CN107942661B

CN107942661B - 一种基于自适应优化控制节点的月球探测器软着陆最优控制系统

Info

Publication number: CN107942661B
Application number: CN201711117056.5A
Authority: CN
Inventors: 刘兴高; 李国栋
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2017-11-13
Filing date: 2017-11-13
Publication date: 2020-02-28
Anticipated expiration: 2037-11-13
Also published as: CN107942661A

Abstract

本发明公开了一种基于自适应优化控制节点的月球探测器软着陆最优控制系统，该系统由速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示构成。月球探测器准备软着陆时，速度传感器、距离探测器测量当前该探测器的下降速度、与月球表面之间的距离，并将测量数据传送给MCU，MCU立即执行自适应优化控制节点最优控制方法，计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略，将其转换为运行指令传送给燃料消耗系统，并实时显示当前软着陆状态。本发明能够保证月球探测器安全软着陆并且最大程度地减少燃料的消耗。

Description

一种基于自适应优化控制节点的月球探测器软着陆最优控制系统

技术领域

本发明涉及月球软着陆控制领域，主要是一种基于自适应优化控制节点的月球探测器软着陆最优控制系统。在月球探测器将要着陆时，该系统能够计算出最优的软着陆策略，以保证探测器安全着陆并且最大程度地减少燃料的消耗。

背景技术

二十世纪五十年代末至今，美国、前苏联/俄罗斯、日本、欧洲航天局、中国和印度先后进行了月球探测，九十年代以来兴起了新一轮的热潮。其中，月球探测器软着陆是一种非常重要的技术手段。软着陆就是在落地之前通过一定的手段减小垂直速度，使之以一个可以接受的速度落地，以保护飞行器和航天员。由于月球上没有空气，类似于真空，用降落伞是不可能的，而气垫不好控制力度，目前的技术是靠月球探测器自身的反作用力实现软着陆。现今，国内外众多专家学者都对此展开了深入研究。

发明内容

为了使月球探测器安全着陆并且最大程度地减少燃料的消耗，本发明提供了一种基于自适应优化控制节点的月球探测器软着陆最优控制系统，该系统借助MCU作为最优控制方法的实现载体。

本发明的目的是通过以下技术方案来实现的：一种基于自适应优化控制节点的月球探测器软着陆最优控制系统，能够计算出最优的软着陆策略，以保证探测器安全着陆并且最大程度地减少燃料的消耗。由速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示构成。所述系统的运行过程包括：

步骤A4：月球探测器准备软着陆时开启速度传感器以及距离探测器，用于实时测量当前该探测器的下降速度以及与月球表面之间的距离，并将测量数据传送给MCU；

步骤A5：MCU执行内部的自适应控制节点最优控制方法，计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略；

步骤A6：MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令，传送给燃料消耗系统，并实时显示当前软着陆状态。

所述的MCU，包括信息采集模块、初始化模块、结束时间处理模块、控制向量参数化模块、非线性规划(Nonlinear Programming，NLP)问题求解模块、终止条件判断模块、自适应控制网格划分模块、控制指令输出模块。

月球探测器的软着陆过程可以描述为：

其中t表示时间，t₀表示软着陆过程开始时间，t_f表示软着陆过程结束时间，且t_f不固定；

被称为状态变量，表示月球探测器的速度、加速度、质量、与月球表面之间的距离等物理参数，x₀是其初始值，

是其一阶导数；u(t)表示月球探测器的燃料消耗速率，u_l、u_u分别为其下限值和上限值；

是根据能量守恒以及力学原理建立的微分方程组；

是对月球探测器软着陆结束时刻的物理参数建立的约束条件。n_x,n_g分别是状态变量和约束的数量。

假设以Φ[x(t_f)]表示燃料的总消耗量，则使燃料消耗最少的数学模型可表示为：

其中J[u(t)]表示控制目标，由燃料消耗速率u(t)决定。该问题本质上是一个最优控制问题。

本发明解决该问题所采用的技术方案是：在MCU中集成了自适应优化控制节点最优控制方法，并以此为基础构建了一套最优控制系统。所述控制系统的结构包括速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示。所述系统的各组成部分均由月球探测器内数据总线统一连接。

所述系统的运行过程如下：

步骤C1：月球探测器准备软着陆时开启速度传感器以及距离探测器，用于实时测量当前该探测器的下降速度以及与月球表面之间的距离，并将测量数据传送给MCU；

步骤C2：MCU执行内部的自适应优化控制节点最优控制方法，计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略；

步骤C3：MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令，传送给燃料消耗系统，并实时显示当前软着陆状态。

集成了自适应优化控制节点最优控制方法的MCU是本发明的核心，其内部包括信息采集模块、初始化模块、结束时间处理模块、控制向量参数化模块、非线性规划(Nonlinear Programming，NLP)问题求解模块、终止条件判断模块、自适应控制节点分配模块、时间尺度转换模块、控制指令输出模块。

信息采集模块包括当前下降速度采集、与月球表面之间的距离采集两个子模块。

结束时间处理模块引入新的时间变量υ，使得

t＝(t_f-t₀)υ+t₀ (3)从而将结束时间t_f不固定的数学模型(2)转换为控制时域为[0,1]的数学模型，如下所示：

其中，

控制向量参数化模块采用分段常量策略来实现燃料消耗速率控制，具体如下：

假设整个控制时域[0,1]被划分为p(p＞0)个控制子区间[υ_k-1,υ_k)(k＝1,2,…,p)，并且

0＜υ₁＜…＜υ_p-1＜υ_p＝1 (6)

这样，

可表示为：

其中，

为常数，表示

在控制子区间[υ_k-1,υ_k)内的参数值，χ_k(υ)为单位开关函数，其定义如下：

从而，燃料消耗速率控制参数可由向量

表示。

NLP问题求解模块包括序列二次规划(Sequential Quadratic Programming，SQP)求解、联立微分方程组求解两个子模块。联立微分方程组包括方程组(9)

和方程组(10)

其中，

利用四阶Runge-Kutta算法求解联立微分方程组(9)、(10)，可以得到数学模型(4)的目标函数值

以及目标函数对控制参数向量的一阶梯度信息：

同样，可以得到数学模型(4)中的约束函数值以及约束函数对控制参数向量的一阶梯度信息：

自适应控制节点分配模块提供了一种自适应分配控制节点的策略，具体如下：

假设经过第l次迭代，得到的目标函数最优值为J^*l，最优控制参数为

相应的控制网格为

通过将Δ^l中的每个控制子区间进行二等分，得到控制网格及初始控制参数

对于

中当前取值为

的各个参数

为了评估其对目标函数J下降量的影响，定义相对于J的灵敏度为：

其中，

表示不超过(j+1)/2的最大整数。

假设在控制区间

内，

分别为第l-1次和第l次所获得的最优控制参数值。如果以下条件满足：

其中，ε_uv＞0为给定阈值，则令

s_2k-1＝0且s_2k＝0 (17)

对于Δ^l'中的控制节点

如果在下一次迭代中将其保留，需满足：

或

其中，r_su＞0为给定系数，

为平均灵敏度，其定义如下：

如果式(18)不满足，则将该控制节点消除。

当控制节点和

都被消除时，如果以下条件满足

且

其中，给定系数r_sl∈(0,r_su]、ε_uh＞0，则控制节点

也应该被消除。

经过以上控制网格二等分以及控制节点消除等步骤，控制网格Δ^l'可作为下一次迭代的控制网格Δ^l+1。

时间尺度转换模块是将当前数学模型(4)转换到一个新的时间尺度上，以便于对自适应控制节点分配模块得到的控制网格进行优化，具体如下：

对于一个新插入的控制节点如果满足

或

其中，给定系数r_ss≥r_su，则该控制节点被认为是重要控制节点。这样，控制子区间

和被认为是重要控制子区间，其长度可当作变量进行优化，以找到控制节点

的最优位置。

假设经过自适应控制节点分配模块调整后，整个控制时域存在P个控制子区间[υ_k-1,υ_k)(k＝1,2,...,P)，每个控制子区间的长度用θ_k表示，且其初始值为

对于其中的非重要控制子区间，其长度为定值，不必优化。对于其中的重要控制子区间，根据其连续情况，假设可分为R(R≥1)部分，第r(1≤r≤R)部分包含n_r(n_r≥2)个连续控制子区间，且其所有控制子区间的长度满足：

引入时间尺度转换函数如下：

其中，τ为新的时间变量，

表示不超过τ的最大整数。这样，数学模型(4)在新的时间尺度上可被转换为：

其中，

所述MCU产生燃料消耗系统运行指令的过程如下：

步骤D1：信息采集模块获取月球探测器当前下降速度以及与月球表面之间的距离；

步骤D2：初始化模块运行，设置初始控制网格数目p、燃料消耗速率控制策略的初始猜测值

设定常数值ε_uv＞0、ε_uh＞0、r_su＞0、r_sl∈(0,r_su]、r_ss≥r_su，设置最大迭代次数l^max≥1以及终止误差tol_J＞0，并令迭代计数l＝0；

步骤D3：结束时间处理模块将数学模型(2)转换为数学模型(4)；

步骤D4：控制向量参数化模块采用分段常量策略来表示燃料消耗速率控制曲线，如果l＝0，则将控制时域等分为p段而得到当前控制网格，并令所有控制参数值为

否则，采用Δ^l作为当前控制网格，每个控制子区间内的参数值为对应控制时域内

的值；

步骤D5：NLP问题求解模块中的SQP求解模块运行，并且通过联立微分方程组求解模块获取目标函数值、目标函数对控制参数向量的一阶梯度信息、约束函数值、约束函数对控制参数向量的一阶梯度信息，最终得到当前控制网格下的目标函数最优值J^*l以及相应的最优控制参数

步骤D6：终止条件判断模块运行，对于l＞0，如果l＝l^max或

则执行步骤D10，否则，执行步骤D7；

步骤D7：自适应控制节点分配模块运行，获得新的控制网格Δ^l+1；

步骤D8：令迭代计数l＝l+1，如果l＝l^max，则执行步骤D9，否则，转到步骤D4；

步骤D9：时间尺度转换模块将数学模型(4)转换为新时间尺度上的数学模型(25)，转到步骤D4；

步骤D10：控制指令输出模块将当前控制时域按(24)、(3)转换到实际控制时域，并将获得的最优燃料消耗速率控制策略输出。

本发明的有益效果主要表现在：基于自适应优化控制节点的月球探测器软着陆最优控制系统，能够计算出探测器最优的软着陆策略，可以适应问题的最优控制曲线，特别是找到问题的不连续点，能够获得较高的精度；采用自适应策略之后，下一次最优控制曲线的初始估计值是当前迭代的最优曲线，由此可以获得较快的收敛速度，减少探测器最优的软着陆策略的计算时间。本发明在保证月球探测器安全软着陆的情况下，并且能够最大程度地减少燃料的消耗。

附图说明

图1是本发明的功能示意图；

图2是本发明的结构示意图；

图3是本发明MCU内部模块结构图；

图4是对实施实例1获得的燃料消耗速率控制策略图；

图5是图4中燃料消耗速率控制策略所对应的各状态变量变化图。

具体实施方式

如图1所示，月球探测器的软着陆过程可以描述为：

是根据能量守恒以及力学原理建立的微分方程组；

本发明解决该问题所采用的技术方案是：在MCU中集成了自适应优化控制节点最优控制方法，并以此为基础构建了一套最优控制系统。所述控制系统的结构如图2所示，包括速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示。所述系统的各组成部分均由月球探测器内数据总线统一连接。

所述系统的运行过程如下：

步骤C4：月球探测器准备软着陆时开启速度传感器以及距离探测器，用于实时测量当前该探测器的下降速度以及与月球表面之间的距离，并将测量数据传送给MCU；

步骤C5：MCU执行内部的自适应优化控制节点最优控制方法，计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略；

步骤C6：MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令，传送给燃料消耗系统，并实时显示当前软着陆状态。

集成了自适应优化控制节点最优控制方法的MCU是本发明的核心，如图3所示，其内部包括信息采集模块、初始化模块、结束时间处理模块、控制向量参数化模块、非线性规划(Nonlinear Programming，NLP)问题求解模块、终止条件判断模块、自适应控制节点分配模块、时间尺度转换模块、控制指令输出模块。

结束时间处理模块引入新的时间变量υ，使得

t＝(t_f-t₀)υ+t₀ (30)从而将结束时间t_f不固定的数学模型(2)转换为控制时域为[0,1]的数学模型，如下所示：

其中，

0＜υ₁＜…＜υ_p-1＜υ_p＝1 (33)

这样，

可表示为：

其中，

为常数，表示

从而，燃料消耗速率控制参数可由向量

表示。

和方程组(10)

其中，

以及目标函数对控制参数向量的一阶梯度信息：

同样，可以得到数学模型(4)中的约束函数值

以及约束函数对控制参数向量的一阶梯度信息：

相应的控制网格为

通过将Δ^l中的每个控制子区间进行二等分，得到控制网格

及初始控制参数

对于

中当前取值为

的各个参数为了评估其对目标函数J下降量的影响，定义

相对于J的灵敏度为：

其中，

表示不超过(j+1)/2的最大整数。

假设在控制区间

内，

其中，ε_uv＞0为给定阈值，则令

s_2k-1＝0且s_2k＝0 (44)

对于Δ^l'中的控制节点

如果在下一次迭代中将其保留，需满足：

或

其中，r_su＞0为给定系数，

为平均灵敏度，其定义如下：

如果式(18)不满足，则将该控制节点消除。

当控制节点

和

都被消除时，如果以下条件满足

且

其中，给定系数r_sl∈(0,r_su]、ε_uh＞0，则控制节点

也应该被消除。

对于一个新插入的控制节点

如果满足

或

和

被认为是重要控制子区间，其长度可当作变量进行优化，以找到控制节点

的最优位置。

引入时间尺度转换函数如下：

其中，τ为新的时间变量，

其中，

所述MCU产生燃料消耗系统运行指令的过程如下：

步骤D11：信息采集模块获取月球探测器当前下降速度以及与月球表面之间的距离；

步骤D12：初始化模块运行，设置初始控制网格数目p、燃料消耗速率控制策略的初始猜测值

步骤D13：结束时间处理模块将数学模型(2)转换为数学模型(4)；

步骤D14：控制向量参数化模块采用分段常量策略来表示燃料消耗速率控制曲线，如果l＝0，则将控制时域等分为p段而得到当前控制网格，并令所有控制参数值为

否则，采用Δ^l作为当前控制网格，每个控制子区间内的参数值为对应控制时域内的值；

步骤D15：NLP问题求解模块中的SQP求解模块运行，并且通过联立微分方程组求解模块获取目标函数值、目标函数对控制参数向量的一阶梯度信息、约束函数值、约束函数对控制参数向量的一阶梯度信息，最终得到当前控制网格下的目标函数最优值J^*l以及相应的最优控制参数

步骤D16：终止条件判断模块运行，对于l＞0，如果l＝l^max或

则执行步骤D20，否则，执行步骤D17；

步骤D17：自适应控制节点分配模块运行，获得新的控制网格Δ^l+1；

步骤D18：令迭代计数l＝l+1，如果l＝l^max，则执行步骤D19，否则，转到步骤D14；

步骤D19：时间尺度转换模块将数学模型(4)转换为新时间尺度上的数学模型(25)，转到步骤D4；

步骤D20：控制指令输出模块将当前控制时域按(24)、(3)转换到实际控制时域，并将获得的最优燃料消耗速率控制策略输出。

控制指令输出模块将当前控制时域按(3)转换到实际控制时域，并将获得的最优燃料消耗速率控制策略输出。

实施实例1

某月球探测器软着陆的数学模型如下：

其中，x₁(t)、x₂(t)、x₃(t)分别表示探测器与月球表面之间的距离(m)、下降速度(m/s)、燃料消耗量(kg)，u(t)表示燃料消耗速率(kg/s)。

当探测器开始软着陆时，速度传感器、距离探测器测量到当前该探测器的下降速度为-2m/s、与月球表面之间的距离为10m，并将这些测量数据传送给MCU的信息采集模块。MCU立即开始运行自适应优化控制节点最优控制方法，其运行过程如图3所示，为：

步骤E1：初始化模块2运行，设置初始控制网格数目p＝4、燃料消耗速率控制策略的初始猜测值设定常数值ε_uv＝10^-6、ε_uh＝10^-3、r_su＝0.25、r_sl＝0.2、r_ss＝1.45，设置最大迭代次数l^max＝2以及终止误差tol_J＝10^-6，并令迭代计数l＝0；

步骤E2：结束时间处理模块3运行，将数学模型(55)转换为数学模型(4)的形式；

步骤E3：控制向量参数化模块4采用分段常量策略来表示燃料消耗速率控制曲线，如果l＝0，则将控制时域等分为p段而得到当前控制网格，并令所有控制参数值为

的值；

步骤E4：NLP问题求解模块5中的SQP求解模块运行，并且通过联立微分方程组求解模块获取目标函数值、目标函数对控制参数向量的一阶梯度信息、约束函数值、约束函数对控制参数向量的一阶梯度信息，最终得到当前控制网格下的目标函数最优值J^*l以及相应的最优控制参数

步骤E5：终止条件判断模块6运行，对于l＞0，如果l＝l^max或

则执行步骤E9，否则，执行步骤E6；

步骤E6：自适应控制节点分配模块7运行，获得新的控制网格Δ^l+1；

步骤E7：令迭代计数l＝l+1，如果l＝l^max，则执行步骤E8，否则，转到步骤E3；

步骤E8：时间尺度转换模块8将数学模型(4)转换为新时间尺度上的数学模型(25)，转到步骤E3；

步骤E9：控制指令输出模块9将当前控制时域按(24)、(3)转换到实际控制时域，并将获得的最优燃料消耗速率控制策略输出。

自适应优化控制节点最优控制方法得到的最优燃料消耗速率控制曲线如图4所示，完全满足控制要求。图5显示了月球探测器与月球表面之间距离、下降速度的变化曲线，可以看到，在软着陆结束时其值均为0。

最后，MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令，传送给燃料消耗系统，并实时显示当前软着陆状态。

上述实施例用来解释说明本发明，而不是对本发明进行限制，在本发明的精神和权利要求的保护范围内，对本发明作出的任何修改和改变，都落入本发明的保护范围。

Claims

1.一种基于自适应优化控制节点的月球探测器软着陆最优控制系统，能够计算出最优的软着陆策略，以保证探测器安全着陆并且最大程度地减少燃料的消耗；其特征在于：由速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示构成；所述系统运行过程包括：

步骤A1：月球探测器准备软着陆时开启速度传感器以及距离探测器，用于实时测量当前该探测器的下降速度以及与月球表面之间的距离，并将测量数据传送给MCU；

步骤A2：MCU执行内部的自适应优化控制节点最优控制方法，计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略；

步骤A3：MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令，传送给燃料消耗系统，并实时显示当前软着陆状态；

所述的MCU，包括信息采集模块、初始化模块、结束时间处理模块、控制向量参数化模块、非线性规划(Nonlinear Programming，NLP)问题求解模块、终止条件判断模块、自适应控制节点分配模块、时间尺度转换模块、控制指令输出模块；

月球探测器的软着陆过程可以描述为：

被称为状态变量，表示月球探测器的速度、加速度、质量、与月球表面之间的距离物理参数，x₀是其初始值，

是其一阶导数；u(t)表示月球探测器的燃料消耗速率，u_l、u_u分别为其下限值和上限值；是根据能量守恒以及力学原理建立的微分方程组；是对月球探测器软着陆结束时刻的物理参数建立的约束条件；n_x,n_g分别是状态变量和约束的数量；

其中J[u(t)]表示控制目标，由燃料消耗速率u(t)决定；

信息采集模块包括当前下降速度采集、与月球表面之间的距离采集两个子模块；

结束时间处理模块引入新的时间变量υ，使得

t＝(t_f-t₀)υ+t₀ (3)

从而将结束时间t_f不固定的数学模型(2)转换为控制时域为[0,1]的数学模型，如下所示：

其中，

假设整个控制时域[0,1]被划分为p个控制子区间[υ_k-1,υ_k)，p＞0，k＝1,2,...,p，并且

0＜υ₁＜…＜υ_p-1＜υ_p＝1 (6)

这样，可表示为：

其中，

为常数，表示

从而，燃料消耗速率控制参数可由向量

表示；

NLP问题求解模块包括序列二次规划(Sequential Quadratic Programming，SQP)求解、联立微分方程组求解两个子模块；联立微分方程组包括方程组(9)

和方程组(10)

其中，

以及目标函数对控制参数向量的一阶梯度信息：

同样，可以得到数学模型(4)中的约束函数值

以及约束函数对控制参数向量的一阶梯度信息：

相应的控制网格为

通过将Δ^l中的每个控制子区间进行二等分，得到控制网格

及初始控制参数

对于

中当前取值为

的各个参数

为了评估其对目标函数J下降量的影响，定义

相对于J的灵敏度为：

其中，

表示不超过(j+1)/2的最大整数；

假设在控制区间

内，

分别为第l-1次和第l次所获得的最优控制参数值；如果以下条件满足：

其中，ε_uv＞0为给定阈值，则令

s_2k-1＝0且s_2k＝0 (17)

对于Δ^l'中的控制节点

如果在下一次迭代中将其保留，需满足：

其中，r_su＞0为给定系数，

为平均灵敏度，其定义如下：

如果式(18)不满足，则将该控制节点消除；

当控制节点和

都被消除时，如果以下条件满足

其中，给定系数r_sl∈(0,r_su]、ε_uh＞0，则控制节点

也应该被消除；

经过以上控制网格二等分以及控制节点消除等步骤，控制网格Δ^l'可作为下一次迭代的控制网格Δ^l+1；

对于一个新插入的控制节点如果满足

其中，给定系数r_ss≥r_su，则该控制节点被认为是重要控制节点；这样，控制子区间

的最优位置；

对于其中的非重要控制子区间，其长度为定值，不必优化；对于其中的重要控制子区间，根据其连续情况，假设可分为R(R≥1)部分，第r(1≤r≤R)部分包含n_r(n_r≥2)个连续控制子区间，且其所有控制子区间的长度满足：

引入时间尺度转换函数如下：

其中，τ为新的时间变量，

表示不超过τ的最大整数；这样，数学模型(4)在新的时间尺度上可被转换为：

其中，

所述MCU产生燃料消耗系统运行指令的过程如下：

步骤B1：信息采集模块获取月球探测器当前下降速度以及与月球表面之间的距离；

步骤B2：初始化模块运行，设置初始控制网格数目p、燃料消耗速率控制策略的初始猜测值

步骤B3：结束时间处理模将结束时间不固定的月球探测器软着陆数学模型转换为控制时域为[0,1]的数学模型；

步骤B4：控制向量参数化模块采用分段常量策略来表示燃料消耗速率控制曲线，如果l＝0，则将控制时域等分为p段而得到当前控制网格，并令所有控制参数值为

的值；

步骤B5：NLP问题求解模块中的SQP求解模块运行，并且通过联立微分方程组求解模块获取目标函数值、目标函数对控制参数向量的一阶梯度信息、约束函数值、约束函数对控制参数向量的一阶梯度信息，最终得到当前控制网格下的目标函数最优值J^*l以及相应的最优控制参数

步骤B6：终止条件判断模块运行，对于l＞0，如果l＝l^max或

则执行步骤B10，否则，执行步骤B7；

步骤B7：自适应控制节点分配模块运行，获得新的控制网格Δ^l+1；

步骤B8：令迭代计数l＝l+1，如果l＝l^max，则执行步骤B9，否则，转到步骤B4；

步骤B9：时间尺度转换模块将数学模型转换到新时间尺度上，转到步骤B4；

步骤B10：控制指令输出模块将当前控制时域按转换到实际控制时域，并将获得的最优燃料消耗速率控制策略输出。