CN107942661B - 一种基于自适应优化控制节点的月球探测器软着陆最优控制系统 - Google Patents

一种基于自适应优化控制节点的月球探测器软着陆最优控制系统 Download PDF

Info

Publication number
CN107942661B
CN107942661B CN201711117056.5A CN201711117056A CN107942661B CN 107942661 B CN107942661 B CN 107942661B CN 201711117056 A CN201711117056 A CN 201711117056A CN 107942661 B CN107942661 B CN 107942661B
Authority
CN
China
Prior art keywords
control
module
fuel consumption
soft landing
lunar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201711117056.5A
Other languages
English (en)
Other versions
CN107942661A (zh
Inventor
刘兴高
李国栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201711117056.5A priority Critical patent/CN107942661B/zh
Publication of CN107942661A publication Critical patent/CN107942661A/zh
Application granted granted Critical
Publication of CN107942661B publication Critical patent/CN107942661B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Feedback Control In General (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)

Abstract

本发明公开了一种基于自适应优化控制节点的月球探测器软着陆最优控制系统,该系统由速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示构成。月球探测器准备软着陆时,速度传感器、距离探测器测量当前该探测器的下降速度、与月球表面之间的距离,并将测量数据传送给MCU,MCU立即执行自适应优化控制节点最优控制方法,计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略,将其转换为运行指令传送给燃料消耗系统,并实时显示当前软着陆状态。本发明能够保证月球探测器安全软着陆并且最大程度地减少燃料的消耗。

Description

一种基于自适应优化控制节点的月球探测器软着陆最优控制 系统
技术领域
本发明涉及月球软着陆控制领域,主要是一种基于自适应优化控制节点的月球探测器软着陆最优控制系统。在月球探测器将要着陆时,该系统能够计算出最优的软着陆策略,以保证探测器安全着陆并且最大程度地减少燃料的消耗。
背景技术
二十世纪五十年代末至今,美国、前苏联/俄罗斯、日本、欧洲航天局、中国和印度先后进行了月球探测,九十年代以来兴起了新一轮的热潮。其中,月球探测器软着陆是一种非常重要的技术手段。软着陆就是在落地之前通过一定的手段减小垂直速度,使之以一个可以接受的速度落地,以保护飞行器和航天员。由于月球上没有空气,类似于真空,用降落伞是不可能的,而气垫不好控制力度,目前的技术是靠月球探测器自身的反作用力实现软着陆。现今,国内外众多专家学者都对此展开了深入研究。
发明内容
为了使月球探测器安全着陆并且最大程度地减少燃料的消耗,本发明提供了一种基于自适应优化控制节点的月球探测器软着陆最优控制系统,该系统借助MCU作为最优控制方法的实现载体。
本发明的目的是通过以下技术方案来实现的:一种基于自适应优化控制节点的月球探测器软着陆最优控制系统,能够计算出最优的软着陆策略,以保证探测器安全着陆并且最大程度地减少燃料的消耗。由速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示构成。所述系统的运行过程包括:
步骤A4:月球探测器准备软着陆时开启速度传感器以及距离探测器,用于实时测量当前该探测器的下降速度以及与月球表面之间的距离,并将测量数据传送给MCU;
步骤A5:MCU执行内部的自适应控制节点最优控制方法,计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略;
步骤A6:MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令,传送给燃料消耗系统,并实时显示当前软着陆状态。
所述的MCU,包括信息采集模块、初始化模块、结束时间处理模块、控制向量参数化模块、非线性规划(Nonlinear Programming,NLP)问题求解模块、终止条件判断模块、自适应控制网格划分模块、控制指令输出模块。
月球探测器的软着陆过程可以描述为:
Figure BDA0001466627980000021
其中t表示时间,t0表示软着陆过程开始时间,tf表示软着陆过程结束时间,且tf不固定;
Figure BDA0001466627980000027
被称为状态变量,表示月球探测器的速度、加速度、质量、与月球表面之间的距离等物理参数,x0是其初始值,
Figure BDA0001466627980000023
是其一阶导数;u(t)表示月球探测器的燃料消耗速率,ul、uu分别为其下限值和上限值;
Figure BDA0001466627980000024
是根据能量守恒以及力学原理建立的微分方程组;
Figure BDA0001466627980000025
是对月球探测器软着陆结束时刻的物理参数建立的约束条件。nx,ng分别是状态变量和约束的数量。
假设以Φ[x(tf)]表示燃料的总消耗量,则使燃料消耗最少的数学模型可表示为:
Figure BDA0001466627980000026
其中J[u(t)]表示控制目标,由燃料消耗速率u(t)决定。该问题本质上是一个最优控制问题。
本发明解决该问题所采用的技术方案是:在MCU中集成了自适应优化控制节点最优控制方法,并以此为基础构建了一套最优控制系统。所述控制系统的结构包括速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示。所述系统的各组成部分均由月球探测器内数据总线统一连接。
所述系统的运行过程如下:
步骤C1:月球探测器准备软着陆时开启速度传感器以及距离探测器,用于实时测量当前该探测器的下降速度以及与月球表面之间的距离,并将测量数据传送给MCU;
步骤C2:MCU执行内部的自适应优化控制节点最优控制方法,计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略;
步骤C3:MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令,传送给燃料消耗系统,并实时显示当前软着陆状态。
集成了自适应优化控制节点最优控制方法的MCU是本发明的核心,其内部包括信息采集模块、初始化模块、结束时间处理模块、控制向量参数化模块、非线性规划(Nonlinear Programming,NLP)问题求解模块、终止条件判断模块、自适应控制节点分配模块、时间尺度转换模块、控制指令输出模块。
信息采集模块包括当前下降速度采集、与月球表面之间的距离采集两个子模块。
结束时间处理模块引入新的时间变量υ,使得
t=(tf-t0)υ+t0 (3)从而将结束时间tf不固定的数学模型(2)转换为控制时域为[0,1]的数学模型,如下所示:
其中,
Figure BDA0001466627980000032
控制向量参数化模块采用分段常量策略来实现燃料消耗速率控制,具体如下:
假设整个控制时域[0,1]被划分为p(p>0)个控制子区间[υk-1k)(k=1,2,…,p),并且
0<υ1<…<υp-1<υp=1 (6)
这样,
Figure BDA0001466627980000033
可表示为:
Figure BDA0001466627980000034
其中,
Figure BDA0001466627980000035
为常数,表示
Figure BDA0001466627980000036
在控制子区间[υk-1k)内的参数值,χk(υ)为单位开关函数,其定义如下:
Figure BDA0001466627980000037
从而,燃料消耗速率控制参数可由向量
Figure BDA0001466627980000038
表示。
NLP问题求解模块包括序列二次规划(Sequential Quadratic Programming,SQP)求解、联立微分方程组求解两个子模块。联立微分方程组包括方程组(9)
和方程组(10)
Figure BDA0001466627980000042
其中,
Figure BDA0001466627980000043
利用四阶Runge-Kutta算法求解联立微分方程组(9)、(10),可以得到数学模型(4)的目标函数值
Figure BDA0001466627980000044
以及目标函数对控制参数向量的一阶梯度信息:
Figure BDA0001466627980000045
同样,可以得到数学模型(4)中的约束函数值以及约束函数对控制参数向量的一阶梯度信息:
Figure BDA0001466627980000047
自适应控制节点分配模块提供了一种自适应分配控制节点的策略,具体如下:
假设经过第l次迭代,得到的目标函数最优值为J*l,最优控制参数为
Figure BDA0001466627980000048
Figure BDA0001466627980000049
相应的控制网格为
Figure BDA00014666279800000410
通过将Δl中的每个控制子区间进行二等分,得到控制网格及初始控制参数
Figure BDA00014666279800000412
对于
Figure BDA00014666279800000413
中当前取值为
Figure BDA00014666279800000414
的各个参数
Figure BDA00014666279800000415
为了评估其对目标函数J下降量的影响,定义相对于J的灵敏度为:
Figure BDA00014666279800000417
其中,
Figure BDA00014666279800000418
表示不超过(j+1)/2的最大整数。
假设在控制区间
Figure BDA00014666279800000419
内,
Figure BDA00014666279800000420
分别为第l-1次和第l次所获得的最优控制参数值。如果以下条件满足:
Figure BDA0001466627980000051
其中,εuv>0为给定阈值,则令
s2k-1=0且s2k=0 (17)
对于Δl'中的控制节点
Figure BDA0001466627980000052
如果在下一次迭代中将其保留,需满足:
Figure BDA0001466627980000054
其中,rsu>0为给定系数,
Figure BDA0001466627980000055
为平均灵敏度,其定义如下:
如果式(18)不满足,则将该控制节点消除。
当控制节点
Figure BDA0001466627980000058
都被消除时,如果以下条件满足
Figure BDA0001466627980000059
Figure BDA00014666279800000510
其中,给定系数rsl∈(0,rsu]、εuh>0,则控制节点
Figure BDA00014666279800000511
也应该被消除。
经过以上控制网格二等分以及控制节点消除等步骤,控制网格Δl'可作为下一次迭代的控制网格Δl+1
时间尺度转换模块是将当前数学模型(4)转换到一个新的时间尺度上,以便于对自适应控制节点分配模块得到的控制网格进行优化,具体如下:
对于一个新插入的控制节点如果满足
Figure BDA00014666279800000513
其中,给定系数rss≥rsu,则该控制节点被认为是重要控制节点。这样,控制子区间
Figure BDA00014666279800000515
被认为是重要控制子区间,其长度可当作变量进行优化,以找到控制节点
Figure BDA00014666279800000517
的最优位置。
假设经过自适应控制节点分配模块调整后,整个控制时域存在P个控制子区间[υk-1k)(k=1,2,...,P),每个控制子区间的长度用θk表示,且其初始值为
Figure BDA00014666279800000518
对于其中的非重要控制子区间,其长度为定值,不必优化。对于其中的重要控制子区间,根据其连续情况,假设可分为R(R≥1)部分,第r(1≤r≤R)部分包含nr(nr≥2)个连续控制子区间,且其所有控制子区间的长度满足:
引入时间尺度转换函数如下:
Figure BDA0001466627980000061
其中,τ为新的时间变量,
Figure BDA0001466627980000062
表示不超过τ的最大整数。这样,数学模型(4)在新的时间尺度上可被转换为:
Figure BDA0001466627980000063
其中,
Figure BDA0001466627980000064
所述MCU产生燃料消耗系统运行指令的过程如下:
步骤D1:信息采集模块获取月球探测器当前下降速度以及与月球表面之间的距离;
步骤D2:初始化模块运行,设置初始控制网格数目p、燃料消耗速率控制策略的初始猜测值
Figure BDA0001466627980000065
设定常数值εuv>0、εuh>0、rsu>0、rsl∈(0,rsu]、rss≥rsu,设置最大迭代次数lmax≥1以及终止误差tolJ>0,并令迭代计数l=0;
步骤D3:结束时间处理模块将数学模型(2)转换为数学模型(4);
步骤D4:控制向量参数化模块采用分段常量策略来表示燃料消耗速率控制曲线,如果l=0,则将控制时域等分为p段而得到当前控制网格,并令所有控制参数值为
Figure BDA0001466627980000066
否则,采用Δl作为当前控制网格,每个控制子区间内的参数值为对应控制时域内
Figure BDA0001466627980000067
的值;
步骤D5:NLP问题求解模块中的SQP求解模块运行,并且通过联立微分方程组求解模块获取目标函数值、目标函数对控制参数向量的一阶梯度信息、约束函数值、约束函数对控制参数向量的一阶梯度信息,最终得到当前控制网格下的目标函数最优值J*l以及相应的最优控制参数
Figure BDA0001466627980000068
步骤D6:终止条件判断模块运行,对于l>0,如果l=lmax
则执行步骤D10,否则,执行步骤D7;
步骤D7:自适应控制节点分配模块运行,获得新的控制网格Δl+1
步骤D8:令迭代计数l=l+1,如果l=lmax,则执行步骤D9,否则,转到步骤D4;
步骤D9:时间尺度转换模块将数学模型(4)转换为新时间尺度上的数学模型(25),转到步骤D4;
步骤D10:控制指令输出模块将当前控制时域按(24)、(3)转换到实际控制时域,并将获得的最优燃料消耗速率控制策略输出。
本发明的有益效果主要表现在:基于自适应优化控制节点的月球探测器软着陆最优控制系统,能够计算出探测器最优的软着陆策略,可以适应问题的最优控制曲线,特别是找到问题的不连续点,能够获得较高的精度;采用自适应策略之后,下一次最优控制曲线的初始估计值是当前迭代的最优曲线,由此可以获得较快的收敛速度,减少探测器最优的软着陆策略的计算时间。本发明在保证月球探测器安全软着陆的情况下,并且能够最大程度地减少燃料的消耗。
附图说明
图1是本发明的功能示意图;
图2是本发明的结构示意图;
图3是本发明MCU内部模块结构图;
图4是对实施实例1获得的燃料消耗速率控制策略图;
图5是图4中燃料消耗速率控制策略所对应的各状态变量变化图。
具体实施方式
如图1所示,月球探测器的软着陆过程可以描述为:
Figure BDA0001466627980000072
其中t表示时间,t0表示软着陆过程开始时间,tf表示软着陆过程结束时间,且tf不固定;
Figure BDA0001466627980000073
被称为状态变量,表示月球探测器的速度、加速度、质量、与月球表面之间的距离等物理参数,x0是其初始值,
Figure BDA0001466627980000074
是其一阶导数;u(t)表示月球探测器的燃料消耗速率,ul、uu分别为其下限值和上限值;
Figure BDA0001466627980000081
是根据能量守恒以及力学原理建立的微分方程组;
Figure BDA0001466627980000084
是对月球探测器软着陆结束时刻的物理参数建立的约束条件。nx,ng分别是状态变量和约束的数量。
假设以Φ[x(tf)]表示燃料的总消耗量,则使燃料消耗最少的数学模型可表示为:
Figure BDA0001466627980000083
其中J[u(t)]表示控制目标,由燃料消耗速率u(t)决定。该问题本质上是一个最优控制问题。
本发明解决该问题所采用的技术方案是:在MCU中集成了自适应优化控制节点最优控制方法,并以此为基础构建了一套最优控制系统。所述控制系统的结构如图2所示,包括速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示。所述系统的各组成部分均由月球探测器内数据总线统一连接。
所述系统的运行过程如下:
步骤C4:月球探测器准备软着陆时开启速度传感器以及距离探测器,用于实时测量当前该探测器的下降速度以及与月球表面之间的距离,并将测量数据传送给MCU;
步骤C5:MCU执行内部的自适应优化控制节点最优控制方法,计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略;
步骤C6:MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令,传送给燃料消耗系统,并实时显示当前软着陆状态。
集成了自适应优化控制节点最优控制方法的MCU是本发明的核心,如图3所示,其内部包括信息采集模块、初始化模块、结束时间处理模块、控制向量参数化模块、非线性规划(Nonlinear Programming,NLP)问题求解模块、终止条件判断模块、自适应控制节点分配模块、时间尺度转换模块、控制指令输出模块。
信息采集模块包括当前下降速度采集、与月球表面之间的距离采集两个子模块。
结束时间处理模块引入新的时间变量υ,使得
t=(tf-t0)υ+t0 (30)从而将结束时间tf不固定的数学模型(2)转换为控制时域为[0,1]的数学模型,如下所示:
Figure BDA0001466627980000091
其中,
Figure BDA0001466627980000092
控制向量参数化模块采用分段常量策略来实现燃料消耗速率控制,具体如下:
假设整个控制时域[0,1]被划分为p(p>0)个控制子区间[υk-1k)(k=1,2,…,p),并且
0<υ1<…<υp-1<υp=1 (33)
这样,
Figure BDA0001466627980000093
可表示为:
Figure BDA0001466627980000094
其中,
Figure BDA0001466627980000095
为常数,表示
Figure BDA0001466627980000096
在控制子区间[υk-1k)内的参数值,χk(υ)为单位开关函数,其定义如下:
Figure BDA0001466627980000097
从而,燃料消耗速率控制参数可由向量
Figure BDA0001466627980000098
表示。
NLP问题求解模块包括序列二次规划(Sequential Quadratic Programming,SQP)求解、联立微分方程组求解两个子模块。联立微分方程组包括方程组(9)
Figure BDA0001466627980000099
和方程组(10)
Figure BDA00014666279800000910
其中,
Figure BDA00014666279800000911
Figure BDA0001466627980000101
利用四阶Runge-Kutta算法求解联立微分方程组(9)、(10),可以得到数学模型(4)的目标函数值
Figure BDA0001466627980000102
以及目标函数对控制参数向量的一阶梯度信息:
同样,可以得到数学模型(4)中的约束函数值
Figure BDA0001466627980000104
以及约束函数对控制参数向量的一阶梯度信息:
Figure BDA0001466627980000105
自适应控制节点分配模块提供了一种自适应分配控制节点的策略,具体如下:
假设经过第l次迭代,得到的目标函数最优值为J*l,最优控制参数为
Figure BDA0001466627980000106
Figure BDA0001466627980000107
相应的控制网格为
Figure BDA0001466627980000108
通过将Δl中的每个控制子区间进行二等分,得到控制网格
Figure BDA0001466627980000109
及初始控制参数
Figure BDA00014666279800001010
对于
Figure BDA00014666279800001011
中当前取值为
Figure BDA00014666279800001012
的各个参数为了评估其对目标函数J下降量的影响,定义
Figure BDA00014666279800001014
相对于J的灵敏度为:
Figure BDA00014666279800001015
其中,
Figure BDA00014666279800001016
表示不超过(j+1)/2的最大整数。
假设在控制区间
Figure BDA00014666279800001017
内,
Figure BDA00014666279800001018
分别为第l-1次和第l次所获得的最优控制参数值。如果以下条件满足:
其中,εuv>0为给定阈值,则令
s2k-1=0且s2k=0 (44)
对于Δl'中的控制节点
Figure BDA00014666279800001020
如果在下一次迭代中将其保留,需满足:
Figure BDA00014666279800001021
Figure BDA00014666279800001022
其中,rsu>0为给定系数,
Figure BDA00014666279800001023
为平均灵敏度,其定义如下:
Figure BDA00014666279800001024
如果式(18)不满足,则将该控制节点消除。
当控制节点
Figure BDA0001466627980000111
Figure BDA0001466627980000112
都被消除时,如果以下条件满足
Figure BDA0001466627980000113
Figure BDA0001466627980000114
其中,给定系数rsl∈(0,rsu]、εuh>0,则控制节点
Figure BDA0001466627980000115
也应该被消除。
经过以上控制网格二等分以及控制节点消除等步骤,控制网格Δl'可作为下一次迭代的控制网格Δl+1
时间尺度转换模块是将当前数学模型(4)转换到一个新的时间尺度上,以便于对自适应控制节点分配模块得到的控制网格进行优化,具体如下:
对于一个新插入的控制节点
Figure BDA0001466627980000116
如果满足
Figure BDA0001466627980000117
Figure BDA0001466627980000118
其中,给定系数rss≥rsu,则该控制节点被认为是重要控制节点。这样,控制子区间
Figure BDA0001466627980000119
Figure BDA00014666279800001110
被认为是重要控制子区间,其长度可当作变量进行优化,以找到控制节点
Figure BDA00014666279800001111
的最优位置。
假设经过自适应控制节点分配模块调整后,整个控制时域存在P个控制子区间[υk-1k)(k=1,2,...,P),每个控制子区间的长度用θk表示,且其初始值为
对于其中的非重要控制子区间,其长度为定值,不必优化。对于其中的重要控制子区间,根据其连续情况,假设可分为R(R≥1)部分,第r(1≤r≤R)部分包含nr(nr≥2)个连续控制子区间,且其所有控制子区间的长度满足:
引入时间尺度转换函数如下:
Figure BDA00014666279800001114
其中,τ为新的时间变量,
Figure BDA00014666279800001115
表示不超过τ的最大整数。这样,数学模型(4)在新的时间尺度上可被转换为:
Figure BDA0001466627980000121
其中,
Figure BDA0001466627980000122
所述MCU产生燃料消耗系统运行指令的过程如下:
步骤D11:信息采集模块获取月球探测器当前下降速度以及与月球表面之间的距离;
步骤D12:初始化模块运行,设置初始控制网格数目p、燃料消耗速率控制策略的初始猜测值
Figure BDA0001466627980000123
设定常数值εuv>0、εuh>0、rsu>0、rsl∈(0,rsu]、rss≥rsu,设置最大迭代次数lmax≥1以及终止误差tolJ>0,并令迭代计数l=0;
步骤D13:结束时间处理模块将数学模型(2)转换为数学模型(4);
步骤D14:控制向量参数化模块采用分段常量策略来表示燃料消耗速率控制曲线,如果l=0,则将控制时域等分为p段而得到当前控制网格,并令所有控制参数值为
Figure BDA0001466627980000124
否则,采用Δl作为当前控制网格,每个控制子区间内的参数值为对应控制时域内的值;
步骤D15:NLP问题求解模块中的SQP求解模块运行,并且通过联立微分方程组求解模块获取目标函数值、目标函数对控制参数向量的一阶梯度信息、约束函数值、约束函数对控制参数向量的一阶梯度信息,最终得到当前控制网格下的目标函数最优值J*l以及相应的最优控制参数
Figure BDA0001466627980000126
步骤D16:终止条件判断模块运行,对于l>0,如果l=lmax
Figure BDA0001466627980000127
则执行步骤D20,否则,执行步骤D17;
步骤D17:自适应控制节点分配模块运行,获得新的控制网格Δl+1
步骤D18:令迭代计数l=l+1,如果l=lmax,则执行步骤D19,否则,转到步骤D14;
步骤D19:时间尺度转换模块将数学模型(4)转换为新时间尺度上的数学模型(25),转到步骤D4;
步骤D20:控制指令输出模块将当前控制时域按(24)、(3)转换到实际控制时域,并将获得的最优燃料消耗速率控制策略输出。
控制指令输出模块将当前控制时域按(3)转换到实际控制时域,并将获得的最优燃料消耗速率控制策略输出。
实施实例1
某月球探测器软着陆的数学模型如下:
Figure BDA0001466627980000131
其中,x1(t)、x2(t)、x3(t)分别表示探测器与月球表面之间的距离(m)、下降速度(m/s)、燃料消耗量(kg),u(t)表示燃料消耗速率(kg/s)。
当探测器开始软着陆时,速度传感器、距离探测器测量到当前该探测器的下降速度为-2m/s、与月球表面之间的距离为10m,并将这些测量数据传送给MCU的信息采集模块。MCU立即开始运行自适应优化控制节点最优控制方法,其运行过程如图3所示,为:
步骤E1:初始化模块2运行,设置初始控制网格数目p=4、燃料消耗速率控制策略的初始猜测值设定常数值εuv=10-6、εuh=10-3、rsu=0.25、rsl=0.2、rss=1.45,设置最大迭代次数lmax=2以及终止误差tolJ=10-6,并令迭代计数l=0;
步骤E2:结束时间处理模块3运行,将数学模型(55)转换为数学模型(4)的形式;
步骤E3:控制向量参数化模块4采用分段常量策略来表示燃料消耗速率控制曲线,如果l=0,则将控制时域等分为p段而得到当前控制网格,并令所有控制参数值为
Figure BDA0001466627980000133
否则,采用Δl作为当前控制网格,每个控制子区间内的参数值为对应控制时域内
Figure BDA0001466627980000134
的值;
步骤E4:NLP问题求解模块5中的SQP求解模块运行,并且通过联立微分方程组求解模块获取目标函数值、目标函数对控制参数向量的一阶梯度信息、约束函数值、约束函数对控制参数向量的一阶梯度信息,最终得到当前控制网格下的目标函数最优值J*l以及相应的最优控制参数
Figure BDA0001466627980000135
步骤E5:终止条件判断模块6运行,对于l>0,如果l=lmax
Figure BDA0001466627980000141
则执行步骤E9,否则,执行步骤E6;
步骤E6:自适应控制节点分配模块7运行,获得新的控制网格Δl+1
步骤E7:令迭代计数l=l+1,如果l=lmax,则执行步骤E8,否则,转到步骤E3;
步骤E8:时间尺度转换模块8将数学模型(4)转换为新时间尺度上的数学模型(25),转到步骤E3;
步骤E9:控制指令输出模块9将当前控制时域按(24)、(3)转换到实际控制时域,并将获得的最优燃料消耗速率控制策略输出。
自适应优化控制节点最优控制方法得到的最优燃料消耗速率控制曲线如图4所示,完全满足控制要求。图5显示了月球探测器与月球表面之间距离、下降速度的变化曲线,可以看到,在软着陆结束时其值均为0。
最后,MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令,传送给燃料消耗系统,并实时显示当前软着陆状态。
上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

Claims (1)

1.一种基于自适应优化控制节点的月球探测器软着陆最优控制系统,能够计算出最优的软着陆策略,以保证探测器安全着陆并且最大程度地减少燃料的消耗;其特征在于:由速度传感器、距离探测器、MCU、燃料消耗系统、软着陆状态显示构成;所述系统运行过程包括:
步骤A1:月球探测器准备软着陆时开启速度传感器以及距离探测器,用于实时测量当前该探测器的下降速度以及与月球表面之间的距离,并将测量数据传送给MCU;
步骤A2:MCU执行内部的自适应优化控制节点最优控制方法,计算出使月球探测器安全着陆并且最少消耗燃料的燃料消耗速率控制策略;
步骤A3:MCU将得到的燃料消耗速率控制策略转换为燃料消耗系统运行指令,传送给燃料消耗系统,并实时显示当前软着陆状态;
所述的MCU,包括信息采集模块、初始化模块、结束时间处理模块、控制向量参数化模块、非线性规划(Nonlinear Programming,NLP)问题求解模块、终止条件判断模块、自适应控制节点分配模块、时间尺度转换模块、控制指令输出模块;
月球探测器的软着陆过程可以描述为:
Figure FDA0002280971510000011
其中t表示时间,t0表示软着陆过程开始时间,tf表示软着陆过程结束时间,且tf不固定;
Figure FDA0002280971510000012
被称为状态变量,表示月球探测器的速度、加速度、质量、与月球表面之间的距离物理参数,x0是其初始值,
Figure FDA0002280971510000013
是其一阶导数;u(t)表示月球探测器的燃料消耗速率,ul、uu分别为其下限值和上限值;是根据能量守恒以及力学原理建立的微分方程组;是对月球探测器软着陆结束时刻的物理参数建立的约束条件;nx,ng分别是状态变量和约束的数量;
假设以Φ[x(tf)]表示燃料的总消耗量,则使燃料消耗最少的数学模型可表示为:
Figure FDA0002280971510000021
其中J[u(t)]表示控制目标,由燃料消耗速率u(t)决定;
信息采集模块包括当前下降速度采集、与月球表面之间的距离采集两个子模块;
结束时间处理模块引入新的时间变量υ,使得
t=(tf-t0)υ+t0 (3)
从而将结束时间tf不固定的数学模型(2)转换为控制时域为[0,1]的数学模型,如下所示:
Figure FDA0002280971510000022
其中,
控制向量参数化模块采用分段常量策略来实现燃料消耗速率控制,具体如下:
假设整个控制时域[0,1]被划分为p个控制子区间[υk-1k),p>0,k=1,2,...,p,并且
0<υ1<…<υp-1<υp=1 (6)
这样,可表示为:
Figure FDA0002280971510000025
其中,
Figure FDA0002280971510000026
为常数,表示
Figure FDA0002280971510000027
在控制子区间[υk-1k)内的参数值,χk(υ)为单位开关函数,其定义如下:
Figure FDA0002280971510000028
从而,燃料消耗速率控制参数可由向量
Figure FDA0002280971510000029
表示;
NLP问题求解模块包括序列二次规划(Sequential Quadratic Programming,SQP)求解、联立微分方程组求解两个子模块;联立微分方程组包括方程组(9)
Figure FDA0002280971510000031
和方程组(10)
Figure FDA0002280971510000032
其中,
Figure FDA0002280971510000033
利用四阶Runge-Kutta算法求解联立微分方程组(9)、(10),可以得到数学模型(4)的目标函数值
Figure FDA0002280971510000034
以及目标函数对控制参数向量的一阶梯度信息:
Figure FDA0002280971510000035
同样,可以得到数学模型(4)中的约束函数值
Figure FDA0002280971510000036
以及约束函数对控制参数向量的一阶梯度信息:
Figure FDA0002280971510000037
自适应控制节点分配模块提供了一种自适应分配控制节点的策略,具体如下:
假设经过第l次迭代,得到的目标函数最优值为J*l,最优控制参数为
Figure FDA0002280971510000038
Figure FDA0002280971510000039
相应的控制网格为
Figure FDA00022809715100000310
通过将Δl中的每个控制子区间进行二等分,得到控制网格
Figure FDA00022809715100000311
及初始控制参数
Figure FDA00022809715100000312
对于
Figure FDA00022809715100000313
中当前取值为
Figure FDA00022809715100000314
的各个参数
Figure FDA00022809715100000315
为了评估其对目标函数J下降量的影响,定义
Figure FDA00022809715100000316
相对于J的灵敏度为:
Figure FDA00022809715100000317
其中,
Figure FDA00022809715100000318
表示不超过(j+1)/2的最大整数;
假设在控制区间
Figure FDA00022809715100000319
内,
Figure FDA00022809715100000320
分别为第l-1次和第l次所获得的最优控制参数值;如果以下条件满足:
Figure FDA0002280971510000041
其中,εuv>0为给定阈值,则令
s2k-1=0且s2k=0 (17)
对于Δl'中的控制节点
Figure FDA0002280971510000042
如果在下一次迭代中将其保留,需满足:
Figure FDA0002280971510000043
其中,rsu>0为给定系数,
Figure FDA0002280971510000044
为平均灵敏度,其定义如下:
Figure FDA0002280971510000045
如果式(18)不满足,则将该控制节点消除;
当控制节点
Figure FDA0002280971510000047
都被消除时,如果以下条件满足
其中,给定系数rsl∈(0,rsu]、εuh>0,则控制节点
Figure FDA0002280971510000049
也应该被消除;
经过以上控制网格二等分以及控制节点消除等步骤,控制网格Δl'可作为下一次迭代的控制网格Δl+1
时间尺度转换模块是将当前数学模型(4)转换到一个新的时间尺度上,以便于对自适应控制节点分配模块得到的控制网格进行优化,具体如下:
对于一个新插入的控制节点如果满足
Figure FDA00022809715100000411
其中,给定系数rss≥rsu,则该控制节点被认为是重要控制节点;这样,控制子区间
Figure FDA00022809715100000412
被认为是重要控制子区间,其长度可当作变量进行优化,以找到控制节点
Figure FDA00022809715100000414
的最优位置;
假设经过自适应控制节点分配模块调整后,整个控制时域存在P个控制子区间[υk-1k)(k=1,2,...,P),每个控制子区间的长度用θk表示,且其初始值为
Figure FDA00022809715100000415
对于其中的非重要控制子区间,其长度为定值,不必优化;对于其中的重要控制子区间,根据其连续情况,假设可分为R(R≥1)部分,第r(1≤r≤R)部分包含nr(nr≥2)个连续控制子区间,且其所有控制子区间的长度满足:
Figure FDA0002280971510000051
引入时间尺度转换函数如下:
Figure FDA0002280971510000052
其中,τ为新的时间变量,
Figure FDA0002280971510000053
表示不超过τ的最大整数;这样,数学模型(4)在新的时间尺度上可被转换为:
Figure FDA0002280971510000054
其中,
所述MCU产生燃料消耗系统运行指令的过程如下:
步骤B1:信息采集模块获取月球探测器当前下降速度以及与月球表面之间的距离;
步骤B2:初始化模块运行,设置初始控制网格数目p、燃料消耗速率控制策略的初始猜测值
Figure FDA0002280971510000056
设定常数值εuv>0、εuh>0、rsu>0、rsl∈(0,rsu]、rss≥rsu,设置最大迭代次数lmax≥1以及终止误差tolJ>0,并令迭代计数l=0;
步骤B3:结束时间处理模将结束时间不固定的月球探测器软着陆数学模型转换为控制时域为[0,1]的数学模型;
步骤B4:控制向量参数化模块采用分段常量策略来表示燃料消耗速率控制曲线,如果l=0,则将控制时域等分为p段而得到当前控制网格,并令所有控制参数值为
Figure FDA0002280971510000057
否则,采用Δl作为当前控制网格,每个控制子区间内的参数值为对应控制时域内
Figure FDA0002280971510000058
的值;
步骤B5:NLP问题求解模块中的SQP求解模块运行,并且通过联立微分方程组求解模块获取目标函数值、目标函数对控制参数向量的一阶梯度信息、约束函数值、约束函数对控制参数向量的一阶梯度信息,最终得到当前控制网格下的目标函数最优值J*l以及相应的最优控制参数
Figure FDA0002280971510000061
步骤B6:终止条件判断模块运行,对于l>0,如果l=lmax
Figure FDA0002280971510000062
则执行步骤B10,否则,执行步骤B7;
步骤B7:自适应控制节点分配模块运行,获得新的控制网格Δl+1
步骤B8:令迭代计数l=l+1,如果l=lmax,则执行步骤B9,否则,转到步骤B4;
步骤B9:时间尺度转换模块将数学模型转换到新时间尺度上,转到步骤B4;
步骤B10:控制指令输出模块将当前控制时域按转换到实际控制时域,并将获得的最优燃料消耗速率控制策略输出。
CN201711117056.5A 2017-11-13 2017-11-13 一种基于自适应优化控制节点的月球探测器软着陆最优控制系统 Expired - Fee Related CN107942661B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711117056.5A CN107942661B (zh) 2017-11-13 2017-11-13 一种基于自适应优化控制节点的月球探测器软着陆最优控制系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711117056.5A CN107942661B (zh) 2017-11-13 2017-11-13 一种基于自适应优化控制节点的月球探测器软着陆最优控制系统

Publications (2)

Publication Number Publication Date
CN107942661A CN107942661A (zh) 2018-04-20
CN107942661B true CN107942661B (zh) 2020-02-28

Family

ID=61934929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711117056.5A Expired - Fee Related CN107942661B (zh) 2017-11-13 2017-11-13 一种基于自适应优化控制节点的月球探测器软着陆最优控制系统

Country Status (1)

Country Link
CN (1) CN107942661B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111308893B (zh) * 2020-03-05 2021-06-18 江南大学 生物反应器流加调控的非均匀网格优化方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5094409A (en) * 1990-05-09 1992-03-10 The Bionetics Corporation Method of providing a lunar habitat from an external tank
CN101464664B (zh) * 2009-01-09 2010-12-01 浙江工业大学 基于单种群和预交叉的差分进化算法的间歇反应器最优控制方法
CN101872444B (zh) * 2010-05-21 2012-07-25 杭州电子科技大学 一种结合中期修正策略的间歇过程批到批优化方法
CN101887239A (zh) * 2010-06-30 2010-11-17 浙江大学 一种自适应的工业过程最优控制系统及方法
CN103853127A (zh) * 2012-12-06 2014-06-11 天津市电力公司 一种寻求在dcs中最优控制变量值的方法
CN103309234B (zh) * 2013-06-08 2015-12-09 浙江大学 一种基于正交配置优化的间歇反应釜控制系统
CN103309371B (zh) * 2013-06-08 2015-07-22 浙江大学 一种基于控制变量参数化方法的间歇反应釜控制系统
CN103557511B (zh) * 2013-11-18 2015-02-25 华北电力大学(保定) 一种电站锅炉主蒸汽温度全程控制方法
CN103926835B (zh) * 2014-04-04 2016-06-29 北京航空航天大学 一种基于干扰观测器的着陆器动力下降段优化控制方法
CN105253328B (zh) * 2015-09-02 2017-06-27 北京控制工程研究所 一种动力下降过程位置速度全可控的近似最优显式制导方法

Also Published As

Publication number Publication date
CN107942661A (zh) 2018-04-20

Similar Documents

Publication Publication Date Title
CN107656439B (zh) 一种基于自适应控制网格的月球探测器软着陆最优控制系统
CN107765554B (zh) 一种基于自适应控制节点的月球探测器软着陆最优控制系统
CN107885082B (zh) 一种基于正交配置优化的月球着陆器轨迹控制器
CN107942661B (zh) 一种基于自适应优化控制节点的月球探测器软着陆最优控制系统
CN105955023B (zh) 一种用于快速运动控制系统的模型预测控制方法
CN209842353U (zh) 交流径向磁轴承用神经网络自抗扰控制器
CN108241292A (zh) 一种基于扩张状态观测器的水下机器人滑模控制方法
CN104048676B (zh) 基于改进粒子滤波的mems陀螺随机误差补偿方法
WO2023168772A1 (zh) 一种飞行器动态特性模拟的时间并行扰动域更新方法
CN108667504A (zh) 一种基于交替方向乘子法的无人飞行器中继系统分布式资源优化方法
CN110515301A (zh) 一种结合dmpc的改进的admm算法
CN109918808A (zh) 一种气热弹三场耦合仿真分析方法
CN111045447B (zh) 高精度的高超声速飞行器轨迹优化多尺度最优控制系统
CN113110058B (zh) 一种通信受限的多智能体系统二分实用一致性控制方法
CN107703759B (zh) 一种基于自适应优化控制网格的月球探测器软着陆最优控制系统
Hur et al. Direct dynamic-simulation approach to trajectory optimization
Huang et al. FPGA implementation of 4-channel ICA for on-line EEG signal separation
CN110262334A (zh) 一种随机通信协议下状态饱和系统的有限时域h∞控制方法
CN111766890B (zh) 不依赖神经网络近似的航天器保性能姿态控制方法
CN117407637A (zh) 一种基于Radau方法的高指标微分代数方程神经网络求解方法
CN203301361U (zh) 光伏并网逆变器的智能电流及电压隔离变送器
CN106873363B (zh) 一种飞行器迎角信号的建模方法
CN113410861B (zh) 一种适用于多端柔性直流系统的下垂控制参数优化方法
CN107942967B (zh) 一种基于自适应优化控制网格的间歇反应器最优控制系统
CN113485397B (zh) 一种基于多项式规划的航天器姿态机动路径规划方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200228

Termination date: 20211113

CF01 Termination of patent right due to non-payment of annual fee