CN112800542B - 一种样本数据生成方法及装置、存储介质 - Google Patents

一种样本数据生成方法及装置、存储介质 Download PDF

Info

Publication number
CN112800542B
CN112800542B CN202110109336.1A CN202110109336A CN112800542B CN 112800542 B CN112800542 B CN 112800542B CN 202110109336 A CN202110109336 A CN 202110109336A CN 112800542 B CN112800542 B CN 112800542B
Authority
CN
China
Prior art keywords
sample data
rocket
landing
value
data generation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110109336.1A
Other languages
English (en)
Other versions
CN112800542A (zh
Inventor
龚胜平
宋雨
苗新元
程林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110109336.1A priority Critical patent/CN112800542B/zh
Publication of CN112800542A publication Critical patent/CN112800542A/zh
Application granted granted Critical
Publication of CN112800542B publication Critical patent/CN112800542B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/13Differential equations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/10Numerical modelling

Abstract

一种样本数据生成方法及装置、计算机可读存储介质,所述样本数据生成方法包括:建立火箭垂直回收的燃料最优控制问题模型;根据所述燃料最优控制问题模型,建立对应的逆问题模型;根据所述逆问题模型生成样本数据。本实施例提供的方案,基于逆问题模型生成样本数据,避免了正向求解燃料最优问题,耗时较少,具备更高的样本生成效率。

Description

一种样本数据生成方法及装置、存储介质
技术领域
本文涉及智能控制技术,尤指一种样本数据生成方法及装置、存储介质。
背景技术
随着国际商业火箭公司如太空探索公司(SpaceX)、蓝色起源(Blue Origin)等相继成功研制了可重复使用的火箭飞行器,火箭垂直回收技术成为学术界和世界各大航天机构的研究热门。火箭一子级在完成发射任务后再入返回时,受到稠密大气等诸多不确定的干扰,对精确着陆制导算法带来了严峻的考验。由于起始条件的不确定性,且火箭下降的时间较短,传统算法无法满足强自适应性、实时性等需求。
发明内容
本申请实施例提供了一种样本数据生成方法及装置,可以降低样本数据生成时间。
本申请实施例提供了一种样本数据生成方法,包括:
建立火箭垂直回收的燃料最优控制问题模型;
根据所述燃料最优控制问题模型,建立对应的逆问题模型;
根据所述逆问题模型生成样本数据。
在一示例性实施例中,所述根据所述逆问题模型生成样本数据包括:
确定积分初值;
根据所述积分初值以及下述微分方程式,进行数值积分;
Figure BDA0002918736220000021
当满足预设条件时,停止积分,获得样本数据;
其中,τ为逆向时间独立变量,其取值为τ0至τf,τ0为着陆段的最终时刻,τf为着陆段的起始时刻;r(τ),v(τ)和m(τ)分别表示τ时刻所述火箭的位置矢量、速度矢量和质量,g表示重力加速度矢量,u(τ)和nT(τ)分别表示τ时刻所述火箭的推力的大小和方向,Isp为火箭的发动机的比冲,g0为地球海平面重力常量,λr(τ),λv(τ),λm(τ)分别为位置矢量的协态变量、速度矢量的协态变量和质量的协态变量。
在一示例性实施例中,所述确定积分初值包括:
确定积分初值Xi0)=[r(τ0);v(τ0);m(τ0);λr0);λv0);λm0)];其中,r(τ0)为着陆段的最终时刻期望的位置矢量,v(τ0)为着陆段的最终时刻期望的速度矢量;随机选取m(τ0)∈[mf,min,mf,max],mf,min为火箭在着陆段的最终时刻的质量最小值,mf,max为所述火箭在着陆段的最终时刻的质量最大值;
所述λm0)=0,所述λr0),λv0)根据如下方式确定:
Figure BDA0002918736220000022
Figure BDA0002918736220000023
Figure BDA0002918736220000024
其中,
Figure BDA0002918736220000031
mf即m(τ0);Tmax为所述火箭的推力幅值的最大值;
Figure BDA0002918736220000032
随机选取且
Figure BDA0002918736220000033
Figure BDA0002918736220000034
以火箭的最终着陆点为中心点,以重力加速度的反方向为y轴,建立xyz三轴坐标系,
Figure BDA0002918736220000035
Figure BDA0002918736220000036
分别表示x、y、z坐标轴方向上的单位矢量,θmax为火箭的推力方向与y轴的夹角的最大值。
在一示例性实施例中,所述
Figure BDA0002918736220000037
所述k为预设值。
在一示例性实施例中,所述θmax=15°,0≤k≤12。
在一示例性实施例中,所述k=6。
在一示例性实施例中,所述预设条件包括以下至少之一:
积分时长满足:τ==τmax,τmax为所述火箭着陆段的起始时刻至最终时刻的时长;
质量条件约束满足:m(τ)==mmax,所述mmax为火箭燃料满载时的质量;
违反路径约束:
Figure BDA0002918736220000038
其中γ表示路径约束的极限角,rx(τ),ry(τ)和rz(τ)分别表示τ时刻位置矢量r(τ)在x轴、y轴、z轴的分量。
本申请实施例提供一种样本数据生成装置,包括存储器和处理器,所述存储器存储有程序,所述程序在被所述处理器读取执行时,实现上述样本数据生成方法。
本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述样本数据生成方法。
本申请实施例提供一种样本数据生成方法及装置,存储介质,所述样本数据生成方法包括:建立火箭回收的燃料最优控制问题模型;根据所述燃料最优控制问题模型,建立对应的逆问题模型;根据所述逆问题模型生成样本数据。本申请实施例所提供的方法,基于逆问题模型生成样本数据,避免了正向求解燃料最优问题,耗时较少,具备更高的样本生成效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本申请实施例提供的样本数据生成方法流程图;
图2为一示例性实施例提供的坐标系及火箭路径约束示意图;
图3为一示例性实施例提供的推力方向的角度和推力指向约束示意图;
图4为一示例性实施例提供的多条样本轨迹示意图;
图5为一示例性实施例提供的样本轨迹端点分布情况示意图;
图6为一示例性实施例提供的推力曲线与间接法所得的推力曲线对比示意图;
图7为本申请实施例提供的样本数据生成装置示意图;
图8为本申请实施例提供的计算机可读存储介质示意图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
近年来,随着人工智能技术在计算机视觉、自然语言识别等领域的突破,机器学习技术也被广泛用于航天飞行器动力学制导与控制中。目前,用于航天器动力学制导与控制的机器学习方法主要归于强化学习和监督学习两大类。强化学习采用智能体和环境不断交互的方法,以“试错”的方式进行学习,不依赖于任何离线的学习样本,但训练效率往往较低,收敛的智能体控制精度也较差。相比之下,监督学习则具有更高的学习效率,但依赖于大量的离线学习样本。由于航天任务本身小样本的特性,用于训练神经网络的样本数据往往通过离线模拟生成。一种方案中,针对深空探测转移轨道,通过随机生成大量出发天体和目标交会天体,并通过间接法依次计算两者之间的转移轨道,获得大量的局部最优解,作为深度神经网络的训练数据;另一方案中,针对着陆问题,通过随机产生初始状态,采用直接法或间接法计算从该初始状态到目标落点的燃料最优轨道,作为深度神经网络的学习数据。上述的离线训练数据生成方法,通过求解最优控制问题,保证了解的最优性,使得深度学习在通过离线训练后,能够进行在线最优映射。然而,最优控制问题的离线求解,往往需要在计算效率和最优性之间做权衡。例如,利用间接法求解燃料最优着陆最优控制问题,由于协态初值敏感性和控制量的不连续性,需要采用协态初值归一化、同伦法等技巧,才能得到一条样本轨迹;直接法虽然不依赖于初值的选取,但求解精度和解的最优性往往不如间接法。同时,直接法和间接法在求解过程中,计算效率和离散精度都有很大关系,为了获取单条样本轨迹上更多的样本点,必然导致单条样本轨迹生成效率的损失。为使基于深度神经网络的智能控制具备更好的学习效果,需要数以百万计的离线训练样本,上述通过求解最优控制问题的样本生成方法往往需要花费数以天计的时间。
本公开实施例提出了一种样本数据生成方法。本公开实施例中,针对火箭垂直回收制导问题,建立正向的燃料最优控制问题,通过变分法和极大值原理推导最优控制律以及满足的一阶必要条件和横截条件;其次,通过逆问题分析的方法,推导在特定假设条件下,逆问题具备的特性;在此基础上,通过所建立的燃料最优控制问题和逆问题分析得到的特性和结论,提出火箭回收最优控制问题样本轨迹的生成策略。
图1为本申请实施例提供的样本数据生成方法流程图。如图1所示,本申请实施例提供的样本数据生成方法包括:
步骤101,建立火箭垂直回收的燃料最优控制问题模型;
步骤102,根据所述燃料最优控制问题模型,建立对应的逆问题模型;
步骤103,根据所述逆问题模型生成样本数据。
本实施例提供的样本数据生成方法,可用于生成火箭垂直回收智能控制算法中所需的样本数据。智能控制算法中通过人工智能方法,比如深度学习,来做火箭回收的智能控制。而智能方法往往都是需要大量的数据样本进行离线训练,本申请实施例提供样本数据的生成方法。
本实施例提供的方案,基于逆问题模型生成样本数据,避免了正向求解燃料最优问题,耗时较少,具备更高的样本生成效率。
下面通过具体实施例对本申请技术方案进行说明。
在一示例性示例中,提供一种样本数据生成方法,包括:
步骤一:建立火箭垂直回收着陆段燃料最优控制问题模型,简称为正问题;
本实施例中,针对火箭垂直回收动力着陆段问题,建立如图1和图2所示的坐标系,定义火箭质心运动的xyz三轴坐标系,本实施例中,以火箭的最终着陆点为坐标系的原点,以重力加速度的反方向为y轴,并定义火箭运动轨迹需要满足的路径约束,以及推力指向约束。火箭质心的动力学方程为:
Figure BDA0002918736220000071
其中,r,v和m分别表示火箭的位置矢量、速度矢量和质量;g表示重力加速度矢量,本申请实施例中视为常值向量;Isp表示火箭发动机的比冲,g0表示地球海平面重力常量,u和nT分别表示火箭推力的大小和方向,且:
Figure BDA0002918736220000072
其中,u表示火箭推力矢量,θ和
Figure BDA0002918736220000076
为描述火箭推力方向的两个角度,θ为火箭推力方向与y轴的夹角,
Figure BDA0002918736220000077
为火箭推力方向在x轴、z轴构成的平面的投影与x轴的夹角,如图2所示;
Figure BDA0002918736220000074
Figure BDA0002918736220000075
分别表示x,y,z三个坐标轴方向上的单位矢量。
推力大小和方向满足的约束(控制量可行域)为:
Figure BDA0002918736220000073
其中,Tmax和Tmin分别表示火箭的推力幅值的最大和最小值,θmax为火箭推力方向与y轴的夹角的最大值,如图3所示,Tmax、Tmin和θmax可以预先设定。在一示例性实施例中,所述θmax可以为15°,但不限于此。
火箭运动轨迹的路径约束可以表示为:
Figure BDA0002918736220000081
其中γ表示锥形路径约束的极限角,为预设值,如图1所示;在一示例性实施例中,所述γ可以为60°,但不限于此。rx(t),ry(t)和rz(t)分别表示t时刻位置矢量r(t)在x轴、y轴、z轴的分量。
火箭垂直回收的着陆段的起始时刻和着陆段的最终时刻满足的状态约束为:
Figure BDA0002918736220000082
Figure BDA0002918736220000083
其中,t0和tf分别表示火箭的着陆段的起始时刻和着陆段的最终时刻,r0、v0和m0分别表示火箭在着陆段的起始时刻的位置、速度矢量和火箭质量,rf和vf分别为火箭在着陆段的最终时刻期望的位置和速度矢量,在本申请实施例所建立的坐标系中,rf和vf均为0,但本申请实施例不限于此,当使用不同的坐标系时,相应的rf和vf值改变。
以燃料最优为目标函数,建立燃料最优问题的性能指标为
Figure BDA0002918736220000084
通过引入协态变量,建立系统的哈密尔顿(Hamilton)方程如下
Figure BDA0002918736220000085
通过Hamilton方程对状态量的偏导,可得正则方程
Figure BDA0002918736220000086
根据极小值条件,最优控制律满足:
Figure BDA0002918736220000091
定义协态向量的单位方向矢量
Figure BDA0002918736220000092
则最优控制律可显式地表示为
Figure BDA0002918736220000093
Figure BDA0002918736220000094
其中ρ表示开关函数
Figure BDA0002918736220000095
根据式(12),当
Figure BDA0002918736220000096
时,角度约束不活跃,即
Figure BDA0002918736220000097
通过分析开关函数的单调性及符号变化,可得结论1:开关函数最多发生两次符号变化,即火箭的推力幅值曲线仅存在“Tmin-Tmax”、“Tmax-Tmin-Tmax”、“Tmax”三种情况,且最后一段为满开段。
步骤二:针对所建立的正问题,建立对应的逆问题,进行逆向分析;
对步骤一中的正问题进行逆向分析,定义逆向时间独立变量:
τ=tf-t,t∈[t0,tf] (16)
正问题与逆问题的正则方程、容许集及路径约束形式一致,初末端点条件互换:
Figure BDA0002918736220000101
Figure BDA0002918736220000102
Figure BDA0002918736220000103
其中,
Figure BDA0002918736220000104
θ和
Figure BDA0002918736220000105
为描述火箭推力方向的两个角度,θ(τ)为τ时刻火箭推力方向与y轴的夹角,
Figure BDA0002918736220000106
为τ时刻火箭推力方向在x轴、z轴构成的平面的投影与x轴的夹角。
质量mf自由,且性能指标中不显含质量,则质量协态λm末端满足:
λm0)=λm(tf)=0 (20)
正问题的末端时刻自由,末端状态固定且不显含质量项,可得:
H*0)=H*(tf)=0 (21)
由式(17)可得,位置协态λr为常值向量,速度协态λv随时间线性变化,即
Figure BDA0002918736220000107
步骤三:针对火箭最后着陆段的飞行特性,分析逆问题具备的特性;
考虑火箭垂直回收接近落点时的姿态约束,推力方向接近重力方向的反向,即:
假设1:推力方向角度约束不活跃,速度协态满足
Figure BDA0002918736220000111
则有
Figure BDA0002918736220000112
根据结论1中开关函数单调性及火箭着陆最终段推力满开的特性,可得结论2:开关函数在最后满开段单调递减,即:
Figure BDA0002918736220000113
将式(23)及式(20)代入到式(21),可得
Figure BDA0002918736220000114
整理可得:
Figure BDA0002918736220000115
其中,
Figure BDA0002918736220000116
mf即m(τ0);
等式(26)两边同除以||λv0)||,并重新整理可得:
Figure BDA0002918736220000117
其中,
Figure BDA0002918736220000118
即速度协态λv0)的y轴分量λv,y0)与模||λv0)||的余弦值。
根据协态变化规律式(22)及最优控制律式(12),可得结论3:λv决定了推力的方向,λr决定了推力方向的变化情况。
基于假设1及结论2,将逆问题的初始条件代入到开关函数中可得:
Figure BDA0002918736220000121
其中,cos<λrv0)>表示向量λr与λv0)夹角的余弦值。
将式(26)代入上式(28),可得:
Figure BDA0002918736220000122
即在逆问题初始时刻,开关函数符号为负,与上述结论2一致。
由式(28)中开关函数一阶导数的表达式,根据结论2及假设1,可得结论4:逆问题中λv0)与λr夹角大于90°。
步骤四:基于逆问题的特性分析,建立样本轨迹生成策略。
根据步骤二和步骤三中关于逆问题分析,任意给定一组[λrv0),m(τ0)],以及积分时长Δt=τf0,则可以确定一条逆问题的轨迹。对上述7维参数(即,r(τ0),v(τ0),m(τ0),λrv0),m(τ0),以及积分时长)进行任意随机的组合,即可得到不同随机初始状态的逆问题轨迹,即得到样本数据。
根据式(26)可知,||λv0)||由质量m(τ0)确定,λv0)在xyz三坐标轴的分量可由式(11)中的两个角度唯一确定。此外,在假设1的条件下,决定λv0)方向的两个角度量
Figure BDA0002918736220000123
满足如下约束:
Figure BDA0002918736220000124
关于||λr0)||的取值,可由单位圆上两个随机的归一化参数ε1和ε2生成,表达方式如下:
Figure BDA0002918736220000125
由上述表达式可知,通过归一化,取值范围在正实数空间的||λr0)||被两个单位圆弧上的参数ε1和ε2唯一确定。
同理,决定λr0)方向的两个角度
Figure BDA0002918736220000131
可以根据各自的取值范围生成,如下式(32):
Figure BDA0002918736220000132
值得一提的是,根据式(22)及结论3,λr决定了推力方向的变化情况。随着逆问题时间项独立变量的增加,λv(τ)逐渐向λr逼近,即
Figure BDA0002918736220000133
逐渐向
Figure BDA0002918736220000134
逼近。当式(29)中的
Figure BDA0002918736220000135
较小时,由式(12)及式(2)可知,推力方向在水平方向的分量最大,会导致路径约束边界处积累大量的样本轨迹。在一示例性实施中,为避免此类现象,使样本轨迹集中分布在靠近落点中心上方,并向周围辐射的情况,对
Figure BDA0002918736220000136
做一定的约束,即:
Figure BDA0002918736220000137
其中,π-kθmax≥0,通过调节不同的k值,可以控制样本点在水平面内的分布。k值越大,样本轨迹在水平方向的分布越均匀,甚至导致在路径约束边界大量累积;反之,k值越小,样本越集中在原点正上方。
在一示例性实施例中,当θmax=15°时,0≤k≤12。
在一示例性实施例中,可以取k=6,从而权衡样本轨迹在水平方向上的分布以及原点正上方重点区域的分布,但本申请实施例不限于此,k可以为其他值。
在一示例性实施例中,提供一种样本数据生成方法,包括:
步骤1:随机选取m(τ0)∈[mf,min,mf,max],mf,min为火箭在着陆段的最终时刻的质量最小值(可以是火箭携带的燃料完全消耗时的质量),mf,max为所述火箭在着陆最终时刻的质量最大值(可以是火箭携带的燃料未完全消耗时的质量),根据式(29)随机选取协态变量单位矢量的角度值
Figure BDA0002918736220000138
根据式(32)随机选取协态变量单位矢量的角度值
Figure BDA0002918736220000139
Figure BDA00029187362200001310
Figure BDA00029187362200001311
步骤2:根据式(27)确定||λr0)||,根据式(30)确定||λv0)||,根据||λr0)||、||λv0)||
Figure BDA00029187362200001312
(
Figure BDA00029187362200001313
Figure BDA00029187362200001314
Figure BDA00029187362200001315
Figure BDA00029187362200001316
)以及式(11)确定λr0)及λv0);
即:
Figure BDA0002918736220000141
Figure BDA0002918736220000142
ε1和ε2随机选取;
Figure BDA0002918736220000143
取λm0)=0,可以确定微分方程的积分初值:Xi0)=[r(τ0);v(τ0);m(τ0);λr0);λv0);λm0)]。
步骤3:根据上述微分方程的积分初值:Xi0)=[r(τ0);v(τ0);m(τ0);λr0);λv0);λm0)],以及,预设的积分时长τmax和微分方程式(17),进行数值积分;
即根据如下微分方程进行数值积分:
Figure BDA0002918736220000144
步骤4:当满足预设条件时,停止进行数值积分,得到第i条样本轨迹Xi(τ):
所述预设条件包括以下至少之一:
条件A:积分时长满足:τ==τmax,τmax为所述火箭着陆段的起始时刻至最终时刻的时长;
条件B:质量条件约束满足:m(τ)==mmax,所述mmax为所述火箭燃料满载时的质量;
条件C:违反路径约束:
Figure BDA0002918736220000151
其中γ表示路径约束的极限角,rx(τ),ry(τ)和rz(τ)分别表示τ时刻位置矢量r(τ)在x轴、y轴、z轴的分量。
在一示例性实施例中,当满足上述条件之一时,停止进行数值积分。
在一示例性实施例中,还包括:步骤5,保存第i条轨迹,返回步骤1,继续生成第i+1条轨迹。
在一示例性实施例中,根据本申请实施例提供的样本数据生成方法,随机生成3000条样本轨迹,如附图4所示。随机生成的样本轨迹端点分布情况如附图5所示。从图4和图5可以看出,样本轨迹在三维空间中呈辐射散开状,样本轨迹端点在水平方向上呈正态分布。
下面采用传统的间接法求解正向的最优控制问题,对本申请实施例提出的方法生成的样本轨迹,进行有效性和最优性的验证,并对样本数据的分布进行分析。在一示例性实施例中,随机生成一条样本轨迹和样本推力曲线,取该样本轨迹的端点r0,v0以及m0作为初始状态,采用同样的参数进行间接法求解,对比采用本申请实施例提供的方案生成的样本推力曲线和通过间接法求得的燃料最优推力曲线,结果如图6所示,其中,实线为本申请实施例生成的样本推力曲线,带三角形的虚线为通过间接法得到的燃料最优推力曲线,可以看出,本申请实施例得到的样本推力曲线与间接法求得的燃料最优推力曲线基本重合,因此,本申请实施例所提出的样本数据生成方法,具备与正向求解燃料最优问题等价的可行性和最优性。
本申请实施例所提出的样本数据生成方法,可用于但不限于火箭垂直回收可控域分析、智能控制器等多种智能控制算法的离线样本数据生成。
图7为本申请实施例提供的一种样本数据生成装置示意图。如图7所示,本申请实施例提供的样本数据生成装置包括存储器710和处理器720,所述存储器710存储有程序,所述程序在被所述处理器720读取执行时,实现上述样本数据生成方法。
图8为本申请实施例提供的一种计算机可读存储介质示意图。如图8所示,本申请实施例提供一种计算机可读存储介质70,所述计算机可读存储介质70存储有一个或者多个程序80,所述一个或者多个程序80可被一个或者多个处理器执行,以实现上述样本数据生成方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

Claims (8)

1.一种样本数据生成方法,其特征在于,包括:
建立火箭垂直回收的燃料最优控制问题模型;
根据所述燃料最优控制问题模型,建立对应的逆问题模型;
根据所述逆问题模型生成样本数据;
所述根据所述逆问题模型生成样本数据包括:
确定积分初值;
根据所述积分初值以及下述微分方程式,进行数值积分;
Figure DEST_PATH_IMAGE001
当满足预设条件时,停止积分,获得样本数据;
其中,
Figure 630291DEST_PATH_IMAGE002
为逆向时间独立变量,其取值为
Figure DEST_PATH_IMAGE003
Figure 605201DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
为着陆段的最终时刻,
Figure 493522DEST_PATH_IMAGE006
为着陆段的起始时刻;
Figure DEST_PATH_IMAGE007
Figure 313711DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE009
分别表示
Figure 798351DEST_PATH_IMAGE002
时刻所述火箭的位置矢量、 速度矢量和质量,g表示重力加速度矢量,
Figure 740899DEST_PATH_IMAGE010
Figure DEST_PATH_IMAGE011
分别表示
Figure 54200DEST_PATH_IMAGE002
时刻所述火箭的推 力的大小和方向,I sp为火箭的发动机的比冲,g 0为地球海平面重力常量,
Figure 615762DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
Figure 26015DEST_PATH_IMAGE014
分别为位置矢量的协态变量、速度矢量的协态变量和质量的协态变量。
2.根据权利要求1所述的样本数据生成方法,其特征在于,所述确定积分初值包括:
确定积分初值
Figure DEST_PATH_IMAGE015
;其中,
Figure 342727DEST_PATH_IMAGE016
为着陆段 的最终时刻期望的位置矢量,
Figure DEST_PATH_IMAGE017
为着陆段的最终时刻期望的速度矢量;随机选取
Figure 143324DEST_PATH_IMAGE018
,
Figure DEST_PATH_IMAGE019
为火箭在着陆段的最终时刻的质量最小值,
Figure 833544DEST_PATH_IMAGE020
为所述火箭在着陆段的最终时刻的质量最大值;
所述
Figure DEST_PATH_IMAGE021
,所述
Figure 832724DEST_PATH_IMAGE022
根据如下方式确定:
Figure 117075DEST_PATH_IMAGE023
其中,
Figure 608230DEST_PATH_IMAGE024
Figure 636229DEST_PATH_IMAGE025
Figure 755495DEST_PATH_IMAGE026
Figure 882851DEST_PATH_IMAGE027
Figure 782673DEST_PATH_IMAGE028
为所述火箭的推力幅值的最大值;
Figure 552046DEST_PATH_IMAGE029
Figure 791398DEST_PATH_IMAGE030
Figure 151972DEST_PATH_IMAGE031
Figure 479704DEST_PATH_IMAGE033
随机选取且
Figure 849505DEST_PATH_IMAGE034
Figure 943363DEST_PATH_IMAGE035
,以火箭的最终着陆点为中心点,以重力加速度的反方向为y轴, 建立xyz三轴坐标系,
Figure 412522DEST_PATH_IMAGE036
Figure 21358DEST_PATH_IMAGE037
Figure 663692DEST_PATH_IMAGE038
分别表示x、y、z坐标轴方向上的单位矢量,
Figure 346477DEST_PATH_IMAGE039
为火箭的推 力方向与y轴的夹角的最大值。
3.根据权利要求2所述的样本数据生成方法,其特征在于,所述
Figure 580012DEST_PATH_IMAGE041
,所述k为预设值。
4.根据权利要求3所述的样本数据生成方法,其特征在于,所述
Figure 676144DEST_PATH_IMAGE039
=15°,
Figure 325431DEST_PATH_IMAGE042
5.根据权利要求3所述的样本数据生成方法,其特征在于,所述k=6。
6.根据权利要求2至5任一所述的样本数据生成方法,其特征在于,所述预设条件包括以下至少之一:
积分时长满足:
Figure 269247DEST_PATH_IMAGE043
Figure 408105DEST_PATH_IMAGE044
为所述火箭着陆段的起始时刻至最终时刻的时长;
质量条件约束满足:
Figure 926286DEST_PATH_IMAGE045
,所述
Figure 176002DEST_PATH_IMAGE046
为火箭燃料满载时的质量;
违反路径约束:
Figure 98959DEST_PATH_IMAGE047
,其中γ表示路径约束的极限角,
Figure 346400DEST_PATH_IMAGE048
Figure 417125DEST_PATH_IMAGE049
Figure 673794DEST_PATH_IMAGE050
分别表示
Figure 451257DEST_PATH_IMAGE002
时刻位置矢量
Figure 463075DEST_PATH_IMAGE051
在x轴、y轴、z轴的分量。
7.一种样本数据生成装置,其特征在于,包括存储器和处理器,所述存储器存储有程序,所述程序在被所述处理器读取执行时,实现如权利要求1至6任一所述的样本数据生成方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至6任一所述的样本数据生成方法。
CN202110109336.1A 2021-01-27 2021-01-27 一种样本数据生成方法及装置、存储介质 Active CN112800542B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110109336.1A CN112800542B (zh) 2021-01-27 2021-01-27 一种样本数据生成方法及装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110109336.1A CN112800542B (zh) 2021-01-27 2021-01-27 一种样本数据生成方法及装置、存储介质

Publications (2)

Publication Number Publication Date
CN112800542A CN112800542A (zh) 2021-05-14
CN112800542B true CN112800542B (zh) 2023-01-20

Family

ID=75812071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110109336.1A Active CN112800542B (zh) 2021-01-27 2021-01-27 一种样本数据生成方法及装置、存储介质

Country Status (1)

Country Link
CN (1) CN112800542B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414003A (zh) * 2019-07-29 2019-11-05 清华大学 建立文本生成模型的方法、装置、介质和计算设备
CN110929772A (zh) * 2019-11-15 2020-03-27 北京奇艺世纪科技有限公司 模型训练方法、样本生成方法、装置、电子设备及存储介质
CN111709248A (zh) * 2020-05-28 2020-09-25 北京百度网讯科技有限公司 文本生成模型的训练方法、装置及电子设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9225988B2 (en) * 2013-05-30 2015-12-29 Apple Inc. Adaptive color space transform coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414003A (zh) * 2019-07-29 2019-11-05 清华大学 建立文本生成模型的方法、装置、介质和计算设备
CN110929772A (zh) * 2019-11-15 2020-03-27 北京奇艺世纪科技有限公司 模型训练方法、样本生成方法、装置、电子设备及存储介质
CN111709248A (zh) * 2020-05-28 2020-09-25 北京百度网讯科技有限公司 文本生成模型的训练方法、装置及电子设备

Also Published As

Publication number Publication date
CN112800542A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
Gaudet et al. Adaptive guidance and integrated navigation with reinforcement meta-learning
CN109655066A (zh) 一种基于Q(λ)算法的无人机路径规划方法
CN113268059B (zh) 基于有限时间扩张状态观测器的多无人艇编队控制方法
CN105005651A (zh) 航天器脉冲交会轨迹的梯度分割区间优化设计方法
CN114115262B (zh) 基于方位角信息的多auv执行器饱和协同编队控制系统和方法
CN113821035A (zh) 无人船轨迹追踪控制方法和装置
Valasek et al. Intelligent motion video guidance for unmanned air system ground target surveillance
CN111680462A (zh) 基于空间目标在光学相平面位置变化的制导方法和系统
CN111191368A (zh) 一种连续小推力行星际转移轨道优化方法和装置
Gao et al. Broad learning system-based adaptive optimal control design for dynamic positioning of marine vessels
CN114370793A (zh) 一种火箭子级返回与垂直着陆制导方法
Jiang et al. Realizing midcourse penetration with deep reinforcement learning
Li et al. Optimized neural network based sliding mode control for quadrotors with disturbances
CN113608541B (zh) 一种水下航行器姿态控制方法和系统
Wu et al. Improved reinforcement learning using stability augmentation with application to quadrotor attitude control
CN112800542B (zh) 一种样本数据生成方法及装置、存储介质
CN114118365A (zh) 基于径向基网络的跨介质飞行器快速入水近似优化方法
Khamis Advanced tracking strategies for linear and nonlinear control systems: Theory and applications
Vathsal et al. Current trends in tactical missile guidance
CN113955153B (zh) 一种燃料最优的连续小推力轨道转移方法
Mohamed et al. Flight control system design using adaptive pigeon-inspired optimisation
CN115542746A (zh) 高超声速飞行器的能量管控再入制导方法及装置
CN112800546B (zh) 一种火箭垂直回收状态可控性分析方法和装置
El-Kalubi et al. Vision-based real time guidance of UAV
Yuqi et al. Time-varying parameters estimation with adaptive neural network EKF for missile-dual control system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant