CN113093568A - 基于长短时记忆网络的飞机自动驾驶操作模拟方法 - Google Patents

基于长短时记忆网络的飞机自动驾驶操作模拟方法 Download PDF

Info

Publication number
CN113093568A
CN113093568A CN202110346058.1A CN202110346058A CN113093568A CN 113093568 A CN113093568 A CN 113093568A CN 202110346058 A CN202110346058 A CN 202110346058A CN 113093568 A CN113093568 A CN 113093568A
Authority
CN
China
Prior art keywords
flight
time
network
aircraft
long
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110346058.1A
Other languages
English (en)
Inventor
许斌
夏大昀
杨瑞嘉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202110346058.1A priority Critical patent/CN113093568A/zh
Publication of CN113093568A publication Critical patent/CN113093568A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B17/00Systems involving the use of models or simulators of said systems
    • G05B17/02Systems involving the use of models or simulators of said systems electric

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明涉及一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,属于飞机自动驾驶领域。将航线整流程飞行数据作为训练集,利用长短时记忆网络挖掘数据在时间序列上的相关性,学习飞行员依据航线导航信息进行驾驶行为决策的模式。通过训练,模型将学习到人类飞行员根据导航数据进行飞行模式转换的关键决策信息。对独立的飞行阶段进行飞行机理分析与数据相关性分析,确定相应的模型训练输入。通过训练,模型将学习到从飞行状态、飞行环境等输入到操作量输出的映射关系。由此,飞机在实际飞行过程中根据感知到的飞行状态、飞行环境等数据,通过长短时记忆网络模型预测得到对应的油门杆、脚蹬、俯仰横滚摇杆操作量,从而实现飞机的自动驾驶。

Description

基于长短时记忆网络的飞机自动驾驶操作模拟方法
技术领域
本发明属于飞机自动驾驶领域,特别是涉及一种基于长短时记忆(LSTM)网络的端到端的深度神经网络模型的飞机自动驾驶模拟方法。
背景技术
飞机的自动驾驶仪是按技术要求自动控制飞行器轨迹的调节设备,其作用主要是保持飞机姿态和辅助驾驶员操纵飞机,现代自动驾驶仪已广泛应用于飞机。自动驾驶仪可以保证飞机按照设定的航线、速度和高度自动飞行,如果飞机偏离原有姿态,系统也能自动修正。自动驾驶仪能够完成高空中的自动巡航保持稳定飞行,但一些比较精确的操作,比如起飞降落、地面滑行、避免碰撞等仍然需要飞行员介入。
针对当前飞机自动驾驶仪的局限性,有必要研究一种新的飞机自动驾驶方法,不需要通过人类预先设定飞机飞行状态,而是让飞机学会在遇到特定情况时如何自动飞行,自行智能地做出操作应对决策,增加飞机自动驾驶方法在真实飞行过程中的应用场景和泛化能力。
深度学习的蓬勃发展,极大地扩展了人工智能算法的应用场景并深刻地影响着当下的社会生活。作为深度学习的重要应用之一,自动驾驶技术也成为了热点研究领域。自然而然地,开始有研究者类比地将深度学习方法引入到飞机的自动驾驶中。该技术试图取代传统代自动驾驶仪在飞行驾驶的问题上进一步解放人类,利用计算机系统以及机器学习算法提高飞机自动驾驶的智能性,提高飞机自动驾驶技术的适用性范围,提高飞机驾驶的安全性与便利性,因此该技术具有良好的应用前景。
许多新的研究表明,采用一个端到端的神经网络模型作为“黑箱”系统进行问题求解,比基于人类经验特征进行建模求解的方法具有更好的效果。得益于深度神经网络的强表征能力,端到端的神经网络模型可以自主学习飞机各种飞行状态量和人类的驾驶操作行为之间存在的映射关系,并依此进行正确、合理的预测。这种技术被称为“行为克隆”,实际上是一种模仿学习,采用深度学习模型模仿学习得到的状态-动作对序列决定飞机在特定情况下的驾驶方式。通过提供足够多情形下足够大体量的飞行员驾驶飞行数据进行示教,学习训练得到的神经网络就可以直接预测到在各种复杂情况下符合人类驾驶习惯的正确驾驶操作行为。
发明内容
要解决的技术问题
为了提升现有飞机自动驾驶系统的智能化程度扩大其适用性范围,本发明提出了了一种基于长短时记忆网络的飞机自动驾驶操作模拟方法。
技术方案
本发明主要包括以下两点:
1、提出用基于长短时记忆网络的方法实现对飞行员驾驶行为决策模式的学习预测。
将大量经处理过的航线整流程飞行数据作为训练集,利用长短时记忆网络挖掘数据在时间序列上的相关性,学习飞行员依据航线导航信息进行驾驶行为决策的模式。通过训练,模型将学习到人类飞行员根据导航数据进行飞行模式转换的关键决策信息,例如在何时进行飞行高度爬升、何时进行飞行转弯、何时进行巡航下降等,以及以何种爬升率或者爬升角爬升、以何种坡度进行转弯、以何种模式下降等。
2、提出用基于长短时记忆网络的方法实现飞机自动驾驶的操作量预测。
将飞行数据按阶段进行划分,以飞机飞行过程中油门杆、脚蹬、俯仰横滚摇杆的操作量为模型输出,针对独立的飞行阶段进行飞行机理分析与数据相关性分析,确定相应的模型训练输入。
通过训练,模型将学习到从飞行状态、飞行环境等输入到操作量输出的映射关系。由此,飞机在实际飞行过程中根据感知到的飞行状态、飞行环境等数据,通过长短时记忆网络模型预测得到对应的油门杆、脚蹬、俯仰横滚摇杆操作量,从而实现飞机的自动驾驶。
应当指出,该方法实际上是实现神经网络模型对飞行驾驶数据集中蕴含的驾驶决策、操作信息进行挖掘的一种普适性框架,原则上可以使用任何一种优秀的神经网络架构完成上述驾驶行为决策模式和驾驶操作量的学习,从而得到一个有较强泛化能力的、可适用于真实环境的飞机自动驾驶决策操作模型。
一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特殊之处在于步骤如下:
步骤1、飞行数据预处理。
对大量的整流程航线飞行数据进行数据预处理,作为后续深度神经网络训练学习的数据集。
步骤1-1.首先对七个常规飞行阶段(起飞滑跑、起飞爬升、入航爬升、直线巡航、入航下降、着陆下降、落地滑跑)进行步骤划分,并完成数据归一化处理,形成驾驶行为模式学习网络模型训练的数据集D1
步骤1-2.其次以四个空中基本机动动作(直线平飞、上升、转弯、下降)和两个地面基本机动动作(滑跑离地、落地滑跑)为基础进行飞行动作数据划分,并完成数据归一化处理,形成驾驶行为操作量学习网络模型训练的数据集D2
步骤2、飞行模式及飞行操作量学习。
本发明涉及一种分层次的飞行操作学习方法,因此需要设计两个神经网络模型。
步骤2-1.飞行模式预测网络构建。
根据飞行阶段划分,对飞行数据进行飞行模式学习,具体使用长短时记忆网络(LSTM)实现。以步骤1中数据集D1包含的飞行航线导航信息
Figure BDA0003000725140000031
作为网络训练输入,
Figure BDA0003000725140000032
表示t时刻飞机的导航信息,具体包括当前飞机航向Ot、当前导航点与飞机航向夹角ΔOt、当前飞机高度ALTt、当前计划航线高度RVSMt,即
Figure BDA0003000725140000041
将飞行阶段分别编号记作起飞滑跑Y1、起飞爬升Y2、入航爬升Y3、直线巡航Y4、入航下降Y5、着陆下降Y6、落地滑跑Y7作为网络训练输出。设计以θm为模型参数的飞行模式预测网络
Figure BDA0003000725140000042
输出预测结果P(y=Yi|Xt),并进一步计算交叉熵损失函数作为分类损失:
Figure BDA0003000725140000043
其中yt对应Xt的模型预测输出,Yi为Xt对应的真实飞行模式标签值。
步骤2-2.飞行操作量预测网络构建。
根据飞行阶段划分,对飞行数据进行飞行操作量训练,学习不同飞行状态对应的动作操作量,具体使用长短时记忆网络(LSTM)实现。飞行操作包括直线平飞、上升、转弯、下降和滑跑离地、落地滑跑等基本飞行动作。以步骤1中数据集D2包含的飞行状态信息
Figure BDA0003000725140000044
作为网络训练输入,
Figure BDA0003000725140000045
表示t时刻飞机的飞行状态,具体包括当前飞机飞行模式Yi、飞行高度ALTt、飞行速度Vt、航向Ot、俯仰角θt、偏航角ψt、滚转角φt、迎角αt、侧滑角βt,即
Figure BDA0003000725140000046
网络输出包括t时刻飞行状态下飞行员的俯仰摇杆We、滚转摇杆Wa、偏航脚蹬Wr、油门杆δT操作量。设计以θa为模型参数的飞行动作预测网络
Figure BDA0003000725140000047
输出预测结果yt=[We,Wa,WrT]并进一步计算预测损失函数,具体采用均方误差公式,即
Figure BDA0003000725140000048
其中
Figure BDA0003000725140000049
为t时刻
Figure BDA00030007251400000410
状态下飞行员采取的真实操作动作。
步骤3、优化模型参数。
将飞行模式预测网络、飞行操作量预测网络进行训练,优化模型参数θm和θa。本发明采用的优化目标为:
Figure BDA00030007251400000411
其中,
Figure BDA00030007251400000412
Figure BDA00030007251400000413
分别为最优化θm和θa得到的模型参数,λ为系数常量,表明模式预测损失相较于操作量预测损失的重要程度。通过梯度反向传播算法和Adam优化器训练神经网络模型,使模型参数逼近上述优化目标。
步骤4、对模型进行应用测试完成验证。
采用XPLANE飞行模拟软件作为仿真验证平台,将XPLANE飞行模拟软件的实时飞行数据信息通过UDP协议输入至训练好的神经网络模型,就可以得到具有较高准确率与高度泛化性的飞行模式预测与飞行操作量预测输出,并将操作量输出通过UDP协议反馈至XPLANE飞行模拟软件,实时控制飞机执行飞行动作,最终完成整流程飞行任务的自动驾驶。
有益效果
本发明提出的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,与现存的方法相比,本发明提出的算法具有以下优点:
高度智能化:本发明利用深度学习方法克服了现存自动驾驶仪的应用局限性,利用深度学习方法的泛化性能有效保证了该方法的适用性。
高准确率:实验证明,本发明提出的模型在测试数据集上获得了较高的准确率,并且在仿真平台成功验证证明了可行性。
附图说明
图1为本发明的整体框架图;
图2为飞行模式预测神经网络结构图;
图3为飞行操作量预测神经网络结构图;
图4为具体实施例流程图。
具体实施方式
现结合实施例、附图对本发明作进一步描述:
参见图1,所示为本方法的整体模型框架图。
本发明的具体步骤如下:
步骤(1):获取数据集,进行数据预处理。
首先获取取样于真实飞行环境的真实飞行数据或者是专业飞行员在计算机模拟飞行软件中操作生成的模拟飞行数据。
对原始数据进行预处理,具体包括:
将飞行数据划分为七个飞行阶段并标注:起飞滑跑Y1、起飞爬升Y2、入航爬升Y3、直线巡航Y4、入航下降Y5、着陆下降Y6、落地滑跑Y7,同时抽取飞机导航信息具体包括航向Ot、当前导航点与飞机航向夹角ΔOt、当前飞机高度ALTt、当前计划航线高度RVSMt。将所有数据按属性进行归一化处理,形成飞行模式学习数据集D1,其中
Figure BDA0003000725140000061
作为训练输入,Yi为Xt对应的真实飞行模式标签值作为训练输出。
根据飞行阶段划分,进一步对每个飞行阶段的飞行动作进行分解,具体包括直线平飞、上升、转弯、下降、滑跑离地、落地滑跑。从原始数据中抽取飞机飞行模式Yi、飞行高度ALTt、飞行速度Vt、航向Ot、俯仰角θt、偏航角ψt、滚转角φt、迎角αt、侧滑角βt、俯仰摇杆操作量We、滚转摇杆操作量Wa、偏航脚蹬操作量Wr、油门杆操作量δT。并将所有数据按属性进行归一化处理,形成飞行操作量学习数据集D2,其中
Figure BDA0003000725140000062
作为训练输入,yt=[We,Wa,WrT]作为训练输出。
步骤(2):使用两个参数独立的LSTM神经网络进行飞行模式及飞行操作量的学习,分别对来自数据集D1和D2的输入输出建立相应映射关系模型。本发明涉及一种分层次的飞行操作学习方法,因此需要设计两个神经网络模型。由于飞行数据是一种典型的时序数据,因此选取LSTM神经网络对训练样本进行学习。
步骤(2.1):对于飞行模式预测网络,从数据集D1中连续采取N1个样本作为训练输入,网络采用序列模型,具体由两层LSTM神经网络层以及三层全连接层构成,网络结构可参见图2。第一层LSTM神经网络包含200个隐藏节点,输入维度为4,第二层LSTM神经网络包含100个隐藏节点,前两层全连接层的节点数分别为800、400,最后一层输出全连接层节点数为7,并且使用softmax函数进行激活,其余每层网络输出均用整流线性单元(RectifiedLinear Unit,ReLU)进行激活。
将训练样本
Figure BDA0003000725140000071
输入参数为θm的上述神经网络模型,即可输出得到模型预测的当前飞行模式概率P(y=Yi|Xt),即
Figure BDA0003000725140000072
进一步计算交叉熵损失函数作为分类损失:
Figure BDA0003000725140000073
步骤(2.2):对于飞行操作量预测网络,从数据集D2中连续采取N2个样本作为训练输入,网络采用序列模型,具体由两层LSTM神经网络层以及三层全连接层构成,网络结构可参见图3。第一层LSTM神经网络包含200个隐藏节点,输入维度为9,第二层LSTM神经网络层包含200个隐藏节点,前两层全连接层的节点数分别为800、400,最后一层输出全连接层节点数为1,并且每一层网络输出均用整流线性单元(Rectified Linear Unit,ReLU)进行激活。
将训练样本
Figure BDA0003000725140000074
输入参数为θa的上述神经网络模型,即可输出得到模型预测的飞机执行机构操作量yt=[We,Wa,WrT],即
Figure BDA0003000725140000075
进一步计算均方误差作为预测损失函数:
Figure BDA0003000725140000076
步骤(3):将飞行模式预测网络、飞行操作量预测网络进行训练,优化模型参数θm和θa
为了能够使整个网络统一使用通过梯度反向传播算法和Adam优化器进行训练,将两个损失函数合并为一个联合损失函数,即L=λLmod+Lact。所以本发明采用的优化目标为:
Figure BDA0003000725140000077
其中,
Figure BDA0003000725140000078
Figure BDA0003000725140000079
分别为最优化θm和θa得到的模型参数,λ为系数常量,表明模式预测损失相较于操作量预测损失的重要程度,建议其取值范围为[0.5,1]。然后使用Adam优化器进行模型训练,最小化联合损失函数L直至收敛。Adam优化器的参数均采用默认值。
步骤(4):对模型进行应用测试完成验证。
将完成训练的以θm为参数的飞行模式预测网络、以θa为参数的飞行操作量预测网络进行保存,以进行后续的测试实验或实地应用。
采用MATLAB和XPLANE飞行模拟软件作为仿真验证平台,将XPLANE飞行模拟软件的实时飞行数据信息通过UDP协议传输至MATLAB中训练保存好的神经网络模型,具体包括步骤(1)提到的飞机当前航向Ot、导航点与飞机航向夹角ΔOt、飞机高度ALTt、计划航线高度RVSMt、飞行速度Vt、俯仰角θt、偏航角ψt、滚转角φt、迎角αt、侧滑角βt数据。网络模型完成飞行模式概率预测P(y=Yi|Xt)以及飞行操作量预测yt=[We,Wa,WrT],并将操作量预测值通过UDP协议输出反馈至XPLANE飞行模拟软件,实时控制飞机执行飞行动作,最终完成高度智能化的整流程飞行任务自动驾驶,整体流程可参见图4。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于步骤如下:
步骤1:对飞行数据进行预处理分别得到两个数据集;
步骤2:将两个数据集分别作为两个长短时记忆网络的输入,构建以θm为模型参数的飞行模式预测网络,以θa为模型参数的飞行动作预测网络;
步骤3:将飞行模式预测网络、飞行操作量预测网络进行训练,优化模型参数θm和θa
步骤4:将完成训练的以θm为参数的飞行模式预测网络、以θa为参数的飞行操作量预测网络进行保存,以进行后续的测试实验或实地应用。
2.根据权利要求1所述的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于步骤1具体如下:
步骤1-1:对常规飞行阶段进行步骤划分,并完成数据归一化处理,形成驾驶行为模式学习网络模型训练的数据集D1
步骤1-2:进行飞行动作数据划分,并完成数据归一化处理,形成驾驶行为操作量学习网络模型训练的数据集D2
3.根据权利要求2所述的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于步骤2中构建飞行模式预测网络具体为:以步骤1中数据集D1包含的飞行航线导航信息
Figure FDA0003000725130000011
作为网络训练输入,
Figure FDA0003000725130000012
表示t时刻飞机的导航信息;将飞行阶段分别编号记作起飞滑跑Y1、起飞爬升Y2、入航爬升Y3、直线巡航Y4、入航下降Y5、着陆下降Y6、落地滑跑Y7作为网络训练输出;设计以θm为模型参数的飞行模式预测网络
Figure FDA0003000725130000013
输出预测结果P(y=Yi|Xt),并进一步计算交叉熵损失函数作为分类损失:
Figure FDA0003000725130000014
其中yt对应Xt的模型预测输出,Yi为Xt对应的真实飞行模式标签值。
4.根据权利要求3所述的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于
Figure FDA0003000725130000021
表示t时刻飞机的导航信息,包括当前飞机航向Ot Ot、当前导航点与飞机航向夹角ΔOt、当前飞机高度ALTt、当前计划航线高度RVSMt,即
Figure FDA0003000725130000022
5.根据权利要求2所述的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于步骤2中构建飞行操作量预测网络具体为:以步骤1中数据集D2包含的飞行状态信息
Figure FDA0003000725130000023
作为网络训练输入,
Figure FDA0003000725130000024
表示t时刻飞机的飞行状态;网络输出包括t时刻飞行状态下飞行员的俯仰摇杆We、滚转摇杆Wa、偏航脚蹬Wr、油门杆δT操作量;设计以θa为模型参数的飞行动作预测网络
Figure FDA0003000725130000025
输出预测结果yt=[We,Wa,WrT]并进一步计算预测损失函数。
6.根据权利要求5所述的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于
Figure FDA00030007251300000213
表示t时刻飞机的飞行状态,包括当前飞机飞行模式Yi、飞行高度ALTt、飞行速度Vt、航向Ot、俯仰角θt、偏航角ψt、滚转角φt、迎角αt、侧滑角βt,即
Figure FDA0003000725130000026
7.根据权利要求5所述的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于损失函数,具体采用均方误差公式,即
Figure FDA0003000725130000027
其中
Figure FDA0003000725130000028
为t时刻
Figure FDA0003000725130000029
状态下飞行员采取的真实操作动作。
8.根据权利要求1所述的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于步骤3中优化目标为
Figure FDA00030007251300000210
其中,
Figure FDA00030007251300000211
Figure FDA00030007251300000212
分别为最优化θm和θa得到的模型参数,λ为系数常量,表明模式预测损失相较于操作量预测损失的重要程度。
9.根据权利要求1所述的一种基于长短时记忆网络的飞机自动驾驶操作模拟方法,其特征在于步骤4中通过梯度反向传播算法和Adam优化器训练神经网络模型,使模型参数逼近上述优化目标。
CN202110346058.1A 2021-03-31 2021-03-31 基于长短时记忆网络的飞机自动驾驶操作模拟方法 Pending CN113093568A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110346058.1A CN113093568A (zh) 2021-03-31 2021-03-31 基于长短时记忆网络的飞机自动驾驶操作模拟方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110346058.1A CN113093568A (zh) 2021-03-31 2021-03-31 基于长短时记忆网络的飞机自动驾驶操作模拟方法

Publications (1)

Publication Number Publication Date
CN113093568A true CN113093568A (zh) 2021-07-09

Family

ID=76671888

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110346058.1A Pending CN113093568A (zh) 2021-03-31 2021-03-31 基于长短时记忆网络的飞机自动驾驶操作模拟方法

Country Status (1)

Country Link
CN (1) CN113093568A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219034A (zh) * 2021-12-17 2022-03-22 江西洪都航空工业集团有限责任公司 一种基于svm分类算法的飞参数据和飞行员生理数据挖掘方法
CN115935192A (zh) * 2023-01-10 2023-04-07 中国民用航空飞行学院 一种基于增量式在线学习框架的飞行训练数据预测方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853531A (zh) * 2010-05-25 2010-10-06 北京航空航天大学 基于预分类技术和rbf神经网络的直升机飞行状态识别方法
CN107450593A (zh) * 2017-08-30 2017-12-08 清华大学 一种无人机自主导航方法和系统
WO2018117872A1 (en) * 2016-12-25 2018-06-28 Baomar Haitham The intelligent autopilot system
CN109034376A (zh) * 2018-07-18 2018-12-18 东北大学 一种基于lstm的无人机飞行状态预测方法及系统
CN110231829A (zh) * 2019-06-20 2019-09-13 上海大学 基于数据增融的强化学习小型无人旋翼机自主着陆方法
CN110349294A (zh) * 2019-07-22 2019-10-18 北京润科通用技术有限公司 飞行数据的飞行模式识别方法及装置
CN111830848A (zh) * 2020-07-31 2020-10-27 中国人民解放军国防科技大学 一种无人机超机动飞行性能仿真训练系统及方法
CN112198890A (zh) * 2020-12-03 2021-01-08 中国科学院自动化研究所 基于强化学习的飞行器姿态控制方法、系统、装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853531A (zh) * 2010-05-25 2010-10-06 北京航空航天大学 基于预分类技术和rbf神经网络的直升机飞行状态识别方法
WO2018117872A1 (en) * 2016-12-25 2018-06-28 Baomar Haitham The intelligent autopilot system
CN107450593A (zh) * 2017-08-30 2017-12-08 清华大学 一种无人机自主导航方法和系统
CN109034376A (zh) * 2018-07-18 2018-12-18 东北大学 一种基于lstm的无人机飞行状态预测方法及系统
CN110231829A (zh) * 2019-06-20 2019-09-13 上海大学 基于数据增融的强化学习小型无人旋翼机自主着陆方法
CN110349294A (zh) * 2019-07-22 2019-10-18 北京润科通用技术有限公司 飞行数据的飞行模式识别方法及装置
CN111830848A (zh) * 2020-07-31 2020-10-27 中国人民解放军国防科技大学 一种无人机超机动飞行性能仿真训练系统及方法
CN112198890A (zh) * 2020-12-03 2021-01-08 中国科学院自动化研究所 基于强化学习的飞行器姿态控制方法、系统、装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219034A (zh) * 2021-12-17 2022-03-22 江西洪都航空工业集团有限责任公司 一种基于svm分类算法的飞参数据和飞行员生理数据挖掘方法
CN115935192A (zh) * 2023-01-10 2023-04-07 中国民用航空飞行学院 一种基于增量式在线学习框架的飞行训练数据预测方法

Similar Documents

Publication Publication Date Title
CN112162564B (zh) 基于模仿学习和强化学习算法的无人机飞行控制方法
CN108268053B (zh) 仿候鸟进化雪堆博弈的无人机自主集群编队轮换控制方法
CN110806759B (zh) 一种基于深度强化学习的飞行器航线跟踪方法
CN110703766B (zh) 一种基于迁移学习策略深度q网络的无人机路径规划方法
CN112818599B (zh) 一种基于强化学习和四维轨迹的空中管制方法
Ferdaus et al. Towards the use of fuzzy logic systems in rotary wing unmanned aerial vehicle: a review
CN111399541B (zh) 无监督学习型神经网络的无人机全区域侦察路径规划方法
CN109034376A (zh) 一种基于lstm的无人机飞行状态预测方法及系统
CN113093568A (zh) 基于长短时记忆网络的飞机自动驾驶操作模拟方法
CN105182988B (zh) 基于马尔科夫决策过程的飞行员操作行为引导方法
Baomar et al. An Intelligent Autopilot System that learns flight emergency procedures by imitating human pilots
CN114355777B (zh) 一种基于分布式压力传感器与分段姿态控制的动态滑翔方法及系统
CN111353256A (zh) 航空电子设备中的机器学习
CN113741533A (zh) 一种基于模仿学习与强化学习的无人机智能决策系统
Dong et al. Study on the resolution of multi-aircraft flight conflicts based on an IDQN
CN109375642B (zh) 一种无人机节能控制方法
CN114237268A (zh) 一种基于深度强化学习的无人机强鲁棒姿态控制方法
CN113485443A (zh) 基于深度学习的无人机控制方法、存储介质及设备
Pinguet et al. A Neural Autopilot Training Platform based on a Matlab and X-Plane co-simulation
Juang et al. Analysis and comparison of aircraft landing control using recurrent neural networks and genetic algorithms approaches
CN113359852B (zh) 一种仿原鸽个体属性智能行为的无人机集群协同控制方法
d’Apolito et al. Flight control of a multicopter using reinforcement learning
CN113110550A (zh) 一种基于强化学习与网络模型蒸馏的无人机飞行控制方法
Obaid et al. Obstacle avoidance in unmanned aerial vehicles using image segmentation and deep learning
Medeiros Learn to Fly: Cloning the Behavior of a Pilot

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210709