CN111679576A - 一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法 - Google Patents

一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法 Download PDF

Info

Publication number
CN111679576A
CN111679576A CN202010433366.3A CN202010433366A CN111679576A CN 111679576 A CN111679576 A CN 111679576A CN 202010433366 A CN202010433366 A CN 202010433366A CN 111679576 A CN111679576 A CN 111679576A
Authority
CN
China
Prior art keywords
network
value
strategy
algorithm
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010433366.3A
Other languages
English (en)
Other versions
CN111679576B (zh
Inventor
杜宪
马艳华
孙希明
胡雪兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Shengke Intelligent Control Aviation Technology Co ltd
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN202010433366.3A priority Critical patent/CN111679576B/zh
Publication of CN111679576A publication Critical patent/CN111679576A/zh
Application granted granted Critical
Publication of CN111679576B publication Critical patent/CN111679576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02CGAS-TURBINE PLANTS; AIR INTAKES FOR JET-PROPULSION PLANTS; CONTROLLING FUEL SUPPLY IN AIR-BREATHING JET-PROPULSION PLANTS
    • F02C9/00Controlling gas-turbine plants; Controlling fuel supply in air- breathing jet-propulsion plants
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Combustion & Propulsion (AREA)
  • Software Systems (AREA)
  • Feedback Control In General (AREA)
  • Data Mining & Analysis (AREA)
  • Mechanical Engineering (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Automation & Control Theory (AREA)

Abstract

本发明属于航空发动机控制技术领域,一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法。本发明采用样本优先回放技术、目标神经网络技术对确定性策略梯度算法进行改进,将其作为变循环发动机多变量控制算法。改进的确定性策略梯度算法可以加快神经网络的训练速度、保证神经网络参数更新过程的稳定性,实现变循环发动机全部可调部件的组合调节。本发明设计的变循环发动机稳态多变量控制器,不需要对变量进行解耦控制,具有更好的可以可移植性。加入的样本优先回放机制有利于提高了样本利用率,加速神经网络训练过程,同时双Actor‑Critic结构设计,利用目标神经网络计算真实神经网络梯度,使神经网络的训练过程更易于收敛。

Description

一种基于改进确定性策略梯度算法的变循环发动机控制器设 计方法
技术领域
本发明属于航空发动机控制技术领域,具体涉及一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法。
背景技术
航空发动机为飞机提供飞行所需的动力,是飞机执行各项飞行任务必不可少的装备,而航空发动机的控制系统则是发动机稳定、可靠、安全运行的重要保障。与传统的航空发动机相比,变循环发动机通过调节对多个可变几何部件,能在宽广的范围内改变发动机的热力循环过程,实现超声速、高推力和亚声速、油耗低模式的自由切换,可以看作是涡喷发动机与扇发动机的组合装置,集涡扇、涡喷发动机优点于一体,是目前航空发动机研究领域的重点研究对象。
变循环发动机结构复杂,工作范围大。对发动机的控制系统性能要求高,如在全飞行包线内保证较高的控制精度和良好的稳定性,在飞行条件或发动机工作状态发生变化时有尽可能短的调节时间,充分发挥发动机的潜力,降低耗油率等。传统燃油闭环控制和几何机构开环调度的控制系统无法满足变循环发动机的控制要求,存在需要建立小偏差线性化模型、控制变量少和控制器结构复杂等问题。随着智能控制技术的快速发展,采用智能控制技术对变循环发动机进行多变量控制,提高发动机的性能,成为一个必然的趋势,设计一种新的变循环发动机智能控制器具有重要的意义。
发明内容
本发明采用样本优先回放技术、目标神经网络技术对确定性策略梯度算法进行改进,将其作为变循环发动机多变量控制算法。改进的确定性策略梯度算法可以加快神经网络的训练速度、保证神经网络参数更新过程的稳定性,实现变循环发动机全部可调部件的组合调节。
本发明的技术方案为:
一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法,包括以下步骤:
S1.建立基于改进确定性策略梯度算法的控制系统架构
应用于变循环发动机多变量控制的基于改进确定性策略梯度算法的控制算法,在确定性策略梯度算法的Actor-Critic结构基础上,添加目标策略网络和目标Q值网络,即改进后的确定性策略梯度算法为双Actor-Critic结构;同时,为了加快神经网络的训练速度和维持算法稳定性,加入带样本优先回放机制的样本池;
S2.根据控制目标确定Actor-Critic结构的输入和输出变量
变循环发动机控制变量共八个,包括喷口膨胀面积、风扇导流叶片角度、核心机风扇导流叶片角度、低压涡轮导向器的控制角、核心机风扇的混合器面积、第一外涵道面积高、高压气机导流叶片角度和主燃烧室供油量;选取高压压气机相对转速和发动机的落压比为被控变量;设定八个变循环发动机控制变量为确定性策略梯度算法中策略网络的输出值,高压压气机相对转速和和发动机落压比的稳态误差绝对值为发动机反馈回Actor-Critic结构的状态;
S3.确定奖赏函数
奖励值函数依据设计目标而定,针对变循环发动机多变量控制,奖励函数设计为:
Figure RE-GDA0002591997570000021
其中,st和st+1分别为t时刻和下一时刻的环境状态量,即本次环境的状态量比上次更靠近目标值,给予正奖励,否则给予负奖励;
S4.设置策略网络和Q值网络参数
策略网络和Q值网络均为单隐层BP神经网络,根据控制系统特性和控制目标,设置的策略网络的输入层节点个数、隐含层节点个数、输出层节点;设置Q 值网络的输入层节点个数、隐含层节点个数、输出层节点个数、神经网络的激活函数;
S5.设计改进确定性策略梯度算法
S5.1初始化策略网络和Q值网络的神经网络参数:θμ和θQ;初始化样本回放池R和用于增加算法探索性的Uhlenbeck-Ornstein过程;
S5.2将策略网络和Q网络的参数赋给对应的目标策略网络和Q值网络的参数θμ′和θQ′,即:
θμ′=θμ,θQ′=θQ
S5.3计算策略网络输出
策略网络根据当前的网络参数,产生一个动作输出值μ(stμ),该值和UO 随机过程输出的Nt相加,得到策略网络的最终输出值at,该动作值传递给环境模型:
at=μ(stμ)+Nt
S5.4模型执行动作at,反馈回当前的单步奖励值rt和状态值st+1
S5.5上述转换过程产生的数据元组(st,at,st+1,rt+1)作为一个样本存入样本回放池R中,作为训练策略网络和Q值网络的数据集;
S5.6从样本回放池R中,随机采样K×N个样本数据,计算样本优先级,选取样本优先级最高的N个样本,作为目标策略网络和目标Q值网络的一个 mini-batch训练数据,用(st,at,st+1,rt)表示mini-batch中的单个样本数据;
S5.7计算在线Q值网络梯度
定义在线Q值网络的损失函数loss为:
Figure RE-GDA0002591997570000031
yi=ri+γQ′(si+1,μ′(si+1μ′)|θQ′)
其中,γ为折扣因子,取0.99,N为样本个数;
基于反向传播方法,求得L针对θQ的梯度
Figure RE-GDA0002591997570000032
采用Adam optimizer算法更新Q值网络参数:θQ
S5.8计算在线策略网络的梯度:
在线策略网络的梯度定义为性能目标函数J对策略网络的参数θμ的梯度
Figure RE-GDA0002591997570000041
Figure RE-GDA0002591997570000042
采用Adam optimizer算法更新online策略网络:θμ
S5.9更新目标策略网络和目标Q值网络的神经网络参数
采用soft update算法更新目标策略网络和Q值网络参数的参数θμ和θQ
S5.10如达到预设的神经网络训练次数,或控制器的控制效果达到控制精度要求,则算法结束;否则返回步骤S5.2,继续下一轮的神经网络训练;
S6.神经网络训练结束后,保存上述步骤产生的参数,将计算出的控制变量输入到变循环发动机,对控制效果进行验证。
本发明的有益效果:通过本发明设计的基于改进确定性策略梯度算法的变循环发动机稳态多变量控制器,不需要对变量进行解耦控制,是一种模型无关的多变量控制算法,具有更好的可以可移植性。加入的样本优先回放机制有利于提高了样本利用率,加速神经网络训练过程,同时双Actor-Critic结构设计,利用目标神经网络计算真实神经网络梯度,使神经网络的训练过程更易于收敛。
附图说明
图1为本发明的控制系统结构示意图。
图2为本发明的控制器算法流程图。
图3改进确定性策略梯度算法流程图。
图4为H=0,Ma=0,PLA=50时,系统被控变量输出曲线与参考曲线对比图;图4(a)为高压压气机相对转速输出曲线和参考曲线的对比图;图4(b)为落压比输出曲线和参考曲线的对比图。
图5为H=9,Ma=0.8,PLA=90时,系统被控变量输出曲线与参考曲线对比图;图5(a)为高压压气机相对转速输出曲线和参考曲线的对比图;图5(b)为落压比输出曲线和参考曲线的对比图。
具体实施方式
下面结合附图及对本发明技术方案实施过程做进一步详细说明。
本发明的控制算法计算流程如图2所示,具体步骤如下:
S1:建立基于改进确定性策略梯度算法的控制系统架构
应用于变循环发动机多变量控制的基于改进确定性策略梯度算法的控制结构示意图如图1所示,在确定性策略梯度算法的Actor-Critic结构基础上,添加目标策略网络和目标Q值网络,即改进后的确定性策略梯度算法为双 Actor-Critic结构。同时,为了加快神经网络的训练速度和维持算法稳定性,加入带样本优先回放机制的样本池技术。
S2:根据控制目标确定Actor-Critic结构的输入和输出变量
本发明涉及的某型变循环发动机控制变量共八个,包括喷口膨胀面积、风扇导流叶片角度、核心机风扇导流叶片角度、低压涡轮导向器的控制角、核心机风扇的混合器面积、第一外涵道面积高、高压气机导流叶片角度,和主燃烧室供油量。在进行稳态控制时,需要考虑发动机的喘振和超速停车等现象,因此,在进行控制器设计时,要保证稳态误差小于1%的精度要求,同时,要保证发动机不喘振、不超限停车。
选取高压压气机相对转速和发动机的落压比为被控变量。设定八个控制为确定性策略梯度算法中策略网络的输出值,高压压气机相对转速和和发动机落压比的稳态误差绝对值为发动机反馈回Actor-Critic结构的状态。此时变循环发动机多变量控制问题转变为拥有两输入节点、八输出节点的确定性策略梯度算法策略网络参数整定问题。
S3.确定奖赏函数
奖励值函数依据设计目标而定,针对变循环发动机多变量控制,奖励函数设计为:
Figure RE-GDA0002591997570000061
其中,st和st+1分别为t时刻和下一时刻变循环发动机被控变量稳态误差绝对值之和,flag为发动机喘振和超温标识。即本次控制器的控制精度上次更高且四个状态量的输出值在限制范围内,给予正奖励,否则给予负奖励。
S4.设置策略网络和Q值网络参数
策略网络和Q值网络均为单隐层BP神经网络,根据控制系统特性和控制目标,设置的策略网络的输入层节点个数为2,代表发动机的高压压气机和落压比稳态误差;隐含层节点个数64;输出层节点个数为8,表示策略网络输出变循环发动机的八个控制量计算值;设置Q值网络的输入层节点个数为10,输入值为某一时刻发动机的控制变量和被控变量稳态值;隐含层节点个数为128;输出层节点个数1、神经网络各节点的激活函数均为Tanh,策略网络学习率为1e-4,评价网络学习率为1e-5。目标神经网络的策略网络和Q值网络结构与策略网络和Q值网络完全相同。
S5.设计改进确定性策略梯度算法
S5.1初始化策略网络和Q网络的神经网络参数:θμ和θQ;设置回放池R的大小为6000×13。OU随机过程的方差为0.532,均值为0。
S5.2将策略网络和Q网络的参数赋给目标策略网络和Q网络的参数θμ′和θQ′,即:
θμ′=θμ,θQ′=θQ
S5.3计算策略网络输出的动作
策略网络根据当前的网络参数,产生一个动作输出值μ(stμ),该值和 UO随机过程生成的Nt相加,得到策略网络的输出值at,该值传递给变循环
发动机模型:
at=μ(stμ)+Nt
S5.4模型执行at,反馈回当前的单步奖励值rt和稳态误差向量st+1
S5.5上述转换过程产生的数据元组(st,at,st+1,rt+1)作为一个样本存入经验池R中,作为训练策略网络和Q值网络参数的数据集。
S5.6从样本池R中,随机采样20×300个样本数据,计算样本优先级,选取样本优先级最高的300个样本,作为策略网络、Q值网络的一个mini-batch 训练数据,用(si,ai,si+1,ri)表示mini-batch中的单个样本数据。
其中样本优先级定义为:
Figure RE-GDA0002591997570000071
其中,pi为第i个样本的在任意时刻t的样本优先级,定义为:
pt=|rt+γQ(st+1,at+1)-Q(st,at)|+∈
α为优先级权重,当α=0时,即为均匀采样,∈是一个取值较小的正常数,使 TD误差为零的样本也能被取到。
S5.7计算在线Q值神经网络梯度
定义在线Q值网络的损失函数loss为:
Figure RE-GDA0002591997570000072
yi=ri+γQ′(si+1,μ′(si+1μ′)|θQ′)
其中,γ为折扣因子,取0.99,N为样本个数。
基于反向传播方法,求得L针对θQ的梯度
Figure RE-GDA0002591997570000073
采用Adam optimizer更新 onlineQ网络参数θQ
S5.8计算在线策略网络的梯度:
在线策略网络的梯度定义为性能目标函数J对策略网络的参数θμ的梯度
Figure RE-GDA0002591997570000081
Figure RE-GDA0002591997570000082
采用Adam optimizer算法更新online策略网络:θμ
S5.9更新目标策略网络和Q值网络的神经网络参数
采用soft update算法更新目标策略网络和Q网络参数的参数θμ和θQ:
S5.10若神经网络训练次数到达设定的最大值5000,或控制器控制效果达到稳态误差小于1%的精度要求,则保存此时策略网络的神经网络参数;否则返回步骤S5.2,继续下一轮的神经网络训练。
S6.神经网络训练结束后,保存上述步骤产生的相关参数,将计算出的控制量输入到发动机模型,对控制效果进行验证。
图4(a)、图4(b)分别为高度H=0km,Ma=0,油门杆信号PLA为50的工况下高压压气机和落压比输出曲线和参考曲线的对比图和系统限制状态量输出值。高压压气机相对转速和落压比稳态误差分别为0.52%和0.03%,均小于1%;调节时间约为3.9s,小于参考曲线调节时间;涡轮后温度为1218.49K,高压压气机、风扇、核心机风扇喘振标识均小于90,发动机无喘振、超限现象。
图5(a)、图5(b)分别为高度H=9km,Ma=0.8,油门杆信号PLA为90 的工况下高压压气机相对转速和发动机落压比输出曲线和参考曲线的对比图和系统限制状态量输出值。高压压气机相对转速和落压比稳态误差分别为0.32%和 0.71%,均小于1%;同时落压比和高压压气机的调节时间比参考曲线调节时间短;涡轮后温度为1224.10K,高压压气机、风扇、核心机风扇喘振标识均小于 90,发动机无喘振、超限现象。
综上可见,本发明提出的将样本优先回放、双Actor-Critic技术与确定性策略梯度算法相结合,用作变循环发动机多变量控制器算法,可以在变循环发动机模型封装未知的情况下,对发动机进行多变量稳态控制,相较于传统的燃油闭环控制和几何部件解耦控制具有明显的优势。

Claims (1)

1.一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法,其特征在于,包括以下步骤:
S1.建立基于改进确定性策略梯度算法的控制系统架构
应用于变循环发动机多变量控制的基于改进确定性策略梯度算法的控制算法,在确定性策略梯度算法的Actor-Critic结构基础上,添加目标策略网络和目标Q值网络,即改进后的确定性策略梯度算法为双Actor-Critic结构;同时,为了加快神经网络的训练速度和维持算法稳定性,加入带样本优先回放机制的样本池;
S2.根据控制目标确定Actor-Critic结构的输入和输出变量
变循环发动机控制变量共八个,包括喷口膨胀面积、风扇导流叶片角度、核心机风扇导流叶片角度、低压涡轮导向器的控制角、核心机风扇的混合器面积、第一外涵道面积高、高压气机导流叶片角度和主燃烧室供油量;选取高压压气机相对转速和发动机的落压比为被控变量;设定八个变循环发动机控制变量为确定性策略梯度算法中策略网络的输出值,高压压气机相对转速和和发动机落压比的稳态误差绝对值为发动机反馈回Actor-Critic结构的状态;
S3.确定奖赏函数
奖励值函数依据设计目标而定,针对变循环发动机多变量控制,奖励函数设计为:
Figure FDA0002501319590000011
其中,st和st+1分别为t时刻和下一时刻的环境状态量,即本次环境的状态量比上次更靠近目标值,给予正奖励,否则给予负奖励;
S4.设置策略网络和Q值网络参数
策略网络和Q值网络均为单隐层BP神经网络,根据控制系统特性和控制目标,设置的策略网络的输入层节点个数、隐含层节点个数、输出层节点;设置Q值网络的输入层节点个数、隐含层节点个数、输出层节点个数、神经网络的激活函数;
S5.设计改进确定性策略梯度算法
S5.1初始化策略网络和Q值网络的神经网络参数:θμ和θQ;初始化样本回放池R和用于增加算法探索性的Uhlenbeck-Ornstein过程;
S5.2将策略网络和Q网络的参数赋给对应的目标策略网络和Q值网络的参数θμ′和θQ′,即:
θμ′=θμ,θQ′=θQ
S5.3计算策略网络输出
策略网络根据当前的网络参数,产生一个动作输出值μ(stμ),该值和UO随机过程输出的Nt相加,得到策略网络的最终输出值at,该动作值传递给环境模型:
at=μ(stμ)+Nt
S5.4模型执行动作at,反馈回当前的单步奖励值rt和状态值st+1
S5.5上述转换过程产生的数据元组(st,at,st+1,rt+1)作为一个样本存入样本回放池R中,作为训练策略网络和Q值网络的数据集;
S5.6从样本回放池R中,随机采样K×N个样本数据,计算样本优先级,选取样本优先级最高的N个样本,作为目标策略网络和目标Q值网络的一个mini-batch训练数据,用(st,at,st+1,rt)表示mini-batch中的单个样本数据;
S5.7计算在线Q值网络梯度
定义在线Q值网络的损失函数loss为:
Figure FDA0002501319590000021
yi=ri+γQ′(si+1,μ′(si+1μ)|θQ)
其中,γ为折扣因子,取0.99,N为样本个数;
基于反向传播方法,求得L针对θQ的梯度
Figure FDA0002501319590000022
采用Adam optimizer算法更新Q值网络参数:θQ
S5.8计算在线策略网络的梯度:
在线策略网络的梯度定义为性能目标函数J对策略网络的参数θμ的梯度
Figure FDA0002501319590000031
Figure FDA0002501319590000032
采用Adam optimizer算法更新online策略网络:θμ
S5.9更新目标策略网络和目标Q值网络的神经网络参数
采用soft update算法更新目标策略网络和Q值网络参数的参数θμ和θQ
S5.10如达到预设的神经网络训练次数,或控制器的控制效果达到控制精度要求,则算法结束;否则返回步骤S5.2,继续下一轮的神经网络训练;
S6.神经网络训练结束后,保存上述步骤产生的参数,将计算出的控制变量输入到变循环发动机,对控制效果进行验证。
CN202010433366.3A 2020-05-21 2020-05-21 一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法 Active CN111679576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010433366.3A CN111679576B (zh) 2020-05-21 2020-05-21 一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010433366.3A CN111679576B (zh) 2020-05-21 2020-05-21 一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法

Publications (2)

Publication Number Publication Date
CN111679576A true CN111679576A (zh) 2020-09-18
CN111679576B CN111679576B (zh) 2021-07-16

Family

ID=72452118

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010433366.3A Active CN111679576B (zh) 2020-05-21 2020-05-21 一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法

Country Status (1)

Country Link
CN (1) CN111679576B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113246121A (zh) * 2021-04-08 2021-08-13 浙江工业大学 一种基于Actor-Critic深度强化学习的同心管机器人控制方法
CN113485117A (zh) * 2021-07-28 2021-10-08 沈阳航空航天大学 基于输入输出信息的航空发动机多变量强化学习控制方法
CN114675535A (zh) * 2022-03-07 2022-06-28 大连理工大学 一种基于强化学习的航空发动机过渡态寻优控制方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3034841A1 (en) * 2013-08-13 2016-06-22 IHI Corporation Gas turbine engine optimization control device
CN108196443A (zh) * 2017-11-23 2018-06-22 南京航空航天大学 变循环发动机的非线性预测控制设计方法
CN109472062A (zh) * 2018-10-18 2019-03-15 南京航空航天大学 一种变循环发动机自适应部件级仿真模型构建方法
CN109624986A (zh) * 2019-03-01 2019-04-16 吉林大学 一种基于模式切换的驾驶风格的学习巡航控制系统及方法
CN110194156A (zh) * 2019-06-21 2019-09-03 厦门大学 智能网联混合动力汽车主动避撞增强学习控制系统和方法
CN110341690A (zh) * 2019-07-22 2019-10-18 北京理工大学 一种基于确定性策略梯度学习的phev能量管理方法
CN110615003A (zh) * 2019-10-30 2019-12-27 吉林大学 基于策略梯度在线学习算法的巡航控制系统及设计方法
CN110647052A (zh) * 2019-08-16 2020-01-03 南京航空航天大学 一种变循环发动机模式切换自适应身份证模型构建方法
EP3633562A1 (en) * 2018-10-01 2020-04-08 Rolls-Royce plc Multi-variable optimisation method and system
CN111042928A (zh) * 2019-12-30 2020-04-21 大连理工大学 一种基于动态神经网络的变循环发动机智能控制方法
EP3647566A1 (en) * 2018-11-05 2020-05-06 Rolls-Royce plc Control system for a gas turbine engine

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3034841A1 (en) * 2013-08-13 2016-06-22 IHI Corporation Gas turbine engine optimization control device
CN108196443A (zh) * 2017-11-23 2018-06-22 南京航空航天大学 变循环发动机的非线性预测控制设计方法
EP3633562A1 (en) * 2018-10-01 2020-04-08 Rolls-Royce plc Multi-variable optimisation method and system
CN109472062A (zh) * 2018-10-18 2019-03-15 南京航空航天大学 一种变循环发动机自适应部件级仿真模型构建方法
EP3647566A1 (en) * 2018-11-05 2020-05-06 Rolls-Royce plc Control system for a gas turbine engine
CN109624986A (zh) * 2019-03-01 2019-04-16 吉林大学 一种基于模式切换的驾驶风格的学习巡航控制系统及方法
CN110194156A (zh) * 2019-06-21 2019-09-03 厦门大学 智能网联混合动力汽车主动避撞增强学习控制系统和方法
CN110341690A (zh) * 2019-07-22 2019-10-18 北京理工大学 一种基于确定性策略梯度学习的phev能量管理方法
CN110647052A (zh) * 2019-08-16 2020-01-03 南京航空航天大学 一种变循环发动机模式切换自适应身份证模型构建方法
CN110615003A (zh) * 2019-10-30 2019-12-27 吉林大学 基于策略梯度在线学习算法的巡航控制系统及设计方法
CN111042928A (zh) * 2019-12-30 2020-04-21 大连理工大学 一种基于动态神经网络的变循环发动机智能控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐佩佩: "变循环发动机多变量控制及性能寻优", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113246121A (zh) * 2021-04-08 2021-08-13 浙江工业大学 一种基于Actor-Critic深度强化学习的同心管机器人控制方法
CN113246121B (zh) * 2021-04-08 2022-04-08 浙江工业大学 一种基于Actor-Critic深度强化学习的同心管机器人控制方法
CN113485117A (zh) * 2021-07-28 2021-10-08 沈阳航空航天大学 基于输入输出信息的航空发动机多变量强化学习控制方法
CN113485117B (zh) * 2021-07-28 2024-03-15 沈阳航空航天大学 基于输入输出信息的航空发动机多变量强化学习控制方法
CN114675535A (zh) * 2022-03-07 2022-06-28 大连理工大学 一种基于强化学习的航空发动机过渡态寻优控制方法
CN114675535B (zh) * 2022-03-07 2024-04-02 大连理工大学 一种基于强化学习的航空发动机过渡态寻优控制方法

Also Published As

Publication number Publication date
CN111679576B (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN111679576B (zh) 一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法
CN106647253B (zh) 航空发动机分布式控制系统多性能鲁棒跟踪控制方法
US20210201155A1 (en) Intelligent control method for dynamic neural network-based variable cycle engine
CN109162813B (zh) 一种基于迭代学习修正的航空发动机智能转速控制方法
WO2019144337A1 (zh) 一种基于深度学习算法的航空发动机全包线模型自适应修正方法
CN114675535B (zh) 一种基于强化学习的航空发动机过渡态寻优控制方法
CN111679574B (zh) 一种基于大规模全局优化技术的变循环发动机过渡态优化方法
CN111594322B (zh) 一种基于Q-Learning的变循环航空发动机推力控制方法
CN111042928B (zh) 一种基于动态神经网络的变循环发动机智能控制方法
CN110219736A (zh) 基于非线性模型预测控制的航空发动机直接推力控制方法
CN111006843B (zh) 一种暂冲式超声速风洞的连续变速压方法
CN111666648B (zh) 一种航空发动机动态特性模拟方法
CN103452674B (zh) 一种挖掘航空发动机的加速潜能的控制系统及控制方法
CN114237029B (zh) 基于主动切换逻辑的涡扇发动机加速过程控制方法及装置
Hao et al. Acceleration technique for global optimization of a variable cycle engine
CN117518816A (zh) 基于群智能搜索的变循环发动机性能寻优控制设计方法
CN116661297A (zh) 一种变循环发动机双回路闭环模式切换控制方法
CN114047692B (zh) 一种涡扇发动机鲁棒容错抗干扰模型参考动态输出反馈控制方法
CN115128966A (zh) 一种涡扇发动机全包线控制器的设计方法与仿真方法
Jia et al. Multi-variable anti-disturbance controller with state-dependent switching law for adaptive cycle engine
CN113741170A (zh) 一种基于深度神经网络的航空发动机直接推力逆控制方法
CN111624880B (zh) 一种基于脑情感学习模型的变循环发动机多变量控制算法
Wang et al. Gain scheduling controller of the aero-engine based on LPV model
CN115981160B (zh) 一种基于反演滑模控制的航空发动机喘振主动控制系统
Zhenghong et al. Design of variable weight SDRE control algorithm for civil aeroengine transition state

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240605

Address after: Room 320, Building D09, No. 863-9, Shangshengou Village, Hunnan District, Shenyang City, Liaoning Province, 110168

Patentee after: Shenyang Shengke Intelligent Control Aviation Technology Co.,Ltd.

Country or region after: China

Address before: 116024 No. 2 Ling Road, Ganjingzi District, Liaoning, Dalian

Patentee before: DALIAN University OF TECHNOLOGY

Country or region before: China