CN113836787A - 基于区分性特征学习的超声速进气道流动状态监测方法 - Google Patents
基于区分性特征学习的超声速进气道流动状态监测方法 Download PDFInfo
- Publication number
- CN113836787A CN113836787A CN202110929263.0A CN202110929263A CN113836787A CN 113836787 A CN113836787 A CN 113836787A CN 202110929263 A CN202110929263 A CN 202110929263A CN 113836787 A CN113836787 A CN 113836787A
- Authority
- CN
- China
- Prior art keywords
- cnn
- equation
- samples
- tdl
- ddl
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000012544 monitoring process Methods 0.000 title claims abstract description 28
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 36
- 238000004364 calculation method Methods 0.000 claims description 29
- 238000012360 testing method Methods 0.000 claims description 27
- 238000012706 support-vector machine Methods 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 238000005457 optimization Methods 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 239000002184 metal Substances 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000000926 separation method Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 abstract description 93
- 238000013135 deep learning Methods 0.000 abstract description 6
- 238000012545 processing Methods 0.000 abstract description 6
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000001228 spectrum Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 19
- 230000008569 process Effects 0.000 description 13
- 238000011176 pooling Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 3
- 238000001135 Friedman test Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000010355 oscillation Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000001151 non-parametric statistical test Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000005304 optical glass Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000004205 output neuron Anatomy 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/28—Design optimisation, verification or simulation using fluid dynamics, e.g. using Navier-Stokes equations or computational fluid dynamics [CFD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/08—Fluids
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Fluid Mechanics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Medical Informatics (AREA)
- Feedback Control In General (AREA)
Abstract
本发明提出一种监测超声速进气道流动状态的方法,采用时频分析技术和深度学习相结合的方法,从动态传感器信号中监测超声速进气道的流动状态。首先,使用连续小波变换对动态传感器信号进行初步的信号处理,将动态传感器信号转换为时频谱图,然后输入到卷积神经网络(Convolutional Neural Network,简称CNN)中进行分类。为了减少分类误差,本发明提出了同时考虑交叉熵损失和区分性特征学习的双通道/三通道卷积神经网络(Doublet/Triplet ConvolutionalNeural Network combined with Discriminative Learning,简称DDL‑CNN/TDL‑CNN)。所提出的方法鼓励卷积模块将时频谱图投射到一个特征空间,使得在该空间里不同的流动状态变得更加可分。实验结果表明,与传统CNN相比,DDL‑CNN/TDL‑CNN在多个指标上具有更好的性能。
Description
技术领域
本发明属于超声速进气道流动状态监测技术领域,具体涉及一种超声速进气 道流动状态的监测方法。
背景技术
超声速进气道作为吸气式超声速推进系统的关键部件之一,其流动状态对整 个系统的性能有直接影响。例如,超声速进气道喘振是一种极其不稳定的流动状 态,通常伴随着剧烈的、周期性的激波振荡,这将使得整个推进系统的推力特性 严重恶化,并且时刻面临着熄火的风险。不仅如此,随激波振荡产生的周期性热 力载荷也会使整个系统的可操控性急剧变差,甚至还可能直接导致整体结构的破 坏,对飞行器与人员的安全构成威胁。从保护控制的角度来说,由于在不同的流 动状态下,超声速进气道表现出不同的流动特点,因此采取的控制措施也应有所 不同。因此,为了降低喘振现象的安全威胁以及更好地控制推进系统,对超声速 进气道的流动状态进行监测是非常重要的。
目前,对于超声速进气道流动状态的监测方法主要包括基于高速纹影摄像的 方法和数据驱动的方法。基于高速纹影摄像的方法直观、可靠,但需要复杂的光 路系统,仅在地面试验中可行,在实际飞行中显然不现实。数据驱动的方法是基 于CFD仿真数据或者试验数据,利用机器学习等技术进行智能化监测。该方法 不需要复杂的光路系统,既适用于地面试验,也适用于实际飞行,并且可以利用 地面试验或实际飞行中不断产生的新数据修正已有的模型,充分挖掘历史数据和 实时数据中的有效信息,在提高数据利用率的同时,使得模型对于外界条件的适 应性较强。目前,对于数据驱动方法的研究主要是基于少量的CFD稳态仿真数 据,而实际测量装置采集的通常是大量的动态试验数据。因此,在以往的研究过 程中会忽略实际试验数据中的动态特性以及噪声、干扰等因素的影响。本发明采 用数据驱动的方法,基于动态试验数据对进气道的流动状态进行监测。
发明内容
针对上述问题,本发明提出一种超声速进气道流动状态的监测方法,利用时 频分析与深度学习技术,基于动态压力数据来监测超声速进气道的流动状态,在 多个指标上具有较好的性能。
为实现上述目的,本发明采用如下技术方案:
一种超声速进气道流动状态的监测方法,包括如下步骤:
步骤1,在超声速进气道的内部流道上布置若干个传感器,分别采集各传感 器的动态压力信号,经过切分后可以得到不同流动状态下的样本;
步骤2,利用连续小波变换对分别对每个传感器的样本进行时频分析,得到 对应的时频谱图,然后将其按照一定比例划分成训练集、验证集和测试集;
步骤3,利用步骤2得到的各传感器的训练集分别训练DDL-CNN/TDL-CNN 网络,并利用验证集选择最佳超参数;
步骤4,利用步骤3训练好的DDL-CNN/TDL-CNN网络分别对各传感器的 测试集进行测试,得到测试结果。
所述步骤1中,利用固定时长的滑动窗口对各传感器采集到的动态压力信号 进行切分,得到不同流动状态下的样本。
所述步骤2中,利用连续小波变换将一维时间信号转变为二维时频谱图,使 得可以同时在时域和频域上揭示原始信号的本质特征。
所述步骤3中,DDL-CNN/TDL-CNN网络在训练阶段分别同时接受两个/三 个样本作为输入,训练目标同时考虑了分类性能以及输入样本特征之间的区分性。
步骤2.1,初始化网络参数,包括DDL-CNN/TDL-CNN倒数第二层之前的 所有参数{θ}以及输出层(即倒数第一层)的权重和偏置{Wj,bj}。其中,Wj是倒 数第二层和输出层第j个节点之间的权重,bj是输出层第j个节点的偏置;
步骤2.2,利用式(1)-(2)分别计算倒数第二层和输出层的输出;
fi=g(Xi|θ) (1)
zij=Wj Tfi+bj (2)
其中,Xi表示第i个训练样本,g(·|θ)表示从输入层到倒数第二层之间的映射关系,fi表示第i个训练样本在倒数第二层处的输出,也可以认为是由卷积模块提取 出的特征,zij是输出层第j个节点的输出;
步骤2.3,利用式(3)-(4)分别计算对输出层施加Softmax后的输出(即预测概 率)以及交叉熵损失;
步骤2.4,DDL-CNN不仅需要将输入的两个样本Xi1和Xi2分类正确,同时需 要确保在经由卷积模块映射后的特征空间里,若Xi1和Xi2来自于同一类,则它们 应该较为接近,否则应该相互远离。
因此,DDL-CNN的总损失由两部分组成,如式(5)所示。
如果对于来自同一类的两个样本有hi,12=-1,对于来自不同类的样本有 hi,12=+1,那么式(7)可以写成一个与支持向量机类似的限制条件。
最终,DDL-CNN的总损失可由式(10)计算。
为了更新(θ′,uj,bj,β),需要将式(11)转化成无限制条件的优化问题,如式(12)所示,然后再利用基于梯度的优化算法进行更新。
其中,II{·}是指示函数。
步骤2.5,TDL-CNN不仅需要将输入的三个样本Xi1、Xi2和Xi3分类正确(其 中,Xi1和Xi2来自同一类,但Xi1和Xi3来自不同类),同时需要确保在经由卷积模 块映射后的特征空间里,Xi1和Xi3之间的距离应该大于Xi1和Xi2之间的距离。
因此,TDL-CNN的总损失也由两部分组成,如式(17)所示。
最终,TDL-CNN的总损失可由式(21)计算。
为了更新(θ′,uj,bj),需要将式(22)转化成无限制条件的优化问题,如式(23) 所示,然后再利用基于梯度的优化算法进行更新。
步骤2.6,利用基于梯度的优化算法对网络参数进行更新。
有益效果:
DDL-CNN/TDL-CNN借助时频分析和深度学习技术,不仅考虑了交叉熵损 失,而且也鼓励卷积模块将不同流动状态的样本投射到一个更具有区分性的特 征空间,使得在多个指标上具有更好的性能。
附图说明
图1是利用核函数进行映射的示意图;
图2是卷积神经网络示意图;
图3是本发明所提出的DDL-CNN网络结构示意图;
图4是本发明所提出的TDL-CNN网络结构示意图;
图5是本发明所采用的卷积神经网络架构;
图6是本发明进行信号处理的流程图;
图7是一类二元外压式超声速进气道的基本构型;
图8是R01和R14的动态压力信号;
图9是各个传感器的监测精度、宏观F1和微观F1的比较图;
图10是非参数统计检验中的CD图;
图11是利用t-sne降维后的可视化图。
具体实施方式
本发明的一种超声速进气道流动状态的监测方法,包括如下步骤:
步骤1,在超声速进气道的内部流道上布置若干个传感器,分别采集各传感 器的动态压力信号,经过切分后可以得到不同流动状态下的样本;
步骤2,利用连续小波变换对分别对每个传感器的样本进行时频分析,得到 对应的时频谱图,然后将其按照一定比例划分成训练集、验证集和测试集;
步骤3,利用步骤2得到的各传感器的训练集分别训练DDL-CNN/TDL-CNN 网络,并利用验证集选择最佳超参数;
步骤4,利用步骤3训练好的DDL-CNN/TDL-CNN网络分别对各传感器的 测试集进行测试,得到测试结果。
本发明中,首先采用连续小波变换对原始时域信号进行时频分析,得到二维 时频谱图,然后将其输入给卷积神经网络进行分类。为了降低卷积神经网络的分 类误差,在考虑交叉熵损失函数的同时,也要求卷积模块提取到的特征满足一定 的关系,使得同类样本较为接近,而不同类样本则相互远离。
首先,简要介绍一下连续小波变换、支持向量机和卷积神经网络,然后再具 体描述本发明提出的DDL-CNN/TDL-CNN网络。
(1)连续小波变换
时频分析方法是分析非平稳信号的常用方法,它可以反映随时间变化的频率 成分及其分布。常用的时频分析方法有短时傅里叶变换(Short Time Fourier Transform,简称STFT)和连续小波变换(Continuous Wavelet Transform,简称 CWT)。短时傅里叶变换通过对时域信号施加滑动时窗,再对时窗内的信号进行 傅里叶变换,因此可以反映频率随时间的变化情况。但是,短时傅里叶变换的时 窗长度是固定的,不能同时达到较好的时间分辨率和频率分辨率。连续小波变换 可以有效地弥补这一缺点,因为它的时间窗随着信号频率的增大而减小,反之亦 然。CWT通过缩放和平移操作对信号进行多尺度分析。其基本定义如下:
(2)支持向量机
支持向量机(Support Vector Machine,简称SVM)最初是为了解决二分类任务。它会产生一个最优超平面,并用最大间隔准则来分离两类样本。给定一个线性可 分的数据集通过引入松弛变量ξi,软支 持向量机的定义如下:
其中,w和b是超平面的系数。
式(1)对应的无约束条件的优化问题如下所示,可通过SGD/Adam等基于梯 度的算法进行优化。
如果数据集是非线性的,则可以使用核函数将样本从原始空间映射到高维空 间,使得样本在该高维空间里变得更易区分,如图1所示。常用的核函数有多 项式核和径向基函数核。
(3)卷积神经网络
卷积神经网络(Convolutional Neural Network,简称CNN)作为一种常用的深 度学习方法,在故障诊断、计算机视觉、自然语言处理等诸多领域都取得了显著 的成功。CNN的整体结构如图2所示。
CNN主要由卷积层、池化层和全连接层组成。卷积层通过对局部感受野进 行卷积运算来进行特征提取,可以大大减少网络参数的数量和模型的复杂度。给 定输入图像Xi及其标签Yi,卷积层的输出计算如下。
其中,*表示卷积运算,Wconv和bconv分别表示卷积层的权值和偏差,σ(·)表示 激活函数。
池化层通过计算局部感受野的平均值或最大值对卷积层的输出进行下采样, 从而在保留关键特征的同时减少了计算量。池化层的输出计算如下。
其中,down_sample(·)表示平均池化或最大池化。
全连接层与传统的前馈神经网络相同,每个输入神经元与每个输出神经元相 连。如果全连接层的输入记为fi,则其输出计算如下。
其中,Wfully和bfully分别表示全连接层的权值和偏置。
输出层的输出类似于式(6),但没有激活函数。
其中,Wout和bout分别表示输出层的权重和偏置。
通常使用式(8)中的softmax函数来计算预测概率,使用式(9)中的交叉熵作为 分类问题的损失函数。
(4)DDL-CNN/TDL-CNN网络
超声速进气道是超声速吸气推进系统的关键部件之一,其流动状态对整个系 统的性能影响很大。例如,不起动是一种非常不稳定的流动状态,具有强烈的周 期性冲击振荡,会导致发动机推力和比冲的显著降低。因此,对超声速进气道流 动状态进行监测具有重要意义。
机器学习已经被广泛应用于航空发动机的推力估计、剩余使用寿命预测、故 障诊断和检测以及智能控制等领域。然而,机器学习在进气道流动状态的监测方 面的研究还很少。Trapier等人提出了累积和算法和广义似然比算法对进气道的 不起动状态进行预警,但不能区分不同的流动状态。常军涛等人等将支持向量机 递归特征消除算法与Fisher线性判别分析相结合,研究了高超声速进气道起动/ 不起动状态的分类,并进一步识别了由于不同原因导致的不起动状态。为了提高 在传感器噪声和外部干扰情况下的监测可靠性,常军涛等人又研究了一种基于概 率输出支持向量机的多分类器融合方法。然而,他们的研究主要是基于CFD仿 真的稳态样本,而工程中的实际系统大多采集的是动态信号,因此可能会忽略一 些动态特性。
为了收集有关流动状态的信息,通常会在进气道内部安装多个传感器。从机 器学习的角度来看,从动态传感器信号监测流动状态的问题可以看作是一个时间 序列分类(Time Series Classification,简称TSC)的任务。TSC任务不同于传统的 分类任务,因为会存在依赖于时间顺序的区分性特征。近年来,深度学习已经成 为一种有效的方法,并成功地应用于许多TSC任务。卷积神经网络是目前最成 功的深度学习模型之一,它已经成功地解决了故障诊断、剩余使用寿命预测等领 域的许多复杂问题。卷积神经网络可以自动从图像中提取特征进行分类。交叉熵 损失和softmax层是卷积神经网络中最常用的组件之一,但是该组件并不能鼓励 卷积模块进行区分性特征的学习。
动态传感器信号通常包含大量有关流动状态的有用信息,因此对其进行信号 处理是比较关键的步骤。传统的频谱分析方法,如傅立叶变换(Fourier Transform, 简称FT),主要适用于动态特性不随时间变化的平稳信号。然而,在进气道从起 动状态向不起动状态过渡的过程中,传感器信号的动态特性随时间变化剧烈,因 此需要时频分析方法来处理这类非静态信号。
本发明将时频分析与深度学习技术相结合,从动态传感器信号中监测超声速 进气道的流动状态。首先,采用连续小波变换(CWT)对信号进行初步处理,将动 态传感器信号转换为二维时频谱图。然后,再利用卷积神经网络对时频谱图进行 分类,得到对应的流动状态。为了减少分类误差,本发明提出了同时考虑交叉熵 损失和区分性特征学习的双通道/三通道卷积神经网络(DDL-CNN/TDL-CNN)。 所提出的方法鼓励卷积模块将时频谱图投射到一个特征空间,使得在该空间里不 同的流动状态变得更加可分。实验结果表明,与传统CNN相比, DDL-CNN/TDL-CNN在多个指标上具有更好的性能。
DDL-CNN/TDL-CNN网络的训练过程均包含两个步骤:1)前向计算;2) 网络参数的梯度计算和更新。具体过程如下。
利用式(10)-(11)分别计算倒数第二层和输出层的输出;
fi=g(Xi|θ) (10)
zij=Wj Tfi+bj (11)
其中,Xi表示第i个训练样本,g(·|θ)表示从输入层到倒数第二层之间的映射关系,fi表示第i个训练样本在倒数第二层处的输出,也可以认为是由卷积模块提取 出的特征,zij是输出层第j个节点的输出;
利用式(12)-(13)分别计算对输出层施加Softmax后的输出(即预测概率)以 及交叉熵损失;
对于DDL-CNN而言,不仅需要将输入的两个样本Xi1和Xi2分类正确,同时 需要确保在经由卷积模块映射后的特征空间里,若Xi1和Xi2来自于同一类,则它 们应该较为接近,否则应该相互远离,如图3所示。因此,DDL-CNN的总损失 由两部分组成,如式(14)所示。
如果对于来自同一类的两个样本有hi,12=-1,对于来自不同类的样本有 hi,12=+1,那么式(7)可以写成一个与支持向量机类似的限制条件。
最终,DDL-CNN的总损失可由式(19)计算。
为了更新(θ′,uj,bj,β),需要将式(20)转化成无限制条件的优化问题,如式(21)所示,然后再利用基于梯度的优化算法进行更新。
其中,II{·}是指示函数。
算法1总结了本发明所提出的DDL-CNN网络的训练流程,如表1所示。
表1
对于TDL-CNN而言,不仅需要将输入的三个样本Xi1、Xi2和Xi3分类正确(其 中,Xi1和Xi2来自同一类,但Xi1和Xi3来自不同类),同时需要确保在经由卷积模 块映射后的特征空间里,Xi1和Xi3之间的距离应该大于Xi1和Xi2之间的距离,如 图4所示。因此,TDL-CNN的总损失也由两部分组成,如式(26)所示。
最终,TDL-CNN的总损失可由式(30)计算。
为了更新(θ′,uj,bj),需要将式(31)转化成无限制条件的优化问题,如式(32) 所示,然后再利用基于梯度的优化算法进行更新。
算法2总结了本发明所提出的TDL-CNN网络的训练流程,如表2所示。
表2
最终,利用基于梯度的优化算法,如Adam算法,对DDL-CNN/TDL-CNN 的网络参数进行更新。
下面结合具体实施例对本发明做进一步说明。
实施例
本实施例利用一类二元外压式超声速进气道的实验数据来验证所提出的 DDL-CNN/TDL-CNN网络的有效性。所有实验都在配置为IntelR CoreTM、 i7-7700HQ CPU、2.80GHz主频、8G内存、Windows10系统和MATLAB 2020b 版本的笔记本电脑上执行。
为了证明DDL-CNN/TDL-CNN网络的有效性,本实施例将其与传统的CNN 进行对比。这些对比方法所采用的网络架构都相同,唯一不同的地方在于它们的 损失函数。传统CNN的损失函数是交叉熵损失,而DDL-CNN/TDL-CNN同时 考虑了交叉熵损失和区分性特征的学习。
在具体实施过程中,首先利用固定时长的滑动窗口对各传感器采集到的动态 压力信号进行切分,得到时长为50ms的不同流动状态下的样本。然后,将所有 样本按6∶2∶2的比例划分为训练集、验证集和测试集。其中,验证集用于选择各 种对比方法中的最优超参数(即验证集精度最大时对应的超参数),测试集用于 比较各种对比方法的性能。
本发明采用连续小波变换对动态传感器信号进行初步的信号处理,将动态传 感器信号转换为二维时频谱图。在使用连续小波变换前,需从动态信号中减去滑 动平均值,以避免直接分量的影响。然后,将时频谱图相同位置上的元素归一化 为[0,1]的范围内,并输入到卷积神经网络中进行分类。本发明采用的卷积神经网 络架构如图5所示,具体细节如表3所示。
表3
采用批量归一化层来稳定和加快训练过程,并选择ReLU作为激活函数。采 用Adam优化器对参数进行更新。迭代次数设置为3000代,学习速率设置为0.001, 梯度衰减因子设置为0.9,平方梯度衰减因子设置为0.999,C的范围设为 [2-10,2-9,…,20]。信号处理的整个流程如图6所示。
本实施例的步骤如下:
步骤1:利用一类二元外压式超声速进气道的试验数据验证DDL-CNN/TDL-CNN网络在监测流动状态方面的有效性。
采集一类二元外压式超声速进气道在额定状态下的节流过程中进气道壁面 上各个传感器的动态压力信号,并利用滑动窗口对采集到的压力信号进行切分, 得到不同流动状态下的样本。
步骤2:利用连续小波变换对分别对每个传感器的样本进行时频分析,得到 对应的时频谱图,然后将其按照一定比例划分成训练集、验证集和测试集。
步骤3:分别基于各个传感器的样本建立并训练DDL-CNN/TDL-CNN网络, 利用验证集选择最佳超参数,并在测试集上与传统CNN的监测效果进行比较。
在监测超声速进气道流动状态的案例中,首先采集一类二元外压式超声速进 气道在额定状态下的节流过程中进气道壁面上各个传感器的动态压力信号,利用 滑动窗口对采集到的压力信号进行切分,得到不同流动状态下的样本。利用连续 小波变换将所有样本转化为二维时频谱图,并按照6:2:2的比例划分成训练集、 验证集和测试集。然后,分别基于各个传感器的训练集,利用算法1和算法2 训练DDL-CNN/TDL-CNN网络,并与传统的CNN进行对比。
本实施例的研究对象是一类二元外压式超声速进气道,其基本构型如图7 所示。该进气道的设计马赫数为2.0,理论捕获面积为48.0mm×40.0mm,面积收 缩比为1.5。上方压缩面采用部分等熵设计,由一级斜楔和一级等熵面构成。为 了兼顾亚音速工况下的气动性能、防止唇罩内侧形成大面积的流动分离,对该进 气道唇罩前缘采取了钝化处理。口部下游为一段单侧扩张通道,其后还接有一段 等直流道。在进气道两侧均嵌有光学玻璃用于内流场观察,其可视窗口范围可覆 盖内流道的核心区域。为了模拟实际工作中的下游节流效应,在进气道出口处设 置了一个楔形节流锥,其前缘位于通道出口的中心高度处。在步进电机的推动下, 该节流锥可沿轴向平移,以此在进气道出口处建立可控的堵塞度。本发明采用堵 塞度来表征进气道下游的壅塞程度。实验过程中,节流锥会从远下游位置处经数十次台阶式进锥后移动至与出口接近贴合状态,使堵塞度逐渐从0%增加至 99.1%。为了获取节流过程中进气道流场内的动态压力信息,在流道上下内表面 的中心线上共设置了31个流向分布的动态压力测点,测量范围覆盖内流道的核 心区域。依据位置的不同,将上述传感器分别编号为C01-C17和R01-R14,具体 实验条件如表4所示。图8显示了R01和R14在节流过程中的动态压力信号。 在此过程中,进气道分别经历了稳定状态、小喘状态、混合喘状态和大喘状态。
表4
表5显示了所有对比方法在31个传感器上的三个多分类性能指标(即监测 精度、宏观F1和微观F1得分)。
表5
为了便于比较,我们将监测精度、宏观F1和微观F1绘制在图9中。可以 看到,就三个多分类性能指标而言,DDL-CNN/TDL-CNN在绝大多数传感器上 都要高于传统CNN。
本实施例又做了一些非参数统计检验(Friedman检验和Nemenyi后续检验) 来对比各种方法的性能。Friedman检验中的参数τF计算如下,且服从自由度为 (k-1)和(k-1)(D-1)的F分布。
其中,k是对比方法的个数,D是数据集的个数,ri表示各种方法在所有数据集上的平均序值。
经过计算,当k=3且D=31时,τF等于33.0120,大于α=0.05时F分布的 临界值3.1504,因此拒绝所有对比方法都有相同性能的假设,需要继续进行 Nemenyi后续检验。临界值域(Critical Difference,简称CD)的计算公式如下:
其中,当α=0.05、k=3且D=31时,qα=2.344,CD=0.5954。
图10是Friedman检验图,其中蓝线的长度等于CD值,红点代表各种方法 的平均序值。如果两种对比方法的分类性能明显不同,则相应的平均序值至少相 差一个CD值。可以看出,本发明提出的DDL-CNN/TDL-CNN网络要显著优于 传统的CNN网络。
图11进一步展示了利用一种叫做t分布随机邻域嵌入(t-sne)的降维技术来可 视化所有对比方法由倒数第二层提取出的特征。可以看出,与传统CNN相比, 在额外考虑了区分性特征学习后,DDL-CNN/TDL-CNN使得不同类别更具有区 分性,进一步证明了所提方法的有效性。
Claims (7)
1.一种超声速进气道流动状态的监测方法,其特征在于,包括如下步骤:
步骤1,在超声速进气道的内部流道上布置若干个传感器,分别采集各传感器的动态压力信号,经过切分后得到不同流动状态下的样本;
步骤2,利用连续小波变换对分别对每个传感器的样本进行时频分析,得到对应的时频谱图,然后将其划分成训练集、验证集和测试集;
步骤3,利用步骤2得到的各传感器的训练集分别训练DDL-CNN/TDL-CNN网络,并利用验证集选择最佳超参数;
步骤4,利用步骤3训练好的DDL-CNN/TDL-CNN网络分别对各传感器的测试集进行测试,得到测试结果。
2.根据权利要求1所述的超声速进气道流动状态监测方法,其特征在于,所述步骤1中,利用固定时长的滑动窗口对各传感器采集到的动态压力信号进行切分,得到不同流动状态下的样本。
3.根据权利要求1所述的超声速进气道流动状态监测方法,其特征在于,所述步骤2中,利用连续小波变换将一维时间信号转变为二维时频谱图,使得可以同时在时域和频域上揭示原始信号的本质特征。
4.根据权利要求1所述的超声速进气道流动状态监测方法,其特征在于,所述步骤3中,DDL-CNN/TDL-CNN网络在训练阶段分别同时接受两个/三个样本作为输入,训练目标同时考虑了分类性能以及输入样本特征之间的区分性。
5.根据权利要求1所述的超声速进气道流动状态监测方法,其特征在于,所述步骤3中,DDL-CNN/TDL-CNN网络模型的训练步骤包括:
步骤2.1,初始化网络参数,包括DDL-CNN/TDL-CNN倒数第二层之前的所有参数{θ}以及输出层的权重和偏置{Wj,bj};其中,Wj是倒数第二层和输出层第j个节点之间的权重,bj是输出层第j个节点的偏置;
步骤2.2,利用式(1)-(2)分别计算倒数第二层和输出层的输出;
fi=g(Xi|θ) (1)
zij=Wj Tfi+bj (2)
其中,Xi表示第i个训练样本,g(·|θ)表示从输入层到倒数第二层之间的映射关系,fi表示第i个训练样本在倒数第二层处的输出,也可认为是由卷积模块提取出的特征,zij是输出层第j个节点的输出;
步骤2.3,利用式(3)-(4)分别计算对输出层施加Softmax后的输出以及交叉熵损失;
步骤2.4,计算DDL-CNN的总损失;
步骤2.5:计算TDL-CNN的总损失;
步骤2.6,利用基于梯度的优化算法对网络参数进行更新。
6.根据权利要求5所述的超声速进气道流动状态监测方法,其特征在于,步骤2.4的具体步骤包括:
DDL-CNN不仅需要将输入的两个样本Xi1和Xi2分类正确,同时需要确保在经由卷积模块映射后的特征空间里,若Xi1和Xi2来自于同一类,则它们应该较为接近,否则应该相互远离;因此,DDL-CNN的总损失由两部分组成,如式(5)所示:
其中,δ表示两个样本之间的基准距离,Δ代表两个样本之间的间隔;
如果对于来自同一类的两个样本有hi,12=-1,对于来自不同类的样本有hi,12=+1,那么式(7)可写成一个与支持向量机类似的限制条件;
最终,DDL-CNN的总损失可由式(10)计算;
s.t.hi,12(di,12+β)≥1-λi,
s.t.hi,12(di,12+β)≥1-λi,
为了更新(θ′,uj,bj,β),将式(11)转化成无限制条件的优化问题,如式(12)所示,然后再利用基于梯度的优化算法进行更新;
其中,II{·}是指示函数;
7.根据权利要求6所述的超声速进气道流动状态监测方法,其特征在于,步骤2.5的具体步骤包括:
TDL-CNN不仅需要将输入的三个样本Xi1、Xi2和Xi3分类正确,其中,Xi1和Xi2来自同一类,但Xi1和Xi3来自不同类,同时需要确保在经由卷积模块映射后的特征空间里,Xi1和Xi3之间的距离应该大于Xi1和Xi2之间的距离;
因此,TDL-CNN的总损失也由两部分组成,如式(17)所示;
最终,TDL-CNN的总损失可由式(21)计算;
s.t.di,13-di,12≥1-λi,
s.t.di,13-di,12≥1-λi,
为了更新(θ′,uj,bj),将式(22)转化成无限制条件的优化问题,如式(23)所示,然后再利用基于梯度的优化算法进行更新;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110929263.0A CN113836787A (zh) | 2021-08-13 | 2021-08-13 | 基于区分性特征学习的超声速进气道流动状态监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110929263.0A CN113836787A (zh) | 2021-08-13 | 2021-08-13 | 基于区分性特征学习的超声速进气道流动状态监测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113836787A true CN113836787A (zh) | 2021-12-24 |
Family
ID=78960482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110929263.0A Pending CN113836787A (zh) | 2021-08-13 | 2021-08-13 | 基于区分性特征学习的超声速进气道流动状态监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113836787A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114169255A (zh) * | 2022-02-11 | 2022-03-11 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像生成系统以及方法 |
CN118338328A (zh) * | 2024-06-14 | 2024-07-12 | 四川酷比通信设备有限公司 | 基于人工智能的5g-ntn卫星通信智能化评估系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102230848A (zh) * | 2007-12-03 | 2011-11-02 | 哈尔滨工业大学 | 高超声速进气道起动/不起动模式最优分类面的获取方法 |
CN112597692A (zh) * | 2020-09-21 | 2021-04-02 | 南京航空航天大学 | 一种实时监测超声速进气道流动状态的方法 |
CN112861419A (zh) * | 2020-12-30 | 2021-05-28 | 南京航空航天大学 | 一种超声速进气道流动状态的实时监测方法 |
-
2021
- 2021-08-13 CN CN202110929263.0A patent/CN113836787A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102230848A (zh) * | 2007-12-03 | 2011-11-02 | 哈尔滨工业大学 | 高超声速进气道起动/不起动模式最优分类面的获取方法 |
CN112597692A (zh) * | 2020-09-21 | 2021-04-02 | 南京航空航天大学 | 一种实时监测超声速进气道流动状态的方法 |
CN112861419A (zh) * | 2020-12-30 | 2021-05-28 | 南京航空航天大学 | 一种超声速进气道流动状态的实时监测方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114169255A (zh) * | 2022-02-11 | 2022-03-11 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像生成系统以及方法 |
CN114169255B (zh) * | 2022-02-11 | 2022-05-13 | 阿里巴巴达摩院(杭州)科技有限公司 | 图像生成系统以及方法 |
CN118338328A (zh) * | 2024-06-14 | 2024-07-12 | 四川酷比通信设备有限公司 | 基于人工智能的5g-ntn卫星通信智能化评估系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | Gated recurrent unit based recurrent neural network for remaining useful life prediction of nonlinear deterioration process | |
CN111368885B (zh) | 一种航空发动机气路故障诊断方法 | |
Li et al. | Fault diagnosis of rotating machinery based on combination of deep belief network and one-dimensional convolutional neural network | |
CN108256173B (zh) | 一种航空发动机动态过程的气路故障诊断方法及系统 | |
CN112131760A (zh) | 基于cbam模型的航空发动机剩余寿命预测方法 | |
Shang et al. | A remaining life prediction of rolling element bearings based on a bidirectional gate recurrent unit and convolution neural network | |
Che et al. | Hybrid multimodal fusion with deep learning for rolling bearing fault diagnosis | |
CN112766303B (zh) | 一种基于cnn的航空发动机故障诊断方法 | |
Wang et al. | Random convolutional neural network structure: An intelligent health monitoring scheme for diesel engines | |
CN115618733B (zh) | 针对航空发动机剩余使用寿命预测的多尺度混杂注意力机制建模方法 | |
US20240012965A1 (en) | Steady flow prediction method in plane cascade based on generative adversarial network | |
CN113836787A (zh) | 基于区分性特征学习的超声速进气道流动状态监测方法 | |
CN112613186B (zh) | 一种基于统计分布特征的航空发动机气路故障融合诊断方法 | |
Qian et al. | A comparative study of deep learning-based fault diagnosis methods for rotating machines in nuclear power plants | |
Liao et al. | Research on a rolling bearing fault detection method with wavelet convolution deep transfer learning | |
CN116028865A (zh) | 基于特征扩增的航空发动机故障诊断方法 | |
Yang et al. | The LST-SATM-net: A new deep feature learning framework for aero-engine hydraulic pipeline systems intelligent faults diagnosis | |
Jin et al. | A rotating stall warning method for aero-engine compressor based on DeepESVDD-CNN | |
Zheng et al. | An unsupervised transfer learning method based on SOCNN and FBNN and its application on bearing fault diagnosis | |
CN112861419B (zh) | 一种超声速进气道流动状态的实时监测方法 | |
Zhou et al. | An adaptive remaining useful life prediction model for aeroengine based on multi-angle similarity | |
CN114298183A (zh) | 飞行动作智能识别方法 | |
CN113409213A (zh) | 柱塞泵故障信号时频图降噪增强方法和系统 | |
Sureshbabu et al. | Deep-learning methods for non-linear transonic flow-field prediction | |
CN115048873B (zh) | 一种用于飞机发动机的剩余使用寿命预测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |