CN113836787A

CN113836787A - 基于区分性特征学习的超声速进气道流动状态监测方法

Info

Publication number: CN113836787A
Application number: CN202110929263.0A
Authority: CN
Inventors: 赵永平; 吴奂; 谭慧俊
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2021-08-13
Filing date: 2021-08-13
Publication date: 2021-12-24

Abstract

本发明提出一种监测超声速进气道流动状态的方法，采用时频分析技术和深度学习相结合的方法，从动态传感器信号中监测超声速进气道的流动状态。首先，使用连续小波变换对动态传感器信号进行初步的信号处理，将动态传感器信号转换为时频谱图，然后输入到卷积神经网络(Convolutional Neural Network，简称CNN)中进行分类。为了减少分类误差，本发明提出了同时考虑交叉熵损失和区分性特征学习的双通道/三通道卷积神经网络(Doublet/Triplet ConvolutionalNeural Network combined with Discriminative Learning，简称DDL‑CNN/TDL‑CNN)。所提出的方法鼓励卷积模块将时频谱图投射到一个特征空间，使得在该空间里不同的流动状态变得更加可分。实验结果表明，与传统CNN相比，DDL‑CNN/TDL‑CNN在多个指标上具有更好的性能。

Description

基于区分性特征学习的超声速进气道流动状态监测方法

技术领域

本发明属于超声速进气道流动状态监测技术领域，具体涉及一种超声速进气道流动状态的监测方法。

背景技术

超声速进气道作为吸气式超声速推进系统的关键部件之一，其流动状态对整个系统的性能有直接影响。例如，超声速进气道喘振是一种极其不稳定的流动状态，通常伴随着剧烈的、周期性的激波振荡，这将使得整个推进系统的推力特性严重恶化，并且时刻面临着熄火的风险。不仅如此，随激波振荡产生的周期性热力载荷也会使整个系统的可操控性急剧变差，甚至还可能直接导致整体结构的破坏，对飞行器与人员的安全构成威胁。从保护控制的角度来说，由于在不同的流动状态下，超声速进气道表现出不同的流动特点，因此采取的控制措施也应有所不同。因此，为了降低喘振现象的安全威胁以及更好地控制推进系统，对超声速进气道的流动状态进行监测是非常重要的。

目前，对于超声速进气道流动状态的监测方法主要包括基于高速纹影摄像的方法和数据驱动的方法。基于高速纹影摄像的方法直观、可靠，但需要复杂的光路系统，仅在地面试验中可行，在实际飞行中显然不现实。数据驱动的方法是基于CFD仿真数据或者试验数据，利用机器学习等技术进行智能化监测。该方法不需要复杂的光路系统，既适用于地面试验，也适用于实际飞行，并且可以利用地面试验或实际飞行中不断产生的新数据修正已有的模型，充分挖掘历史数据和实时数据中的有效信息，在提高数据利用率的同时，使得模型对于外界条件的适应性较强。目前，对于数据驱动方法的研究主要是基于少量的CFD稳态仿真数据，而实际测量装置采集的通常是大量的动态试验数据。因此，在以往的研究过程中会忽略实际试验数据中的动态特性以及噪声、干扰等因素的影响。本发明采用数据驱动的方法，基于动态试验数据对进气道的流动状态进行监测。

发明内容

针对上述问题，本发明提出一种超声速进气道流动状态的监测方法，利用时频分析与深度学习技术，基于动态压力数据来监测超声速进气道的流动状态，在多个指标上具有较好的性能。

为实现上述目的，本发明采用如下技术方案：

一种超声速进气道流动状态的监测方法，包括如下步骤：

步骤1，在超声速进气道的内部流道上布置若干个传感器，分别采集各传感器的动态压力信号，经过切分后可以得到不同流动状态下的样本；

步骤2，利用连续小波变换对分别对每个传感器的样本进行时频分析，得到对应的时频谱图，然后将其按照一定比例划分成训练集、验证集和测试集；

步骤3，利用步骤2得到的各传感器的训练集分别训练DDL-CNN/TDL-CNN 网络，并利用验证集选择最佳超参数；

步骤4，利用步骤3训练好的DDL-CNN/TDL-CNN网络分别对各传感器的测试集进行测试，得到测试结果。

所述步骤1中，利用固定时长的滑动窗口对各传感器采集到的动态压力信号进行切分，得到不同流动状态下的样本。

所述步骤2中，利用连续小波变换将一维时间信号转变为二维时频谱图，使得可以同时在时域和频域上揭示原始信号的本质特征。

所述步骤3中，DDL-CNN/TDL-CNN网络在训练阶段分别同时接受两个/三个样本作为输入，训练目标同时考虑了分类性能以及输入样本特征之间的区分性。

步骤2.1，初始化网络参数，包括DDL-CNN/TDL-CNN倒数第二层之前的所有参数{θ}以及输出层(即倒数第一层)的权重和偏置{W_j，b_j}。其中，W_j是倒数第二层和输出层第j个节点之间的权重，b_j是输出层第j个节点的偏置；

步骤2.2，利用式(1)-(2)分别计算倒数第二层和输出层的输出；

f_i＝g(X_i|θ) (1)

z_ij＝W_j ^Tf_i+b_j (2)

其中，X_i表示第i个训练样本，g(·|θ)表示从输入层到倒数第二层之间的映射关系，f_i表示第i个训练样本在倒数第二层处的输出，也可以认为是由卷积模块提取出的特征，z_ij是输出层第j个节点的输出；

步骤2.3，利用式(3)-(4)分别计算对输出层施加Softmax后的输出(即预测概率)以及交叉熵损失；

其中，y_ij和

分别表示X_i属于第j类的真实概率和预测概率，

表示所有训练样本的交叉熵损失，N表示所有训练样本的数目，M表示所有类别数目；

步骤2.4，DDL-CNN不仅需要将输入的两个样本X_i1和X_i2分类正确，同时需要确保在经由卷积模块映射后的特征空间里，若X_i1和X_i2来自于同一类，则它们应该较为接近，否则应该相互远离。

因此，DDL-CNN的总损失由两部分组成，如式(5)所示。

其中，

表示对输入的两个样本进行分类的平均交叉熵损失，如式(6)所示。

需要确保输入的两个样本在特征空间满足特定的距离关系：若两个样本来自同一类，则它们在特征空间里的距离应该较小，否则应该较大，如式(7)所示。

如果对于来自同一类的两个样本有h_i，12＝-1，对于来自不同类的样本有 h_i，12＝+1，那么式(7)可以写成一个与支持向量机类似的限制条件。

其中，

目

d_i，12＝[g(X_i1|θ′)-g(X_i2|θ′)]^T[g(X_i1|θ′)- g(X_i2|θ′)]是由卷积模块提取的特征之间的距离。

因此，

可以写成与支持向量机类似的损失函数。

最终，DDL-CNN的总损失可由式(10)计算。

如果令

则式(10)可以进一步写成式(11)。

其中，C′＝ρC，且

表示预测概率。

为了更新(θ′，u_j，b_j，β)，需要将式(11)转化成无限制条件的优化问题，如式(12)所示，然后再利用基于梯度的优化算法进行更新。

在更新参数之前，需要利用式(13)-(16)计算

关于(θ′，u_j，b_j，β)的导数。

关于β的导数计算如式(13)所示。

其中，II{·}是指示函数。

关于b_j的导数计算如式(14)所示。

关于u_j的导数计算如式(15)所示。

关于θ′的导数计算如式(16)所示。

其中，

是g(X_i1|θ′)/g(X_i2|θ′)关于θ′的雅克比矩阵。

步骤2.5，TDL-CNN不仅需要将输入的三个样本X_i1、X_i2和X_i3分类正确(其中，X_i1和X_i2来自同一类，但X_i1和X_i3来自不同类)，同时需要确保在经由卷积模块映射后的特征空间里，X_i1和X_i3之间的距离应该大于X_i1和X_i2之间的距离。

因此，TDL-CNN的总损失也由两部分组成，如式(17)所示。

其中，

表示对输入的三个样本进行分类的平均交叉熵损失，如式(6)所示。

需要确保输入的三个样本在特征空间满足特定的距离关系：不同类样本之间的距离应该要大于同一类样本之间的距离，如式(19)所示。

式(19)与支持向量机的限制条件较为相似。因此，

也可以写成与支持向量机类似的损失函数。

最终，TDL-CNN的总损失可由式(21)计算。

如果令

则式(21)可以进一步写成式(22)。

为了更新(θ′，u_j，b_j)，需要将式(22)转化成无限制条件的优化问题，如式(23) 所示，然后再利用基于梯度的优化算法进行更新。

在更新参数之前，需要利用式(13)-(16)计算

关于(θ′，u_j，b_j)的导数。

关于b_j的导数计算如式(24)所示。

关于u_j的导数计算如式(25)所示。

关于θ′的导数计算如式(26)所示。

其中，

是g(X_i1|θ′)/g(X_i2|θ′)/g(X_i3|θ′)关于θ′的雅克比矩阵。

步骤2.6，利用基于梯度的优化算法对网络参数进行更新。

有益效果：

DDL-CNN/TDL-CNN借助时频分析和深度学习技术，不仅考虑了交叉熵损失，而且也鼓励卷积模块将不同流动状态的样本投射到一个更具有区分性的特征空间，使得在多个指标上具有更好的性能。

附图说明

图1是利用核函数进行映射的示意图；

图2是卷积神经网络示意图；

图3是本发明所提出的DDL-CNN网络结构示意图；

图4是本发明所提出的TDL-CNN网络结构示意图；

图5是本发明所采用的卷积神经网络架构；

图6是本发明进行信号处理的流程图；

图7是一类二元外压式超声速进气道的基本构型；

图8是R01和R14的动态压力信号；

图9是各个传感器的监测精度、宏观F1和微观F1的比较图；

图10是非参数统计检验中的CD图；

图11是利用t-sne降维后的可视化图。

具体实施方式

本发明的一种超声速进气道流动状态的监测方法，包括如下步骤：

本发明中，首先采用连续小波变换对原始时域信号进行时频分析，得到二维时频谱图，然后将其输入给卷积神经网络进行分类。为了降低卷积神经网络的分类误差，在考虑交叉熵损失函数的同时，也要求卷积模块提取到的特征满足一定的关系，使得同类样本较为接近，而不同类样本则相互远离。

首先，简要介绍一下连续小波变换、支持向量机和卷积神经网络，然后再具体描述本发明提出的DDL-CNN/TDL-CNN网络。

(1)连续小波变换

时频分析方法是分析非平稳信号的常用方法，它可以反映随时间变化的频率成分及其分布。常用的时频分析方法有短时傅里叶变换(Short Time Fourier Transform，简称STFT)和连续小波变换(Continuous Wavelet Transform，简称 CWT)。短时傅里叶变换通过对时域信号施加滑动时窗，再对时窗内的信号进行傅里叶变换，因此可以反映频率随时间的变化情况。但是，短时傅里叶变换的时窗长度是固定的，不能同时达到较好的时间分辨率和频率分辨率。连续小波变换可以有效地弥补这一缺点，因为它的时间窗随着信号频率的增大而减小，反之亦然。CWT通过缩放和平移操作对信号进行多尺度分析。其基本定义如下：

其中，a是缩放因子，b是平移因子，s(t)是一维时域信号，

是小波基函数。

(2)支持向量机

支持向量机(Support Vector Machine，简称SVM)最初是为了解决二分类任务。它会产生一个最优超平面，并用最大间隔准则来分离两类样本。给定一个线性可分的数据集

通过引入松弛变量ξ_i，软支持向量机的定义如下：

其中，w和b是超平面的系数。

式(1)对应的无约束条件的优化问题如下所示，可通过SGD/Adam等基于梯度的算法进行优化。

如果数据集是非线性的，则可以使用核函数将样本从原始空间映射到高维空间，使得样本在该高维空间里变得更易区分，如图1所示。常用的核函数有多项式核和径向基函数核。

(3)卷积神经网络

卷积神经网络(Convolutional Neural Network，简称CNN)作为一种常用的深度学习方法，在故障诊断、计算机视觉、自然语言处理等诸多领域都取得了显著的成功。CNN的整体结构如图2所示。

CNN主要由卷积层、池化层和全连接层组成。卷积层通过对局部感受野进行卷积运算来进行特征提取，可以大大减少网络参数的数量和模型的复杂度。给定输入图像X_i及其标签Y_i，卷积层的输出计算如下。

其中，*表示卷积运算，W^conv和b^conv分别表示卷积层的权值和偏差，σ(·)表示激活函数。

池化层通过计算局部感受野的平均值或最大值对卷积层的输出进行下采样，从而在保留关键特征的同时减少了计算量。池化层的输出计算如下。

其中，down_sample(·)表示平均池化或最大池化。

全连接层与传统的前馈神经网络相同，每个输入神经元与每个输出神经元相连。如果全连接层的输入记为f_i，则其输出计算如下。

其中，W^fully和b^fully分别表示全连接层的权值和偏置。

输出层的输出类似于式(6)，但没有激活函数。

其中，W^out和b^out分别表示输出层的权重和偏置。

通常使用式(8)中的softmax函数来计算预测概率，使用式(9)中的交叉熵作为分类问题的损失函数。

其中，z_ij表示z_i中的第j个元素，

表示第j类的预测概率，N是训练样本数，M是类别数。

(4)DDL-CNN/TDL-CNN网络

超声速进气道是超声速吸气推进系统的关键部件之一，其流动状态对整个系统的性能影响很大。例如，不起动是一种非常不稳定的流动状态，具有强烈的周期性冲击振荡，会导致发动机推力和比冲的显著降低。因此，对超声速进气道流动状态进行监测具有重要意义。

机器学习已经被广泛应用于航空发动机的推力估计、剩余使用寿命预测、故障诊断和检测以及智能控制等领域。然而，机器学习在进气道流动状态的监测方面的研究还很少。Trapier等人提出了累积和算法和广义似然比算法对进气道的不起动状态进行预警，但不能区分不同的流动状态。常军涛等人等将支持向量机递归特征消除算法与Fisher线性判别分析相结合，研究了高超声速进气道起动/ 不起动状态的分类，并进一步识别了由于不同原因导致的不起动状态。为了提高在传感器噪声和外部干扰情况下的监测可靠性，常军涛等人又研究了一种基于概率输出支持向量机的多分类器融合方法。然而，他们的研究主要是基于CFD仿真的稳态样本，而工程中的实际系统大多采集的是动态信号，因此可能会忽略一些动态特性。

为了收集有关流动状态的信息，通常会在进气道内部安装多个传感器。从机器学习的角度来看，从动态传感器信号监测流动状态的问题可以看作是一个时间序列分类(Time Series Classification，简称TSC)的任务。TSC任务不同于传统的分类任务，因为会存在依赖于时间顺序的区分性特征。近年来，深度学习已经成为一种有效的方法，并成功地应用于许多TSC任务。卷积神经网络是目前最成功的深度学习模型之一，它已经成功地解决了故障诊断、剩余使用寿命预测等领域的许多复杂问题。卷积神经网络可以自动从图像中提取特征进行分类。交叉熵损失和softmax层是卷积神经网络中最常用的组件之一，但是该组件并不能鼓励卷积模块进行区分性特征的学习。

动态传感器信号通常包含大量有关流动状态的有用信息，因此对其进行信号处理是比较关键的步骤。传统的频谱分析方法，如傅立叶变换(Fourier Transform，简称FT)，主要适用于动态特性不随时间变化的平稳信号。然而，在进气道从起动状态向不起动状态过渡的过程中，传感器信号的动态特性随时间变化剧烈，因此需要时频分析方法来处理这类非静态信号。

本发明将时频分析与深度学习技术相结合，从动态传感器信号中监测超声速进气道的流动状态。首先，采用连续小波变换(CWT)对信号进行初步处理，将动态传感器信号转换为二维时频谱图。然后，再利用卷积神经网络对时频谱图进行分类，得到对应的流动状态。为了减少分类误差，本发明提出了同时考虑交叉熵损失和区分性特征学习的双通道/三通道卷积神经网络(DDL-CNN/TDL-CNN)。所提出的方法鼓励卷积模块将时频谱图投射到一个特征空间，使得在该空间里不同的流动状态变得更加可分。实验结果表明，与传统CNN相比， DDL-CNN/TDL-CNN在多个指标上具有更好的性能。

DDL-CNN/TDL-CNN网络的训练过程均包含两个步骤：1)前向计算；2) 网络参数的梯度计算和更新。具体过程如下。

利用式(10)-(11)分别计算倒数第二层和输出层的输出；

f_i＝g(X_i|θ) (10)

z_ij＝W_j ^Tf_i+b_j (11)

利用式(12)-(13)分别计算对输出层施加Softmax后的输出(即预测概率)以及交叉熵损失；

其中，yij和

分别表示X_i属于第j类的真实概率和预测率，

对于DDL-CNN而言，不仅需要将输入的两个样本X_i1和X_i2分类正确，同时需要确保在经由卷积模块映射后的特征空间里，若X_i1和X_i2来自于同一类，则它们应该较为接近，否则应该相互远离，如图3所示。因此，DDL-CNN的总损失由两部分组成，如式(14)所示。

其中，

表示对输入的两个样本进行分类的平均交叉熵损失，如式(15)所示。

需要确保输入的两个样本在特征空间满足特定的距离关系：若两个样本来自同一类，则它们在特征空间里的距离应该较小，否则应该较大，如式(16)所示。

其中，

且

d_i，12＝[g(X_i1|θ′)-g(X_i2|θ′)]T[g(X_i1|θ′)- g(X_i2|θ′)]是由卷积模块提取的特征之间的距离。因此，

可以写成与支持向量机类似的损失函数。

最终，DDL-CNN的总损失可由式(19)计算。

如果令

则式(19)可以进一步写成式(20)。

其中，C′＝ρC，且

表示预测概率。

为了更新(θ′，u_j，b_j，β)，需要将式(20)转化成无限制条件的优化问题，如式(21)所示，然后再利用基于梯度的优化算法进行更新。

在更新参数之前，需要利用式(22)-(25)计算

关于(θ′，u_j，b_j，β)的导数。

关于β的导数计算如式(22)所示。

其中，II{·}是指示函数。

关于b_j的导数计算如式(23)所示。

关于u_j的导数计算如式(24)所示。

关于θ′的导数计算如式(25)所示。

其中，

是g(X_i1|θ′)/g(X_i2|θ′)关于θ′的雅克比矩阵。

算法1总结了本发明所提出的DDL-CNN网络的训练流程，如表1所示。

表1

对于TDL-CNN而言，不仅需要将输入的三个样本X_i1、X_i2和X_i3分类正确(其中，X_i1和X_i2来自同一类，但X_i1和X_i3来自不同类)，同时需要确保在经由卷积模块映射后的特征空间里，X_i1和X_i3之间的距离应该大于X_i1和X_i2之间的距离，如图4所示。因此，TDL-CNN的总损失也由两部分组成，如式(26)所示。

其中，

表示对输入的三个样本进行分类的平均交叉熵损失，如式(27)所示。

需要确保输入的三个样本在特征空间满足特定的距离关系：不同类样本之间的距离应该要大于同一类样本之间的距离，如式(28)所示。

式(28)与支持向量机的限制条件较为相似。因此，

也可以写成与支持向量机类似的损失函数。

最终，TDL-CNN的总损失可由式(30)计算。

如果令

则式(30)可以进一步写成式(31)。

为了更新(θ′，u_j，b_j)，需要将式(31)转化成无限制条件的优化问题，如式(32) 所示，然后再利用基于梯度的优化算法进行更新。

在更新参数之前，需要利用式(33)-(35)计算

关于(θ′，u_j，b_j)的导数。

关于b_j的导数计算如式(33)所示。

关于u_j的导数计算如式(34)所示。

关于θ′的导数计算如式(35)所示。

其中，

是g(X_i1|θ′)/g(X_i2|θ′)/g(X_i3|θ′)关于θ′的雅克比矩阵。

算法2总结了本发明所提出的TDL-CNN网络的训练流程，如表2所示。

表2

最终，利用基于梯度的优化算法，如Adam算法，对DDL-CNN/TDL-CNN 的网络参数进行更新。

下面结合具体实施例对本发明做进一步说明。

实施例

本实施例利用一类二元外压式超声速进气道的实验数据来验证所提出的 DDL-CNN/TDL-CNN网络的有效性。所有实验都在配置为IntelR CoreTM、 i7-7700HQ CPU、2.80GHz主频、8G内存、Windows10系统和MATLAB 2020b 版本的笔记本电脑上执行。

为了证明DDL-CNN/TDL-CNN网络的有效性，本实施例将其与传统的CNN 进行对比。这些对比方法所采用的网络架构都相同，唯一不同的地方在于它们的损失函数。传统CNN的损失函数是交叉熵损失，而DDL-CNN/TDL-CNN同时考虑了交叉熵损失和区分性特征的学习。

在具体实施过程中，首先利用固定时长的滑动窗口对各传感器采集到的动态压力信号进行切分，得到时长为50ms的不同流动状态下的样本。然后，将所有样本按6∶2∶2的比例划分为训练集、验证集和测试集。其中，验证集用于选择各种对比方法中的最优超参数(即验证集精度最大时对应的超参数)，测试集用于比较各种对比方法的性能。

本发明采用连续小波变换对动态传感器信号进行初步的信号处理，将动态传感器信号转换为二维时频谱图。在使用连续小波变换前，需从动态信号中减去滑动平均值，以避免直接分量的影响。然后，将时频谱图相同位置上的元素归一化为[0，1]的范围内，并输入到卷积神经网络中进行分类。本发明采用的卷积神经网络架构如图5所示，具体细节如表3所示。

表3

采用批量归一化层来稳定和加快训练过程，并选择ReLU作为激活函数。采用Adam优化器对参数进行更新。迭代次数设置为3000代，学习速率设置为0.001，梯度衰减因子设置为0.9，平方梯度衰减因子设置为0.999，C的范围设为 [2^-10，2^-9，…，2⁰]。信号处理的整个流程如图6所示。

本实施例的步骤如下：

步骤1：利用一类二元外压式超声速进气道的试验数据验证DDL-CNN/TDL-CNN网络在监测流动状态方面的有效性。

采集一类二元外压式超声速进气道在额定状态下的节流过程中进气道壁面上各个传感器的动态压力信号，并利用滑动窗口对采集到的压力信号进行切分，得到不同流动状态下的样本。

步骤2：利用连续小波变换对分别对每个传感器的样本进行时频分析，得到对应的时频谱图，然后将其按照一定比例划分成训练集、验证集和测试集。

步骤3：分别基于各个传感器的样本建立并训练DDL-CNN/TDL-CNN网络，利用验证集选择最佳超参数，并在测试集上与传统CNN的监测效果进行比较。

在监测超声速进气道流动状态的案例中，首先采集一类二元外压式超声速进气道在额定状态下的节流过程中进气道壁面上各个传感器的动态压力信号，利用滑动窗口对采集到的压力信号进行切分，得到不同流动状态下的样本。利用连续小波变换将所有样本转化为二维时频谱图，并按照6:2:2的比例划分成训练集、验证集和测试集。然后，分别基于各个传感器的训练集，利用算法1和算法2 训练DDL-CNN/TDL-CNN网络，并与传统的CNN进行对比。

本实施例的研究对象是一类二元外压式超声速进气道，其基本构型如图7 所示。该进气道的设计马赫数为2.0，理论捕获面积为48.0mm×40.0mm，面积收缩比为1.5。上方压缩面采用部分等熵设计，由一级斜楔和一级等熵面构成。为了兼顾亚音速工况下的气动性能、防止唇罩内侧形成大面积的流动分离，对该进气道唇罩前缘采取了钝化处理。口部下游为一段单侧扩张通道，其后还接有一段等直流道。在进气道两侧均嵌有光学玻璃用于内流场观察，其可视窗口范围可覆盖内流道的核心区域。为了模拟实际工作中的下游节流效应，在进气道出口处设置了一个楔形节流锥，其前缘位于通道出口的中心高度处。在步进电机的推动下，该节流锥可沿轴向平移，以此在进气道出口处建立可控的堵塞度。本发明采用堵塞度来表征进气道下游的壅塞程度。实验过程中，节流锥会从远下游位置处经数十次台阶式进锥后移动至与出口接近贴合状态，使堵塞度逐渐从0％增加至 99.1％。为了获取节流过程中进气道流场内的动态压力信息，在流道上下内表面的中心线上共设置了31个流向分布的动态压力测点，测量范围覆盖内流道的核心区域。依据位置的不同，将上述传感器分别编号为C01-C17和R01-R14，具体实验条件如表4所示。图8显示了R01和R14在节流过程中的动态压力信号。在此过程中，进气道分别经历了稳定状态、小喘状态、混合喘状态和大喘状态。

表4

表5显示了所有对比方法在31个传感器上的三个多分类性能指标(即监测精度、宏观F1和微观F1得分)。

表5

为了便于比较，我们将监测精度、宏观F1和微观F1绘制在图9中。可以看到，就三个多分类性能指标而言，DDL-CNN/TDL-CNN在绝大多数传感器上都要高于传统CNN。

本实施例又做了一些非参数统计检验(Friedman检验和Nemenyi后续检验) 来对比各种方法的性能。Friedman检验中的参数τ_F计算如下，且服从自由度为 (k-1)和(k-1)(D-1)的F分布。

其中，k是对比方法的个数，D是数据集的个数，r_i表示各种方法在所有数据集上的平均序值。

经过计算，当k＝3且D＝31时，τ_F等于33.0120，大于α＝0.05时F分布的临界值3.1504，因此拒绝所有对比方法都有相同性能的假设，需要继续进行 Nemenyi后续检验。临界值域(Critical Difference，简称CD)的计算公式如下：

其中，当α＝0.05、k＝3且D＝31时，q_α＝2.344，CD＝0.5954。

图10是Friedman检验图，其中蓝线的长度等于CD值，红点代表各种方法的平均序值。如果两种对比方法的分类性能明显不同，则相应的平均序值至少相差一个CD值。可以看出，本发明提出的DDL-CNN/TDL-CNN网络要显著优于传统的CNN网络。

图11进一步展示了利用一种叫做t分布随机邻域嵌入(t-sne)的降维技术来可视化所有对比方法由倒数第二层提取出的特征。可以看出，与传统CNN相比，在额外考虑了区分性特征学习后，DDL-CNN/TDL-CNN使得不同类别更具有区分性，进一步证明了所提方法的有效性。

Claims

1.一种超声速进气道流动状态的监测方法，其特征在于，包括如下步骤：

步骤1，在超声速进气道的内部流道上布置若干个传感器，分别采集各传感器的动态压力信号，经过切分后得到不同流动状态下的样本；

步骤2，利用连续小波变换对分别对每个传感器的样本进行时频分析，得到对应的时频谱图，然后将其划分成训练集、验证集和测试集；

步骤3，利用步骤2得到的各传感器的训练集分别训练DDL-CNN/TDL-CNN网络，并利用验证集选择最佳超参数；

2.根据权利要求1所述的超声速进气道流动状态监测方法，其特征在于，所述步骤1中，利用固定时长的滑动窗口对各传感器采集到的动态压力信号进行切分，得到不同流动状态下的样本。

3.根据权利要求1所述的超声速进气道流动状态监测方法，其特征在于，所述步骤2中，利用连续小波变换将一维时间信号转变为二维时频谱图，使得可以同时在时域和频域上揭示原始信号的本质特征。

4.根据权利要求1所述的超声速进气道流动状态监测方法，其特征在于，所述步骤3中，DDL-CNN/TDL-CNN网络在训练阶段分别同时接受两个/三个样本作为输入，训练目标同时考虑了分类性能以及输入样本特征之间的区分性。

5.根据权利要求1所述的超声速进气道流动状态监测方法，其特征在于，所述步骤3中，DDL-CNN/TDL-CNN网络模型的训练步骤包括：

步骤2.1，初始化网络参数，包括DDL-CNN/TDL-CNN倒数第二层之前的所有参数{θ}以及输出层的权重和偏置{W_j,b_j}；其中，W_j是倒数第二层和输出层第j个节点之间的权重，b_j是输出层第j个节点的偏置；

步骤2.2，利用式(1)-(2)分别计算倒数第二层和输出层的输出；

f_i＝g(X_i|θ) (1)

z_ij＝W_j ^Tf_i+b_j (2)

其中，X_i表示第i个训练样本，g(·|θ)表示从输入层到倒数第二层之间的映射关系，f_i表示第i个训练样本在倒数第二层处的输出，也可认为是由卷积模块提取出的特征，z_ij是输出层第j个节点的输出；

步骤2.3，利用式(3)-(4)分别计算对输出层施加Softmax后的输出以及交叉熵损失；

其中，y_ij和

分别表示X_i属于第j类的真实概率和预测概率，

步骤2.4，计算DDL-CNN的总损失；

步骤2.5：计算TDL-CNN的总损失；

步骤2.6，利用基于梯度的优化算法对网络参数进行更新。

6.根据权利要求5所述的超声速进气道流动状态监测方法，其特征在于，步骤2.4的具体步骤包括：

DDL-CNN不仅需要将输入的两个样本X_i1和X_i2分类正确，同时需要确保在经由卷积模块映射后的特征空间里，若X_i1和X_i2来自于同一类，则它们应该较为接近，否则应该相互远离；因此，DDL-CNN的总损失由两部分组成，如式(5)所示：

其中，

表示对输入的两个样本进行分类的平均交叉熵损失，

表示是否正确判断来自同一类或不同类的损失，ρ是

和

之间的权重系数，

的计算如式(6)所示；

其中，Y_i1,j表示X_i1属于第j类的真实概率，

表示X_i1属于第j类的真实概率，z_i1,j表示未进入Softmax层之前输出层的线性输出；

表示是否正确判断来自同一类或不同类的损失，即

需要确保输入的两个样本在特征空间满足特定的距离关系：若两个样本来自同一类，则它们在特征空间里的距离应该较小，否则应该较大，如式(7)所示：

其中，δ表示两个样本之间的基准距离，Δ代表两个样本之间的间隔；

如果对于来自同一类的两个样本有h_i,12＝-1，对于来自不同类的样本有h_i,12＝+1，那么式(7)可写成一个与支持向量机类似的限制条件；

其中，

且

d_i,12＝,g(X_i1|θ′)-g(X_i2|θ′)]^T,g(X_i1|θ′)-g(X_i2|θ′)]是由卷积模块提取的特征之间的距离；θ′是θ除以

后的参数，代表两个样本之间归一化后的距离；

因此，

可写成与支持向量机类似的损失函数；

最终，DDL-CNN的总损失可由式(10)计算；

s.t.h_i,12(d_i,12+β)≥1-λ_i,

如果令

则式(10)可进一步写成式(11)；

s.t.h_i,12(d_i,12+β)≥1-λ_i,

其中，C′＝ρC，且

表示预测概率；C和C′代表两个损失项之间的权重系数；

为了更新(θ′,u_j,b_j,β)，将式(11)转化成无限制条件的优化问题，如式(12)所示，然后再利用基于梯度的优化算法进行更新；

其中，

表示一组新的权重参数；

在更新参数之前，利用式(13)-(16)计算

关于(θ′,u_j,b_j,β)的导数；

关于β的导数计算如式(13)所示；

其中，II{·}是指示函数；

关于b_j的导数计算如式(14)所示；

关于u_j的导数计算如式(15)所示；

关于θ′的导数计算如式(16)所示；

其中，

是g(X_i1|θ′)/g(X_i2|θ′)关于θ′的雅克比矩阵。

7.根据权利要求6所述的超声速进气道流动状态监测方法，其特征在于，步骤2.5的具体步骤包括：

TDL-CNN不仅需要将输入的三个样本X_i1、X_i2和X_i3分类正确，其中，X_i1和X_i2来自同一类，但X_i1和X_i3来自不同类，同时需要确保在经由卷积模块映射后的特征空间里，X_i1和X_i3之间的距离应该大于X_i1和X_i2之间的距离；

因此，TDL-CNN的总损失也由两部分组成，如式(17)所示；

其中，

表示对输入的三个样本进行分类的平均交叉熵损失，如式(6)所示；

需要确保输入的三个样本在特征空间满足特定的距离关系：不同类样本之间的距离应该要大于同一类样本之间的距离，如式(19)所示；

式(19)与支持向量机的限制条件较为相似；因此，

也可写成与支持向量机类似的损失函数；

最终，TDL-CNN的总损失可由式(21)计算；

s.t.d_i,13-d_i,12≥1-λ_i,

如果令

则式(21)可进一步写成式(22)；

s.t.d_i,13-d_i,12≥1-λ_i,

为了更新(θ′,u_j,b_j)，将式(22)转化成无限制条件的优化问题，如式(23)所示，然后再利用基于梯度的优化算法进行更新；

在更新参数之前，利用式(13)-(16)计算

关于(θ′,u_j,b_j)的导数；

关于b_j的导数计算如式(24)所示；

关于u_j的导数计算如式(25)所示；

关于θ′的导数计算如式(26)所示；

其中，

是g(X_i1|θ′)/g(X_i2|θ′)/g(X_i3|θ′)关于θ′的雅克比矩阵。