CN112836428B - 一种用于诊断航空发动机锥齿轮故障的深度网络构建方法 - Google Patents

一种用于诊断航空发动机锥齿轮故障的深度网络构建方法 Download PDF

Info

Publication number
CN112836428B
CN112836428B CN202110101521.6A CN202110101521A CN112836428B CN 112836428 B CN112836428 B CN 112836428B CN 202110101521 A CN202110101521 A CN 202110101521A CN 112836428 B CN112836428 B CN 112836428B
Authority
CN
China
Prior art keywords
network
training
distribution
candidate
network architecture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110101521.6A
Other languages
English (en)
Other versions
CN112836428A (zh
Inventor
严如强
周峥
李天福
张子泷
赵志斌
孙闯
陈雪峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN202110101521.6A priority Critical patent/CN112836428B/zh
Publication of CN112836428A publication Critical patent/CN112836428A/zh
Application granted granted Critical
Publication of CN112836428B publication Critical patent/CN112836428B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/04Constraint-based CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
  • Complex Calculations (AREA)

Abstract

本公开揭示了一种用于诊断航空发动机锥齿轮故障的深度网络构建方法,包括:采集航空发动机锥齿轮振动信号并划分为训练集Dtrain、验证集Dvalid和测试集Dtest;构建网络搜索空间O,根据搜索空间O构造超网络H(w),基于训练集Dtrain并采用两种掩码矩阵Mask依次对超网络H(w)中的含参算子OP5‑8进行预热训练和对超网络H(w)进行解耦训练,得到优化后的超网络H(w*);基于优化后的超网络H(w*)构造可微性能评估器Λ,利用变分推断对评估器Λ进行优化获得优化后的变分后验分布族,并采样获得候选网络架构集合Set;利用训练集Dtrain和验证集Dvalid对所述候选网络架构集合Set中的网络架构重新训练,并在测试集Dtest上按照测试准确率从大到小排序,将测试准确率最高的网络架构作为最优的故障诊断深度网络架构。

Description

一种用于诊断航空发动机锥齿轮故障的深度网络构建方法
技术领域
本公开属于航空发动机故障诊断技术领域,具体涉及一种用于诊断航空发动机锥齿轮故障的深度网络构建方法。
背景技术
附件锥齿轮作为航空发动机传动系统的重要部件之一,其健康状态对航空发动机的运行可靠性评估十分关键。如今,随着机械故障诊断的智能化,深度网络在构建状态映射模型中占据了主导地位。在指定部件数据域的情况下,通过手工调整网络架构,特定的故障诊断任务可以被很好地解决。但域差异问题普遍存在于现实场景中,在多变环境下工作的航空发动机传动系统尤其如此。航空发动机传动系统部件众多、工作环境多变,其每个部件的数据域往往不一致,并很容易在多变环境下发生偏移。因此,针对每个部件数据域设计匹配的故障诊断模型是一种自然的策略。
虽然深度网络实现了特征工程的自动化,使得诊断模型可以从给定数据域中提取相应的特征,但特征质量受到了网络架构的影响,同一种网络架构很难在多个数据域下取得最佳的性能。而人工为每个数据域设计匹配的诊断模型十分耗时耗力,深度网络的架构参数是复杂的、离散的、无序的超参数,需要从多个维度进行调整,整个网络的设计空间十分庞大,其设计是一个不断试错的优化过程,采用人工手段为每个数据域设计匹配的诊断网络一般不具有可行性。
在背景技术部分中公开的上述信息仅仅用于增强对本发明背景的理解,因此可能包含不构成在本国中本领域普通技术人员公知的现有技术的信息。
发明内容
针对现有技术中的不足,本公开的目的在于提供一种用于诊断航空发动机锥齿轮故障的深度网络构建方法,能够为每个部件数据域自动设计与之匹配的诊断网络。
为实现上述目的,本公开提供以下技术方案:
一种用于诊断航空发动机锥齿轮故障的深度网络构建方法,包括如下步骤:
S100:采集航空发动机锥齿轮振动信号并划分为训练集Dtrain、验证集Dvalid和测试集Dtest
S200:构建网络搜索空间O,根据网络搜索空间O构造超网络H(w),基于训练集Dtrain并采用两种掩码矩阵Mask依次对超网络H(w)中的含参算子OP5-8进行预热训练和对超网络H(w)进行解耦训练,得到优化后的超网络H(w*);
S300:基于优化后的超网络H(w*)构造基于变分后验分布族的可微性能评估器Λ,利用变分推断对可微性能评估器Λ进行优化,获得优化后的变分后验分布族,并对优化后的变分后验分布族通过采样获得候选网络架构集合Set;
S400:利用训练集Dtrain和验证集Dvalid对所述候选网络架构集合Set中的网络架构重新训练,并在测试集Dtest上按照测试准确率从大到小排序,将测试准确率最高的网络架构作为最优的航空发动机锥齿轮故障诊断深度网络架构。
优选的,步骤S200中,所述超网络H(w)表示为:
Figure BDA0002914153350000021
其中,OP1-4为网络搜索空间O中的非参算子,OP5-8为含参算子;系数矩阵A共有14行8列,每一行都代表超网络H(w)中的一条混合运算边,每一行中的8个值α1...α8分别为组成该条混合边的8种算子的系数,系数均设置为1;
Figure BDA0002914153350000022
代表系数矩阵A在搜索空间O上的作用,x为模型输入,w为含参算子的参数;网络搜索空间O={置零,最大池化,平均池化,残差连接,卷积核大小为3的分离卷积,卷积核大小为5的分离卷积,卷积核大小为3的扩张卷积,卷积核大小为5的扩张卷积}。
优选的,步骤S200中,对超网络H(w)中的含参算子OP5-8进行预热训练通过以下方式进行:将Mask矩阵中{βi j,j=1,2…14,for i in[5,6,7,8]}设置为1,Mask矩阵的其他值设置为0;
对超网络H(w)进行解耦训练通过以下方式进行:Mask矩阵中的每一个值服从参数为p的伯努利分布,每个值以概率p设置为0,以概率1-p设置为1。
优选的,步骤S200中,所述优化后的超网络H(w*)表示为:
H(w*)=arg minwLtrain(w)
其中,Ltrain(w)为交叉熵损失函数,w为在超网络中的网络参数,w*为在超网络中优化后的网络参数。
优选的,步骤S300中,所述可微性能评估器Λ包括112个变分后验分布,即{Λi,i=1,2…112},其中,每一个变分后验分布设置为参数为θi的高斯分布。
优选的,步骤S300中,利用变分推断对可微性能评估器Λ进行优化包括如下步骤:
S301:通过重参数方法对可微性能评估器Λ中的变分后验分布进行初始化;
S302:利用初始化后的变分后验分布近似真实后验分布,并通过计算KL散度对初始化后的变分后验分布和真实后验分布的距离进行最小化,从而实现可微性能评估器Λ的变分推断优化;
S303:采用双峰先验分布P(Λ)对步骤S301和步骤S302进行软约束。
优选的,步骤S301包括如下步骤:
S3011:将评估器Λ中的每个变分后验分布设置为参数θ=(μ,σ)的标准高斯分布,其中,μ为高斯分布的均值,高斯分布的标准差σ为log(1+exp(ρ));
S3012:从标准高斯分布中采样出单点ε,进行变换得到变分后验的采样
Figure BDA0002914153350000031
其中,
Figure BDA0002914153350000032
为点乘。
优选的,步骤S302中,KL散度的计算公式如下:
Figure BDA0002914153350000041
其中,P(Λ)为Λ的先验分布,q(Λ|θ)为变分后验分布,P(Dvalid,H(w*)|Λ)为似然,P(Λ|Dvalid,H(w*)为真实后验分布,P(Dvalid,H(w*))为归一化常数。
优选的,步骤S300中,对优化后的变分后验分布族通过采样获得候选网络架构集合Set是指:从变分推断优化后的后验分布族中随机采样得到N个候选网络架构,按照验证准确率和稀疏度从大到小排序,选择验证准确率为前a%的候选网络架构作为备选,然后根据稀疏度从a%*N个候选网络架构中选择前b%个候选网络架构作为候选网络架构集合Set。
优选的,步骤S400中,对所述候选网络架构集合Set中的网络架构重新训练是指:将训练集Dtrain和验证集Dvalid拼接后作为新的训练集输入至候选网络架构集合Set中,对每个候选子网络进行重新训练。
与现有技术相比,本公开带来的有益效果为:本公开能够高效地实现航空发动机锥齿轮故障诊断深度网络的自动化设计,能提高锥齿轮故障诊断准确率,减少多域诊断模型设计的人力物力,无需人为进行深度网络的架构工程。
附图说明
图1是本公开一个实施例提供一种用于诊断航空发动机锥齿轮故障的深度网络构建方法流程图;
图2是本公开另一个实施例提供的采用预热训练和解耦训练对超网络表示能力的影响示意图;
图3是本公开另一个实施例提供的双峰先验分布的示意图;
图4是本公开另一个实施例提供的多种模型在不同噪声水平下诊断准确率的示意图;
图5是本公开另一个实施例提供的架构集合诊断准确率的示意图;
图6是本公开另一个实施例提供的稀疏度对候选网络选择影响的示意图。
具体实施方式
下面将参照附图1至图6详细地描述本公开的具体实施例。虽然附图中显示了本公开的具体实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为一开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本公开的保护范围当视所附权利要求所界定者为准。
为便于对本公开实施例的理解,下面将结合附图以具体实施例为例做进一步的解释说明,且各个附图并不构成对本公开实施例的限定。
一个实施例中,如图1所示,一种用于诊断航空发动机锥齿轮故障的深度网络构建方法,包括如下步骤:
S100:采集航空发动机锥齿轮振动信号,并将所述信号划分为训练集Dtrain、验证集Dvalid和测试集Dtest
该步骤中,将所采集的航空发动机锥齿轮振动信号依照测量时间先后和占比信号长度1∶1∶1依次划分为训练集
Figure BDA0002914153350000051
验证集、
Figure BDA0002914153350000052
和测试集
Figure BDA0002914153350000053
其中,xi为单个输入样本,yi为样本对应的标签,Ntrain、Nvalid和Ntest分别是训练集、验证集和测试集的样本数量。
S200:构建网络搜索空间O,根据搜索空间O构造超网络H(w),基于训练集Dtrain并采用两种掩码矩阵Mask依次对超网络H(w)中的含参算子OP5-8进行预热训练和对超网络H(w)进行解耦训练,得到优化后的超网络H(w*);
该步骤中,两种掩码矩阵Mask表示为:
Figure BDA0002914153350000061
其中,Mask矩阵共有14行8列,每一行都代表超网络H(w)中的一条混合运算边,每一行中的8个值β1...β8分别为组成该条混合边的8种算子的系数,Mask矩阵中的每个元素βi j为0或1,0表示将对应的算子输出置零并冻结其梯度更新,1表示正常训练该算子。
S300:基于优化后的超网络H(w*)构造基于变分后验分布族的可微性能评估器Λ,利用变分推断对可微性能评估器Λ进行优化,获得优化后的变分后验分布族,并从优化后的变分后验分布族中采样获得候选网络架构集合Set;
该步骤中,之所以利用变分推断对可微性能评估器Λ进行优化,原因在于:由于可微性能评估器Λ中是一个一个的分布,在无法知道真实后验分布形式的时候,无法用梯度的方法来更新分布的参数,于是假设每个分布都是高斯分布,高斯分布由均值和方差决定,只要优化“均值和方差”就能更新分布。于是先初始化一些均值和方差都已知的高斯分布(称为变分后验分布),然后通过KL散度来最小化变分后验分布和真实后验分布的距离。
S400:利用训练集Dtrain和验证集Dvalid对所述候选网络架构集合Set中的网络架构重新训练,并在测试集Dtest上按照测试准确率从大到小排序,将测试准确率最高的网络架构作为最优的故障诊断深度网络架构。
该步骤中,测试准确率定义为:在测试集上正确分类的样本数除以总样本数,具体公式表示为:
Figure BDA0002914153350000071
其中1[·]为示性函数,括号内的成立则为1,不成立则为0;
Figure BDA0002914153350000072
为预测的第i个样本类别,yi为真实的第i个样本类别,M为诊断数据集的样本数。
本公开实现了一种新型的神经架构搜索技术,通过构造超网络和可微性能评估器实现了深度网络的高效自动化设计,其中,超网络为候选网络提供了性能代理,而评估器将候选网络的搜索过程自动化,进一步的,评估器的可微特性将离散的搜索过程降级为连续的优化问题,提高了自动化的效率。
另一个实施例中,步骤S200中,所述超网络H(w)表示为:
Figure BDA0002914153350000073
其中,OP1-4为网络搜索空间O中的非参算子,OP5-8为含参算子;系数矩阵A共有14行8列,每一行都代表超网络H(w)中的一条混合运算边,每一行中的8个值α1...α8分别为组成该条混合边的8种算子的系数,系数均设置为1;
Figure BDA0002914153350000074
代表系数矩阵A在搜索空间O上的作用,x为模型输入,w为含参算子的参数;网络搜索空间O={置零,最大池化,平均池化,残差连接,卷积核大小为3的分离卷积,卷积核大小为5的分离卷积,卷积核大小为3的扩张卷积,卷积核大小为5的扩张卷积}。
另一个实施例中,步骤S200中,对超网络H(w)中的含参算子OP5-8进行预热训练通过以下方式进行:将Mask矩阵中{βi j,j=1,2…14,for i in[5,6,7,8]}设置为1,Mask矩阵的其他值设置为0;
对超网络H(w)进行解耦训练通过以下方式进行:Mask矩阵中的每一个值服从参数为p的伯努利分布,每个值以概率p设置为0,以概率1-p设置为1。
本实施例中,伯努利分布的参数设置为0.2,即Mask矩阵的每个值以0.2的概率设置为0,以0.8的概率设置为1。
需要了解,通过预热训练能够增强随机初始化的含参算子的特征表达能力;通过解耦训练能够缓解超网络中多种算子的自适应优化问题。
另一个实施例中,步骤S200中,所述优化后的超网络H(w*)表示为:
H(w*)=arg minw Ltrain(w)
其中,Ltrain(w)为交叉熵损失函数,w为在超网络中的网络参数,w*为在超网络中优化后的网络参数。
另一个实施例中,步骤S300中,所述可微性能评估器包括112个变分后验分布,即{Λi,i=1,2…112},其中,每一个后验分布设置为参数为θi的高斯分布。
另一个实施例中,步骤S300中,利用变分推断对可微性能评估器Λ进行优化包括如下步骤:
S301:通过重参数方法对可微性能评估器Λ中的变分后验分布进行初始化;
S302:利用初始化后的变分后验分布近似真实后验分布,并通过计算KL散度对初始化后的变分后验分布和真实后验分布的距离进行最小化,从而实现可微性能评估器Λ的变分推断优化;
S303:采用双峰先验分布P(Λ)对步骤S301和步骤S302进行软约束。
本实施例中,采用双峰先验分布P(Λ)对步骤S301和S302进行软约束通过以下方式进行:将P(Λ)设置为两个高斯分布的比例混合,定义为:
Figure BDA0002914153350000081
其中,N(Λi|μ,σ2)为均值为μ、方差为σ2的高斯分布在点Λi的概率密度,λ决定双峰高度的比例,μ1
Figure BDA0002914153350000083
μ2
Figure BDA0002914153350000082
分别是两个高斯分布的均值和方差。
通过软约束,能够让可微性能评估器Λ中的112个分布的均值能近似服从双峰分布,即112个分布被近似划分为两部分,一部分均值在左峰,另一部分在右峰。
另一个实施例中,步骤S301包括如下步骤:
S3011:将评估器Λ中的每个变分后验分布设置为参数θ=(μ,σ)的标准高斯分布,其中,μ为高斯分布的均值,高斯分布的标准差σ为log(1+exp(ρ));
S3012:从标准高斯分布中采样出单点ε,进行变换得到变分后验的采样
Figure BDA0002914153350000093
其中,
Figure BDA0002914153350000094
为点乘。
本实施例中,每次采样的评估器作用在超网络上可以表示为:
Figure BDA0002914153350000091
另一个实施例中,步骤S302中,KL散度的计算公式如下:
Figure BDA0002914153350000092
其中,P(Λ)为Λ的先验分布,q(Λ|θ)为变分后验分布,P(Dvalid,H(w*)|Λ)为似然,P(Λ|Dvalid,H(w*)为真实后验分布,P(Dvalid,H(w*))为归一化常数。
本实施例中,为了允许更灵活的先验和变分后验的组合,对KL散度计算公式进行近似,其近似表达式为:
Figure BDA0002914153350000101
另一个实施例中,步骤S300中,对优化后的变分后验分布族通过采样获得候选网络架构集合Set是指:从变分推断优化后的后验分布族中随机采样得到N个候选网络架构,按照验证准确率和稀疏度从大到小排序,选择验证准确率为前a%的候选网络架构作为备选,然后根据稀疏度从a%*N个候选网络架构中选择前b%个候选网络架构作为候选网络架构集合Set。
本实施例中,先随机采样N个候选网络架构,按照验证准确率和稀疏度从大到小排序。首先,按照验证准确率选择前a%个候选网络架构,再按照稀疏度从a%*N个候选网络架构中选择前b%个候选网络,构成候选集合Set,则该集合中共有b%*a%*N个候选网络架构。
需要说明的是,上述实施例中,稀疏度表示为:
Figure BDA0002914153350000102
其中,n为评估器中变分后验分布的个数,
Figure BDA0002914153350000103
为从评估器中的采样值,
Figure BDA0002914153350000104
为从第i个分布中的采样值。
还需要说明的是,上述实施例中,验证准确率定义为:在验证集上正确分类的样本数除以总样本数,N值的选择应该满足统计意义,a值和b值的选择需考虑计算资源的限制。
示例性的,总采样架构的个数N设置为2000,以充分满足统计意义;在认为具备高验证准确率的网络在测试阶段的准确率同样高的前提假设下,根据经验以及考虑到计算资源的限制,a的值不能太大,设置为2.5,即从2000个模型中按照高验证准确率选择前2.5%个网络架构,共50个;同样在计算资源的限制下,b的值设置为20,即从50个模型中按照高稀疏度选择前20%个网络架构,共10个。
另一个实施例中,步骤S400中,对所述候选网络架构集合Set中的网络架构重新训练是指:将训练集Dtrain和验证集Dvalid拼接后作为新的训练集输入至候选网络架构集合Set中,对每个候选子网络进行重新训练。
下面结合图2至图4对本公开的技术方案进行进一步描述。
在某航空发动机锥齿轮故障测试试验台上设置四组不同状态的锥齿轮实验,每组分别在5种转速下运行,同一状态下的数据共享同一个分类标签,数据集如表1所示。
表1
Figure BDA0002914153350000111
其中,振动信号在多变的环境中易受不同噪声水平的影响,因此,不同分贝的高斯噪声被加入到原始振动信号中模拟多域问题,公式为
Figure BDA0002914153350000112
其中Psignal是原始信号的功率,Pnoise是噪声的功率,共设置了五组噪声分贝,分别是{-10dB,-5dB,0dB,5dB,10dB}。
图2是采用预热训练和解耦训练对超网络表示能力的影响示意图。在噪声水平为0dB的情况下,分别采用普通训练、解耦训练和预热训练+解耦训练三种策略训练超网络;随后分别优化对应的贝叶斯可微评估器,从优化后的评估器分布中随机采样2000个候选架构,分别绘制其验证准确率分布的核密度估计图。由图2可以看到,预热训练和解耦训练可以显著提高超网络的表示能力。
图3是双峰先验分布的示意图。双峰先验分布的参数{λ,μ1,σ1,μ2,σ2}分别设置为{0.8,0.1,0.3,0.03,0.05},变分后验分布初始化为均值为0.2,标准差为log(1+exp(-4))的高斯分布。为了避免KL散度在计算时为0,初始化的变分后验分布与双峰先验分布需有重叠部分。如图3所示,在最小化变分后验分布和双峰先验分布的KL散度的情况下,初始化的112个变分后验分布中的大部分会向双峰先验分布中的高峰移动,少部分会向低峰移动。
图4是关于多种模型在不同噪声水平下诊断准确率的示意图。BDAS为本公开提出的诊断模型自动化搭建方法,DARTS为可微神经架构搜索方法,Inception、ResNet18、VGG11和DCNN为四种主流的人工设计深度网络。由图4可以看出,BDAS在噪声为-10分贝的情况下的诊断准确率比DCNN高19.09%,比DARTS高4.44%;随着噪声分贝数的增大,BDAS的准确率下降速度比其他5种方法都要慢,从而说明本公开所提出的方案对噪声是鲁棒的,同时也说明了所提出的方案具有普遍适用性。
图5是架构集合诊断准确率的示意图。如图5所示,五角星为最佳的域匹配诊断模型测试准确率,方块为DARTS的测试准确率,箱线图为候选架构集合的测试准确率分布示意图。由图5可以看出,在六种噪声情况下,方块的位置都落在箱线图内部,这说明了本方法能显著提高可微神经架构搜索方法的性能;方块与五角星的距离越远,意味着本方法获得的候选架构集合中包含越多优于DARTS的深度网络结构;对架构集合按照诊断准确率从高到底进行排序,将诊断准确率最高的深度网络架构作为最终的结果,其最高诊断准确率如图5中的五角星所示。
图6是关于稀疏度对候选网络选择影响的示意图。为了获得候选架构集合,本实施例经历了两次排序和选择。先从优化后的评估器分布中采样了2000个候选架构,按照验证准确率从大到小排序,出于计算资源的限制,选择前50个候选架构;再按照稀疏度对这50个架构排序,出于计算资源的限制,选择前10个候选架构作为最后的搜索集合。图中的五边形为具有最高验证准确率的架构,三角形为搜索集合,方块为搜索集合中具有最高测试准确率的架构。图6中各五边形和方块的测试准确率和稀疏度如表2所示:
表2
Figure BDA0002914153350000121
Figure BDA0002914153350000131
由表2可知,在六种噪声情况下,具有最高验证准确率的网络架构的测试准确率没有经过稀疏度选择的网络架构高,一个平衡了验证准确率和稀疏度的网络在测试阶段的表现更好。
以上仅为本公开较佳的实施例,并非因此限制本公开的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本公开说明书内容做出的等同替换和显而易见的变化所得到的方案,均应当包含在本公开的保护范围内。

Claims (10)

1.一种用于诊断航空发动机锥齿轮故障的深度网络构建方法,包括如下步骤:
S100:采集航空发动机锥齿轮振动信号并划分为训练集Dtrain、验证集Dvalid和测试集Dtest
S200:构建网络搜索空间O,根据网络搜索空间O构造超网络H(w),基于训练集Dtrain并采用两种掩码矩阵Mask依次对超网络H(w)中的含参算子OP5-8进行预热训练和对超网络H(w)进行解耦训练,得到优化后的超网络H(w*);
S300:基于优化后的超网络H(w*)构造基于变分后验分布族的可微性能评估器Λ,利用变分推断对可微性能评估器Λ进行优化,获得优化后的变分后验分布族,并对优化后的变分后验分布族通过采样获得候选网络架构集合Set;
S400:利用训练集Dtrain和验证集Dvalid对所述候选网络架构集合Set中的网络架构重新训练,并在测试集Dtest上按照测试准确率从大到小排序,将测试准确率最高的网络架构作为最优的航空发动机锥齿轮故障诊断深度网络架构。
2.根据权利要求1所述的方法,其中,优选的,步骤S200中,所述超网络H(w)表示为:
Figure FDA0002914153340000011
其中,OP1-4为网络搜索空间O中的非参算子,OP5-8为含参算子;系数矩阵A共有14行8列,每一行都代表超网络H(w)中的一条混合运算边,每一行中的8个值α1...α8分别为组成该条混合边的8种算子的系数,系数均设置为1;
Figure FDA0002914153340000012
代表系数矩阵A在搜索空间O上的作用,x为模型输入,w为含参算子的参数;网络搜索空间O={置零,最大池化,平均池化,残差连接,卷积核大小为3的分离卷积,卷积核大小为5的分离卷积,卷积核大小为3的扩张卷积,卷积核大小为5的扩张卷积}。
3.根据权利要求1所述的方法,其中,步骤S200中,对超网络H(w)中的含参算OP5-8进行预热训练通过以下方式进行:将Mask矩阵
Figure FDA0002914153340000021
设置为1,Mask矩阵的其他值设置为0;
对超网络H(w)进行解耦训练通过以下方式进行:Mask矩阵中的每一个值服从参数为p的伯努利分布,每个值以概率p设置为0,以概率1-p设置为1。
4.根据权利要求1所述的方法,其中,步骤S200中,所述优化后的超网络H(w*)表示为:
H(w*)=arg minwLtrain(w)
其中,Ltrain(w)为交叉熵损失函数,w为在超网络中的网络参数,w*为在超网络中优化后的网络参数。
5.根据权利要求1所述的方法,其中,步骤S300中,所述可微性能评估器Λ包括112个变分后验分布,即{Λi,i=1,2…112},其中,每一个变分后验分布设置为参数为θi的高斯分布。
6.根据权利要求1所述的方法,其中,步骤S300中,利用变分推断对可微性能评估器Λ进行优化包括如下步骤:
S301:通过重参数方法对可微性能评估器Λ中的变分后验分布进行初始化;
S302:利用初始化后的变分后验分布近似真实后验分布,并通过计算KL散度对初始化后的变分后验分布和真实后验分布的距离进行最小化,从而实现可微性能评估器Λ的变分推断优化;
S303:采用双峰先验分布P(Λ)对步骤S302进行软约束。
7.根据权利要求6所述的方法,其中,步骤S301包括如下步骤:
S3011:将评估器Λ中的每个变分后验分布设置为参数θ=(μ,σ)的标准高斯分布,其中,μ为高斯分布的均值,高斯分布的标准差σ为log(1+exp(ρ));
S3012:从标准高斯分布中采样出单点ε,进行变换得到变分后验的采样
Figure FDA0002914153340000031
其中,
Figure FDA0002914153340000032
为点乘。
8.根据权利要求6所述的方法,其中,步骤S302中,KL散度的计算公式如下:
Figure FDA0002914153340000033
其中,P(Λ)为Λ的先验分布,q(Λ|θ)为变分后验分布,P(Dvalid,H(w*)|Λ)为似然,P(Λ|Dvalid,H(w*)为真实后验分布,P(Dvalid,H(w*))为归一化常数。
9.根据权利要求1所述的方法,其中,步骤S300中,对优化后的变分后验分布族通过采样获得候选网络架构集合Set是指:从变分推断优化后的后验分布族中随机采样得到N个候选网络架构,按照验证准确率和稀疏度从大到小排序,选择验证准确率为前a%的候选网络架构作为备选,然后根据稀疏度从a%*N个候选网络架构中选择前b%个候选网络架构作为候选网络架构集合Set。
10.根据权利要求1所述的方法,其中,步骤S400中,对所述候选网络架构集合Set中的网络架构重新训练是指:将训练集Dtrain和验证集Dvalid拼接后作为新的训练集输入至候选网络架构集合Set中,对每个候选子网络进行重新训练。
CN202110101521.6A 2021-01-25 2021-01-25 一种用于诊断航空发动机锥齿轮故障的深度网络构建方法 Active CN112836428B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110101521.6A CN112836428B (zh) 2021-01-25 2021-01-25 一种用于诊断航空发动机锥齿轮故障的深度网络构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110101521.6A CN112836428B (zh) 2021-01-25 2021-01-25 一种用于诊断航空发动机锥齿轮故障的深度网络构建方法

Publications (2)

Publication Number Publication Date
CN112836428A CN112836428A (zh) 2021-05-25
CN112836428B true CN112836428B (zh) 2022-12-06

Family

ID=75931540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110101521.6A Active CN112836428B (zh) 2021-01-25 2021-01-25 一种用于诊断航空发动机锥齿轮故障的深度网络构建方法

Country Status (1)

Country Link
CN (1) CN112836428B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108519768A (zh) * 2018-03-26 2018-09-11 华中科技大学 一种基于深度学习和信号分析的故障诊断方法
CN111860495A (zh) * 2020-06-19 2020-10-30 上海交通大学 一种层级化网络结构搜索方法、设备及可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108519768A (zh) * 2018-03-26 2018-09-11 华中科技大学 一种基于深度学习和信号分析的故障诊断方法
CN111860495A (zh) * 2020-06-19 2020-10-30 上海交通大学 一种层级化网络结构搜索方法、设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度卷积变分自编码网络的故障诊断方法;佘博等;《仪器仪表学报》;20181015(第10期);全文 *

Also Published As

Publication number Publication date
CN112836428A (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN109086799A (zh) 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
US20040216004A1 (en) Fault diagnosis
CN111810124B (zh) 一种基于特征重标定残差卷积神经网络模型的抽油机井故障诊断方法
CN109165159B (zh) 一种基于程序频谱的多缺陷定位方法
CN110647830A (zh) 基于卷积神经网络和高斯混合模型的轴承故障诊断方法
CN108563791A (zh) 一种建筑质量投诉文本分类的方法和系统
CN111042928A (zh) 一种基于动态神经网络的变循环发动机智能控制方法
CN110082738B (zh) 基于高斯混合和张量循环神经网络的雷达目标识别方法
CN112395777B (zh) 基于汽车尾气排放模拟环境的发动机标定参数寻优方法
CN115062648B (zh) 一种旋转机械故障诊断方法、系统、装置及存储介质
CN113095179A (zh) 元度量学习驱动的直升机行星齿轮箱故障诊断方法
CN115935277A (zh) 基于小样本学习的增压锅炉故障诊断方法及故障诊断模型的训练方法和测试方法
CN113591553A (zh) 一种基于小样本权值优化的涡轮泵迁移学习故障智能判定方法
CN112836428B (zh) 一种用于诊断航空发动机锥齿轮故障的深度网络构建方法
Zhou et al. Differentiable architecture search for aeroengine bevel gear fault diagnosis
CN114792126A (zh) 一种基于遗传算法的卷积神经网络设计方法
CN108428012B (zh) 一种优化神经网络的风机噪音预测方法
CN113469252A (zh) 一种考虑不平衡样本的特高压换流阀运行状态评估方法
CN113011091A (zh) 一种自动分组的多尺度轻量型深度卷积神经网络优化方法
CN112146880A (zh) 一种对不同转速下滚动轴承内部结构故障的智能化诊断方法
CN116502696A (zh) 基于联邦学习和模型剪枝的滚动轴承剩余寿命预测方法
CN111309973A (zh) 基于改进马尔可夫模型和改进k最近邻的缺失值填补方法
CN103714385B (zh) 一种基于改进型克隆选择算法的模拟电路故障诊断方法
CN113591625B (zh) 一种不平衡样本重要性加权的齿轮箱故障诊断方法
CN111474905B (zh) 一种机电产品制造过程参数漂移故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant