CN114897292B - 基于多尺度残差卷积变分网络故障诊断方法和诊断系统 - Google Patents
基于多尺度残差卷积变分网络故障诊断方法和诊断系统 Download PDFInfo
- Publication number
- CN114897292B CN114897292B CN202210317326.1A CN202210317326A CN114897292B CN 114897292 B CN114897292 B CN 114897292B CN 202210317326 A CN202210317326 A CN 202210317326A CN 114897292 B CN114897292 B CN 114897292B
- Authority
- CN
- China
- Prior art keywords
- residual
- module
- scale
- convolution
- network model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 52
- 238000012360 testing method Methods 0.000 claims abstract description 38
- 230000001133 acceleration Effects 0.000 claims abstract description 25
- 239000013598 vector Substances 0.000 claims abstract description 21
- 230000005540 biological transmission Effects 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 26
- 230000004913 activation Effects 0.000 claims description 15
- 238000012952 Resampling Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 6
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000013136 deep learning model Methods 0.000 description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241001391944 Commicarpus scandens Species 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明公开了一种基于多尺度残差卷积变分网络故障诊断方法和诊断系统,包括:获取针对机械设备不同传递系统故障的加速度数据,并随机划分为训练样本和测试样本;由至少3个残差卷积变分模块并行学习串接,对每个残差卷积变分模块输出特征向量进行汇总形成总的特征向量,并采用分类模块对总的特征向量进行故障分类,形成多尺度残差卷积变分网络模型,其中,对多尺度残差卷积变分网络模型的初始参数进行设置;采用所述训练样本对多尺度残差卷积变分网络模型进行训练,实现小样本数据下多尺度、深层次的故障特征学习,并将测试样本输入至上述训练好的多尺度残差卷积变分网络模型,以实现对机械设备运行状态的自动辨别和智能诊断。
Description
技术领域
本发明涉及机械设备诊断与健康管理领域,尤其涉及一种基于多尺度残差卷积变分网络故障诊断方法和诊断系统。
背景技术
风电机组作为一种大型的旋转机械设备,其安全稳定运行直接关系到风电企业的经济效益。由于风电机组长时间处于变转速、变载荷等变工况的复杂条件下,使得其关键部件(如轴承、齿轮、转子等)很容易发生故障,导致风电设备性能退化,甚至造成重大的经济损失和严重的人员伤亡。
智能故障诊断作为一种评估风电机组可靠性、降低停机风险的有效手段,在现代复杂旋转机械系统中具有重要的意义。因此,为了保证风电场的生产效率和操作安全,开展对风电机组结构健康监测和故障诊断技术的研究越来越受到重视。常见的故障诊断方法有人工神经网络、支持向量机、极限学习机等,虽然这些方法在故障诊断方面取得了一定效果,但它们均属于浅层学习方法,需要人工提取特征,且鲁棒性不强。为了避免传统诊断方法中需要人工特征提取的缺点和提高非平稳工况下模型的鲁棒性,需要一种基于多尺度残差卷积变分网络故障诊断方法和诊断系统。
发明内容
本方案针对上文提出的问题和需求,提出一种基于多尺度残差卷积变分网络故障诊断方法和诊断系统,由于采取了如下技术特征而能够实现上述技术目的,并带来其他多项技术效果。
本发明的一个目的在于提出一种基于多尺度残差卷积变分网络故障诊断方法,包括如下步骤:
S10:获取针对机械设备不同传递系统故障的加速度数据x(N),N是采集数据的总长度,并随机划分为训练样本和测试样本;
S20:由至少3个残差卷积变分模块并行学习串接,对每个残差卷积变分模块输出特征向量进行汇总形成总的特征向量,并采用分类模块对总的特征向量进行故障分类,形成多尺度残差卷积变分网络模型,其中,对多尺度残差卷积变分网络模型的初始参数进行设置;
S30:采用所述训练样本对多尺度残差卷积变分网络模型进行训练,实现小样本数据下多尺度、深层次的故障特征学习,并将测试样本输入至上述训练好的多尺度残差卷积变分网络模型,以实现对机械设备运行状态的自动辨别和智能诊断。
在本发明的一个示例中,在步骤S10中随机划分训练样本和测试样本包括:
假设给定一个长度为L的滑移窗函数,采用该滑移函数沿着采集的加速度数据x(N)截取等比例的训练样本x1(n)和测试样本x2(n),其中n是每个样本的数据长度,训练样本和测试样本的个数均为m/2,其中m可由以下公式计算得到:
在本发明的一个示例中,在步骤S20中,所述残差卷积变分模块包括:
3个残差模块,3个残差模块依次串接,每个所述残差模块通过快捷方式与2个卷积层、2个批处理层和2个激活函数层的输出结果F(x)进行叠加,获得残差模块的输出结果F(x)+x;其中,第1个残差模块的输出作为第2残差模块的输入,第2残差模块的输出作为第3个残差模块的输入;
重采模块,所述重采样模块通过重参数技巧对第3个残差模块的输出结果F3(x)+x3进行平整化处理和重参数采样计算,获得有用的潜在特征z;
卷积模块,由1个卷积层、1个批处理层、1个激活函数层、1个最大池化层、1个丢弃层和1个全连接层组成,配置为用于对潜在特征z进行更深入地处理,获得更具代表性的故障信息。
在本发明的一个示例中,在步骤S20中,所述分类模块采用Softmax函数,其计算公式为:
式中,pi表示第i类故障样本被正确识别的概率,zi表示第i个网络节点的输出值,C为故障样本的类别数量。
在本发明的一个示例中,在步骤S20中,多尺度残差卷积变分网络模型的初始参数包括:初始化最大进化次数M、学习率η和批量大小S。
在本发明的一个示例中,在步骤S30中,采用所述训练样本对多尺度残差卷积变分网络模型进行训练还包括:
通过adam算法对多尺度残差卷积变分网络模型的网络参数进行迭代更新,包括如下过程:
t←t+1
mt←β1mt-1+(1-β1)gt
式中,t为时间步长,gt为随机目标梯度,为梯度运算,ft(θt-1)为随机目标函数,θ为随机参数,mt和νt分别为一阶动量和二阶动量,和分别表示经过偏差校正后的一阶动量和二阶动量,β1,β2和ε均是网络模型的超参数,η为初始学习率。
本发明的另一个目的在于提出一种基于多尺度残差卷积变分网络故障诊断系统,包括:
数据获取装置,配置为获取针对机械设备不同传递系统故障的加速度数据x(N),N是采集数据的总长度,并随机划分为训练样本和测试样本;
模型获取装置,配置为由至少3个残差卷积变分模块并行学习串接,对每个残差卷积变分模块输出特征向量进行汇总形成总的特征向量,并采用分类模块对总的特征向量进行故障分类,形成多尺度残差卷积变分网络模型,其中,对多尺度残差卷积变分网络模型的初始参数进行设置;
故障诊断装置,配置为采用所述训练样本对多尺度残差卷积变分网络模型进行训练,实现小样本数据下多尺度、深层次的故障特征学习,并将测试样本输入至上述训练好的多尺度残差卷积变分网络模型,以实现对机械设备运行状态的自动辨别和智能诊断。
在本发明的一个示例中,还包括:训练装置,
配置为假设给定一个长度为L的滑移窗函数,采用该滑移函数沿着采集的加速度数据x(N)截取等比例的训练样本x1(n)和测试样本x2(n),其中n是每个样本的数据长度,训练样本和测试样本的个数均为m/2,其中m可由以下公式计算得到:
在本发明的一个示例中,所述残差卷积变分模块包括:
3个残差模块,3个残差模块依次串接,每个所述残差模块通过快捷方式与2个卷积层、2个批处理层和2个激活函数层的输出结果F(x)进行叠加,获得残差模块的输出结果F(x)+x;其中,第1个残差模块的输出作为第2残差模块的输入,第2残差模块的输出作为第3个残差模块的输入;
重采模块,所述重采样模块通过重参数技巧对第3个残差模块的输出结果F3(x)+x3进行平整化处理和重参数采样计算,获得有用的潜在特征z;
卷积模块,由1个卷积层、1个批处理层、1个激活函数层、1个最大池化层、1个丢弃层和1个全连接层组成,配置为用于对潜在特征z进行更深入地处理,获得更具代表性的故障信息。
在本发明的一个示例中,所述分类模块采用Softmax函数,其计算公式为:
式中,pi表示第i类故障样本被正确识别的概率,zi表示第i个网络节点的输出值,C为故障样本的类别数量。
下文中将结合附图对实施本发明的最优实施例进行更加详尽的描述,以便能容易理解本发明的特征和优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下文中将对本发明实施例的附图进行简单介绍。其中,附图仅仅用于展示本发明的一些实施例,而非将本发明的全部实施例限制于此。
图1为本发明方法的整体实施流程图;
图2为残差模块示意图;
图3为残差卷积变分模块示意图;
图4为多尺度残差卷积变分网络示意图;
图5为某风电场750kW风电机组结构示意图;
图6为风电机组不同故障下某一数据样本的时域波形图;
图7为不同深度学习模型获得的诊断精度对比图。
具体实施方式
为了使得本发明的技术方案的目的、技术方案和优点更加清楚,下文中将结合本发明具体实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。附图中相同的附图标记代表相同部件。需要说明的是,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于实际的风电机组通常在变工况、变转速等非平稳条件下运行,因此从机组上采集的振动信号具有高度的复杂性,这意味着从这些复杂的振动信号中难以获取的有效故障特征信息,针对此问题,本发明公布了一种基于多尺度残差卷积变分网络的风电机组故障诊断方法。该方法通过将采集的振动信号输入到多个残差卷积变分模块中进行逐层并行学习,能够自动获取丰富、判别性的故障特征信息,从而实现波动工况下风电机组的高精度故障诊断,对风电场设备的可靠运行和健康管理具有很好的指导价值。
需要说的是,本发明中所涉及的残差模块、重采样模块、卷积模块等均为Matlab中关于深度学习的工具包中的函数。
根据本发明第一方面的一种基于多尺度残差卷积变分网络故障诊断方法,如图1、图4所示,包括如下步骤:
S10:获取针对机械设备不同传递系统故障的加速度数据x(N),N是采集数据的总长度,并随机划分为训练样本和测试样本;例如,机械设备为风电机组,在风电机组传递系统上安装6个加速度传感器,分别位于主轴、齿轮箱低速级、中间级、高速级和发电机前后端位置,选用合理的测试仪器设备(如PCB振动加速度传感器、NI9234数据采集卡等),采集风电机组传递系统不同故障(如轴承划痕、齿轮磨损、转子不平衡等)对应的加速度数据x(N),N为采集数据x(N)的总长度,并随机划分为训练样本和测试样本。
S20:由至少3个残差卷积变分模块并行学习串接,对每个残差卷积变分模块输出特征向量进行汇总形成总的特征向量,并采用分类模块对总的特征向量进行故障分类,形成多尺度残差卷积变分网络模型(MRCVN),其中,对多尺度残差卷积变分网络模型的初始参数进行设置;
S30:采用所述训练样本对多尺度残差卷积变分网络模型进行训练,实现小样本数据下多尺度、深层次的故障特征学习,并将测试样本输入至上述训练好的多尺度残差卷积变分网络模型,以实现对机械设备运行状态的自动辨别和智能诊断。
该诊断方法通过多个残差卷积变分模块的层层堆叠并行学习,构建了一种新型的多尺度残差卷积变分网络模型,它具备卷积网络、残差网络和变分自编码网络的优点,能够从小样本中自动学习丰富的故障特征信息,能够缓解网络退化和梯度弥散问题,非常适用于解决含噪环境下的机械设备故障诊断问题。与传统智能诊断方法相比,通过多尺度、深层次自动地学习故障特征信息,能够实现波动工况条件下机械设备故障类型的有效识别,具有良好的鲁棒性和泛化性能,无需多余的信号处理技术和人工特征提取过程,便于工程应用。
需要说明的是,残差卷积变分模块的数量选择依据计算任务的大小而定,作为优选地,选择3个残差卷积变分模块。
在本发明的一个示例中,在步骤S10中随机划分训练样本和测试样本包括:
假设给定一个长度为L的滑移窗函数,采用该滑移函数沿着采集的加速度数据x(N)截取等比例的训练样本x1(n)和测试样本x2(n),其中n是每个样本的数据长度,训练样本和测试样本的个数均为m/2,其中m可由以下公式计算得到:
例如,随机划分为训练样本和测试样本是指通过滑移窗函数按1:1比例随机划分为训练样本x1(n)和测试样本x2(n),n是每个样本的数据长度。
在本发明的一个示例中,在步骤S20中,如图2、图3所示,所述残差卷积变分模块包括:
3个残差模块,3个残差模块依次串接,每个所述残差模块通过快捷方式与2个卷积层(Convolutional Layer)、2个批处理层(BN)和2个激活函数层(LReLU)的输出结果F(x)进行叠加,获得残差模块的输出结果F(x)+x;其中,第1个残差模块的输出作为第2残差模块的输入,第2残差模块的输出作为第3个残差模块的输入;也就是说,第1个残差模块的输出为F(x)+x,第2残差模块的输出为F(F(x)+x)+F(x)+x,第3个残差模块的输出为F(F(F(x)+x)+F(x)+x)+F(F(x)+x)+F(x)+x;当输入信号输入残差模块时,先经过一个卷积层,接着由一个批处理层和一个激活函数层处理输出,然后重复上述步骤一次并输出结果F(x),最后通过恒等映射得到残差模块的输出结果F(x)+x。
重采模块,所述重采样模块通过重参数技巧对第3个残差模块的输出结果F3(x)+x3进行平整化处理(即经过扁平层flatten layer)和重参数采样计算,获得有用的潜在特征z,平整化处理输出对应的均值μ和标准差σ,根据重参数采样计算,令z=μ+εσ,进而获得有用的潜在特征z,其中ε通过从正态分布N(1,0)中采样获得,即ε:N(1,0)。
卷积模块,由1个卷积层(Convolutional Layer)、1个批处理层(BN)、1个激活函数层(LReLU)、1个最大池化层(Maxpooling)、1个丢弃层(Dropout)和1个全连接层(Fully-connected Layer)组成,配置为用于对潜在特征z进行更深入地处理,获得更具代表性的故障信息;其中,激活函数层(LReLU)采用的是有漏洞的修正线性单元,丢弃层(Dropout)的丢弃率P设置为0.2。
也就是说,建立的多尺度残差卷积变分网络模型由3个残差卷积变分模块通过对输入数据x(N)并行学习连接构成,其中每个残差卷积变分模块是由3个残差模块、1个重采样模块和1个卷积模块组合构成。
在本发明的一个示例中,在步骤S20中,所述分类模块采用Softmax函数,其计算公式为:
式中,pi表示第i类故障样本被正确识别的概率,zi表示第i个网络节点的输出值,C为故障样本的类别数量。
在本发明的一个示例中,在步骤S20中,多尺度残差卷积变分网络模型的初始参数包括:初始化最大进化次数M、学习率η和批量大小S;
例如,初始化最大进化次数M=200,初始化学习率η=0.01,初始化批量大小S=50。
在本发明的一个示例中,在步骤S30中,采用所述训练样本对多尺度残差卷积变分网络模型进行训练还包括:
通过adam算法对多尺度残差卷积变分网络模型的网络参数进行迭代更新,包括如下过程:
t←t+1
mt←β1mt-1+(1-β1)gt
式中,t为时间步长,gt为随机目标梯度,为梯度运算,ft(θt-1)为随机目标函数,θ为随机参数,mt和νt分别为一阶动量和二阶动量,和分别表示经过偏差校正后的一阶动量和二阶动量,β1,β2和ε均是网络模型的超参数,η为初始学习率。
例如,上述步骤中采用训练样本对MRCVN模型进行训练时,定义MRCVN模型的初始超参数,即设置初始时间步长t为0,偏移量γ为10-8,衰减因子β1和β2分别为0.9和0.999,一阶动量m0和二阶动量ν0均为0。
根据本发明第二方面的一种基于多尺度残差卷积变分网络故障诊断系统,包括:
数据获取装置,配置为获取针对机械设备不同传递系统故障的加速度数据x(N),N是采集数据的总长度,并随机划分为训练样本和测试样本;
模型获取装置,配置为由至少3个残差卷积变分模块并行学习串接,对每个残差卷积变分模块输出特征向量进行汇总形成总的特征向量,并采用分类模块对总的特征向量进行故障分类,形成多尺度残差卷积变分网络模型,其中,对多尺度残差卷积变分网络模型的初始参数进行设置;
故障诊断装置,配置为采用所述训练样本对多尺度残差卷积变分网络模型进行训练,实现小样本数据下多尺度、深层次的故障特征学习,并将测试样本输入至上述训练好的多尺度残差卷积变分网络模型,以实现对机械设备运行状态的自动辨别和智能诊断。
该诊断系统通过多个残差卷积变分模块的层层堆叠并行学习,构建了一种新型的多尺度残差卷积变分网络模型,它具备卷积网络、残差网络和变分自编码网络的优点,能够从小样本中自动学习丰富的故障特征信息,能够缓解网络退化和梯度弥散问题,非常适用于解决含噪环境下的机械设备故障诊断问题。与传统智能诊断方法相比,无需多余的信号处理技术和人工特征提取过程,便于工程应用。
在本发明的一个示例中,还包括:训练装置,
配置为假设给定一个长度为L的滑移窗函数,采用该滑移函数沿着采集的加速度数据x(N)截取等比例的训练样本x1(n)和测试样本x2(n),其中n是每个样本的数据长度,训练样本和测试样本的个数均为m/2,其中m可由以下公式计算得到:
在本发明的一个示例中,所述残差卷积变分模块包括:
3个残差模块,3个残差模块依次串接,每个所述残差模块通过快捷方式与2个卷积层、2个批处理层和2个激活函数层的输出结果F(x)进行叠加,获得残差模块的输出结果F(x)+x;其中,第1个残差模块的输出作为第2残差模块的输入,第2残差模块的输出作为第3个残差模块的输入;也就是说,第1个残差模块的输出为F(x)+x,第2残差模块的输出为F(F(x)+x)+F(x)+x,第3个残差模块的输出为F(F(F(x)+x)+F(x)+x)+F(F(x)+x)+F(x)+x;当输入信号输入残差模块时,先经过一个卷积层,接着由一个批处理层和一个激活函数层处理输出,然后重复上述步骤一次并输出结果F(x),最后通过恒等映射得到残差模块的输出结果F(x)+x。
重采模块,所述重采样模块通过重参数技巧对第3个残差模块的输出结果F3(x)+x3进行平整化处理和重参数采样计算,获得有用的潜在特征z;
卷积模块,由1个卷积层、1个批处理层、1个激活函数层、1个最大池化层、1个丢弃层和1个全连接层组成,配置为用于对潜在特征z进行更深入地处理,获得更具代表性的故障信息。
在本发明的一个示例中,所述分类模块采用Softmax函数,其计算公式为:
式中,pi表示第i类故障样本被正确识别的概率,zi表示第i个网络节点的输出值,C为故障样本的类别数量。
具体实施案例:本案例以某风电场750kW的风电机组为研究对象,图5显示了该风电机组的结构示意图,主要由叶轮、齿轮箱和发电机组成,其中齿轮箱包括行星级齿轮、中间级齿轮和高速级齿轮。如图5所示,在该风电机组运行过程中,通过在主轴、齿轮箱低速级、中间级、高速级、发电机前后端位置安装6个加速度传感器,分别采集了风电机组4种运行状态下(即正常、高速级齿轮故障、发电机前轴承故障、发电机转子不平衡故障)的振动加速度数据。在数据采集过程中,采集卡型号为NI9234,输入轴转速大约为21.8r/min,发电机轴转速大约为1523r/min,采样频率设置为16384Hz。通过现场测试共采集500个数据样本,每个数据样本的总长度N为327680,设置滑移窗函数的长度L=2048,移动步长s=1000,采用滑移窗函数将采集的数据样本随机划分为163个训练样本和163个测试样本,每个训练样本和测试样本的长度都为2048点。图6为通过滑移窗函数获取的某一数据样本的时域波形图。
为了证明提出方法在风电机组运行状态识别中的有效性和优越性,采用相同的训练样本对提出的MRCVN模型和4种常见的深度学习模型(即卷积神经网络CNN、变分自编码器VAE、深度信念网络DBN、长短期记忆网络LSTM)进行训练,并采用测试数据对训练好的深度学习模型进行测试,获得风电机组的诊断结果,如图7所示。从图7可以明显看出,提出的MRCVN模型获得了99%以上的诊断精度。另外,与4种常见的深度学习模型(即CNN、VAE、DBN和LSTM)相比,提出的MRCVN模型能够取得最高的诊断准确率,且诊断结果的稳定性更好,这说明本发明公布的MRCVN模型相比传统深度学习模型具有明显的诊断优势,能够实现波动工况下风电机组运行状态的智能识别与可靠诊断,同时具有良好的鲁棒性。
上文中参照优选的实施例详细描述了本发明所提出的基于多尺度残差卷积变分网络故障诊断方法和诊断系统的示范性实施方式,然而本领域技术人员可理解的是,在不背离本发明理念的前提下,可以对上述具体实施例做出多种变型和改型,且可以对本发明提出的各种技术特征、结构进行多种组合,而不超出本发明的保护范围,本发明的保护范围由所附的权利要求确定。
Claims (2)
1.一种基于多尺度残差卷积变分网络故障诊断方法,其特征在于,包括如下步骤:
S10:获取针对机械设备不同传递系统故障的加速度数据x(N),N是采集数据的总长度,并随机划分为训练样本和测试样本;
S20:由至少3个残差卷积变分模块并行学习串接,对每个残差卷积变分模块输出特征向量进行汇总形成总的特征向量,并采用分类模块对总的特征向量进行故障分类,形成多尺度残差卷积变分网络模型,其中,对多尺度残差卷积变分网络模型的初始参数进行设置;
S30:采用所述训练样本对多尺度残差卷积变分网络模型进行训练,实现小样本数据下多尺度、深层次的故障特征学习,并将测试样本输入至上述训练好的多尺度残差卷积变分网络模型,以实现对机械设备运行状态的自动辨别和智能诊断;
其中,在步骤S10中随机划分训练样本和测试样本包括:
假设给定一个长度为L的滑移窗函数,采用该滑移函数沿着采集的加速度数据x(N)截取等比例的训练样本x1(n)和测试样本x2(n),其中n是每个样本的数据长度,训练样本和测试样本的个数均为m/2,其中m可由以下公式计算得到:
其中,在步骤S20中,所述残差卷积变分模块包括:
3个残差模块,3个残差模块依次串接,每个所述残差模块通过快捷方式与2个卷积层、2个批处理层和2个激活函数层的输出结果F(x)进行叠加,获得残差模块的输出结果F(x)+x;其中,第1个残差模块的输出作为第1残差模块的输入,第2残差模块的输出作为第3个残差模块的输入;
重采模块,所述重采样模块通过重参数技巧对第3个残差模块的输出结果F3(x)+x3进行平整化处理和重参数采样计算,获得有用的潜在特征z;
卷积模块,由1个卷积层、1个批处理层、1个激活函数层、1个最大池化层、1个丢弃层和1个全连接层组成,配置为用于对潜在特征z进行更深入地处理,获得更具代表性的故障信息;
其中,在步骤S20中,所述分类模块采用Softmax函数,其计算公式为:
式中,pi表示第i类故障样本被正确识别的概率,zi表示第i个网络节点的输出值,C为故障样本的类别数量;
其中,在步骤S20中,多尺度残差卷积变分网络模型的初始参数包括:初始化最大进化次数M、学习率η和批量大小S;
其中,在步骤S30中,采用所述训练样本对多尺度残差卷积变分网络模型进行训练还包括:
通过adam算法对多尺度残差卷积变分网络模型的网络参数进行迭代更新,包括如下过程:
t←t+1
mt←β1mt-1+(1-β1)gt
2.一种基于多尺度残差卷积变分网络故障诊断系统,其特征在于,包括:
数据获取装置,配置为获取针对机械设备不同传递系统故障的加速度数据x(N),N是采集数据的总长度,并随机划分为训练样本和测试样本;
模型获取装置,配置为由至少3个残差卷积变分模块并行学习串接,对每个残差卷积变分模块输出特征向量进行汇总形成总的特征向量,并采用分类模块对总的特征向量进行故障分类,形成多尺度残差卷积变分网络模型,其中,对多尺度残差卷积变分网络模型的初始参数进行设置;
故障诊断装置,配置为采用所述训练样本对多尺度残差卷积变分网络模型进行训练,实现小样本数据下多尺度、深层次的故障特征学习,并将测试样本输入至上述训练好的多尺度残差卷积变分网络模型,以实现对机械设备运行状态的自动辨别和智能诊断;
训练装置,配置为假设给定一个长度为L的滑移窗函数,采用该滑移函数沿着采集的加速度数据x(N)截取等比例的训练样本x1(n)和测试样本x2(n),其中n是每个样本的数据长度,训练样本和测试样本的个数均为m/2,其中m可由以下公式计算得到:
其中,所述残差卷积变分模块包括:
3个残差模块,3个残差模块依次串接,每个所述残差模块通过快捷方式与2个卷积层、2个批处理层和2个激活函数层的输出结果F(x)进行叠加,获得残差模块的输出结果F(x)+x;其中,第1个残差模块的输出作为第2残差模块的输入,第2残差模块的输出作为第3个残差模块的输入;
重采模块,所述重采样模块通过重参数技巧对第3个残差模块的输出结果F3(x)+x3进行平整化处理和重参数采样计算,获得有用的潜在特征z;
卷积模块,由1个卷积层、1个批处理层、1个激活函数层、1个最大池化层、1个丢弃层和1个全连接层组成,配置为用于对潜在特征z进行更深入地处理,获得更具代表性的故障信息;
其中,所述分类模块采用Softmax函数,其计算公式为:
式中,pi表示第i类故障样本被正确识别的概率,zi表示第i个网络节点的输出值,C为故障样本的类别数量;
其中,多尺度残差卷积变分网络模型的初始参数包括:初始化最大进化次数M、学习率η和批量大小S;
其中,采用所述训练样本对多尺度残差卷积变分网络模型进行训练还包括:
通过adam算法对多尺度残差卷积变分网络模型的网络参数进行迭代更新,包括如下过程:
t←t+1
mt←β1mt-1+(1-β1)gt
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210317326.1A CN114897292B (zh) | 2022-03-28 | 2022-03-28 | 基于多尺度残差卷积变分网络故障诊断方法和诊断系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210317326.1A CN114897292B (zh) | 2022-03-28 | 2022-03-28 | 基于多尺度残差卷积变分网络故障诊断方法和诊断系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114897292A CN114897292A (zh) | 2022-08-12 |
CN114897292B true CN114897292B (zh) | 2023-04-07 |
Family
ID=82714780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210317326.1A Active CN114897292B (zh) | 2022-03-28 | 2022-03-28 | 基于多尺度残差卷积变分网络故障诊断方法和诊断系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114897292B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116484172B (zh) * | 2023-01-19 | 2024-01-30 | 南京林业大学 | 一种基于强鲁棒性多尺度网络的机械故障诊断方法和系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109740626A (zh) * | 2018-11-23 | 2019-05-10 | 杭州电子科技大学 | 基于深度学习的乳腺癌病理切片中癌症区域的检测方法 |
CN112033463B (zh) * | 2020-09-02 | 2022-09-06 | 哈尔滨工程大学 | 一种核动力设备状态评估与预测一体化方法和系统 |
CN113052218A (zh) * | 2021-03-15 | 2021-06-29 | 杭州电子科技大学 | 工业过程的多尺度残差卷积与lstm融合性能评估方法 |
CN113673346B (zh) * | 2021-07-20 | 2022-07-22 | 中国矿业大学 | 一种基于多尺度SE-Resnet的电机振动数据处理与状态识别方法 |
CN113744220B (zh) * | 2021-08-25 | 2024-03-26 | 中国科学院国家空间科学中心 | 一种基于pynq的无预选框检测系统 |
-
2022
- 2022-03-28 CN CN202210317326.1A patent/CN114897292B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114897292A (zh) | 2022-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lei et al. | Fault diagnosis of wind turbine based on Long Short-term memory networks | |
CN112161784B (zh) | 基于多传感器信息融合迁移网络的机械故障诊断方法 | |
CN109918752B (zh) | 基于迁移卷积神经网络的机械故障诊断方法、设备及介质 | |
CN109555566B (zh) | 一种基于lstm的汽轮机转子故障诊断方法 | |
CN107657250B (zh) | 轴承故障检测及定位方法及检测定位模型实现系统和方法 | |
CN111538947B (zh) | 风力发电机轴承故障分类模型的构建方法 | |
CN109060347B (zh) | 基于堆叠消噪自动编码器和门控循环单元神经网络的行星齿轮故障识别方法 | |
CN113339204B (zh) | 一种基于混合神经网络的风力发电机故障识别方法 | |
Cao et al. | Intelligent fault diagnosis of wind turbine gearbox based on Long short-term memory networks | |
CN115290326A (zh) | 一种滚动轴承故障智能诊断方法 | |
CN114897292B (zh) | 基于多尺度残差卷积变分网络故障诊断方法和诊断系统 | |
CN111855202A (zh) | 一种齿轮箱故障诊断方法及系统 | |
Zheng et al. | An end-to-end CNN-BiLSTM attention model for gearbox fault diagnosis | |
CN113095179A (zh) | 元度量学习驱动的直升机行星齿轮箱故障诊断方法 | |
CN115828466A (zh) | 一种基于宽核卷积的风机主轴部件故障预测方法 | |
CN113240022A (zh) | 多尺度单分类卷积网络的风电齿轮箱故障检测方法 | |
CN115481666A (zh) | 一种齿轮箱小样本故障诊断方法、系统及设备 | |
CN114295368A (zh) | 一种多通道融合的风电行星齿轮箱故障诊断方法 | |
CN114298110B (zh) | 基于可解释1dcnn模型的滚动轴承故障诊断方法及系统 | |
CN113916535B (zh) | 基于时频和cnn的轴承诊断方法、系统、设备及介质 | |
CN117708574B (zh) | 一种嵌入物理信息的cnn变转速滚动轴承故障诊断方法 | |
CN113673442B (zh) | 一种基于半监督单分类网络的变工况故障检测方法 | |
CN112163630A (zh) | 一种基于不平衡学习的复合故障诊断方法及装置 | |
CN116793666A (zh) | 一种基于lstm-mlp-lsgan模型的风电机组齿轮箱故障诊断方法 | |
CN114912480A (zh) | 基于深度残差变分自编码器的故障诊断方法和诊断系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |