CN117194990A - 一种轴承故障诊断模型的小样本训练方法及诊断方法 - Google Patents
一种轴承故障诊断模型的小样本训练方法及诊断方法 Download PDFInfo
- Publication number
- CN117194990A CN117194990A CN202311345392.0A CN202311345392A CN117194990A CN 117194990 A CN117194990 A CN 117194990A CN 202311345392 A CN202311345392 A CN 202311345392A CN 117194990 A CN117194990 A CN 117194990A
- Authority
- CN
- China
- Prior art keywords
- fault diagnosis
- training
- bearing
- diagnosis model
- bearing fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 80
- 238000012549 training Methods 0.000 title claims abstract description 63
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000010606 normalization Methods 0.000 claims description 25
- 238000005070 sampling Methods 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 13
- 238000011176 pooling Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 238000004140 cleaning Methods 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 5
- 238000012952 Resampling Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 25
- 230000004913 activation Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Landscapes
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明涉及故障诊断技术领域,具体涉及一种轴承故障诊断模型的小样本训练方法及诊断方法,包括步骤:A,采集轴承的工作参数并建立数据集,所述数据集包括公开数据集以及小样本本地数据集;B,建立轴承故障诊断模型,轴承故障诊断模型包括并列设置的一维残差网络和编码器‑解码器结构;C,基于采集到的公开数据集对建立的轴承故障诊断模型进行预训练;D,基于采集到的小样本本地数据集对预训练后的轴承故障诊断模型进行元训练;E,对元训练后的轴承故障诊断模型进行微调,以得到训练好的轴承故障诊断模型,克服了实际中轴承故障样本稀缺而导致故障诊断精度低的问题,能够在样本数量稀缺的条件下,达到高泛化性、高灵活度、高可靠度的效果。
Description
技术领域
本发明涉及故障诊断技术领域,具体涉及一种轴承故障诊断模型的小样本训练方法及诊断方法。
背景技术
轴承作为机械设备中的重要零部件,其运行状态对设备的性能、可靠性和寿命具有直接影响。目前,基于振动信号的轴承故障诊断方法具有信息丰富、故障特征明显、关联性强、非侵入性和实时性等特点,是最常见的轴承故障诊断方法。
其中,基于深度神经网络模型的故障诊断由于其较好的空间表达能力和自适应性,在故障诊断领域展现出较大的优势。通常,一个具有较高可靠性的深度神经网络需要训练大量的数据。而在现实情况中,由于机械装备故障隐私性问题,故障标注成本问题,往往不能获得足够的轴承缺陷样本,从而导致模型可靠性不高,实际工程难以落地。
目前,轴承故障诊断领域现有的小样本学习方法分为基于样本生成的方法、基于迁移的方法和基于元学习的方法。基于样本生成的方法通过合成样本扩充原始样本集,但是过度依赖于样本特征的完备性,泛化性能不强;基于迁移方法利用已有的知识数据来提高在目标任务上的性能,但是在源域和目标域之间的差异过大时,无法很好的适配目标域,缺少域间适应的灵活度;基于元学习的方法通过多任务学习来快速适应任务,但是其模型容量小,导致其精度无法满足生产需求,模型无法很好的在样本数量稀缺的条件下,达到良好的诊断效果。
发明内容
针对现有技术中存在的上述问题,本发明提供一种轴承故障诊断模型的小样本训练方法,提出了一种轴承故障诊断模型,能够在样本数量稀缺的条件下,达到高泛化性、高灵活度、高可靠度的效果。
第一方面,本申请实施例提供了一种轴承故障诊断模型的小样本训练方法,包括步骤:
步骤A,采集轴承的工作参数并建立数据集,所述数据集包括公开数据集以及小样本本地数据集。
步骤B,建立轴承故障诊断模型,轴承故障诊断模型包括并列设置的一维残差网络和编码器-解码器结构。一维残差网络为现有技术中的ResNet50为基础针对轴承特征进行改进,作为特征提取器,改进了采样层,增加了多头自注意力层以及对应的参数。
步骤C,基于采集到的公开数据集对建立的轴承故障诊断模型进行预训练,为了使训练得到的轴承故障诊断模型具有良好的泛化性。
步骤D,基于采集到的小样本本地数据集对预训练后的轴承故障诊断模型进行元训练。
步骤E,对元训练后的轴承故障诊断模型进行微调,进一步调整网络参数,提高网络参数,以得到训练好的轴承故障诊断模型,使得训练得到的轴承故障诊断模型在实际使用中具有更高的可靠性。
在第一方面的又一种可选方案中,步骤A中,建立数据集后,还将公开数据集以及小样本本地数据集均按照8:2的比例划分为训练集和对应的测试集,所述训练集为未标注轴承故障的数据集,所述测试集为已标注轴承故障的数据集。
在第一方面的一种可选方案中,步骤B中,所述一维残差网络包括依次连接的五个模块,模块一包括依次连接的采样层和平均池化层,模块二、模块三以及模块四均包括多层批量归一化层,模块五包括依次连接的批量归一化层和多头自注意力层。
在第一方面的又一种可选方案中,步骤C具体为:
步骤C1,将公开数据集输入一维残差网络中进行处理,以得到信号特征,公开数据集实用现有技术中轴承数据集CWRU。
步骤C2,将公开数据集输入编码器-解码器结构中进行处理,以得到文本描述特征;
步骤C3,基于得到的信号特征和文本描述特征,计算预训练损失函数,所述预训练损失函数为余弦损失函数,直至预训练损失函数收敛至预设值,以得到预训练后的轴承故障诊断模型。
在第一方面的又一种可选方案中,步骤D具体为:
步骤D1,利用预训练后的轴承故障诊断模型将小样本本地数据集从一维特征空间映射到多维特征空间,以得到模型诊断出的轴承故障的诊断结果。
步骤D2,建立元训练损失函数,直至元训练损失函数收敛至预设值,以得到元训练后的轴承故障诊断模型。
在第一方面的又一种可选方案中,步骤A中,采集轴承的工作参数后,还对采集到的轴承的工作参数进行数据清洗和数据增强,为了提高数据价值。
在第一方面的又一种可选方案中,所述数据清洗包括异常值处理以及缺失值处理。
在第一方面的又一种可选方案中,所述数据增强包括滑窗增强和重采样增强。
在第一方面的又一种可选方案中,所述轴承的工作参数包括采样频率、采样时间以及振动信号。
第二方面,本申请实施例提供了一种轴承故障诊断方法,基于本申请实施例第一方面或第一方面的任意一种实现方式提供的一种轴承故障诊断模型的小样本训练方法训练好的一种轴承故障诊断模型对故障轴承进行诊断。
本发明的有益技术效果包括:
克服了实际工程中轴承故障样本稀缺而导致故障诊断精度低的问题,基于采集的公开数据集以及小样本本地数据集,对搭建的轴承故障诊断模型进行预训练、元训练以及微调处理,使得轴承故障诊断模型在拥有良好的泛化性的同时,提取能力强,可靠性高,故障诊断精度高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明中一种轴承故障诊断模型的小样本训练方法流程图;
图2为本发明中一种轴承故障诊断模型的小样本训练方法示意图;
图3为本发明中一种轴承故障诊断模型框图;
图4为本发明中一维残差网络的网络架构框图;
图5为本发明中一维残差网络的网络架构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本申请的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例可能并未在以下内容中有明确的文字记载。
下面的描述提供了示例,并且不对权利要求书中阐述的范围、适用性或示例进行限制。可以在不脱离本申请内容的范围的情况下,对描述的元素的功能和布置做出改变。各个示例可以适当省略、替代或添加各种过程或组件。例如所描述的方法可以以所描述的顺序不同的顺序来执行,并且可以添加、省略或组合各种步骤。此外,可以将关于一些示例描述的特征组合到其他示例中。
实施例一:
参照图1,一种轴承故障诊断模型的小样本训练方法,包括步骤:
步骤A,采集轴承的工作参数并建立数据集,所述数据集包括公开数据集以及小样本本地数据集。
进一步地,步骤A具体包括:
步骤A1,在轴承的基座上安装振动传感器,根据采集要求,采集轴承的工作参数,所述轴承的工作参数包括采样频率、采样时间、滤波器以及振动信号,振动信号的采集为启动采集设备,采集振动信号数据,并将采集到的振动信号数据导入计算机中。
步骤A2,对采集到的轴承的工作参数数据进行数据清洗,所述数据清洗包括异常值处理、缺失值处理以及重复值处理,对缺失值和异常值取零,将重复值删除。
步骤A3,对采集到的轴承的工作参数数据进行数据增强,所述数据增强包括滑窗增强和重采样增强。
步骤A4,将数据集按照8:2的比例划分为训练集和测试集。
参照图2,步骤B,建立轴承故障诊断模型,轴承故障诊断模型包括并列设置的一维残差网络和编码器-解码器结构。
一维残差网络为现有技术中的ResNet50为基础针对轴承特征进行改进,作为特征提取器,改进了采样层,增加了多头自注意力层以及对应的参数。
一维残差网络包括依次连接的五个模块,模块一包括依次连接的采样层和平均池化层,模块二、模块三以及模块四均包括多层批量归一化层,模块五包括依次连接的批量归一化层和多头自注意力层。
具体地,第一批量归一化层中,数据两路并行,第一路数据顺序经过卷积层、批量归一化层、激活函数层、卷积层、批量归一化层、激活函数层、平均池化层、卷积层以及平均池化层,第二路数据顺序通过卷积层和批量归一化层。数据经过两路并行之后相加,最后通过激活函数层。数据经过批量归一化层层后,通道数为原来的4/S倍,通道宽为原来的1/S倍,S为倍率。
第二批量归一化层,数据两路并行,第一路数据分别经过卷积层、批量归一化层、激活函数层、卷积层、批量归一化层、激活函数层、平均池化层、卷积层以及平均池化层,第二路数据不做处理。数据经过两路并行之后相加,最后通过激活函数层。数据经过第二批量归一化层后,通道数和通道宽不变。
进一步地,激活函数层中激活函数为ReLU。
多头自注意力层中,首先将输入的多维数据平铺为一维数据,然后对该一维数据顺序执行多头投影、注意力计算以及多头拼接操作,其中,头的数量为8。
具体地,模块一包括依次连接的三层采样层和一层平均池化层组成,三层采样层均包括依次连接的卷积层、批量归一化层以及激活函数层,所述激活函数为ReLU,其中,第一层采样层中的卷积层的卷积核大小为1*3,步长为2,通道数为32,第二层采样层中的卷积层的卷积大小为1*3,步长为2,通道数为32,第三层采样层中的卷积层的卷积大小为1*3,步长为2,通道数为64,第四层平均池化层的卷积核的大小为2,步长为2。
模块二包括依次连接的三层批量归一化层,第一层批量归一化层的通道数为64,通道宽为128,缩放比例为1,后两层批量归一化层的参数相同,通道数均为256,通道宽均为128。
模块三包括依次连接的四层批量归一化层,第一层批量归一化层的通道数为256,通道宽为128,缩放比例为2,后三层批量归一化层的参数相同,通道数均为512,通道宽均为64。
模块四包括依次连接的五层批量归一化层,第一层批量归一化层的通道数为512,通道宽为64,缩放比例为2,后四层第二批量归一化层的参数相同,通道数均为1024,通道宽均为32。
模块五包括依次连接的三层批量归一化层和一层多头自注意力层,第一层批量归一化层的通道数为1024,通道宽为32,缩放比例为2,后两层第二批量归一化层的参数相同,通道数均为2048,通道宽均为16,第四层多头自注意力层的通道数为2048,输出宽度为N。
步骤C,基于采集到的公开数据集对建立的轴承故障诊断模型进行预训练,公开数据集为凯斯西楚大学轴承数据集CWRU。
步骤C具体为:
步骤C1,将公开数据集输入一维残差网络中进行处理,以得到信号特征;
步骤C2,将公开数据集输入编码器-解码器结构中进行处理,将信号特征转化为对当前轴承故障的具体文本描述,以得到文本描述特征;
步骤C3,基于得到的信号特征和文本描述特征,计算预训练损失函数,所述预训练损失函数为余弦损失函数,直至预训练损失函数收敛至预设值,以得到预训练后的轴承故障诊断模型。
步骤D,基于采集到的小样本本地数据集对预训练后的轴承故障诊断模型进行元训练。
步骤D具体为:
步骤D1,利用预训练后的轴承故障诊断模型将小样本本地数据集从一维特征空间映射到多维特征空间,以得到模型诊断出的轴承故障的诊断结果。映射式为:
k表示训练集中的样本,k′表示对应的测试集中的样本,Nk表示数据集中样本总数,(xi,yi)表示数据xi及其对应的标签yi,d表示余弦距离度量函数,通过映射式可以得出获取的轴承故障属于何种类型的故障。每个训练集和测试集下按照8:2划分支持集和查询集,以进行数据的查询支持,保证数据的完整性。
步骤D2,建立元训练损失函数,直至元训练损失函数收敛至预设值,以得到元训练后的轴承故障诊断模型。
步骤E,对元训练后的轴承故障诊断模型进行微调,将输入样本映射到低维度特征空间,并计算微调损失函数,微调损失函数为交叉熵损失函数,以得到训练好的轴承故障诊断模型。
本发明方法使用公开轴承振动信号数据集进行预训练,保证了模型精度的同时让模型具有良好的泛化性,预训练模型使用以一维残差网络ResNet50为特征提取器的双流模型,保证了模型容量的同时加快了模型收敛速度,对本地数据进行元训练,让模型能灵活适应本地数据分布,使用微调手段进一步调整网络参数,让模型具有更高的可靠性。
本发明通过预训练、元训练、微调步骤,充分应用外部公开轴承数据集作为辅助训练,具有高特征提取能力和高可靠性的特点,具有很大的应用前景。
实施例二:
一种轴承故障诊断方法,其特征在于,基于实施例一提供的一种轴承故障诊断模型的小样本训练方法训练好的一种轴承故障诊断模型对故障轴承进行诊断。
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的保护范围内。
Claims (10)
1.一种轴承故障诊断模型的小样本训练方法,其特征在于,包括步骤:
A,采集轴承的工作参数并建立数据集,所述数据集包括公开数据集以及小样本本地数据集;
B,建立轴承故障诊断模型,轴承故障诊断模型包括并列设置的一维残差网络和编码器-解码器结构;
C,基于采集到的公开数据集对建立的轴承故障诊断模型进行预训练;
D,基于采集到的小样本本地数据集对预训练后的轴承故障诊断模型进行元训练;
E,对元训练后的轴承故障诊断模型进行微调,以得到训练好的轴承故障诊断模型。
2.根据权利要求1所述的一种轴承故障诊断模型的小样本训练方法,其特征在于,步骤A中,建立数据集后,还将公开数据集以及小样本本地数据集均按照8:2的比例划分为训练集和对应的测试集,所述训练集为未标注轴承故障的数据集,所述测试集为已标注轴承故障的数据集。
3.根据权利要求2所述的一种轴承故障诊断模型的小样本训练方法,其特征在于,步骤B中,所述一维残差网络包括依次连接的五个模块,模块一包括依次连接的采样层和平均池化层,模块二、模块三以及模块四均包括多层批量归一化层,模块五包括依次连接的批量归一化层和多头自注意力层。
4.根据权利要求3所述的一种轴承故障诊断模型的小样本训练方法,其特征在于,步骤C具体为:
C1,将公开数据集输入一维残差网络中进行处理,以得到信号特征;
C2,将公开数据集输入编码器-解码器结构中进行处理,以得到文本描述特征;
C3,基于得到的信号特征和文本描述特征,计算预训练损失函数,所述预训练损失函数为余弦损失函数,直至预训练损失函数收敛至预设值,以得到预训练后的轴承故障诊断模型。
5.根据权利要求4所述的一种轴承故障诊断模型的小样本训练方法,其特征在于,步骤D具体为:
D1,利用预训练后的轴承故障诊断模型将小样本本地数据集从一维特征空间映射到多维特征空间,以得到模型诊断出的轴承故障的诊断结果;
D2,建立元训练损失函数,直至元训练损失函数收敛至预设值,以得到元训练后的轴承故障诊断模型。
6.根据权利要求1所述的一种轴承故障诊断模型的小样本训练方法,其特征在于,步骤A中,采集轴承的工作参数后,还对采集到的轴承的工作参数进行数据清洗和数据增强。
7.根据权利要求6所述的一种轴承故障诊断模型的小样本训练方法,其特征在于,所述数据清洗包括异常值处理以及缺失值处理。
8.根据权利要求6所述的一种轴承故障诊断模型的小样本训练方法,其特征在于,所述数据增强包括滑窗增强和重采样增强。
9.根据权利要求6所0述的一种轴承故障诊断模型的小样本训练方法,其特征在于,所述轴承的工作参数包括采样频率、采样时间以及振动信号。
10.一种轴承故障诊断方法,其特征在于,基于权利要求1至9任一项所述的一种轴承故障诊断模型的小样本训练方法训练好的一种轴承故障诊断模型对故障轴承进行诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311345392.0A CN117194990A (zh) | 2023-10-17 | 2023-10-17 | 一种轴承故障诊断模型的小样本训练方法及诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311345392.0A CN117194990A (zh) | 2023-10-17 | 2023-10-17 | 一种轴承故障诊断模型的小样本训练方法及诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117194990A true CN117194990A (zh) | 2023-12-08 |
Family
ID=89001821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311345392.0A Pending CN117194990A (zh) | 2023-10-17 | 2023-10-17 | 一种轴承故障诊断模型的小样本训练方法及诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117194990A (zh) |
-
2023
- 2023-10-17 CN CN202311345392.0A patent/CN117194990A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111459700B (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
CN110991295B (zh) | 一种基于一维卷积神经网络的自适应故障诊断方法 | |
CN113158814B (zh) | 一种基于卷积自编码器的轴承健康状态监测方法 | |
CN111060337A (zh) | 一种基于专家系统的运转设备实时故障诊断方法 | |
CN110596506A (zh) | 基于时间卷积网络的变换器故障诊断方法 | |
CN110705456A (zh) | 一种基于迁移学习的微型电机异常检测方法 | |
CN112163472A (zh) | 一种基于多视角特征融合的滚动轴承诊断方法 | |
CN113538353B (zh) | 基于单通道图数据增强和迁移训练残差网络的五相异步电动机滚动轴承故障诊断方法 | |
CN112326213B (zh) | 异常数据检测方法及装置、机械故障检测方法及装置 | |
CN113125135A (zh) | 旋转机械的故障诊断方法、存储介质及电子设备 | |
CN110987431B (zh) | 一种基于tqwt辅助spc的轴承状态监测及故障诊断的方法 | |
CN107590604B (zh) | 一种结合s变换和2dpca的同调机组分群方法及系统 | |
CN115876473A (zh) | 基于PWVD和DenseNet的轴承故障诊断方法 | |
CN115437358A (zh) | 工业机器人智能状态监测与故障诊断系统及故障诊断方法 | |
CN116956215A (zh) | 一种传动系统故障诊断方法及系统 | |
CN109782158B (zh) | 一种基于多级分类的模拟电路诊断方法 | |
CN114462446A (zh) | 基于振动信号的滚动轴承故障诊断方法及电子设备 | |
CN113191247A (zh) | 一种gis设备机械故障诊断方法及系统 | |
Nandi et al. | Diagnosis of induction motor faults using frequency occurrence image plots—a deep learning approach | |
CN117194990A (zh) | 一种轴承故障诊断模型的小样本训练方法及诊断方法 | |
CN116861320A (zh) | 基于短时傅里叶同步压缩变换的转子故障诊断方法 | |
CN114593916A (zh) | 一种基于多通道振动特征的轴承故障诊断方法 | |
Zheng et al. | Wavelet packet decomposition and neural network based fault diagnosis for elevator excessive vibration | |
CN112464708A (zh) | 双馈异步风机电能质量异常故障诊断方法 | |
CN114325352B (zh) | 一种基于经验小波变换的模拟滤波电路故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |