CN115081514A

CN115081514A - 一种数据不平衡情况下的工业设备故障识别方法

Info

Publication number: CN115081514A
Application number: CN202210546676.5A
Authority: CN
Inventors: 马延庆; 高运兴; 万斌; 尚建华; 韩增永; 丁申; 秦松; 王辉; 冉亮; 许玉伟; 张奇; 柳晓
Original assignee: TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd
Current assignee: TaiAn Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority date: 2022-05-19
Filing date: 2022-05-19
Publication date: 2022-09-20

Abstract

本发明提供一种数据不平衡情况下的工业设备故障识别方法，采集工业设备运行过程中出现过的故障数据属性信息以及对应故障类别，并对采集数据进行预处理与特征选择；构建卷积神经网络与长短时记忆网络；通过SMOTE过采样技术合成工业设备的少数类故障数据，通过EasyEnsemble欠采样技术处理工业设备的多数类故障数据，得到均衡的故障数据集；通过历史故障数据信息进行训练，通过测试故障数据信息得到工业设备的故障识别结果。本发明对不同故障类别之间的数据不平衡情况，通过挖掘工业设备异常运行数据与故障类型之间的映射关系，对设备的故障进行精准诊断，提高了故障辨识的精度和准度，保证工业设备的稳定运行。

Description

一种数据不平衡情况下的工业设备故障识别方法

技术领域

本发明涉及工业设备运行监控技术领域，尤其涉及一种数据不平衡情况下的工业设备故障识别方法。

背景技术

工业设备是为各个工业企业中常用的装置，工业设备可以为工矿企业提供生产技术装备。工业设备可以应用的行业包括金属制品业、普通机械制造业、专用设备制造业、交通运输设备制造业、电气机械及器材制造业等等。工业设备涉及的行业较广。

工业设备的稳定运行是保证制造业稳定生产，并生产出符合质量要求的重要条件。当前对工业设备的运行监控是有效对工业设备故障进行监控的重要方式。

当前的工业设备故障监控过程无法对故障类别之间的数据不平衡情况进行处理，影响对工业设备故障的诊断，有时无法对故障数据结果进行有效识别，降低了故障输出结果的准确率，进而对制造业稳定生产造成影响，还影响产品质量。

发明内容

本发明提供一种对设备的故障进行精准诊断的数据不平衡情况下的工业设备故障识别方法,

方法包括：

步骤1：采集工业设备运行过程中出现过的故障数据属性信息以及对应故障类别，并对采集数据进行预处理与特征选择；

步骤2：构建卷积神经网络与长短时记忆网络，并将两种神经网络进行结合得到分类模型；

步骤3：通过SMOTE过采样技术合成工业设备的少数类故障数据，通过EasyEnsemble欠采样技术处理工业设备的多数类故障数据，得到均衡的故障数据集；

步骤4：通过历史故障数据信息进行训练，通过测试故障数据信息得到工业设备的故障识别结果。

进一步需要说明的是，步骤1具体包括：

步骤1.1：对于连续数据缺失的样本，采用与其故障类别相同样本的类数据平均值进行填充；

步骤1.2：对于分类数据缺失的样本，采用与其故障类别相同的该类数据的众数进行填充；

步骤1.3：将工业设备所属厂家、设备型号、检定故障原因分类数据处理；

步骤1.4：将故障日期与安装日期作差，得到可替代两者的使用时长；

步骤1.5：对检定故障原因缺失的样本进行删除。

步骤1.6：采用标准化公式对数据进行预处理；

式中：x′为标准化后的数据，x为某一特征原始数据样本，

为样本均值，σ(x)为样本标准差；

步骤1.7：通过距离相关系数对工业设备的输入特征进行选择，过滤掉低相关系数特征，实现输入特征降维并以降维特征作为模型的输入。

进一步需要说明的是，步骤2具体包括以下过程：

步骤2.1：构建卷积神经网络；

步骤2.2：构建长短时记忆网络；

LSTM网络在循环神经网络的基础上增加了一个状态单元c，并通过遗忘门、输入门、输出门控制LSTM网络每个时刻的信息状态；

LSTM网络在t时刻有3个输入：

当前时刻网络的输入值x_t，即经过CNN神经网络特征提取后的工业设备故障数据信息；

上一时刻LSTM网络隐含层的输出值h_t-1；上一时刻的单元状态c_t-1；

LSTM网络在t时刻有2个输出：当前时刻隐含层的输出值h_t和单元状态c_t；

遗忘门决定上一时刻的单元状态c_t-1保留到当前单元状态c_t的信息量；

输入门决定当前时刻网络的输入x_t保存到当前单元状态c_t的信息量；

输出门决定当前单元状态c_t作为当前时刻隐含层输出h_t的信息量；

步骤2.3：将两种神经网络进行结合，将输入数据通过CNN进行特征提取与参数降维，输入到LSTM网络中得到最终分类模型。

进一步需要说明的是，步骤2.1还包括：

卷积神经网络采用局部连接和权值共享的方式，从原始数据中通过卷积层和池化层交替使用来获取有效表征，自动提取数据的局部特征，为LSTM网络提供输入；

卷积神经网络包括：卷积层、池化层和全连接层；通过卷积层和池化层对工业设备故障数据进行特征提取与参数降维，实现特征提取的封装。

遗忘门、输入门以及输出门之间的通过如下公式进行门控：

f_t＝(W_f[h_t-1,x_t]+b_f)

i_t＝σ(W_i[h_t-1,x_t]+b_i)

o_t＝σ(W_o[h_t-1,x_t]+b_o)

式中：f_t、i_t、o_t分别为遗忘门、输入门、输出门；

b_f、b_i、b_c、b_o分别为对应单元的偏置项；

W_f、W_i、W_c、W_o分别为对应单元的权重矩阵；

表示元素按位相乘；

为候选单元状态；σ表示sigmoid激活函数。

进一步需要说明的是，步骤3具体包括以下过程：

步骤3.1：具有n维特征的数据集中两个样本分别为X_i＝(x_i1,x_i2,…,x_in)，X_j＝(x_j1,x_j2,…,x_jn)，样本之间的欧几里得距离为：

式中：x_il和x_jl分别为第i、j个样本的第l个特征变量值；

步骤3.2：选择要进行过采样的类数据集，并输入参数：

输入样本个数T；需要的采样率N为常取100的整数倍；

最邻近样本个数k；

步骤3.3：计算样本集中一个小样本与其他样本之间的欧氏距离，选取k个最邻近的样本；

以k个最近邻样本点为依据，随机选取其中的N/100个临近点，通过下述公式生成新的样本；

X_new＝X_i+rand(0,1)*(X_i-X_near)

式中：X_new为合成的新样本；X_i为选取的原始样本点数据；X_near为选取的邻近点数据；rand(0,1)为0到1之间的随机数；

步骤3.4：将T个样本分别按照步骤3.3过程合成新的样本，得到(N/100)*T个合成样本；

步骤3.5：通过EasyEnsemble算法从多数类样本中有放回的随机采样n次，每次选取与少数类数目近似的样本，得到n个样本集合记作S＝{S₁、S₂、…、S_n}；

步骤3.6：将样本集合S中的每一份与少数类样本结合组成n个训练样本{D₁、D₂、…、D_n}，后续训练时将据此在每一个训练集上得到一个模型，对每个模型的预测结果向量和对应的权重向量做内积，然后减去阈值，根据差的符号确定样本的类别。

进一步需要说明的是，步骤4还包括：

步骤4.1：为保证模型对各故障类别识别能力得到充分的训练，将处理好的数据集根据下式所示的分层抽样方法进行数据集划分，以保证各个故障类别在训练集和测试集中所占比例相同；

式中：train_data_i为故障类别i训练集样本数；data_i为故障类别i总样本数；train_size为训练集所占比例；

步骤4.2：将训练集通过CNN-LSTM进行训练，通过CNN的卷积层进行一维卷积操作以提取故障数据中的更高层次特征信息，通过池化层进行降维；

将得到的特征信息输入到LSTM网络中，对故障数据的时间维度特征进行提取，通过全连接层得到样本的映射结果；

步骤4.3：采用Softmax函数将全连接层的输出转换各个类别的概率：

式中：z_i为全连接层对第i个类别的输出值；n为故障类别总数；

步骤4.4：训练过程中将工业设备实际故障类别标签与训练输出类别标签通过前向传播算法进行损失函数的计算，通过反向传播算法更新各个参数，并以Adam作为优化算法，进而得到精确的分类模型；

步骤4.5：将工业设备故障测试集数据输入到训练好的CNN-LSTM分类模型中，得到设备的故障识别结果；

步骤4.6：构建工业设备分类模型的混淆矩阵，计算真阳性率、假阳性率、真阴性率、假阴性率，得到能够综合体现模型分类性能的指标。

模型分类精度的评价采用各个类别的F1-Score指标以及如下式综合考虑模型对所有故障类别准确率和召回率的指标Micro_F1；

式中：Precision_m表示模型整体准确率；

Recall_m为模型整体召回率；

TP_i表示第i个故障类别的真阳性率；

FP_i表示第i个故障类别的假阳性率；

FN_i表示第i个故障类别的假阴性率；

步骤4.7：通过模型的评估指标对模型进行优化调整。

从以上技术方案可以看出，本发明具有以下优点：

本发明提供的数据不平衡情况下的工业设备故障识别方法中采集工业设备运行过程中出现过的故障数据属性信息以及对应故障类别，并进行预处理与特征选择；通过SMOTE过采样技术合成工业设备的少数类故障数据，通过EasyEnsemble欠采样技术处理工业设备的多数类故障数据，得到均衡的故障数据集；基于历史故障数据信息进行训练，通过现有故障数据信息得到工业设备的故障识别结果。本发明考虑了不同故障类别之间的数据不平衡情况，通过挖掘工业设备异常运行数据与故障类型之间的映射关系，对设备的故障进行精准诊断，提高了故障辨识的精度和准度，保证工业设备的稳定运行。

本发明提供的数据不平衡情况下的工业设备故障识别方法提高故障输出结果的准确率，降低对制造业稳定生产造成的影响，提高产品质量。

附图说明

为了更清楚地说明本发明的技术方案，下面将对描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为数据不平衡情况下的工业设备故障识别方法流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的数据不平衡情况下的工业设备故障识别方法中，所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

本发明提供的数据不平衡情况下的工业设备故障识别方法中，中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

本发明涉及的数据不平衡情况下的工业设备故障识别方法考虑了不同故障类别之间的数据不平衡情况，通过挖掘工业设备异常运行数据与故障类型之间的映射关系，对设备的故障进行精准诊断。

方法具体包括:如图1所示，

S101：采集工业设备运行过程中出现过的故障数据属性信息以及对应故障类别，并对采集数据进行预处理与特征选择；

步骤101具体包括以下过程：

步骤1.1：对于连续数据缺失的样本，采用与其故障类别相同样本的该类数据平均值进行填充。

步骤1.2：对于分类数据缺失的样本，采用与其故障类别相同的该类数据的众数进行填充。

步骤1.3：将工业设备所属厂家、设备型号、检定故障原因等分类数据处理如下表所示的one-hot编码，此处以变压器故障状态数据为例；

表1变压器状态对应的One-hot编码

步骤1.4：将故障日期与安装日期作差，得到可替代两者的新连续特征“使用时长”；

步骤1.5：由于所用模型为有监督学习，故对检定故障原因缺失的样本进行删除；数据集中不足10个样本的故障类别缺少同类故障特征多样性，难以验证算法对于该类故障的泛化性，因此舍去；

步骤1.6：工业设备不同特征之间量纲不同，同时数量级之间也有差别，需要进行特征缩放。缩放后的多维度特征无量纲且具有相近的尺度，可以使梯度下降算法更快的收敛，采用标准化公式对数据进行预处理。

式中：x′为标准化后的数据，x为某一特征原始数据样本，

为样本均值，σ(x)为样本标准差。

步骤1.7：通过距离相关系数对工业设备的输入特征进行选择，过滤掉低相关系数特征，实现特征降维并以该特征作为模型的输入，避免特征冗余影响模型性能。

本发明以变压器设备为例，假设采集到的样本数据个数为n，定义X样本为C₂H₂、CH₄、C₂H₆、C₂H₂等特征数据，Y样本为变压器故障类型，两个样本间距离相关系数公式如下：

式中：R²(X,Y)为X,Y两样本数据的距离相关系数；X_i、X_j、X_k、X_l分别为某一输入特征数据集中第i、j、k、l个样本；X_i、X_j、X_k、X_l为故障类型数据中第i、j、k、l个样本。v²(X,X)、v²(Y,Y)均可通过上述公式求出。

S102：构建卷积神经网络与长短时记忆网络，并将两种神经网络进行结合得到分类模型；

步骤102具体包括：

步骤2.1：构建卷积神经网络(CNN)。卷积神经网络采用局部连接和权值共享的方式，直接从原始数据中通过卷积层和池化层交替使用来获取有效表征，自动提取数据的局部特征，为LSTM网络提供输入，进而提高模型分类精度。

CNN一般包含三层结构，分别为：卷积层、池化层和全连接层。其中，卷积层在输入数据上应用一组过滤器，也称为卷积核，每个过滤器在输入数据上滑动以提取数据中的特征向量，通过局部感知特性减少模型的计算参数；池化层主要进行欠采样，用于特征降维和压缩参数数量，提高模型的容错性，减少过拟合；全连接层也称输出层，对前几层学习到的高质量特征进行处理，利用相应激活函数得到最终输出结果。

在本方法中应用其卷积层和池化层对工业设备故障数据进行特征提取与参数降维，这种网络结构既减少了权重参数数量，又实现了特征提取的封装，进而提高输出结果的准确率。

步骤2.2：构建长短时记忆网络(LSTM)。LSTM在循环神经网络(RNN)的基础上增加了一个状态单元c，并通过遗忘门、输入门、输出门控制LSTM网络每个时刻的信息状态。LSTM网络在t时刻有3个输入：当前时刻网络的输入值x_t，即经过CNN神经网络特征提取后的智能电表故障数据信息；上一时刻LSTM网络隐含层的输出值h_t-1；上一时刻的单元状态c_t-2。LSTM网络在t时刻有2个输出：当前时刻隐含层的输出值h_t和单元状态c_t。

遗忘门决定上一时刻的单元状态c_t-1保留到当前单元状态c_t的信息量；输入门决定当前时刻网络的输入x_t保存到当前单元状态c_t的信息量；输出门决定当前单元状态c_t作为当前时刻隐含层输出h_t的信息量。

具体公式如下：

f_t＝σ(W_f[h_t-1,x_t]+b_f)

i_t＝σ(W_i[h_t-1,x_t]+b_i)

o_t＝σ(W_o[h_t-1,x_t]+b_o)

式中：f_t、i_t、o_t分别为遗忘门、输入门、输出门的门控；

b_f、b_i、b_c、b_o分别为对应单元的偏置项；W_f、W_i、W_c、W_o分别为对应单元的权重矩阵；

表示元素按位相乘；

为候选单元状态；σ表示sigmoid激活函数。

步骤S103：通过SMOTE过采样技术合成工业设备的少数类故障数据，通过EasyEnsemble欠采样技术处理工业设备的多数类故障数据，得到均衡的故障数据集；

步骤103具体包括：

步骤3.1：具有n维特征的数据集中两个样本分别为X_i＝(x_i1,x_i2,…,x_in)，X_j＝(x_j1,x_j2,…,x_jn)，那么样本之间的欧几里得距离为：

式中：x_il和x_jl分别为第i、j个样本的第l个特征变量值。

步骤3.2：选择要进行过采样的类数据集，并输入参数：其输入样本个数T；所需要的采样率N(常取100的整数倍)；最邻近样本个数k；

步骤3.3：计算样本集中一个小样本与其他样本之间的欧氏距离，选取k个最邻近的样本。然后以该样本点的k个最近邻样本点为依据，随机选取其中的N/100个临近点，通过下述公式生成新的样本；

X_new＝X_i+rand(0,1)*(X_i-_near)

式中：X_new为合成的新样本；X_i为选取的原始样本点数据；X_near为选取的邻近点数据；rand(0,1)为0到1之间的随机数。

步骤3.4：将T个样本分别按照上述过程合成新的样本，得到(N/100)*T个合成样本；

步骤3.5：通过EasyEnsemble算法从多数类样本中有放回的随机采样n次，每次选取与少数类数目近似的样本，那么可得到n个样本集合记作S＝{S₁、S₂、…、S_n}；

步骤S104：通过历史故障数据信息进行训练，通过测试故障数据信息得到工业设备的故障识别结果。

步骤4.1：为保证模型对各故障类别识别能力得到充分的训练，将处理好的数据集根据下式所示的分层抽样方法进行数据集划分，以保证各个故障类别在训练集和测试集中所占比例相同，前者负责训练模型，后者负责模型评估。

式中：train_data_i为故障类别i训练集样本数；data_i为故障类别i总样本数；train_size为训练集所占比例。

步骤4.2：将训练集通过CNN-LSTM进行训练，通过CNN的卷积层进行一维卷积操作以提取智能电表故障数据中的更高层次特征信息，通过池化层进行降维以减少运算参数，避免在大量生成数据的同时导致过拟合现象。然后将得到的特征信息输入到LSTM网络中，对故障数据的时间维度特征进行提取，进而通过全连接层得到样本的映射结果；

式中：z_i为全连接层对第i个类别的输出值；n为故障类别总数。

步骤4.4：训练过程中将工业设备实际故障类别标签与训练输出类别标签通过前向传播算法进行损失函数的计算，通过反向传播算法更新各个参数，并以Adam作为优化算法，进而得到精确的分类模型。

步骤4.5：将工业设备故障测试集数据输入到训练好的CNN-LSTM分类模型中，得到设备的故障识别结果。

步骤4.6：构建工业设备分类模型的混淆矩阵，通过它计算真阳性率(TP)、假阳性率(FP)、真阴性率(TN)、假阴性率(FN)，进而得到能够综合体现模型分类性能的指标。本方法中模型分类精度的评价采用各个类别的F1-Score指标以及如下式所示可以综合考虑模型对所有故障类别准确率和召回率的指标Micro_F1。

式中：Precisi n_m表示模型整体准确率；Recall_m为模型整体召回率；TP_i表示第i个故障类别的真阳性率；FP_i表示第i个故障类别的假阳性率；FN_i表示第i个故障类别的假阴性率。

步骤4.7：通过模型的评估指标对模型进行优化调整，提高故障识别准确率。

本发明提供的数据不平衡情况下的工业设备故障识别方法是结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属技术领域的技术人员能够理解，本发明提供的数据不平衡情况下的工业设备故障识别方法的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。