CN110689203A - 基于自编码器的火电厂一次风机故障预警方法 - Google Patents

基于自编码器的火电厂一次风机故障预警方法 Download PDF

Info

Publication number
CN110689203A
CN110689203A CN201910951862.5A CN201910951862A CN110689203A CN 110689203 A CN110689203 A CN 110689203A CN 201910951862 A CN201910951862 A CN 201910951862A CN 110689203 A CN110689203 A CN 110689203A
Authority
CN
China
Prior art keywords
self
data
encoder
early warning
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910951862.5A
Other languages
English (en)
Inventor
路宽
赵岩
高嵩
庞向坤
孟祥荣
杨兴森
王海超
孙雯雪
李军
韩英昆
蒋哲
颜庆
于庆彬
周长来
孙萌萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201910951862.5A priority Critical patent/CN110689203A/zh
Publication of CN110689203A publication Critical patent/CN110689203A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Computing Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于自编码器的火电厂一次风机故障预警方法,包括以下步骤:S1,在整个数据集中挑选出风机正常运行时的数据,划分成训练集、验证集和测试集;S2,对各个测点的测量值根据训练集、验证集和测试集的最大值、最小值进行归一化处理;S3,建立自编码器模型并进行模型训练;S4,计算测试集的自编码器模型输出与输入值的测试残差;S5,对测试集数据残差进行均值和标准差的滚动计算,并确定阈值;S6,利用自编码器模型计算风机运行实时数据的残差,并将残差与阈值比较确定设备状态,并根据设备状态进行预警。

Description

基于自编码器的火电厂一次风机故障预警方法
技术领域
本发明涉及一种基于自编码器的火电厂一次风机故障预警方法,属于电力设备技术领域。
背景技术
一次风机是火力发电厂的重要辅助设备,其通过输出一定流量和压力的一次风来为锅炉燃烧系统稳定运行提供保障。由于一次风机所处环境较为复杂,这将严重影响着设备安全可靠的运行。一旦设备发生故障,主机生产线将会关闭,导致严重的经济损失,甚至是人身安全。
目前,由于电厂系统的复杂性,一次风机故障预警主要使用了基于数据驱动的方法实现,包括多变量统计方法,神经网络方法,支持向量机等。其中,多元状态估计技术(MSET)是由Singer于1995年提出,现已在核电传感器校验、设备监测和电子产品寿命预测等方面取得了成功的应用。这种方法具有非参数设置、计算速度快以及方便部署等诸多优点。但记忆矩阵中向量之间的线性相关性会对导致模型无法求得最优解,因此需要使用主成份分析(PCA)进行线性关系剔除,同时设计非线性算子以保证矩阵的可逆性。这里,PCA由于无法对变量之间的非线性关系进行识别,同时非线性算子的设计也存在一定的困难,这都导致了MSET难以得到鲁棒性的结果。
火电厂中影响一次风机工况的指标复杂且多样,面对高维度数据时,传统的多元状态估计技术(MSET)方法需要解决特征压缩和矩阵的可逆性问题。此外,随着数据量的增大,传统算法的计算速度也将显著下降,影响模型在实际中的工作效果。
发明内容
针对以上方法存在的不足,本发明提出了一种基于自编码器的火电厂一次风机故障预警方法,其判断火电厂一次风机测点数据的状态,对异常数据进行及时预警。
本发明解决其技术问题采取的技术方案是:
一方面,本发明实施例提供的一种基于自编码器的火电厂一次风机故障预警方法,包括以下步骤:
S1,在整个数据集中挑选出风机正常运行时的数据,划分成训练集、验证集和测试集;
S2,对各个测点的测量值根据训练集、验证集和测试集的最大值、最小值进行归一化处理;
S3,建立自编码器模型并进行模型训练;
S4,计算测试集的自编码器模型输出与输入值的测试残差;
S5,对测试集数据残差进行均值和标准差的滚动计算,并确定阈值;
S6,利用自编码器模型计算风机运行实时数据的残差,并将残差与阈值比较确定设备状态,并根据设备状态进行预警。
作为本实施例一种可能的实现方式,所述归一化处理的公式为:
Figure BDA0002222866800000021
这里,x是一个由实数组成的向量,xmax和xmin是分别由x在每个维度上的最大值和最小值组成的向量。
作为本实施例一种可能的实现方式,所述建立自编码器模型并进行模型训练的过程包括:
S31,选取一次风机出口压力、A相电流、前后轴震动、出口风量、润滑油压力的指标作为一次风机运行状态判断的依据;
S32,构建自编码神经网络,自编码神经网络的输入和输出层的激活函数选择sigmoid激活函数,中间层的激活函数选择tanh激活函数;
其中,sigmoid函数的表达式为:
Figure BDA0002222866800000031
tanh激活函数的表达式为:
tanh(x)=2sig(x)-1;
S33,运用自适应矩估计优化算法(ADAM)进行梯度下降寻优计算,最小化的目标函数为:
其中,
Figure BDA0002222866800000033
表示
Figure BDA0002222866800000034
与x之间的欧几里得距离;
Figure BDA0002222866800000035
Figure BDA0002222866800000036
是损失函数的l2正则化项,Wij是权重系数,λ是修正系数;K表示网络的层数,L表示每一层神经元的个数;
S34,利用训练集数据进行训练并通过验证集数据进行验证。
作为本实施例一种可能的实现方式,所述确定阈值的过程为:
给定窗口中残差的均值E和标准差S作为衡量设备异常状态的指标,有:
Figure BDA0002222866800000037
Figure BDA0002222866800000038
其中:i表示第i个窗口期,l为窗口宽度,rk表示第k个样本与其预测值的欧几里得距离;
根据预先设置好的窗口宽度滚动计算测试集的残差均值
Figure BDA00022228668000000310
和标准差
Figure BDA00022228668000000311
得到
Figure BDA00022228668000000312
Figure BDA00022228668000000313
设置阈值系数λmean和λstd,得到残差均值和残差标准差的阈值
Figure BDA00022228668000000314
另一方面,本发明实施例提供的一种基于自编码器的火电厂一次风机故障预警方法,包括以下步骤:
步骤1,数据预处理;
步骤2,构建自编码器模型;
步骤3,模型训练;
步骤4,阈值计算;
步骤5,计算风机运行实时数据的残差,并将残差与阈值比较确定设备状态,并根据设备状态进行预警。
作为本实施例一种可能的实现方式,所述数据预处理过程为对输入数据进行标准化处理。
作为本实施例一种可能的实现方式,所述标准化处理为将数据利用归一化公式的均值和向量统一到0和1上;所述归一化公式为:
这里,x是一个由实数组成的向量,xmax和xmin是分别由x在每个维度上的最大值和最小值组成的向量。
作为本实施例一种可能的实现方式,所述建立自编码器模型的过程为:
选取一次风机出口压力、A相电流、前后轴震动、出口风量、润滑油压力的指标作为一次风机运行状态判断的依据;
构建自编码神经网络,自编码神经网络的输入和输出层的激活函数选择sigmoid激活函数,中间层的激活函数选择tanh激活函数;
其中,sigmoid函数的表达式为:
Figure BDA0002222866800000042
tanh激活函数的表达式为:
tanh(x)=2sig(x)-1。
作为本实施例一种可能的实现方式,所述模型训练的过程为:
运用自适应矩估计优化算法(ADAM)进行梯度下降寻优计算,最小化的目标函数为:
其中,
Figure BDA0002222866800000052
表示
Figure BDA0002222866800000053
与x之间的欧几里得距离;
Figure BDA0002222866800000054
Figure BDA0002222866800000055
是损失函数的l2正则化项,Wij是权重系数,λ是修正系数;K表示网络的层数,L表示每一层神经元的个数;
利用训练集数据进行训练并通过验证集数据进行验证。
作为本实施例一种可能的实现方式,所述阈值计算的过程为:
给定窗口中残差的均值E和标准差S作为衡量设备异常状态的指标,有:
Figure BDA0002222866800000056
Figure BDA0002222866800000058
其中:i表示第i个窗口期,l为窗口宽度,rk表示第k个样本与其预测值的欧几里得距离;
根据预先设置好的窗口宽度滚动计算测试集的残差均值
Figure BDA0002222866800000059
和标准差
Figure BDA00022228668000000510
得到
Figure BDA00022228668000000511
Figure BDA00022228668000000512
设置阈值系数λmean和λstd,得到残差均值和残差标准差的阈值
Figure BDA00022228668000000513
本发明实施例的技术方案可以具有的有益效果如下:
本发明能够实现一次风机监测点的无监督自学习,挖掘不同维度向量之间的非线性关系;同时,通过对正常运行数据的学习,训练后的自编码器可以被看作是MSET中优化后的记忆矩阵,其取代了MEST矩阵求逆过程中对非线性算子的选择。当新的测点输入到子编码器后,以输出结果与原始数据之间的平均欧机里德距离作为预测残差,计算滚动窗口期内该残差项的平均值和标准差的变化趋势,通过判断测点数据的状态,对异常数据进行及时预警。
本发明不仅能够实现一次风机监测点的无监督自学习,自动实现高维数据降维,挖掘特征间的非线性关系;而且训练完成后的自编码网络作为优化后的MSET模型,避免了矩阵求逆过程中的非线性算子设计困难。本发明的自编码器模型应用于实际,以残差均值阈值和残差标准差阈值作为判断设备运行状态的标准,取得了一定的效果。
附图说明:
图1是自编码器网络结构图;
图2是根据一示例性实施例示出的一种基于自编码器的火电厂一次风机故障预警方法的流程图;
图3是根据一示例性实施例示出的另一种基于自编码器的火电厂一次风机故障预警方法的流程图;
图4是残差均值变化与预警点图;
图5是残差标准变化与预警点图;
图6是残差均值-标准差走势图。
具体实施方式
下面结合附图与实施例对本发明做进一步说明:
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
Hinton于2006年提出一种称为“自动编码器”的无监督学习网络来实现对高维数据进行特征压缩。目前,该方法已经在语音识别、图像识别等领域得到了广泛应用,并取得了显著的成果。
自编码器(AutoEncoder)是前馈神经网络的一种。它主要是由输入层、中间层和输出层组成的3层神经网络结构,其中输入层、输出层具有相同的维度。AE的训练包括编码和解码两个过程。其中:编码过程将输入数据的高维特征转换成中间层的低维特征;解码过程将经过转化的低维特征再进行特征重构,输出与输入维度相等的数据,如图1所示。
在基本的自编码器模型中,xii∈1,...,n表示自编码器的输入,其中:n是输入数据的特征维度;hjj∈1,...,m是中间层的神经元,且m<n;
Figure BDA0002222866800000071
n是输出的估计值。在编码过程中,自编码器首先将向量x与权重W和截距b进行线性加权计算,然后通过激活函数f(x)得到中间层的计算结果。
h=f(Wx+b) (1)
在解码过程中,中间层按照同样的方式先线性加权再通过激活函数进而计算出重构的估计值
Figure BDA0002222866800000072
计算过程如下:
Figure BDA0002222866800000073
其中,W′和b′是输出层的权重系数和截距。
自编码器作为无监督学习,输入值和标签集均取同一数据集,训练的目标就是要最小化数据x与之间的重构误差。损失函数的表达式为:
Figure BDA0002222866800000075
注意,这里的α∑(θ2)是一个正则化项,用于减少权重,防止模型过拟合。其中θ代表第l层相邻两个神经元之间的权重
Figure BDA0002222866800000076
f′θ与f′(W′x+b′)含义相同。
图2是根据一示例性实施例示出的一种基于自编码器的火电厂一次风机故障预警方法的流程图。如图2所示,本发明实施例提供的一种基于自编码器的火电厂一次风机故障预警方法,包括以下步骤:
S1,在整个数据集中挑选出风机正常运行时的数据,划分成训练集、验证集和测试集;
S2,对各个测点的测量值根据训练集、验证集和测试集的最大值、最小值进行归一化处理;
S3,建立自编码器模型并进行模型训练;
S4,计算测试集的自编码器模型输出与输入值的测试残差;
S5,对测试集数据残差进行均值和标准差的滚动计算,并确定阈值;
S6,利用自编码器模型计算风机运行实时数据的残差,并将残差与阈值比较确定设备状态,并根据设备状态进行预警。
作为本实施例一种可能的实现方式,所述归一化处理的公式为:
Figure BDA0002222866800000081
这里,x是一个由实数组成的向量,xmax和xmin是分别由x在每个维度上的最大值和最小值组成的向量。
作为本实施例一种可能的实现方式,所述建立自编码器模型并进行模型训练的过程包括:
S31,选取一次风机出口压力、A相电流、前后轴震动、出口风量、润滑油压力的指标作为一次风机运行状态判断的依据;
S32,构建自编码神经网络,自编码神经网络的输入和输出层的激活函数选择sigmoid激活函数,中间层的激活函数选择tanh激活函数;
其中,sigmoid函数的表达式为:
Figure BDA0002222866800000082
tanh激活函数的表达式为:
tanh(x)=2sig(x)-1;
S33,运用自适应矩估计优化算法(ADAM)进行梯度下降寻优计算,最小化的目标函数为:
其中,
Figure BDA0002222866800000092
表示
Figure BDA0002222866800000093
与x之间的欧几里得距离;
Figure BDA0002222866800000095
是损失函数的l2正则化项,Wij是权重系数,λ是修正系数;K表示网络的层数,L表示每一层神经元的个数;
S34,利用训练集数据进行训练并通过验证集数据进行验证。
作为本实施例一种可能的实现方式,所述确定阈值的过程为:
给定窗口中残差的均值E和标准差S作为衡量设备异常状态的指标,有:
Figure BDA0002222866800000096
Figure BDA0002222866800000097
Figure BDA0002222866800000098
其中:i表示第i个窗口期,l为窗口宽度,rk表示第k个样本与其预测值的欧几里得距离;
根据预先设置好的窗口宽度滚动计算测试集的残差均值和标准差
Figure BDA00022228668000000910
得到
Figure BDA00022228668000000911
Figure BDA00022228668000000912
设置阈值系数λmean和λstd,得到残差均值和残差标准差的阈值
Figure BDA00022228668000000913
图3是根据一示例性实施例示出的另一种基于自编码器的火电厂一次风机故障预警方法的流程图。如图3所示,本发明实施例提供的一种基于自编码器的火电厂一次风机故障预警方法,包括以下步骤:
步骤1,数据预处理;
步骤2,构建自编码器模型;
步骤3,模型训练;
步骤4,阈值计算;
步骤5,计算风机运行实时数据的残差,并将残差与阈值比较确定设备状态,并根据设备状态进行预警。所述根据设备状态进行预警为判断设备测点数据的状态,对异常数据进行及时预警。
作为本实施例一种可能的实现方式,所述数据预处理过程为对输入数据进行标准化处理。
作为本实施例一种可能的实现方式,所述标准化处理为将数据利用归一化公式的均值和向量统一到0和1上;所述归一化公式为:
Figure BDA0002222866800000101
这里,x是一个由实数组成的向量,xmax和xmin是分别由x在每个维度上的最大值和最小值组成的向量。
作为本实施例一种可能的实现方式,所述建立自编码器模型的过程为:
选取一次风机出口压力、A相电流、前后轴震动、出口风量、润滑油压力的指标作为一次风机运行状态判断的依据;
构建自编码神经网络,自编码神经网络的输入和输出层的激活函数选择sigmoid激活函数,中间层的激活函数选择tanh激活函数。
其中,sigmoid函数的表达式为:
Figure BDA0002222866800000102
tanh激活函数的表达式为:
tanh(x)=2sig(x)-1。
作为本实施例一种可能的实现方式,所述模型训练的过程为:
运用自适应矩估计优化算法(ADAM)进行梯度下降寻优计算,最小化的目标函数为:
Figure BDA0002222866800000103
其中,
Figure BDA0002222866800000111
表示与x之间的欧几里得距离;
Figure BDA0002222866800000113
Figure BDA0002222866800000114
是损失函数的l2正则化项,Wij是权重系数,λ是修正系数;K表示网络的层数,L表示每一层神经元的个数;
利用训练集数据进行训练并通过验证集数据进行验证。
作为本实施例一种可能的实现方式,所述阈值计算的过程为:
给定窗口中残差的均值E和标准差S作为衡量设备异常状态的指标,有:
Figure BDA0002222866800000115
Figure BDA0002222866800000117
其中:i表示第i个窗口期,l为窗口宽度,rk表示第k个样本与其预测值的欧几里得距离;
根据预先设置好的窗口宽度滚动计算测试集的残差均值
Figure BDA0002222866800000118
和标准差
Figure BDA0002222866800000119
得到
Figure BDA00022228668000001110
设置阈值系数λmean和λstd,得到残差均值和残差标准差的阈值
Figure BDA00022228668000001112
下面从数据处理、模型建立、阈值计算和数据实验等方面对本发明进行详细说明。
1、数据预处理
为了防止神经元发生过饱和,需要对输入数据进行标准化处理。此外,标准化可以将数据的均值和向量统一到0和1上,这将使目标函数在学习的过程中不会因某一维度偏离过大而受到影响。这里归一化数据的公式为:
Figure BDA00022228668000001113
这里,x是一个由实数组成的向量,xmax和xmin是分别由x在每个维度上的最大值和最小值组成的向量。
2、模型构建
本发明选取一次风机出口压力、A相电流、前后轴震动、出口风量、润滑油压力等10个维度的指标作为一次风机运行状态判断的依据,见表1,形成输入数据集xi10,其中,i代表时刻、10表示特征维度的数量。
表1影响电厂一次风机运行状态的指标:
序号 测点名称
1 一次风机出口压力
2 一次风机A相电流
3 一次风机前轴承震动
4 一次风机后轴承震动
5 一次风机出口风量
6 一次风机电机润滑油压力
7 一次风机前轴承温度1
8 一次风机前轴承温度2
9 一次风机后轴承温度1
10 一次风机后轴承温度2
模型训练与预警的过程如下:
首先,运用专家判断法,在整个数据集中挑选出风机正常运行时的数据,划分成训练集、验证集和测试集。其次,由于风机测点的量纲不同,且不同测点数据绝对值相差很大,为保证自编码器在训练的过程中不发生神经元过饱和,需要对各个测点的测量值根据各自的极值进行归一化处理,使实际测量值映射到[0,1]区间。第三,构建自编码神经网络。在激活函数的选择上,输入和输出层的激活函数选择sigmoid激活函数,中间层的激活函数选择tanh激活函数。第四,运用自适应矩估计优化算法(ADAM)进行梯度下降寻优计算,最小化的目标函数表示为:
Figure BDA0002222866800000131
其中,
Figure BDA0002222866800000132
表示
Figure BDA0002222866800000133
与x之间的欧几里得距离;
Figure BDA0002222866800000135
是损失函数的l2正则化项,Wij是权重系数,λ是修正系数;K表示网络的层数,L表示每一层神经元的个数;
因此,通过自编码器训练完成的网络相当于对多元状态估计技术(MSET)下过程记忆矩阵进行了非线性的特征维度压缩。同时,由于新输入数据可以直接带入训练完成后的模型中计算残差。这就避开了MSET在最小二乘法(least square method)寻优计算过程中,发生的因矩阵不可逆而存在非唯一最优解的问题。
3、阈值计算
由于训练完成的自编码器学习到了一次风机正常工况下的设备状态,因此当新的观测值来自正常工作的设备时,模型输出与输入之间的残差应该很小;但当新的观测值来自异常的工况状态下时,残差会变大。特别是在设备发生故障的早期阶段起,这种异常的残差应该具有累计变大的趋势。在这里,我们选择了给定窗口中残差的均值E和标准差S作为衡量设备异常状态的指标,有:
Figure BDA0002222866800000136
Figure BDA0002222866800000137
Figure BDA0002222866800000138
其中:i表示第i个窗口期,l为窗口宽度,rk表示第k个样本与其预测值的欧几里得距离;
针对正常数据中的测试集计算残差,并根据预先设置好的窗口宽度滚动计算
Figure BDA0002222866800000141
Figure BDA0002222866800000142
得到
Figure BDA0002222866800000143
Figure BDA0002222866800000144
同时,设置阈值系数λmean和λstd,可以得到残差均值和残差标准差的阈值
Figure BDA0002222866800000145
Figure BDA0002222866800000146
使用这种方法进行预警阈值设置的好处是计算简单,同时,随着训练数据集的不断增加,阈值具备可更新性。
4、数据实验结果
实验数据取自山东省东部某发电公司的PI数据库,时间范围为:2018年11月1日至11月30日,共计156000个有效数据,时间间隔为10秒,其中故障数据有1000个。在训练的过程中,按照50%、30%和20%的比例,将155000个数据划分成训练集、验证集和测试集。其中,测试集用来计算残差均值和残差标准差的阈值E*和S*。注意,这里对残差的向量进行了归一化的处理,将其压缩到[0,1]范围内。同时,为简单起见,令λmean=λstd=1.1,则计算得出的均值阈值为0.66,标准差阈值为0.6。整个模型的计算过程如图2或图3所示:
下面的图4和图5分别给出了模型基于残差的均值阈值和标准差阈值的设备故障预警效果。图4显示有1413个数据超过了E*,图5显示有709个数据超过了S*。通过对以上结果的分析我们可以看出,(1)基于均值的阈值对设备故障预警的判断早于设备故障发生的时刻,其准确率为70.77%,但召回率达到100%。这说明,虽然模型会存在部分程度上的误判问题,但所有的故障数据都没有错过。(2)基于标准差的阈值对设备故障预警的判断贡献较小,准确率为36.81%,召回率只有26.1%。这说明,从残差的标准差分布来看,正常数据和异常数据之间在标准差方面相差并不大。(3)对归一化后的残差标准差进行滚动求平均,窗口设置为100,根据图6可以看出,随着残差均值的上升,标准差的均值也呈上升状态。这说明,在某种程度上,残差的标准差能否反映出数据的异常性。因此,需要进一步故障数据集以发挥残差标准差阈值的作用。
本发明能够实现一次风机监测点的无监督自学习,挖掘不同维度向量之间的非线性关系;同时,通过对正常运行数据的学习,训练后的自编码器可以被看作是MSET中优化后的记忆矩阵,其取代了MEST矩阵求逆过程中对非线性算子的选择。当新的测点输入到子编码器后,以输出结果与原始数据之间的平均欧机里德距离作为预测残差,计算滚动窗口期内该残差项的平均值和标准差的变化趋势,可以判断测点数据的状态,对异常数据进行及时预警。
本发明不仅能够实现一次风机监测点的无监督自学习,自动实现高维数据降维,挖掘特征间的非线性关系;而且训练完成后的自编码网络作为优化后的MSET模型,避免了矩阵求逆过程中的非线性算子设计困难。本发明的自编码器模型应用于实际,以残差均值阈值和残差标准差阈值作为判断设备运行状态的标准,取得了一定的效果。
以上所述只是本发明的优选实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也被视作为本发明的保护范围。

Claims (10)

1.一种基于自编码器的火电厂一次风机故障预警方法,其特征是,包括以下步骤:
S1,在整个数据集中挑选出风机正常运行时的数据,划分成训练集、验证集和测试集;
S2,对各个测点的测量值根据训练集、验证集和测试集的最大值、最小值进行归一化处理;
S3,建立自编码器模型并进行模型训练;
S4,计算测试集的自编码器模型输出与输入值的计算残差;
S5,对测试集数据残差进行均值和标准差的滚动计算,并确定阈值;
S6,利用自编码器模型计算风机运行实时数据的残差,并将残差与阈值比较确定设备状态,并根据设备状态进行预警。
2.根据权利要求1所述的基于自编码器的火电厂一次风机故障预警方法,其特征是,所述归一化处理的公式为:
Figure FDA0002222866790000011
这里,x是一个由实数组成的向量,xmax和xmin是分别由x在每个维度上的最大值和最小值组成的向量。
3.根据权利要求2所述的基于自编码器的火电厂一次风机故障预警方法,其特征是,所述建立自编码器模型并进行模型训练的过程包括:
S31,选取一次风机出口压力、A相电流、前后轴震动、出口风量、润滑油压力的指标作为一次风机运行状态判断的依据;
S32,构建自编码神经网络,自编码神经网络的输入和输出层的激活函数选择sigmoid激活函数,中间层的激活函数选择tanh激活函数;
其中,sigmoid函数的表达式为:
Figure FDA0002222866790000012
tanh激活函数的表达式为:
tanh(x)=2sig(x)-1;
S33,运用自适应矩估计优化算法进行梯度下降寻优计算,最小化的目标函数为:
Figure FDA0002222866790000021
其中,
Figure FDA0002222866790000026
表示
Figure FDA0002222866790000029
与x之间的欧几里得距离;
Figure FDA0002222866790000028
是损失函数的l2正则化项,
Figure FDA0002222866790000027
是权重系数,λ是修正系数;K表示网络的层数,L表示每一层神经元的个数;
S34,利用训练集数据进行训练并通过验证集数据进行验证。
4.根据权利要求3所述的基于自编码器的火电厂一次风机故障预警方法,其特征是,所述确定阈值的过程为:
给定窗口中残差的均值E和标准差S作为衡量设备异常状态的指标,有:
Figure FDA0002222866790000022
Figure FDA0002222866790000023
Figure FDA0002222866790000024
其中:i表示第i个窗口期,l为窗口宽度,rk表示第k个样本与其预测值的欧几里得距离;
根据预先设置好的窗口宽度滚动计算测试集的残差均值
Figure FDA00022228667900000213
和标准差得到
Figure FDA00022228667900000211
Figure FDA00022228667900000212
设置阈值系数λmean和λstd,得到残差均值和残差标准差的阈值
Figure FDA0002222866790000025
5.一种基于自编码器的火电厂一次风机故障预警方法,其特征是,包括以下步骤:
步骤1,数据预处理;
步骤2,构建自编码器模型;
步骤3,模型训练;
步骤4,阈值计算;
步骤5,计算风机运行实时数据的残差,并将残差与阈值比较确定设备状态,并根据设备状态进行预警。
6.根据权利要求5所述的基于自编码器的火电厂一次风机故障预警方法,其特征是,所述数据预处理过程为对输入数据进行标准化处理。
7.根据权利要求6所述的基于自编码器的火电厂一次风机故障预警方法,其特征是,所述标准化处理为将数据利用归一化公式的均值和向量统一到0和1上;所述归一化公式为:
Figure FDA0002222866790000031
这里,x是一个由实数组成的向量,xmax和xmin是分别由x在每个维度上的最大值和最小值组成的向量。
8.根据权利要求5所述的基于自编码器的火电厂一次风机故障预警方法,其特征是,所述建立自编码器模型的过程为:
选取一次风机出口压力、A相电流、前后轴震动、出口风量、润滑油压力的指标作为一次风机运行状态判断的依据;
构建自编码神经网络,自编码神经网络的输入和输出层的激活函数选择sigmoid激活函数,中间层的激活函数选择tanh激活函数;
其中,sigmoid函数的表达式为:
Figure FDA0002222866790000032
tanh激活函数的表达式为:
tanh(x)=2sig(x)-1
x是一个由实数组成的向量。
9.根据权利要求8所述的基于自编码器的火电厂一次风机故障预警方法,其特征是,所述模型训练的过程为:
运用自适应矩估计优化算法进行梯度下降寻优计算,最小化的目标函数为:
Figure FDA0002222866790000041
其中,
Figure FDA0002222866790000046
表示
Figure FDA0002222866790000048
与x之间的欧几里得距离;
Figure FDA0002222866790000049
是损失函数的l2正则化项,
Figure FDA0002222866790000047
是权重系数,λ是修正系数;K表示网络的层数,L表示每一层神经元的个数;
利用训练集数据进行训练并通过验证集数据进行验证。
10.根据权利要求9所述的基于自编码器的火电厂一次风机故障预警方法,其特征是,所述阈值计算的过程为:
给定窗口中残差的均值E和标准差S作为衡量设备异常状态的指标,有:
Figure FDA0002222866790000042
Figure FDA0002222866790000043
Figure FDA0002222866790000044
其中:i表示第i个窗口期,l为窗口宽度,rk表示第k个样本与其预测值的欧几里得距离;
根据预先设置好的窗口宽度滚动计算测试集的残差均值
Figure FDA00022228667900000413
和标准差得到
Figure FDA00022228667900000411
Figure FDA00022228667900000412
设置阈值系数λmean和λstd,得到残差均值和残差标准差的阈值
CN201910951862.5A 2019-09-30 2019-09-30 基于自编码器的火电厂一次风机故障预警方法 Pending CN110689203A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910951862.5A CN110689203A (zh) 2019-09-30 2019-09-30 基于自编码器的火电厂一次风机故障预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910951862.5A CN110689203A (zh) 2019-09-30 2019-09-30 基于自编码器的火电厂一次风机故障预警方法

Publications (1)

Publication Number Publication Date
CN110689203A true CN110689203A (zh) 2020-01-14

Family

ID=69111620

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910951862.5A Pending CN110689203A (zh) 2019-09-30 2019-09-30 基于自编码器的火电厂一次风机故障预警方法

Country Status (1)

Country Link
CN (1) CN110689203A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111720296A (zh) * 2020-06-11 2020-09-29 浙江浙能技术研究院有限公司 一种基于自编码器的汽动给水泵设备异常状态预警方法
CN112067335A (zh) * 2020-09-03 2020-12-11 华能国际电力股份有限公司玉环电厂 一种基于多元状态估计的电厂送风机故障预警方法
CN112488326A (zh) * 2020-11-09 2021-03-12 广州瀚信通信科技股份有限公司 基于5g核心网的智能运维故障预警方法及装置
CN112530526A (zh) * 2020-12-09 2021-03-19 浙江浙能北仑发电有限公司 飞灰含碳量预测方法、装置和电子设备
CN112580699A (zh) * 2020-12-04 2021-03-30 中国船舶重工集团公司第七一一研究所 一种传感器数据异常检测的方法及其应用
CN113433917A (zh) * 2021-08-11 2021-09-24 内蒙古京隆发电有限责任公司 一种用于发电厂的dcs控制系统及控制方法
CN113657454A (zh) * 2021-07-23 2021-11-16 杭州安脉盛智能技术有限公司 基于自回归BiGRU的核电旋转机械状态监测方法
CN113671917A (zh) * 2021-08-19 2021-11-19 中国科学院自动化研究所 针对多模态工业过程异常状态的检测方法、系统、设备
CN115841255A (zh) * 2022-12-27 2023-03-24 济南市工程质量与安全中心 基于在线分析的建筑工程现场预警方法及系统
CN118035929A (zh) * 2024-04-12 2024-05-14 江西江投能源技术研究有限公司 基于热力学和数据挖掘的电厂安全监测预警方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102773A (zh) * 2014-07-05 2014-10-15 山东鲁能软件技术有限公司 一种设备故障预警及状态监测方法
CN107725283A (zh) * 2017-09-19 2018-02-23 江苏方天电力技术有限公司 一种基于深度信念网络模型的风机故障检测方法
CN107742008A (zh) * 2017-09-20 2018-02-27 上海电机学院 一种风电机组齿轮箱的故障预警方法
CN108961245A (zh) * 2018-07-06 2018-12-07 西安电子科技大学 基于双通道深度并行卷积网络的图像质量分类方法
CN109815983A (zh) * 2018-12-10 2019-05-28 清华大学 基于混合深度学习的高铁道岔智能故障预测方法
CN110006650A (zh) * 2019-03-18 2019-07-12 华中科技大学 一种基于栈式剪枝稀疏去噪自动编码器的故障诊断方法
CN110059357A (zh) * 2019-03-19 2019-07-26 中国电力科学研究院有限公司 一种基于自编码网络的智能电能表故障分类检测方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104102773A (zh) * 2014-07-05 2014-10-15 山东鲁能软件技术有限公司 一种设备故障预警及状态监测方法
CN107725283A (zh) * 2017-09-19 2018-02-23 江苏方天电力技术有限公司 一种基于深度信念网络模型的风机故障检测方法
CN107742008A (zh) * 2017-09-20 2018-02-27 上海电机学院 一种风电机组齿轮箱的故障预警方法
CN108961245A (zh) * 2018-07-06 2018-12-07 西安电子科技大学 基于双通道深度并行卷积网络的图像质量分类方法
CN109815983A (zh) * 2018-12-10 2019-05-28 清华大学 基于混合深度学习的高铁道岔智能故障预测方法
CN110006650A (zh) * 2019-03-18 2019-07-12 华中科技大学 一种基于栈式剪枝稀疏去噪自动编码器的故障诊断方法
CN110059357A (zh) * 2019-03-19 2019-07-26 中国电力科学研究院有限公司 一种基于自编码网络的智能电能表故障分类检测方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
QIAN YANG 等: "PSO based LS-SVM approach for fault prediction of primary air fan", 《2015 CHINESE AUTOMATION CONGRESS (CAC)》 *
严冰: "深度学习在航空发动机故障诊断中的应用", 《中国优秀博硕士学位论文全文数据库(硕士) 工程科技Ⅱ辑》 *
章浩伟 等: "基于自编码网络模型的风机故障检测研究", 《软件导刊》 *
金秀章 等: "基于MSET的一次风机故障预警", 《仪器仪表用户》 *
高瑜 等: "基于关联规则的一次风机故障预警方法研究", 《电力科学与工程》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111720296A (zh) * 2020-06-11 2020-09-29 浙江浙能技术研究院有限公司 一种基于自编码器的汽动给水泵设备异常状态预警方法
CN112067335A (zh) * 2020-09-03 2020-12-11 华能国际电力股份有限公司玉环电厂 一种基于多元状态估计的电厂送风机故障预警方法
CN112488326A (zh) * 2020-11-09 2021-03-12 广州瀚信通信科技股份有限公司 基于5g核心网的智能运维故障预警方法及装置
CN112580699A (zh) * 2020-12-04 2021-03-30 中国船舶重工集团公司第七一一研究所 一种传感器数据异常检测的方法及其应用
CN112530526A (zh) * 2020-12-09 2021-03-19 浙江浙能北仑发电有限公司 飞灰含碳量预测方法、装置和电子设备
CN112530526B (zh) * 2020-12-09 2024-02-02 上海长庚信息技术股份有限公司 飞灰含碳量预测方法、装置和电子设备
CN113657454A (zh) * 2021-07-23 2021-11-16 杭州安脉盛智能技术有限公司 基于自回归BiGRU的核电旋转机械状态监测方法
CN113657454B (zh) * 2021-07-23 2024-02-23 杭州安脉盛智能技术有限公司 基于自回归BiGRU的核电旋转机械状态监测方法
CN113433917A (zh) * 2021-08-11 2021-09-24 内蒙古京隆发电有限责任公司 一种用于发电厂的dcs控制系统及控制方法
CN113671917A (zh) * 2021-08-19 2021-11-19 中国科学院自动化研究所 针对多模态工业过程异常状态的检测方法、系统、设备
CN113671917B (zh) * 2021-08-19 2022-08-02 中国科学院自动化研究所 针对多模态工业过程异常状态的检测方法、系统、设备
CN115841255A (zh) * 2022-12-27 2023-03-24 济南市工程质量与安全中心 基于在线分析的建筑工程现场预警方法及系统
CN115841255B (zh) * 2022-12-27 2024-05-31 济南市工程质量与安全中心 基于在线分析的建筑工程现场预警方法及系统
CN118035929A (zh) * 2024-04-12 2024-05-14 江西江投能源技术研究有限公司 基于热力学和数据挖掘的电厂安全监测预警方法及系统

Similar Documents

Publication Publication Date Title
CN110689203A (zh) 基于自编码器的火电厂一次风机故障预警方法
CN111275288B (zh) 基于XGBoost的多维数据异常检测方法与装置
US20230023931A1 (en) Hydraulic turbine cavitation acoustic signal identification method based on big data machine learning
JP4922597B2 (ja) 燃料電池システムの診断方法および診断装置
CN116757534A (zh) 一种基于神经训练网络的智能冰箱可靠性分析方法
CN113222289B (zh) 一种基于数据处理的能源功率的预测方法
CN112132394B (zh) 一种电厂循环水泵预测性状态评估方法及系统
CN109409024B (zh) 基于一维深度残差网络的光伏组件电压电流特性建模方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN111815053A (zh) 一种针对工业时序数据的预测方法及系统
CN111648992A (zh) 燃气轮机压气机故障识别预警方法
CN111582542A (zh) 一种基于异常修复的电力负荷预测方法及系统
CN112327701B (zh) 面向非线性动态工业过程的慢特征网络监测方法
CN115608793B (zh) 一种机理融合数据的精轧温度调控方法
CN114091525A (zh) 一种滚动轴承退化趋势预测方法
CN111103137A (zh) 基于深度神经网络的风力涡轮机齿轮箱故障诊断方法
CN111259523B (zh) 基于kpca-cva模型和随机算法的过程监测方法
CN115712817A (zh) 一种基于卷积神经网络的工业电机泵的故障的诊断方法
CN112633331A (zh) 一种基于自编码器的火电厂辅机健康状态评估方法
Wang et al. An adaptive condition monitoring method of wind turbines based on multivariate state estimation technique and continual learning
CN113703422B (zh) 一种基于特征分析处理的燃气轮机气动执行机构故障诊断方法
Tong et al. Fault prediction of marine diesel engine based on time series and support vector machine
Zhao et al. Remaining useful life prediction method based on convolutional neural network and long short-term memory neural network
Huang et al. A hybrid bayesian deep learning model for remaining useful life prognostics and uncertainty quantification
CN117313796A (zh) 一种基于dae-lstm-kde模型的风电齿轮箱故障预警方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200114