CN109976316B - 一种故障相关的变量选择方法 - Google Patents

一种故障相关的变量选择方法 Download PDF

Info

Publication number
CN109976316B
CN109976316B CN201910336463.8A CN201910336463A CN109976316B CN 109976316 B CN109976316 B CN 109976316B CN 201910336463 A CN201910336463 A CN 201910336463A CN 109976316 B CN109976316 B CN 109976316B
Authority
CN
China
Prior art keywords
fault
variable
normal
contribution
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910336463.8A
Other languages
English (en)
Other versions
CN109976316A (zh
Inventor
周东华
陈茂银
吴德浩
纪洪泉
钟麦英
王建东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN201910336463.8A priority Critical patent/CN109976316B/zh
Publication of CN109976316A publication Critical patent/CN109976316A/zh
Application granted granted Critical
Publication of CN109976316B publication Critical patent/CN109976316B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0262Confirmation of fault detection, e.g. extra checks to confirm that a failure has indeed occurred
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种故障相关的变量选择方法,具体涉及工业过程监控和故障检测领域。该方法利用KL散度来度量某个变量在故障发生前后的差异,选择出对故障敏感的变量用于对工业过程进行数据建模。具体包括:分别采集工业过程运行的正常数据和故障数据;依次计算m个测量变量在正常和故障情况下的KL散度,以此作为该变量对于反映故障效应的贡献值;将贡献值从大到小排列,根据一定的规则选择前d个最大的贡献值对应的变量;利用所选择的变量对工业过程进行数据建模,并进行后续的过程监控和故障检测,能够减少计算复杂度,并有效降低建模过程中出现过拟合的概率,有利于构建一个简洁、高性能的数据模型。

Description

一种故障相关的变量选择方法
技术领域
本发明涉及工业过程监控和故障检测领域,具体涉及一种故障相关的变量选择方法。
背景技术
随着现代工业的快速发展,工业过程的规模和复杂程度不断提高。复杂的工业过程安装了大量的传感器,可能包含成千上万的测量变量。以大型发电机组为例,它包含了大量的操作单元,例如过热器、再热器、汽轮机和发电机等,同时有大量的阀门、管道和辅机等设备。因此,一台1000MW的大型发电机组可能包含上万个测量变量。
海量的测量数据极大地促进了数据驱动故障检测技术的发展,同时也对高效的过程监控带来了前所未有的挑战。目前,大多数过程监控技术利用所有的测量变量进行数据建模和故障检测。已有研究表明,并非所有的测量变量都是与系统故障紧密相关的,即只有一部分变量包含故障的关键信息。无关的变量可能增加不必要的计算复杂度,甚至降低算法的监控性能。从所有的测量变量中选择出最能反映故障效应的变量,有助于提高故障过程的可解释性,挖掘其中潜在的故障信息。
发明内容
本发明针对上述问题,提出了一种故障相关的变量选择方法,旨在选择包含特定故障信息最多的部分变量。
本发明具体采用如下技术方案:
一种故障相关的变量选择方法,具体包括以下步骤:
11、采集工业过程运行的正常数据
Figure BDA0002039300890000011
和故障数据
Figure BDA0002039300890000012
建立训练数据集,其中,Nn表示正常情况下的样本数目,Nf表示故障情况下的样本数目,m表示测量变量的数目;
12、以KL散度来度量某个变量在正常和故障情况下的差异,差异大的变量被认为是有助于反映故障效应的变量,定义第i个测量变量对于反映故障效应的贡献值为式(1)所示:
Figure BDA0002039300890000013
其中,i=1,2,…,m,pf(xi)和pn(xi)分别为变量xi在故障和正常情况下的概率密度函数;
13、将m个变量的贡献值按照降序排列,记为式(2)
cont(x[1])≥cont(x[2])≥…≥cont(x[m]) (2)
其中,cont(x[i])为第i个最大的贡献值;
14、计算前d个最大的贡献值的累积贡献率,如式(3)所示:
Figure BDA0002039300890000021
其中,1≤d≤m;
15、对于指定的阈值α,0<α≤1,假设d为最小的正整数使得CCR(d)≥α,那么选择这d个最大的贡献值对应的测量变量,以此作为后续数据建模的基础。
优选地,在以KL散度来度量某个变量在正常和故障情况下的差异过程中,在采样数目足够大的情况下,假设每个测量变量服从高斯分布:
121、分别计算第i个测量变量在正常情况下的样本均值和样本标准差,具体为式(4)、(5):
Figure BDA0002039300890000022
Figure BDA0002039300890000023
其中,i=1,2,…,m,
Figure BDA0002039300890000024
表示变量xi在正常情况下的第j个测量值;
122、分别计算第i个测量变量在故障情况下的样本均值和样本标准差,如式(6)、(7)所示:
Figure BDA0002039300890000025
Figure BDA0002039300890000026
其中,i=1,2,…,m,
Figure BDA0002039300890000027
表示变量xi在故障情况下的第j个测量值;
123、此时,式(1)定义的贡献值表示为如式(8)所示的形式:
Figure BDA0002039300890000028
本发明具有如下有益效果:
该故障相关的变量选择方法能够在一定程度上降低离线建模和在线监控的计算复杂度,在降维的同时保护了原有的特征空间;消除冗余变量可以降低建模过程中出现过拟合的概率,有助于为工业过程建立一个高性能的数据模型。
附图说明
图1为故障相关的变量选择方法流程框图;
图2为基于田纳西-伊斯曼过程仿真实验平台的训练数据,31个变量的贡献值示意图。
具体实施方式
下面结合附图和具体实施例对本发明的具体实施方式做进一步说明:
如图1所述,一种故障相关的变量选择方法,具体包括以下步骤:
11、采集工业过程运行的正常数据
Figure BDA0002039300890000031
和故障数据
Figure BDA0002039300890000032
建立训练数据集,其中,Nn表示正常情况下的样本数目,Nf表示故障情况下的样本数目,m表示测量变量的数目;
12、以KL散度来度量某个变量在正常和故障情况下的差异,差异大的变量被认为是有助于反映故障效应的变量,定义第i个测量变量对于反映故障效应的贡献值为式(1)所示:
Figure BDA0002039300890000033
其中,i=1,2,…,m,pf(xi)和pn(xi)分别为变量xi在故障和正常情况下的概率密度函数;
在以KL散度来度量某个变量在正常和故障情况下的差异过程中,在采样数目足够大的情况下,假设每个测量变量服从高斯分布:
121、分别计算第i(i=1,2,…,m)个测量变量在正常情况下的样本均值和样本标准差,具体为式(4)、(5):
Figure BDA0002039300890000034
Figure BDA0002039300890000035
其中,
Figure BDA0002039300890000036
表示变量xi在正常情况下的第j个测量值;
122、分别计算第i(i=1,2,…,m)个测量变量在故障情况下的样本均值和样本标准差,如式(6)、(7)所示:
Figure BDA0002039300890000041
Figure BDA0002039300890000042
其中,
Figure BDA0002039300890000043
表示变量xi在故障情况下的第j个测量值;
123、此时,式(1)定义的贡献值可以表示为如式(8)所示的形式:
Figure BDA0002039300890000044
13、将m个变量的贡献值按照降序排列,记为式(2)
cont(x[1])≥cont(x[2])≥…≥cont(x[m]) (2)
其中,cont(x[i])为第i个最大的贡献值;
14、计算前d个最大的贡献值的累积贡献率,如式(3)所示:
Figure BDA0002039300890000045
其中,1≤d≤m;
15、对于指定的阈值α,0<α≤1,假设d为最小的正整数使得CCR(d)≥α,那么选择这d个最大的贡献值对应的测量变量,以此作为后续数据建模的基础。
如图2所示,为了帮助理解本发明,同时直观地展示本发明方法用于工业过程变量选择的效果,下面对一示例进行说明。本示例基于田纳西-伊斯曼过程仿真实验平台,该平台提供了一个在过程监控和故障诊断领域被广泛研究的标准数据库。
在训练过程中,利用该过程的分散控制模型来产生闭环的实验数据,训练集包含正常数据和故障数据。采样时间间隔是0.01小时,采集100个小时的正常数据作为训练数据。同时,考虑该过程中可能发生的20种故障形式。对于每种故障,采集5个小时的故障数据作为训练数据。因此,训练集包含10000个正常数据和10000个故障数据。
在本实验中,包括该过程的22个连续测量变量和9个操作变量在内的共计31个测量变量作为监控变量。这31个变量的贡献值如图2所示,贡献率阈值设为α=0.999。根据图2可知,从21号变量到24号变量的累积贡献率超过了0.999。所以,横坐标上从21号变量到24号变量在内的23个变量被选择进行数据建模。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。

Claims (2)

1.一种故障相关的变量选择方法,其特征在于,具体包括以下步骤:
11、采集工业过程运行的正常数据
Figure FDA0002039300880000011
和故障数据
Figure FDA0002039300880000012
建立训练数据集,其中,Nn表示正常情况下的样本数目,Nf表示故障情况下的样本数目,m表示测量变量的数目;
12、以KL散度来度量某个变量在正常和故障情况下的差异,差异大的变量被认为是有助于反映故障效应的变量,定义第i个测量变量对于反映故障效应的贡献值为式(1)所示:
Figure FDA0002039300880000013
其中,i=1,2,…,m,pf(xi)和pn(xi)分别为变量xi在故障和正常情况下的概率密度函数;
13、将m个变量的贡献值按照降序排列,记为式(2)
cont(x[1])≥cont(x[2])≥…≥cont(x[m]) (2)
其中,cont(x[i])为第i个最大的贡献值;
14、计算前d个最大的贡献值的累积贡献率,如式(3)所示:
Figure FDA0002039300880000014
其中,1≤d≤m;
15、对于指定的阈值α,0<α≤1,假设d为最小的正整数使得CCR(d)≥α,那么选择这d个最大的贡献值对应的测量变量,以此作为后续数据建模的基础。
2.如权利要求1所述的一种故障相关的变量选择方法,其特征在于,在以KL散度来度量某个变量在正常和故障情况下的差异过程中,在采样数目足够大的情况下,假设每个测量变量服从高斯分布:
121、分别计算第i个测量变量在正常情况下的样本均值和样本标准差,具体为式(4)、(5):
Figure FDA0002039300880000015
Figure FDA0002039300880000016
其中,i=1,2,…,m,
Figure FDA0002039300880000017
表示变量xi在正常情况下的第j个测量值;
122、分别计算第i个测量变量在故障情况下的样本均值和样本标准差,如式(6)、(7)所示:
Figure FDA0002039300880000021
Figure FDA0002039300880000022
其中,i=1,2,…,m,
Figure FDA0002039300880000023
表示变量xi在故障情况下的第j个测量值;
123、此时,式(1)定义的贡献值表示为如式(8)所示的形式:
Figure FDA0002039300880000024
CN201910336463.8A 2019-04-25 2019-04-25 一种故障相关的变量选择方法 Active CN109976316B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910336463.8A CN109976316B (zh) 2019-04-25 2019-04-25 一种故障相关的变量选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910336463.8A CN109976316B (zh) 2019-04-25 2019-04-25 一种故障相关的变量选择方法

Publications (2)

Publication Number Publication Date
CN109976316A CN109976316A (zh) 2019-07-05
CN109976316B true CN109976316B (zh) 2021-06-18

Family

ID=67086218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910336463.8A Active CN109976316B (zh) 2019-04-25 2019-04-25 一种故障相关的变量选择方法

Country Status (1)

Country Link
CN (1) CN109976316B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103868692A (zh) * 2014-03-18 2014-06-18 电子科技大学 基于核密度估计和k-l散度的旋转机械故障诊断方法
CN106447202A (zh) * 2016-09-29 2017-02-22 国网山东省电力公司 基于数据挖掘和主成分分析的电力设备状态评估方法
CN108052974A (zh) * 2017-12-12 2018-05-18 苏州大学 一种故障诊断方法、系统、设备及存储介质
CN108270778A (zh) * 2017-12-29 2018-07-10 中国互联网络信息中心 一种dns域名异常访问检测方法及装置
CN109190464A (zh) * 2018-07-24 2019-01-11 南京航空航天大学 一种变工况下基于迁移学习的机械故障智能诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9275334B2 (en) * 2012-04-06 2016-03-01 Applied Materials, Inc. Increasing signal to noise ratio for creation of generalized and robust prediction models

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103868692A (zh) * 2014-03-18 2014-06-18 电子科技大学 基于核密度估计和k-l散度的旋转机械故障诊断方法
CN106447202A (zh) * 2016-09-29 2017-02-22 国网山东省电力公司 基于数据挖掘和主成分分析的电力设备状态评估方法
CN108052974A (zh) * 2017-12-12 2018-05-18 苏州大学 一种故障诊断方法、系统、设备及存储介质
CN108270778A (zh) * 2017-12-29 2018-07-10 中国互联网络信息中心 一种dns域名异常访问检测方法及装置
CN109190464A (zh) * 2018-07-24 2019-01-11 南京航空航天大学 一种变工况下基于迁移学习的机械故障智能诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"一种基于故障重要度的概率神经网络诊断方法";雷正伟 等;《计算机测量与控制》;20040229;第12卷(第2期);107-109 *
"一种新的风电机组轴承故障监测与诊断策略";齐咏生 等;《控制工程》;20180131;第25卷(第1期);37-43 *
"基于KECA的化工过程故障监测新方法";齐咏生 等;《化工学报》;20160331;第67卷(第3期);1063-1069 *

Also Published As

Publication number Publication date
CN109976316A (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
JP2021064370A (ja) デジタル・ツイン・シミュレーション・データを利用した時系列データに基づく、大規模な産業用監視システム向けの半教師あり深層異常検出のための方法およびシステム
CN107609574A (zh) 基于数据挖掘的风电机组故障预警方法
CN111340110B (zh) 一种基于工业过程运行状态趋势分析的故障预警方法
CN115453356B (zh) 一种动力设备运行状态监测分析方法、系统、终端及介质
CN110262450A (zh) 面向汽轮机的多种故障特性协同分析的故障预测方法
CN112836941B (zh) 一种煤电机组汽轮机高加系统在线健康状况评估方法
CN110209144B (zh) 基于动静协同差异分析的两层实时监测与报警溯源方法
CN108334674A (zh) 一种基于参数关联性智能分析的汽轮机高压缸运行状态监测方法
CN109298633A (zh) 基于自适应分块非负矩阵分解的化工生产过程故障监测方法
CN114564885A (zh) 一种基于bp神经网络的水轮发电机组轴瓦温度预警方法
Wang et al. An adaptive condition monitoring method of wind turbines based on multivariate state estimation technique and continual learning
Zhao et al. Gas turbine exhaust system health management based on recurrent neural networks
Velasquez et al. Machine Learning Approach for Predictive Maintenance in Hydroelectric Power Plants
CN111913463B (zh) 一种核电厂化学容积控制系统状态监测方法
CN109976316B (zh) 一种故障相关的变量选择方法
CN117170236A (zh) 基于逆强化学习的工业调速系统执行器故障智能自愈方法
Cao et al. An adaptive UKF algorithm for process fault prognostics
Rodriguez-Guerra et al. Fault-tolerant control study and classification: Case study of a hydraulic-press model simulated in real-time
CN111814325B (zh) 燃煤发电装备非平稳运行的单变量报警阈值优化方法
CN115130564A (zh) 一种基于并行gmm-lcksvd的高压加热器在线监测方法
Yun et al. Fault diagnosis of wind turbine pitch system based on multiblock KPCA algorithm
CN113806918A (zh) 一种面向非平稳非线性工业过程的异常监测方法
CN117034157B (zh) 一种结合多模态运行数据的水电设备故障识别方法与系统
CN111123890B (zh) 一种特种设备故障监测系统
Kuang et al. A Highly Accurate Method for Forecasting Aero-Engine Vibration Levels Based on an Enhanced ConvNeXt Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant