CN111652414B - 基于高斯混合模型的滑窗pca高炉异常监测方法 - Google Patents
基于高斯混合模型的滑窗pca高炉异常监测方法 Download PDFInfo
- Publication number
- CN111652414B CN111652414B CN202010432828.XA CN202010432828A CN111652414B CN 111652414 B CN111652414 B CN 111652414B CN 202010432828 A CN202010432828 A CN 202010432828A CN 111652414 B CN111652414 B CN 111652414B
- Authority
- CN
- China
- Prior art keywords
- model
- statistics
- gmm
- gaussian
- blast furnace
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 44
- 239000000203 mixture Substances 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000007246 mechanism Effects 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 30
- 239000011159 matrix material Substances 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 13
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 230000005856 abnormality Effects 0.000 abstract description 6
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- 238000010835 comparative analysis Methods 0.000 abstract 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 20
- 238000009826 distribution Methods 0.000 description 18
- 229910052742 iron Inorganic materials 0.000 description 10
- 229910000831 Steel Inorganic materials 0.000 description 9
- 239000010959 steel Substances 0.000 description 9
- 230000000694 effects Effects 0.000 description 6
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000002485 combustion reaction Methods 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000007664 blowing Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000571 coke Substances 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Manufacturing & Machinery (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种基于高斯混合模型的滑窗PCA高炉异常监测方法,属于工业过程监测领域。本发明利用高斯混合模型改进传统PCA监测模型的T 2 统计量,称为GMM‑T 2 统计量,从而适应高炉数据的非高斯特性;并在此基础上加入滑窗机制,使模型具有实时更新的能力,进而适应高炉炉况的时变特性,并将该模型与现有的模型进行了对比分析,证明了模型对高炉异常监测能力上的提高。
Description
技术领域
本发明属于工业过程监测领域,具体涉及一种基于高斯混合模型的滑窗(MovingWindow)PCA高炉异常监测模型。
技术背景
钢铁工业是我国现代工业和国民经济重要支柱产业,也是国民经济密不可分的重要组成部分。而高炉炼铁是整个钢铁工业的核心环节,也是钢铁制造过程中能质流转换的关键工序,它的能耗占钢铁生产总能耗的比例高达70%。实现高炉炼铁过程安全运行,是钢铁工业深度节能减排和提质增效的重中之重,而一个准确的异常监测模型可以及时地为操作者提供预警,提前对炉况进行调整,避免危险情况的发生。
在高炉炼铁过程中,由于原料品质波动、人员的误操作、设备异常等原因,高炉炉况异常时有发生。高炉炉况一旦发生异常,往往会引起燃料比增加、休风检修时间增长、铁水质量不达标等问题,不仅会造成资源和设备的重大损失,降低高炉炉龄,而且甚至有可能引发事故造成人员伤亡。例如2011年10月5日南京钢铁集团有限公司高炉发生铁水外溢,造成12人死亡;2017年11月10日山东日照钢铁公司15号高炉风口烧穿引发燃烧爆炸等严重事故。由此可见,提高高炉炼铁过程的安全性,尤其是减少高炉事故和异常炉况出现的频率,对减少能源消耗、保证设备和人员的安全以及提高钢铁生产流程的经济效益有着十分重要的意义。然而,大型高炉数据有着数据非高斯分布和时变等特点,这使得高炉系统异常监测与诊断成为极具挑战性的课题,成为当今世界冶金科技研究的前沿热点、难点。
发明内容
本发明针对高炉异常监测目前存在的问题,提出一种基于高斯混合模型的滑窗PCA高炉异常监测方法,利用高斯混合模型改进PCA监测模型的T2统计量,称为GMM-T2统计量,使其可以适应高炉数据的非高斯特性;并在此基础上加入滑窗机制,使模型具有实时更新的能力,进而适应高炉炉况的时变特性,最终模型可以实现对高炉异常炉况快速、准确的预警。
一种基于高斯混合模型的Moving Window PCA高炉异常监测方法,利用高斯混合模型改进传统PCA监测模型的T2统计量,称为GMM-T2统计量,从而适应高炉数据的非高斯特性;
并在此基础上加入滑窗机制,使模型具有实时更新的能力,进而适应高炉炉况的时变特性;
所述利用高斯混合模型改进PCA监测模型的T2统计量为:
在对高炉数据样本使用PCA模型之后,得到主成分T和主元个数A,选取高斯混合模型个数k,对主成分T使用高斯混合模型进行求解,得到每个高斯成分的均值μi和协方差Σi,并求出每个样本的GMM-T2统计量以及每个高斯成分的GMM-T2统计量上限GMM-T2 UCL:
其中,0≤i≤k,即第i个高斯成分,GMM-T2 ij为隶属于第i个高斯成分的第j个样本的GMM-T2统计量,tij为隶属于第i个高斯成分的第j个样本的主成分,bi为第i个高斯成分包含的样本数,每个高斯成分的GMM-T2统计量上限即为该成分包含的样本中,GMM-T2统计量的最大值;当统计量没有超过统计量的上限值是,模型判断高炉未发生异常情况,反之则发生异常情况。
所述模型加入滑窗机制为:
当模型判断高炉数据样本为正常样本时,就将该样本加入训练集中,然后将训练集中最早的一个样本剔除,保持训练集数量不变,当判断为正常样本的新样本数到达W个时,后台使用新的训练集进行模型的训练,完成模型的更新后替代当前用于在线监测的模型。
所述方法具体流程为:
步骤1:离线建模;
步骤1.1:收集高炉过程数据,将其进行标准化后的数据记为Xtrain(N×m),样本数为N,变量数为m。计算数据的协方差矩阵Rtrain,利用SVD分解得到特征向量和特征值,然后根据累计方差贡献率选取主成分个数A,进而得到负载矩阵Ptrain以及得分矩阵Ttrain,其中Ttrain为Xtrain在Ptrain方向上的投影;
步骤1.2:确定高斯混合模型的高斯成分个数为k,对使用PCA得到的主成分使用高斯混合模型进行求解,得到每个高斯成分的均值μi和协方差Σi,并求出每个样本的GMM-T2统计量以及每个高斯成分的GMM-T2统计量上限GMM-T2 UCL;
同时也计算出SPE统计量和其上限值SPEUCL;
步骤2:在线监测;
步骤2.1:当有高炉的新样本到来时,同样对其进行标准化,将标准化后的数据记为Xtest,然后计算其主成分t,利用高斯混合模型判断其归属于第i个高斯成分,然后计算其对应的GMM-T2统计量和SPE统计量:
SPE=eTe
其中,S为离线建模阶段的特征值对角阵,μi和Σi也是离线训练时第i个高斯成分均值和协方差。将计算出来的统计量与GMM-T2 UCL和SPEUCL进行比较,如果有一个指标超限,则可判断系统出现异常;若两个指标均未超限,则系统处于正常运行状态;
步骤3:模型更新;
步骤3.1:当模型判断高炉样本为正常样本时,就将该样本加入训练集中,然后将训练集中最早的一个样本剔除,保持训练集数量不变,当判断为正常样本的新样本数到达W个时,后台使用新的训练集重新执行步骤1,完成模型的更新后替代当前用于在线监测的模型。
本发明的有益效果在于:
1、GMM-T2统计量克服了传统T2统计量对高炉数据非高斯分布的敏感性,可以克服高炉热风炉切换时产生的误报。
2、GMM-T2统计量很大程度上降低了模型的误报率,并且拥有更强的鲁棒性,可以对高炉数据样本分布有一个更加精确的拟合。
3、模型克服了高炉数据的时变特点,当高炉的工作点或者炉况发生变化时,模型可以进行更新适应新的工作状态。
附图说明
图1-1,1-2,1-3,1-4为4个关键变量的变化趋势图;
图2-1,2-2,2-3,2-4为4个关键变量的分布直方图;
图3为T2统计量在二维空间不同置信度下对样本的覆盖范围;
图4为GMM-T2统计量在二维空间下对样本的覆盖范围;
图5为SPE统计量监测图;
图6为T2统计量监测图;
图7为GMM-T2统计量监测图;
图8为未进行模型更新前的SPE统计量监测图;
图9为未进行模型更新前的GMM-T2统计量监测图;
图10为进行模型更新后的SPE统计量监测图;
图11为进行模型更新后的GMM-T2统计量监测图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细阐述。
基于高斯混合模型的滑窗PCA高炉异常监测方法一个具体流程为:
步骤1:离线建模;
步骤1.1:通过高炉上附着的传感器收集高炉过程变量数据,将进行标准化后的数据记为Xtrain(N×m),样本数为N,变量数为m。计算数据的协方差矩阵Rtrain,利用SVD分解得到特征向量和特征值,然后根据累计方差贡献率选取主成分个数A,进而得到负载矩阵Ptrain以及得分矩阵Ttrain,其中Ttrain为Xtrain在Ptrain方向上的投影;
步骤1.2:确定高斯混合模型的高斯成分个数为k,对使用PCA得到的主成分使用高斯混合模型进行求解,得到每个高斯成分的均值μi和协方差Σi,并求出每个样本的GMM-T2统计量以及每个高斯成分的GMM-T2统计量上限GMM-T2 UCL:
其中,0≤i≤k,即第i个高斯成分,GMM-T2 ij为隶属于第i个高斯成分的第j个样本的GMM-T2统计量,tij为隶属于第i个高斯成分的第j个样本的主成分,bi为第i个高斯成分包含的样本数,每个高斯成分的GMM-T2统计量上限即为该成分包含的样本中,GMM-T2统计量的最大值。
同时也计算出SPE统计量和其上限值SPEUCL:
SPE=eTe
其中,α为置信度,cα是正态分布(1-α)高位的临界值。
步骤2:在线监测;
步骤2.1:当有高炉的新样本到来时,同样进行标准化,将标准化后的数据记为Xtest,然后计算其主成分t,利用高斯混合模型判断其归属于第i个高斯成分,然后计算其对应的GMM-T2统计量和SPE统计量:
SPE=eTe
其中,S为离线建模阶段的特征值对角阵,μi和Σi也是离线训练时第i个高斯成分均值和协方差。将计算出来的统计量与GMM-T2 UCL和SPEUCL进行比较,如果有一个指标超限,则可判断系统出现异常;若两个指标均未超限,则系统处于正常运行状态。
步骤3:模型更新;
步骤3.1:当模型判断高炉样本为正常样本时,就将该样本加入训练集中,然后将训练集中最早的一个样本剔除,保持训练集数量不变,当判断为正常样本的新样本数到达W个时,后台使用新的训练集重新执行步骤1,完成模型的更新后替代当前用于在线监测的模型。
实施例
(1)高炉过程变量介绍
本次实验针对中国华南某钢铁集团的2650立方米高炉。炉体的数据平均10s采样一次,含有35个变量,如表1所示。
表1 数据集的变量列表
根据操作员的经验,热风压力、总压降、理论燃烧温度和鼓风动能是反映高炉运行状态的关键性指标。因此选择2018年7月1日一整天共7819个样本,其中这四个关键指标如图1-1,1-2,1-3,1-4所示。
从图1-1,1-2,1-3,1-4中可以看出,有部分变量每间隔一段时间会出现一个峰状的扰动,这是由于高炉炉体热风炉切换导致的,高炉往往有不止一个热风炉,当一个热风炉在给高炉送风时,另外的热风炉需要进行蓄热,然后在一段时间后再进行切换,以保证高炉不间断运行。
(2)高炉过程变量分析
非高斯性:
为了检验数据样本的非高斯特性,本次测试选取了2018年7月1日一整天共7819个样本的4个典型变量,绘制其数据分布直方图如图2-1,2-2,2-3,2-4所示。
从4个典型变量热风压力、全压差、理论燃烧温度和鼓风动能的直方图分布粗略来看,变量并不符合高斯分布的要求,为了进一步对问题进行说明,对该四个变量采用KS(Kolmogorov–Smirnov)检验中的正态分布检验方法进行检验,结果如表3所示。KS检验是统计学上的一种非参数检验方法,它可以用于比较样本与参考概率分布,因此也可以用于判断样本是否符合正态分布。
表3 KS正态分布检验
根据检验结果,p值都拒绝了正态分布的假设,因此变量均不满足正态分布的要求,即变量具有非高斯特性。高炉数据非高斯分布的特性主要由以下三个原因导致:(1)由热风炉切换导致的峰状扰动;(2)定期填充铁矿石与焦炭(3)高炉内部发生的各种各样的物理化学反应。
时变特性:
为了研究高炉过程数据的时变特性,选取2018年7月1日和2018年7月20日时隔20天的两组数据,样本数分别为7819个和8467个,针对这两组数据的四个典型变量计算均值、标准差,相关数据如表3所示。
表3 两组数据均值与标准差
PCA降维分解结果和数据的均值、标准差密切相关。从表3中我们可以看出,仅仅20天,变量的均值和标准差变化就十分明显,如果在PCA建模过程中,不对模型进行更新,旧模型显然无法适应新数据的工作状态,会与真实状态产生较大的偏差。因此,针对数据具有的时变特性,模型必须也进行相应的处理。
(3)GMM-T2统计量的得出
由于数据非高斯分布的特点,T2统计量在对高炉过程进行监测的时候会有误报的情况产生,这种数据非高斯分布特点和误报主要是由热风炉切换数据所导致的。在先前的研究中,学者们往往选择先区分正常炉况和热风炉切换的情况,再进行监测。在本发明中,提出了一种基于高斯混合模型的T2统计量的方法,使PCA模型可以在不区分是否为热风炉切换的情况下进行监测。
首先对源数据降维后的主成分使用高斯混合模型进行求解,此时选择的高斯元个数k为6,图3为普通T2统计量在99.99%、99.9%和99%置信度下的二维空间内的覆盖范围展现,其中每一个点为样本点,椭圆形的弧线范围为不同置信度的统计量所覆盖的范围,图4为高斯混合模型解算的T2统计量在二维空间内的覆盖范围展现,不规则的深色部分为高斯混合模型解算所得到的覆盖范围。
由图3、图4可以看出,相比与T2统计量覆盖的范围,高斯混合模型的结果显然更加准确一些,不仅基本上覆盖了所有样本,而且一些没有样本的空间不被包含在其中。对于这种通过高斯混合模型划分区域再计算是否超限的T2统计量改进方法,将其称为GMM-T2统计量,其计算方式如下所示:
确定高斯混合模型的高斯成分个数为k,对使用PCA得到的主成分使用高斯混合模型进行求解,得到每个高斯成分的均值μi和协方差Σi,并求出每个样本的GMM-T2统计量以及每个高斯成分的GMM-T2统计量上限GMM-T2 UCL:
其中,0≤i≤k,即第i个高斯成分,GMM-T2 ij为隶属于第i个高斯成分的第j个样本的GMM-T2统计量,tij为隶属于第i个高斯成分的第j个样本的主成分,bi为第i个高斯成分包含的样本数,每个高斯成分的GMM-T2统计量上限即为该成分包含的样本中,GMM-T2统计量的最大值。
(4)基于GMM-T2统计量的MWPCA算法完整流程
步骤1:离线建模;
步骤1.1:通过高炉上附着的传感器收集高炉过程变量数据,将进行标准化后的数据记为Xtrain(N×m),样本数为N,变量数为m。计算数据的协方差矩阵Rtrain,利用SVD分解得到特征向量和特征值,然后根据累计方差贡献率选取主成分个数A,进而得到负载矩阵Ptrain以及得分矩阵Ttrain,其中Ttrain为Xtrain在Ptrain方向上的投影;
步骤1.2:确定高斯混合模型的高斯成分个数为k,对使用PCA得到的主成分使用高斯混合模型进行求解,得到每个高斯成分的均值μi和协方差Σi,并求出每个样本的GMM-T2统计量以及每个高斯成分的GMM-T2统计量上限GMM-T2 UCL:
其中,0≤i≤k,即第i个高斯成分,GMM-T2 ij为隶属于第i个高斯成分的第j个样本的GMM-T2统计量,tij为隶属于第i个高斯成分的第j个样本的主成分,bi为第i个高斯成分包含的样本数,每个高斯成分的GMM-T2统计量上限即为该成分包含的样本中,GMM-T2统计量的最大值。
同时也计算出SPE统计量和其上限值SPEUCL:
SPE=eTe
其中,α为置信度,cα是正态分布(1-α)高位的临界值。
步骤2:在线监测;
步骤2.1:当有高炉的新样本到来时,同样进行标准化,将标准化后的数据记为Xtest,然后计算其主成分t,利用高斯混合模型判断其归属于第i个高斯成分,然后计算其对应的GMM-T2统计量和SPE统计量:
SPE=eTe
其中,S为离线建模阶段的特征值对角阵,μi和Σi也是离线训练时第i个高斯成分均值和协方差。将计算出来的统计量与GMM-T2 UCL和SPEUCL进行比较,如果有一个指标超限,则可判断系统出现异常;若两个指标均未超限,则系统处于正常运行状态。
步骤3:模型更新;
步骤3.1:当模型判断高炉样本为正常样本时,就将该样本加入训练集中,然后将训练集中最早的一个样本剔除,保持训练集数量不变,当判断为正常样本的新样本数到达W个时,后台使用新的训练集重新执行步骤1,完成模型的更新后替代当前用于在线监测的模型。
(5)模型克服数据非高斯性检验:
为了检验基于GMM-T2统计量的MWPCA模型的应用效果,选取2018年11月05日至2018年11月15日10天的80000个数据样本作为训练集;2018年11月26日的5000个样本为测试集。其中测试集包含了一个异常,为了证明模型的有效性,将普通T2统计量和GMM-T2统计量进行对比,结果如图5-图7所示。
由图5-图7可以看出,对于异常,SPE统计量、T2统计量和GMM-T2统计量表现类似,都发出了报警,其中统计量在1360时刻报警,T2统计量在1359时刻报警,GMM-T2统计量在1360时刻报警,GMM-T2统计量报警晚于T2统计量1个时刻。
其中T2统计量由于热风炉切换的原因有很多误报的情况出现,而GMM-T2统计量则没有受到任何干扰。此外,T2统计量和GMM-T2统计量在3100时刻左右有一个较大的分歧,即鼓风动能有一个微小的波动导致T2统计量超限了,通过观察其它过程变量发现并没有这个波动的出现,结合操作者的报告也并不存在异常现象,因此可以判断这是一个正常的波动。针对这个正常波动,T2统计量产生了大规模误报,而GMM-T2统计量则只有个别误报。由此可见,GMM-T2统计量不仅可以克服热风炉切换扰动,并且在一定程度上可以避免正常波动带来的误报,拥有更强的鲁棒性。
(6)模型克服数据时变性检验:
为了测试基于GMM-T2统计量的MWPCA模型对时变数据的适应能力,选取2018年10月1日至2018年10月10日10天的80000个数据样本作为起始训练集;2018年11月26日的4000个样本为最终测试集。
未加入滑窗时的监测效果如图8、9所示,加入滑窗后的监测效果如图10、11所示。
由图8-图11可以看出,当模型加入滑窗来更新样本之后,SPE统计量就明显不会出现因为模型未更新导致的大规模误报情况,GMM-T2统计量的上限值相对变得更小了,这说明监测范围也变得更加准确了。
(7)模型对比:
由于GMM-T2统计量是PCA监测模型传统T2统计量的改进,而且其在判断统计量的控制限时,取值为隶属于当前高斯成分的所有样本的GMM-T2统计量的最大值,这与传统T2统计量根据置信度决定控制限是有区别的。因此为了更加全面的对比,也加入了传统T2统计量不根据置信度,而直接取T2统计量最大值作为控制限时的监测效果,这里简称为MAX-T2统计量。此外,也比较了GMM-T2统计量与专门克服热风炉扰动的两阶段PCA模型,可以进一步表明GMM-T2统计量在克服非高斯和热风炉扰动上的独特优势。其中,统计量选取的置信区间的置信度均为99.99%。
异常监测的监测效果主要体现于监测的误报率、异常的报警起始时刻和报警持续时间(可以判断是否有漏报的情况产生)上,因此下面的对比主要表现在以上3个指标里。
对于(5)中的测试集,结果对比如表4所示:
表4 不同统计量的性能指标
其中时刻指的是样本数,即第1859时刻为第1859个样本,持续186个时刻即持续186个样本的时间,其中每个样本的采样间隔为10秒,由于操作员的交班记录里并不会明确给出异常的具体时间,因此希望通过异常报警的持续时间从侧面看出模型报警的完整性。
对于该测试集,每个统计量的表现都不太一样,对于T2统计量,很明显存在误报的情况出现,因此需要进行改进,但是如果直接简单地利用MAX-T2统计量,可以看出其效果是不如GMM-T2统计量的,由于MAX-T2统计量是直接取了最大T2统计量值作为控制限,因此其覆盖的范围很大且没有针对性,这从其报警时刻的延后和持续时间的缩短上都可以有所体现。而两阶段PCA的T2统计量由于其有一个报警持续时间限W,只有当报警持续时间超过W时才会视为发生异常,因此报警时刻的延后和持续时间的缩短是不可避免的。而GMM-T2统计量不仅在误报率上得到了大幅度的降低,而且报警时刻也仅仅只有1个时刻的落后,由于高斯混合模型更加具有针对性的拟合方式,也避免了MAX-T2统计量简单粗暴方式所带来的覆盖范围过大问题,同时相比于专门针对热风炉切换的两阶段PCA方法,GMM-T2统计量在报警时刻和持续时间上都有着明显的优势。
Claims (2)
1.一种基于高斯混合模型的滑窗PCA高炉异常监测方法,其特征在于,利用高斯混合模型改进PCA监测模型的T2统计量,称为GMM-T2统计量,从而适应高炉数据的非高斯特性;并在此基础上加入滑窗机制,使模型具有实时更新的能力,进而适应高炉炉况的时变特性;
所述利用高斯混合模型改进PCA监测模型的T2统计量为:
在对高炉数据样本使用PCA模型之后,得到主成分T和主元个数A,选取高斯混合模型个数k,对主成分T使用高斯混合模型进行求解,得到每个高斯成分的均值μi和协方差Σi,并求出每个样本的GMM-T2统计量以及每个高斯成分的GMM-T2统计量上限GMM-T2 UCL:
其中,0≤i≤k,即第i个高斯成分,GMM-T2 ij为隶属于第i个高斯成分的第j个样本的GMM-T2统计量,tij为隶属于第i个高斯成分的第j个样本的主成分,bi为第i个高斯成分包含的样本数,每个高斯成分的GMM-T2统计量上限即为该成分包含的样本中,GMM-T2统计量的最大值;当统计量没有超过统计量的上限值时,模型判断高炉未发生异常情况,反之则发生异常情况;
所述模型加入滑窗机制为:
当模型判断高炉数据样本为正常样本时,就将该样本加入训练集中,然后将训练集中最早的一个样本剔除,保持训练集数量不变,当判断为正常样本的新样本数到达W个时,后台使用新的训练集进行模型的训练,完成模型的更新后替代当前用于在线监测的模型。
2.根据权利要求1所述的方法,其特征在于,其具体流程为:
步骤1:离线建模;
步骤1.1:收集高炉过程数据,将其进行标准化后的数据记为Xtrain(N×m),样本数为N,变量数为m,计算数据的协方差矩阵Rtrain,利用SVD分解得到特征向量和特征值,然后根据累计方差贡献率选取主成分个数A,进而得到负载矩阵Ptrain以及得分矩阵Ttrain,其中Ttrain为Xtrain在Ptrain方向上的投影;
步骤1.2:确定高斯混合模型的高斯成分个数为k,对使用PCA得到的主成分使用高斯混合模型进行求解,得到每个高斯成分的均值μi和协方差Σi,并求出每个样本的GMM-T2统计量以及每个高斯成分的GMM-T2统计量上限GMM-T2 UCL;
同时也计算出SPE统计量和其上限值SPEUCL;
步骤2:在线监测;
步骤2.1:当有高炉的新样本到来时,同样对其进行标准化,将标准化后的数据记为Xtest,然后计算其主成分t,利用高斯混合模型判断其归属于第i个高斯成分,然后计算其对应的GMM-T2统计量和SPE统计量:
SPE=eTe
其中,S为离线建模阶段的特征值对角阵,μi和Σi也是离线训练时第i个高斯成分均值和协方差,将计算出来的统计量与GMM-T2 UCL和SPEUCL进行比较,如果有一个指标超限,则可判断系统出现异常;若两个指标均未超限,则系统处于正常运行状态;
步骤3:模型更新;
步骤3.1:当模型判断高炉样本为正常样本时,就将该样本加入训练集中,然后将训练集中最早的一个样本剔除,保持训练集数量不变,当判断为正常样本的新样本数到达W个时,后台使用新的训练集重新执行步骤1,完成模型的更新后替代当前用于在线监测的模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010432828.XA CN111652414B (zh) | 2020-05-20 | 2020-05-20 | 基于高斯混合模型的滑窗pca高炉异常监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010432828.XA CN111652414B (zh) | 2020-05-20 | 2020-05-20 | 基于高斯混合模型的滑窗pca高炉异常监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111652414A CN111652414A (zh) | 2020-09-11 |
CN111652414B true CN111652414B (zh) | 2023-05-05 |
Family
ID=72342724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010432828.XA Active CN111652414B (zh) | 2020-05-20 | 2020-05-20 | 基于高斯混合模型的滑窗pca高炉异常监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111652414B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113592163A (zh) * | 2021-07-22 | 2021-11-02 | 汉谷云智(武汉)科技有限公司 | Scr脱硝反应器入口氮氧化物浓度预测方法及设备 |
CN114239743B (zh) * | 2021-12-22 | 2023-12-15 | 电子科技大学 | 一种基于稀疏时间序列数据的天气事件发生时间预测方法 |
CN115096359A (zh) * | 2022-06-17 | 2022-09-23 | 北京航空航天大学 | 一种金属屋面健康监测系统及方法 |
CN115905974B (zh) * | 2022-11-04 | 2024-02-27 | 北京科技大学 | 一种高炉异常炉况检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101899563A (zh) * | 2009-06-01 | 2010-12-01 | 上海宝钢工业检测公司 | 基于pca模型的连续退火机组炉内温度、张力监测及故障追溯方法 |
CN103974311A (zh) * | 2014-05-21 | 2014-08-06 | 哈尔滨工业大学 | 基于改进高斯过程回归模型的状态监测数据流异常检测方法 |
CN109062196A (zh) * | 2018-10-31 | 2018-12-21 | 东北大学 | 一种集成pca-ica的高炉过程监测及故障诊断方法 |
CN110130875A (zh) * | 2019-06-20 | 2019-08-16 | 中国石油大学(华东) | 抽油机异常工况监控方法 |
CN110273818A (zh) * | 2019-06-10 | 2019-09-24 | 浙江大学 | 一种基于轴变换粗细度分类的风机叶片结冰故障监测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI376648B (en) * | 2009-02-25 | 2012-11-11 | Micro Star Int Co Ltd | Method and device for keeping image background by multiple gauss models |
-
2020
- 2020-05-20 CN CN202010432828.XA patent/CN111652414B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101899563A (zh) * | 2009-06-01 | 2010-12-01 | 上海宝钢工业检测公司 | 基于pca模型的连续退火机组炉内温度、张力监测及故障追溯方法 |
CN103974311A (zh) * | 2014-05-21 | 2014-08-06 | 哈尔滨工业大学 | 基于改进高斯过程回归模型的状态监测数据流异常检测方法 |
CN109062196A (zh) * | 2018-10-31 | 2018-12-21 | 东北大学 | 一种集成pca-ica的高炉过程监测及故障诊断方法 |
CN110273818A (zh) * | 2019-06-10 | 2019-09-24 | 浙江大学 | 一种基于轴变换粗细度分类的风机叶片结冰故障监测方法 |
CN110130875A (zh) * | 2019-06-20 | 2019-08-16 | 中国石油大学(华东) | 抽油机异常工况监控方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111652414A (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111652414B (zh) | 基于高斯混合模型的滑窗pca高炉异常监测方法 | |
CN104777830A (zh) | 一种基于kpca混合模型的多工况过程监控方法 | |
CN107290962B (zh) | 一种基于自适应阈值pls的高炉铁水质量监测方法 | |
CN111607673B (zh) | 铁前诊断系统及方法 | |
CN109280726B (zh) | 一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法 | |
CN105893700A (zh) | 基于物理-大数据混合模型的化工生产在线故障检测与诊断技术 | |
CN102925602B (zh) | 高炉操作炉型维护方法 | |
CN113360830B (zh) | 一种金属冶炼企业重大安全风险重大风险辨识与评估方法 | |
CN111593155A (zh) | 高炉诊断系统及方法 | |
Zhang et al. | Fault diagnosis for blast furnace ironmaking process based on two-stage principal component analysis | |
CN112226570B (zh) | 转炉在线诊断节能降耗sads系统 | |
CN104731083A (zh) | 一种基于自适应特征提取的工业故障诊断方法及应用 | |
CN112066724A (zh) | 一种基于自适应主元分析的辊道窑能耗异常检测方法 | |
CN111752147A (zh) | 一种具有持续学习能力改进pca的多工况过程监测方法 | |
CN107976432A (zh) | 一种基于支持向量机的耐热钢老化等级测量方法 | |
CN105989435B (zh) | 一种基于rcm理论估算设备维护周期的方法 | |
CN109978059B (zh) | 一种原油蒸馏过程初馏塔冲塔故障预警方法 | |
CN103451680A (zh) | 基于多元统计方法的电解铝全流程监测及故障诊断系统 | |
CN113177353A (zh) | 一种应用于工业预警系统的数据模型构建方法 | |
Kamo et al. | Method for predicting gas channeling in blast furnace | |
CN108709426B (zh) | 基于频谱特征双边检测法烧结机漏风故障在线诊断方法 | |
CN112241800A (zh) | 一种焦炉VOCs污染物排放量的计算方法 | |
CN113050595B (zh) | 一种基于pfmea和hra方法的潜在故障分析方法 | |
CN114854920B (zh) | 高斯混合模型嵌入的gru自编码器高炉异常监测方法 | |
CN108364095B (zh) | 基于数据挖掘的炼钢生产过程钢水质量诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |