CN114997316A - 一种基于变量重要性投影分块的过程监测方法 - Google Patents

一种基于变量重要性投影分块的过程监测方法 Download PDF

Info

Publication number
CN114997316A
CN114997316A CN202210663732.3A CN202210663732A CN114997316A CN 114997316 A CN114997316 A CN 114997316A CN 202210663732 A CN202210663732 A CN 202210663732A CN 114997316 A CN114997316 A CN 114997316A
Authority
CN
China
Prior art keywords
data
model
principal component
moving average
variable importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210663732.3A
Other languages
English (en)
Inventor
刘鸿斌
杨杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Forestry University
Original Assignee
Nanjing Forestry University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Forestry University filed Critical Nanjing Forestry University
Priority to CN202210663732.3A priority Critical patent/CN114997316A/zh
Publication of CN114997316A publication Critical patent/CN114997316A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明公开了一种基于改进变量重要性投影值分块的多元指数加权移动平均核主成分分析过程监测方法,可用于大规模、非线性和时变性复杂工业过程故障检测。首先,根据改进的变量重要性投影值将过程变量划分到质量相关空间和质量独立空间,避免在确定分块数量时引入的主观性;其次,利用多元指数加权移动平均对每个子空间中的数据变量进行预处理,提高模型对过程中微小故障的敏感性;最后,结合核主成分分析建立过程监测模型,使其能够较好地拟合数据中的非线性特征。本发明充分考虑了数据中的非线性和高阶信息,使基于改进变量重要性投影值的子块划分结果更加准确、合理,充分挖掘过程中的局部信息,有效提高故障检测率,降低误检率。

Description

一种基于变量重要性投影分块的过程监测方法
技术领域
本发明属于故障检测技术领域,具体涉及一种基于变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法。
背景技术
现代工业过程中都增加了更多子流程或处理单元以追求更高的产品质量,提高生产效率。同时,为了采集更多过程相关的数据,每个单元内部都配备了许多高精度的工业传感器,这也导致数据维度成倍地增长。对于这类大规模复杂工业过程,直接采用所有变量建立单个模型进行监测这样的方式可能不再适合,数据高维性不仅会带来“维度灾难”,而且无关变量的引入还可能会降低模型的检测效果。针对这一问题,有研究人员提出采用变量分块或分布式监控框架,即将整个过程划分为几个有意义的块,然后构建子块模型进行监测。这种方式不仅考虑到过程中的局部信息,而且还有效简化了模型结构,降低了计算复杂度。近年来,关于分块线性监测模型相关的方法已有很多研究,然而,在实际大规模工业过程中,变量之间普遍存在较强的非线性关系,这些复杂的非线性结构以及高阶信息应在分块时给予更多的考虑。互信息源自于信息论,它可以从熵的角度定量地描述两个随机变量之间相互依赖的程度。互信息值越大,表示这两个变量的关系越密切,反之,则表示两个变量近似独立。虽然互信息对数据中的非线性结构和高阶信息描述的有效性已经得到证明,但忽略了由自变量组合所表示的潜变量对质量变量的影响。
主成分分析作为一个经典的多元统计方法在众多工业过程中得到广泛地应用,但难以处理数据中的非线性特征。因此,许多基于主成分分析的非线性方法被提出,其中核主成分分析由于其避免了非线性优化问题,使模型训练变得更容易。在非线性过程中,系统的运行状况可能会因为设备老化、设定点偏移或天气等原因发生微小的变化,这些故障随时间变化,通常在前期难以捕捉到。即使经过一段时间累积效应后在后期可以检测到该故障,但已经产生较大的检测时延。因此,及时准确地检测到这些微小故障是保证安全生产,减少企业经济损失的关键。为了解决这个问题,有学者提出将核主成分分析提取的核主成分得分和残差统计量作为多元指数加权移动平均的输入,以提高微小变化所导致故障的检测效果。因此,这种类似的混合过程监测方法应给予更多关注。
发明内容
本发明针对现有技术中存在的问题,提供一种基于改进变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法,所述方法包括以下步骤:
S1.数据预处理:对输入数据X及输出数据Y进行标准化,将其转化为均值为0,方差为1的无量纲数据;将训练集数据用于模型的构建及训练,测试集数据用于对模型的性能进行评估。
S2.构建改进的变量重要性投影指标:在变量重要性投影的基础上引入互信息对潜变量和质量变量之间的关系进行定量描述,并构建改进的变量重要性投影指标。
S3.构建动态模型:根据改进的变量重要性投影,将过程变量划分到质量相关空间和质量独立空间,同时对不同空间中的数据变量进行多元指数加权移动平均预处理,实现动态模型构建。
S4.构建多元指数加权移动平均核主成分分析模型:将通过多元指数加权移动平均预处理后的数据作为核主成分分析的输入,构建多元指数加权移动平均核主成分分析模型,以此来提高模型对数据中的动态信息的捕获能力及微小故障的敏感性。
S5.对数据进行反标准化,并完成模型性能的评估:将测试集数据带入训练后的模型进行测试,根据故障检测率这个指标完成模型性能的评估。
该方法的优势在于充分考虑了变量之间的非线性关系,在变量重要性投影基础上进一步引入互信息构建改进的变量重要性投影指标。基于此,将整个过程变量进行分块,适当的变量划分不仅能够降低模型计算复杂度,还能够挖掘过程中的局部信息。最后,分别在两个子空间内构建多元指数加权移动平均核主成分分析模型来提高对非线性过程中微小变化的敏感性。因此,在大规模复杂工业过程中,该模型可靠性高,能够充分地挖掘局部信息,具备较高的故障检测率。
采用上述方案后,本发明与现有技术相比具有如下效果:
与现有技术相比,基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法的提出,克服了大规模工业过程数据中非线性和时变性特征,解决了故障发生初期检测难的问题,有效降低了模型计算复杂度。利用改进的变量重要性投影指标对过程变量分块,使其不仅避免了传统分块方法在确定分块个数时的主观性,还增强了对监测结果的可解释性。因此,对工程师来说更容易对过程运行状态和工艺优化进行把控,有助于保障生产安全,减少企业经济损失。
附图说明
图1是田纳西-伊斯曼过程的工艺及控制流程图。
图2是基于改进变量重要性投影的变量分块结构图。
图3是基于改进变量重要性投影的变量分块结果。
图4是对于故障5基于改进变量重要性投影分块的多元指数加权移动平均核主成分分析的监测结果。
具体实施方式
下面将对本发明进行更清楚、完整的描述,显然,所描述的实例仅仅是本发明的一部分实例,而不是全部的实施例。
本发明提供的对大规模复杂工业过程监测所采取的技术方案是:
S1.数据预处理:根据公式(1)完成输入数据X及输出数据Y的标准化处理;将其转化为均值为0,方差为1的无量纲数据;将训练集数据用于模型的构建及训练,测试集数据用于对模型的性能进行评估。
S2.构建改进的变量重要性投影指标:在变量重要性投影的基础上引入互信息对潜变量和质量变量之间的关系进行定量描述,并构建改进的变量重要性投影指标。
S3.构建动态模型:根据改进的变量重要性投影,将过程变量划分到质量相关空间和质量独立空间,同时对不同空间中的数据变量进行多元指数加权移动平均预处理,实现动态模型构建。
S4.构建多元指数加权移动平均核主成分分析模型:将通过多元指数加权移动平均预处理后的数据作为核主成分分析的输入,构建多元指数加权移动平均核主成分分析模型,以此来提高模型对数据中的动态信息的捕获能力及微小故障的敏感性。
S5.对数据进行反标准化,并完成模型性能的评估:将测试集数据带入训练后的模型进行测试,根据故障检测率这个指标完成模型性能的评估。
步骤S1中,将数据转化为均值为0,方差为1的公式为:
Figure BSA0000275031140000031
式中,X*为原数据,X为标准化后的数据,μ和σ分别为所有训练集样本的均值和方差。
步骤S2中,改进的变量重要性投影指标的构建如下:
S21:使用偏最小二乘模型对标准化后的输入数据
Figure BSA0000275031140000032
与输出数据
Figure BSA0000275031140000033
作如下分解:
Figure BSA0000275031140000034
其中,
Figure BSA0000275031140000035
是得分矩阵;
Figure BSA0000275031140000036
Figure BSA0000275031140000037
分别为X和Y的负载矩阵;E和F分别为输入和输出矩阵的残差;l为潜变量的个数,通常由交叉验证来确定;
S22:采用潜变量和质量变量之间的互信息值来替代原始通过计算每个成分所解释的方差的部分,即:
Figure BSA0000275031140000041
式中,
Figure BSA0000275031140000042
为估计两个变量互信息值的函数;ti第i个主成分得分;yk为第k个质量变量。
S23:计算第j个变量的改进的变量重要性投影(IVIP)值:
Figure BSA0000275031140000043
步骤S3中,利用改进的变量重要性投影将过程变量进行分块,并构建动态模型:
S31:通过计算每个过程变量的改进的变量重要性投影,将其划分到质量相关空间和质量独立空间:
X=[Xqr,Xin] (5)
S32:分别对不同空间的数据变量进行预处理,构建动态模型:
Zi=βXi+(1-β)Zi-1 (6)
式中,0<β≤1为平滑参数,控制着检测时延和灵敏度之间的平衡。
步骤S4中,构建多元指数加权移动平均核主成分分析模型:
S41:对处理后的数据利用核技巧构建Gram矩阵
Figure BSA0000275031140000044
Kij=k(zi,zj)=<φ(zi),φ(zj)> (7)
其中,Kij为Gram矩阵K中的元素,核函数采用高斯核,定义为k(x,y)=exp(-||x-y||/(2×σ2));σ为可调节的核参数,通常由经验或者网格搜索确定。
S42:对Gram矩阵K进行中心化:
Figure BSA0000275031140000045
其中
Figure BSA0000275031140000046
S43:对
Figure BSA0000275031140000051
进行特征分解:
Figure BSA0000275031140000052
式中,λ和α分别为
Figure BSA0000275031140000053
的特征值和特征向量。
S44:根据累计方差贡献率确定核主成分个数l;
S45:计算非线性主成分得分
Figure BSA0000275031140000054
k=1,2,...,p,并构建T2和Q统计量:
Figure BSA0000275031140000055
Figure BSA0000275031140000056
S46:分别计算质量相关空间和质量独立空间的两个统计量控制限:
Figure BSA0000275031140000057
Figure BSA0000275031140000058
g=b/2a (15)
h=2a2/b (16)
其中,F表示F分布;χ2表示卡方分布;a和b分别为Q统计量的均值和方差。
S47:统计量任何一个超出置信度的话,则认为发生了故障。否则认为该过程正常。
步骤S5中,对数据进行反标准化,并完成模型性能的评估:
将测试集数据带入训练后的模型进行测试,根据故障检测率(FDR)这个指标完成模型性能的评估。FDR的计算公式如下:
Figure BSA0000275031140000059
实施例1:
以下结合田纳西-伊斯曼过程来说明本发明的有效性,它是美国伊斯曼化学品公司在1993年基于真实的化工过程所建立的一个仿真平台,旨在于对过程控制与监测方法的可行性和有效性的验证提供一个真实的案例,已获得学术界的高度认可,并广泛应用在控制、优化以及过程监测等领域。田纳西-伊斯曼过程的工艺及控制流程图如图1所示,主要由五个单元组成,包括反应器、冷凝器、压缩机、分离器和汽提塔。传感器记录有41个测量变量和12个操纵变量,均包含高斯噪声。41个测量变量中又可分为22个连续过程变量,和19个成分变量。该仿真数据集预设了21种故障,其中有16种已知故障,5种未知故障。表1对这些故障进行详细描述。
表1.田纳西-伊斯曼过程故障描述
Figure BSA0000275031140000061
下面对本发明做进一步详述:
第一步:选用正常状态下的过程变量(1-22)和操纵变量(1-11)为输入变量,最终产物作为质量变量用于模型训练,并对其进行数据预处理。测试集则采用21种预设故障数据来评估模型的性能。
第二步:在变量重要性投影基础上引入互信息,构建改进的变量重要性投影指标。通过式(4)计算每个过程变量的改进的变量重要性投影,如图2所示。
第三步:根据改进的变量重要性投影,将大于阈值的过程变量划分到质量相关空间,其余则分到质量独立空间,如图3所示。图中的横线为设定的阈值。对不同空间中的数据变量进行多元指数加权移动平均预处理,实现动态模型构建。
第四步:通过多元指数加权移动平均预处理后的数据作为核主成分分析的输入,构建多元指数加权移动平均核主成分分析模型,以此来提高模型对数据中的动态信息的捕获能力及微小故障的敏感性。
第五步:将测试集数据进行反标准化,完成模型性能评估。本发明所提出的基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析方法不仅能够监测整个过程中的系统运行状况,而且对于工程师来说,这些与质量相关的变量被单独划分出来,加强了监测结果对质量变量的可解释性。图4(a)和(b)为所提出方法对于故障5分别在质量相关空间和质量独立空间的监测结果。相比于传统的全局模型,基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法能够有效检测到非线性过程中的微小故障,并且工程师可以根据异常情况及时对过程进行调节和维修,避免安全事故和更大的损失。
以上描述了本发明的基本原理、主要特征及本发明的优势所在。以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不局限于此,本行业的技术人员在本发明展示的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该由所附的权利要求书及其等效物界定。

Claims (6)

1.基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法,其特征在于,所述建模方法包括以下步骤:
S1.数据预处理:对输入数据X及输出数据Y进行标准化,将其转化为均值为0,方差为1的无量纲数据;将训练集数据用于模型的构建及训练,测试集数据用于对模型的性能进行评估。
S2.构建改进的变量重要性投影指标:在变量重要性投影的基础上引入互信息对潜变量和质量变量之间的关系进行定量描述,并构建改进的变量重要性投影指标。
S3.构建动态模型:根据改进的变量重要性投影,将过程变量划分到质量相关空间和质量独立空间,同时对不同空间中的数据变量进行多元指数加权移动平均预处理,实现动态模型构建。
S4.构建多元指数加权移动平均核主成分分析模型:将通过多元指数加权移动平均预处理后的数据作为核主成分分析的输入,构建多元指数加权移动平均核主成分分析模型,以此来提高模型对数据中的动态信息的捕获能力及微小故障的敏感性。
2.根据权利要求1所述的基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法,其特征在于,步骤1中的数据为田纳西-伊斯曼过程仿真数据,输入数据X包含工业生产中31个过程测量变量,输出数据Y为最终产品G和H。
3.根据权利要求1所述的基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法,其特征在于,所述步骤S2的具体过程为:
S21:使用偏最小二乘模型对标准化后的输入数据
Figure FSA0000275031130000011
与输出数据
Figure FSA0000275031130000012
作如下分解:
Figure FSA0000275031130000013
其中,
Figure FSA0000275031130000014
是得分矩阵;
Figure FSA0000275031130000015
Figure FSA0000275031130000016
分别为X和Y的负载矩阵;E和F分别为输入和输出矩阵的残差;l为潜变量的个数,通常由交叉验证来确定;
S22:采用潜变量和质量变量之间的互信息值来替代原始通过计算每个成分所解释的方差的部分,即:
Figure FSA0000275031130000017
式中,
Figure FSA0000275031130000021
为估计两个变量互信息值的函数;ti第i个主成分得分;yk为第k个质量变量。
S23:计算第j个变量的改进的变量重要性投影(IVIP)值:
Figure FSA0000275031130000022
4.根据权利要求1所述的基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法,其特征在于,所述步骤S3的具体过程为:
S31:通过计算每个过程变量的改进的变量重要性投影,将其划分到质量相关空间和质量独立空间:
X=[Xqr,Xin] (5)
S32:分别对不同空间的数据变量进行预处理,构建动态模型:
Zi=βXi+(1-β)Zi-1 (6)
式中,0<β≤1为平滑参数,控制着检测时延和灵敏度之间的平衡。
5.根据权利要求1所述的基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法,其特征在于,所述步骤S4的具体过程为:
S41:对处理后的数据利用核技巧构建Gram矩阵
Figure FSA0000275031130000023
Kij=k(zi,zj)=<φ(zi),φ(zj)> (7)
其中,Kij为Gram矩阵K中的元素,核函数采用高斯核,定义为k(x,y)=exp(-||x-y||/(2×σ2));
σ为可调节的核参数,通常由经验或者网格搜索确定。
S42:对Gram矩阵K进行中心化:
Figure FSA0000275031130000024
其中
Figure FSA0000275031130000025
S43:对
Figure FSA0000275031130000026
进行特征分解:
Figure FSA0000275031130000027
式中,λ和α分别为
Figure FSA0000275031130000031
的特征值和特征向量。
S44:根据累计方差贡献率确定核主成分个数l;
S45:计算非线性主成分得分
Figure FSA0000275031130000032
并构建T2和Q统计量:
T2=[t1,t2,…,tp]A-1[t1,t2,…,tp]T (11)
Figure FSA0000275031130000033
S46:分别计算质量相关空间和质量独立空间的两个统计量控制限:
Figure FSA0000275031130000034
Figure FSA0000275031130000035
g=b/2a (15)
h=2a2/b (16)
其中,F表示F分布;χ2表示卡方分布;a和b分别为Q统计量的均值和方差。
S47:统计量任何一个超出置信度的话,则认为发生了故障。否则认为该过程正常。
6.根据权利要求1至5任一项所述的基于改进的变量重要性投影分块的多元指数加权移动平均核主成分分析过程监测方法,其特征在于,所述建模方法还包括模型性能评估过程,具体为:将测试集数据带入训练后的模型,根据故障检测率完成模型性能评估。
CN202210663732.3A 2022-06-13 2022-06-13 一种基于变量重要性投影分块的过程监测方法 Pending CN114997316A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210663732.3A CN114997316A (zh) 2022-06-13 2022-06-13 一种基于变量重要性投影分块的过程监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210663732.3A CN114997316A (zh) 2022-06-13 2022-06-13 一种基于变量重要性投影分块的过程监测方法

Publications (1)

Publication Number Publication Date
CN114997316A true CN114997316A (zh) 2022-09-02

Family

ID=83033072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210663732.3A Pending CN114997316A (zh) 2022-06-13 2022-06-13 一种基于变量重要性投影分块的过程监测方法

Country Status (1)

Country Link
CN (1) CN114997316A (zh)

Similar Documents

Publication Publication Date Title
CN109459993B (zh) 一种流程工业过程在线自适应故障监测与诊断方法
CN108062565B (zh) 基于化工te过程的双主元-动态核主元分析故障诊断方法
CN107632592B (zh) 基于高效递推核主元分析的非线性时变过程故障监测方法
CN108803520B (zh) 一种基于变量非线性自相关性剔除的动态过程监测方法
Deng et al. Modified kernel principal component analysis using double-weighted local outlier factor and its application to nonlinear process monitoring
CN104714537B (zh) 一种基于联合相对变化分析和自回归模型的故障预测方法
CN109739214B (zh) 工业过程间歇故障的检测方法
Rotem et al. Ethylene compressor monitoring using model‐based PCA
CN113642754B (zh) 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN107272667B (zh) 一种基于平行的偏最小二乘法的工业过程故障检测方法
CN109407652B (zh) 基于主辅pca模型的多变量工业过程故障检测方法
CN101403923A (zh) 基于非高斯成分提取和支持向量描述的过程监控方法
CN110262450B (zh) 面向汽轮机的多种故障特性协同分析的故障预测方法
CN109507972B (zh) 基于分层式非高斯监测算法的工业生产过程故障监测方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN109298633A (zh) 基于自适应分块非负矩阵分解的化工生产过程故障监测方法
CN112666918A (zh) 一种基于在线压缩keca自适应工业过程故障检测方法
CN114611067A (zh) 一种基于典型变量相异性分析的化工过程缓变故障检测方法
CN106647274B (zh) 一种连续生产过程中运行工况稳态判别方法
CN111062848A (zh) 一种消防工程异常状态监测的智能监控方法
CN114997316A (zh) 一种基于变量重要性投影分块的过程监测方法
CN113253682B (zh) 非线性化工过程故障检测方法
CN110501986B (zh) 一种基于加权部分互信息的质量相关过程监控方法
CN114995338A (zh) 一种基于规范变量分析与js散度融合的工业过程微小故障检测方法
CN114879612A (zh) 一种基于Local-DBKSSA的高炉炼铁过程监测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination