CN116956232B - 一种基于邻域保持嵌入回归的质量相关故障检测方法 - Google Patents

一种基于邻域保持嵌入回归的质量相关故障检测方法 Download PDF

Info

Publication number
CN116956232B
CN116956232B CN202310895864.3A CN202310895864A CN116956232B CN 116956232 B CN116956232 B CN 116956232B CN 202310895864 A CN202310895864 A CN 202310895864A CN 116956232 B CN116956232 B CN 116956232B
Authority
CN
China
Prior art keywords
quality
regression
matrix
fault detection
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310895864.3A
Other languages
English (en)
Other versions
CN116956232A (zh
Inventor
宋冰
郭涛
侍洪波
吴铮华
陶阳
谭帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumaite Intelligent Technology Jiangsu Co ltd
East China University of Science and Technology
Original Assignee
East China University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China University of Science and Technology filed Critical East China University of Science and Technology
Priority to CN202310895864.3A priority Critical patent/CN116956232B/zh
Publication of CN116956232A publication Critical patent/CN116956232A/zh
Application granted granted Critical
Publication of CN116956232B publication Critical patent/CN116956232B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Optimization (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开尤其涉及一种基于邻域保持嵌入回归算法的质量相关故障检测算法,并在此基础上建立了质量相关故障检测模型。首先,基于邻域保持嵌入算法提取出数据的有效流形特征信息。然后,为了表征过程变量对质量变量的变化趋势,本发明在基于邻域保持嵌入算法提取特征信息的基础之上,建立特征空间与质量指标的回归关系。相比于传统的方法,本发明克服了传统邻域保持嵌入算法提取特征时无法衡量输入变量和输出变量关系的缺点;通过对回归系数的协方差矩阵执行特征值分解,得到质量相关和无关子空间,进而在相应子空间建立统计量并估计各统计量的控制限,解决了邻域保持嵌入算法不考虑质量变量的缺点,是一种更优的质量相关故障检测方法。

Description

一种基于邻域保持嵌入回归的质量相关故障检测方法
技术领域
本发明涉及一种数据驱动的故障检测方法,尤其涉及一种基于邻域保持嵌入回归的质量相关故障检测方法。
背景技术
现代流程工业中为了保证生产的有效进行,必须对整个生产过程中出现的故障做到精准且即时的检测。随着工业过程集散化,复杂化的推进,基于数据驱动的故障检测方法被研究者广泛关注。多元统计分析作为一种典型数据驱动方法,常见的有主成分分析(principal component analysis,PCA)、偏最小二乘法(partial least squares,PLS)、独立主元分析(independent component analysis,ICA)等,这些方法都已表明可以很好应对复杂的工业过程。然而,这些方法仅考虑样本间的全局特征信息,并没有关注局部包含的流形结构关系,这会导致忽略隐藏在高维空间中的更多信息,降低故障检测的效率。
为了有效地提取局部结构信息,基于流形学习的方法被提出,如邻域保持嵌入(neighbor preserving embedding,NPE)、等距映射(isometric feature mapping,ISOMAP)、局部保持投影(local preserving projection,LPP)等。这些方法都侧重于关注样本间的局部信息,研究表明,与基于全局信息的模型相比,流形学习方法更容易揭示高维空间中数据分布的真实结构。此外,由于流程工业中闭环反馈的存在,并不是每个故障的发生都会影响产品质量的变化。因此需要考虑质量相关故障与无关故障报警的情况以及对整个操作流程复杂化的影响,避免不必要的报警和检修工作。基于上述讨论,考虑到NPE无法表征过程变量和质量变量之间的关系,本发明在传统的NPE算法基础上,通过引入最小二乘回归,提出了一种基于邻域保持嵌入回归(neighbor preserving embedding regression,NPER)的质量相关故障检测方法。本发明通过引入最小二乘回归,构建过程变量和质量变量的回归关系,然后对回归系数的协方差矩阵执行特征值分解,获得质量相关和质量无关子空间,最后在相应子空间建立统计量并估计其控制限。
发明内容
本发明所要解决的主要技术问题是:第一是构建回归关系的问题,利用NPE提取的特征信息,通过最小二乘回归建立特征空间与质量变量的回归关系,进而推导过程变量和质量变量的回归关系。第二是质量相关子空间划分的问题,通过对回归系数的协方差矩阵执行特征值分解,得到质量相关和质量无关子空间投影矩阵,将原始样本映射到质量相关和质量无关子空间,最后在各自子空间建立相应统计量并随即估计其控制限。
本发明为解决上述问题所采用的技术方案为:一种基于邻域保持嵌入回归的质量相关故障检测方法,包括以下步骤:
(1)收集工业流程中正常运行状态下的样本数据,组成训练数据集。其中,过程变量数据集为质量变量数据集为/>计算训练数据集/>的均值μx和标准差σx,并按照公式(1)对/>和/>进行Z-score标准化,得到标准化后的数据为X∈RN×p Y∈RN×q
其中x与y为标准化后数据集的单一采样点时刻的数据,其中x∈R1×p,y∈R1×q
(2)经过NPE算法降维,获得的低维特征空间为:其中A为特征映射矩阵,NPE具体步骤如下:
①构建邻域图:利用k近邻算法来构建邻域图。假设过程数据集共有m个样本,则邻域图共有m个结点,其中xi表示第i个结点。如果xj是xi的k个最近的邻居之一,那么将这两点连接,反之不连接;
②计算权重矩阵:设权重矩阵为W,其中元素Wij代表结点i和结点j之间的权重,如果两点之间没有边,则对应的矩阵元素为0。矩阵W元素的值主要通过最小化如下目标函数获得:
③计算映射:用相同大小的权重Wij来重建低维空间的相应数据点。特征映射矩阵可以通过最小如下目标函数来获得;
其中且满足ATXTXA=I。优化问题被转化为以下广义特征值求解问题:
求取最小的d个特征值对应的特征向量,构成特征映射矩阵A;
(3)建立回归关系模型,并对回归系数的协方差矩阵执行特征值分解,得到质量相关子空间和质量无关子空间,具体操作过程如下所示:
①首先依据NPE算法提取出的特征空间信息为:
Q=XA (5)
②建立过程变量和质量的回归关系:ynew=xnewA(QTQ)-1QTY=xnewM,并对系数矩阵M=A(QTQ)-1QTY进行特征值分解:其中/>和/>分别为质量相关空间和无关空间投影矩阵;
(4)构造质量相关和无关统计量:
(5)给定置信水平α,估计其控制限,具体公式如(7)~(8):
其中,q和γ分别表示质量相关和无关子空间的自由度。通过给定的置信水平α,分别确立和/>的控制限/>和/>
步骤(1)~(5)为本发明方法的离线建模阶段,如下所示步骤(6)~(8)为本发明方法的在线检测过程;
(6)获取在线样本xnew∈R1×p,利用训练数据集的均值和标准差对其执行标准化,得到:
(7)根据离线建模阶段得到的投影矩阵,计算在线样本的统计量:
(8)按如下故障判别逻辑进行在线检测:如果在线样本的统计量则过程发生了质量相关的故障;如果/>且/>则过程发生了质量无关的故障;如果且/>则无故障发生;
与传统的NPE方法相比,本发明方法的优势在于:
考虑了质量信息对过程信息的指导作用,引入最小二乘回归建立二者之间的回归关系,使得后续建模更加充分且精确,能够在故障检测模型构建时充分考虑故障是否会影响质量。在应对质量子空间划分的问题上,建立了质量变量和过程变量的回归关系,并对回归系数矩阵执行特征值分解,得到质量相关子空间和质量无关子空间;
附图说明
图1为本发明方法的流程图;
图2为TEP工业流程图;
图3和图4分别为CCA和NPER对故障1的检测结果;
具体实施方式
下面结合附图于具体的实施案例对本发明方法进行详情对比。
如图1所示,展示的是一种基于邻域保持嵌入回归的质量相关故障检测方法具体流程图。下面结合一个测试案例来说明本发明的具体实施过程,并且阐述相对于经典的基于典型相关分析方法的优越性。
测试对象是美国Eastman化学公司开发的具有开放性和挑战性的化工模型仿真平台-Tennessee Eastman(TE)仿真平台。其具体的工业流程图如图2所示,包含了反应器,冷凝器,压缩机,分离器和汽提塔五个主要单元。整个TE过程包含22个连续测量变量,12个操作变量和19个成分变量。本案例选择22个连续测量变量和11个操作变量作为过程变量数据集,第35个成分变量作为质量变量数据集来进行建模,并利用表1中三种典型的故障案例进行分析。接下来结合TE过程对本发明具体实施步骤进行详细的阐述。
表1:TE过程三种典型故障。
故障编号 故障描述 故障类型
1 反应物A/C的进料比改变 阶跃
2 组分B含量发生改变,A/C进料流量比始终不变 阶跃
14 反应器中的冷却水阀门故障导致 阶跃
带有故障的测试集样本共采集960个观测值,其中前160个观测值为正常数据,后800个观测值为故障数据,故障样本在第161个数据开始引入。首先利用采集的960个正常样本进行离线训练,建立质量相关故障检测模型,包括以下步骤:
(1)收集正常工况下的样本组成训练数据集并对其进行标准化操作得到X∈R960×33,Y∈R960×1
(2)基于NPE,构造过程变量和质量的回归模型,其具体步骤如下:
①首先依据NPE提取的特征空间信息为:Q=XA;
②建立回归关系:ynew=xnewA(QTQ)-1QTY=xnewM,并对系数矩阵M=A(QTQ)-1QTY进行特征值分解:其中/>和/>分别为质量相关空间和无关空间投影矩阵;
(4)构造质量相关和无关统计量:
(5)给定置信水平α,估计其控制限,具体公式如(11)~(12):
其中,q和γ分别表示质量相关和无关子空间的自由度。通过给定的置信水平α,分别确立和/>的控制限/>和/>
步骤(1)~(5)为本发明方法的离线建模阶段,如下所示步骤(6)~(8)为本发明方法的在线检测过程;
(6)对在线采集的样本利用训练数据集的均值和标准差对其标准化:
(7)根据离线建模阶段得到的投影矩阵,计算在线样本的统计量:
(8)按照如下判别逻辑进行在线检测:如果在线采集样本的统计量则系统发生了质量相关的故障;如果/>且/>则系统发生了质量无关的故障;如果/>且/>则系统无故障发生;
将本方法与经典的基于典型相关分析的质量相关故障检测的方法进行对比,两种方法对TE中质量相关故障2的检测结果,如表2所示;
表2:质量相关故障在质量相关子空间的检测结果。
两种方法对TE中质量无关故障14的检测结果,如表3所示:
表3:质量无关故障在质量相关子空间的检测结果。
故障14是由于反应器中的冷却水阀门故障导致的。该故障发生后,反应器内温度发生波动,但由于闭环反馈的控制作用,故障14并不会影响成分变量G含量的变化。通过表2和表3可以看出与传统的CCA方法相比较,本发明方法能够提升对质量相关故障的故障检测率,同时降低质量无关故障的误报率。上述实例验证证明了本发明的有效性。
故障1为反应物A/C的进料比改变的阶跃类型的故障。虽然该故障会使成分G的浓度发生变化,但是由于系统自身的反馈调节作用,在第400个样本点左右,成分G的浓度会慢慢回到正常范围。图3展示的是CCA方法故障检测结果,可以看出CCA方法存在大量超限的样本点,无法在400个样本点附近回归到控制限下,表明CCA无法有效地跟踪质量变量的变化趋。而本发明提出的方法在第160个样本点的故障引入后,统计量明显超出控制限,并在第400个样本点附近回到控制限下方,表明本方法能够反应质量变量的变化趋势。
上述实施案例只用来解释说明本发明的具体实施,而不是对本发明进行限制。故凡依本发明之形状,原理所作的变化,均应涵盖在本发明的包含范围内。

Claims (2)

1.一种基于邻域保持嵌入回归的质量相关故障检测方法,其特征在于:所述方法包括以下步骤:
离线建模阶段的实施过程如下所示:
步骤(1)收集工业流程中正常运行状态下的样本数据,组成训练数据集;其中,过程变量数据集为质量变量数据集为/>计算训练数据集/>的均值μx和标准差σx,并按照公式(1)对/>和/>进行Z-score标准化,得到标准化后的数据为X∈RN×p Y∈RN×q
其中x与y为标准化后数据集的单一采样点时刻的数据,其中x∈R1×p,y∈R1×q
步骤(2)经过NPE算法降维,获得的低维特征空间为:其中A为特征映射矩阵,NPE具体步骤如下:
①构建邻域图:利用k近邻算法来构建邻域图;假设过程数据集共有m个样本,则邻域图共有m个结点,其中xi表示第i个结点;如果xj是xi的k个最近的邻居之一,那么将这两点连接,反之不连接;
②计算权重矩阵:设权重矩阵为W,其中元素Wij代表结点i和结点j之间的权重,如果两点之间没有边,则对应的矩阵元素为0;矩阵W元素的值通过最小化如下目标函数获得:
③计算映射:用相同大小的权重Wij来重建低维空间的相应数据点;特征映射矩阵可以通过最小化如下目标函数来获得;
其中且满足ATXTXA=I;优化问题转化为以下广义特征值求解问题:
求取最小的d个特征值对应的特征向量,构成特征映射矩阵A;
步骤(3)建立回归关系模型,并对回归系数的协方差矩阵执行特征值分解,得到质量相关子空间和质量无关子空间:
在线检测阶段的实施过程如下所示:
步骤(4)获取在线样本xnew∈R1×p,利用训练数据集的均值和标准差对其执行标准化,得到:
步骤(5)根据离线建模阶段得到的投影矩阵,计算在线样本的统计量:
步骤(6)按照如下判别逻辑进行在线检测:如果在线样本的统计量则发生了质量相关的故障;如果/>且/>则发生了质量无关的故障;如果/>则无故障发生。
2.根据权利要求1所述的一种基于邻域保持嵌入回归的质量相关故障检测方法,其特征在于,所述步骤(3)中构造过程变量和质量变量的回归关系,具体实施过程如下所示:
步骤(3.1)首先依据NPE算法提取出的特征空间信息为:
Q=XA (6)
步骤(3.2)建立过程变量和质量的回归关系:
ynew=xnewA(QTQ)-1QTY=xnewM (7)
步骤(3.3)并对系数矩阵进行特征值分解:
其中和/>分别为质量相关空间和无关空间投影矩阵;
步骤(3.4)投影到质量相关子空间和无关子空间的样本分别为:
CN202310895864.3A 2023-07-20 2023-07-20 一种基于邻域保持嵌入回归的质量相关故障检测方法 Active CN116956232B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310895864.3A CN116956232B (zh) 2023-07-20 2023-07-20 一种基于邻域保持嵌入回归的质量相关故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310895864.3A CN116956232B (zh) 2023-07-20 2023-07-20 一种基于邻域保持嵌入回归的质量相关故障检测方法

Publications (2)

Publication Number Publication Date
CN116956232A CN116956232A (zh) 2023-10-27
CN116956232B true CN116956232B (zh) 2024-05-10

Family

ID=88456004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310895864.3A Active CN116956232B (zh) 2023-07-20 2023-07-20 一种基于邻域保持嵌入回归的质量相关故障检测方法

Country Status (1)

Country Link
CN (1) CN116956232B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106644162A (zh) * 2016-10-12 2017-05-10 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法
CN107025351A (zh) * 2017-04-01 2017-08-08 宁波大学 一种基于多近邻保持嵌入回归模型的工业软测量方法
CN114757269A (zh) * 2022-03-23 2022-07-15 华东理工大学 一种基于局部子空间-邻域保持嵌入的复杂过程精细化故障检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111796576B (zh) * 2020-06-16 2023-03-31 北京工业大学 一种基于双核t分布随机近邻嵌入的过程监测可视化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106644162A (zh) * 2016-10-12 2017-05-10 云南大学 基于邻域保持嵌入回归算法的环网柜线芯温度软测量方法
CN107025351A (zh) * 2017-04-01 2017-08-08 宁波大学 一种基于多近邻保持嵌入回归模型的工业软测量方法
CN114757269A (zh) * 2022-03-23 2022-07-15 华东理工大学 一种基于局部子空间-邻域保持嵌入的复杂过程精细化故障检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Quality-Related Plant-Wide Process Monitoring Based on Mutual Information-Neighborhood Preserving Embedding-Partial Least Squares for Hot Strip Mill Process;Rouru Chen等;《2022 34th Chinese Control and Decision Conference (CCDC)》;20230214;全文 *
基于T-TSNPR的动态过程质量监控;吕铮等;《华东理工大学学报(自然科学版)》;20190117;全文 *

Also Published As

Publication number Publication date
CN116956232A (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
Chien et al. Semiconductor fault detection and classification for yield enhancement and manufacturing intelligence
Kariwala et al. A branch and bound method for isolation of faulty variables through missing variable analysis
CN109146246B (zh) 一种基于自动编码器和贝叶斯网络的故障检测方法
US11860608B2 (en) Industrial equipment operation, maintenance and optimization method and system based on complex network model
Ma et al. A novel hierarchical detection and isolation framework for quality-related multiple faults in large-scale processes
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN108388234B (zh) 一种基于相关性划分多变量块pca模型的故障监测方法
CN105607631B (zh) 间歇过程弱故障模型控制限建立方法及弱故障监测方法
Zhu et al. Convolutional neural network based feature learning for large-scale quality-related process monitoring
CN115994337B (zh) 一种带钢热连轧非平稳过程微小故障检测方法及装置
CN109240276B (zh) 基于故障敏感主元选择的多块pca故障监测方法
CN112000081B (zh) 基于多块信息提取和马氏距离的故障监测方法及系统
CN114757269A (zh) 一种基于局部子空间-邻域保持嵌入的复杂过程精细化故障检测方法
CN111913460B (zh) 一种基于序列相关局部保持投影算法的故障监测方法
CN113703422B (zh) 一种基于特征分析处理的燃气轮机气动执行机构故障诊断方法
CN116305733B (zh) 一种基于全局和局部特征提取的质量相关故障检测方法
Jiang et al. Partial cross mapping based on sparse variable selection for direct fault root cause diagnosis for industrial processes
Yu et al. An unsupervised fault detection and diagnosis with distribution dissimilarity and lasso penalty
CN116956232B (zh) 一种基于邻域保持嵌入回归的质量相关故障检测方法
Uchida et al. Process fault diagnosis method based on MSPC and LiNGAM and its application to Tennessee Eastman process
CN115017978A (zh) 一种基于加权概率神经网络的故障分类方法
Luo et al. Improved alarm visualization system based on two-Dimensional online root-cause contribution graph for industry 4.0
Wang et al. Maximizing Anomaly Detection Performance Using Latent Variable Models in Industrial Systems
CN113467434B (zh) 基于双层k近邻标准化的CCA发酵过程KPI相关故障监测方法
Tang et al. Monitoring and fault diagnosis using fisher discrimnant analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240523

Address after: 200237 No. 130, Meilong Road, Shanghai, Xuhui District

Patentee after: EAST CHINA University OF SCIENCE AND TECHNOLOGY

Country or region after: China

Patentee after: SUMAITE INTELLIGENT TECHNOLOGY (JIANGSU) Co.,Ltd.

Address before: 200237 No. 130, Meilong Road, Shanghai, Xuhui District

Patentee before: EAST CHINA University OF SCIENCE AND TECHNOLOGY

Country or region before: China