CN110263826A - 含噪声非线性过程故障检测模型的构建方法及其检测方法 - Google Patents
含噪声非线性过程故障检测模型的构建方法及其检测方法 Download PDFInfo
- Publication number
- CN110263826A CN110263826A CN201910466924.3A CN201910466924A CN110263826A CN 110263826 A CN110263826 A CN 110263826A CN 201910466924 A CN201910466924 A CN 201910466924A CN 110263826 A CN110263826 A CN 110263826A
- Authority
- CN
- China
- Prior art keywords
- data set
- data
- dimensional
- noise
- low
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Complex Calculations (AREA)
Abstract
本发明涉及基于流形学习的故障检测方法技术领域,具体涉及含噪声非线性过程故障检测模型的构建方法及其检测方法。该构建方法包括以下步骤:对样本数据集进行标准化处理,得到所述样本数据集的校准数据集;根据所述校准数据集计算其标准差和标准化残差,剔除所述校准数据集中的噪声数据得到正常数据集,并计算所述正常数据集的低维表示数据集;根据所述低维表示数据集,使用支持向量机算法建立故障多分类模型。本发明在数理统计的基础之上,使用标准化残差对原始数据的流形特性进行回归分析,识别并有效地隔离噪声,提高故障检测模型的准确率,通过对Isomap算法的改进,实现了样本数据非线性主元的准确获取,增强了等距映射算法对噪声的鲁棒性。
Description
技术领域
本发明涉及基于流形学习的故障检测方法技术领域,具体涉及含噪声非线性过程故障检测模型的构建方法及其检测方法。
背景技术
现代工业系统规模宏大,且日趋复杂,使得化工生产过程中的监控数据往往呈现出高维数且强非线性的特征。减少过程数据的冗杂、准确地获取监控数据的非线性主元,为工业过程中实时、高效的故障检测提供了重要保障。现在被广泛使用的线性特征提取算法,如主成分分析、线性判别法和多维尺度分析等算法,均不能获取数据中非线性特征信息,易造成关键信息的丢失,不利于提升工业系统故障检测的准确性。
等距映射算法(Isomap算法)是一种高效的流形学习算法,广泛应用于非线性数据的降维运算。Isomap算法将高维空间的流形映射到低维空间中,有效的获取嵌入在高维空间中的低维结构。Isomap算法是基于领域图与经典MDS算法的具有全局特性的非线性流形学习算法,算法基本思想是利用局部邻域距离估计高维数据点之间的全局流形测地距离来描述各点之间的相互关系,实现高维非线性数据的特征简约。
在统计学习理论基础之上发展起来的支持向量机(Support Vector Machines,SVM)算法,是一种建立在结构风险最小化(Structural Risk Minimization,SRM)原理基础之上,研究有限样本预测的学习方法。SVM能够克服神经网络和传统分类器的局部极值点、维数灾难、过学习等诸多缺点,可以很好地解决小样本、非线性、高维数和局部极小点等实际问题,是一种重要的模式识别方法。
发明人在实践中,发现上述现有技术存在以下缺陷:
在实际生产过程中,当系统设备正常运行或发生故障时,设备传感器周边往往存在强磁强场、高温或者其他未知不规则扰动,使得传感器传输的数据中包含异常或噪声数据,当收集到的数据作为系统运行状态数据而运用于系统故障检测时,异常或噪声数据不规则的特性往往会导致故障检测结果准确率较低,漏检率较高,远远不能满足实际工业过程的安全要求。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种含噪声非线性过程故障检测模型的构建方法及其检测方法,所采用的技术方案具体如下:
一种含噪声非线性过程故障检测模型的构建方法,该构建方法包括以下步骤:
对样本数据集进行标准化处理,得到所述样本数据集的校准数据集;
根据所述校准数据集计算其标准差和标准化残差,剔除所述校准数据集中的噪声数据得到正常数据集,并计算所述正常数据集的低维表示数据集;
根据所述低维表示数据集,使用支持向量机算法建立故障多分类模型;
其中,所述标准化处理的方法包括计算所述样本数据集中样本数据的k度距ri和xi的中心距di,获得由校准数据(di,ri)组成的校准数据集:
对于和样本数据集X={x1,x2,…,xN},xi∈Rn,i=1,2,3,...,N,计算样本数据xi与CX{xi}中各点的欧式距离,选取k个欧式距离最小的点组成集合并定义该集合为KNNk(xi);
对于定义样本数据xi的k度距ri:
其中xl∈KNNk(xi),t=|{xj|xj∈X∩xi∈KNNk(xj)}|,A∈R+为调节因子。
进一步,所述计算所述正常数据集的低维表示数据集的方法,包括以下步骤:
在所述正常数据集中构造邻域关系图,在所述邻域关系图中构造最短路径矩阵,近似估计所述样本数据之间的测地距离;
保持所述测地距离不变,计算出所述样本数据集的低维表示数据集。
进一步,在所述计算所述正常数据集的低维表示数据集之后,还包括:
计算所述正常数据与所述低维表示数据之间的映射函数。
进一步,所述映射函数的计算方法采用Lasso回归算法。
一种基于含噪声非线性过程故障检测模型的构建方法的检测方法,包括以下步骤:
对待测数据集进行标准化处理,得到待测校准数据集;
根据所述待测校准数据集计算其标准差和标准化残差,剔除所述待测校准数据集中的噪声数据得到正常数据集,并计算所述待测正常数据集的待测低维表示数据集;
根据所述故障多分类模型,采用投票法获得所述待测数据集的故障判断类型。
进一步,所述计算所述待测校准数据集的待测低维表示数据集的方法,包括以下步骤:
由显著性及自由度确定所述待测校准数据集的正常数据集,并在所述正常数据集中构造邻域关系图;
在所述邻域关系图中构造最短路径矩阵,近似估计所述样本数据之间的测地距离;
保持所述测地距离不变,计算出所述待测数据集的待测低维表示数据集。
进一步,包括以下步骤:
对待测数据集进行标准化处理,得到待测校准数据集;
根据所述映射函数计算所述待测数据的待测低维表示数据,得到待测低维表示数据集;
根据所述故障多分类模型,采用投票法获得所述待测数据集的故障判断类型。
本发明具有如下有益效果:
本发明实施例公开了一种含噪声非线性过程故障检测模型的构建方法,该方法首先利用SR-Isomap算法对样本数据集进行标准化处理,然后获取样本数据集的正常数据集,并获得该正常数据集的低维结构,降低样本数据集的维度,并计算正常数据集与低维表示数据集之间的映射函数;然后,使用支持向量机算法建立故障多分类模型。本发明实施例在数理统计的基础之上,使用标准化残差对原始数据的流形特性进行回归分析,识别并有效地隔离噪声,消除噪声数据对原始数据流形结构造成的偏差,提高故障检测模型的准确率,通过对Isomap算法的改进,实现了样本数据非线性主元的准确获取,进一步增强了等距映射算法对噪声的鲁棒性。
附图说明
图1为本发明一个实施例所提供的一种含噪声非线性过程故障检测模型的构建方法的流程图;
图2为本发明一个实施例所提供的一种基于含噪声非线性过程故障检测模型的构建方法的检测方法的流程图;
图3-1(a)为采用Isomap算法的降维效果示意图;
图3-1(b)为采用SR-Isomap算法的降维效果示意图;
图3-2(a)为粘滞故障时关于原始高维数据的k度距回归分析图;
图3-2(b)为粘滞故障时关于原始高维数据的标准化残差分布图;
图3-3(a)为第8种故障时关于原始高维数据的k度距回归分析图;
图3-3(b)为第8种故障时关于原始高维数据的标准化残差分布图;
图3-4(a)为第21种故障关于原始高维数据的k度距回归分析图;
图3-4(b)为第21种故障时关于原始高维数据的标准化残差分布图;
图3-5(a)为粘滞故障时未经标准化处理的数据r值随时间的变化图;
图3-5(b)为粘滞故障时经标准化处理的数据r值随时间的变化图;
图3-6(a)为第8种故障时未经标准化处理的数据r值随时间的变化图;
图3-6(b)第8种故障时经标准化处理的数据r值随时间的变化图;
图3-7(a)为第21种故障时未经标准化处理的数据r值随时间的变化图;
图3-7(b)第21种故障时经标准化处理的数据r值随时间的变化图;
图3-8为粘滞故障时三种故障检测方法仿真结果对比图;
图3-9为第8种故障时三种故障检测方法仿真结果对比图;
图3-10为第21种故障时三种故障检测方法仿真结果对比图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种含噪声非线性过程故障检测模型的构建方法及其检测方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
需要说明的是,当元件被称为“设置”或者“连接”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的属于只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
下面结合附图具体的说明本发明所提供的一种含噪声非线性过程故障检测模型的构建方法及其检测方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的含噪声非线性过程故障检测模型的构建方法的流程图,本发明在数理统计的基础之上,使用标准化残差对原始数据的流形特性进行回归分析,识别并有效地隔离噪声,消除噪声数据对原始数据流形结构造成的偏差,提高故障检测模型的准确率。具体的,该故障检测模型的构建方法包括以下步骤:
步骤S101,对样本数据集进行标准化处理,得到所述样本数据集的校准数据集。
具体的,设在非线性工业系统中收集的含噪声的样本数据集X={x1,x2,…,xN},xi∈Rn,i=1,2,3,...,N,假设噪声为高斯白噪声,满足正态分布。
定义Ⅰ对于和样本数据集X={x1,x2,…,xN},xi∈Rn,i=1,2,3,...,N,计算样本数据xi与CX{xi}中各点的欧式距离,选取k个欧式距离最小的点组成集合并定义该集合为KNNk(xi)。
定义Ⅱ在样本数据集X={x1,x2,…,xN},xi∈Rn中,对于定义样本数据xi的k度距ri:
xl∈KNNk(xi)
t=|{xj|xj∈X∩xi∈KNNk(xj)}|
其中,A∈R+为调节因子。
对于计算xi的中心距di,并组成校准数据集D:
D={(d1,r1),(d2,r2),…,(dN,rN)}
步骤S102,根据所述校准数据集计算其标准差和标准化残差,剔除所述校准数据集中的噪声数据。
具体的,对校准数据进行回归分析,设回归方程为:
对于校准数据(di,ri),其残差表示为:
对于校准数据集D残差的标准差s表示为:
在计算残差的过程中需要用到校准数据集D的所有元素,使得e1,e2,…,eN之间并不是相互独立的。同时,残差的标准差也不尽相同,越是聚类特性异常的点,其对应的残差的波动性越小。对于s,标准化残差ti表示为
其中,hii表示杠杆系数,hii的计算方法为:
通过杠杆系数hii达到残差ei去杠杆化的目的,此时残差ei标准差调整至为整数1,对于异常和噪声数据来说,其杠杆系数hii显著大于其他观测数据,其标准化残差显著小于其他观测,经过杠杆系数hii调整至标准化残差后,观测数据的残差开始变得均匀可比,并且残差ei遵从正态分布N(0,δ2),其中δ表示残差ei的均值,标准化残差ti服从标准正态分布N(0,1)。由给定的显著性α及自由度N-2以及标准化残差临界值,当满足ti≥tα,N-2条件时,则该观测数据可判定为噪声或异常数据,当ti<tα,N-2时,则该点判定为正常数据,并组成一个正常数据集S。
步骤S103,计算所述正常数据集的低维表示数据集。
首先,在正常数据集S中构造邻域关系图,在邻域关系图G中构造最短路径矩阵W,近似估计高维数据点之间的测地距离。然后,保持测地距离不变,采用多维度分析算法计算出高维数据X的低维表示数据集Z。
具体的,采用Dijkstra算法计算正常数据集S中各点之间最短路径:
其中xp+1∈KNNk(xp),xp,xp+1,…,xq∈S。
根据正常数据集S中各点之间的最短路径,构建最短路径矩阵W:
其中
G=|S|
并采用MDS算法构建W的低维流形。
设Z∈Rm'×M为样本在低维空间中的表示形式,且||zp-zq||=wpq,则
对B=ZTZ∈RM×M进行SVD分解:
B=QΣU
式中Q表示左奇异向量,为BTB的特征向量矩阵,U表示右奇异向量,Q和U均为正交矩阵,Σ为奇异值矩阵。提取前m'项特征值λ1,λ2,…,λm'和对应的特征向量v1,v2,…,vm',令
V=(v1,v2,…,vm')
则低维数据可表示为
步骤S104,根据所述低维表示数据集,使用支持向量机算法建立故障多分类模型。
请参阅1,将流形学习算法与支持向量机多分类模型相结合,构造SR-Isomap-SVM故障检测模型。支持向量机(SVM)多类分类模型的建立可采用“一对一”、“一对多”和有向无环图法等多种分类方法。本发明实施例采用“一对一”的方法建立多分类模型。
综上所述,本发明实施例公开了一种含噪声非线性过程故障检测模型的构建方法,该方法首先利用SR-Isomap算法对样本数据集进行处理,然后获取样本数据集的正常数据集,并获得该正常数据集的低维结构,降低样本数据集的维度,并计算正常数据集与低维表示数据集之间的映射函数;然后,使用支持向量机算法建立故障多分类模型。本发明实施例在数理统计的基础之上,使用标准化残差对原始数据的流形特性进行回归分析,识别并有效地隔离噪声,消除噪声数据对原始数据流形结构造成的偏差,提高故障检测模型的准确率,通过对Isomap算法的改进,实现了样本数据非线性主元的准确获取,进一步增强了等距映射算法对噪声的鲁棒性。
请再次参阅图1,可选的,本发明实施例在所述计算正常数据集的低维表示数据集之后,还包括步骤S105,建立了正常数据与低维表示数据之间的映射函数。
建立映射函数的过程可以是在计算所述待测正常数据集的待测低维表示数据集之后,获得所述待测数据集的故障判断类型之前;也可以是在获得所述待测数据集的故障判断类型之后。
当采用Isomap流行学习算法对新采集的数据进行特征提取时,由于在新采集的数据和低维数据之间不存在明确的映射关系,对于所有新采集数据均需要多次估计所有数据点间的测地距离,从而使得特征提取过程具有较大的复杂度和较高的延时性,当流形学习算法应用于故障检测时,高复杂度的特征提取过程不利于提升故障检测模型的快速性。所以,准确地拟合输入、输出数据之间的映射关系成为提高故障检测快速性和准确性的关键。
在实际生产过程中,故障数据具有维度较高、样本数量有限且新采集数据表现为多重共线性的特点,这使得故障检测模型的精度受到很大的影响,在本节中采用Lasso回归方法构造结构风险最小化函数,大大减少了数据变异性和显著提高了线性回归模型的准确性。
Lasso回归方法能够更加有效的拟合正常数据及其低维表示数据之间的映射关系,其基本原理是在拟合输入数据和输出数据之间映射关系的基础之上,构造出数据之间的的均方误差,使其最优化来求出数据间具体的映射表达式。在Lasso回归中,经验风险最小化的均方差表示为
其中,X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),该式的解析解表示为
当数据维度大于采集数据数量时,XTX不是满秩矩阵,式(1-105)中会存在无穷多个解,当随机选择可行解时,往往会造成过拟合的现象。并且,在实际生产过程中,故障数据维度较高、样本数量有限且数据之间具有多重共线性的特点,大大影响了故障检测模型的准确度。
采用Lasso回归方法构造结构风险最小化函数,能够减少变异性和提高线性回归模型的准确性,能够有效的拟合输入数据和输出数据的映射关系:
式中,λ为正则化参数,作用是控制均方误差和惩罚项的大小,采用交叉验证的方法确定最优λ。通过限制W和λ的大小实现对模型空间的限制,避免过拟合现象的发生,且这种方法具有良好的稀疏性。
将上式转化为二次规划问题:
采用坐标下沉法求解
对变量进行中心化
那么
由Donoho-Johnstone引理得到
使用坐标下降算法求解W,首先对数学模型中的参数进行初始化设置,并进行迭代循环计算。
当满足终止条件时,停止迭代计算。
请参阅图2,本发明还提供了一种基于上述实施例所提供的含噪声非线性过程故障检测模型的构建方法的检测方法,该检测方法用于系统故障检测,该检测方法包括以下步骤:
步骤S201,对待检测数据进行标准化处理,得到待测校准数据集。
具体,该标准化处理的过程,与上述实施例的步骤S101中对样本数据集进行标准化处理的过程相同。
步骤S202,根据所述待测校准数据集计算其标准差和标准化残差,剔除所述待测校准数据集中的噪声数据得到待测正常数据集,并计算所述待测正常数据集的待测低维表示数据集;
采用与步骤S102相同的算法计算待测低维表示数据集。
步骤S203,根据故障多分类模型,采用投票法获得所述待测数据集的故障判断类型。
根据所述故障检测模型中的故障多分类模型,采用投票法统计待诊断样本在所有SVM分类器下的故障判断类型,最大计票数所对应的状态即为测试样本的状态。
请再次参阅图2,在其他实施例中,步骤S202还可以通过映射函数获得待检测数据的低维表示数据集,所述映射函数是在故障多分类模型中建立的能够准确描述正常数据及其低维表示数据之间的映射关系的函数,通过建立映射函数能够提高故障检测快速性和准确性。该映射函数的建立过程,请参照上述实施例步骤S105中采用Lasso回归方法建立映射函数的过程,不再赘述。
下面通过实验数据来进一步说明本发明实施例所提供的方案:
将本发明所提供的步骤S101~103的改进算法称为SR-Isomap算法,将SR-Isomap算法与支持向量机多分类模型相结合的算法称为SR-Isomap-SVM,下文不再声明。
1)SR-Isomap算法的抗燥性能分析
在实验中随机选取1000个S-curve数据样本组成测试集,为1000×3矩阵,并向测试集中加入100组高斯白噪声。图3-1(a)和图3-1(b)分别表示Isomap算法和SR-Isomap算法的试验结果。
如图3-1(a)所示,加入高斯噪声后,Isomap算法映射结果产生了叠加,流形结构无法得到展开,产生这种现象是因为在噪声点的干扰下,Isomap算法在取较大的邻域时会产生“短路”现象,即低维流形中不同邻域的点映射后会出现混杂。图3-1(b)显示了SR-Isomap降维结果,流形结构得到展开,能够有效地在低维空间表达高维数据,减少了降维后损失的数据信息,试验结果表明SR-Isomap算法对噪声具有较强的鲁棒性。
2)TE过程故障检测仿真分析
TE过程是由Downs和Vogel提出的一个标准工业仿真平台,包括反应器、冷凝器、气液分离器、循环压缩机和产品分离器5个主要操作单元,产生4个反应,生成两种产物和一种副产物。TE过程是一个大样本的复杂非线性化工系统,根据不同的产品比率,可分为六种操作模态,在每个模态中均包含41个过程变量和12个控制变量,在41个过程变量中包含22个连续变量,如压力、流量和温度等,剩余的19个变量为成分变量。TE过程中的采样数据是随机的时间序列,采样数据具有维度高、强耦合、缓变性和多模态等特点,根据TE过程成分测量变量不同,TE过程数据可分为21种故障工况数据,分别是阶跃、随机变化、慢漂移、粘滞和恒定位置等故障类型,每种故障数据集包含960个样本,为960×52矩阵。
在本试验中,分别选取TE过程的正常和故障工况各500个样本组成样本数据集,余下样本作为待测数据集,并向其添加50组均差为0方差为0.01的高斯白噪声以模拟工业过程现场情况。不失一般性,随机选取粘滞故障、第8种故障和第21种故障进行试验,试验中设置目标维数为20,显著性水平为95.54%,调节因子A取1,仿真结果如图3-2至图3-4所示,其中图3-2(a)至图3-4(a)中的原始高维数据的r值分布在区间[0,5]内,分布集中,少数点存在扰动,不同数据之间的r值分布差异较小。噪声数据的r值分布分散且随机性较强,远离原始数据的r值分布。图3-2(b)至图3-4(b)表示测试集中样本的标准化残差分布图,在图中可以看出,绝大多数噪声的标准化残差值均分布在区间[0,2]之外,可以在95.45%的异常显著性水平下识别噪声。试验结果验证了SR-Isomap算法中的标准化残差分析的合理性。
为了进一步验证SR-Isomap算法的抗噪性能,设置r值作为监控统计量对三种故障进行监控,仿真结果如图3-5至图3-7所示。在噪声干扰下数据的r值具有较大的波动性,采用SR-Isomap算法隔离噪声之后,数据的r值分布趋于平稳,波动性减小,仿真结果进一步验证了SR-Isomap算法对噪声的极强的鲁棒性。
为了验证SR-Isomap-SVM方法在噪声环境下的故障检测性能,在同等条件下,选用等距映射算法与支持向量机相结合(Isomap-SVM)的故障检测方法、核函数主成分分析与支持向量机(KPCA-SVM)、基于相对等距映射(RISOMAP)故障检测方法和基于标准化残差的等距映射与支持向量机(SR-Isomap-SVM)4种故障检测方法,对粘滞故障、第8种故障和第21种故障进行故障检测仿真试验,重复10次试验,仿真结果取均值,三种故障检测方法的准确率如表3-1所示。
表3-1故障检测结果对比
从表3-1中可以看出,在噪声干扰下,Isomap-SVM方法的故障检测准确率非常低,误判率较高,Isomap流形学习算法易受噪声的干扰,造成Isomap-SVM故障检测方法在噪声环境下的故障检测性能较差。KPCA算法强调整体方差最小化,无法学习出嵌入在非线性数据中的低维流形结构,造成KPCA-SVM故障检测方法在非线性监控数据下故障检测的准确率较低,不能满足实际非线性过程故障检测的要求。基于RISOMAP故障诊断方法故障检测正确率优于前两种方法,但也容易受到噪声的干扰。在三种故障检测方法中,SR-Isomap-SVM方法故障检测准确率最高,在噪声环境下,该方法能够准确学习出嵌入在高维数据低维流形,实现对化工过程运行状态的准确识别。
为了进一步验证SR-Isomap-SVM故障检测方法在噪声环境下的故障检测性能,在仿真试验中,不断改变样本数据集中噪声在试验数据中所占的比例,观测在每次试验中每种故障检测方法的准确率。在每种噪声比例下,均重复10次试验,结果取均值。仿真结果如图3-8至图3-10所示。
如图3-8至图3-10所示,随着噪声比例的增加,在三种故障检测方法中,SR-Isomap-SVM方法故障检测对对噪声的鲁棒性最强,故障检测的准确率最高。当噪声比例超过15%时,Isomap-SVM方法对粘滞故障和第21种故障故障检测准确率均低于20%,误判率极高,故障检测模型基本失效。当噪声比例超过17.5%时,Isomap-SVM对第8种故障检测的准确率低于45%,故障检测性能极差,不能满足实际生产安全和产品质量的要求;相对于Isomap-SVM,噪声对KPCA-SVM影响较小,这是因为Isomap算法对噪声非常敏感,噪声会使得算法不能学习出高维流形中的低维结构,而KPCA算法着重全局方差最小,不易受噪声的影响,但KPCA算法对核函数的种类及其参数的选择对特征提取结果的影响较大,不适用于噪声环境下化工过程的故障检测。SR-Isomap算法能够准确识别噪声,大大地降低了噪声对故障检测的影响,噪声环境下,SR-Isomap-SVM故障检测方法具有较高的准确率,仿真结果验证了该方法故障识别领域可靠性和可应用性。
综上所述,本发明实施例对工业过程中的非线性和多变量问题展开研究,在对数据的流形特征分析的基础上,对等距映射流形学习算法的改进,并将流形学习算法与支持向量机多分类模型相结合,构建SR-Isomap-SVM故障检测模型。TE过程仿真结果表明,本大名所提的故障检测方法对噪声具有较强的鲁棒性,能够快速准确地识别出系统故障。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (7)
1.一种含噪声非线性过程故障检测模型的构建方法,其特征在于,该构建方法包括以下步骤:
对样本数据集进行标准化处理,得到所述样本数据集的校准数据集;
根据所述校准数据集计算其标准差和标准化残差,剔除所述校准数据集中的噪声数据得到正常数据集,并计算所述正常数据集的低维表示数据集;
根据所述低维表示数据集,使用支持向量机算法建立故障多分类模型;
其中,所述标准化处理的方法包括计算所述样本数据集中样本数据的k度距ri和xi的中心距di,获得由校准数据(di,ri)组成的校准数据集:
对于和样本数据集X={x1,x2,…,xN},xi∈Rn,i=1,2,3,...,N,计算样本数据xi与CX{xi}中各点的欧式距离,选取k个欧式距离最小的点组成集合并定义该集合为KNNk(xi);
对于定义样本数据xi的k度距ri:
其中xl∈KNNk(xi),t=|{xj|xj∈X∩xi∈KNNk(xj)}|,A∈R+为调节因子。
2.根据权利要求1所述的一种含噪声非线性过程故障检测模型的构建方法,其特征在于,所述计算所述正常数据集的低维表示数据集的方法,包括以下步骤:
在所述正常数据集中构造邻域关系图,在所述邻域关系图中构造最短路径矩阵,近似估计所述样本数据之间的测地距离;
保持所述测地距离不变,计算出所述样本数据集的低维表示数据集。
3.根据权利要求1或者2所述的一种含噪声非线性过程故障检测模型的构建方法,其特征在于,在所述计算所述正常数据集的低维表示数据集之后,还包括:
计算所述正常数据与所述低维表示数据之间的映射函数。
4.根据权利要求3所述的一种含噪声非线性过程故障检测模型的构建方法,其特征在于,所述映射函数的计算方法采用Lasso回归算法。
5.一种基于权利要求1所述的一种含噪声非线性过程故障检测模型的构建方法的检测方法,其特征在于,包括以下步骤:
对待测数据集进行标准化处理,得到待测校准数据集;
根据所述待测校准数据集计算其标准差和标准化残差,剔除所述待测校准数据集中的噪声数据得到正常数据集,并计算所述待测正常数据集的待测低维表示数据集;
根据所述故障多分类模型,采用投票法获得所述待测数据集的故障判断类型。
6.一种基于权利要求3所述的一种含噪声非线性过程故障检测模型的构建方法的检测方法,其特征在于,包括以下步骤:
对待测数据集进行标准化处理,得到待测校准数据集;
根据所述映射函数计算所述待测数据的待测低维表示数据,得到待测低维表示数据集;
根据所述故障多分类模型,采用投票法获得所述待测数据集的故障判断类型。
7.根据权利要求5或者6所述的一种检测方法,其特征在于,所述计算所述待测校准数据集的待测低维表示数据集的方法,包括以下步骤:
在所述正常数据集中构造邻域关系图;在所述邻域关系图中构造最短路径矩阵,近似估计所述样本数据之间的测地距离;
保持所述测地距离不变,计算出所述待测数据集的待测低维表示数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910466924.3A CN110263826A (zh) | 2019-05-31 | 2019-05-31 | 含噪声非线性过程故障检测模型的构建方法及其检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910466924.3A CN110263826A (zh) | 2019-05-31 | 2019-05-31 | 含噪声非线性过程故障检测模型的构建方法及其检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110263826A true CN110263826A (zh) | 2019-09-20 |
Family
ID=67916179
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910466924.3A Pending CN110263826A (zh) | 2019-05-31 | 2019-05-31 | 含噪声非线性过程故障检测模型的构建方法及其检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110263826A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723514A (zh) * | 2020-05-09 | 2020-09-29 | 东华大学 | 基于高斯核函数的svm算法的工艺流程故障诊断方法 |
CN113722935A (zh) * | 2021-09-16 | 2021-11-30 | 广东辛孚科技有限公司 | 一种石化装置代理模型的自动更新方法 |
CN114936582A (zh) * | 2022-06-08 | 2022-08-23 | 华侨大学 | 一种工作模态参数识别方法、系统及故障位置识别方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106604229A (zh) * | 2016-12-27 | 2017-04-26 | 东南大学 | 一种基于流形学习与改进支持向量机的室内定位方法 |
-
2019
- 2019-05-31 CN CN201910466924.3A patent/CN110263826A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106604229A (zh) * | 2016-12-27 | 2017-04-26 | 东南大学 | 一种基于流形学习与改进支持向量机的室内定位方法 |
Non-Patent Citations (3)
Title |
---|
LUNARNAI: "关于数据降维的诸多算法,测试数据必须要和训练数据一起运算么", 《HTTPS://WWW.ZHIHU.COM/QUESTION/30696153/ANSWER/551472194》 * |
YANKUN HAN等: "Fault detection method based on improved Isomap and SVM in noise-containing nonlinear process", 《2018 INTERNATIONAL CONFERENCE ON CONTROL, AUTOMATION AND INFORMATION SCIENCES (ICCAIS)》 * |
吴锦华等: "一种基于Laplacian 的半监督特征选择模型", 《重庆科技学院学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723514A (zh) * | 2020-05-09 | 2020-09-29 | 东华大学 | 基于高斯核函数的svm算法的工艺流程故障诊断方法 |
CN113722935A (zh) * | 2021-09-16 | 2021-11-30 | 广东辛孚科技有限公司 | 一种石化装置代理模型的自动更新方法 |
CN114936582A (zh) * | 2022-06-08 | 2022-08-23 | 华侨大学 | 一种工作模态参数识别方法、系统及故障位置识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105975749B (zh) | 一种轴承健康评估与预测的方法及系统 | |
CN103033362B (zh) | 一种基于改进多变量预测模型的齿轮故障诊断方法 | |
CN102192927B (zh) | 一种基于电子鼻技术的空气质量监测系统及其监测方法 | |
CN104712542B (zh) | 一种基于物联网的往复压缩机敏感特征提取与故障诊断方法 | |
CN101398311B (zh) | 基于灰色系统理论的重复动态测量数据处理方法 | |
CN110263826A (zh) | 含噪声非线性过程故障检测模型的构建方法及其检测方法 | |
CN106529090A (zh) | 一种航天电子类产品可靠性评估方法 | |
CN105572572B (zh) | 基于wknn-lssvm的模拟电路故障诊断方法 | |
CN101446283B (zh) | 一种基于进化计算诊断压缩机故障的方法 | |
CN108549908B (zh) | 基于多采样概率核主成分模型的化工过程故障检测方法 | |
CN107590351B (zh) | 一种离心泵扬程特性分析与预测的方法 | |
CN109407649A (zh) | 一种基于故障特征变量选择的故障类型匹配方法 | |
CN106257488B (zh) | 一种基于邻域特征空间鉴别分析的雷达目标识别方法 | |
CN107832789A (zh) | 基于平均影响值数据变换的特征加权k近邻故障诊断方法 | |
CN109409425A (zh) | 一种基于近邻成分分析的故障类型识别方法 | |
Al-Maskari et al. | An effective approach to handling noise and drift in electronic noses | |
CN111612241A (zh) | 智能船舶路径规划功能实现性的综合评价方法 | |
CN109725138B (zh) | 智能化水泥工厂生产中熟料质量检测方法、装置及设备 | |
Bartel et al. | Force calibration using errors-in-variables regression and Monte Carlo uncertainty evaluation | |
CN105740617B (zh) | 一体化天馈系统品质度的衡量方法 | |
CN104503436A (zh) | 一种基于随机投影和k近邻的快速故障检测方法 | |
CN113873471A (zh) | 一种基于svm的地铁轨道线路无线环境指纹库构建方法 | |
CN105894014A (zh) | 基于多因素不一致度量的异常行为序贯检测方法 | |
CN111061151B (zh) | 一种基于多元卷积神经网络的分布式能源状态监测方法 | |
CN108053093A (zh) | 一种基于平均影响值数据变换的k-近邻故障诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190920 |
|
RJ01 | Rejection of invention patent application after publication |