CN110263826A

CN110263826A - 含噪声非线性过程故障检测模型的构建方法及其检测方法

Info

Publication number: CN110263826A
Application number: CN201910466924.3A
Authority: CN
Inventors: 侯彦东; 程前帅; 黄瑞瑞; 韩艳坤; 陈政权; 刘畅
Original assignee: Henan University
Current assignee: Henan University
Priority date: 2019-05-31
Filing date: 2019-05-31
Publication date: 2019-09-20

Abstract

本发明涉及基于流形学习的故障检测方法技术领域，具体涉及含噪声非线性过程故障检测模型的构建方法及其检测方法。该构建方法包括以下步骤：对样本数据集进行标准化处理，得到所述样本数据集的校准数据集；根据所述校准数据集计算其标准差和标准化残差，剔除所述校准数据集中的噪声数据得到正常数据集，并计算所述正常数据集的低维表示数据集；根据所述低维表示数据集，使用支持向量机算法建立故障多分类模型。本发明在数理统计的基础之上，使用标准化残差对原始数据的流形特性进行回归分析，识别并有效地隔离噪声，提高故障检测模型的准确率，通过对Isomap算法的改进，实现了样本数据非线性主元的准确获取，增强了等距映射算法对噪声的鲁棒性。

Description

含噪声非线性过程故障检测模型的构建方法及其检测方法

技术领域

本发明涉及基于流形学习的故障检测方法技术领域，具体涉及含噪声非线性过程故障检测模型的构建方法及其检测方法。

背景技术

现代工业系统规模宏大，且日趋复杂，使得化工生产过程中的监控数据往往呈现出高维数且强非线性的特征。减少过程数据的冗杂、准确地获取监控数据的非线性主元，为工业过程中实时、高效的故障检测提供了重要保障。现在被广泛使用的线性特征提取算法，如主成分分析、线性判别法和多维尺度分析等算法，均不能获取数据中非线性特征信息，易造成关键信息的丢失，不利于提升工业系统故障检测的准确性。

等距映射算法(Isomap算法)是一种高效的流形学习算法，广泛应用于非线性数据的降维运算。Isomap算法将高维空间的流形映射到低维空间中，有效的获取嵌入在高维空间中的低维结构。Isomap算法是基于领域图与经典MDS算法的具有全局特性的非线性流形学习算法，算法基本思想是利用局部邻域距离估计高维数据点之间的全局流形测地距离来描述各点之间的相互关系，实现高维非线性数据的特征简约。

在统计学习理论基础之上发展起来的支持向量机(Support Vector Machines，SVM)算法，是一种建立在结构风险最小化(Structural Risk Minimization，SRM)原理基础之上，研究有限样本预测的学习方法。SVM能够克服神经网络和传统分类器的局部极值点、维数灾难、过学习等诸多缺点，可以很好地解决小样本、非线性、高维数和局部极小点等实际问题，是一种重要的模式识别方法。

发明人在实践中，发现上述现有技术存在以下缺陷：

在实际生产过程中，当系统设备正常运行或发生故障时，设备传感器周边往往存在强磁强场、高温或者其他未知不规则扰动，使得传感器传输的数据中包含异常或噪声数据，当收集到的数据作为系统运行状态数据而运用于系统故障检测时，异常或噪声数据不规则的特性往往会导致故障检测结果准确率较低，漏检率较高，远远不能满足实际工业过程的安全要求。

发明内容

为了解决上述技术问题，本发明的目的在于提供一种含噪声非线性过程故障检测模型的构建方法及其检测方法，所采用的技术方案具体如下：

一种含噪声非线性过程故障检测模型的构建方法，该构建方法包括以下步骤：

对样本数据集进行标准化处理，得到所述样本数据集的校准数据集；

根据所述校准数据集计算其标准差和标准化残差，剔除所述校准数据集中的噪声数据得到正常数据集，并计算所述正常数据集的低维表示数据集；

根据所述低维表示数据集，使用支持向量机算法建立故障多分类模型；

其中，所述标准化处理的方法包括计算所述样本数据集中样本数据的k度距r_i和x_i的中心距d_i，获得由校准数据(d_i,r_i)组成的校准数据集：

对于和样本数据集X＝{x₁,x₂,…,x_N}，x_i∈Rⁿ，i＝1,2,3,...,N，计算样本数据x_i与C_X{x_i}中各点的欧式距离，选取k个欧式距离最小的点组成集合并定义该集合为KNN_k(x_i)；

对于定义样本数据x_i的k度距r_i：

其中x_l∈KNN_k(x_i)，t＝|{x_j|x_j∈X∩x_i∈KNN_k(x_j)}|，A∈R⁺为调节因子。

进一步，所述计算所述正常数据集的低维表示数据集的方法，包括以下步骤：

在所述正常数据集中构造邻域关系图，在所述邻域关系图中构造最短路径矩阵，近似估计所述样本数据之间的测地距离；

保持所述测地距离不变，计算出所述样本数据集的低维表示数据集。

进一步，在所述计算所述正常数据集的低维表示数据集之后，还包括：

计算所述正常数据与所述低维表示数据之间的映射函数。

进一步，所述映射函数的计算方法采用Lasso回归算法。

一种基于含噪声非线性过程故障检测模型的构建方法的检测方法，包括以下步骤：

对待测数据集进行标准化处理，得到待测校准数据集；

根据所述待测校准数据集计算其标准差和标准化残差，剔除所述待测校准数据集中的噪声数据得到正常数据集，并计算所述待测正常数据集的待测低维表示数据集；

根据所述故障多分类模型，采用投票法获得所述待测数据集的故障判断类型。

进一步，所述计算所述待测校准数据集的待测低维表示数据集的方法，包括以下步骤：

由显著性及自由度确定所述待测校准数据集的正常数据集，并在所述正常数据集中构造邻域关系图；

在所述邻域关系图中构造最短路径矩阵，近似估计所述样本数据之间的测地距离；

保持所述测地距离不变，计算出所述待测数据集的待测低维表示数据集。

进一步，包括以下步骤：

对待测数据集进行标准化处理，得到待测校准数据集；

根据所述映射函数计算所述待测数据的待测低维表示数据，得到待测低维表示数据集；

本发明具有如下有益效果：

本发明实施例公开了一种含噪声非线性过程故障检测模型的构建方法，该方法首先利用SR-Isomap算法对样本数据集进行标准化处理，然后获取样本数据集的正常数据集，并获得该正常数据集的低维结构，降低样本数据集的维度，并计算正常数据集与低维表示数据集之间的映射函数；然后，使用支持向量机算法建立故障多分类模型。本发明实施例在数理统计的基础之上，使用标准化残差对原始数据的流形特性进行回归分析，识别并有效地隔离噪声，消除噪声数据对原始数据流形结构造成的偏差，提高故障检测模型的准确率，通过对Isomap算法的改进，实现了样本数据非线性主元的准确获取，进一步增强了等距映射算法对噪声的鲁棒性。

附图说明

图1为本发明一个实施例所提供的一种含噪声非线性过程故障检测模型的构建方法的流程图；

图2为本发明一个实施例所提供的一种基于含噪声非线性过程故障检测模型的构建方法的检测方法的流程图；

图3-1(a)为采用Isomap算法的降维效果示意图；

图3-1(b)为采用SR-Isomap算法的降维效果示意图；

图3-2(a)为粘滞故障时关于原始高维数据的k度距回归分析图；

图3-2(b)为粘滞故障时关于原始高维数据的标准化残差分布图；

图3-3(a)为第8种故障时关于原始高维数据的k度距回归分析图；

图3-3(b)为第8种故障时关于原始高维数据的标准化残差分布图；

图3-4(a)为第21种故障关于原始高维数据的k度距回归分析图；

图3-4(b)为第21种故障时关于原始高维数据的标准化残差分布图；

图3-5(a)为粘滞故障时未经标准化处理的数据r值随时间的变化图；

图3-5(b)为粘滞故障时经标准化处理的数据r值随时间的变化图；

图3-6(a)为第8种故障时未经标准化处理的数据r值随时间的变化图；

图3-6(b)第8种故障时经标准化处理的数据r值随时间的变化图；

图3-7(a)为第21种故障时未经标准化处理的数据r值随时间的变化图；

图3-7(b)第21种故障时经标准化处理的数据r值随时间的变化图；

图3-8为粘滞故障时三种故障检测方法仿真结果对比图；

图3-9为第8种故障时三种故障检测方法仿真结果对比图；

图3-10为第21种故障时三种故障检测方法仿真结果对比图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种含噪声非线性过程故障检测模型的构建方法及其检测方法，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。

需要说明的是，当元件被称为“设置”或者“连接”另一个元件，它可以直接在另一个元件上或者也可以存在居中的元件。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的属于只是为了描述具体的实施例的目的，不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

下面结合附图具体的说明本发明所提供的一种含噪声非线性过程故障检测模型的构建方法及其检测方法的具体方案。

请参阅图1，其示出了本发明一个实施例提供的含噪声非线性过程故障检测模型的构建方法的流程图，本发明在数理统计的基础之上，使用标准化残差对原始数据的流形特性进行回归分析，识别并有效地隔离噪声，消除噪声数据对原始数据流形结构造成的偏差，提高故障检测模型的准确率。具体的，该故障检测模型的构建方法包括以下步骤：

步骤S101，对样本数据集进行标准化处理，得到所述样本数据集的校准数据集。

具体的，设在非线性工业系统中收集的含噪声的样本数据集X＝{x₁,x₂,…,x_N}，x_i∈Rⁿ，i＝1,2,3,...,N，假设噪声为高斯白噪声，满足正态分布。

定义Ⅰ对于和样本数据集X＝{x₁,x₂,…,x_N}，x_i∈Rn，i＝1,2,3,...,N，计算样本数据x_i与C_X{x_i}中各点的欧式距离，选取^k个欧式距离最小的点组成集合并定义该集合为KNN_k(x_i)。

定义Ⅱ在样本数据集X＝{x₁,x₂,…,x_N}，x_i∈Rⁿ中，对于定义样本数据x_i的k度距r_i：

x_l∈KNN_k(x_i)

t＝|{x_j|x_j∈X∩x_i∈KNN_k(x_j)}|

其中，A∈R⁺为调节因子。

对于计算x_i的中心距d_i，并组成校准数据集D：

D＝{(d₁,r₁),(d₂,r₂),…,(d_N,r_N)}

步骤S102，根据所述校准数据集计算其标准差和标准化残差，剔除所述校准数据集中的噪声数据。

具体的，对校准数据进行回归分析，设回归方程为：

对于校准数据(d_i,r_i)，其残差表示为：

对于校准数据集D残差的标准差s表示为：

在计算残差的过程中需要用到校准数据集D的所有元素，使得e₁,e₂,…,e_N之间并不是相互独立的。同时，残差的标准差也不尽相同，越是聚类特性异常的点，其对应的残差的波动性越小。对于s，标准化残差t_i表示为

其中，h_ii表示杠杆系数，h_ii的计算方法为：

通过杠杆系数h_ii达到残差e_i去杠杆化的目的，此时残差e_i标准差调整至为整数1，对于异常和噪声数据来说，其杠杆系数h_ii显著大于其他观测数据，其标准化残差显著小于其他观测，经过杠杆系数h_ii调整至标准化残差后，观测数据的残差开始变得均匀可比，并且残差e_i遵从正态分布N(0,δ²)，其中δ表示残差e_i的均值，标准化残差t_i服从标准正态分布N(0,1)。由给定的显著性α及自由度N-2以及标准化残差临界值，当满足t_i≥t_α,N-2条件时，则该观测数据可判定为噪声或异常数据，当t_i＜t_α,N-2时，则该点判定为正常数据，并组成一个正常数据集S。

步骤S103，计算所述正常数据集的低维表示数据集。

首先，在正常数据集S中构造邻域关系图，在邻域关系图G中构造最短路径矩阵W，近似估计高维数据点之间的测地距离。然后，保持测地距离不变，采用多维度分析算法计算出高维数据X的低维表示数据集Z。

具体的，采用Dijkstra算法计算正常数据集S中各点之间最短路径：

其中x_p+1∈KNN_k(x_p)，x_p,x_p+1,…,x_q∈S。

根据正常数据集S中各点之间的最短路径，构建最短路径矩阵W：

其中

G＝|S|

并采用MDS算法构建W的低维流形。

设Z∈R^m'×M为样本在低维空间中的表示形式，且||z_p-z_q||＝w_pq，则

对B＝Z^TZ∈R^M×M进行SVD分解：

B＝QΣU

式中Q表示左奇异向量，为B^TB的特征向量矩阵，U表示右奇异向量，Q和U均为正交矩阵，Σ为奇异值矩阵。提取前m'项特征值λ₁,λ₂,…,λ_m'和对应的特征向量v₁,v₂,…,v_m'，令

V＝(v₁,v₂,…,v_m')

则低维数据可表示为

步骤S104，根据所述低维表示数据集，使用支持向量机算法建立故障多分类模型。

请参阅1，将流形学习算法与支持向量机多分类模型相结合，构造SR-Isomap-SVM故障检测模型。支持向量机(SVM)多类分类模型的建立可采用“一对一”、“一对多”和有向无环图法等多种分类方法。本发明实施例采用“一对一”的方法建立多分类模型。

综上所述，本发明实施例公开了一种含噪声非线性过程故障检测模型的构建方法，该方法首先利用SR-Isomap算法对样本数据集进行处理，然后获取样本数据集的正常数据集，并获得该正常数据集的低维结构，降低样本数据集的维度，并计算正常数据集与低维表示数据集之间的映射函数；然后，使用支持向量机算法建立故障多分类模型。本发明实施例在数理统计的基础之上，使用标准化残差对原始数据的流形特性进行回归分析，识别并有效地隔离噪声，消除噪声数据对原始数据流形结构造成的偏差，提高故障检测模型的准确率，通过对Isomap算法的改进，实现了样本数据非线性主元的准确获取，进一步增强了等距映射算法对噪声的鲁棒性。

请再次参阅图1，可选的，本发明实施例在所述计算正常数据集的低维表示数据集之后，还包括步骤S105，建立了正常数据与低维表示数据之间的映射函数。

建立映射函数的过程可以是在计算所述待测正常数据集的待测低维表示数据集之后，获得所述待测数据集的故障判断类型之前；也可以是在获得所述待测数据集的故障判断类型之后。

当采用Isomap流行学习算法对新采集的数据进行特征提取时，由于在新采集的数据和低维数据之间不存在明确的映射关系，对于所有新采集数据均需要多次估计所有数据点间的测地距离，从而使得特征提取过程具有较大的复杂度和较高的延时性，当流形学习算法应用于故障检测时，高复杂度的特征提取过程不利于提升故障检测模型的快速性。所以，准确地拟合输入、输出数据之间的映射关系成为提高故障检测快速性和准确性的关键。

在实际生产过程中，故障数据具有维度较高、样本数量有限且新采集数据表现为多重共线性的特点，这使得故障检测模型的精度受到很大的影响，在本节中采用Lasso回归方法构造结构风险最小化函数，大大减少了数据变异性和显著提高了线性回归模型的准确性。

Lasso回归方法能够更加有效的拟合正常数据及其低维表示数据之间的映射关系，其基本原理是在拟合输入数据和输出数据之间映射关系的基础之上，构造出数据之间的的均方误差，使其最优化来求出数据间具体的映射表达式。在Lasso回归中，经验风险最小化的均方差表示为

其中，X＝(x₁,x₂,x₃,…,x_n)，Y＝(y₁,y₂,y₃,…,y_n)，该式的解析解表示为

当数据维度大于采集数据数量时，X^TX不是满秩矩阵，式(1-105)中会存在无穷多个解，当随机选择可行解时，往往会造成过拟合的现象。并且，在实际生产过程中，故障数据维度较高、样本数量有限且数据之间具有多重共线性的特点，大大影响了故障检测模型的准确度。

采用Lasso回归方法构造结构风险最小化函数，能够减少变异性和提高线性回归模型的准确性，能够有效的拟合输入数据和输出数据的映射关系：

式中，λ为正则化参数，作用是控制均方误差和惩罚项的大小，采用交叉验证的方法确定最优λ。通过限制W和λ的大小实现对模型空间的限制，避免过拟合现象的发生，且这种方法具有良好的稀疏性。

将上式转化为二次规划问题：

采用坐标下沉法求解

对变量进行中心化

那么

由Donoho-Johnstone引理得到

使用坐标下降算法求解W，首先对数学模型中的参数进行初始化设置，并进行迭代循环计算。

当满足终止条件时，停止迭代计算。

请参阅图2，本发明还提供了一种基于上述实施例所提供的含噪声非线性过程故障检测模型的构建方法的检测方法，该检测方法用于系统故障检测，该检测方法包括以下步骤：

步骤S201，对待检测数据进行标准化处理，得到待测校准数据集。

具体，该标准化处理的过程，与上述实施例的步骤S101中对样本数据集进行标准化处理的过程相同。

步骤S202，根据所述待测校准数据集计算其标准差和标准化残差，剔除所述待测校准数据集中的噪声数据得到待测正常数据集，并计算所述待测正常数据集的待测低维表示数据集；

采用与步骤S102相同的算法计算待测低维表示数据集。

步骤S203，根据故障多分类模型，采用投票法获得所述待测数据集的故障判断类型。

根据所述故障检测模型中的故障多分类模型，采用投票法统计待诊断样本在所有SVM分类器下的故障判断类型，最大计票数所对应的状态即为测试样本的状态。

请再次参阅图2，在其他实施例中，步骤S202还可以通过映射函数获得待检测数据的低维表示数据集，所述映射函数是在故障多分类模型中建立的能够准确描述正常数据及其低维表示数据之间的映射关系的函数，通过建立映射函数能够提高故障检测快速性和准确性。该映射函数的建立过程，请参照上述实施例步骤S105中采用Lasso回归方法建立映射函数的过程，不再赘述。

下面通过实验数据来进一步说明本发明实施例所提供的方案：

将本发明所提供的步骤S101～103的改进算法称为SR-Isomap算法，将SR-Isomap算法与支持向量机多分类模型相结合的算法称为SR-Isomap-SVM，下文不再声明。

1)SR-Isomap算法的抗燥性能分析

在实验中随机选取1000个S-curve数据样本组成测试集，为1000×3矩阵，并向测试集中加入100组高斯白噪声。图3-1(a)和图3-1(b)分别表示Isomap算法和SR-Isomap算法的试验结果。

如图3-1(a)所示，加入高斯噪声后，Isomap算法映射结果产生了叠加，流形结构无法得到展开，产生这种现象是因为在噪声点的干扰下，Isomap算法在取较大的邻域时会产生“短路”现象，即低维流形中不同邻域的点映射后会出现混杂。图3-1(b)显示了SR-Isomap降维结果，流形结构得到展开，能够有效地在低维空间表达高维数据，减少了降维后损失的数据信息，试验结果表明SR-Isomap算法对噪声具有较强的鲁棒性。

2)TE过程故障检测仿真分析

TE过程是由Downs和Vogel提出的一个标准工业仿真平台，包括反应器、冷凝器、气液分离器、循环压缩机和产品分离器5个主要操作单元，产生4个反应，生成两种产物和一种副产物。TE过程是一个大样本的复杂非线性化工系统，根据不同的产品比率，可分为六种操作模态，在每个模态中均包含41个过程变量和12个控制变量，在41个过程变量中包含22个连续变量，如压力、流量和温度等，剩余的19个变量为成分变量。TE过程中的采样数据是随机的时间序列，采样数据具有维度高、强耦合、缓变性和多模态等特点，根据TE过程成分测量变量不同，TE过程数据可分为21种故障工况数据，分别是阶跃、随机变化、慢漂移、粘滞和恒定位置等故障类型，每种故障数据集包含960个样本，为960×52矩阵。

在本试验中，分别选取TE过程的正常和故障工况各500个样本组成样本数据集，余下样本作为待测数据集，并向其添加50组均差为0方差为0.01的高斯白噪声以模拟工业过程现场情况。不失一般性，随机选取粘滞故障、第8种故障和第21种故障进行试验，试验中设置目标维数为20，显著性水平为95.54％，调节因子A取1，仿真结果如图3-2至图3-4所示，其中图3-2(a)至图3-4(a)中的原始高维数据的r值分布在区间[0,5]内，分布集中，少数点存在扰动，不同数据之间的r值分布差异较小。噪声数据的r值分布分散且随机性较强，远离原始数据的r值分布。图3-2(b)至图3-4(b)表示测试集中样本的标准化残差分布图，在图中可以看出，绝大多数噪声的标准化残差值均分布在区间[0,2]之外，可以在95.45％的异常显著性水平下识别噪声。试验结果验证了SR-Isomap算法中的标准化残差分析的合理性。

为了进一步验证SR-Isomap算法的抗噪性能，设置r值作为监控统计量对三种故障进行监控，仿真结果如图3-5至图3-7所示。在噪声干扰下数据的r值具有较大的波动性，采用SR-Isomap算法隔离噪声之后，数据的r值分布趋于平稳，波动性减小，仿真结果进一步验证了SR-Isomap算法对噪声的极强的鲁棒性。

为了验证SR-Isomap-SVM方法在噪声环境下的故障检测性能，在同等条件下，选用等距映射算法与支持向量机相结合(Isomap-SVM)的故障检测方法、核函数主成分分析与支持向量机(KPCA-SVM)、基于相对等距映射(RISOMAP)故障检测方法和基于标准化残差的等距映射与支持向量机(SR-Isomap-SVM)4种故障检测方法，对粘滞故障、第8种故障和第21种故障进行故障检测仿真试验，重复10次试验，仿真结果取均值，三种故障检测方法的准确率如表3-1所示。

表3-1故障检测结果对比

从表3-1中可以看出，在噪声干扰下，Isomap-SVM方法的故障检测准确率非常低，误判率较高，Isomap流形学习算法易受噪声的干扰，造成Isomap-SVM故障检测方法在噪声环境下的故障检测性能较差。KPCA算法强调整体方差最小化，无法学习出嵌入在非线性数据中的低维流形结构，造成KPCA-SVM故障检测方法在非线性监控数据下故障检测的准确率较低，不能满足实际非线性过程故障检测的要求。基于RISOMAP故障诊断方法故障检测正确率优于前两种方法，但也容易受到噪声的干扰。在三种故障检测方法中，SR-Isomap-SVM方法故障检测准确率最高，在噪声环境下，该方法能够准确学习出嵌入在高维数据低维流形，实现对化工过程运行状态的准确识别。

为了进一步验证SR-Isomap-SVM故障检测方法在噪声环境下的故障检测性能，在仿真试验中，不断改变样本数据集中噪声在试验数据中所占的比例，观测在每次试验中每种故障检测方法的准确率。在每种噪声比例下，均重复10次试验，结果取均值。仿真结果如图3-8至图3-10所示。

如图3-8至图3-10所示，随着噪声比例的增加，在三种故障检测方法中，SR-Isomap-SVM方法故障检测对对噪声的鲁棒性最强，故障检测的准确率最高。当噪声比例超过15％时，Isomap-SVM方法对粘滞故障和第21种故障故障检测准确率均低于20％，误判率极高，故障检测模型基本失效。当噪声比例超过17.5％时，Isomap-SVM对第8种故障检测的准确率低于45％，故障检测性能极差，不能满足实际生产安全和产品质量的要求；相对于Isomap-SVM，噪声对KPCA-SVM影响较小，这是因为Isomap算法对噪声非常敏感，噪声会使得算法不能学习出高维流形中的低维结构，而KPCA算法着重全局方差最小，不易受噪声的影响，但KPCA算法对核函数的种类及其参数的选择对特征提取结果的影响较大，不适用于噪声环境下化工过程的故障检测。SR-Isomap算法能够准确识别噪声，大大地降低了噪声对故障检测的影响，噪声环境下，SR-Isomap-SVM故障检测方法具有较高的准确率，仿真结果验证了该方法故障识别领域可靠性和可应用性。

综上所述，本发明实施例对工业过程中的非线性和多变量问题展开研究，在对数据的流形特征分析的基础上，对等距映射流形学习算法的改进，并将流形学习算法与支持向量机多分类模型相结合，构建SR-Isomap-SVM故障检测模型。TE过程仿真结果表明，本大名所提的故障检测方法对噪声具有较强的鲁棒性，能够快速准确地识别出系统故障。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种含噪声非线性过程故障检测模型的构建方法，其特征在于，该构建方法包括以下步骤：

对于定义样本数据x_i的k度距r_i：

2.根据权利要求1所述的一种含噪声非线性过程故障检测模型的构建方法，其特征在于，所述计算所述正常数据集的低维表示数据集的方法，包括以下步骤：

3.根据权利要求1或者2所述的一种含噪声非线性过程故障检测模型的构建方法，其特征在于，在所述计算所述正常数据集的低维表示数据集之后，还包括：

计算所述正常数据与所述低维表示数据之间的映射函数。

4.根据权利要求3所述的一种含噪声非线性过程故障检测模型的构建方法，其特征在于，所述映射函数的计算方法采用Lasso回归算法。

5.一种基于权利要求1所述的一种含噪声非线性过程故障检测模型的构建方法的检测方法，其特征在于，包括以下步骤：

对待测数据集进行标准化处理，得到待测校准数据集；

6.一种基于权利要求3所述的一种含噪声非线性过程故障检测模型的构建方法的检测方法，其特征在于，包括以下步骤：

对待测数据集进行标准化处理，得到待测校准数据集；

7.根据权利要求5或者6所述的一种检测方法，其特征在于，所述计算所述待测校准数据集的待测低维表示数据集的方法，包括以下步骤：

在所述正常数据集中构造邻域关系图；在所述邻域关系图中构造最短路径矩阵，近似估计所述样本数据之间的测地距离；