CN108038493A

CN108038493A - 基于回归智能判别嵌入的工业大数据过程故障监测方法

Info

Publication number: CN108038493A
Application number: CN201711188839.2A
Authority: CN
Inventors: 张颖伟; 杨德胜; 王建辉
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2017-11-24
Filing date: 2017-11-24
Publication date: 2018-05-15

Abstract

本发明提供一种基于回归智能判别嵌入的工业大数据过程故障监测方法，涉及故障监测与诊断技术领域。该方法首先采集工业过程中的数据，建立基于图理论的采样数据的各类图矩阵，构造非线性低维嵌入子空间，对原始数据空间做线性投影变换，然后构造优化函数并求解，构建在线特征提取公式，对工业生产过程采集的新数据进行特征提取，通过两个SVM分类器对提取的新数据的特征进行故障监测和诊断。本发明在半监督判别嵌入的基础上，结合半监督灵活流形嵌入的特点，可以在传统数据与多媒体流数据统一建模的情况下，对非线性与时变性的数据进行有效的特征提取，提高故障检测的准确率，以达到故障监测和诊断的目的。

Description

基于回归智能判别嵌入的工业大数据过程故障监测方法

技术领域

本发明涉及故障监测与诊断技术领域，尤其涉及一种基于回归智能判别嵌入的工业大数据过程故障监测方法。

背景技术

随着现代工业的迅速发展，现代企业中生产设备日趋大型化、连续化、高速化和自动化，设备的结构与组成十分复杂，生产规模非常庞大。现代工业的生产过程大多是一个复杂的多变量、时变、非线性和强耦合的过程。在生产过程中极易发生各种故障，从而造成了巨大的经济损失。传统的故障检测方式只是利用常用的物理和化学变量等数据进行故障监测，诊断效率低并且误报率高，很难满足实际的需求。现在已有的基于大数据的故障诊断方法把传统的数据和多媒体流异构数据分开建模分别诊断，忽略的大数据之间的必然联系，失去了大数据的固有特性。所以现在急需一种有效的方法对现代的工业生产过程采集的传统数据和多媒体流异构数据进行统一建模并进行故障监测和诊断。

近几年随着计算机和自动化技术的蓬勃发展，工业数据的采集、处理和获取获得了前所未有的发展，为统一建立生产过程的物理化学变量和图像声音视频的大数据池提供了可能。同时对于现代的工业生产过程来说，可以把监测的工业生产的图像面积、运动速度、位置、有效像素比、分布方向、声音的频率相关信息、视频重要度和高斯熵等变量与物理化学等传统数据统一建模，发挥工业大数据的优势。通过迁移学习，提高故障诊断和分析的灵敏度，并且根据故障幅值输入调控方法来降低现代工业生产中故障造成的损失。但是随着工业系统的发展，采集的数据也日益复杂，数据之多且维度之高已经成为了大数据统一建模并进行故障监测和诊断的一大障碍。所以如何对这样高维度的大数据进行特征提取来简化接下来的故障监测和诊断已成为当前所关注的问题。传统的特征提取方法如PCA、LDA等，已无法满足当前物理化学数据和多媒体流异构数据统一建模进行故障监测和诊断的需求。所以现在急需一种有效的特征提取方法对现代的工业生产过程采集的传统数据和多媒体流异构数据进行统一建模并进行故障监测和诊断。

发明内容

本发明要解决的技术问题是针对上述现有技术的不足，提供一种基于回归智能判别嵌入的工业大数据过程故障监测方法，可以在传统数据与多媒体流数据统一建模的情况下，对非线性与时变性的数据进行有效的特征提取，提高故障检测的准确率，以达到故障监测和诊断的目的。

为解决上述技术问题，本发明所采取的技术方案是：

一种基于回归智能判别嵌入的工业大数据过程故障监测方法，包括以下步骤：

步骤1：采集工业过程中的数据，包括传统的物理化学数据和多媒体流数据；对采集的所有数据进行归一标准化处理，并根据人工经验和先验知识对其中l个数据进行类别标记；记标准归一化后为X＝[x₁，x₂，...，x_l，x_l+1，...，x_l+u]∈R^D×(l+u)，其中为标记数据，为未标记数据，l+u＝N为采样数据的个数，D为每个采样数据的维数；每个标记数据的信息记为C为采样数据的分类类别数；

步骤2：根据具体的工业生产选择合适的相似性函数，构造基于图理论的采样数据的同类相似性权重矩阵S_w、异类相似性权重矩阵S_b和全局相似性权重矩阵S，以及各相似性权重矩阵的拉普拉斯矩阵和L；

步骤3：构造一个非线性低维嵌入子空间Z＝[z₁，z₂，...z_l，z_l+1，...，z_l+u]∈R^d ^×(l+u)，d为该非线性低维嵌入子空间的维数；对原始数据空间X做线性投影变换X^TW+1^Nb，其中，W、b分别为投影矩阵和偏移向量，1_N表示有N个1的列向量；并且使原始数据线性投影变换后的子空间无限逼近该非线性低维嵌入子空间Z，即

min||X^TW+1^Nb-Z||² (7)

且z_i对应x_i，为x_i在该非线性低维嵌入子空间中的特征向量；

同时非线性低维嵌入子空间Z需满足以下条件：和minTr(Z^TLZ)；

步骤4：根据步骤3构造如下式所示的优化函数，并求解该优化函数，得到优化后的投影矩阵W^*和偏移向量b^*；

其中，λ、μ、γ是三个正的平衡参数；根据实际要提取的特征个数来选择W^*的列数，达到特征提取的目的；

步骤5：利用步骤4求得的投影矩阵W^*和偏移向量b^*构建在线特征提取公式，来对工业生产过程采集的新数据进行特征提取；在线特征提取公式为

z_new＝W^*Tx_new+b^* (14)

其中，x_new为采集的新数据，z_new为提取的数据特征；

通过SVM分类器对提取的新数据的特征进行故障监测和诊断。

所述步骤2中的相似性函数采用高斯核函数，即sim(x_i，x_j)＝exp(-||x_i-x_j||²/c)；其中c为高斯核参数；

所述同类相似性权重矩阵S_w和其拉普拉斯矩阵分别如式(1)和式(2)所示；

其中，i＝1，2，…，N；j＝1，2，…，N；N_w(x_i)表示在采样数据x_i的K邻域且与x_i有相同标记的一组数据；L_w＝D_w-S_w，L_w∈R^l×l；D_w是一个对角矩阵，它的每一个对角线元素为同类相似性权重矩阵S_w对应位置的行和或者列和；

所述异类相似性权重矩阵S_b和其拉普拉斯矩阵分别如式(3)和式(4)所示；

其中，N_b(x_i)表示在采样数据x_i的K邻域且与x_i有不同标记的一组数据；L_b＝D_b-S_b，L_b∈R^u×u；D_b是一个对角矩阵，它的每一个对角线元素为异类相似性权重矩阵S_b对应位置的行和或者列和；

所述全局相似性权重矩阵S和其拉普拉斯矩阵L分别如式(5)和式(6)所示；

S(i，j)＝sim(x_i，x_j) (5)

L＝D-S∈R^N×N (6)

其中，D是一个对角矩阵，它的每一个对角线元素为相似性权重矩阵S对应位置的行和或者列和。

在构建图矩阵的过程中，选取标记数据数量的二分之一作为K邻近的值，即l/2。

所述步骤4中求解优化函数时，先固定两个变量b和W，变换优化函数，求变量Z，反过来利用求得的变量Z求解前两个固定变量b和W，具体的求解过程如下：

首先求优化函数e(Z，W，b)关于b和W的偏导数，并且分别令它们的偏导数等于零，得到b和W的表达式分别如下两式所示，

W＝γ(γXX^T+I)^-1XZ＝AZ (10)

其中，A＝γ(γXX^T+I)^-1X；

固定两个变量b和W，将优化函数e(Z，W，b)变换为Tr(Z^T(L₁+E)Z)，通过求解如下的优化函数求得Z的解，

Z^*＝minTr(Z^T(L₁+E)Z)，s.t.Z^TZ＝I (13)

其中，E＝μA^TA+μγ(B-I)^T(B-I)，

Z求出之后，带入W和b的表达式，进而求得W^*和b^*。

采用上述技术方案所产生的有益效果在于：本发明提供的一种基于回归智能判别嵌入的工业大数据过程故障监测方法，在半监督判别嵌入(SSDE)的基础上，结合半监督灵活流形嵌入(SSFME)的特点，实现在传统数据与多媒体流数据统一建模的情况下，对非线性与时变性的数据进行有效的特征提取，提高故障检测的准确率，以达故障监测和诊断的目的，具体表现为：

(1)本发明中的低维嵌入子空间是一个非线性数据特征空间，与半监督灵活流形嵌入(SSFME)不同，维数不受训练数据的类别数限制，能与诸多分类算法融合使用；

(2)本发明是一种非线性工业数据特征提取的方法，首先假设一个非线性低维空间嵌入，然后用一个线性回归去逼近该非线性低维嵌入子空间，来达到工业大数据特征提取的目的，通用性更强，适用范围更广；

(3)本发明可以实现在传统数据与多媒体流数据统一建模的情况下，对非线性与时变性的数据进行有效的特征提取；同时本发明使用了数据的判别信息，使同类数据的间距最小，异类数据的间距最大，可以有效提取工业数据的特征信息，以实现故障监测和诊断。

总之，本发明提供的方法不仅能大大降低误报警，还提高了故障检测的准确性。

附图说明

图1为电镕镁炉生产过程结构示意图；

图2为本发明实施例提供的基于回归智能判别嵌入的工业大数据过程故障监测方法流程图；

图3为本发明实施例提供的在构建图矩阵的过程中，K邻近取值为10时对电镕镁炉数据特征提取后的分类示意图；

图4为本发明实施例提供的在构建图矩阵的过程中，K邻近取值为15时对电镕镁炉数据特征提取后的分类示意图；

图5为本发明实施例提供的在构建图矩阵的过程中，K邻近取值为20时对电镕镁炉数据特征提取后的分类示意图；

图6为本发明实施例提供的在构建图矩阵的过程中，K邻近取值为25时对电镕镁炉数据特征提取后的分类示意图；

图7为本发明实施例提供的在构建图矩阵的过程中，K邻近取值为30时对电镕镁炉数据特征提取后的分类示意图；

图8为本发明实施例提供的在构建图矩阵的过程中，K邻近取值为35时对电镕镁炉数据特征提取后的分类示意图；

图9为本发明实施例提供的在特征提取维度为3时，R-SSDE算法对电镕镁炉数据特征提取后的分类示意图；

图10为本发明实施例提供的SSDE算法对电镕镁炉数据特征提取后的分类示意图；

图11为本发明实施例提供的R-SSDE算法与SSDE算法在不同特征提取维度下对电镕镁炉故障监测与诊断准确率变化曲线示意图。

图中：1、变压器；2、短网；3、电极升降装置；4、电极；5、炉壳；6、车体；7、电弧；8、炉料。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。。以下实施例用于说明本发明，但不用来限制本发明的范围。

本发明以电熔镁炉工业生产过程为例，电镕镁炉生产过程结构示意图如图1所示。基于回归智能判别嵌入的工业大数据过程故障监测方法如图2所示，具体实施步骤如下所述。

步骤1：采集工业过程数据。在电熔镁炉运行过程中，分别采集传统的统计量数据，包括电熔镁炉三个电极的电流值(Ia、Ib、Ic)，同时采集炉内外的图像数据，用灰度共生矩阵提取图像的ASM能量、对比度、逆差距、熵、自相关等信息。将所采集的数据归一标准化为N个采样数据，每一个采样数据记为x_i，总的采样数据为X＝[x₁，x₂，...，x_l，x_l+1，...，x_l+u]∈R^D ^×(l+u)，其中为标记数据，为未标记数据，l+u＝N，D为每个采样数据的维数；每个标记数据的信息记为其中C为采样数据的分类类别数。本实施例中，1＝80，u＝120，N＝200，D＝23，即采集200个数据，其中80个标记数据，120个未标记数据，每个数据为一个23维的向量；C＝3，表示采样数据中包括3类数据，这3类数据分别为正常数据、故障一数据和故障二数据，其中故障一表示漏炉故障，故障二表示喷炉故障。。如表1所示，为本实施例中采集的部分采样数据(8个数据)，包括一部分标记数据(6个标记数据)和未标记数据(2个未标记数据)，其中最后一行的类别中，类别1表示正常数据，类别2表示故障一数据，类别3表示故障二数据，“-”表示未标记数据。

表1标准化后的8组采样数据

步骤2：根据实际情况选择合适的相似性函数，构造基于图理论的采样数据的同类相似性权重矩阵S_w、异类相似性权重矩阵S_b和全局相似性权重矩阵S，以及各相似性权重矩阵的拉普拉斯矩阵和L。

相似性函数sim(·，·)满足的要求：任何两个变量满足对称性的函数都可以作为相似性函数，即对换两个变量的值函数的值不会发生变化。常用的相似性函数有高斯核函数、多项式函数等。本实施例采用高斯核函数，高斯核参数为c＝1000，即sim(x_i，x_j)＝exp(-||x_i-x_j||²/c)。

同类相似性权重矩阵S_w和其拉普拉斯矩阵分别如式(1)和式(2)所示。

其中，i＝1，2，…，N；j＝1，2，…，N；N_w(x_i)表示在采样数据x_i的K邻域且与x_i有相同标记的一组数据。

其中，L_w＝D_w-S_w，L_w∈R^l×l；D_w是一个对角矩阵，它的每一个对角线元素为同类相似性权重矩阵S_w对应位置的行和或者列和。

异类相似性权重矩阵S_b和其拉普拉斯矩阵分别如式(3)和式(4)所示。

其中，N_b(x_i)表示在采样数据x_i的K邻域且与x_i有不同标记的一组数据。

其中，L_b＝D_b-S_b，L_b∈R^u×u；D_b是一个对角矩阵，它的每一个对角线元素为异类相似性权重矩阵S_b对应位置的行和或者列和。

为了保持维度的一致性和保证运算的可行性，将拉普拉斯矩阵L_w和L_b扩展成了和

全局相似性权重矩阵S和其拉普拉斯矩阵L分别如式(5)和式(6)所示；

S(i，j)＝sim(x_i，x_j) (5)

L＝D-S∈R^N×N (6)

为了保证在实际过程中的故障诊断的准确性和实时性，该发明在构建图矩阵的过程中，选取标记数据数量的二分之一左右作为K邻近的值，即l/2。

本实施例在表一数据基础上计算出全局拉普拉斯矩阵L、异类拉普拉斯矩阵和同类拉普拉斯矩阵分别如表2、表3和表4所示。

表2采样数据全局拉普拉斯矩阵L

表3采样数据异类拉普拉斯矩阵

表4采样数据同类拉普拉斯矩阵

步骤3：构造一个非线性低维嵌入子空间Z＝[z₁，z₂，...z_l，z_l+1，...，z_l+u]∈R^d ^×(l+u)，d为该非线性低维嵌入子空间的维数。对原始数据空间X做线性投影变换X^TW+1^Nb，其中，W、b分别为投影矩阵和偏移向量，1_N表示有N个1的列向量。并且使原始数据线性投影变换后的子空间无限逼近该非线性低维嵌入子空间Z，即

min||X^TW+1^Nb-Z||² (7)

且z_i对应x_i，为x_i在该非线性低维嵌入子空间中的特征向量。

同时为了保证非线性低维嵌入子空间Z有最大的判别信息且低维嵌入子空间满足一定的流形光滑性等要求，需满足以下条件，即：和minTr(Z^TLZ)。

步骤4：根据步骤3构造如下式所示的优化函数，并求解该优化函数。

其中，λ，μ，γ是三个正的平衡参数。

求解过程：该优化函数包括三个变量Z，W，b。为了更便捷的求解该优化函数，采用如下方法：固定两个变量求第三个变量，反过来利用求解的第三个变量求解这两个固定变量。

首先，我们求优化函数e(Z，W，b)关于b和W的偏导数，并且分别令它们的偏导数等于零，得到

W＝γ(γXX^T+I)^-1XZ＝AZ (10)

其中，A＝γ(γXX^T+I)^-1X。

将上述的b和W的表达式带入变换方程X^TW+1_Nb，得到

其中，把上述表达式带入优化函数可得

其中，E＝μA^TA+μγ(B-I)^T(B-I)。

这样就可以通过求解上述式子得到Z的解。Z的求解可以通过求解如下的优化函数求得。

Z^*＝minTr(Z^T(L₁+E)Z)，s.t.Z^TZ＝I (13)

Z求出来之后，带入b和W的表达式进而可以求得b^*和W^*。接下来根据实际想要提取的特征的个数来选择W^*的列数来达到特征提取的目的。

在本实施例中，取200个数据点作为建模数据，其中60个数据点为标记数据，140点为未标记数据。在提取特征维数为2维的情况下，计算投影矩阵和偏差向量。偏差向量为b^*＝[-0.0003，0.0011]^T，投影矩阵如表4所示。

表4投影矩阵

步骤5：利用步骤4求得的投影矩阵W^*和偏移向量b^*构建在线特征提取公式，来对工业生产过程采集的新数据进行特征提取，通过提取的数据特征对工业生产过程进行实时在线监测与故障诊断。在线特征提取公式为

z_new＝W^*Tx_new+b^* (14)

其中，x_new为采集的新数据，z_new为提取的数据特征；

通过两个SVM分类器对提取的新数据的特征进行故障监测和诊断，第一个SVM分类器由正常数据和两类故障数据提取的特征训练，并将第一个SVM分类器记为SVM1，用于判断数据是否为故障数据。第二个SVM分类器由故障一数据和故障二数据提取的特征训练，并将第二个SVM分类器记为SVM2，用于判别故障的类型；将采集的新数据进行特征提取之后带入SVM1分类器中，若该分类器值大于或等于0，则表示该新数据为正常数据，若SVM1分类器值小于0，则表示为故障数据。为了进一步确定该故障数据的故障类别，将故障数据的特征带入SVM2分类器中，若该分类器值大于或等于0，则表示该故障数据为一类故障，否则为二类故障。

由于本发明的方法是基于图理论的半监督算法，所以基于图理论的采样数据的异类相似性权重矩阵S_b、同类相似性权重矩阵S_w和全局相似性权重矩阵S和它们各自的拉普拉斯矩阵的建立对实验的结果有着十分重要的作用。由于在图矩阵的建立过程用到了K邻近的思想，并且K的值对实验仿真过程起着重要的作用。所以首先观察不同的K值对实验仿真结果的影响。

在本实施例中，以200个数据点为建模数据，其中60个标记数据，140个未标记数据，100个数据点作为检测数据。三个平衡参数的取值分别为λ＝μ＝γ＝0.5，取K邻近的K的值依次为10、15、20、15、30、35等不同值，分别仿真出仿真图像，并且统计不同的K值情况下对建模数据中的未标记数据和检测数据的故障诊断准确率。仿真结果如图3～图8所示，故障诊断准确率如表5所示。

表5不同的K值的故障诊断准确率

从仿真图3～图6和图8可以看出，在K取10、15、20、25、35时，虽然可以看到正常数据和两类故障数据都分开聚类，但是在正常数据和故障一数据的边缘都有交集，这是在实际工业生产中不想看到的。因为在实际工业生产中，要排除一切干扰因素来保证故障监测和诊断的准确率，因为一丝的疏忽就可能造成巨大的损失。而在图7中可以看出，当K的值为30时，正常数据与两类故障数据分界明显具有很好聚类效果。所以在本实施例的电镕镁炉实际生产过程中，取K邻近的值为30。同时从表5也可以看出当K的取值为30时故障诊断准确率最高为98.57％。如图9所示，为在特征提取维度为3时，对电镕镁炉数据特征提取后的分类示意图，可以看出，K的取值为30时，分类效果也很明显。

本发明的方法(简称R-IDE算法)是在半监督判别嵌入(SSDE)的基础上提出的，下面对本发明方法与SSDE算法做对比，并统计这两种故障诊断算法在提取不同维度特征的情况下的故障诊断准确率。

同样以200个数据点为建模数据，其中60个标记数据，140个未标记数据，100个数据点作为检测数据。三个平衡参数的取值分别为λ＝μ＝γ＝0.5，取K邻近的K的值为30。并且统计在不同的特征提取维度情况下对建模数据中的未标记数据和检测数据的故障诊断准确率。从仿真图的易读性考虑，在这里不将建模数据和检测数据区分，而是当做一个整体的数据集。SSDE算法的仿真结果如图10所示，故障诊断准确率如表6所示。

表6 SSDE与R-IDE算法在提取不同特征维度下的故障诊断准确率

从仿真结果图10可以看出，SSDE虽然有初步的聚类效果，即数据实现了分类，但是正常数据和两类故障的分类边缘都有交集。与R-IDE的实验仿真图7相比，分类效果差很多。同时，如图11所示，为本发明R-IDE算法与SSDE算法在不同特征提取维度下对电镕镁炉故障监测与诊断准确率变化曲线示意图，从图11的故障诊断率曲线上也可以看出，在同等特征提取的维度下，SSDE的故障诊断准确率明显要低于R-IDE。

在表6中也可以看出，在R-IDE故障诊断过程中，当特征提取维度为2和3时，故障诊断准确率最高。但是考虑到时间效率问题与运算复杂程度，在实际的电镕镁炉生产过程中，提取数据的特征维度为2来保证故障诊断准确率。

在本实施例中，取上述实验过程所建立的模型。选取检测数据的前40个数据进行故障在线监测诊断，此外还对检测出的故障数据进行具体的故障分类。首先用所建立的模型对检测数据进行特征提取。其中，选取K邻近的K值为30，特征提取维度为2，λ＝μ＝γ＝0.5。接着用两个SVM分类器对提取后的特征进行分类，得到待检测数据的类别后，与它们的真实类别进行对比，计算出故障监测与诊断以及故障数据具体分类结果的准确率。其中检测数据的真实类别与实验仿真结果的类别对比如表7所示。其中类别1表示为正常数据，类别2为故障一数据，类别3为故障二数据。

表7检测数据的真实类别与R-IDE算法实验结果得出的类别

从表7中的数据可以看出，R-IDE故障监测方法的可靠性非常高。对40个检测数据的检测结果只有一个数据点的检测结果产生了错误，故障诊断率达97.25％。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims

1.一种基于回归智能判别嵌入的工业大数据过程故障监测方法，其特征在于：包括以下步骤：

步骤3：构造一个非线性低维嵌入子空间Z＝[z₁，z₂，...z_l，z_l+1，...，z_l+u]∈R^d×(l+u)，d为该非线性低维嵌入子空间的维数；对原始数据空间X做线性投影变换X^TW+1^Nb，其中，W、b分别为投影矩阵和偏移向量，1_N表示有N个1的列向量；并且使原始数据线性投影变换后的子空间无限逼近该非线性低维嵌入子空间Z，即

min||X^TW+1^Nb-Z||² (7)

同时非线性低维嵌入子空间Z需满足以下条件：和minTr(Z^TLZ)；

<mrow> <mi>min</mi> <mi> </mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>Z</mi> <mo>,</mo> <mi>W</mi> <mo>,</mo> <mi>b</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>T</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>Z</mi> <mi>T</mi> </msup> <mi>L</mi> <mi>Z</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>T</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>Z</mi> <mi>T</mi> </msup> <msub> <mover> <mi>L</mi> <mo>~</mo> </mover> <mi>w</mi> </msub> <mi>Z</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>&lambda;</mi> <mi>T</mi> <mi>r</mi> <mrow> <mo>(</mo> <msup> <mi>Z</mi> <mi>T</mi> </msup> <msub> <mover> <mi>L</mi> <mo>~</mo> </mover> <mi>b</mi> </msub> <mi>Z</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>&mu;</mi> <mrow> <mo>(</mo> <mo>|</mo> <mo>|</mo> <mi>W</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <mi>&gamma;</mi> <mo>|</mo> <mo>|</mo> <msup> <mi>X</mi> <mi>T</mi> </msup> <mi>W</mi> <mo>+</mo> <msub> <mn>1</mn> <mi>N</mi> </msub> <mi>b</mi> <mo>-</mo> <mi>Z</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

z_new＝W^*Tx_new+b^* (14)

其中，x_new为采集的新数据，z_new为提取的数据特征；

通过SVM分类器对提取的新数据的特征进行故障监测和诊断。

2.根据权利要求1所述的基于回归智能判别嵌入的工业大数据过程故障监测方法，其特征在于：所述步骤2中的相似性函数采用高斯核函数，即sim(x_i，x_j)＝exp(-||x_i-x_j||²/c)；其中c为高斯核参数；

<mrow> <msub> <mi>S</mi> <mi>w</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>w</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>r</mi> <mi> </mi> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>w</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mover> <mi>L</mi> <mo>~</mo> </mover> <mi>w</mi> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>L</mi> <mi>w</mi> </msub> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>&Element;</mo> <msup> <mi>R</mi> <mrow> <mi>N</mi> <mo>&times;</mo> <mi>N</mi> </mrow> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>S</mi> <mi>b</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>b</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>r</mi> <mi> </mi> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msub> <mi>N</mi> <mi>b</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mover> <mi>L</mi> <mo>~</mo> </mover> <mi>b</mi> </msub> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <msub> <mi>L</mi> <mi>b</mi> </msub> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mn>0</mn> </mtd> </mtr> </mtable> </mfenced> <mo>&Element;</mo> <msup> <mi>R</mi> <mrow> <mi>N</mi> <mo>&times;</mo> <mi>N</mi> </mrow> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

S(i，j)＝sim(x_i，x_j) (5)

L＝D-S∈R^N×N (6)

3.根据权利要求2所述的基于回归智能判别嵌入的工业大数据过程故障监测方法，其特征在于：在构建图矩阵的过程中，选取标记数据数量的二分之一作为K邻近的值，即l/2。

4.根据权利要求2所述的基于回归智能判别嵌入的工业大数据过程故障监测方法，其特征在于：所述步骤4中求解优化函数时，先固定两个变量b和W，变换优化函数，求变量Z，反过来利用求得的变量Z求解前两个固定变量b和W，具体的求解过程如下：

W＝γ(γXX^T+I)^-1XZ＝AZ (10)

其中，A＝γ(γXX^T+I)^-1X；

Z^*＝minTr(Z^T(L₁+E)Z)，s.t.Z^TZ＝I (13)

其中，E＝μA^TA+μγ(B-I)^T(B-I)，

Z求出之后，带入W和b的表达式，进而求得W^*和b^*。