CN108182445B

CN108182445B - 基于大数据智能核独立元分析的过程故障识别方法

Info

Publication number: CN108182445B
Application number: CN201711325148.2A
Authority: CN
Inventors: 张颖伟; 王振帮; 关守平
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2017-12-13
Filing date: 2017-12-13
Publication date: 2020-05-19
Anticipated expiration: 2037-12-13
Also published as: CN108182445A

Abstract

本发明提供一种基于大数据智能核独立元分析的过程故障识别方法，涉及流程工业故障诊断技术领域。该方法通过样本数据构建半监督核独立元分析算法，获得样本数据的空间转换矩阵和状态投影矩阵，再构建各个运行状态类别的生产运行状态库；对新采集的数据进行预处理后，通过获得的空间转换矩阵和状态投影矩阵进行初步故障诊断，获得的各个投影方向的置信区间求得实时工况数据的得分因子，计算FICD统计量，进行精准的故障识别。本发明将基于类别成员资格的半监督分类学习方法和核独立元分析相结合，根据状态投影矩阵和构建相应的统计量对工业过程的运行状态进行故障诊断和精准的故障识别，能有效地提升识别电熔镁炉熔炼运行状态的识别度和准确性。

Description

基于大数据智能核独立元分析的过程故障识别方法

技术领域

本发明涉及流程工业故障诊断技术领域，尤其涉及一种基于大数据智能核独立元分析的过程故障识别方法。

背景技术

传统的数据集往往有物理化学等过程变量组成。基于向量的过程监测方法在多元统计方法运用的推动下蓬勃发展。然而，在监控设备大量使用后，图像和视频等维度高、数据量丰富、动态性能明显的异构矩阵数据出现使得故障诊断领域在新的应用前景中遇到了挑战。

特征提取和特征选择对上述问题有巨大的帮助，然而，过于丰富且海量的数据源很难标记出每一个数据的状态信息。因此，故障诊断的建模过程面临巨大的困难。众所周知，对于所采集的数据集进行全部的标签处理将浪费大量的人力物力，同时，对于数据量巨大的现代过程工业实时地进行标签标记也是难以实现的。那么对于一个只含有少量标记数据的数据集，仅仅利用标签数据进行建模是难以准确进行分类的同时也是难以令人信服的。

此外，对于处于各类重叠区域的样本数据有时候仅仅利用单一的分类假设或是狭义的分类思想往往会对数据产生错分类信息。经典的多分类问题常常会根据标记样本的分布信息然后依据一定的聚类假设对参与训练的未标记样本给出一个清晰的标签。这对于医学病例分析或是故障检测和诊断领域来说，对存在于分类边界处的未标记样本点给出清晰的标签基本上是一种武断的行为，甚至影响到对期待结果的判断，因为存在于分类边界处的未标记样本点往往是由故障点和临界稳定点组成的。

传统的主元分析(principle component analysis，PCA)、偏最小二乘方法(partial least square，PLS)和独立元分析(independent component analysis，ICA)等过程监测方法依靠物理化学变量建模且取得了极其理想的效果。线性判别分析(lineardiscriminant analysis，LDA)等多元统计方法也仅仅能够处理常规的过程变量。对于构建的具有异构数据特征的大数据池，原始的过程监测方法往往很难直接移植用于故障诊断。上述的海量数据难以全部或是大范围的标记以及数据的异构特点是传统监测方法移植应用的难题。ICA方法在应用于传统的故障诊断时表现出了优越的性能，同时其充分考虑数据的高阶信息使得独立的潜空间对数据的特征信息更加敏感。ICA方法在图像处理方面也有良好的性能，其通过分析高阶统计信息充分应用图像数据的边缘分布特征。由于流程工业往往是复杂多变的，数据常常具有非线性的特征，所以利用核独立元分析(kernel ICA，KICA)方法处理物理变量和图像视频数据在一起的大数据将会获得良好的检测和诊断性能。原始的KICA方法对处理传统过程变量和提取图像数据的边缘分布特征时都很敏感，但是应用已知状态比例较低的大数据建模的准确度大大降低。

电熔镁炉是一种埋弧炉，通过悬于其上方的电极传输大电流产生高温电弧，在菱镁矿粉层的下方形成超高温熔池，从而实现氧化镁的制取。整个炉体通过炉壳内耐高温绝缘材料，使炉体内部形成一个几乎封闭的熔炼空间，使得碳酸镁分解成氧化镁和二氧化碳。在熔炼的过程中往往由于电流大小的不平衡或是电极位置的微小偏离，都会使得产生的二氧化碳气体排放异常产生喷炉故障；由于电极的提升位置异常或是电流过大使得漏炉故障发生。因此，为了在实际生产中及时地规避故障的发生，进行实时有效的故障诊断，准确地识别出故障，降低生产中的安全隐患是必要的。

发明内容

本发明要解决的技术问题是针对上述现有技术的不足，提供一种基于大数据智能核独立元分析的过程故障识别方法，将基于类别成员资格的半监督分类学习方法和核独立元分析(即kernel ICA，简称KICA)方法相结合，提出基于大数据智能核独立元分析方法，即半监督KICA(即Semi-supervised KICA，简称SSKICA)方法，应用于电熔镁炉熔炼过程故障识别，以实现准确识别电熔镁炉熔炼过程的运行状态，对喷炉故障和漏炉故障降低误报警率和漏报警率的目的。

为解决上述技术问题，本发明所采取的技术方案是：一种基于大数据智能核独立元分析的过程故障识别方法，包括以下步骤：

步骤1：采集电熔镁炉炉内熔炼物料表层视频图像和熔炼过程的物理变量，物理变量包括电压、电流和炉壳温度，并对其中明显且已知的运行状态进行标记；

步骤2：对电熔镁炉炉内熔炼物料表层视频图像进行特征提取，同时与物理变量的过程数据放在同一个数据集中作为样本数据；

步骤3：对特征提取后得到的样本数据进行数据预处理，包括标准化处理和白化处理，得到处理后的样本数据Z；

步骤4：构建半监督核独立元分析算法，获得样本数据的空间转换矩阵和状态投影矩阵，具体步骤如下：

步骤4-1：在核独立元分析算法中引入基于类别成员资格的半监督分类方法，构建出半监督核独立元分析算法的目标函数，具体公式如下：

B^TB＝I

其中，z_i表示第i个白化样本，

表示第i个白化样本的局部权值归一化重构，所述局部权值归一化重构简称LWMR；r_k表示第k类的标签编码；v_k(B^Tz_i)表示第i个白化样本属于第k类的类别成员函数，B表示空间转换矩阵；f(B^Tz_i)表示第i个白化样本的类别决策函数，

表示第i个重构样本的类别决策函数；λ和λ_s均为正则化系数；E{·}为期望；

表示第p个独立元信号的概率密度；b_p表示空间转换矩阵的第p个列向量，也表示用于求解独立元信号的第p个解混向量；detB表示空间转换矩阵B的行列式值，

表示类别决策函数的希尔伯特范数，C和n分别表示类别总数和样本总数；d表示空间转换矩阵B中解混向量的个数，也表示空间转换后独立元样本中独立元变量的个数；

步骤4-2：根据循环迭代的思想对类别成员函数v_k(B^Tz_i)、空间转换矩阵B和状态投影矩阵α进行求解，具体方法为：

步骤4-2-1：对于固定的类别成员函数v_k(B^Tz_i)和空间转换矩阵B，通过优化求解，获得状态投影矩阵α，α＝[α₁,α₂,…,α_n]∈R^c×n，为利用表达定理

表示类别决策函数f(B^Tz)时的系数矩阵，其中，α_i是矩阵α中的第i个列向量；

步骤4-2-2：当类别决策函数f(B^Tz_i)和空间转换矩阵B为定值时，类别成员函数v_k(B^Tz_i)变化的情况下，优化求解获得类别成员函数v_k(B^Tz_i)；

步骤4-2-3：对于优化求解空间转换矩阵B，固定f(B^Tz_i)和v_k(B^Tz_i)本次迭代获得的封闭解，然后利用自然梯度下降法优化求取空间转换矩阵B，用于构建潜在的独立元子空间；

步骤4-2-4：判断目标函数|M^(t)-M^(t-1)|是否趋近于0，若是，则空间转换矩阵B和状态投影矩阵α求解完毕；否则，利用当前的类别成员函数v_k(B^Tz_i)、空间转换矩阵B和状态投影矩阵α返回执行步骤4-2-1；

步骤4-3：根据白化处理后的样本数据Z和求得的空间转换矩阵B，获得样本数据非线性独立元估计信号S，S＝B^TZ；

步骤5：将历史数据的估计信号S向状态投影空间的各个投影方向投影，根据用户所设定的置信度τ，获得建模样本在各个投影方向上的从属区间，进而构建各个运行状态类别的生产运行状态库；

步骤6：实时采集电熔镁炉炉内熔炼物料表层视频图像和物理变量过程数据，得到新的测试样本数据x_0new，根据步骤2和步骤3的方法对新采集的样本数据进行预处理，得到新的白化样本数据z_new；

步骤7：根据步骤6中处理后的数据，再通过步骤4-2-4求得的空间转换矩阵B和状态投影矩阵α进行初步的故障诊断；根据步骤5获得的各个投影方向的置信区间求得实时工况数据的得分因子sf；依据实时工况数据在各个投影方向的得分因子，计算故障识别置信度统计量，简称FICD统计量，然后根据获得实时工况数据的FICD统计量进行精准的故障识别；

步骤8：判断实时工况数据的状态决策函数f(B^Tz_new)的概率值，同时判断FICD统计量的数值，若状态决策函数的概率值低于0.9或者正常类别的FICD为0，则报警，否则，返回执行步骤6。

所述步骤4-2-1中优化求解获得的状态投影矩阵α如下式所示：

其中，G＝[G_l,G_u]，

Z＝[Z_l,Z_u]由前n_l列标记白化样本和后n_u列未标记的白化样本组成，

由前n_l列标记的LWMR和后n_u列未标记的LWMR组成，n＝n_l+n_u，Y表示标记样本的标签矩阵，

由C个n_u×n_u的单位阵组成，

由C个L_k组成，L_k的第k行全为1，其他位置为0，

是一个对角元素为V中元素平方的对角阵，

代表未标记数据的类别成员资格矩阵。

所述步骤4-2-2中优化求解获得的类别成员函数v_k(B^Tz_i)如下式所示：

其中，s_i＝B^Tz_i，

v_k(s_i)表示第i个独立元信号属于第k类的类别成员函数，s_i表示第i个独立元信号，f(s_i)表示第i个独立元信号的类别决策函数，

表示第i个重构独立元信号的类别决策函数，r_k表示第k类的标签编码。

所述步骤4-2-3中优化求取的空间转换矩阵B如下式所示：

B⁺←B-γ·▽M_3NGD(B)；

其中，B⁺表示空间转换矩阵B利用上式优化求解得出的当前迭代步骤中的空间转换矩阵；γ为空间转换矩阵B的寻优步长，用户根据需要自定为定步长或变步长；▽M_3NGD(B)＝▽M₃(B)B^TB，▽M₃(B)为优化求解空间转换矩阵B时目标函数M₃的梯度，目标函数M₃和梯度▽M₃(B)的具体公式分别如下两式所示；

其中，

Q_ll＝Z_lY^TαZ^T，

tr(·)表示矩阵的迹，rank(I)表示单位阵I的秩，g(·)表示对数概率密度函数logP_p(·)的一阶导数，g(Z^TB)表示白化样本Z通过空间转换矩阵B转换后的独立元样本S的对数概率密度的一阶导数；Z＝[Z_l,Z_u]由前n_l列标记白化样本和后n_u列未标记的白化样本组成，

由C个n_u×n_u的单位阵组成，

由C个L_k组成，L_k的第k行全为1，其他位置为0，

是一个对角元素为V中元素平方的对角阵，

代表未标记数据的类别成员资格矩阵；η为拉格朗日乘子系数，η由下式求出：

步骤5所述的建模样本在各个投影方向上从属区间为

具体公式为：

其中，s表示白化样本经过空间转换后得到的独立元样本，Ω＝[ω₁,ω₂,…,ω_C]为投影方向矩阵，ω_q为第q个投影方向，q＝1,2,…,C；

表示第k类建模样本在第q个投影方向上的概率密度，所述建模样本即为空间转换后的第k类独立元样本；

分别表示第k类建模样本投影到第q个投影方向上从属区间的最小值和最大值。

所述步骤7中进行初步故障诊断的具体方法为：

将预处理后的白化样本数据z_new投影到状态识别空间，根据类别决策函数

去判断样本的类别；对于类别决策函数f(B^Tz_new)的每一个元素f_k来说，当f_k∈(0,1]时，f_k表示x_0new属于第k类的概率；当f_k≥1，直接令f_k＝1，即测试样本x_0new完全属于第k类；若f_k≤0，则认为测试样本x_0new不属于第k类。

所述步骤7中求得的实时工况数据的得分因子sf如下式所示：

其中，sf_kq代表第k类样本在第q个投影方向上的得分因子；

分别表示第k类建模样本投影到第q个投影方向上从属区间的最小值和最大值，

表示新的待测样本在第q个投影方向上的投影值，其中s_new表示转换到独立元空间后的新的待测样本。

所述步骤7中的故障识别置信度统计量FICD按如下公式计算：

其中，δ_kq表示第k类样本是否属于第q个投影方向的从属区间，FICD_k表示待测样本是否属于第k类。

采用上述技术方案所产生的有益效果在于：本发明提供的基于大数据智能核独立元分析的过程故障识别方法，将KICA方法和半监督分类学习方法相结合形成了SSKICA，实现了充分利用未标记数据的分布特征，根据样本在各个类别的从属概率进行简要的故障诊断，达到了准确检测早期故障和临界稳定样本的目标，最终根据状态投影矩阵和构建相应的统计量对工业过程的运行状态进行故障诊断和精准的故障识别，能有效地提升识别电熔镁炉熔炼运行状态的识别度和准确性。本发明既解决原始的KICA方法应用已知状态比例较低的大数据建模的准确度低的问题，又能利用半监督分类方法在应用大数据进行过程监测时有良好的诊断手段；独立元方法可以去除变量间的强相关性转换到独立的子空间，这对提升分类算法的可分性和准确性提供了帮助。

附图说明

图1为本发明一种实施方式的基于大数据智能核独立元分析的过程故障识别方法流程图；

图2为本发明一种实施方式的不同类别样本在不同投影方向的概率密度图，其中，图(a)是不同类别样本在第一投影方向的概率密度图，图(b)不同类别样本在第二投影方向的概率密度图，图(c)不同类别样本在第三投影方向的概率密度图；

图3为本发明一种实施方式的通过投影到状态特征空间的故障诊断示意图；

图4为本发明一种实施方式的通过投影分析的故障识别示意图；

图5为本发明一种实施方式的电熔镁炉结构和监测系统示意图；

图6为本发明一种实施方式的基于SSKICA的故障诊断结果图；

图7为本发明一种实施方式的空间转换后电熔镁炉不同运行状态的故障诊断结果的二维可视化图；

图8为本发明一种实施方式的电熔镁炉不同运行状态原始数据分布的二维可视化图；

图9为本发明一种实施方式的基于SSKICA的故障识别结果图；

图10为本发明一种实施方式的基于SSCCM的故障诊断结果图；

图11为本发明一种实施方式的基于KICA的故障检测结果图。

图中：1、CCD摄像机；2、石墨电极；3、电极夹持器；4、钢丝绳；5、母线；6、电流互感器；7、电压互感器；8、控制中心；9、原料筒仓；10、振动给料机；11、炉壁；12、导轨。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

如图1所示，本实施例提供的基于大数据智能核独立元分析的过程故障识别方法如下所述。

本实施例中，初始的标记数据X_0l，其相应的标签为

同时初始的未标记的数据集为X_0u，X₀＝[X_0l,X_0u]，样本数n＝n_l+n_u，n_l和n_u分别为标记样本和未标记样本的数量；

本实施例中，视频特征提取后与物理变量放在同一个数据集中的标记数据

其相应的标签为

同时未标记的数据集为

X′＝[X′_l,X′_u]，样本数n＝n_l+n_u，n_l和n_u分别为标记样本和未标记样本的数量；

本实施例中，特征提取后的数据集由16个变量组成，建模数据和实时工况数据的特征变量如表1所示。

表1电熔镁炉熔炼过程中的监测变量

步骤3：对特征提取后得到的样本数据进行数据预处理，包括标准化处理和白化处理。

本实施例中，为了消除变量的量纲和特征变量中的噪声，对特征数据集进行如下的标准化处理：

其中，m为变量的数量；

s′_j分别表示变量的均值和标准差，标准化后的特征数据集X＝[X_l,X_u]由标记数据

和未标记的数据集

组成。

为了进一步去除数据间的相关性，对标准化后的特征数据集进行白化处理，首先样本数据映射到非线性特征空间

然后白化数据可以根据如下公式给出：

其中，z为白化处理后的样本数据向量，

为标准化的核矩阵，Σ和H分别代表

的特征值矩阵和特征向量矩阵，P为样本在特征空间中的白化矩阵，n为样本总数。

步骤4：构建半监督核独立元分析算法，获得样本数据的空间转换矩阵和状态投影矩阵，具体步骤如下。

步骤4-1：在核独立元分析算法中引入基于类别成员资格的半监督分类方法，构建出半监督核独立元分析算法的目标函数。

在实际分类的过程中，当标记数据存在于各自类别的边缘时，利用基本的聚类假设“相似的样本含有相同的标签”进行分类会产生很糟糕的标签预测结果，不能充分地反映真实的数据分布状态。因为对于存在于边界处的样本而言，直接给出属于当前类别而不是临近区域类别的判断是很困难的。因此，需要考虑更加准确且充分的聚类假设“给定的样本应该具有与其邻域内相似样本相似的标签，组成邻域内的类别成员资格”，其能够很好地改善标记数据分布位置不好而影响分类结果的缺陷，同时能够充分地利用未标记数据的信息。基于类别成员资格的半监督分类方法(semi-supervised classification based onclass membership,SSCCM)能够充分考虑待分类样本在各个类别的从属类别可能，这对发现早期故障和判定临界稳定状态是极其重要的。下面对基于类别成员资格的半监督分类方法(SSCCM)进行详细的描述。

对于标准化后的特征数据集X＝[X_l,X_u]，标记数据为

其相应的标签为

未标记的数据集

为了很好地利用标记数据和未标记数据的分布信息且同时兼顾相似样本具有相似类别成员资格的假设，利用k近邻准则对样本数据进行重构，从而在后面分类的过程中用样本数据的估计来训练提高样本数据的标签成员资格的泛化能力获得尽可能的真实可靠的分类器。那么对样本数据进行重构称为局部权重归一化重构处理(local weight normalized reconstruction，LWNR)，定义为：

其中，Ne(x_i)代表样本数据x_i邻域内由x_j组成的k近邻，近邻关系可通过欧式距离来判定，且x_i、x_j∈X，S_ij代表x_i邻域内样本点与其距离的一种度量用于更好地表征离所估计样本点距离越近的点相应获得较大权重的特性，当x_i与x_j的距离增加时，构建单调递减函数S_ij＝exp(-||x_i-x_j||²)。

和

分别表示标记样本和未标记样本的LWNR。C个类的成员编码通过

来表示，r_k表示第k类的标签编码，当x_i存在于第k类中时，y_i＝r_k，第k个输入对于每一个y_i和r_k为1，其余输入为-1。除了常规的类别决策函数f(x)，还定义一个C维类别成员资格向量值函数v(x)，对于任意的x_i，v_k(x_i)代表第i个样本x_i属于第k类的概率。最终，根据相似的样本应该具有相似的类别成员资格这个聚类假设，那么每一个示例和其LWNR都将会获得大致相同的类别成员资格向量，进而可以表示SSCCM为：

其中，f(x_i)表示第i个样本的类别决策函数，

表示第i个重构样本的类别决策函数，λ和λ_s均为正则化系数，

表示类别决策函数的希尔伯特范数，C和n分别表示类别总数和样本总数，b为标签成员函数的指数权重因子用于调控所分类的样本属于各个类别的可能性，在本实施例中，b＝2。

对于标记数据，其标签是确定的，也就是其类别成员资格是固定的，即：

其中，i＝1,…,n_l；k＝1,…,C；

为样本{x_i}中属于第k类的一个子集。由于标记数据具有确定的标签，所以式(4)将被转化如下：

这样每一个示例对应于所有的类别都有存在于各个类别的可能性，从而降低误分类的可能性。同时，利用LWNR来修正示例的标签同样能够提高分类的准确性。然而，所获取的示例数据间往往存在着耦合情况，若是能够找到数据间潜在的解耦的独立数据关系会大大提高分类的精度和降低分类的难度。因此，期望通过独立元变换在独立元潜空间进行数据简便且准确的分类。

当数据集在一般观测空间时，其获得的观测信号实质是实际现场中某些信号的线性组合或是某些潜在信号的叠加。那么当对常规的信号进行标签处理后，其经过一定的变换后，数据所具有的属性不会出现变化，也就是正常工况数据或是故障工况数据同样应该具有数据变换前具有的标签。基于这样的准则，对观测数据进行独立元分析，从而获取其潜在的独立元信息，即去耦合后的独立元信息将对提高分类器的分类精度有所帮助。由于独立元信息是潜在的且是独立不相关的，那么在独立元所在的空间进行数据分类进而实现在线监测能够在更加深入的层面对工况数据进行分类诊断分析。利用独立元信号信息进行数据分类能够去除原数据间存在的耦合且充分考虑数据的高阶统计量信息，同时对类别决策函数的求取，也就是分类面的优化提供便利。

因此，将KICA方法与SSCCM方法相结合实现在解混的非线性独立元信号空间的分类，从而实现基于半监督分类方法的故障检测与诊断。

当利用极大似然估价的思想去衡量数据潜在信号的独立性时，ICA算法的极大似然目标函数为：

上式可以看做是信息的最大化原则，其中，

表示第p个独立元信号的概率密度；b_p表示空间转换矩阵的第p个列向量，也表示用于求解独立元信号的第p个解混向量；n表示样本数据的采样次数，z_i为第i次实际采样的白化向量，detB为空间转换矩阵B的行列式值。

为了简化等式的表达和计算，ICA的极大似然目标函数转化为对数似然函数的期望形式：

其中，E{·}为期望。

通过优化等式(8)可以得到正交解混矩阵(空间转换矩阵)B，最后，用于解决工业非线性数据问题的KICA提取出如下的非线性独立元：

其中，

为标准化的核矩阵，Σ和H分别代表

的特征值矩阵和特征向量矩阵。

根据上面的分析，对基于ICA方法获得的独立元依据SSCCM进行数据分类。由于实际监测过程中的数据大部分具有非线性的特点，那么本方法对公式(9)求得的非线性独立元进行分类，SSKICA的目标函数为；

B^TB＝I

其中，z_i表示第i个白化样本，

表示第i个白化样本局部权值归一化重构，所述局部权值归一化重构简称LWMR；v_k(B^Tz_i)表示第i个白化样本属于第k类的类别成员函数，B表示空间转换矩阵；f(B^Tz_i)表示第i个白化样本的类别决策函数，

表示第i个重构样本的类别决策函数。

步骤4-2：根据循环迭代的思想对类别成员函数v_k(B^Tz_i)、空间转换矩阵B和状态投影矩阵α进行求解，具体如下：

步骤4-2-1：对于固定的类别成员函数v_k(B^Tz_i)和空间转换矩阵B，优化求解获得状态投影矩阵α；具体如下：

SSKICA的优化问题可以转化为：

函数可以利用表达定理

进一步转换为：

其中，Z＝[Z_l,Z_u]由前n_l列标记白化样本和后n_u列未标记的白化样本组成，

由C个n_u×n_u的单位阵组成，

由C个L_k组成，L_k的第k行全为1，其他位置为0，

是一个对角元素为V中元素平方的对角阵，

代表未标记数据的类别成员资格矩阵，α_i是一个列向量，α＝[α₁,α₂,…,α_n]∈R^c×n是拉格朗日乘子矩阵。

对等式(12)求取一阶导数可以得到：

求解获得状态投影矩阵为：

其是一个封闭的解析解，其中，G＝[G_l,G_u]，

步骤4-2-2：当类别决策函数f(B^Tz_i)和空间转换矩阵B为定值时，类别成员函数v_k(B^Tz_i)变化的情况下，SSKICA的目标函数改变为：

由于求解过程中与B无关，为了方便表示，B^Tz_i和

都将被替换为s_i＝B^Tz_i和

关于v_k(B^Tz_i)的目标函数变化为：

其中，v_k(s_i)表示第i个独立元信号属于第k类的类别成员函数，s_i表示第i个独立元信号，f(s_i)表示第i个独立元信号的类别决策函数，

表示第i个重构独立元信号的类别决策函数，λ_i为拉格朗日乘子系数。

求取式(16)的一阶导数为：

可得起驻点为：

根据约束信息，可以得到：

通过式(19)可以求得λ_i并代入到式(18)得到关于v_k(B^Tz_i)的封闭解如下：

v_k(B^Tz_i)恰满足约束0≤v_k(B^Tz_i)≤1，k＝1,…,C；i＝n_l+1,…,n。

步骤4-2-3：对于优化求解B，我们固定f(B^Tz_i)和v_k(B^Tz_i)本次迭代获得的封闭解，然后优化求取正交解混矩阵B，用于构建潜在的独立元子空间，关于B的目标函数为：

根据拉格朗日乘子法变换为无约束问题并转化为矩阵的表达式为：

其中，tr(·)表示矩阵的迹，η为拉格朗日乘子系数，rank(I)表示单位阵I的秩，对B和η求一阶导数可得：

其中，

Q_ll＝Z_lY^TαZ^T，

一般情况下，对于所有的独立元，对数概率密度函数logP_p的一阶导数g(·)都可以选择相同的函数：

g(s)＝tanh(s) (26)

为了提高梯度下降法的收敛速度且在迭代中可能发散的问题，使用自然梯度下降法同时迭代步长γ可变(用户可自行选取)那么转化后的自然梯度下降法公式为：

进而，得到最终正交解混矩阵的迭代表达式：

B⁺←B-γ·▽M_3NGD(B) (28)

本实施例中，γ＝exp(-0.1(t-1))为可变步长，t为循环迭代次数，最大迭代次数t_max＝200。空间转换矩阵B每一次迭代后都需要标准化处理。

步骤4-2-4：判断目标函数|M^(t)-M^(t-1)|是否趋近于0，若是，则空间转换矩阵B和状态投影矩阵α求解完毕；否则，利用当前的类别成员函数v_k(B^Tz_i)、空间转换矩阵B和状态投影矩阵α返回执行步骤4-2-1。

步骤4-3、根据白化处理后的样本数据Z和求得的空间转换矩阵B，获得样本数据非线性独立元估计信号S，S＝B^TZ。

步骤5、将历史数据的估计信号S向状态投影空间的各个投影方向投影，根据用户所设定的置信度τ，获得建模样本在各个投影方向上的从属区间，进而构建各个运行状态类别的生产运行状态库。

本实施例中，独立元投影到特征空间后的基矩阵可表示为

即Ω＝[ω₁,ω₂,…,ω_C]，ω_q为第q个投影方向，q＝1,2,…,C。通过空间转换矩阵B，可以得到独立元样本s＝B^Tz。进而可以定义得分因子(score factor，sf)：

其中，sf_kq代表第k类样本在第q个投影方向上的得分因子；

表示新的待测样本在第q个投影方向上的投影值，其中s_new表示转换到独立元空间后的新的待测样本；

和

可以通过统计方式获得。根据从历史数据中随机选择的训练数据，统计分析各个类别数据的概率密度进而选择出各类数据分布最集中的部分作为置信区间，即[τ,1-τ]，此外数据分布的边缘部分被视为数据类别(即运行状态)的模糊区域。置信区间的上限和下限可以通过变上下限积分获得，如下两式所示。

其中，s表示白化样本经过空间转换后得到的独立元样本，

表示映射到独立元空间的第k类建模样本在第q个投影方向上的概率密度，建模样本即为空间转换后的第k类独立元样本。

本实施例中，[τ,1-τ]＝[0.05,0.95]。

然后，定义如下的统计量去识别测试样本的运行状态。

其中，δ_kq表示第k类样本是否属于第q个投影方向的从属区间，FICD_k表示待测样本是否属于第k类。如果测试样本转换到独立元空间后投影到状态空间后在某个类别建模运行状态库的从属区间时，δ_kq为1时。运行状态库是指在投影置信区间内存在各种已知状态样本的数据集，用于新获取的监视样本状态的比较，判断和分析。此外，构建称为故障识别置信度(fault identification confidence degree，FICD)的统计量，以判断被测样本的投影是否位于各个类别的每个投影置信区间中，以排除异常数据并发现新的状态类。

本实施例中，将历史建模数据在状态投影空间的主要投影方向上进行投影，确定各个类别数据在各个投影方向上的从属区间，然后将所有的区间整合在一起形成运行状态库。图2中显示出不同类别数据在不同投影方向上的概率分布情况，在图2(a)、(b)和(c)中，从上到下的三个子图分别表示第1类、第2类和第3类的数据分布情况。根据公式(30)和公式(31)，正常运行状态数据在三个主要投影方向上的从属区间为：{[0,1]；[-0.53,0.25]；[-0.53,0.11]}，喷炉状态数据在三个主要投影方向上的从属区间为：{[-0.6,0.12]；[0.2,0.91]；[-0.55,0]}，漏炉状态数据在三个主要投影方向上的从属区间为：{[-0.63,0.05]；[-0.6,-0.06]；[0,0.8]}。熔炼过程数据从属的运行状态库即构建结束。

步骤6、实时采集电熔镁炉炉内熔炼物料表层视频图像和电压电流温度物理变量过程数据，得到新的测试样本数据x_0new，根据步骤2和步骤3的方法对新采集的样本数据进行预处理，得到新的白化样本数据z_new。

步骤7、根据步骤6中处理后的数据，再通过步骤4-2-4求得的空间转换矩阵B和状态投影矩阵α进行初步的故障诊断；根据步骤5获得的各个投影方向的置信区间求得实时工况数据的得分因子sf，依据实时工况数据在各个投影方向的得分因子，计算故障识别置信度FICD统计量，然后根据获得实时工况数据的FICD统计量进行精准的故障识别。

本实施例中，根据SSKICA方法，可以获得相对准确的分类界面，进而一个新的标准化处理后的观测样本x_new被映射到状态映射空间诊断其属于哪一类的运行状态。基于投影方式的故障诊断示意图如图3所示。由于在实际中我们无法表达高维的特征空间，在图中仅仅说明了非线性映射转换后在三维空间中的三类样本的分类结果，其与高维特征空间的形式是相似的。此示意图表明空间转换后的三类样本经过SSKICA方法对提升分类诊断给予可能，其能够很好地实现不同状态样本的故障诊断。

对于一个新的测试样本x_new，需要将其在高维特征空间中转化为白化数据z_new，进一步被投影到状态识别空间根据类别决策函数

去判断样本的类别。对于类别决策函数f(B^Tz_new)的每一个元素f_k来说，当f_k∈(0,1]时，f_k表示x_new属于第k类的概率；当f_k≥1，直接令f_k＝1，即测试样本x_new完全属于第k类；若f_k≤0，则认为测试样本x_new不属于第k类。

因为这种诊断方式仅仅依靠数据投影后的部分信息，因此这种故障诊断方法仅作为粗略的初步诊断分析。

通过上面的映射，仅在转换后的独立空间中判断识别样本的大致位置，但是无法确定测试样本的确切位置信息，从而不能很好地识别出新的故障类别，并且可能对工业过程的运行状态给出错误的判断。因此，需要构建一种精确的基于SSKICA的故障识别方法。

对于从工业过程获得的数据，其不同类别的分布都是明确的。因此，各种类型的数据应该根据各自类别的分布进行大致的聚集。然而有异常样本出现时，数据的分布会表现出意想不到的结果。此外，可以将历史训练数据投影到独立元故障诊断空间中的每个轴上，以便学习各种数据类型的分布，从而更准确地排除异常样本，找到新类并确定工业过程的运行状态。样本的分布将由核密度拟合给出。这种故障识别的示意图如图4所示。

步骤8、判断实时工况数据的状态决策函数f(B^Tz_new)的概率值，同时判断FICD统计量的数值，若是正常类别的状态决策函数的概率值低于0.9或者若是正常类别的FICD为0则报警；否则，返回执行步骤6。

电熔镁炉是一种埋弧炉，通过悬于其上方的电极传输大电流产生高温电弧，在菱镁矿粉层的下方形成超高温熔池，从而实现氧化镁的制取。整个炉体通过炉壳内耐高温绝缘材料，使炉体内部形成一个几乎封闭的熔炼空间，使得碳酸镁分解成氧化镁和二氧化碳。在熔炼的过程中往往由于电流大小的不平衡或是电极位置的微小偏离，都会使得产生的二氧化碳气体排放异常产生喷炉故障；由于电极的提升位置异常或是电流过大使得漏炉故障发生。因此，为了在实际生产中，及时的规避故障的发生，进行实时有效的故障诊断，准确的识别出故障及时报警，降低生产中的安全隐患是必要的。电熔镁炉的结构和监测系统示意图如图5所示。

在进行运行状态的识别过程中，随机选择600个历史样本建立模型，其中正常状态、喷炉状态(故障1)和漏炉状态(故障2)各为200个，各个类别的标记样本为20个。然后再随机选择300个历史数据点作为测试数据集，各个类别为100个。本实施例中，选择正则化系数λ和λ_s分别为1和0.15。

首先，根据SSKICA方法通过建模获得的状态投影矩阵B对测试样本进行简略的故障诊断，故障诊断结果如图6所示。本实施例中，认为第k类决策函数值大于0.9的样本即从属于第k类，同时第k类概率值为1的点则完全属于第k类。通过图6可以发现，SSKICA应用于故障诊断时，其性能是比较令人满意的。当测试状态分别处于正常运行状态，故障1和故障2时，所改进的SSKICA算法几乎对每一个测试样本都能检测并诊断。即使存在一定的误报和漏报，但是比例也是极低的且在可接受的范围内。

SSKICA算法是在独立元空间监测样本的状态。原始数据通过空间转换映射到独立元空间，SSKICA对于不同运行状态故障诊断的二维可视化结果如图7所示。在图7中，通过观察各个运行状态的建模样本和测试样本，发现SSKICA方法可以在半监督建模的条件下对电熔镁炉的运行状态进行有效地监测。这是由于算法充分考虑了未标记数据分布特征信息的结果。在图8中展示了原始样本数据的分布形式。故障1与故障2和正常状态数据集都有一定的重叠和交叉，这对于分类算法的识别结果的影响是巨大的。而在观察图7时，发现经过空间转换后的独立元数据交叉和重叠的区域大大减少，这对后续的分类工作会带来大大的帮助。通过图7和图8的对比，因为独立元能够使数据间的耦合解除，去除数据间的相关性，所以将独立元分析和半监督分类学习相结合应用于故障诊断是可行的。

在上面的算法测试中，已经验证将数据映射到独立元空间再进行特征分类优势明显且效果显著。进一步，为了更加准确地识别出电熔镁炉的运行状态，通过基于半监督核独立元分析的故障识别方法进行过程监测。下面根据步骤5构建的运行状态库，应用统计量FICD识别测试数据的运行状态，识别结果见图9。

在图9中，发现应用FICD可以准确识别出电熔镁炉真实的运行状态。然而，发现SSKICA算法在识别故障的过程中，正常运行状态存在误报情况，同时在喷炉和漏炉故障发生的情况下也发生了漏报。幸运的是，上述误报和漏报状态的比例是极低的，这样的结果也是令人满意的。

最后，为了显示出所改进算法良好的故障诊断性能，将SSKICA的监测结果与原始的SSCCM和KICA算法在电熔镁炉运行状态的过程监测结果进行比较。SSCCM算法的状态识别结果和KICA算法的故障检测结果分别展示在图10和图11中。图10说明了SSCCM算法在故障识别过程中也有良好的性能，但是通过比较图6和图10的监测结果，当运行于相应状态时，SSCCM决策出低于0.9的样本明显多于SSKICA。此外，根据图9的结果，SSKICA方法应用于故障识别时还可以给出准确的诊断结果，同时识别率更高。这再次展示出数据转换到独立元空间后再进行分类诊断的优势。在图11中，KICA算法应用T²和SPE统计量对电熔镁炉的运行状状态检测。可以发现KICA在正常状态出现了误报，在故障状态下出现了大量的漏报。这是由于建模数据仅利用了少量正常标记数据的结果，导致了算法的泛化能力大大下降。这也充分说明传统的KICA方法应用于已知状态较低的大数据为基础故障检测时有一定的困难。此外，传统的KICA算法仅仅能进行过程检测，并不能在检测的同时直接识别出故障的类型。

为了更加直观的比较出所提出算法的先进性能，将不同算法的检测率和诊断率总结在表2中。其中，检测率表示算法对正常运行状态的识别程度，即此时是正常运行还是故障运行。诊断率代表对当前运行状态的识别程度，即是正常状态，故障1还是故障2。因此诊断率仅考虑SSKICA算法和SSCCM算法。根据表2中的数据，再一次印证了SSKICA的优势。

表2.算法性能比较

算法	检测率	诊断率
			SSKICA	97.33％	96.67％
SSCCM	97％	93.33％
			KICA-T<sup>2</sup>	87.33％	—
KICA-SPE	89.67％	—

SSKICA方法在电熔镁炉过程监测的应用中展现出了优越的性能，这为规避电熔镁炉故障的出现并及时报警提供了帮助。通过实验分析，样本转换到独立元空间后对提高故障识别的准确度提供了可能。所构建的运行状态库和故障识别统计量使得运行状态的识别更加精准。此外，半监督分类方法和KICA相结合能够有效地处理当前的海量数据问题。同时，所提出的方法汲取了SSCCM方法的优势，对早期故障点和临界稳定点的检测更加准确，从而大大降低误报和漏报。总而言之，SSKICA方法能够解决电熔镁炉熔炼过程中喷炉和漏炉的检测和诊断问题，而且是行之有效的。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。