CN107831743B

CN107831743B - 基于可信软标签线性判别分析的工业过程故障诊断方法

Info

Publication number: CN107831743B
Application number: CN201711061648.XA
Authority: CN
Inventors: 张颖伟; 刘志远; 李旭光
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2017-10-31
Filing date: 2017-10-31
Publication date: 2019-12-10
Anticipated expiration: 2037-10-31
Also published as: CN107831743A

Abstract

本发明提供一种基于可信软标签线性判别分析的工业过程故障诊断方法，涉及故障检测与诊断技术领域。该方法首先采集工业过程的数据；其次对原始数据进行正标记，并对正标记数据进行正标签传播，根据正标签传播结果对原始数据进行正负标签协同传播，使未标记数据获得软标签；然后采用可信的软标签线性判别分析算法计算将高维原始数据投影到低维空间的投影矩阵；最后设计分类器，对工业过程进行在线故障诊断。本发明提供的基于可信软标签线性判别分析的工业过程故障诊断方法，解决了软标签获取时易产生的误分类以及软标记数据使用不当的问题，降低了故障检测中的误报警率，提高了故障检测的准确性。

Description

基于可信软标签线性判别分析的工业过程故障诊断方法

技术领域

本发明涉及故障监测与诊断技术领域，尤其涉及一种基于可信软标签线性判别分析的工业过程故障诊断方法。

背景技术

工业生产的实际生产过程非常复杂，容易发生故障。传统的故障检测方法把生产过程中的物理化学变量数据和图像声音视频数据分开进行建模，这种建模方式忽视了二者之间的联系。

软标签线性判别分析方法(soft label linear discriminant analysis，SLLDA)是一种半监督方法，SLLDA首先通过标签传播算法使得大量的未标记数据获得可信度较低的软标签，之后进行线性判别分析。线性判别分析方法目的就是求解出高维空间到低维空间的最优映射，同类数据通过映射之后类内数据点之间的间距尽可能的小，异类数据通过映射之后类间数据点间距尽可能的大。与LDA方法相比，SLLDA方法解决了工业现场难以获取大量的已标记训练数据的问题。但是SLLDA方法也存在很多问题，传统的正标签传播方法是通过初始标记矩阵以及迭代公式求出标签概率显示矩阵，标签概率显示矩阵每一行的最大值对应的类别就是这个样本所属的类别。但是当标签概率显示矩阵某一行出现两个最大的数值相差较小的情况，很容易出现误分类。使得标签传播算法准确率较低进而降低故障监测准确度。除此之外，SLLDA方法将带有软标签的未标记数据作为已标记数据使用会降低线性判别分析方法的性能，也会降低故障监测的准确度。

发明内容

针对现有技术的缺陷，本发明提供一种基于可信软标签线性判别分析的工业过程故障诊断方法，降低工业生产故障监测过程中的误报警率。

基于可信软标签线性判别分析的工业过程故障诊断方法，包括以下步骤：

步骤1：采集工业过程中的数据，得到多维的原始数据矩阵作为训练样本数据，并且对其进行标准化处理；

步骤2：对标准化处理的数据进行正标记，使用正标记数据进行正标签传播，然后根据正标签传播结果对原始数据进行负标记，最后使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签，具体方法为：

步骤2.1：对标准化处理的数据进行正标记，使用正标记数据进行正标签传播，具体方法为：

经过步骤1标准化处理以后的数据为其中x_i∈R^D′并且y_i∈{1，2，...，c}，x_i为第i个训练样本数据，y_i是第i个样本数据所属的类别，i＝1，...n，n为训练样本数据个数，D′为原始数据的维数，c为原始数据所属的类别数；将标准化处理后的数据集进行标记之后得到已标记数据集和未标记数据集D_u＝{x_l+1，x_l+2，...，x_1+u}，其中，l是已标记数据个数，u是未标记数据个数，且二者满足l+u＝n；

在已标记数据集和未标记数据集D_u＝{x_l+1，x₁₊₂，...，x_1+u}的基础上构建图G＝(V，E，M)，其中，V为图的顶点集合，E为图的边集，M为边的权重矩阵，矩阵值表示为：

其中，M_ii′为第i个数据点和第i′个数据点所构成边的权重，σ为高斯函数的带宽参数，x_i和x_i′分别表示第i个和第i′个标准化后的原始数据点，i′＝1，...，n；对权重矩阵M进行归一化，得到标签传播矩阵N，如下式所示：

其中，d_i为权重矩阵M的第i行所有元素的和，i＝1，2，…，n；

根据已标记数据的初始标签，得到n行c列的初始正标签矩阵Y，其前l行根据以下公式进行赋值，其余行的所有元素均赋值为零；

其中，j＝1，...，c为原始数据所属的类别；

使用正标签传播方法对初始正标签矩阵Y进行迭代计算，迭代公式为：

F(t+1)＝βNF(t)+(1-β)Y

其中，参数β∈(0，1)为用户自己确定的正标签传播参数，F(t)为标签概率显示矩阵F迭代到第t次得到的结果、F(t+1)为标签概率显示矩阵F迭代到第t+1次得到的结果；

每一次的迭代过程中，每一个数据点新的标签信息来源于两个部分，第一部分为该数据点的邻域数据点的标签信息，第二部分为该数据点的原始标签信息；

通过迭代公式，得到标签概率显示矩阵F第t次的迭代结果如下式所示：

其中，θ＝0，…，t-1为迭代次数；

通过迭代公式F(t)进行迭代，直到收敛，得到标签概率显示矩阵F如下：

其中，I为n阶单位矩阵，βN满足矩阵I-βN为非奇异矩阵；

步骤2.2：根据正标签传播结果对原始数据进行负标记，并使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签，具体方法为：

将标签概率显示矩阵F分为两部分，F_L是已标记数据所对应的行，F_U是未标记数据所对应的行；

对已标记数据对应的负标记矩阵进行赋值时，仅需要将每个数据所属的类别处标记零，其余位置均为1，即每行只有一个零元素，其余均为1，负标记的赋值公式为：

对未标记数据对应的负标记矩阵进行赋值时，计算F_U第k行最大的两个值之间的差值Δ_k，选取前m个差值最小的行所对应的未标记数据进行负标记，其中，m为用户自己设定的数值，将每个需要进行负标记的未标记数据所对应的行F_U的行向量中最大的两个值所属的两个类别处标记零，其余位置均为1，即每行有两个零元素，其余均为1；

通过正负标签协同传播算法对正则化框架进行最小化，得到最优的标签概率显示矩阵F^*，正则化框架表示为：

ψ(F)＝tr(F^TN′F)+λ[λ₁tr((F-Y⁺)^t(F-Y⁺))-λ₂tr((F-Y-)^T(F-Y-))]

其中，λ为调节损失函数λ₁tr((F-Y⁺)^t(F-Y⁺))-λ₂tr((F-Y-)^t(F-Y-))和图的平滑度限制项tr(FTN′F)二者权重的参数，λ₁和λ₂为调节正标签损失函数tr((F-Y⁺)^T(F-Y⁺))和负标签损失函数tr((F-Y^-)^T(F-Y-))的参数，并且λ₁和λ₂满足λ₁+λ₂＝1，N′＝A′-N为拉普拉斯矩阵，其中d_i′是标签传播矩阵N第i行所有元素的和；

将正则化框架ψ(F)对F求一阶偏导，并使其一阶偏导等于零，如下公式所示：

得到最优的标签概率显示矩阵，如下所示：

F^*＝[λN′+λ²(λ₁-λ₂)I]^-1(λ₁Y⁺-λ₂Y^-)

通过最优的标签概率显示矩阵F^*，得到通过正负标签协同传播之后第i个未标记样本数据所属的类别，即得到第i个未标记数据的软标签，如下公式所示：

步骤3：求解将高维原始数据投影到低维空间的投影矩阵W，具体方法为：

首先将已标记数据按类别从第1类到第c类进行排列得到已标记数据X_L，将携带软标签的未标记数据按类别从第1类到第c类进行排列得到未标记数据X_U，分别计算已标记数据X_L和未标记数据X_U的类间散度矩阵及类内散度矩阵；

步骤3.1：计算已标记数据X_L的类间散度矩阵及类内散度矩阵；

已标记数据X_L的总体样本均值为其中，l为已标记数据个数，X_i ^l为第i个已标记数据；第j类已标记数据的样本均值为其中，N_j ^l为第j类已标记数据的集合，为第j类已标记数据的个数；

已标记数据X_L的类间散度矩阵S_b ^L如下所示：

其中，矩阵B为l行l列的方阵，所有元素均为矩阵A如下所示：

其中，矩阵A^j为行列的方阵，所有元素均为

已标记数据X_L的类内散度矩阵S_w ^L如下所示：

其中，矩阵I_l为l行l列的单位阵，矩阵C如下所示：

其中，矩阵C^j为行列的方阵，所有元素均为

步骤3.2：计算未标记数据X_U的类间散度矩阵及类内散度矩阵；

未标记数据X_U的总体样本均值为其中，u是携带软标签的未标记数据个数，为第i个携带软标签的未标记数据；第j类携带软标签的未标记数据的样本均值为其中，为第j类携带软标签的未标记数据的集合，第j类携带软标签的未标记数据的个数；

未标记数据X_U的类间散度矩阵S_b ^U如下式所示：

其中，矩阵B′为u行u列的方阵，所有元素均为矩阵A′如下式所示：

其中，矩阵A′^j为行列的方阵，所有元素均为

未标记数据X_U的类内散度矩阵S_w ^U如下式所示：

其中，矩阵I_u为u行u列的单位阵，矩阵C′如下式所示：

其中，矩阵C′^j为行列的方阵，所有元素均为

步骤3.3：通过已标记数据和携带软标签的未标记数据的类内散度矩阵、类间散度矩阵，得到高维原始数据投影到低维空间所需的投影矩阵W，如下式所示：

其中，参数γ为调节已标记数据的散度矩阵和携带软标记的未标记数据的散度矩阵二者比例的参数，τ为正则化参数，I_D′是D′行D′列的单位矩阵；

将投影矩阵W的求解转化为对下式进行特征分解，得到的前d个最大特征值所对应的特征向量构成投影矩阵W，其中，d为低维空间的维数；

(γS_b ^L+(1-γ)S_b ^U)w_k＝υ_k(γS_w ^L+(1-γ)S_w ^U+τI_D′)w_k

其中，υ_k为特征值，w_k为特征向量；

步骤4：建立分类器在线对工业过程进行故障检测与诊断，具体方法为：

步骤4.1：计算已标记数据每一类的类均值和协方差矩阵；

已标记数据第j类的类均值的计算公式如下所示：

其中，P为元素均为的行向量，行向量P的长度为n_j ^l，X_j ^l为第j类已标记数据，z_i ^l表示高维空间数据通过投影矩阵W投影到低维空间对应的低维数据；

已标记数据第j类的协方差矩阵的计算公式如下式所示：

其中，为所有元素均为1的n_j ^l行n_j ^l列的方阵；

步骤4.2：计算携带软标签的未标记数据每一类的类均值和协方差矩阵；

携带软标签的未标记数据第j类的类均值的计算公式如下所示：

ξ_j ^u＝W^TX_j ^uP′

其中，P′是一个元素均为的行向量，行向量P′的长度为n_j ^u，X_j ^u为第j类携带软标签的未标记数据；

携带软标签的未标记数据第j类的协方差矩阵的计算公式如下所示：

其中，为元素均为1的n_j ^u行n_j ^u列的方阵；

步骤4.3：计算每一类原始数据的均值和协方差，得到每类数据的概率密度函数；

第j类原始数据的均值为：

ξ_j＝γξ_j ^l+(1-γ)ξ_j ^u

第j类原始数据的协方差矩阵为：

ω_j＝γω_j ^l+(1-γ)ω_j ^u

将高维原始数据通过投影矩阵W进行投影之后得到低维数据z，如下式所示：

z＝W^TX

结合第j类原始数据的均值和协方差，得到第j类低维数据z的概率密度函数为：

步骤4.4：使用分类器对工业过程进行在线故障诊断，具体方法为：

首先采集当前时刻数据，将当前时刻的高维数据通过投影矩阵W投影到低维空间得到低维数据z，将低维数据z带入到每一个类的概率密度函数中，概率密度函数值最大的类别就是当前时刻数据所属的类别，完成对工业过程的故障诊断。

由上述技术方案可知，本发明的有益效果在于：本发明提供的基于可信软标签线性判别分析的工业过程故障诊断方法，使用可信软标签线性判别分析方法，合理的使用了带有正常标签的已标记数据和带有软标记的未标记数据，提高了未标记数据标签的可信度，解决了软标签获取时易产生误分类以及软标记数据使用不当的问题。同时，通过将高维原始数据投影到低维空间，使得同类数据之间的距离更小，异类数据之间距离更大，分类效果更好，降低了故障检测中的误报警率，提高了故障检测的准确性。

附图说明

图1为本发明实施例提供的电熔镁冶炼工业流程的示意图；

图2为本发明实施例提供的基于可信软标签线性判别分析的工业过程故障诊断方法的流程图；

图3为本发明实施例提供的使用正负标签协同传播法进行标记数据的示意图；

图4为本发明实施例提供的使用可信软标签线性判别分析方法(CSLLDA)对训练数据进行降维的效果示意图；

图5为本发明实施例提供的使用可信软标签线性判别分析方法(CSLLDA对超高温电熔镁过程的的数据进行分类的效果示意图；

图6为本发明实施例提供的使用软标签线性判别分析法(SLLDA)对训练数据降维效果示意图；

图7为本发明实施例提供的使用软标签线性判别分析法(SLLDA)对超高温电熔镁过程的数据进行分类的效果示意图。

图中：1、变压器；2、短网；3、电极夹；4、电极；5、炉壳；6、小车；7、电弧；8、熔池。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

超高温电熔镁冶炼工业流程，如图1所示，所使用的设备包括变压器1、短网2、电极夹3、电极4、炉壳5、小车6、电弧7和熔池8。电熔镁炉电路结构为：电流从电网流入，通过变压器升高电压，电流流经短网进入三相电极，通过引弧材料和熔池产生电弧，最终电流回到电网形成闭合回路。电熔镁炉通过三个交流电机来控制三个电极进行上下升降，电极步长较小。熔池是生产电熔镁砂的主要反应区，熔池的电阻较小，在较高的电压作用下会产生近似短路的强大电流以及高温电弧，依靠电极的埋弧电热和物料的电阻电热来熔炼物料。电熔镁炉炉体一般为圆柱形，电极初始位置较低，通电以后最先熔炼电极周围的物料，由于熔炼部位上方有较厚的生料层因此可以很好的阻止热量散失。随着物料的不断融化，通过控制电极夹缓慢提升电极位置，使熔池底部的熔体发生结晶，而上方的生料在电弧高温作用下不断熔化，直到生料完全熔化后，将电极移出炉体进行冷却结晶形成氧化镁晶体。

本实施例以某企业的超高温电熔镁冶炼过程为例，使用本发明的基于可信软标签线性判别分析的工业过程故障诊断方法对超高温电熔镁炉冶炼过程的故障进行监测。

一种基于可信软标签线性判别分析的工业过程故障诊断方法，如图2所示，包括以下步骤：

步骤1：采集数据，数据包括电解炉炉面图像四个方向的灰度共生矩阵共20个特征值，同一时刻电熔镁炉的三个电极的实时电流值，并且对数据进行标准化处理；

本实施例中，采集的数据包括电熔镁冶炼过程在某一特定时刻的电解炉炉面图像数据和电极电流值，每一个数据的前20维代表电解炉炉面图像数据的20个特征值，最后3维数据为三个电极的电流值。训练数据样本个数为179个，其中电解炉正常运行状态的正常数据个数为92个，电解炉发生漏炉的故障数据个数为53个，电解炉发生喷炉的故障数据个数为34个。对训练样本进行正标记，其中，电解炉正常运行状态的正常数据标记18个，如表1所示；电解炉发生漏炉的故障数据标记11个，如表2所示；电解炉发生喷炉的故障数据标记8个，如表3所示。

表1标记的18个正常数据

表1正常标记数据18个

表2标记的11个漏炉故障数据

表3标记的8个喷炉故障数据

经过步骤1标准化处理以后的数据为其中x_i∈R^D′并且y_i∈{1，2，...，c}，x_i为第i个训练样本数据，y_i是第i个样本数据所属的类别，i＝1，...n，n为训练样本数据个数，D′为原始数据的维数，c为原始数据所属的类别数；将标准化处理后的数据集进行标记之后得到已标记数据集和未标记数据集D_u＝{x_l+1，x₁₊₂，...，x_1+u}，其中，l是已标记数据个数，u是未标记数据个数，且二者满足l+u＝n；

其中，M_ii′为第i个数据点和第i′个数据点所构成边的权重，σ为高斯函数的带宽参数，x_i和x_i′分别表示第i个和第i′个标准化后的原始数据点，i′＝1，...，n；

对权重矩阵M进行归一化，得到标签传播矩阵N，如下式所示：

其中，j＝1，...，c为原始数据所属的类别；

使用正标签传播方法对初始标签矩阵Y进行迭代计算，迭代公式为：

F(t+1)＝βNF(t)+(1-β)Y

其中，θ＝0，…，t-1为迭代次数；

其中，I为n阶单位矩阵，βN满足矩阵I-βN为非奇异矩阵。

本实施例中，高斯函数的带宽参数σ取值为0.02，正标签传播参数β的取值为0.4。

对未标记数据对应的负标记矩阵进行赋值时，计算F_U第k行最大的两个值之间的差值Δ_k，选取前40个差值最小的行所对应的未标记数据进行负标记，其中，m为用户自己设定的数值，将每个需要进行负标记的未标记数据所对应的行F_U的行向量中最大的两个值所属的两个类别处标记零，其余位置均为1，即每行有两个零元素，其余均为1；

ψ(F)＝tr(F^TN′F)+λ[λ₁tr((F-Y⁺)^T(F-Y⁺))-λ₂tr((F-Y-)^t(F-Y-))]

其中，λ为调节损失函数λ₁tr((F-Y⁺)^T(F-Y⁺))-λ₂tr((F-Y^-)^T(F-Y^-))和图的平滑度限制项tr(F^TN′F)二者权重的参数，λ₁和λ₂为调节正标签损失函数tr((F-Y⁺)^T(F-Y⁺))和负标签损失函数tr((F-Y^-)^T(F-Y^-))的参数，并且λ₁和λ₂满足λ₁+λ₂＝1，N′＝A′-N为拉普拉斯矩阵，其中d_i′是标签传播矩阵N第i行所有元素的和。

正则化框架ψ(F)对F求一阶偏导，并且使其一阶偏导等于零，如下公式所示：

得到最优的标签概率显示矩阵，如下所示：

F^*＝[λN′+λ²(λ₁-λ₂)I]^-1(λ₁Y⁺-λ₂Y^-)

本实施例中，调节损失函数和图的平滑度限制项二者权重的参数λ取值为0.8，调节正标签损失函数和负标签损失函数的参数λ₁和λ₂取值为0.6和0.4。正负标签协同传播结果如图3所示，正负标签协同传播结果准确率为92.25％。

已标记数据X_L的类间散度矩阵S_b ^L如下所示：

其中，矩阵B为l行l列的方阵，所有元素均为矩阵A如下所示：

其中，矩阵A^j为行列的方阵，所有元素均为

已标记数据X_L的类内散度矩阵如下所示：

其中，矩阵I_l为l行l列的单位阵，矩阵C如下所示：

其中，矩阵C^j为行列的方阵，所有元素均为

未标记数据X_U的总体样本均值为其中，u是携带软标签的未标记数据个数，是第i个携带软标签的未标记数据；第j类携带软标签的未标记数据的样本均值为其中，为第j类携带软标签的未标记数据的集合，第j类携带软标签的未标记数据的个数；

未标记数据X_U的类间散度矩阵如下式所示：

其中，矩阵A′^j为行列的方阵，所有元素均为

未标记数据X_U的类内散度矩阵S_w ^U如下式所示：

其中，矩阵I_u为u行u列的单位阵，矩阵C′如下式所示：

其中，矩阵C^′j为行列的方阵，所有元素均为

将投影矩阵W的求解转化为对下式进行特征分解，得到的前d个最大的特征值所对应的特征向量所构成投影矩阵W，其中，d为低维空间的维数；

(γS_b ^L+(1-γ)S_b ^U)w_k＝υ_k(γS_w ^L+(1-γ)S_w ^U+τI_D′)w_k

其中，υ_k为特征值，w_k为特征向量。

本实施例中，进行特征分解的过程中，正则化参数τ取值为0.15，参数γ取值为0.6。通过投影矩阵W将原始数据从高维降维到二维空间得到的降维效果如图4所示。

步骤4.1：计算已标记数据每一类的类均值和协方差矩阵；

已标记数据第j类的类均值的计算公式如下所示：

已标记数据第j类的协方差矩阵的计算公式如下式所示：

其中，为所有元素均为1的n_j ^l行n_j ^l列的方阵；

ξ_j ^u＝W^TX_j ^uP′

其中，为元素均为1的n_j ^u行n_j ^u列的方阵；

步骤4.3：计算每一类原始数据的均值和协方差，得到每类数据的概率密度函数，完成分类器的建立；

第j类原始数据的均值为：

ξ_j＝γξ_j ^l+(1-γ)ξ_j ^u

第j类原始数据的协方差矩阵为：

ω_j＝γω_j ^l+(1-γ)ω_j ^u

z＝W^tX

本实施例中，采集当前时刻超高温电熔镁过程的数据，并采用分类器进行分类，分类效果如图5所示，分类结果准确率为93.30％。

本实施例同时采用相同的标签传播算法获得软标签，通过SLLDA求取投影矩阵W，对训练数据进行降维的效果如图6所示，对超高温电熔镁过程的数据进行分类的效果如图7所示，分类结果准确率为92.74％。通过分类准确率，可以清楚地看出本发明的基于可信软标签线性判别分析的工业过程故障诊断方法在超高温电熔镁冶炼过程的监测和诊断过程中表现更好。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims

1.一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：包括以下步骤：

步骤2.1：对标准化处理的数据进行正标记，使用正标记数据进行正标签传播；

步骤2.2：根据正标签传播结果对原始数据进行负标记，并使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签；

首先将已标记数据按类别从第1类到第c类进行排列得到已标记数据X_L，将携带软标签的未标记数据按类别从第1类到第c类进行排列得到未标记数据X_U，分别计算已标记数据X_L类间散度矩阵及类内散度矩阵和携带软标签的未标记数据X_U的类间散度矩阵及类内散度矩阵

通过已标记数据和携带软标签的未标记数据的类内散度矩阵、类间散度矩阵，得到高维原始数据投影到低维空间所需的投影矩阵W，如下公式所示：

其中，参数γ为调节已标记数据的散度矩阵和携带软标记的未标记数据的散度矩阵二者比例的参数，τ为正则化参数，I_D′是D′行D′列的单位矩阵，D′为原始矩阵的维数；

将投影矩阵W的求解转化为对下列特征方程进行特征分解，得到的前d个最大特征值所对应的特征向量构成投影矩阵W，其中，d为低维空间的维数；

(γS_b ^L+(1-γ)S_b ^U)w_k＝υ_k(γS_w ^L+(1-γ)S_w ^U+τI_D′)w_k

其中，υ_k为特征值，w_k为特征向量；

步骤4.1：计算已标记数据每一类的类均值和协方差矩阵；

步骤4.4：使用分类器对工业过程进行在线故障诊断。

2.根据权利要求1所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：步骤2.1所述对标准化处理的原始数据进行正标记，使用正标记数据进行正标签传播的具体方法为：

经过步骤1标准化处理以后的数据为其中xi∈R^D′并且y_i∈{1，2，...，c}，x_i为第i个训练样本数据，y_i是第i个样本数据所属的类别，i＝1，...n，n为训练样本数据个数，c为原始数据所属的类别数；将标准化处理后的原始数据集进行标记之后得到已标记数据集和未标记数据集D_u＝{x_l+1，x_l+2，...，x_l+u}，其中，l是已标记数据个数，u是未标记数据个数，且二者满足l+u＝n；

在已标记数据集和未标记数据集D_u＝{x_l+1，x_l+2，...，x_l+u}的基础上构建图G＝(V，E，M)，其中，V为图的顶点集合，E为图的边集，M为边的权重矩阵，矩阵值表示为：

其中，j＝1，...，c为原始数据所属的类别；

F(t+1)＝βNF(t)+(1-β)Y

其中，θ＝0，…，t-1为迭代次数；

其中，I为n阶单位矩阵，βN满足矩阵I-βN为非奇异矩阵。

3.根据权利要求2所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：步骤2.2所述对原始数据进行负标记，并使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签具体方法为：

将标签概率显示矩阵F分为两部分，FL是已标记数据所对应的行，F_U是未标记数据所对应的行；

对未标记数据对应的负标记矩阵进行赋值时，计算F_U第k行最大的两个值之间的差值Δ_k，选取前m个差值最小的行所对应的未标记数据进行负标记，其中m是用户自己设定的数值，将每个需要进行负标记的未标记数据所对应的行F_U的行向量中最大的两个值所属的两个类别处标记零，其余位置均为1，即每行有两个零元素，其余均为1；

ψ(F)＝tr(F^TN′F)+λ[λ₁tr((F-Y⁺)^t(F-Y⁺))-λ₂tr((F-Y-)^t(F-Y-))]

其中，λ为调节损失函数λ₁tr((F-Y⁺)^T(F-Y⁺))-λ₂tr((F-Y-)^T(F-Y-))和图的平滑度限制项tr(F^TN′F)二者权重的参数，λ₁和λ₂为调节正标签损失函数tr((F-Y⁺)^T(F-Y⁺))和负标签损失函数tr((F-Y^-)^t(F-Y^-))的参数，并且λ₁和λ₂满足λ₁+λ₂＝1，N′＝-N为拉普拉斯矩阵，其中d_i′是标签传播矩阵N第i行所有元素的和；

得到最优的标签概率显示矩阵，如下所示：

F^*＝[λN′+λ²(λ₁-λ₂)I]^-1(λ₁Y⁺-λ₂Y^-)

4.根据权利要求3所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：步骤3所述计算已标记数据X_L的类间散度矩阵及类内散度矩阵的具体方法为：

已标记数据X_L的类间散度矩阵如下所示：

其中，矩阵B为l行l列的方阵，所有元素均为矩阵A如下所示：

其中，矩阵A^j为行列的方阵，所有元素均为

已标记数据X_L的类内散度矩阵如下所示：

其中，矩阵I_l为l行l列的单位阵，矩阵C如下所示：

其中，矩阵C^j为行列的方阵，所有元素均为

5.根据权利要求4所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：步骤3所述计算未标记数据X_U的类间散度矩阵及类内散度矩阵的具体方法为：

未标记数据X_U的类间散度矩阵S_b ^U如下式所示：

其中，矩阵A′^j为行列的方阵，所有元素均为

未标记数据X_U的类内散度矩阵S_w ^U如下式所示：

其中，矩阵I_u为u行u列的单位阵，矩阵C′如下式所示：

其中，矩阵C′^j为行列的方阵，所有元素均为

6.根据权利要求5所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：步骤4.1所述计算已标记数据每一类的类均值和协方差矩阵的具体方法为：

已标记数据第j类的类均值的计算公式如下所示：

已标记数据第j类的协方差矩阵的计算公式如下式所示：

其中，为所有元素均为1的n_j ^l行n_j ^l列的方阵。

7.根据权利要求6所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：步骤4.2所述计算携带软标签的未标记数据每一类的类均值和协方差矩阵的具体方法为：

ξ_j ^u＝W^tX_j ^uP′

其中，为元素均为1的n_j ^u行n_j ^u列的方阵。

8.根据权利要求7所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：步骤4.3所述得到每类数据的概率密度函数的具体方法为：

计算每一类原始数据的均值和协方差；

第j类原始数据的均值为：

ξ_j＝γξ_j ^l+(1-γ)ξ_j ^u

第j类原始数据的协方差矩阵为：

ω_j＝γω_j ^l+(1-γ)ω_j ^u

z＝W^tX

9.根据权利要求8所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法，其特征在于：步骤4.4所述使用分类器对工业过程进行在线故障诊断的具体过程为：

首先采集当前时刻数据，将当前时刻的高维数据通过投影矩阵W投影到低维空间得到低维数据，将低维数据带入到每一个类的概率密度函数中，概率密度函数值最大的类别就是当前时刻数据所属的类别，完成对工业过程的故障诊断。