CN107831743B - 基于可信软标签线性判别分析的工业过程故障诊断方法 - Google Patents
基于可信软标签线性判别分析的工业过程故障诊断方法 Download PDFInfo
- Publication number
- CN107831743B CN107831743B CN201711061648.XA CN201711061648A CN107831743B CN 107831743 B CN107831743 B CN 107831743B CN 201711061648 A CN201711061648 A CN 201711061648A CN 107831743 B CN107831743 B CN 107831743B
- Authority
- CN
- China
- Prior art keywords
- data
- matrix
- label
- class
- soft
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 39
- 238000004458 analytical method Methods 0.000 title claims abstract description 31
- 238000003745 diagnosis Methods 0.000 title claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 226
- 238000012549 training Methods 0.000 claims description 16
- 239000000126 substance Substances 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 230000000644 propagated effect Effects 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 6
- 230000005540 biological transmission Effects 0.000 abstract 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 12
- 229910052749 magnesium Inorganic materials 0.000 description 12
- 239000011777 magnesium Substances 0.000 description 12
- 238000003723 Smelting Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- CPLXHLVBOLITMK-UHFFFAOYSA-N Magnesium oxide Chemical compound [Mg]=O CPLXHLVBOLITMK-UHFFFAOYSA-N 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 238000010309 melting process Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 238000010891 electric arc Methods 0.000 description 4
- 239000000395 magnesium oxide Substances 0.000 description 4
- 239000002994 raw material Substances 0.000 description 3
- 238000005485 electric heating Methods 0.000 description 2
- 238000009776 industrial production Methods 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000004070 electrodeposition Methods 0.000 description 1
- AXZKOIWUVFPNLO-UHFFFAOYSA-N magnesium;oxygen(2-) Chemical compound [O-2].[Mg+2] AXZKOIWUVFPNLO-UHFFFAOYSA-N 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000155 melt Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/418—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
- G05B19/41885—Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/32—Operator till task planning
- G05B2219/32339—Object oriented modeling, design, analysis, implementation, simulation language
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Manufacturing & Machinery (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明提供一种基于可信软标签线性判别分析的工业过程故障诊断方法,涉及故障检测与诊断技术领域。该方法首先采集工业过程的数据;其次对原始数据进行正标记,并对正标记数据进行正标签传播,根据正标签传播结果对原始数据进行正负标签协同传播,使未标记数据获得软标签;然后采用可信的软标签线性判别分析算法计算将高维原始数据投影到低维空间的投影矩阵;最后设计分类器,对工业过程进行在线故障诊断。本发明提供的基于可信软标签线性判别分析的工业过程故障诊断方法,解决了软标签获取时易产生的误分类以及软标记数据使用不当的问题,降低了故障检测中的误报警率,提高了故障检测的准确性。
Description
技术领域
本发明涉及故障监测与诊断技术领域,尤其涉及一种基于可信软标签线性判别分析的工业过程故障诊断方法。
背景技术
工业生产的实际生产过程非常复杂,容易发生故障。传统的故障检测方法把生产过程中的物理化学变量数据和图像声音视频数据分开进行建模,这种建模方式忽视了二者之间的联系。
软标签线性判别分析方法(soft label linear discriminant analysis,SLLDA)是一种半监督方法,SLLDA首先通过标签传播算法使得大量的未标记数据获得可信度较低的软标签,之后进行线性判别分析。线性判别分析方法目的就是求解出高维空间到低维空间的最优映射,同类数据通过映射之后类内数据点之间的间距尽可能的小,异类数据通过映射之后类间数据点间距尽可能的大。与LDA方法相比,SLLDA方法解决了工业现场难以获取大量的已标记训练数据的问题。但是SLLDA方法也存在很多问题,传统的正标签传播方法是通过初始标记矩阵以及迭代公式求出标签概率显示矩阵,标签概率显示矩阵每一行的最大值对应的类别就是这个样本所属的类别。但是当标签概率显示矩阵某一行出现两个最大的数值相差较小的情况,很容易出现误分类。使得标签传播算法准确率较低进而降低故障监测准确度。除此之外,SLLDA方法将带有软标签的未标记数据作为已标记数据使用会降低线性判别分析方法的性能,也会降低故障监测的准确度。
发明内容
针对现有技术的缺陷,本发明提供一种基于可信软标签线性判别分析的工业过程故障诊断方法,降低工业生产故障监测过程中的误报警率。
基于可信软标签线性判别分析的工业过程故障诊断方法,包括以下步骤:
步骤1:采集工业过程中的数据,得到多维的原始数据矩阵作为训练样本数据,并且对其进行标准化处理;
步骤2:对标准化处理的数据进行正标记,使用正标记数据进行正标签传播,然后根据正标签传播结果对原始数据进行负标记,最后使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签,具体方法为:
步骤2.1:对标准化处理的数据进行正标记,使用正标记数据进行正标签传播,具体方法为:
经过步骤1标准化处理以后的数据为其中xi∈RD′并且yi∈{1,2,...,c},xi为第i个训练样本数据,yi是第i个样本数据所属的类别,i=1,...n,n为训练样本数据个数,D′为原始数据的维数,c为原始数据所属的类别数;将标准化处理后的数据集进行标记之后得到已标记数据集和未标记数据集Du={xl+1,xl+2,...,x1+u},其中,l是已标记数据个数,u是未标记数据个数,且二者满足l+u=n;
在已标记数据集和未标记数据集Du={xl+1,x1+2,...,x1+u}的基础上构建图G=(V,E,M),其中,V为图的顶点集合,E为图的边集,M为边的权重矩阵,矩阵值表示为:
其中,Mii′为第i个数据点和第i′个数据点所构成边的权重,σ为高斯函数的带宽参数,xi和xi′分别表示第i个和第i′个标准化后的原始数据点,i′=1,...,n;对权重矩阵M进行归一化,得到标签传播矩阵N,如下式所示:
其中,di为权重矩阵M的第i行所有元素的和,i=1,2,…,n;
根据已标记数据的初始标签,得到n行c列的初始正标签矩阵Y,其前l行根据以下公式进行赋值,其余行的所有元素均赋值为零;
其中,j=1,...,c为原始数据所属的类别;
使用正标签传播方法对初始正标签矩阵Y进行迭代计算,迭代公式为:
F(t+1)=βNF(t)+(1-β)Y
其中,参数β∈(0,1)为用户自己确定的正标签传播参数,F(t)为标签概率显示矩阵F迭代到第t次得到的结果、F(t+1)为标签概率显示矩阵F迭代到第t+1次得到的结果;
每一次的迭代过程中,每一个数据点新的标签信息来源于两个部分,第一部分为该数据点的邻域数据点的标签信息,第二部分为该数据点的原始标签信息;
通过迭代公式,得到标签概率显示矩阵F第t次的迭代结果如下式所示:
其中,θ=0,…,t-1为迭代次数;
通过迭代公式F(t)进行迭代,直到收敛,得到标签概率显示矩阵F如下:
其中,I为n阶单位矩阵,βN满足矩阵I-βN为非奇异矩阵;
步骤2.2:根据正标签传播结果对原始数据进行负标记,并使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签,具体方法为:
将标签概率显示矩阵F分为两部分,FL是已标记数据所对应的行,FU是未标记数据所对应的行;
对已标记数据对应的负标记矩阵进行赋值时,仅需要将每个数据所属的类别处标记零,其余位置均为1,即每行只有一个零元素,其余均为1,负标记的赋值公式为:
对未标记数据对应的负标记矩阵进行赋值时,计算FU第k行最大的两个值之间的差值Δk,选取前m个差值最小的行所对应的未标记数据进行负标记,其中,m为用户自己设定的数值,将每个需要进行负标记的未标记数据所对应的行FU的行向量中最大的两个值所属的两个类别处标记零,其余位置均为1,即每行有两个零元素,其余均为1;
通过正负标签协同传播算法对正则化框架进行最小化,得到最优的标签概率显示矩阵F*,正则化框架表示为:
ψ(F)=tr(FTN′F)+λ[λ1tr((F-Y+)t(F-Y+))-λ2tr((F-Y-)T(F-Y-))]
其中,λ为调节损失函数λ1tr((F-Y+)t(F-Y+))-λ2tr((F-Y-)t(F-Y-))和图的平滑度限制项tr(FTN′F)二者权重的参数,λ1和λ2为调节正标签损失函数tr((F-Y+)T(F-Y+))和负标签损失函数tr((F-Y-)T(F-Y-))的参数,并且λ1和λ2满足λ1+λ2=1,N′=A′-N为拉普拉斯矩阵,其中di′是标签传播矩阵N第i行所有元素的和;
将正则化框架ψ(F)对F求一阶偏导,并使其一阶偏导等于零,如下公式所示:
得到最优的标签概率显示矩阵,如下所示:
F*=[λN′+λ2(λ1-λ2)I]-1(λ1Y+-λ2Y-)
通过最优的标签概率显示矩阵F*,得到通过正负标签协同传播之后第i个未标记样本数据所属的类别,即得到第i个未标记数据的软标签,如下公式所示:
步骤3:求解将高维原始数据投影到低维空间的投影矩阵W,具体方法为:
首先将已标记数据按类别从第1类到第c类进行排列得到已标记数据XL,将携带软标签的未标记数据按类别从第1类到第c类进行排列得到未标记数据XU,分别计算已标记数据XL和未标记数据XU的类间散度矩阵及类内散度矩阵;
步骤3.1:计算已标记数据XL的类间散度矩阵及类内散度矩阵;
已标记数据XL的总体样本均值为其中,l为已标记数据个数,Xi l为第i个已标记数据;第j类已标记数据的样本均值为其中,Nj l为第j类已标记数据的集合,为第j类已标记数据的个数;
已标记数据XL的类间散度矩阵Sb L如下所示:
其中,矩阵B为l行l列的方阵,所有元素均为矩阵A如下所示:
其中,矩阵Aj为行列的方阵,所有元素均为
已标记数据XL的类内散度矩阵Sw L如下所示:
其中,矩阵Il为l行l列的单位阵,矩阵C如下所示:
其中,矩阵Cj为行列的方阵,所有元素均为
步骤3.2:计算未标记数据XU的类间散度矩阵及类内散度矩阵;
未标记数据XU的总体样本均值为其中,u是携带软标签的未标记数据个数,为第i个携带软标签的未标记数据;第j类携带软标签的未标记数据的样本均值为其中,为第j类携带软标签的未标记数据的集合,第j类携带软标签的未标记数据的个数;
未标记数据XU的类间散度矩阵Sb U如下式所示:
其中,矩阵B′为u行u列的方阵,所有元素均为矩阵A′如下式所示:
其中,矩阵A′j为行列的方阵,所有元素均为
未标记数据XU的类内散度矩阵Sw U如下式所示:
其中,矩阵Iu为u行u列的单位阵,矩阵C′如下式所示:
其中,矩阵C′j为行列的方阵,所有元素均为
步骤3.3:通过已标记数据和携带软标签的未标记数据的类内散度矩阵、类间散度矩阵,得到高维原始数据投影到低维空间所需的投影矩阵W,如下式所示:
其中,参数γ为调节已标记数据的散度矩阵和携带软标记的未标记数据的散度矩阵二者比例的参数,τ为正则化参数,ID′是D′行D′列的单位矩阵;
将投影矩阵W的求解转化为对下式进行特征分解,得到的前d个最大特征值所对应的特征向量构成投影矩阵W,其中,d为低维空间的维数;
(γSb L+(1-γ)Sb U)wk=υk(γSw L+(1-γ)Sw U+τID′)wk
其中,υk为特征值,wk为特征向量;
步骤4:建立分类器在线对工业过程进行故障检测与诊断,具体方法为:
步骤4.1:计算已标记数据每一类的类均值和协方差矩阵;
已标记数据第j类的类均值的计算公式如下所示:
其中,P为元素均为的行向量,行向量P的长度为nj l,Xj l为第j类已标记数据,zi l表示高维空间数据通过投影矩阵W投影到低维空间对应的低维数据;
已标记数据第j类的协方差矩阵的计算公式如下式所示:
其中,为所有元素均为1的nj l行nj l列的方阵;
步骤4.2:计算携带软标签的未标记数据每一类的类均值和协方差矩阵;
携带软标签的未标记数据第j类的类均值的计算公式如下所示:
ξj u=WTXj uP′
其中,P′是一个元素均为的行向量,行向量P′的长度为nj u,Xj u为第j类携带软标签的未标记数据;
携带软标签的未标记数据第j类的协方差矩阵的计算公式如下所示:
其中,为元素均为1的nj u行nj u列的方阵;
步骤4.3:计算每一类原始数据的均值和协方差,得到每类数据的概率密度函数;
第j类原始数据的均值为:
ξj=γξj l+(1-γ)ξj u
第j类原始数据的协方差矩阵为:
ωj=γωj l+(1-γ)ωj u
将高维原始数据通过投影矩阵W进行投影之后得到低维数据z,如下式所示:
z=WTX
结合第j类原始数据的均值和协方差,得到第j类低维数据z的概率密度函数为:
步骤4.4:使用分类器对工业过程进行在线故障诊断,具体方法为:
首先采集当前时刻数据,将当前时刻的高维数据通过投影矩阵W投影到低维空间得到低维数据z,将低维数据z带入到每一个类的概率密度函数中,概率密度函数值最大的类别就是当前时刻数据所属的类别,完成对工业过程的故障诊断。
由上述技术方案可知,本发明的有益效果在于:本发明提供的基于可信软标签线性判别分析的工业过程故障诊断方法,使用可信软标签线性判别分析方法,合理的使用了带有正常标签的已标记数据和带有软标记的未标记数据,提高了未标记数据标签的可信度,解决了软标签获取时易产生误分类以及软标记数据使用不当的问题。同时,通过将高维原始数据投影到低维空间,使得同类数据之间的距离更小,异类数据之间距离更大,分类效果更好,降低了故障检测中的误报警率,提高了故障检测的准确性。
附图说明
图1为本发明实施例提供的电熔镁冶炼工业流程的示意图;
图2为本发明实施例提供的基于可信软标签线性判别分析的工业过程故障诊断方法的流程图;
图3为本发明实施例提供的使用正负标签协同传播法进行标记数据的示意图;
图4为本发明实施例提供的使用可信软标签线性判别分析方法(CSLLDA)对训练数据进行降维的效果示意图;
图5为本发明实施例提供的使用可信软标签线性判别分析方法(CSLLDA对超高温电熔镁过程的的数据进行分类的效果示意图;
图6为本发明实施例提供的使用软标签线性判别分析法(SLLDA)对训练数据降维效果示意图;
图7为本发明实施例提供的使用软标签线性判别分析法(SLLDA)对超高温电熔镁过程的数据进行分类的效果示意图。
图中:1、变压器;2、短网;3、电极夹;4、电极;5、炉壳;6、小车;7、电弧;8、熔池。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
超高温电熔镁冶炼工业流程,如图1所示,所使用的设备包括变压器1、短网2、电极夹3、电极4、炉壳5、小车6、电弧7和熔池8。电熔镁炉电路结构为:电流从电网流入,通过变压器升高电压,电流流经短网进入三相电极,通过引弧材料和熔池产生电弧,最终电流回到电网形成闭合回路。电熔镁炉通过三个交流电机来控制三个电极进行上下升降,电极步长较小。熔池是生产电熔镁砂的主要反应区,熔池的电阻较小,在较高的电压作用下会产生近似短路的强大电流以及高温电弧,依靠电极的埋弧电热和物料的电阻电热来熔炼物料。电熔镁炉炉体一般为圆柱形,电极初始位置较低,通电以后最先熔炼电极周围的物料,由于熔炼部位上方有较厚的生料层因此可以很好的阻止热量散失。随着物料的不断融化,通过控制电极夹缓慢提升电极位置,使熔池底部的熔体发生结晶,而上方的生料在电弧高温作用下不断熔化,直到生料完全熔化后,将电极移出炉体进行冷却结晶形成氧化镁晶体。
本实施例以某企业的超高温电熔镁冶炼过程为例,使用本发明的基于可信软标签线性判别分析的工业过程故障诊断方法对超高温电熔镁炉冶炼过程的故障进行监测。
一种基于可信软标签线性判别分析的工业过程故障诊断方法,如图2所示,包括以下步骤:
步骤1:采集数据,数据包括电解炉炉面图像四个方向的灰度共生矩阵共20个特征值,同一时刻电熔镁炉的三个电极的实时电流值,并且对数据进行标准化处理;
本实施例中,采集的数据包括电熔镁冶炼过程在某一特定时刻的电解炉炉面图像数据和电极电流值,每一个数据的前20维代表电解炉炉面图像数据的20个特征值,最后3维数据为三个电极的电流值。训练数据样本个数为179个,其中电解炉正常运行状态的正常数据个数为92个,电解炉发生漏炉的故障数据个数为53个,电解炉发生喷炉的故障数据个数为34个。对训练样本进行正标记,其中,电解炉正常运行状态的正常数据标记18个,如表1所示;电解炉发生漏炉的故障数据标记11个,如表2所示;电解炉发生喷炉的故障数据标记8个,如表3所示。
表1标记的18个正常数据
表1正常标记数据18个
表2标记的11个漏炉故障数据
表3标记的8个喷炉故障数据
步骤2:对标准化处理的数据进行正标记,使用正标记数据进行正标签传播,然后根据正标签传播结果对原始数据进行负标记,最后使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签,具体方法为:
步骤2.1:对标准化处理的数据进行正标记,使用正标记数据进行正标签传播,具体方法为:
经过步骤1标准化处理以后的数据为其中xi∈RD′并且yi∈{1,2,...,c},xi为第i个训练样本数据,yi是第i个样本数据所属的类别,i=1,...n,n为训练样本数据个数,D′为原始数据的维数,c为原始数据所属的类别数;将标准化处理后的数据集进行标记之后得到已标记数据集和未标记数据集Du={xl+1,x1+2,...,x1+u},其中,l是已标记数据个数,u是未标记数据个数,且二者满足l+u=n;
在已标记数据集和未标记数据集Du={xl+1,x1+2,...,x1+u}的基础上构建图G=(V,E,M),其中,V为图的顶点集合,E为图的边集,M为边的权重矩阵,矩阵值表示为:
其中,Mii′为第i个数据点和第i′个数据点所构成边的权重,σ为高斯函数的带宽参数,xi和xi′分别表示第i个和第i′个标准化后的原始数据点,i′=1,...,n;
对权重矩阵M进行归一化,得到标签传播矩阵N,如下式所示:
其中,di为权重矩阵M的第i行所有元素的和,i=1,2,…,n;
根据已标记数据的初始标签,得到n行c列的初始正标签矩阵Y,其前l行根据以下公式进行赋值,其余行的所有元素均赋值为零;
其中,j=1,...,c为原始数据所属的类别;
使用正标签传播方法对初始标签矩阵Y进行迭代计算,迭代公式为:
F(t+1)=βNF(t)+(1-β)Y
其中,参数β∈(0,1)为用户自己确定的正标签传播参数,F(t)为标签概率显示矩阵F迭代到第t次得到的结果、F(t+1)为标签概率显示矩阵F迭代到第t+1次得到的结果;
每一次的迭代过程中,每一个数据点新的标签信息来源于两个部分,第一部分为该数据点的邻域数据点的标签信息,第二部分为该数据点的原始标签信息;
通过迭代公式,得到标签概率显示矩阵F第t次的迭代结果如下式所示:
其中,θ=0,…,t-1为迭代次数;
通过迭代公式F(t)进行迭代,直到收敛,得到标签概率显示矩阵F如下:
其中,I为n阶单位矩阵,βN满足矩阵I-βN为非奇异矩阵。
本实施例中,高斯函数的带宽参数σ取值为0.02,正标签传播参数β的取值为0.4。
步骤2.2:根据正标签传播结果对原始数据进行负标记,并使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签,具体方法为:
将标签概率显示矩阵F分为两部分,FL是已标记数据所对应的行,FU是未标记数据所对应的行;
对已标记数据对应的负标记矩阵进行赋值时,仅需要将每个数据所属的类别处标记零,其余位置均为1,即每行只有一个零元素,其余均为1,负标记的赋值公式为:
对未标记数据对应的负标记矩阵进行赋值时,计算FU第k行最大的两个值之间的差值Δk,选取前40个差值最小的行所对应的未标记数据进行负标记,其中,m为用户自己设定的数值,将每个需要进行负标记的未标记数据所对应的行FU的行向量中最大的两个值所属的两个类别处标记零,其余位置均为1,即每行有两个零元素,其余均为1;
通过正负标签协同传播算法对正则化框架进行最小化,得到最优的标签概率显示矩阵F*,正则化框架表示为:
ψ(F)=tr(FTN′F)+λ[λ1tr((F-Y+)T(F-Y+))-λ2tr((F-Y-)t(F-Y-))]
其中,λ为调节损失函数λ1tr((F-Y+)T(F-Y+))-λ2tr((F-Y-)T(F-Y-))和图的平滑度限制项tr(FTN′F)二者权重的参数,λ1和λ2为调节正标签损失函数tr((F-Y+)T(F-Y+))和负标签损失函数tr((F-Y-)T(F-Y-))的参数,并且λ1和λ2满足λ1+λ2=1,N′=A′-N为拉普拉斯矩阵,其中di′是标签传播矩阵N第i行所有元素的和。
正则化框架ψ(F)对F求一阶偏导,并且使其一阶偏导等于零,如下公式所示:
得到最优的标签概率显示矩阵,如下所示:
F*=[λN′+λ2(λ1-λ2)I]-1(λ1Y+-λ2Y-)
通过最优的标签概率显示矩阵F*,得到通过正负标签协同传播之后第i个未标记样本数据所属的类别,即得到第i个未标记数据的软标签,如下公式所示:
本实施例中,调节损失函数和图的平滑度限制项二者权重的参数λ取值为0.8,调节正标签损失函数和负标签损失函数的参数λ1和λ2取值为0.6和0.4。正负标签协同传播结果如图3所示,正负标签协同传播结果准确率为92.25%。
步骤3:求解将高维原始数据投影到低维空间的投影矩阵W,具体方法为:
首先将已标记数据按类别从第1类到第c类进行排列得到已标记数据XL,将携带软标签的未标记数据按类别从第1类到第c类进行排列得到未标记数据XU,分别计算已标记数据XL和未标记数据XU的类间散度矩阵及类内散度矩阵;
步骤3.1:计算已标记数据XL的类间散度矩阵及类内散度矩阵;
已标记数据XL的总体样本均值为其中,l为已标记数据个数,Xi l为第i个已标记数据;第j类已标记数据的样本均值为其中,Nj l为第j类已标记数据的集合,为第j类已标记数据的个数;
已标记数据XL的类间散度矩阵Sb L如下所示:
其中,矩阵B为l行l列的方阵,所有元素均为矩阵A如下所示:
其中,矩阵Aj为行列的方阵,所有元素均为
已标记数据XL的类内散度矩阵如下所示:
其中,矩阵Il为l行l列的单位阵,矩阵C如下所示:
其中,矩阵Cj为行列的方阵,所有元素均为
步骤3.2:计算未标记数据XU的类间散度矩阵及类内散度矩阵;
未标记数据XU的总体样本均值为其中,u是携带软标签的未标记数据个数,是第i个携带软标签的未标记数据;第j类携带软标签的未标记数据的样本均值为其中,为第j类携带软标签的未标记数据的集合,第j类携带软标签的未标记数据的个数;
未标记数据XU的类间散度矩阵如下式所示:
其中,矩阵B′为u行u列的方阵,所有元素均为矩阵A′如下式所示:
其中,矩阵A′j为行列的方阵,所有元素均为
未标记数据XU的类内散度矩阵Sw U如下式所示:
其中,矩阵Iu为u行u列的单位阵,矩阵C′如下式所示:
其中,矩阵C′j为行列的方阵,所有元素均为
步骤3.3:通过已标记数据和携带软标签的未标记数据的类内散度矩阵、类间散度矩阵,得到高维原始数据投影到低维空间所需的投影矩阵W,如下式所示:
其中,参数γ为调节已标记数据的散度矩阵和携带软标记的未标记数据的散度矩阵二者比例的参数,τ为正则化参数,ID′是D′行D′列的单位矩阵;
将投影矩阵W的求解转化为对下式进行特征分解,得到的前d个最大的特征值所对应的特征向量所构成投影矩阵W,其中,d为低维空间的维数;
(γSb L+(1-γ)Sb U)wk=υk(γSw L+(1-γ)Sw U+τID′)wk
其中,υk为特征值,wk为特征向量。
本实施例中,进行特征分解的过程中,正则化参数τ取值为0.15,参数γ取值为0.6。通过投影矩阵W将原始数据从高维降维到二维空间得到的降维效果如图4所示。
步骤4:建立分类器在线对工业过程进行故障检测与诊断,具体方法为:
步骤4.1:计算已标记数据每一类的类均值和协方差矩阵;
已标记数据第j类的类均值的计算公式如下所示:
其中,P为元素均为的行向量,行向量P的长度为nj l,Xj l为第j类已标记数据,zi l表示高维空间数据通过投影矩阵W投影到低维空间对应的低维数据;
已标记数据第j类的协方差矩阵的计算公式如下式所示:
其中,为所有元素均为1的nj l行nj l列的方阵;
步骤4.2:计算携带软标签的未标记数据每一类的类均值和协方差矩阵;
携带软标签的未标记数据第j类的类均值的计算公式如下所示:
ξj u=WTXj uP′
其中,P′是一个元素均为的行向量,行向量P′的长度为nj u,Xj u为第j类携带软标签的未标记数据;
携带软标签的未标记数据第j类的协方差矩阵的计算公式如下所示:
其中,为元素均为1的nj u行nj u列的方阵;
步骤4.3:计算每一类原始数据的均值和协方差,得到每类数据的概率密度函数,完成分类器的建立;
第j类原始数据的均值为:
ξj=γξj l+(1-γ)ξj u
第j类原始数据的协方差矩阵为:
ωj=γωj l+(1-γ)ωj u
将高维原始数据通过投影矩阵W进行投影之后得到低维数据z,如下式所示:
z=WtX
结合第j类原始数据的均值和协方差,得到第j类低维数据z的概率密度函数为:
步骤4.4:使用分类器对工业过程进行在线故障诊断,具体方法为:
首先采集当前时刻数据,将当前时刻的高维数据通过投影矩阵W投影到低维空间得到低维数据z,将低维数据z带入到每一个类的概率密度函数中,概率密度函数值最大的类别就是当前时刻数据所属的类别,完成对工业过程的故障诊断。
本实施例中,采集当前时刻超高温电熔镁过程的数据,并采用分类器进行分类,分类效果如图5所示,分类结果准确率为93.30%。
本实施例同时采用相同的标签传播算法获得软标签,通过SLLDA求取投影矩阵W,对训练数据进行降维的效果如图6所示,对超高温电熔镁过程的数据进行分类的效果如图7所示,分类结果准确率为92.74%。通过分类准确率,可以清楚地看出本发明的基于可信软标签线性判别分析的工业过程故障诊断方法在超高温电熔镁冶炼过程的监测和诊断过程中表现更好。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。
Claims (9)
1.一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:包括以下步骤:
步骤1:采集工业过程中的数据,得到多维的原始数据矩阵作为训练样本数据,并且对其进行标准化处理;
步骤2:对标准化处理的数据进行正标记,使用正标记数据进行正标签传播,然后根据正标签传播结果对原始数据进行负标记,最后使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签,具体方法为:
步骤2.1:对标准化处理的数据进行正标记,使用正标记数据进行正标签传播;
步骤2.2:根据正标签传播结果对原始数据进行负标记,并使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签;
步骤3:求解将高维原始数据投影到低维空间的投影矩阵W,具体方法为:
首先将已标记数据按类别从第1类到第c类进行排列得到已标记数据XL,将携带软标签的未标记数据按类别从第1类到第c类进行排列得到未标记数据XU,分别计算已标记数据XL类间散度矩阵及类内散度矩阵和携带软标签的未标记数据XU的类间散度矩阵及类内散度矩阵
通过已标记数据和携带软标签的未标记数据的类内散度矩阵、类间散度矩阵,得到高维原始数据投影到低维空间所需的投影矩阵W,如下公式所示:
其中,参数γ为调节已标记数据的散度矩阵和携带软标记的未标记数据的散度矩阵二者比例的参数,τ为正则化参数,ID′是D′行D′列的单位矩阵,D′为原始矩阵的维数;
将投影矩阵W的求解转化为对下列特征方程进行特征分解,得到的前d个最大特征值所对应的特征向量构成投影矩阵W,其中,d为低维空间的维数;
(γSb L+(1-γ)Sb U)wk=υk(γSw L+(1-γ)Sw U+τID′)wk
其中,υk为特征值,wk为特征向量;
步骤4:建立分类器在线对工业过程进行故障检测与诊断,具体方法为:
步骤4.1:计算已标记数据每一类的类均值和协方差矩阵;
步骤4.2:计算携带软标签的未标记数据每一类的类均值和协方差矩阵;
步骤4.3:计算每一类原始数据的均值和协方差,得到每类数据的概率密度函数,完成分类器的建立;
步骤4.4:使用分类器对工业过程进行在线故障诊断。
2.根据权利要求1所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:步骤2.1所述对标准化处理的原始数据进行正标记,使用正标记数据进行正标签传播的具体方法为:
经过步骤1标准化处理以后的数据为其中xi∈RD′并且yi∈{1,2,...,c},xi为第i个训练样本数据,yi是第i个样本数据所属的类别,i=1,...n,n为训练样本数据个数,c为原始数据所属的类别数;将标准化处理后的原始数据集进行标记之后得到已标记数据集和未标记数据集Du={xl+1,xl+2,...,xl+u},其中,l是已标记数据个数,u是未标记数据个数,且二者满足l+u=n;
在已标记数据集和未标记数据集Du={xl+1,xl+2,...,xl+u}的基础上构建图G=(V,E,M),其中,V为图的顶点集合,E为图的边集,M为边的权重矩阵,矩阵值表示为:
其中,Mii′为第i个数据点和第i′个数据点所构成边的权重,σ为高斯函数的带宽参数,xi和xi′分别表示第i个和第i′个标准化后的原始数据点,i′=1,...,n;
对权重矩阵M进行归一化,得到标签传播矩阵N,如下式所示:
其中,di为权重矩阵M的第i行所有元素的和,i=1,2,…,n;
根据已标记数据的初始标签,得到n行c列的初始正标签矩阵Y,其前l行根据以下公式进行赋值,其余行的所有元素均赋值为零;
其中,j=1,...,c为原始数据所属的类别;
使用正标签传播方法对初始正标签矩阵Y进行迭代计算,迭代公式为:
F(t+1)=βNF(t)+(1-β)Y
其中,参数β∈(0,1)为用户自己确定的正标签传播参数,F(t)为标签概率显示矩阵F迭代到第t次得到的结果、F(t+1)为标签概率显示矩阵F迭代到第t+1次得到的结果;
每一次的迭代过程中,每一个数据点新的标签信息来源于两个部分,第一部分为该数据点的邻域数据点的标签信息,第二部分为该数据点的原始标签信息;
通过迭代公式,得到标签概率显示矩阵F第t次的迭代结果如下式所示:
其中,θ=0,…,t-1为迭代次数;
通过迭代公式F(t)进行迭代,直到收敛,得到标签概率显示矩阵F如下:
其中,I为n阶单位矩阵,βN满足矩阵I-βN为非奇异矩阵。
3.根据权利要求2所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:步骤2.2所述对原始数据进行负标记,并使用正标记数据和负标记数据进行正负标签协同传播得到未标记数据的最优软标签具体方法为:
将标签概率显示矩阵F分为两部分,FL是已标记数据所对应的行,FU是未标记数据所对应的行;
对已标记数据对应的负标记矩阵进行赋值时,仅需要将每个数据所属的类别处标记零,其余位置均为1,即每行只有一个零元素,其余均为1,负标记的赋值公式为:
对未标记数据对应的负标记矩阵进行赋值时,计算FU第k行最大的两个值之间的差值Δk,选取前m个差值最小的行所对应的未标记数据进行负标记,其中m是用户自己设定的数值,将每个需要进行负标记的未标记数据所对应的行FU的行向量中最大的两个值所属的两个类别处标记零,其余位置均为1,即每行有两个零元素,其余均为1;
通过正负标签协同传播算法对正则化框架进行最小化,得到最优的标签概率显示矩阵F*,正则化框架表示为:
ψ(F)=tr(FTN′F)+λ[λ1tr((F-Y+)t(F-Y+))-λ2tr((F-Y-)t(F-Y-))]
其中,λ为调节损失函数λ1tr((F-Y+)T(F-Y+))-λ2tr((F-Y-)T(F-Y-))和图的平滑度限制项tr(FTN′F)二者权重的参数,λ1和λ2为调节正标签损失函数tr((F-Y+)T(F-Y+))和负标签损失函数tr((F-Y-)t(F-Y-))的参数,并且λ1和λ2满足λ1+λ2=1,N′=-N为拉普拉斯矩阵,其中di′是标签传播矩阵N第i行所有元素的和;
将正则化框架ψ(F)对F求一阶偏导,并使其一阶偏导等于零,如下公式所示:
得到最优的标签概率显示矩阵,如下所示:
F*=[λN′+λ2(λ1-λ2)I]-1(λ1Y+-λ2Y-)
通过最优的标签概率显示矩阵F*,得到通过正负标签协同传播之后第i个未标记样本数据所属的类别,即得到第i个未标记数据的软标签,如下公式所示:
4.根据权利要求3所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:步骤3所述计算已标记数据XL的类间散度矩阵及类内散度矩阵的具体方法为:
已标记数据XL的总体样本均值为其中,l为已标记数据个数,xi l为第i个已标记数据;第j类已标记数据的样本均值为其中,Nj l为第j类已标记数据的集合,为第j类已标记数据的个数;
已标记数据XL的类间散度矩阵如下所示:
其中,矩阵B为l行l列的方阵,所有元素均为矩阵A如下所示:
其中,矩阵Aj为行列的方阵,所有元素均为
已标记数据XL的类内散度矩阵如下所示:
其中,矩阵Il为l行l列的单位阵,矩阵C如下所示:
其中,矩阵Cj为行列的方阵,所有元素均为
5.根据权利要求4所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:步骤3所述计算未标记数据XU的类间散度矩阵及类内散度矩阵的具体方法为:
未标记数据XU的总体样本均值为其中,u是携带软标签的未标记数据个数,为第i个携带软标签的未标记数据;第j类携带软标签的未标记数据的样本均值为其中,为第j类携带软标签的未标记数据的集合,第j类携带软标签的未标记数据的个数;
未标记数据XU的类间散度矩阵Sb U如下式所示:
其中,矩阵B′为u行u列的方阵,所有元素均为矩阵A′如下式所示:
其中,矩阵A′j为行列的方阵,所有元素均为
未标记数据XU的类内散度矩阵Sw U如下式所示:
其中,矩阵Iu为u行u列的单位阵,矩阵C′如下式所示:
其中,矩阵C′j为行列的方阵,所有元素均为
6.根据权利要求5所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:步骤4.1所述计算已标记数据每一类的类均值和协方差矩阵的具体方法为:
已标记数据第j类的类均值的计算公式如下所示:
其中,P为元素均为的行向量,行向量P的长度为nj l,Xj l为第j类已标记数据,zi l表示高维空间数据通过投影矩阵W投影到低维空间对应的低维数据;
已标记数据第j类的协方差矩阵的计算公式如下式所示:
其中,为所有元素均为1的nj l行nj l列的方阵。
7.根据权利要求6所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:步骤4.2所述计算携带软标签的未标记数据每一类的类均值和协方差矩阵的具体方法为:
携带软标签的未标记数据第j类的类均值的计算公式如下所示:
ξj u=WtXj uP′
其中,P′是一个元素均为的行向量,行向量P′的长度为nj u,Xj u为第j类携带软标签的未标记数据;
携带软标签的未标记数据第j类的协方差矩阵的计算公式如下所示:
其中,为元素均为1的nj u行nj u列的方阵。
8.根据权利要求7所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:步骤4.3所述得到每类数据的概率密度函数的具体方法为:
计算每一类原始数据的均值和协方差;
第j类原始数据的均值为:
ξj=γξj l+(1-γ)ξj u
第j类原始数据的协方差矩阵为:
ωj=γωj l+(1-γ)ωj u
将高维原始数据通过投影矩阵W进行投影之后得到低维数据z,如下式所示:
z=WtX
结合第j类原始数据的均值和协方差,得到第j类低维数据z的概率密度函数为:
9.根据权利要求8所述的一种基于可信软标签线性判别分析的工业过程故障诊断方法,其特征在于:步骤4.4所述使用分类器对工业过程进行在线故障诊断的具体过程为:
首先采集当前时刻数据,将当前时刻的高维数据通过投影矩阵W投影到低维空间得到低维数据,将低维数据带入到每一个类的概率密度函数中,概率密度函数值最大的类别就是当前时刻数据所属的类别,完成对工业过程的故障诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711061648.XA CN107831743B (zh) | 2017-10-31 | 2017-10-31 | 基于可信软标签线性判别分析的工业过程故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711061648.XA CN107831743B (zh) | 2017-10-31 | 2017-10-31 | 基于可信软标签线性判别分析的工业过程故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107831743A CN107831743A (zh) | 2018-03-23 |
CN107831743B true CN107831743B (zh) | 2019-12-10 |
Family
ID=61651451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711061648.XA Active CN107831743B (zh) | 2017-10-31 | 2017-10-31 | 基于可信软标签线性判别分析的工业过程故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107831743B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11551488B2 (en) * | 2019-08-22 | 2023-01-10 | GM Global Technology Operations LLC | Adaptive fault diagnostic system for motor vehicles |
CN111913461B (zh) * | 2019-09-07 | 2022-03-18 | 宁波大学 | 一种基于正则化gcca模型的分布式化工过程监测方法 |
CN113627523B (zh) * | 2021-08-09 | 2024-03-26 | 中国科学院微小卫星创新研究院 | 一种卫星微小故障的检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101169623A (zh) * | 2007-11-22 | 2008-04-30 | 东北大学 | 基于核主元分析贡献图的非线性过程故障辨识方法 |
KR20090078075A (ko) * | 2008-01-14 | 2009-07-17 | 충북대학교 산학협력단 | Dft와 웨이블렛을 이용한 유도전동기 고장진단방법 |
CN104536439A (zh) * | 2015-01-20 | 2015-04-22 | 浙江大学 | 一种基于嵌套迭代费舍尔判别分析的故障诊断方法 |
CN106839769A (zh) * | 2017-03-24 | 2017-06-13 | 东北大学 | 基于多流形半监督局部‑全局的电熔镁炉故障监测方法 |
CN107220475A (zh) * | 2016-11-01 | 2017-09-29 | 重庆交通大学 | 一种基于线性判别分析的轴承特征数据分析方法 |
-
2017
- 2017-10-31 CN CN201711061648.XA patent/CN107831743B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101169623A (zh) * | 2007-11-22 | 2008-04-30 | 东北大学 | 基于核主元分析贡献图的非线性过程故障辨识方法 |
KR20090078075A (ko) * | 2008-01-14 | 2009-07-17 | 충북대학교 산학협력단 | Dft와 웨이블렛을 이용한 유도전동기 고장진단방법 |
CN104536439A (zh) * | 2015-01-20 | 2015-04-22 | 浙江大学 | 一种基于嵌套迭代费舍尔判别分析的故障诊断方法 |
CN107220475A (zh) * | 2016-11-01 | 2017-09-29 | 重庆交通大学 | 一种基于线性判别分析的轴承特征数据分析方法 |
CN106839769A (zh) * | 2017-03-24 | 2017-06-13 | 东北大学 | 基于多流形半监督局部‑全局的电熔镁炉故障监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107831743A (zh) | 2018-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | Gaze estimation using transformer | |
CN107831743B (zh) | 基于可信软标签线性判别分析的工业过程故障诊断方法 | |
Yi et al. | A novel framework for fault diagnosis using kernel partial least squares based on an optimal preference matrix | |
CN108182445B (zh) | 基于大数据智能核独立元分析的过程故障识别方法 | |
Yao et al. | Discriminative manifold distribution alignment for domain adaptation | |
CN107976992B (zh) | 基于图半监督支持向量机的工业过程大数据故障监测方法 | |
CN108181891B (zh) | 基于智能核主元分析的工业大数据故障诊断方法 | |
CN107918379B (zh) | 基于图半监督代价敏感的工业大数据早期故障检测方法 | |
Li et al. | Hierarchical consistency regularized mean teacher for semi-supervised 3d left atrium segmentation | |
Huang et al. | Cloud-edge collaborative method for industrial process monitoring based on error-triggered dictionary learning | |
Zhou et al. | Identification of abnormal conditions for fused magnesium melting process based on deep learning and multisource information fusion | |
Yi et al. | Optimized relative transformation matrix using bacterial foraging algorithm for process fault detection | |
CN105976397B (zh) | 一种目标跟踪方法 | |
CN104915658B (zh) | 一种基于情感分布学习的情感成分分析方法及其系统 | |
CN112085252B (zh) | 一种关于集合类型决策效果的反事实预测方法 | |
CN107861481B (zh) | 基于工业大数据图半监督新类挖掘的故障诊断方法 | |
Le et al. | Uncertainty-aware label distribution learning for facial expression recognition | |
CN113591915B (zh) | 基于半监督学习和单分类支持向量机的异常流量识别方法 | |
CN112115993A (zh) | 一种基于元学习的零样本和小样本证件照异常检测方法 | |
Li et al. | Learning low-rank representations with classwise block-diagonal structure for robust face recognition | |
Peng et al. | Source-free domain adaptive human pose estimation | |
Li et al. | Stochastic configuration networks for self-blast state recognition of glass insulators with adaptive depth and multi-scale representation | |
CN109657693B (zh) | 一种基于相关熵和迁移学习的分类方法 | |
CN109949437B (zh) | 基于稀疏化的异构数据协同工业故障诊断方法 | |
Lu et al. | Semi-supervised condition monitoring and visualization of fused magnesium furnace |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |