CN108182302B - 基于修改聚类半监督核主元分析的早期故障检测方法 - Google Patents

基于修改聚类半监督核主元分析的早期故障检测方法 Download PDF

Info

Publication number
CN108182302B
CN108182302B CN201711324889.9A CN201711324889A CN108182302B CN 108182302 B CN108182302 B CN 108182302B CN 201711324889 A CN201711324889 A CN 201711324889A CN 108182302 B CN108182302 B CN 108182302B
Authority
CN
China
Prior art keywords
data
sample
fault
tag
early
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711324889.9A
Other languages
English (en)
Other versions
CN108182302A (zh
Inventor
张颖伟
于忠源
方正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201711324889.9A priority Critical patent/CN108182302B/zh
Publication of CN108182302A publication Critical patent/CN108182302A/zh
Application granted granted Critical
Publication of CN108182302B publication Critical patent/CN108182302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于修改聚类半监督核主元分析的早期故障检测方法,涉及故障监测与诊断技术领域。该方法通过离线建模与在线监测,同时考虑数据的本身分布信息和数据类别标签信息,并采用修改的聚类假设,运用改进的半监督KPCA方法,先找到早期故障数据,进而进行二次建模,得到偏向于主元的分解函数,找到划分故障与正常的分界,运用该分解函数判定新采集的数据是否属于故障类数据。本发明针对于工业早期故障难以发现和判定的问题,不仅能大大降低误报警,还提高了故障检测的准确性。

Description

基于修改聚类半监督核主元分析的早期故障检测方法
技术领域
本发明涉及故障监测与诊断技术领域,尤其涉及一种基于修改聚类半监督核主元分析的早期故障检测方法。
背景技术
随着现代工业的迅速发展,现代企业中生产设备日趋大型化、连续化、高速化和自动化,设备的结构与组成十分复杂,生产规模非常庞大,各部门之间的联系也特别密切。精确的过程故障检测对提高生产质量和避免生产事故非常重要。因此,过去几年来,大量研究人员重视开发有效的过程监控技术。特别是,随着计算机和传感器技术在工业过程中的广泛应用,测量和存储了许多过程数据。测量数据包含大量的过程操作信息。实际的生产过程有线性的、非线性的、时不变的、时变的等,对于不同的生产过程所具有的特征,应选用不同的故障监测方法,这样才能有效地检测到故障。
通过采用统计分析技术,可以发现包含测量数据的信息来监控过程。已经提出了包括主成分分析(PCA),偏最小二乘法(PLS)和独立分量分析(ICA)在内的古典多变量统计过程监测(MSPM)方法,用于过程故障诊断。针对工业过程的非线性特性,一些学者提出了核主元分析(KPCA)方法,通过非线性核函数把非线性数据映射到高维特征空间,然后在特征空间中执行线性PCA提取特征,KPCA是在高维特征空间中执行PCA,所以无需求解非线性优化问题,并且与其它非线性方法相比,在建模之前它不需要指定主元数目,但是传统KPCA方法也存在着不足之处,KPCA是一种无监督的方法,只是考虑了数据本身的分布特性,而并没有考虑数据与类别的相关联系,即建模数据中同时含有是正常和故障的数据。将故障与正常类别信息、数据本身分布特征两者结合在一起,将KPCA扩展为半监督方法对于故障检测意义重大。而这种半监督KPCA本质上是属于半监督的分类方法,其隐含了每个数据都具有一个明确的类标签。
然而在实际应用中,尤其是对于早期故障检测中,很难说明一个实例的情况具体是属于正常还是故障,数据可能同时含有两类的数据特征,将这种体现两类信息的数据定义为早期故障数据,这里需要指出的是早期故障数据并不等于故障数据,早期故障数据是正常与故障的过渡状态,这里被定义为既包含正常数据特征又具有故障数据特征的数据。这是由于故障与正常运行时界限不清晰,正常运行数据与故障数据特征差异较大,并且具有大量未标记的中间运行状态数据,故障信息与正常故障信息同时出现,有时在未发生严重后果时,难以判定是否故障已经发生,所以需要提出一种有效可行方法针对早期故障进行识别和诊断。例如对于电熔镁炉来说,喷炉是其中频繁发生严重的事故。冶炼过程中CO2气体在炉内不断累积,到达临界点后,气体仍无法排出,将造成喷炉事故,对生产质量与工人安全造成极大隐患。然而气体累积过程是在炉体内部,且是一种渐变过程,可CO2含量属于完全正常时只有冶炼过程早期,到达临界点喷炉之后气体一下子释放,中间累积过程情况难以断定,冶炼过程中可能包含正常运行信息也体现着要发生故障信息,而目前情况只能靠工人经验判断,误报漏报率极高。
通过迁移学习,提高故障诊断和分析的灵敏度,并且根据故障幅值输入调控方法来降低电熔镁炉工业生产中故障造成的损失。但是随着工业系统的发展,采集的数据也日益复杂,数据之多且维度之高已经成为了大数据统一建模并进行故障监测和诊断的一大障碍。所以如何对这样高维度的大数据进行特征提取来简化接下来的故障监测和诊断已成为当前所关注的问题。传统的特征提取方法如PCA、LDA等,已无法满足当前物理化学数据和多媒体流异构数据统一建模进行故障监测和诊断的需求。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于修改聚类半监督核主元分析的早期故障检测方法,通过采集的传统数据和多媒体流异构数据进行统一建模,先找到早期故障数据,进而找到划分故障与正常的分界。
为解决上述技术问题,本发明所采取的技术方案是:
一种基于修改聚类半监督核主元分析的早期故障检测方法,包括以下步骤:
步骤1:采集冶炼工业过程中的传统数据与多媒体流数据,包括:冶炼初期即完全正常状态的数据、冶炼过程中数据、喷炉故障发生前后数据,并对采集的正常和故障数据进行标记,得到标记样本数据
Figure GDA0003026025420000021
其标签矩阵为
Figure GDA0003026025420000022
yi∈[1,C],C为类别总数,其它数据作为无标记数据,得到未标记样本数据
Figure GDA0003026025420000023
其中xi∈RD、xj∈RD,N=nl+nu,D表示xi、xj的数据维数,nl表示标记样本数,nu表示未标记样本数;提取采集的多媒体流数据中的关键帧,并提取多媒体流数据的色彩与灰度特征,并将传统数据与多媒体流数据统一进行标准化处理和坐标变换,得到采样样本数据;
步骤2:用步骤1标准化后的采样样本,通过建立基于类成员的半监督分类模型,即SSCCM(即semi-supervised classification based on class membership)模型,得到未标记样本的标签成员资格,进而找出早期故障数据;具体方法为:
步骤2.1:采用修改聚类假设,根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量,建立基于类成员的半监督分类模型即SSCCM模型,在再生希尔伯特空间采用(f,v)交替迭代的方法求解该模型,得到决策函数f和标签成员资格函数v;具体方法为:
步骤2.1.1:计算标记样本数据与未标记样本数据的邻域加权平均值即LWM(localweighted mean),分别为
Figure GDA0003026025420000031
Figure GDA0003026025420000032
其中
Figure GDA0003026025420000033
Figure GDA0003026025420000034
分别表示第i个标记数据样本和第j个未标记数据样本的邻域加权平均值,分别如下两式所示;
Figure GDA0003026025420000035
Figure GDA0003026025420000036
其中,i′=1,2,…,nl;j′=1,2,…,nu;Ne(xi)、Ne(xj)分别表示xi、xj在欧式空间通过k-近邻得到的邻域集;Sii′、Sjj′分别表示随xi与xi′距离增加而单调递减的权值量、随xj与xj′距离增加而单调递减的权值量,Sii′=exp(-||xi-xi′||2),Sjj′=exp(-||xj-xj′||2);
步骤2.1.2:采用修改聚类假设,根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量,建立SSCCM模型如下式所示;
Figure GDA0003026025420000037
其中,f表示决策函数;vk(xn)为样本xn的标签成员资格函数v(xn)的第k个元素,表示样本xn属于第k类的可能性;对于标记样本xi,其标签成员资格函数v(xi)为定值,如果标记样本xi属于第k类,则vk(xi)=1;其余元素为0;f(xn)表示样本xn的函数决策值;rk表示类别编码向量,C个类的编码矩阵为
Figure GDA0003026025420000038
rk的第k个元素为1,其余元素为0;当标记样本xi属于第k类时,令yi=rk,即标签与类编码都是C维向量,且yi的第k个元素为1,其余元素为0;
Figure GDA0003026025420000039
表示样本xn的邻域加权平均值的函数决策值;λ和λs是正则化参数,b是标签成员资格的加权指数;
步骤2.1.3:为了找出早期故障数据,采用二分类方式,用以区分正常与故障数据,令公式(1)中的类别总数C=2;
步骤2.1.4:在再生希尔伯特空间,采用(f,v)交替迭代的方法,求解SSCCM模型,得到决策函数f和标签成员资格函数v;具体方法为:
每个样本xn的在核空间的邻域加权平均值被定义为
Figure GDA0003026025420000041
通过表达定理,决策函数形式变换为
Figure GDA0003026025420000042
每个βn∈R2×1,所以解的形式如下式所示;
Figure GDA0003026025420000043
其中,β=[β12,...,βN]∈R2×N,为表达定理的系数向量;Y表示标签数据的标签向量yi构成的矩阵,K表示所有样本的核矩阵,
Figure GDA0003026025420000044
Figure GDA0003026025420000045
Figure GDA0003026025420000046
Figure GDA0003026025420000047
Iu是nu×nu的单位矩阵;
Figure GDA0003026025420000048
Figure GDA0003026025420000049
表示未标记数据的类标签成员概率值,
Figure GDA00030260254200000410
是一个对角矩阵,其对角元素是V的按行排列的所有元素的平方值;
对于固定的决策函数f(x),SSCCM问题将变为对标签成员资格函数求解问题,如下式所示;
Figure GDA00030260254200000411
求解上式得到任意样本x的第k个标签成员资格函数为:
Figure GDA0003026025420000051
步骤2.2:根据决策函数f和标签成员资格函数v找出早期故障数据,使用如下互补的两种方法进行判定:
(1)对于处于决策边界附近的样本x,检验其决策函数f(x)与标签成员资格函数v(x)的一致性,如果两者不一致,则判断x为早期故障点;
(2)对于处于决策边界附近的样本x,判定两侧的标签成员资格函数v1(x)与v2(x)之差是否小于标签成员函数的选择系数ε,即|v1(x)-v2(x)|<ε,0≤ε≤1;
对于上述两种方法判定出的相同的早期故障点数据,取其中之一,综合得到所有的早期故障数据;
步骤3:将步骤2得到的早期故障数据重新作为未标记数据
Figure GDA0003026025420000052
数据个数为m;将步骤1中的标记数据和步骤2中已经明确划分类别的数据重新作为标记数据
Figure GDA0003026025420000053
标签值矩阵为
Figure GDA0003026025420000054
yl为第l个标记数据的标签值,Y′∈Rr,数据个数为M;考虑早期故障数据的变化信息,并基于修改的聚类假设,建立修改聚类假设的半监督KPCA故障检测模型,进行第二次分类,找到早期故障数据中偏向主元的分界线fD;修改聚类假设的半监督KPCA故障检测模型如式(6)所示;
Figure GDA0003026025420000055
其中,Y0与Y1是新标记的正常与故障两类数据的标签值,与新的标记数据标签值应一致;v0与v1分别表示正常和故障两类标签成员资格概率值,λl和λu是新的标记数据与新的未标记数据的权衡参数;s是方差约束控制参数;
进行第二次分类,找到早期故障数据中偏向主元的分界线fD的方法为:在对(f,v)求解的过程中,采用(f,v)交替迭代的方法,每一步都得到闭合解,具体步骤为:
步骤3.1:根据表达定理,将公式(6)中的目标函数变换为下式:
Figure GDA0003026025420000061
其中,t0,t1∈Rm分别是m维列向量,t0内的所有元素值均为Y0,t1内的所有元素值均为Y1,K表示所有数据的核矩阵,KM表示K中取标记数据的M行,Km表示K中取未标记数据m行;,αD为表达定理的系数向量,采用αD的投影算子,迫使αD投影到之前所有解的零空间内,令A=[α1,...,αD-1]是之前所有解构成的矩阵,之后通过奇异值分解(Singular ValueDecomposition,简称SVD)使S=Null(KAATK)作为KA零空间的N×(N-n+1)的正交基;通过投影SαD,得到N-n+1维问题;
Figure GDA0003026025420000062
均为m维对角矩阵,其对角元素分别是v0(xu)、v1(xu)的平方值,其中u=1,...,m;c表示的是拉格朗日算子;ED为m维方阵,其中每一元素的值为
Figure GDA0003026025420000063
步骤3.2:令L′偏导数为零,
Figure GDA0003026025420000064
求解式(7)并通过耦合形式变换得到:
Figure GDA0003026025420000065
其中,
Figure GDA0003026025420000066
P=ST(Km TKm-Km TEDKm)S,
Figure GDA0003026025420000067
步骤3.3:通过求解下式所示的广义特征值问题,得到式(12)中的c,由此便得到αD
Figure GDA0003026025420000068
步骤3.4:对于一个固定的决策函数,其标签成员资格函数求解将变为下式:
Figure GDA0003026025420000069
令L″对v0(xu)和v1(xu)求偏导数并等于零,即
Figure GDA00030260254200000610
Figure GDA0003026025420000071
又由于式(6)中约束的第一项v0(xu)+v1(xu)=1,则得到
Figure GDA0003026025420000072
Figure GDA0003026025420000073
在求取决策函数时,c<δ,δ是Gx=δPx的最小广义特征值,由于αD TD在c∈[-∞,δ)是严格递增的,因此当满足αD TD-s2=0时,解是唯一的;通过Gx=δPx确定控制参数s的上界,即当c=δ时;
通过以上的求解,得到对于早期故障数据二次分类所得的分界线fD
步骤4:对冶炼工业过程进行在线故障检测与诊断;
将新采集的多媒体流数据按步骤1采用的方法进行标准化处理,得到新样本xnew,利用步骤3得到的二次分界线fD,判定xnew的类别,如果判定为故障类,则认为该冶炼工业过程发生故障;否则,继续步骤4处理下一个新样本信息。
采用上述技术方案所产生的有益效果在于:本发明提供的一种基于修改聚类半监督核主元分析的早期故障检测方法,主要分为两个部分,离线建模与在线监测,主要针对于工业早期故障难以发现和判定的问题,同时考虑数据的本身分布信息和数据类别标签信息,并采用修改的聚类假设,即假设数据同时具有两种类别特征信息,运用半监督KPCA方法并进行改进,进而更适用于早期工业过程故障的诊断,不仅能大大降低误报警,还提高了故障检测的准确性。
附图说明
图1为本发明实施例提供的电熔镁炉工艺原理图;
图2为本发明实施例提供的基于修改聚类半监督核主元分析的早期故障检测方法流程图;
图3为本发明实施例提供的故障检测数据真实边界示意图;
图4为本发明实施例提供的基于修改聚类半监督核主元分析的早期故障检测方法所找出的早期故障数据图;
图5为本发明实施例提供的基于修改聚类半监督核主元分析的早期故障检测方法划分边界示意图;
图6为本发明实施例提供的基于修改聚类半监督核主元分析的早期故障检测方法对于早期故障数据进行二次分类所得到的分界线结果图;
图7为本发明实施例提供的未采用修改聚类假设时的LS-KPCA方法对电熔镁炉故障检测的结果图;
图8为本发明实施例提供的未采用修改聚类假设时多次正交投影的半监督KPCA方法对电熔镁炉故障检测的结果图;
图9为本发明实施例提供的单独使用SSCCM时对电熔镁炉故障检测的结果图;
图10为本发明实施例提供的对整体样本直接使用基于修改聚类半监督核主元分析的早期故障检测方法对电熔镁炉故障检测的结果。
图中:1、变压器;2、电路短网;3、电极升降装置;4、电极;5、炉壳;6、车体;7、电弧、8、炉料。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本实施例以电熔镁炉的运行过程为例,电熔镁炉的设备主要包括:变压器、电路短网、电极、电极升降装置以及炉体等。炉边设有控制室,可控制电极升降。电熔镁炉的基本工作原理示意如图1所示。本实施例的方法如下所述。
一种基于修改聚类半监督核主元分析的早期故障检测方法,如图2所示,具体步骤如下所述。
步骤1:采集电熔镁炉运行过程中的传统数据与视频图像数据,包括:冶炼初期即完全正常状态的数据、冶炼过程中数据、喷炉故障发生前后数据,具体包括电熔镁炉三个电极的电压值(Ua、Ub、Uc)、三个电极的电流值(Ia、Ib、Ic)、三个电极位置值(Pa、Pb、Pc)、炉温T和炉内外的视频图像数据,用灰度共生矩阵提取图像的ASM能量、对比度、逆差距、熵、自相关等共20维信息。将传统数据与视频图像数据统一进行标准化处理和坐标变换,得到采样样本数据,对采集的正常和故障数据进行标记,得到标记样本数据
Figure GDA0003026025420000081
其标签矩阵为
Figure GDA0003026025420000082
yi∈[1,C],C为类别总数,其它数据作为无标记数据,得到未标记样本数据
Figure GDA0003026025420000083
其中xi∈RD、xj∈RD,N=nl+nu,D表示xi、xj的数据维数,nl表示标记样本数,nu表示未标记样本数。
本实施例给出部分采样数据,包括一部分标记数据和未标记数据,如表1所示,前10组为正常,后10组为故障。
表1电熔镁炉数据中的部分数据
Figure GDA0003026025420000091
步骤2:用步骤1标准化后的采样样本,通过基于二分类的类成员的半监督分类即SSCCM(即semi-supervised classification based on class membership)模型得到未标记样本的标签成员资格,进而找出早期故障数据,本实施例中,故障检测数据真实边界如图3所示。找出早期故障数据的具体方法如下所述。
步骤2.1:采用修改聚类假设,根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量,建立基于类成员的半监督分类模型即SSCCM模型,在再生希尔伯特空间采用(f,v)交替迭代的方法求解该模型,得到决策函数f和标签成员资格函数v;具体方法为:
步骤2.1.1:计算标记样本数据与未标记样本数据的邻域加权平均值即LWM(localweighted mean),分别为
Figure GDA0003026025420000101
Figure GDA0003026025420000102
LWM事实上是xi或xj的邻域内k个最近实例的鲁棒图像。其中
Figure GDA0003026025420000103
Figure GDA0003026025420000104
分别表示第i个标记数据样本xi和第j个未标记数据样本xj的邻域加权平均值,分别如下两式所示;
Figure GDA0003026025420000105
Figure GDA0003026025420000106
其中,i′=1,2,…,nl;j′=1,2,…,nu;Ne(xi)、Ne(xj)分别表示xi、xj在欧式空间通过k-近邻得到的邻域集;Sii′、Sjj′分别表示随xi与xi′距离增加而单调递减的权值量、随xj与xj′距离增加而单调递减的权值量,Sii′=exp(-||xi-xi′||2),Sjj′=exp(-||xj-xj′||2);
步骤2.1.2:采用修改聚类假设,根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量,建立SSCCM模型如下式所示;
Figure GDA0003026025420000107
其中,f表示决策函数;vk(xn)为样本xn的标签成员资格函数v(xn)的第k个元素,表示样本xn属于第k类的可能性;对于标记样本xi,其标签成员资格函数v(xi)为定值,如果标记样本xi属于第k类,则vk(xi)=1;其余元素为0;f(xn)表示样本xn的函数决策值;rk表示类别编码向量,C个类的编码矩阵为
Figure GDA0003026025420000108
rk的第k个元素为1,其余元素为0;当标记样本xi属于第k类时,令yi=rk,即标签与类编码都是C维向量,且yi的第k个元素为1,其余元素为0;
Figure GDA0003026025420000111
表示样本xn的邻域加权平均值的函数决策值;λ和λs是正则化参数,b是标签成员资格的加权指数;λs负责调整每一个样本与其LWM预测值的一致性,λ调整此模型复杂度,b控制着每一样本隶属于每一类的程度或不确定程度,本实施例中取b=2。
步骤2.1.3:对于SSCCM本身来说,是可以应用为多分类的方法,但由于为了找出早期故障数据,首先采用二分类方式,用以区分正常与故障数据,令公式(1)中的类别总数C=2,则SSCCM模型即式(1)重新写成下式:
Figure GDA0003026025420000112
步骤2.1.4:在再生希尔伯特空间,采用(f,v)交替迭代的方法,求解SSCCM模型,每一次迭代都可以闭合解,得到决策函数f和标签成员资格函数v;具体方法为:
每个样本xn的在核空间的邻域加权平均值被定义为
Figure GDA0003026025420000113
通过表达定理,决策函数形式变换为
Figure GDA0003026025420000114
每个βn∈R2×1,所以解的形式如下式所示;
Figure GDA0003026025420000115
其中,β=[β12,...,βN]∈R2×N,为表达定理的系数向量;Y表示标签数据的标签向量yi构成的矩阵,K表示所有样本的核矩阵,
Figure GDA0003026025420000116
Figure GDA0003026025420000117
Figure GDA0003026025420000118
Figure GDA0003026025420000121
Iu是nu×nu的单位矩阵;
Figure GDA0003026025420000122
Figure GDA0003026025420000123
表示未标记数据的类标签成员概率值,
Figure GDA0003026025420000124
是一个对角矩阵,其对角元素是V的按行排列的所有元素的平方值;
对于固定的决策函数f(x),SSCCM问题将变为对标签成员资格函数求解问题,如下式所示;
Figure GDA0003026025420000125
求解上式得到任意样本x的第k个标签成员资格函数为:
Figure GDA0003026025420000126
通过步骤2.1的建模求解,得到了决策函数f与标签成员资格函数v,然而当某一样本数据x处于决策边界附近时,对于x的分类预测是不可靠的,因为这时的x同时含有两类数据的特征,如果仅考虑整体数据特征,通过一次分类,误分类概率很大。为了精确分类,要将这些容易误分类的点,即早期故障数据找出来。
步骤2.2:根据步骤2.1得到的决策函数f和标签成员资格函数v找出早期故障数据,使用如下互补的两种方法进行判定:
(1)对于处于决策边界附近的样本x,检验其决策函数f(x)与标签成员资格函数v(x)的一致性,如果两者不一致,则判断x为早期故障点;
(2)对于处于决策边界附近的样本x,判定两侧的标签成员资格函数之差是否小于标签成员函数的选择系数ε,即|v1(x)-v2(x)|<ε,0≤ε≤1;
上述两种方法的结果会有重合部分,对于上述两种方法判定出的相同的早期故障点数据,取其中之一,综合得到所有的早期故障数据,如图4所示。
本实施例中找出的电熔镁炉数据中部分早期故障数据如表2所示。
表2.找出的电熔镁炉数据中部分早期故障数据
Figure GDA0003026025420000131
步骤3:将步骤2得到的早期故障数据重新作为未标记数据
Figure GDA0003026025420000132
数据个数为m;将步骤1中的标记数据和步骤2中已经明确划分类别的数据重新作为标记数据
Figure GDA0003026025420000133
标签值矩阵为
Figure GDA0003026025420000134
yl为第l个标记数据的标签值,Y′∈Rr,数据个数为M;考虑早期故障数据的变化信息,并基于修改的聚类假设,建立修改聚类假设的半监督KPCA故障检测模型,进行第二次分类,找到早期故障数据中偏向主元的分界线fD;修改聚类假设的半监督KPCA故障检测模型如式(6)所示;
Figure GDA0003026025420000141
其中,Y0与Y1分别是新标记的正常与故障两类数据的标签值,与新的标记数据标签值应一致;v0与v1分别表示正常和故障两类标签成员资格概率值,λl和λu是新的标记数据与新的未标记数据的权衡参数;s.t.中前两个约束与SSCCM模型中的相同,第三个约束使得fD与s的关系变得紧密起来,它表示的是未标记数据的方差约束,s是方差约束控制参数;第四个约束使得在计算KPCA时,其中朝向训练标签偏置的第n个方向垂直于前面的n-1个约束。
进行第二次分类,找到早期故障数据中偏向主元的分界线fD的方法为:在对(f,v)求解的过程中,采用(f,v)交替迭代的方法,每一步都得到闭合解,具体步骤为:
步骤3.1:根据表达定理,将公式(6)中的目标函数变换为下式:
Figure GDA0003026025420000142
其中,t0,t1∈Rm分别是m维列向量,t0内的所有元素值均为Y0,t1内的所有元素值均为Y1,K表示所有数据的核矩阵,KM表示K中取标记数据的M行,Km表示K中取未标记数据m行;αD为表达定理的系数向量,为了考虑到式(6)中第四个约束,采用αD的投影算子,迫使αD投影到之前所有解的零空间内,令A=[α1,...,αD-1]是之前所有解构成的矩阵,之后通过奇异值分解(Singular Value Decomposition,简称SVD)使S=Null(KAATK)作为KA零空间的N×(N-n+1)的正交基,因此通过投影SαD,得到N-n+1维问题;
Figure GDA0003026025420000143
均为m维对角矩阵,其对角元素分别是v0(xu)、v1(xu)的平方值,其中u=1,...,m;c表示的是拉格朗日算子;ED为m维方阵,其中每一元素的值为
Figure GDA0003026025420000151
步骤3.2:令L′偏导数为零,
Figure GDA0003026025420000152
即:
Figure GDA0003026025420000153
Figure GDA0003026025420000154
将式(8)、式(9)转化为下面的耦合形式:
Figure GDA0003026025420000155
将式(10)简化为:
Figure GDA0003026025420000156
其中,
Figure GDA0003026025420000157
P=ST(Km TKm-Km TEDKm)S,
Figure GDA0003026025420000158
步骤3.3:通过求解下式所示的广义特征值问题,得到式(12)中的c,由此便得到αD
Figure GDA0003026025420000159
步骤3.4:与SSCCM模型的求解类似,第二次分类中对于一个固定的决策函数,其标签成员资格函数求解将变为下式:
Figure GDA00030260254200001510
令L″对v0(xu)和v1(xu)求偏导数并等于零,即
Figure GDA00030260254200001511
又由于式(6)中约束的第一项v0(xu)+v1(xu)=1,则得到
Figure GDA0003026025420000161
Figure GDA0003026025420000162
在求取决策函数时,有c<δ,δ是Gx=δPx的最小广义特征值,由于αD TD在c∈[-∞,δ)是严格递增的,因此当满足αD TD-s2=0的条件时,解是唯一的。所以当系统约束比较差的时候,为了寻找高精度的解,还可以采用边界搜索的方法。而对于控制参数s的选择,通过Gx=δPx,可以确定s的上界,即当c=δ时。通过以上部分的求解,得到对于早期故障数据二次分类所得的分界线fD。本实施例得到的分界线示意图如图5所示,对于实际数据进行二次分类所得到的分界线效果图如图6所示。
步骤4:对冶炼工业过程进行在线故障检测与诊断;
将新采集的电熔镁炉视频图像数据按步骤1采用的方法进行标准化处理,得到新样本xnew,利用步骤3得到的二次分界线fD,判定xnew的类别,如果判定为故障类,则认为该电熔镁炉运行过程发生故障;否则,继续步骤4处理下一个新样本信息。
将本实施例采用的修改聚类假设的半监督KPCA的故障检测结果与其他方法的故障检测结果进行比较,对比结果如表3所示,其他方法包括未采用修改聚类假设时的LS-KPCA方法、多次正交投影的半监督KPCA方法、单独使用SSCCM的方法和对整体样本直接使用基于修改聚类半监督核主元分析的早期故障检测方法即未先求取早期故障数据的方法,这四种方法对电熔镁炉故障检测的结果图分别如图7、图8、图9和图10所示,通过对比证明了本实施例采用的修改聚类假设的半监督KPCA在故障检测上更具有优势。同时对修改聚类假设的半监督KPCA分别用于整体数据和早期故障数据进行检测的结果进行比较,结果发现本实施例所采用的方法,即先提取早期数据,进而再应用修改聚类假设的半监督KPCA进行检测的准确率更高。对比结果更加说明本方法在早期故障检测上的有效性。
表3不同的方法的故障诊断准确率对比
Figure GDA0003026025420000163
Figure GDA0003026025420000171
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (2)

1.一种基于修改聚类半监督核主元分析的早期故障检测方法,其特征在于:包括以下步骤:
步骤1:采集冶炼工业过程中的传统数据与多媒体流数据,包括:冶炼初期即完全正常状态的数据、冶炼过程中数据、喷炉故障发生前后数据,并对采集的正常和故障数据进行标记,得到标记样本数据
Figure FDA0003032385210000011
其标签矩阵为
Figure FDA0003032385210000012
C为类别总数,其它数据作为无标记数据,得到未标记样本数据
Figure FDA0003032385210000013
其中xi∈RD、xj∈RD,N=nl+nu,D表示xi、xj的数据维数,nl表示标记样本数,nu表示未标记样本数;提取采集的多媒体流数据中的关键帧,并提取多媒体流数据的色彩与灰度特征,并将传统数据与多媒体流数据统一进行标准化处理和坐标变换,得到采样样本数据;
步骤2:用步骤1标准化后的采样样本,通过建立基于类成员的半监督分类模型,即SSCCM模型,得到未标记样本的标签成员资格,进而找出早期故障数据;具体方法为:
步骤2.1:采用修改聚类假设,根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量,建立基于类成员的半监督分类模型即SSCCM模型,在再生希尔伯特空间采用(f,v)交替迭代的方法求解该模型,得到决策函数f和标签成员资格函数v;具体方法为:
步骤2.1.1:计算标记样本数据与未标记样本数据的邻域加权平均值,分别为
Figure FDA0003032385210000014
Figure FDA0003032385210000015
其中
Figure FDA0003032385210000016
Figure FDA0003032385210000017
分别表示第i个标记数据样本和第j个未标记数据样本的邻域加权平均值,分别如下两式所示;
Figure FDA0003032385210000018
Figure FDA0003032385210000019
其中,i′=1,2,…,nl;j′=1,2,…,nu;Ne(xi)、Ne(xj)分别表示xi、xj在欧式空间通过k-近邻得到的邻域集;Sii′、Sjj′分别表示随xi与xi′距离增加而单调递减的权值量、随xj与xj′距离增加而单调递减的权值量,Sii′=exp(-||xi-xi′||2),Sjj′=exp(-||xj-xj′||2);
步骤2.1.2:采用修改聚类假设,根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量,建立SSCCM模型如下式所示;
Figure FDA0003032385210000021
其中,f表示决策函数;vk(xn)为样本xn的标签成员资格函数v(xn)的第k个元素,表示样本xn属于第k类的可能性;对于标记样本xi,其标签成员资格函数v(xi)为定值,如果标记样本xi属于第k类,则vk(xi)=1;其余元素为0;f(xn)表示样本xn的函数决策值;rk表示类别编码向量,C个类的编码矩阵为
Figure FDA0003032385210000022
rk的第k个元素为1,其余元素为0;当标记样本xi属于第k类时,令yi=rk,即标签与类编码都是C维向量,且yi的第k个元素为1,其余元素为0;
Figure FDA0003032385210000023
表示样本xn的邻域加权平均值的函数决策值;λ和λs是正则化参数,b是标签成员资格的加权指数;
步骤2.1.3:为了找出早期故障数据,采用二分类方式,用以区分正常与故障数据,令公式(1)中的类别总数C=2;
步骤2.1.4:在再生希尔伯特空间,采用(f,v)交替迭代的方法,求解SSCCM模型,得到决策函数f和标签成员资格函数v;具体方法为:
每个样本xn的在核空间的邻域加权平均值被定义为
Figure FDA0003032385210000024
通过表达定理,决策函数形式变换为
Figure FDA0003032385210000025
每个βn∈R2×1,所以解的形式如下式所示;
Figure FDA0003032385210000026
其中,β=[β12,...,βN]∈R2×N,为表达定理的系数向量;Y表示标签数据的标签向量yi构成的矩阵,K表示所有样本的核矩阵,
Figure FDA0003032385210000027
Figure FDA0003032385210000028
Figure FDA0003032385210000029
Figure FDA0003032385210000031
Iu是nu×nu的单位矩阵;
Figure FDA0003032385210000032
Figure FDA0003032385210000033
表示未标记数据的类标签成员概率值,
Figure FDA0003032385210000034
是一个对角矩阵,其对角元素是V的按行排列的所有元素的平方值;
对于固定的决策函数f(x),SSCCM问题将变为对标签成员资格函数求解问题,如下式所示;
Figure FDA0003032385210000035
求解上式得到任意样本x的第k个标签成员资格函数为:
Figure FDA0003032385210000036
步骤2.2:根据决策函数f和标签成员资格函数v找出早期故障数据,使用如下互补的两种方法进行判定:
(1)对于处于决策边界附近的样本x,检验其决策函数f(x)与标签成员资格函数v(x)的一致性,如果两者不一致,则判断x为早期故障点;
(2)对于处于决策边界附近的样本x,判定两侧的标签成员资格函数v1(x)与v2(x)之差是否小于标签成员函数的选择系数ε,即|v1(x)-v2(x)|<ε,0≤ε≤1;
对于上述两种方法判定出的相同的早期故障点数据,取其中之一,综合得到所有的早期故障数据;
步骤3:将步骤2得到的早期故障数据重新作为未标记数据
Figure FDA0003032385210000037
数据个数为m;将步骤1中的标记数据和步骤2中已经明确划分类别的数据重新作为标记数据
Figure FDA0003032385210000038
标签值矩阵为
Figure FDA0003032385210000039
yl为第l个标记数据的标签值,Y′∈Rr,数据个数为M;考虑早期故障数据的变化信息,并基于修改的聚类假设,建立修改聚类假设的半监督KPCA故障检测模型,进行第二次分类,找到早期故障数据中偏向主元的分界线fD;修改聚类假设的半监督KPCA故障检测模型如式(6)所示;
Figure FDA0003032385210000041
其中,Y0与Y1是新标记的正常与故障两类数据的标签值,与新的标记数据标签值应一致;v0与v1分别表示正常和故障两类标签成员资格概率值,λl和λu是新的标记数据与新的未标记数据的权衡参数;s是方差约束控制参数;
步骤4:对冶炼工业过程进行在线故障检测与诊断;
将新采集的多媒体流数据按步骤1采用的方法进行标准化处理,得到新样本xnew,利用步骤3得到的二次分界线fD,判定xnew的类别,如果判定为故障类,则认为该冶炼工业过程发生故障;否则,继续步骤4处理下一个新样本信息。
2.根据权利要求1所述的基于修改聚类半监督核主元分析的早期故障检测方法,其特征在于:所述步骤3中进行第二次分类,找到早期故障数据中偏向主元的分界线fD的方法为:在对(f,v)求解的过程中,采用(f,v)交替迭代的方法,每一步都得到闭合解,具体步骤为:
步骤3.1:根据表达定理,将公式(6)中的目标函数变换为下式:
Figure FDA0003032385210000042
其中,t0,t1∈Rm分别是m维列向量,t0内的所有元素值均为Y0,t1内的所有元素值均为Y1,K表示所有数据的核矩阵,KM表示K中取标记数据的M行,Km表示K中取未标记数据m行,αD为表达定理的系数向量,采用αD的投影算子,迫使αD投影到之前所有解的零空间内,令A=[α1,...,αD-1]是之前所有解构成的矩阵,之后通过奇异值分解使S=Null(KAATK)作为KA零空间的N×(N-n+1)的正交基;通过投影SαD,得到N-n+1维问题;
Figure FDA0003032385210000051
均为m维对角矩阵,其对角元素分别是v0(xu)、v1(xu)的平方值,其中u=1,...,m;c表示的是拉格朗日算子;ED为m维方阵,其中每一元素的值为
Figure FDA0003032385210000052
步骤3.2:令L′偏导数为零,
Figure FDA0003032385210000053
求解式(7)并通过耦合形式变换得到:
Figure FDA0003032385210000054
其中,
Figure FDA0003032385210000055
P=ST(Km TKm-Km TEDKm)S,
Figure FDA0003032385210000056
步骤3.3:通过求解下式所示的广义特征值问题,得到式(12)中的c,由此便得到αD
Figure FDA0003032385210000057
步骤3.4:对于一个固定的决策函数,其标签成员资格函数求解将变为下式:
Figure FDA0003032385210000058
令L″对v0(xu)和v1(xu)求偏导数并等于零,即
Figure FDA0003032385210000059
Figure FDA00030323852100000510
又由于式(6)中约束的第一项v0(xu)+v1(xu)=1,则得到
Figure FDA00030323852100000511
Figure FDA00030323852100000512
在求取决策函数时,c<δ,δ是Gx=δPx的最小广义特征值,由于αD TD在c∈[-∞,δ) 是严格递增的,因此当满足αD TD-s2=0时,解是唯一的;通过Gx=δPx确定控制参数s的上界,即当c=δ时;
通过以上的求解,得到对于早期故障数据二次分类所得的分界线fD
CN201711324889.9A 2017-12-13 2017-12-13 基于修改聚类半监督核主元分析的早期故障检测方法 Active CN108182302B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711324889.9A CN108182302B (zh) 2017-12-13 2017-12-13 基于修改聚类半监督核主元分析的早期故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711324889.9A CN108182302B (zh) 2017-12-13 2017-12-13 基于修改聚类半监督核主元分析的早期故障检测方法

Publications (2)

Publication Number Publication Date
CN108182302A CN108182302A (zh) 2018-06-19
CN108182302B true CN108182302B (zh) 2021-06-22

Family

ID=62546122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711324889.9A Active CN108182302B (zh) 2017-12-13 2017-12-13 基于修改聚类半监督核主元分析的早期故障检测方法

Country Status (1)

Country Link
CN (1) CN108182302B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113237888B (zh) * 2021-05-21 2022-06-14 哈尔滨工业大学 大口径光学元件损伤点在线与离线暗场图像匹配方法
CN113640607B (zh) * 2021-08-18 2023-02-28 江苏科技大学 一种针对高速列车逆变电路及电机的早期故障诊断方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104914847A (zh) * 2015-04-09 2015-09-16 东北大学 基于方向核偏最小二乘的工业过程故障诊断方法
CN106250578A (zh) * 2016-06-05 2016-12-21 乌鲁木齐职业大学 煤矿瓦斯检测方法
CN106384122A (zh) * 2016-09-05 2017-02-08 江苏科技大学 一种基于改进cs‑lssvm的设备故障模式识别方法
CN106596900A (zh) * 2016-12-13 2017-04-26 贵州电网有限责任公司电力科学研究院 一种基于改进图的半监督分类的变压器故障诊断方法
CN106777606A (zh) * 2016-12-02 2017-05-31 上海电机学院 一种风电机组齿轮箱故障预测诊断算法
CN107065828A (zh) * 2017-03-24 2017-08-18 东北大学 基于知识数据的半监督核判别分析故障诊断方法
CN107092923A (zh) * 2017-03-22 2017-08-25 东北大学 基于改进监督核局部线性嵌入法的电熔镁炉过程监测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2928912A1 (en) * 2012-12-05 2015-10-14 Merz Pharma GmbH & Co. KGaA Novel recombinant clostridial neurotoxins with enhanced membrane localization
CN107153748A (zh) * 2017-06-07 2017-09-12 北京信息科技大学 基于加权核主元分析(wkpca)的回转窑故障诊断方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104914847A (zh) * 2015-04-09 2015-09-16 东北大学 基于方向核偏最小二乘的工业过程故障诊断方法
CN106250578A (zh) * 2016-06-05 2016-12-21 乌鲁木齐职业大学 煤矿瓦斯检测方法
CN106384122A (zh) * 2016-09-05 2017-02-08 江苏科技大学 一种基于改进cs‑lssvm的设备故障模式识别方法
CN106777606A (zh) * 2016-12-02 2017-05-31 上海电机学院 一种风电机组齿轮箱故障预测诊断算法
CN106596900A (zh) * 2016-12-13 2017-04-26 贵州电网有限责任公司电力科学研究院 一种基于改进图的半监督分类的变压器故障诊断方法
CN107092923A (zh) * 2017-03-22 2017-08-25 东北大学 基于改进监督核局部线性嵌入法的电熔镁炉过程监测方法
CN107065828A (zh) * 2017-03-24 2017-08-18 东北大学 基于知识数据的半监督核判别分析故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Decentralized Fault Diagnosis of Large-scale Processes Using Multiblock Kernel Principal Component Analysis;ZHANG Ying-Wei and so on;《ACTA AUTOMATICA SINICA》;20100430;第36卷(第4期);第593-597页 *
Modeling and monitoring of nonlinear multi-mode processes based on similarity measure-KPCA;WANG Xiao-gang and so on;《Journal of Central South University》;20170331;第665-674页 *
基于特征样本核主元分析的TE过程;薄翠梅等;《化工学报》;20080731;第59卷(第7期);第1783-1789页 *

Also Published As

Publication number Publication date
CN108182302A (zh) 2018-06-19

Similar Documents

Publication Publication Date Title
Chen et al. A just-in-time-learning-aided canonical correlation analysis method for multimode process monitoring and fault detection
CN108182445B (zh) 基于大数据智能核独立元分析的过程故障识别方法
Zhong et al. Semi-supervised Fisher discriminant analysis model for fault classification in industrial processes
CN109740676B (zh) 基于相似目标的物体检测迁移方法
CN113657425B (zh) 基于多尺度与跨模态注意力机制的多标签图像分类方法
Cao et al. Segment any anomaly without training via hybrid prompt regularization
CN110458022B (zh) 一种基于域适应的可自主学习目标检测方法
He et al. Fault diagnosis using improved discrimination locality preserving projections integrated with sparse autoencoder
CN107918379A (zh) 基于图半监督代价敏感的工业大数据早期故障检测方法
Fu et al. Low-rank joint embedding and its application for robust process monitoring
CN108182302B (zh) 基于修改聚类半监督核主元分析的早期故障检测方法
Cao et al. Multimodal process monitoring based on variational Bayesian PCA and Kullback-Leibler divergence between mixture models
Yang et al. An intelligent singular value diagnostic method for concrete dam deformation monitoring
CN111191033B (zh) 一种基于分类效用的开集分类方法
CN115221233A (zh) 基于深度学习的变电站多类带电检测数据异常检测方法
CN109324595B (zh) 一种基于增量pca的工业监测数据分类方法
CN109901553B (zh) 基于多视角的异构工业大数据协同建模过程故障监测方法
Huang et al. Fault classification of industrial processes based on generalized zero-shot learning
CN116188445A (zh) 一种产品表面缺陷的检测定位方法、装置及终端设备
CN112182205A (zh) 一种利用文字识别识别电气设备中监测数据的处理方法
Ye et al. A Novel Self-Supervised Learning-Based Anomalous Node Detection Method Based on an Autoencoder for Wireless Sensor Networks
CN116383747A (zh) 基于多时间尺度深度卷积生成对抗网络的异常检测方法
Ma et al. Channel max pooling layer for fine-grained vehicle classification
Liang et al. KNN_SVM based information transmission method for renewable energy power generation
CN114243063A (zh) 一种固体氧化物燃料电池系统故障定位方法和诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant