CN108181891A - 基于智能核主元分析的工业大数据故障诊断方法 - Google Patents

基于智能核主元分析的工业大数据故障诊断方法 Download PDF

Info

Publication number
CN108181891A
CN108181891A CN201711325147.8A CN201711325147A CN108181891A CN 108181891 A CN108181891 A CN 108181891A CN 201711325147 A CN201711325147 A CN 201711325147A CN 108181891 A CN108181891 A CN 108181891A
Authority
CN
China
Prior art keywords
data
sorter model
moment
matrix
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711325147.8A
Other languages
English (en)
Other versions
CN108181891B (zh
Inventor
张颖伟
霍晓斌
贾润达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201711325147.8A priority Critical patent/CN108181891B/zh
Publication of CN108181891A publication Critical patent/CN108181891A/zh
Application granted granted Critical
Publication of CN108181891B publication Critical patent/CN108181891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • G05B23/0245Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a qualitative model, e.g. rule based; if-then decisions

Abstract

本发明提供一种基于智能核主元分析的工业大数据故障诊断方法,涉及故障监测与诊断技术领域。该方法通过采集电熔镁炉熔炼过程中的图像、电流等数据,异构建模大数据池,对数据池中的样本进行智能核主元分析,得到分类器判别矩阵的最优解,建立初始监测分类器模型,采用平均即使风险逼近批量学习的批量风险的方法更新初始监测分类器模型,由更新后的监测分类器对新采集到的异构后的数据进行分类标记,求得结果图,通过结果图即可判断新采集的数据是否发生故障。本发明建立了生产流程的物理化学变量和图像声音视频的大数据池,实现结合多个信息源的互补信息,发现数据源之间的关联关系,以达到降低误报警率、提高故障检测的准确性的目的。

Description

基于智能核主元分析的工业大数据故障诊断方法
技术领域
本发明涉及故障监测与诊断技术领域,尤其涉及一种基于智能核主元分析的工业大数据故障诊断方法。
背景技术
现代社会的发展对材料的性能及产量提出了越来越高的要求,近年来,现代企业中生产设备趋于大型化、连续化、高速化和自动化,设备的结构与组成十分复杂,生产规模非常庞大,各部门之间的联系也特别密切。实际的生产过程有着不同的过程所具有的特征,应选用不同的故障监测方法,这样才能有效地检测到故障。超高温电熔镁冶炼流程是一个复杂的时变非线性工业过程。
核主元分析(KPCA)方法,核独立成分分析(kernel principal componentanalysis,KPCA)是一种通过KPCA方法的基本思想是通过某种隐式方式将输入空间映射到某个高维空间(常称为特征空间),并且在特征空间中实现PCA,KPCA是在高维特征空间中执行PCA,所以不用求解非线性优化问题,并且与其它非线性方法相比,在建模之前它不需要指定主元数目,但是传统KPCA是一种基于数据协方差结构的方法,主元模型一旦建立就是时不变的,导致之后采集的数据造成浪费,并且忽略了数据间的局部信息,造成数据的严重混叠,有可能引起误报警,所以需要提出一种可行方法来解决问题。并且在已有的研究成果中在数据的利用上把物理化学变量数据和图像声音视频数据分开建模,分别诊断,其做法忽视了大数据之间的必然联系,失去了大数据的固有优势。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于智能核主元分析的工业大数据故障诊断方法,建立了生产流程的物理化学变量和图像声音视频的大数据池,实现结合多个信息源的互补信息,发现数据源之间的关联关系,以达到降低误报警率的目的。
为解决上述技术问题,本发明所采取的技术方案是:一种基于智能核主元分析的工业大数据故障诊断方法,包括以下步骤:
步骤1:在电熔镁炉熔炼的工业过程中,采集炉面图像和同一时间的电熔镁炉三个电极的电流;
步骤2:对采集的数据进行标准化处理,对其中部分数据进行标记,异构建模大数据池;具体方法为:
对每一幅图片分别计算0°,45°,90°,135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算对比度、相关性、能量、同质性及熵五个特征值,则每一幅图片均得到一个20维的图片数据向量[x1,x2,…,x20];采集同一时间的电熔镁炉的三个电极的电流数据为[x21,x22,x23];由图片数据和电流数据异构建模的最终向量为[x1,x2,…,x20,x21,x22,x23];
采集的数据样本的总数为N,其中的1个数据由人工先验知识进行标记,u个样本不进行标记,N=1+u,标记数据中包括正常数据和异常数据,由此异构建模大数据池X=[X1,X2,…,Xl,Xl+1,Xl+2,…,Xl+u];
步骤3:用步骤2异构建模的大数据池,建立初始监测分类器模型;
基于表示定理,对如下的优化问题进行求解,得到初始监测分类器模型;
St:eTU(Kα)≥s2i
其中,L(Kα,y)=1/(1+exp(-yKα)),U(Kα)=(Kα)2,α=(α1,α2,...,αn)为表示定理的系数矩阵,n为输入数据的维数,n=23,e为全为1的行向量,K为核矩阵,y为已标记数据的标签,参数Cl、Cu、s和εi为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自已选择;
上述优化问题的最优解即为初始监测分类器模型的系数矩阵,通过表示定理表示的最优系数矩阵为得到的初始监测分类器模型表示为:其中,N为输入数据的个数,Xj为第j个输入数据,αj为系数矩阵的第j列向量,k(Xj,x)表示Xj和x的内积,其中x为当前输入的待标记数据;
步骤4:采用平均即使风险逼近批量学习的批量风险的方法更新步骤3得到的初始监测分类器模型;分类器的更新表示为:
其中,L(ft(x),yt)=1/(1+exp(-ytft(x))),其中的ft(x)表示t刻的监测分类器模型,t表示工业过程的某一时刻;为希尔伯特核再生空间;R(f)为平均即使风险函数;Rt(f)为t时刻的风险函数;yt为由数据点类型构成的列向量;参数T为数据点个数;参数为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自己选择;
步骤5:由更新后的监测分类器对新采集到的异构后的数据进行分类标记,求得结果图,通过结果图即可判断新采集的数据是否发生故障,当该点被标记为故障时,认为有故障发生,反之,则电熔镁炉运转正常;检测后返回步骤3对分类器进行更新。
所述步骤3中建立初始的监测模型的具体方法为:
首先令Q=[α1,α2,...,αn-1],G是通过奇异值分解求解KA的零空间求得N*(N-n+1)维的标准正交基,G=Null(KQQTKT);通过Gαn投影αn,将步骤3中的所述优化问题变形为:
St:eTU(KGα)≥s2i
将上两式简化后得到:
minα∈RTGTKGα+Cl||KOGα-v||2
St:(αTGT(KK-KENK)Gα)=s2
其中,v∈R0是由y的0个指数组成的子向量,同样的K0为由K的0个指数组成的子矩阵,EN为N×N的方阵,其元素是
根据拉格朗日乘子法,将上式的优化问题写成下式:
L(f,λ)=αTGTKGα+Cl||KOGα-v||2+λ((αTGT(KK-KENK)Gα)-s2)
其中λ为拉格朗日乘子;
对上式求导并令其等于零得到:
Cα=-λPα+b
αTPα=s2
其中,C=GT(K+ClGTKO TKOGα)G,b=ClGTKO Tv,P=GT(KK-KENK)G;
将λ求解转换为求解最小广义特征值问题,如下式所示:
其中,ζ为矩阵相对于矩阵的特征值,为属于ζ的特征向量;
由此求解出该优化问题的最优解为α*=(C-ζP)-1b;
g=KOα
zi=1/(1+exp(-vigi))
ri=zi(1-zi)
则得到C和b的更新公式,分别为C=GT(K+ClGTKO TRKOGα)G,b=ClGTKO TRs,其中R是对角元素为Rii=ri的矩阵;参数Cl=10,Cu=0.01,s=0.1;
由牛顿-拉夫森迭代的方法求解分类器模型的最优解,直到正则项εi满足用户设定值或达到最大迭代次数。
所述步骤4中更新分类器的具体方法为:
由梯度下降法得到其中ρt为步长;如果在c时刻到t时刻监测分类器模型表示为其中,m与c的差值为数据池大小,用户根据实际需求进行选择;由梯度下降法更新得到t+1时刻监测分类器模型为其中为t+1时刻真实监测分类器模型的系数矩阵中第i列的列向量,另外预测t+1时刻其中为t+1时刻预测监测分类器模型的系数矩阵中第i列的列向量,令t+1时刻的两个监测分类器模型相等,得到如下等式:
再将新采集到的数据点替换原数据集中停留时间最长的数据点,由此求解ft+1为:
其中为系数矩阵αt+1中第i列的列向量,为系数矩阵中第i列的列向量;
由此得到t+1时刻监测分类器模型更新后的系数矩阵为αt+1=A-1αtB,其中A=(k(x1,x),...,k(xm+1,x)),B=(k(xc,x),...,k(xm+1,x));δt=0.5。
采用上述技术方案所产生的有益效果在于:本发明提供的基于智能核主元分析的工业大数据故障诊断方法,解决数据的非线性和时变性问题,通过平均即使风险逼近批量学习的批量风险的方法对监测分类器模型进行更新,不仅能大大降低误报警,还能提高故障检测的准确性。
附图说明
图1为本发明实施例提供的电熔镁冶炼工艺流程示意图;
图2为本发明实施例提供的基于智能核主元分析的工业大数据故障诊断方法流程图;
图3为本发明实施例提供的采用基于智能核主元分析的工业大数据故障诊断方法对第一个时间点采集到的数据进行分类判断的结果示意图;
图4为本发明实施例提供的采用基于智能核主元分析的工业大数据故障诊断方法对第二个时间点采集到的数据进行分类判断的结果示意图;
图5为本发明实施例提供的采用基于智能核主元分析的工业大数据故障诊断方法对第一个时间点采集到的数据分类判断的准确性结果示意图;
图6为本发明实施例提供的采用基于方差损失函数最小的核主元分析法对第一个时间点采集到的数据分类判断的准确性结果示意图;
图7为本发明实施例提供的采用基于智能核主元分析的工业大数据故障诊断方法对第二个时间点采集到的数据分类判断的准确性结果示意图;
图8为本发明实施例提供的采用基于方差损失函数最小的核主元分析法对第二个时间点采集到的数据分类判断的准确性结果示意图。
图中:1、变压器;2、电路短网;3、电极升降装置;4、电极;5、炉壳;6、车体;7、电弧、8、炉料。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
电熔镁炉实际上是一种埋弧炉,属于矿热炉而不是电弧炉,其主要以熔融状态下电流通过物料所产生的物料电阻热为主要热源,同时伴有电弧热,它的热量集中,能有效的将物料加热到熔点2800℃以上,有利于熔炼电熔镁砂。电熔镁炉的设备主要包括:变压器、电路短网、电极、电极升降装置以及炉体等。炉边设有控制室,可控制电极升降。电熔镁炉的基本工作原理示意如图1。
一种基于智能核主元分析的工业大数据故障诊断方法,如图2所示,具体方法如下。
步骤1:在电熔镁炉熔炼的工业过程,采集炉面图像和同一时间的电熔镁炉三个电极的电流。
步骤2:对采集的数据进行标准化处理,对其中部分数据进行标记,异构建模大数据池,具体方法为:
对每一幅图片分别计算0°,45°,90°,135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算对比度、相关性、能量、同质性及熵五个特征值,则每一幅图片均得到一个20维的图片数据向量[x1,x2,…,x20];采集同一时间的电熔镁炉的三个电极的电流数据为[x21,x22,x23];由图片数据和电流数据异构建模的最终向量为[x1,x2,…,x20,x21,x22,x23];
采集的数据样本的总数为N,其中的1个数据由人工先验知识进行标记,u个样本不进行标记,N=1+u,标记数据中包括正常数据和异常数据,由此异构建模大数据池X=[X1,X2,…,Xl,Xl+1,Xl+2,…,Xl+u]。
由于超高温电熔镁冶炼流程的特殊性与复杂性,数据的采集是极其困难的,但图像的信息相对容易获取,因此由图像信息对镁炉的工业过程进行监测是极其必要的。为了提高过程监测的准确性,将采集到的图像信息进行处理得到图像特征数据,并与同一时刻采集到电流数据进行数据异构得到数据池。本实施例中,数据池采集了两组不同时刻的数据,第一组数据由40个训练样本及100测试样本构成,第二组数据由40个训练数据及90训练样本构成,每个样本点为23维数据点。分别随机选取两组不同时刻的数据中的八组数据如表1和表2所示。将两组数据采集到的40的训练样本中的20个数据由人工先验知识进行标记,20个标记样本中10为正常数据,其余10个为异常数据,采集到的40的训练样本其余20个样本不进行标记,由此异构建模大数据池。
表1第一组数据中的八组数据
表2第二组数据中的八组数据
步骤3:用步骤2异构建模的大数据池,建立初始监测分类器模型。
基于表示定理,对如下的优化问题进行求解,得到初始监测分类器模型;
St:eTU(Kα)≥s2i
其中,L(Kα,y)=1/(1+exp(-yKα)),U(Kα)=(Kα)2,α=(α1,α2,...,αn)为表示定理的系数矩阵,n为输入数据的维数,n=23,e为全为1的行向量,K为核矩阵,y为已标记数据的标签,参数Cl、Cii、s和εi为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自已选择;
首先令Q=[α1,α2,...,αn-1],G是通过奇异值分解求解KA的零空间求得N*(N-n+1)维的标准正交基,G=Null(KQQTKT);通过Gαn投影αn,将上述优化问题变形为:
St:eTU(KGα)≥s2i
将上两式简化后得到:
minα∈RTGTKGα+Cl||KOGα-v||2
St:(αTGT(KK-KENK)Gα)=s2
其中,v∈RO是由y的0个指数组成的子向量,同样的K0为由K的0个指数组成的子矩阵,EN为N×N的方阵,其元素是
根据拉格朗日乘子法,将上式的优化问题写成下式:
L(f,λ)=αTGTKGα+Cl||KOGα-v||2+λ((αTGT(KK-KENK)Gα)-s2)
其中λ为拉格朗日乘子;
对上式求导并令其等于零得到:
Cα=-λPα+b
αTPα=s2
其中,C=GT(K+ClGTKO TKOGα)G,b=ClGTKOTv,P=GT(KK-KENK)G;
将λ求解转换为求解最小广义特征值问题,如下式所示:
其中,ζ为矩阵相对于矩阵的特征值,为属于ζ的特征向量;
由此求解出该优化问题的最优解为α*=(C-ζP)-1b;
g=KOα
zi=1/(1+exp(-vigi))
ri=zi(1-zi)
则得到C和b的更新公式,分别为C=GT(K+ClGTKO TRKOGα)G,b=ClGTKO TRs,其中R是对角元素为Rii=ri的矩阵;参数Cl=10,Cu=0.01,s=0.1;
由牛顿-拉夫森迭代的方法求解分类器模型的最优解,直到正则项εi满足用户设定值或达到最大迭代次数;
求解得到的初始监测分类器模型,表示为:其中,为最优解通过表示定理表示的最优系数矩阵,N为输入数据的个数,Xj为第j个输入数据,αj为系数矩阵的第j列向量,k(Xj,x)表示Xj和x的内积,其中x为当前输入的待标记数据。
本实施例中,求解到得两组数据初始最优解α*分别如表3和表4所示。
表3第一组数据初始最优解
-0.0050 -0.0126 0.0166 -0.0067 -0.078 0.0070 0.0189 -0.0911 -0.0050 -0.0220
-2.8782 0.2846 -0.0376 0.6596 0.7556 -0.1068 1.0340 0.2049 -0.8628 0.7220
0.0022 0.0023 0.0022 0.0022 0.0022 -1.9405e-04 0.0021 0.0022 0.0039 0.0022
0.0022 0.0022 0.0021 0.0022 0.0022 0.0022 0.0022 0.0022 0.0021 0.0020
-0.0107 -0.2339 0.3369 0.5330 0.2720 -0.0403 0.6865 -0.3495 0.2119 0.0097
-0.3852 -0.0111 -0.0338 -0.9079 -0.5631 0.0205 -0.0052 0.0181 0.1106 0.0056
0.0857 0.0513 0.1046 0.2545 -0.0391 0.0238 0.0127 -0.2292 0.0019 -0.2911
0.0022 0.0022 0.0020 0.0022 0.0022 0.0022 0.0023 0.0022 0.0022 0.0022
0.2077 0.0552 0.3232 -0.0010 -0.0190 0.0015 0.0016 -0.0914 0.0054 -0.0119
0.0127 -0.0041 0.1217 -0.0027 -0.0042 -0.6963 1.5946 -0.0048 -0.1502 -0.0017
0.0017 -2.3700e-04 -0.0804 -3.1193e-04 0.9544 1.5244 0.0061 -0.0732 -0.0031 -0.0060
10.3712 -0.2940 -0.1248 0.3855 0.0225 -0.0025 -0.1729 2.3530e-04 -0.0074 0.0015
0.0013 -0.0678 -0.0755 0.0012 2.2221 0.0847 0.0567 -0.0084 0.0218 0.0062
-0.0127 -0.0026 4.6239 4.5709e-04 0.115 0.0611 -1.4206 -0.0510 -0.1052 -0.4206
表4第二组数据初始最优解
-1.1060 1.7242 -0.5092 0.1875 -0.4473 3.2262 0.7609 -1.8703 0.3855 -0.3338
-1.3761 0.3185 -0.0886 0.1652 -0.7140 -0.9261 -2.5309 1.6995 0.9770 4.2862
-0.5814 0.1917 -0.9044 -0.3501 1.5349 -1.4365 -0.8022 -0.5585 1.8804 0.2185
-0.1649 -1.9975 1.8324 2.1737 -4.9913 0.5618 0.7189 3.5820 -0.8726 -0.3088
-0.0068 -1.7276 1.8734 -0.5992 -4.1332 -0.4016 -0.1888 0.8533 1.9636 -1.4593
-2.227 5.7592 -1.7200 -1.4956 3.0180 2.7416 -1.2624 4.4352 -0.9096 1.9158
2.8630 -1.6957 0.9196 -1.4181 -0.6590 0.1914 0.7009 1.0320 -1.7529 -5.0384
0.0024 -2.5552 0.5795 2.0679 -0.7783 0.0246 -1.0776 -0.8884 0.2166 0.9792
-0.6096 2.6410 2.4510 -0.1989 0.7208 0.0197 1.1692 0.8648 -2.4410 0.2781
-0.5762 -0.7948 1.2950 -0.0732 1.5535 -4.4814 -0.1185 -1.5644 0.9743 0.9654
3.4395 -3.0493 1.0254 -1.2513 -0.0844 0.5600 -2.1441 0.3108 -0.7688 -0.5146
-0.0647 0.2022 -1.7423 1.7577 0.3763 1.5316 -0.9197 -0.0640 -2.7975 0.8941
-1.9296 -0.0920 -1.5723 -4.3100 4.3897 0.4255 4.9332 -0.7765 -0.7111 -2.4405
步骤4:采用平均即使风险逼近批量学习的批量风险的方法更新步骤3得到的初始监测分类器模型。
分类器的更新表示为:
其中,L(ft(x),yt)=1/(1+exp(-ytft(x))),其中的ft(x)表示t刻的监测分类器模型,中的f是代表f(x),t表示工业过程的某一时刻,为希尔伯特核再生空间,R(f)为平均即使风险函数,Rt(f)为t时刻的风险函数,yt为由数据点类型构成的列向量,参数T为数据点个数,参数为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自己选择;
由梯度下降法得到其中ρt为步长;如果在c时刻到t时刻监测分类器模型表示为其中,m与c的差值为数据池大小,用户根据实际需求进行选择,本实施例中两组数据选取该值分别为140和130,由梯度下降法更新得到t+1时刻监测分类器模型为其中为t+1时刻真实监测分类器模型的系数矩阵中第i列的列向量,另外预测t+1时刻其中为t+1时刻预测监测分类器模型的系数矩阵中第i列的列向量,令t+1时刻的两个监测分类器模型和ft+1相等,得到如下等式:
再将新采集到的数据点替换原数据集中停留时间最长的数据点,由此求解ft+1
其中为系数矩阵αt+1中第i列的列向量,为系数矩阵中第i列的列向量;
由此得到t+1时刻监测分类器模型更新后的系数矩阵为αt+1=A-1αtB.其中A=(k(x1,x),...,k(xm+1,x)),B=(k(xc,x),...,k(xm+1,x));δt=0.5。
对于数据池的处理方式为在数据池中停留时间最久的样本点由新采集到的样本点代替形成新的建模数据,求解下一时刻监测分类器模型的系数矩阵αt+1。本实施例中,某时刻更新后的监测分类器模型的系数矩阵α的数据如表5和表6所示。
表5第一组某时刻监测分类器模型α
-0.0061 -0.0099 0.0230 -0.0055 -0.0800 0.0068 0.0201 -0.0899 -0.0048 -0.0218
-2.5683 0.2763 -0.0485 0.5522 0.6565 -0.0998 0.9980 0.1989 -0.8555 0.6989
0.0046 0.0024 0.0023 0.0043 0.0043 -1.8200e-04 0.0040 0.0043 0.0043 0.0043
0.0046 0.0023 0.0022 0.0043 0.0043 0.0043 0.0043 0.0043 0.0043 0.0031
-0.0200 -0.3001 0.4399 0.6001 0.2830 -0.0501 0.6925 -0.3323 0.1989 0.0101
-0.4925 -0.0203 -0.0238 -1.0007 -0.6531 0.0189 -0.0056 0.0221 0.0989 0.0066
0.0722 0.0499 0.9964 0.3040 -0.0400 0.0199 0.0223 -0.2300 0.0023 -0.3001
0.0046 0.0024 0.0021 0.0043 0.0043 0.0043 0.0046 0.0043 0.0043 0.0043
0.1986 0.0605 0.2333 -0.0015 -0.0201 0.0034 0.0032 -0.1041 0.0060 -0.0201
0.0200 -0.0039 0.2172 -0.0032 -0.0066 -0.7001 1.6001 -0.0037 -0.1821 -0.0023
0.0016 -1.9800e-04 -0.1000 -3.0011e-04 1.001 1.4928 0.0078 -0.0699 -0.0034 -0.0068
9.4233 -0.3100 -0.0997 0.4022 0.0250 -0.0075 -0.3289 2.3330e-04 -0.0088 0.0021
0.0013 -0.0779 -0.0688 0.0016 2.3333 0.0799 0.0689 -0.0077 0.0199 0.0059
-0.0100 -0.0019 5.0322 4.6667e-04 0.0988 0.0582 -1.3996 -0.0499 -0.0993 -0.3925
表6第二组某时刻监测分类器模型α
-0.9880 1.6630 -0.5092 0.2687 -0.4001 3.5657 0.80866 -1.5868 0.0011 -0.8988
-1.4038 0.2989 -0.0808 0.2232 -0.6544 -0.8889 -2.0382 1.8963 0.4800 3.0010
-0.6006 0.2000 -0.8086 -0.4001 1.2333 -1.3654 -0.5564 -0.2358 2.3666 0.0158
-0.1700 -2.002 2.003 1.9826 -4.800 0.6728 1.0010 3.9998 -0.2679 -0.9898
-0.0100 -1.8868 1.9989 -0.6700 -4.002 -0.3998 -0.1678 0.8848 2.6894 -2.001
-2.0370 6.3263 -1.6980 -1.5606 3.2111 2.7682 -1.0001 4.9369 -0.0092 1.8620
2.8888 -1.777 0.9696 -1.4328 -0.5556 0.1949 0.8078 1.5358 -1.0890 -5.0002
0.0036 -2.4322 0.6068 1.9898 -0.6848 0.0328 -1.2365 -0.0012 0.8988 1.2323
-0.6969 2.5989 2.5555 -0.1998 0.7562 0.0207 1.4454 1.4360 -2.0010 0.8868
-0.5888 -0.9884 1.2950 -0.0663 1.6565 -4.2346 -0.1005 -1.0210 1.0023 1.0303
3.2323 -3.0003 0.9889 -1.1012 -0.0716 0.5872 -1.4998 0.4039 -0.3258 -1.6898
-0.0745 0.3021 -1.6363 1.8868 0.4823 1.6667 -0.5096 -0.0012 -2.4321 1.4686
-2.0010 -0.1000 -1.6689 -4.0211 4.4433 0.3686 5.2358 -0.5603 -0.6210 -3.6848
步骤5:由更新后的监测分类器对新采集到的异构后的数据进行分类标记,求得结果图,通过结果图即可判断新采集的数据是否发生故障,当该点被标记为故障时,认为有故障发生,反之,则电熔镁炉运转正常;检测后返回步骤3对分类器进行更新。
为了更直观的对数据进行投影作图分析,MDS(multidimensional scaling)多维尺度分析法对分类后的数据进行投影作图,本实施例中两组数据中十组投影后的数据分别如表7和表8所示。如图4、图5所示,为投影后的数据得到的实验仿真,从图中可以看出本实施例的方法(I-KPCA)对于这两组不同时刻的数据可以较好的进行区分。如图5、图6、图7、图8所示,为本实施例提供的方法(I-KPCA)与基于方差损失函数最小的核主元分析法(LS-KPCA)对同两组采集于不同时间的数据进行的准确率对比。
表7第一组投影后的数据
表8第二组投影后的数据
由表9准确率对比可以看到,由于引入了半监督与在线检测,I-KPCA对于分类的准确性有所提升。选取MDS进行投影的主要原因为该方法利用的是成对样本间相似性,目的是利用这个信息去构建合适的低维空间,使得样本在此空间的距离和在高维空间中的样本间的相似性尽可能的保持一致。
表9I-KPCA及LS-KPCA诊断准确率
通过上面的仿真实例,表明了本发明提供的基于智能核主元分析的工业大数据故障诊断方法的有效性,实现了对电熔镁炉工业流程的故障监测与诊断。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (3)

1.一种基于智能核主元分析的工业大数据故障诊断方法,其特征在于:包括以下步骤:
步骤1:在电熔镁炉熔炼的工业过程中,采集炉面图像和同一时间的电熔镁炉三个电极的电流;
步骤2:对采集的数据进行标准化处理,对其中部分数据进行标记,异构建模大数据池;具体方法为:
对每一幅图片分别计算0°,45°,90°,135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算对比度、相关性、能量、同质性及熵五个特征值,则每一幅图片均得到一个20维的图片数据向量[x1,x2,…,x20];采集同一时间的电熔镁炉的三个电极的电流数据为[x21,x22,x23];由图片数据和电流数据异构建模的最终向量为[x1,x2,…,x20,x21,x22,x23];
采集的数据样本的总数为N,其中的1个数据由人工先验知识进行标记,u个样本不进行标记,N=1+u,标记数据中包括正常数据和异常数据,由此异构建模大数据池X=[X1,X2,…,Xl,Xl+1,Xl+2,…,Xl+u];
步骤3:用步骤2异构建模的大数据池,建立初始监测分类器模型;
基于表示定理,对如下的优化问题进行求解,得到初始监测分类器模型;
St:eTU(Kα)≥s2i
其中,L(Kα,y)=1/(1+exp(-yKα)),U(Kα)=(Kα)2,α=(α1,α2,...,αn)为表示定理的系数矩阵,n为输入数据的维数,n=23,e为全为1的行向量,K为核矩阵,y为已标记数据的标签,参数Cl、Cu、s和εi为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自已选择;
上述优化问题的最优解即为初始监测分类器模型的系数矩阵,通过表示定理表示的最优系数矩阵为得到的初始监测分类器模型表示为:其中,N为输入数据的个数,Xj为第j个输入数据,αj为系数矩阵的第j列向量,k(Xj,x)表示Xj和x的内积,其中x为当前输入的待标记数据;
步骤4:采用平均即使风险逼近批量学习的批量风险的方法更新步骤3得到的初始监测分类器模型;分类器的更新表示为:
其中,L(ft(x),yt)=1/(1+exp(-ytft(x))),其中的ft(x)表示t时刻的监测分类器模型,t表示工业过程的某一时刻;为希尔伯特核再生空间;R(f)为平均即使风险函数;Rt(f)为t时刻的风险函数;yt为由数据点类型构成的列向量;参数T为数据点个数;参数为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自己选择;
步骤5:由更新后的监测分类器对新采集到的异构后的数据进行分类标记,求得结果图,通过结果图即可判断新采集的数据是否发生故障,当该点被标记为故障时,认为有故障发生,反之,则电熔镁炉运转正常;检测后返回步骤3对分类器进行更新。
2.根据权利要求1所述的基于智能核主元分析的工业大数据故障诊断方法,其特征在于:所述步骤3中建立初始的监测模型的具体方法为:
首先令Q=[α1,α2,...,αn-1],G是通过奇异值分解求解KA的零空间求得N*(N-n+1)维的标准正交基,G=Null(KQQTKT);通过Gαn投影αn,将步骤3中的所述优化问题变形为:
St:eTU(KGα)≥s2i
将上两式简化后得到:
St:(αTGT(KK-KENK)Gα)=s2
其中,v∈RO是由y的0个指数组成的子向量,同样的K0为由K的0个指数组成的子矩阵,EN为N×N的方阵,其元素是
根据拉格朗日乘子法,将上式的优化问题写成下式:
L(f,λ)=αTGTKGα+Cl||KOGα-v||2+λ((αTGT(KK-KENK)Gα)-s2)
其中λ为拉格朗日乘子;
对上式求导并令其等于零得到:
Cα=-λPα+b
αTPα=s2
其中,C=GT(K+ClGTKO TKOGα)G,b=ClGTKO Tv,P=GT(KK-KENK)G;
将λ求解转换为求解最小广义特征值问题,如下式所示:
其中,ζ为矩阵相对于矩阵的特征值,为属于ζ的特征向量;
由此求解出该优化问题的最优解为α*=(C-ζP)-1b;
g=KOα
zi=1/(1+exp(-vigi))
ri=zi(1-zi)
则得到C和b的更新公式,分别为C=GT(K+ClGTKO TRKOGα)G,b=ClGTKO TRs,其中R是对角元素为Rii=ri的矩阵;参数Cl=10,Cu=0.01,s=0.1;
由牛顿-拉夫森迭代的方法求解分类器模型的最优解,直到正则项εi满足用户设定值或达到最大迭代次数。
3.根据权利要求2所述的基于智能核主元分析的工业大数据故障诊断方法,其特征在于:所述步骤4中更新分类器的具体方法为:
由梯度下降法得到其中ρt为步长;如果在c时刻到t时刻监测分类器模型表示为其中,m与c的差值为数据池大小,用户根据实际需求进行选择;由梯度下降法更新得到t+1时刻监测分类器模型为其中为t+1时刻真实监测分类器模型的系数矩阵中第i列的列向量,另外预测t+1时刻其中为t+1时刻预测监测分类器模型的系数矩阵中第i列的列向量,令t+1时刻的两个监测分类器模型阳ft+1相等,得到如下等式:
再将新采集到的数据点替换原数据集中停留时间最长的数据点,由此求解ft+1为:
其中为系数矩阵αt+1中第i列的列向量,为系数矩阵和第i列的列向量;
由此得到t+1时刻监测分类器模型更新后的系数矩阵为αt+1=A-1αtB,其中A=(k(x1,x),...,k(xm+1,x)),B=(k(xc,x),...,k(xm+1,x));δt=0.5。
CN201711325147.8A 2017-12-13 2017-12-13 基于智能核主元分析的工业大数据故障诊断方法 Active CN108181891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711325147.8A CN108181891B (zh) 2017-12-13 2017-12-13 基于智能核主元分析的工业大数据故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711325147.8A CN108181891B (zh) 2017-12-13 2017-12-13 基于智能核主元分析的工业大数据故障诊断方法

Publications (2)

Publication Number Publication Date
CN108181891A true CN108181891A (zh) 2018-06-19
CN108181891B CN108181891B (zh) 2020-05-05

Family

ID=62546186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711325147.8A Active CN108181891B (zh) 2017-12-13 2017-12-13 基于智能核主元分析的工业大数据故障诊断方法

Country Status (1)

Country Link
CN (1) CN108181891B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885032A (zh) * 2019-03-13 2019-06-14 东北大学 基于邻域投影保持的异构数据协同建模工业故障检测方法
CN109901553A (zh) * 2019-03-13 2019-06-18 东北大学 基于多视角的异构工业大数据协同建模过程故障监测方法
CN109948688A (zh) * 2019-03-13 2019-06-28 东北大学 基于流形假设的多源工业异构大数据的故障诊断方法
CN109948503A (zh) * 2019-03-13 2019-06-28 东北大学 基于共享子空间多视角非负矩阵分解的工业故障检测方法
CN110045691A (zh) * 2019-03-13 2019-07-23 东北大学 一种多源异构大数据的多任务处理故障监测方法
CN112801313A (zh) * 2021-01-27 2021-05-14 西安重装配套技术服务有限公司 基于大数据技术综采工作面故障判定方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1682165A (zh) * 2002-09-30 2005-10-12 东京毅力科创株式会社 用于监视和控制半导体生产过程的方法和装置
WO2009013754A1 (en) * 2007-07-24 2009-01-29 Technion Research And Development Foundation Ltd. Chemically sensitive field effect transistors and use thereof in electronic nose devices
CN102566505A (zh) * 2012-02-27 2012-07-11 温州大学 一种数控机床的智能故障诊断方法
CN102681473A (zh) * 2012-04-01 2012-09-19 中南大学 一种基于纹理单元分布的硫浮选过程故障检测方法
CN104063631A (zh) * 2014-06-13 2014-09-24 周家锐 一种面向大数据的代谢组特征数据分析方法及其系统
CN104914807A (zh) * 2014-03-14 2015-09-16 费希尔-罗斯蒙特系统公司 在过程中确定过程元素和测量值的关联关系和定线
US20170356936A1 (en) * 2016-05-11 2017-12-14 Mcmaster University Enhanced system and method for conducting pca analysis on data signals

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1682165A (zh) * 2002-09-30 2005-10-12 东京毅力科创株式会社 用于监视和控制半导体生产过程的方法和装置
WO2009013754A1 (en) * 2007-07-24 2009-01-29 Technion Research And Development Foundation Ltd. Chemically sensitive field effect transistors and use thereof in electronic nose devices
CN102566505A (zh) * 2012-02-27 2012-07-11 温州大学 一种数控机床的智能故障诊断方法
CN102681473A (zh) * 2012-04-01 2012-09-19 中南大学 一种基于纹理单元分布的硫浮选过程故障检测方法
CN104914807A (zh) * 2014-03-14 2015-09-16 费希尔-罗斯蒙特系统公司 在过程中确定过程元素和测量值的关联关系和定线
CN104063631A (zh) * 2014-06-13 2014-09-24 周家锐 一种面向大数据的代谢组特征数据分析方法及其系统
US20170356936A1 (en) * 2016-05-11 2017-12-14 Mcmaster University Enhanced system and method for conducting pca analysis on data signals

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109885032A (zh) * 2019-03-13 2019-06-14 东北大学 基于邻域投影保持的异构数据协同建模工业故障检测方法
CN109901553A (zh) * 2019-03-13 2019-06-18 东北大学 基于多视角的异构工业大数据协同建模过程故障监测方法
CN109948688A (zh) * 2019-03-13 2019-06-28 东北大学 基于流形假设的多源工业异构大数据的故障诊断方法
CN109948503A (zh) * 2019-03-13 2019-06-28 东北大学 基于共享子空间多视角非负矩阵分解的工业故障检测方法
CN110045691A (zh) * 2019-03-13 2019-07-23 东北大学 一种多源异构大数据的多任务处理故障监测方法
CN110045691B (zh) * 2019-03-13 2021-03-16 东北大学 一种多源异构大数据的多任务处理故障监测方法
CN109948688B (zh) * 2019-03-13 2022-11-25 东北大学 基于流形假设的多源工业异构大数据的故障诊断方法
CN109948503B (zh) * 2019-03-13 2023-05-23 东北大学 基于共享子空间多视角非负矩阵分解的工业故障检测方法
CN112801313A (zh) * 2021-01-27 2021-05-14 西安重装配套技术服务有限公司 基于大数据技术综采工作面故障判定方法

Also Published As

Publication number Publication date
CN108181891B (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN108181891A (zh) 基于智能核主元分析的工业大数据故障诊断方法
CN107272655B (zh) 基于多阶段ica-svdd的间歇过程故障监测方法
Yi et al. A novel framework for fault diagnosis using kernel partial least squares based on an optimal preference matrix
CN107065828B (zh) 基于知识数据的半监督核判别分析故障诊断方法
Yi et al. Optimized relative transformation matrix using bacterial foraging algorithm for process fault detection
CN107976992B (zh) 基于图半监督支持向量机的工业过程大数据故障监测方法
CN108182445A (zh) 基于大数据智能核独立元分析的过程故障识别方法
CN107817745B (zh) 基于丛流形核线性判别分析的工业过程故障监测方法
CN106839769A (zh) 基于多流形半监督局部‑全局的电熔镁炉故障监测方法
CN107807860B (zh) 一种基于矩阵分解的电力故障分析方法及系统
CN104898646A (zh) 一种基于kpca进行故障分离与重构的电熔镁炉故障诊断方法
CN108038493A (zh) 基于回归智能判别嵌入的工业大数据过程故障监测方法
CN108647643A (zh) 一种基于深度学习的填料塔液泛状态在线辨识方法
CN105276988A (zh) 一种烧结矿机尾断面FeO含量的控制方法
CN110320468A (zh) 一种基于向量机的开关柜过热故障诊断方法
CN104199441A (zh) 基于稀疏贡献图的高炉多工况故障分离方法及系统
CN116524674A (zh) 基于多源数据融合的智能配电房火灾早期监测方法与系统
CN109949437B (zh) 基于稀疏化的异构数据协同工业故障诊断方法
CN113239623B (zh) 一种适用于电力装备的故障定位方法
CN105843212B (zh) 一种高炉故障诊断系统及方法
CN109901553A (zh) 基于多视角的异构工业大数据协同建模过程故障监测方法
CN107831743B (zh) 基于可信软标签线性判别分析的工业过程故障诊断方法
CN109901064A (zh) 基于ica-lvq的高压断路器故障诊断方法
CN109324595A (zh) 一种基于增量pca的工业监测数据分类方法
CN116204846B (zh) 一种基于可见图的配电网传感器数据异常快速定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant