CN108181891B - 基于智能核主元分析的工业大数据故障诊断方法 - Google Patents

基于智能核主元分析的工业大数据故障诊断方法 Download PDF

Info

Publication number
CN108181891B
CN108181891B CN201711325147.8A CN201711325147A CN108181891B CN 108181891 B CN108181891 B CN 108181891B CN 201711325147 A CN201711325147 A CN 201711325147A CN 108181891 B CN108181891 B CN 108181891B
Authority
CN
China
Prior art keywords
data
monitoring
classifier
classifier model
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711325147.8A
Other languages
English (en)
Other versions
CN108181891A (zh
Inventor
张颖伟
霍晓斌
贾润达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201711325147.8A priority Critical patent/CN108181891B/zh
Publication of CN108181891A publication Critical patent/CN108181891A/zh
Application granted granted Critical
Publication of CN108181891B publication Critical patent/CN108181891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • G05B23/0245Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a qualitative model, e.g. rule based; if-then decisions

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Complex Calculations (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于智能核主元分析的工业大数据故障诊断方法,涉及故障监测与诊断技术领域。该方法通过采集电熔镁炉熔炼过程中的图像、电流等数据,异构建模大数据池,对数据池中的样本进行智能核主元分析,得到分类器判别矩阵的最优解,建立初始监测分类器模型,采用平均即使风险逼近批量学习的批量风险的方法更新初始监测分类器模型,由更新后的监测分类器对新采集到的异构后的数据进行分类标记,求得结果图,通过结果图即可判断新采集的数据是否发生故障。本发明建立了生产流程的物理化学变量和图像声音视频的大数据池,实现结合多个信息源的互补信息,发现数据源之间的关联关系,以达到降低误报警率、提高故障检测的准确性的目的。

Description

基于智能核主元分析的工业大数据故障诊断方法
技术领域
本发明涉及故障监测与诊断技术领域,尤其涉及一种基于智能核主元分析的工业大数据故障诊断方法。
背景技术
现代社会的发展对材料的性能及产量提出了越来越高的要求,近年来,现代企业中生产设备趋于大型化、连续化、高速化和自动化,设备的结构与组成十分复杂,生产规模非常庞大,各部门之间的联系也特别密切。实际的生产过程有着不同的过程所具有的特征,应选用不同的故障监测方法,这样才能有效地检测到故障。超高温电熔镁冶炼流程是一个复杂的时变非线性工业过程。
核主元分析(KPCA)方法,核独立成分分析(kernel principal componentanalysis,KPCA)是一种通过KPCA方法的基本思想是通过某种隐式方式将输入空间映射到某个高维空间(常称为特征空间),并且在特征空间中实现PCA,KPCA是在高维特征空间中执行PCA,所以不用求解非线性优化问题,并且与其它非线性方法相比,在建模之前它不需要指定主元数目,但是传统KPCA是一种基于数据协方差结构的方法,主元模型一旦建立就是时不变的,导致之后采集的数据造成浪费,并且忽略了数据间的局部信息,造成数据的严重混叠,有可能引起误报警,所以需要提出一种可行方法来解决问题。并且在已有的研究成果中在数据的利用上把物理化学变量数据和图像声音视频数据分开建模,分别诊断,其做法忽视了大数据之间的必然联系,失去了大数据的固有优势。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于智能核主元分析的工业大数据故障诊断方法,建立了生产流程的物理化学变量和图像声音视频的大数据池,实现结合多个信息源的互补信息,发现数据源之间的关联关系,以达到降低误报警率的目的。
为解决上述技术问题,本发明所采取的技术方案是:一种基于智能核主元分析的工业大数据故障诊断方法,包括以下步骤:
步骤1:在电熔镁炉熔炼的工业过程中,采集炉面图像和同一时间的电熔镁炉三个电极的电流;
步骤2:对采集的数据进行标准化处理,对其中部分数据进行标记,异构建模大数据池;具体方法为:
对每一幅图片分别计算0°,45°,90°,135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算对比度、相关性、能量、同质性及熵五个特征值,则每一幅图片均得到一个20维的图片数据向量[x1,x2,…,x20];采集同一时间的电熔镁炉的三个电极的电流数据为[x21,x22,x23];由图片数据和电流数据异构建模的最终向量为[x1,x2,…,x20,x21,x22,x23];
采集的数据样本的总数为N,其中的1个数据由人工先验知识进行标记,u个样本不进行标记,N=1+u,标记数据中包括正常数据和异常数据,由此异构建模大数据池X=[X1,X2,…,Xl,Xl+1,Xl+2,…,Xl+u];
步骤3:用步骤2异构建模的大数据池,建立初始监测分类器模型;
基于表示定理,对如下的优化问题进行求解,得到初始监测分类器模型;
Figure BDA0001505508230000021
St:eTU(Kα)≥s2i
Figure BDA0001505508230000022
其中,L(Kα,y)=1/(1+exp(-yKα)),U(Kα)=(Kα)2,α=(α1,α2,...,αn)为表示定理的系数矩阵,n为输入数据的维数,n=23,e为全为1的行向量,K为核矩阵,y为已标记数据的标签,参数Cl、Cu、s和εi为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自已选择;
上述优化问题的最优解即为初始监测分类器模型的系数矩阵,通过表示定理表示的最优系数矩阵为
Figure BDA0001505508230000023
得到的初始监测分类器模型表示为:
Figure BDA0001505508230000024
其中,N为输入数据的个数,Xj为第j个输入数据,αj为系数矩阵的第j列向量,k(Xj,x)表示Xj和x的内积,其中x为当前输入的待标记数据;
步骤4:采用平均即使风险逼近批量学习的批量风险的方法更新步骤3得到的初始监测分类器模型;分类器的更新表示为:
Figure BDA0001505508230000025
Figure BDA0001505508230000026
其中,L(ft(x),yt)=1/(1+exp(-ytft(x))),其中的ft(x)表示t刻的监测分类器模型,t表示工业过程的某一时刻;
Figure BDA0001505508230000035
为希尔伯特核再生空间;R(f)为平均即使风险函数;Rt(f)为t时刻的风险函数;yt为由数据点类型构成的列向量;参数T为数据点个数;参数
Figure BDA0001505508230000031
Figure BDA0001505508230000032
为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自己选择;
步骤5:由更新后的监测分类器对新采集到的异构后的数据进行分类标记,求得结果图,通过结果图即可判断新采集的数据是否发生故障,当该点被标记为故障时,认为有故障发生,反之,则电熔镁炉运转正常;检测后返回步骤3对分类器进行更新。
所述步骤3中建立初始的监测模型的具体方法为:
首先令Q=[α1,α2,...,αn-1],G是通过奇异值分解求解KA的零空间求得N*(N-n+1)维的标准正交基,G=Null(KQQTKT);通过Gαn投影αn,将步骤3中的所述优化问题变形为:
Figure BDA0001505508230000033
St:eTU(KGα)≥s2i
将上两式简化后得到:
minα∈RTGTKGα+Cl||KOGα-v||2
St:(αTGT(KK-KENK)Gα)=s2
其中,v∈R0是由y的0个指数组成的子向量,同样的K0为由K的0个指数组成的子矩阵,EN为N×N的方阵,其元素是
Figure BDA0001505508230000034
根据拉格朗日乘子法,将上式的优化问题写成下式:
L(f,λ)=αTGTKGα+Cl||KOGα-v||2+λ((αTGT(KK-KENK)Gα)-s2)
其中λ为拉格朗日乘子;
对上式求导并令其等于零得到:
Cα=-λPα+b
αTPα=s2
其中,C=GT(K+ClGTKO TKOGα)G,b=ClGTKO Tv,P=GT(KK-KENK)G;
将λ求解转换为求解最小广义特征值问题,如下式所示:
Figure BDA0001505508230000041
其中,ζ为矩阵
Figure BDA0001505508230000042
相对于矩阵
Figure BDA0001505508230000043
的特征值,
Figure BDA0001505508230000044
为属于ζ的特征向量;
由此求解出该优化问题的最优解为α*=(C-ζP)-1b;
g=KOα
zi=1/(1+exp(-vigi))
ri=zi(1-zi)
Figure BDA0001505508230000045
则得到C和b的更新公式,分别为C=GT(K+ClGTKO TRKOGα)G,b=ClGTKO TRs,其中R是对角元素为Rii=ri的矩阵;参数Cl=10,Cu=0.01,s=0.1;
由牛顿-拉夫森迭代的方法求解分类器模型的最优解,直到正则项εi满足用户设定值或达到最大迭代次数。
所述步骤4中更新分类器的具体方法为:
由梯度下降法得到
Figure BDA0001505508230000046
其中ρt为步长;如果在c时刻到t时刻监测分类器模型表示为
Figure BDA0001505508230000047
其中,m与c的差值为数据池大小,用户根据实际需求进行选择;由梯度下降法更新得到t+1时刻监测分类器模型为
Figure BDA0001505508230000048
其中
Figure BDA0001505508230000049
为t+1时刻真实监测分类器模型的系数矩阵中第i列的列向量,另外预测t+1时刻
Figure BDA0001505508230000051
其中
Figure BDA0001505508230000052
为t+1时刻预测监测分类器模型的系数矩阵中第i列的列向量,令t+1时刻的两个监测分类器模型
Figure BDA0001505508230000053
Figure BDA0001505508230000054
相等,得到如下等式:
Figure BDA0001505508230000055
再将新采集到的数据点替换原数据集中停留时间最长的数据点,由此求解ft+1为:
Figure BDA0001505508230000056
其中
Figure BDA0001505508230000057
为系数矩阵αt+1中第i列的列向量,
Figure BDA0001505508230000058
为系数矩阵
Figure BDA0001505508230000059
中第i列的列向量;
由此得到t+1时刻监测分类器模型更新后的系数矩阵为αt+1=A-1αtB,其中
Figure BDA00015055082300000510
A=(k(x1,x),...,k(xm+1,x)),B=(k(xc,x),...,k(xm+1,x));δt=0.5。
采用上述技术方案所产生的有益效果在于:本发明提供的基于智能核主元分析的工业大数据故障诊断方法,解决数据的非线性和时变性问题,通过平均即使风险逼近批量学习的批量风险的方法对监测分类器模型进行更新,不仅能大大降低误报警,还能提高故障检测的准确性。
附图说明
图1为本发明实施例提供的电熔镁冶炼工艺流程示意图;
图2为本发明实施例提供的基于智能核主元分析的工业大数据故障诊断方法流程图;
图3为本发明实施例提供的采用基于智能核主元分析的工业大数据故障诊断方法对第一个时间点采集到的数据进行分类判断的结果示意图;
图4为本发明实施例提供的采用基于智能核主元分析的工业大数据故障诊断方法对第二个时间点采集到的数据进行分类判断的结果示意图;
图5为本发明实施例提供的采用基于智能核主元分析的工业大数据故障诊断方法对第一个时间点采集到的数据分类判断的准确性结果示意图;
图6为本发明实施例提供的采用基于方差损失函数最小的核主元分析法对第一个时间点采集到的数据分类判断的准确性结果示意图;
图7为本发明实施例提供的采用基于智能核主元分析的工业大数据故障诊断方法对第二个时间点采集到的数据分类判断的准确性结果示意图;
图8为本发明实施例提供的采用基于方差损失函数最小的核主元分析法对第二个时间点采集到的数据分类判断的准确性结果示意图。
图中:1、变压器;2、电路短网;3、电极升降装置;4、电极;5、炉壳;6、车体;7、电弧、8、炉料。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
电熔镁炉实际上是一种埋弧炉,属于矿热炉而不是电弧炉,其主要以熔融状态下电流通过物料所产生的物料电阻热为主要热源,同时伴有电弧热,它的热量集中,能有效的将物料加热到熔点2800℃以上,有利于熔炼电熔镁砂。电熔镁炉的设备主要包括:变压器、电路短网、电极、电极升降装置以及炉体等。炉边设有控制室,可控制电极升降。电熔镁炉的基本工作原理示意如图1。
一种基于智能核主元分析的工业大数据故障诊断方法,如图2所示,具体方法如下。
步骤1:在电熔镁炉熔炼的工业过程,采集炉面图像和同一时间的电熔镁炉三个电极的电流。
步骤2:对采集的数据进行标准化处理,对其中部分数据进行标记,异构建模大数据池,具体方法为:
对每一幅图片分别计算0°,45°,90°,135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算对比度、相关性、能量、同质性及熵五个特征值,则每一幅图片均得到一个20维的图片数据向量[x1,x2,…,x20];采集同一时间的电熔镁炉的三个电极的电流数据为[x21,x22,x23];由图片数据和电流数据异构建模的最终向量为[x1,x2,…,x20,x21,x22,x23];
采集的数据样本的总数为N,其中的1个数据由人工先验知识进行标记,u个样本不进行标记,N=1+u,标记数据中包括正常数据和异常数据,由此异构建模大数据池X=[X1,X2,…,Xl,Xl+1,Xl+2,…,Xl+u]。
由于超高温电熔镁冶炼流程的特殊性与复杂性,数据的采集是极其困难的,但图像的信息相对容易获取,因此由图像信息对镁炉的工业过程进行监测是极其必要的。为了提高过程监测的准确性,将采集到的图像信息进行处理得到图像特征数据,并与同一时刻采集到电流数据进行数据异构得到数据池。本实施例中,数据池采集了两组不同时刻的数据,第一组数据由40个训练样本及100测试样本构成,第二组数据由40个训练数据及90训练样本构成,每个样本点为23维数据点。分别随机选取两组不同时刻的数据中的八组数据如表1和表2所示。将两组数据采集到的40的训练样本中的20个数据由人工先验知识进行标记,20个标记样本中10为正常数据,其余10个为异常数据,采集到的40的训练样本其余20个样本不进行标记,由此异构建模大数据池。
表1第一组数据中的八组数据
Figure BDA0001505508230000071
Figure BDA0001505508230000081
表2第二组数据中的八组数据
Figure BDA0001505508230000082
步骤3:用步骤2异构建模的大数据池,建立初始监测分类器模型。
基于表示定理,对如下的优化问题进行求解,得到初始监测分类器模型;
Figure BDA0001505508230000091
St:eTU(Kα)≥s2i
Figure BDA0001505508230000092
其中,L(Kα,y)=1/(1+exp(-yKα)),U(Kα)=(Kα)2,α=(α1,α2,...,αn)为表示定理的系数矩阵,n为输入数据的维数,n=23,e为全为1的行向量,K为核矩阵,y为已标记数据的标签,参数Cl、Cii、s和εi为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自已选择;
首先令Q=[α1,α2,...,αn-1],G是通过奇异值分解求解KA的零空间求得N*(N-n+1)维的标准正交基,G=Null(KQQTKT);通过Gαn投影αn,将上述优化问题变形为:
Figure BDA0001505508230000093
St:eTU(KGα)≥s2i
将上两式简化后得到:
minα∈RTGTKGα+Cl||KOGα-v||2
St:(αTGT(KK-KENK)Gα)=s2
其中,v∈RO是由y的0个指数组成的子向量,同样的K0为由K的0个指数组成的子矩阵,EN为N×N的方阵,其元素是
Figure BDA0001505508230000094
根据拉格朗日乘子法,将上式的优化问题写成下式:
L(f,λ)=αTGTKGα+Cl||KOGα-v||2+λ((αTGT(KK-KENK)Gα)-s2)
其中λ为拉格朗日乘子;
对上式求导并令其等于零得到:
Cα=-λPα+b
αTPα=s2
其中,C=GT(K+ClGTKO TKOGα)G,b=ClGTKOTv,P=GT(KK-KENK)G;
将λ求解转换为求解最小广义特征值问题,如下式所示:
Figure BDA0001505508230000101
其中,ζ为矩阵
Figure BDA0001505508230000102
相对于矩阵
Figure BDA0001505508230000103
的特征值,
Figure BDA0001505508230000104
为属于ζ的特征向量;
由此求解出该优化问题的最优解为α*=(C-ζP)-1b;
g=KOα
zi=1/(1+exp(-vigi))
ri=zi(1-zi)
Figure BDA0001505508230000105
则得到C和b的更新公式,分别为C=GT(K+ClGTKO TRKOGα)G,b=ClGTKO TRs,其中R是对角元素为Rii=ri的矩阵;参数Cl=10,Cu=0.01,s=0.1;
由牛顿-拉夫森迭代的方法求解分类器模型的最优解,直到正则项εi满足用户设定值或达到最大迭代次数;
求解得到的初始监测分类器模型,表示为:
Figure BDA0001505508230000106
其中,
Figure BDA0001505508230000107
为最优解通过表示定理表示的最优系数矩阵,N为输入数据的个数,Xj为第j个输入数据,αj为系数矩阵的第j列向量,k(Xj,x)表示Xj和x的内积,其中x为当前输入的待标记数据。
本实施例中,求解到得两组数据初始最优解α*分别如表3和表4所示。
表3第一组数据初始最优解
-0.0050 -0.0126 0.0166 -0.0067 -0.078 0.0070 0.0189 -0.0911 -0.0050 -0.0220
-2.8782 0.2846 -0.0376 0.6596 0.7556 -0.1068 1.0340 0.2049 -0.8628 0.7220
0.0022 0.0023 0.0022 0.0022 0.0022 -1.9405e-04 0.0021 0.0022 0.0039 0.0022
0.0022 0.0022 0.0021 0.0022 0.0022 0.0022 0.0022 0.0022 0.0021 0.0020
-0.0107 -0.2339 0.3369 0.5330 0.2720 -0.0403 0.6865 -0.3495 0.2119 0.0097
-0.3852 -0.0111 -0.0338 -0.9079 -0.5631 0.0205 -0.0052 0.0181 0.1106 0.0056
0.0857 0.0513 0.1046 0.2545 -0.0391 0.0238 0.0127 -0.2292 0.0019 -0.2911
0.0022 0.0022 0.0020 0.0022 0.0022 0.0022 0.0023 0.0022 0.0022 0.0022
0.2077 0.0552 0.3232 -0.0010 -0.0190 0.0015 0.0016 -0.0914 0.0054 -0.0119
0.0127 -0.0041 0.1217 -0.0027 -0.0042 -0.6963 1.5946 -0.0048 -0.1502 -0.0017
0.0017 -2.3700e-04 -0.0804 -3.1193e-04 0.9544 1.5244 0.0061 -0.0732 -0.0031 -0.0060
10.3712 -0.2940 -0.1248 0.3855 0.0225 -0.0025 -0.1729 2.3530e-04 -0.0074 0.0015
0.0013 -0.0678 -0.0755 0.0012 2.2221 0.0847 0.0567 -0.0084 0.0218 0.0062
-0.0127 -0.0026 4.6239 4.5709e-04 0.115 0.0611 -1.4206 -0.0510 -0.1052 -0.4206
表4第二组数据初始最优解
-1.1060 1.7242 -0.5092 0.1875 -0.4473 3.2262 0.7609 -1.8703 0.3855 -0.3338
-1.3761 0.3185 -0.0886 0.1652 -0.7140 -0.9261 -2.5309 1.6995 0.9770 4.2862
-0.5814 0.1917 -0.9044 -0.3501 1.5349 -1.4365 -0.8022 -0.5585 1.8804 0.2185
-0.1649 -1.9975 1.8324 2.1737 -4.9913 0.5618 0.7189 3.5820 -0.8726 -0.3088
-0.0068 -1.7276 1.8734 -0.5992 -4.1332 -0.4016 -0.1888 0.8533 1.9636 -1.4593
-2.227 5.7592 -1.7200 -1.4956 3.0180 2.7416 -1.2624 4.4352 -0.9096 1.9158
2.8630 -1.6957 0.9196 -1.4181 -0.6590 0.1914 0.7009 1.0320 -1.7529 -5.0384
0.0024 -2.5552 0.5795 2.0679 -0.7783 0.0246 -1.0776 -0.8884 0.2166 0.9792
-0.6096 2.6410 2.4510 -0.1989 0.7208 0.0197 1.1692 0.8648 -2.4410 0.2781
-0.5762 -0.7948 1.2950 -0.0732 1.5535 -4.4814 -0.1185 -1.5644 0.9743 0.9654
3.4395 -3.0493 1.0254 -1.2513 -0.0844 0.5600 -2.1441 0.3108 -0.7688 -0.5146
-0.0647 0.2022 -1.7423 1.7577 0.3763 1.5316 -0.9197 -0.0640 -2.7975 0.8941
-1.9296 -0.0920 -1.5723 -4.3100 4.3897 0.4255 4.9332 -0.7765 -0.7111 -2.4405
步骤4:采用平均即使风险逼近批量学习的批量风险的方法更新步骤3得到的初始监测分类器模型。
分类器的更新表示为:
Figure BDA0001505508230000111
Figure BDA0001505508230000121
其中,L(ft(x),yt)=1/(1+exp(-ytft(x))),其中的ft(x)表示t刻的监测分类器模型,
Figure BDA0001505508230000122
中的f是代表f(x),t表示工业过程的某一时刻,
Figure BDA0001505508230000123
为希尔伯特核再生空间,R(f)为平均即使风险函数,Rt(f)为t时刻的风险函数,yt为由数据点类型构成的列向量,参数T为数据点个数,参数
Figure BDA0001505508230000124
Figure BDA0001505508230000125
为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自己选择;
由梯度下降法得到
Figure BDA0001505508230000126
其中ρt为步长;如果在c时刻到t时刻监测分类器模型表示为
Figure BDA0001505508230000127
其中,m与c的差值为数据池大小,用户根据实际需求进行选择,本实施例中两组数据选取该值分别为140和130,由梯度下降法更新得到t+1时刻监测分类器模型为
Figure BDA0001505508230000128
其中
Figure BDA0001505508230000129
为t+1时刻真实监测分类器模型的系数矩阵中第i列的列向量,另外预测t+1时刻
Figure BDA00015055082300001210
其中
Figure BDA00015055082300001211
为t+1时刻预测监测分类器模型的系数矩阵中第i列的列向量,令t+1时刻的两个监测分类器模型
Figure BDA00015055082300001212
和ft+1相等,得到如下等式:
Figure BDA00015055082300001213
再将新采集到的数据点替换原数据集中停留时间最长的数据点,由此求解ft+1
Figure BDA00015055082300001214
其中
Figure BDA00015055082300001215
为系数矩阵αt+1中第i列的列向量,
Figure BDA00015055082300001216
为系数矩阵
Figure BDA00015055082300001217
中第i列的列向量;
由此得到t+1时刻监测分类器模型更新后的系数矩阵为αt+1=A-1αtB.其中
Figure BDA00015055082300001218
A=(k(x1,x),...,k(xm+1,x)),B=(k(xc,x),...,k(xm+1,x));δt=0.5。
对于数据池的处理方式为在数据池中停留时间最久的样本点由新采集到的样本点代替形成新的建模数据,求解下一时刻监测分类器模型的系数矩阵αt+1。本实施例中,某时刻更新后的监测分类器模型的系数矩阵α的数据如表5和表6所示。
表5第一组某时刻监测分类器模型α
-0.0061 -0.0099 0.0230 -0.0055 -0.0800 0.0068 0.0201 -0.0899 -0.0048 -0.0218
-2.5683 0.2763 -0.0485 0.5522 0.6565 -0.0998 0.9980 0.1989 -0.8555 0.6989
0.0046 0.0024 0.0023 0.0043 0.0043 -1.8200e-04 0.0040 0.0043 0.0043 0.0043
0.0046 0.0023 0.0022 0.0043 0.0043 0.0043 0.0043 0.0043 0.0043 0.0031
-0.0200 -0.3001 0.4399 0.6001 0.2830 -0.0501 0.6925 -0.3323 0.1989 0.0101
-0.4925 -0.0203 -0.0238 -1.0007 -0.6531 0.0189 -0.0056 0.0221 0.0989 0.0066
0.0722 0.0499 0.9964 0.3040 -0.0400 0.0199 0.0223 -0.2300 0.0023 -0.3001
0.0046 0.0024 0.0021 0.0043 0.0043 0.0043 0.0046 0.0043 0.0043 0.0043
0.1986 0.0605 0.2333 -0.0015 -0.0201 0.0034 0.0032 -0.1041 0.0060 -0.0201
0.0200 -0.0039 0.2172 -0.0032 -0.0066 -0.7001 1.6001 -0.0037 -0.1821 -0.0023
0.0016 -1.9800e-04 -0.1000 -3.0011e-04 1.001 1.4928 0.0078 -0.0699 -0.0034 -0.0068
9.4233 -0.3100 -0.0997 0.4022 0.0250 -0.0075 -0.3289 2.3330e-04 -0.0088 0.0021
0.0013 -0.0779 -0.0688 0.0016 2.3333 0.0799 0.0689 -0.0077 0.0199 0.0059
-0.0100 -0.0019 5.0322 4.6667e-04 0.0988 0.0582 -1.3996 -0.0499 -0.0993 -0.3925
表6第二组某时刻监测分类器模型α
-0.9880 1.6630 -0.5092 0.2687 -0.4001 3.5657 0.80866 -1.5868 0.0011 -0.8988
-1.4038 0.2989 -0.0808 0.2232 -0.6544 -0.8889 -2.0382 1.8963 0.4800 3.0010
-0.6006 0.2000 -0.8086 -0.4001 1.2333 -1.3654 -0.5564 -0.2358 2.3666 0.0158
-0.1700 -2.002 2.003 1.9826 -4.800 0.6728 1.0010 3.9998 -0.2679 -0.9898
-0.0100 -1.8868 1.9989 -0.6700 -4.002 -0.3998 -0.1678 0.8848 2.6894 -2.001
-2.0370 6.3263 -1.6980 -1.5606 3.2111 2.7682 -1.0001 4.9369 -0.0092 1.8620
2.8888 -1.777 0.9696 -1.4328 -0.5556 0.1949 0.8078 1.5358 -1.0890 -5.0002
0.0036 -2.4322 0.6068 1.9898 -0.6848 0.0328 -1.2365 -0.0012 0.8988 1.2323
-0.6969 2.5989 2.5555 -0.1998 0.7562 0.0207 1.4454 1.4360 -2.0010 0.8868
-0.5888 -0.9884 1.2950 -0.0663 1.6565 -4.2346 -0.1005 -1.0210 1.0023 1.0303
3.2323 -3.0003 0.9889 -1.1012 -0.0716 0.5872 -1.4998 0.4039 -0.3258 -1.6898
-0.0745 0.3021 -1.6363 1.8868 0.4823 1.6667 -0.5096 -0.0012 -2.4321 1.4686
-2.0010 -0.1000 -1.6689 -4.0211 4.4433 0.3686 5.2358 -0.5603 -0.6210 -3.6848
步骤5:由更新后的监测分类器对新采集到的异构后的数据进行分类标记,求得结果图,通过结果图即可判断新采集的数据是否发生故障,当该点被标记为故障时,认为有故障发生,反之,则电熔镁炉运转正常;检测后返回步骤3对分类器进行更新。
为了更直观的对数据进行投影作图分析,MDS(multidimensional scaling)多维尺度分析法对分类后的数据进行投影作图,本实施例中两组数据中十组投影后的数据分别如表7和表8所示。如图4、图5所示,为投影后的数据得到的实验仿真,从图中可以看出本实施例的方法(I-KPCA)对于这两组不同时刻的数据可以较好的进行区分。如图5、图6、图7、图8所示,为本实施例提供的方法(I-KPCA)与基于方差损失函数最小的核主元分析法(LS-KPCA)对同两组采集于不同时间的数据进行的准确率对比。
表7第一组投影后的数据
Figure BDA0001505508230000141
表8第二组投影后的数据
Figure BDA0001505508230000142
Figure BDA0001505508230000151
由表9准确率对比可以看到,由于引入了半监督与在线检测,I-KPCA对于分类的准确性有所提升。选取MDS进行投影的主要原因为该方法利用的是成对样本间相似性,目的是利用这个信息去构建合适的低维空间,使得样本在此空间的距离和在高维空间中的样本间的相似性尽可能的保持一致。
表9I-KPCA及LS-KPCA诊断准确率
Figure BDA0001505508230000152
通过上面的仿真实例,表明了本发明提供的基于智能核主元分析的工业大数据故障诊断方法的有效性,实现了对电熔镁炉工业流程的故障监测与诊断。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (3)

1.一种基于智能核主元分析的工业大数据故障诊断方法,其特征在于:包括以下步骤:
步骤1:在电熔镁炉熔炼的工业过程中,采集炉面图像和同一时间的电熔镁炉三个电极的电流;
步骤2:对采集的数据进行标准化处理,对其中部分数据进行标记,异构建模大数据池;具体方法为:
对每一幅图片分别计算0°,45°,90°,135°四个方向的灰度共生矩阵,对每个灰度共生矩阵分别计算对比度、相关性、能量、同质性及熵五个特征值,则每一幅图片均得到一个20维的图片数据向量[x1,x2,…,x20],其中x1~x4、x5~x8、x9~x12、x13~x16、x17~x20分别为现场采集到的图片数据的0°、45°、90°、135°四个方向的能量、对比度、同质性、熵和相关性的5组特征值;采集同一时间的电熔镁炉的三个电极的电流数据为[x21,x22,x23],x21、x22、x23为与现场采集到的图片数据对应时刻的电熔镁炉的三相电流数据电流A、电流B、电流C;由图片数据和电流数据异构建模的最终向量为[x1,x2,…,x20,x21,x22,x23];
采集的数据样本的总数为N,其中的1个数据由人工先验知识进行标记,u个样本不进行标记,N=l+u,标记数据中包括正常数据和异常数据,由此异构建模大数据池X=[X1,X2,…,Xl,Xl+1,Xl+2,…,Xl+u],Xi是由第i幅图片中采集的23个变量组成的向量,i=1,2,…,1+u,其中23个变量包括0°、45°、90°、135°四个方向的能量、对比度、同质性、熵、相关性5个特征值和对应时刻的电熔镁炉的三相电流数据电流A、电流B、电流C;
步骤3:用步骤2异构建模的大数据池,建立初始监测分类器模型;
基于表示定理,对如下的优化问题进行求解,得到初始监测分类器模型;
Figure FDA0002417725690000011
St:eTU(Kα)≥s2i
Figure FDA0002417725690000012
其中,L(Kα,y)=1/(1+exp(-yKα)),U(Kα)=(Kα)2,α=(α1α2,...,αn)为初始监测分类器模型待求解的系数矩阵,由表示定理继承而来,α1,...,αn为α中的元素,n为输入数据的维数,n=23,e为全为1的行向量,K为核矩阵,y为已标记数据的标签,参数C1、Cu、s和εi为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自己选择,其中s为采集到的数据集的方差;
上述优化问题的最优解即为初始监测分类器模型的系数矩阵,通过表示定理表示的最优系数矩阵为
Figure FDA0002417725690000021
得到的初始监测分类器模型表示为:
Figure FDA0002417725690000022
其中,N为输入数据的个数,Xj为第j个输入数据,αj为系数矩阵的第j列向量,k(Xj,x)表示Xj和x的内积,其中x为当前输入的待标记数据;
步骤4:采用平均即使风险逼近批量学习的批量风险的方法更新步骤3得到的初始监测分类器模型;分类器的更新表示为:
Figure FDA0002417725690000023
Figure FDA0002417725690000024
其中,L(ft(x),yt)=1/(1+exp(-ytft(x))),其中的ft(x)表示t时刻的监测分类器模型,t表示工业过程的某一时刻;||f||为ft(x)的模;
Figure FDA0002417725690000026
为希尔伯特核再生空间;R(f)为平均即使风险函数;Rt(f)为t时刻的风险函数;yt为由数据点类型构成的列向量;参数T为数据点个数;参数
Figure FDA0002417725690000027
Figure FDA0002417725690000028
为衡量监测分类器模型复杂程度的参数,根据问题不同由用户自己选择;
步骤5:由更新后的监测分类器对新采集到的异构后的数据进行分类标记,求得结果图,通过结果图即可判断新采集的数据是否发生故障,当该新采集的数据被标记为故障时,认为有故障发生,反之,则电熔镁炉运转正常;检测后返回步骤3对分类器进行更新。
2.根据权利要求1所述的基于智能核主元分析的工业大数据故障诊断方法,其特征在于:所述步骤3中建立初始的监测模型的具体方法为:
首先令Q=[α1α2,...,αn-1],G是通过奇异值分解求解KA的零空间求得N*(N-n+1)维的标准正交基,G=Null(KQQTKT);通过Gαn投影αn,将步骤3中的所述优化问题变形为:
Figure FDA0002417725690000025
St:eTU(KGα)≥s2i
将上两式简化后得到:
Figure FDA0002417725690000031
St:(αTGT(KK-KENK)Gα)=s2
其中,v∈RO是由y的0个指数组成的子向量,同样的K0为由K的0个指数组成的子矩阵,EN为N×N的方阵,其元素是
Figure FDA0002417725690000032
根据拉格朗日乘子法,将上式的优化问题写成下式:
L(f,λ)=αTGTKGα+Cl||KOGα-v||2+λ((αTGT(KK-KENK)Gα)-s2)
其中λ为拉格朗日乘子;
对上面根据拉格朗日乘子法表示的优化问题求导并令其等于零得到:
Cα=-λPα+b
αTPα=s2
其中,C=GT(K+ClGTKO TKOGα)G,b=ClGTKO Tv,P=GT(KK-KENK)G;
将λ求解转换为求解最小广义特征值问题,如下式所示:
Figure FDA0002417725690000033
其中,ζ为矩阵
Figure FDA0002417725690000034
相对于矩阵
Figure FDA0002417725690000035
的特征值,
Figure FDA0002417725690000036
为属于ζ的特征向量;
由此求解出该优化问题的最优解为α*=(C-ζP)-1b;
g=KOα
zi=1/(1+exp(-vigi))
ri=zi(1-zi)
Figure FDA0002417725690000037
则得到C和b的更新公式,分别为C=GT(K+ClGTKO TRKOGα)G,b=ClGTKO TRs,其中R是对角元素为Rii=ri的矩阵;参数Ci=10,Cu=0.01,s=0.1;
由牛顿-拉夫森迭代的方法求解分类器模型的最优解,直到正则项εi满足用户设定值或达到最大迭代次数。
3.根据权利要求2所述的基于智能核主元分析的工业大数据故障诊断方法,其特征在于:所述步骤4中更新分类器的具体方法为:
由梯度下降法得到
Figure FDA0002417725690000041
其中ρt为步长;如果在c时刻到t时刻监测分类器模型表示为
Figure FDA0002417725690000042
其中,m与c的差值为数据池大小,用户根据实际需求进行选择;由梯度下降法更新得到t+1时刻监测分类器模型为
Figure FDA0002417725690000043
其中
Figure FDA0002417725690000044
为t+1时刻真实监测分类器模型的系数矩阵中第i列的列向量,另外预测t+1时刻
Figure FDA0002417725690000045
其中
Figure FDA0002417725690000046
为t+1时刻预测监测分类器模型的系数矩阵中第i列的列向量,令t+1时刻的两个监测分类器模型
Figure FDA0002417725690000047
和ft+1相等,得到如下等式:
Figure FDA0002417725690000048
再将新采集到的数据点替换原数据集中停留时间最长的数据点,由此求解ft+1为:
Figure FDA0002417725690000049
其中
Figure FDA00024177256900000410
为系数矩阵αt+1中第i列的列向量,
Figure FDA00024177256900000411
为系数矩阵
Figure FDA00024177256900000412
中第i列的列向量;
由此得到t+1时刻监测分类器模型更新后的系数矩阵为αt+1=A-1αtB,其中
Figure FDA00024177256900000413
A=(k(x1,x),...,k(xm+1,x)),B=(k(xc,x),...,k(xm+1,x));δt=0.5。
CN201711325147.8A 2017-12-13 2017-12-13 基于智能核主元分析的工业大数据故障诊断方法 Active CN108181891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711325147.8A CN108181891B (zh) 2017-12-13 2017-12-13 基于智能核主元分析的工业大数据故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711325147.8A CN108181891B (zh) 2017-12-13 2017-12-13 基于智能核主元分析的工业大数据故障诊断方法

Publications (2)

Publication Number Publication Date
CN108181891A CN108181891A (zh) 2018-06-19
CN108181891B true CN108181891B (zh) 2020-05-05

Family

ID=62546186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711325147.8A Active CN108181891B (zh) 2017-12-13 2017-12-13 基于智能核主元分析的工业大数据故障诊断方法

Country Status (1)

Country Link
CN (1) CN108181891B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948688B (zh) * 2019-03-13 2022-11-25 东北大学 基于流形假设的多源工业异构大数据的故障诊断方法
CN110045691B (zh) * 2019-03-13 2021-03-16 东北大学 一种多源异构大数据的多任务处理故障监测方法
CN109885032B (zh) * 2019-03-13 2021-01-12 东北大学 基于邻域投影保持的异构数据协同建模工业故障检测方法
CN109901553B (zh) * 2019-03-13 2020-09-01 东北大学 基于多视角的异构工业大数据协同建模过程故障监测方法
CN109948503B (zh) * 2019-03-13 2023-05-23 东北大学 基于共享子空间多视角非负矩阵分解的工业故障检测方法
CN112801313A (zh) * 2021-01-27 2021-05-14 西安重装配套技术服务有限公司 基于大数据技术综采工作面故障判定方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1682165A (zh) * 2002-09-30 2005-10-12 东京毅力科创株式会社 用于监视和控制半导体生产过程的方法和装置
WO2009013754A1 (en) * 2007-07-24 2009-01-29 Technion Research And Development Foundation Ltd. Chemically sensitive field effect transistors and use thereof in electronic nose devices
CN102566505A (zh) * 2012-02-27 2012-07-11 温州大学 一种数控机床的智能故障诊断方法
CN102681473A (zh) * 2012-04-01 2012-09-19 中南大学 一种基于纹理单元分布的硫浮选过程故障检测方法
CN104063631A (zh) * 2014-06-13 2014-09-24 周家锐 一种面向大数据的代谢组特征数据分析方法及其系统
CN104914807A (zh) * 2014-03-14 2015-09-16 费希尔-罗斯蒙特系统公司 在过程中确定过程元素和测量值的关联关系和定线

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2965340C (en) * 2016-05-11 2021-05-18 Mahmoud Ismail An enhanced system and method for conducting pca analysis on data signals

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1682165A (zh) * 2002-09-30 2005-10-12 东京毅力科创株式会社 用于监视和控制半导体生产过程的方法和装置
WO2009013754A1 (en) * 2007-07-24 2009-01-29 Technion Research And Development Foundation Ltd. Chemically sensitive field effect transistors and use thereof in electronic nose devices
CN102566505A (zh) * 2012-02-27 2012-07-11 温州大学 一种数控机床的智能故障诊断方法
CN102681473A (zh) * 2012-04-01 2012-09-19 中南大学 一种基于纹理单元分布的硫浮选过程故障检测方法
CN104914807A (zh) * 2014-03-14 2015-09-16 费希尔-罗斯蒙特系统公司 在过程中确定过程元素和测量值的关联关系和定线
CN104063631A (zh) * 2014-06-13 2014-09-24 周家锐 一种面向大数据的代谢组特征数据分析方法及其系统

Also Published As

Publication number Publication date
CN108181891A (zh) 2018-06-19

Similar Documents

Publication Publication Date Title
CN108181891B (zh) 基于智能核主元分析的工业大数据故障诊断方法
CN105550634B (zh) 基于Gabor特征与字典学习的人脸姿态识别方法
CN108090472B (zh) 基于多通道一致性特征的行人重识别方法及其系统
CN109033513B (zh) 电力变压器故障诊断方法与电力变压器故障诊断装置
CN108182445B (zh) 基于大数据智能核独立元分析的过程故障识别方法
CN107918379B (zh) 基于图半监督代价敏感的工业大数据早期故障检测方法
CN114239404A (zh) 一种基于多目标优化的材料智能优化设计方法
CN111222798B (zh) 一种复杂工业过程关键性指标软测量方法
CN110224862A (zh) 基于多层感知器的多智能体系统网络容侵能力评估方法
CN109949437B (zh) 基于稀疏化的异构数据协同工业故障诊断方法
Li et al. Stochastic configuration networks for self-blast state recognition of glass insulators with adaptive depth and multi-scale representation
CN109657693B (zh) 一种基于相关熵和迁移学习的分类方法
CN113110398B (zh) 基于动态时间归整和图卷积网络的工业过程故障诊断方法
CN114580262A (zh) 一种锂离子电池健康状态估计方法
CN110045691B (zh) 一种多源异构大数据的多任务处理故障监测方法
CN117634905A (zh) 一种电网业务数据特征提取方法
Kaur et al. Intelligent medical image segmentation using FCM, GA and PSO
CN112329879A (zh) 基于反事实多智能体学习的图像场景图的生成方法和系统
CN116484275A (zh) 基于自适应时空图卷积神经网络的铝电解阳极效应监测方法
CN116543414A (zh) 多模型融合的舌质颜色分类及舌质红度和紫度量化方法
CN108182302B (zh) 基于修改聚类半监督核主元分析的早期故障检测方法
CN109885028B (zh) 基于相关熵诱导度量的电熔氧化镁熔炼过程故障检测方法
Wu et al. Estimating heterogeneous gene regulatory networks from zero-inflated single-cell expression data
CN109885027B (zh) 基于双向二维稀疏正交判别分析的工业过程故障诊断方法
CN111723857B (zh) 一种流程生产装备运行状态的智能监测方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant