CN108182445B - 基于大数据智能核独立元分析的过程故障识别方法 - Google Patents

基于大数据智能核独立元分析的过程故障识别方法 Download PDF

Info

Publication number
CN108182445B
CN108182445B CN201711325148.2A CN201711325148A CN108182445B CN 108182445 B CN108182445 B CN 108182445B CN 201711325148 A CN201711325148 A CN 201711325148A CN 108182445 B CN108182445 B CN 108182445B
Authority
CN
China
Prior art keywords
sample
data
matrix
class
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711325148.2A
Other languages
English (en)
Other versions
CN108182445A (zh
Inventor
张颖伟
王振帮
关守平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201711325148.2A priority Critical patent/CN108182445B/zh
Publication of CN108182445A publication Critical patent/CN108182445A/zh
Application granted granted Critical
Publication of CN108182445B publication Critical patent/CN108182445B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2134Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on separation criteria, e.g. independent component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于大数据智能核独立元分析的过程故障识别方法,涉及流程工业故障诊断技术领域。该方法通过样本数据构建半监督核独立元分析算法,获得样本数据的空间转换矩阵和状态投影矩阵,再构建各个运行状态类别的生产运行状态库;对新采集的数据进行预处理后,通过获得的空间转换矩阵和状态投影矩阵进行初步故障诊断,获得的各个投影方向的置信区间求得实时工况数据的得分因子,计算FICD统计量,进行精准的故障识别。本发明将基于类别成员资格的半监督分类学习方法和核独立元分析相结合,根据状态投影矩阵和构建相应的统计量对工业过程的运行状态进行故障诊断和精准的故障识别,能有效地提升识别电熔镁炉熔炼运行状态的识别度和准确性。

Description

基于大数据智能核独立元分析的过程故障识别方法
技术领域
本发明涉及流程工业故障诊断技术领域,尤其涉及一种基于大数据智能核独立元分析的过程故障识别方法。
背景技术
传统的数据集往往有物理化学等过程变量组成。基于向量的过程监测方法在多元统计方法运用的推动下蓬勃发展。然而,在监控设备大量使用后,图像和视频等维度高、数据量丰富、动态性能明显的异构矩阵数据出现使得故障诊断领域在新的应用前景中遇到了挑战。
特征提取和特征选择对上述问题有巨大的帮助,然而,过于丰富且海量的数据源很难标记出每一个数据的状态信息。因此,故障诊断的建模过程面临巨大的困难。众所周知,对于所采集的数据集进行全部的标签处理将浪费大量的人力物力,同时,对于数据量巨大的现代过程工业实时地进行标签标记也是难以实现的。那么对于一个只含有少量标记数据的数据集,仅仅利用标签数据进行建模是难以准确进行分类的同时也是难以令人信服的。
此外,对于处于各类重叠区域的样本数据有时候仅仅利用单一的分类假设或是狭义的分类思想往往会对数据产生错分类信息。经典的多分类问题常常会根据标记样本的分布信息然后依据一定的聚类假设对参与训练的未标记样本给出一个清晰的标签。这对于医学病例分析或是故障检测和诊断领域来说,对存在于分类边界处的未标记样本点给出清晰的标签基本上是一种武断的行为,甚至影响到对期待结果的判断,因为存在于分类边界处的未标记样本点往往是由故障点和临界稳定点组成的。
传统的主元分析(principle component analysis,PCA)、偏最小二乘方法(partial least square,PLS)和独立元分析(independent component analysis,ICA)等过程监测方法依靠物理化学变量建模且取得了极其理想的效果。线性判别分析(lineardiscriminant analysis,LDA)等多元统计方法也仅仅能够处理常规的过程变量。对于构建的具有异构数据特征的大数据池,原始的过程监测方法往往很难直接移植用于故障诊断。上述的海量数据难以全部或是大范围的标记以及数据的异构特点是传统监测方法移植应用的难题。ICA方法在应用于传统的故障诊断时表现出了优越的性能,同时其充分考虑数据的高阶信息使得独立的潜空间对数据的特征信息更加敏感。ICA方法在图像处理方面也有良好的性能,其通过分析高阶统计信息充分应用图像数据的边缘分布特征。由于流程工业往往是复杂多变的,数据常常具有非线性的特征,所以利用核独立元分析(kernel ICA,KICA)方法处理物理变量和图像视频数据在一起的大数据将会获得良好的检测和诊断性能。原始的KICA方法对处理传统过程变量和提取图像数据的边缘分布特征时都很敏感,但是应用已知状态比例较低的大数据建模的准确度大大降低。
电熔镁炉是一种埋弧炉,通过悬于其上方的电极传输大电流产生高温电弧,在菱镁矿粉层的下方形成超高温熔池,从而实现氧化镁的制取。整个炉体通过炉壳内耐高温绝缘材料,使炉体内部形成一个几乎封闭的熔炼空间,使得碳酸镁分解成氧化镁和二氧化碳。在熔炼的过程中往往由于电流大小的不平衡或是电极位置的微小偏离,都会使得产生的二氧化碳气体排放异常产生喷炉故障;由于电极的提升位置异常或是电流过大使得漏炉故障发生。因此,为了在实际生产中及时地规避故障的发生,进行实时有效的故障诊断,准确地识别出故障,降低生产中的安全隐患是必要的。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于大数据智能核独立元分析的过程故障识别方法,将基于类别成员资格的半监督分类学习方法和核独立元分析(即kernel ICA,简称KICA)方法相结合,提出基于大数据智能核独立元分析方法,即半监督KICA(即Semi-supervised KICA,简称SSKICA)方法,应用于电熔镁炉熔炼过程故障识别,以实现准确识别电熔镁炉熔炼过程的运行状态,对喷炉故障和漏炉故障降低误报警率和漏报警率的目的。
为解决上述技术问题,本发明所采取的技术方案是:一种基于大数据智能核独立元分析的过程故障识别方法,包括以下步骤:
步骤1:采集电熔镁炉炉内熔炼物料表层视频图像和熔炼过程的物理变量,物理变量包括电压、电流和炉壳温度,并对其中明显且已知的运行状态进行标记;
步骤2:对电熔镁炉炉内熔炼物料表层视频图像进行特征提取,同时与物理变量的过程数据放在同一个数据集中作为样本数据;
步骤3:对特征提取后得到的样本数据进行数据预处理,包括标准化处理和白化处理,得到处理后的样本数据Z;
步骤4:构建半监督核独立元分析算法,获得样本数据的空间转换矩阵和状态投影矩阵,具体步骤如下:
步骤4-1:在核独立元分析算法中引入基于类别成员资格的半监督分类方法,构建出半监督核独立元分析算法的目标函数,具体公式如下:
Figure GDA0002300701010000031
Figure GDA0002300701010000032
BTB=I
其中,zi表示第i个白化样本,
Figure GDA0002300701010000033
表示第i个白化样本的局部权值归一化重构,所述局部权值归一化重构简称LWMR;rk表示第k类的标签编码;vk(BTzi)表示第i个白化样本属于第k类的类别成员函数,B表示空间转换矩阵;f(BTzi)表示第i个白化样本的类别决策函数,
Figure GDA0002300701010000034
表示第i个重构样本的类别决策函数;λ和λs均为正则化系数;E{·}为期望;
Figure GDA0002300701010000035
表示第p个独立元信号的概率密度;bp表示空间转换矩阵的第p个列向量,也表示用于求解独立元信号的第p个解混向量;detB表示空间转换矩阵B的行列式值,
Figure GDA0002300701010000036
表示类别决策函数的希尔伯特范数,C和n分别表示类别总数和样本总数;d表示空间转换矩阵B中解混向量的个数,也表示空间转换后独立元样本中独立元变量的个数;
步骤4-2:根据循环迭代的思想对类别成员函数vk(BTzi)、空间转换矩阵B和状态投影矩阵α进行求解,具体方法为:
步骤4-2-1:对于固定的类别成员函数vk(BTzi)和空间转换矩阵B,通过优化求解,获得状态投影矩阵α,α=[α12,…,αn]∈Rc×n,为利用表达定理
Figure GDA0002300701010000037
表示类别决策函数f(BTz)时的系数矩阵,其中,αi是矩阵α中的第i个列向量;
步骤4-2-2:当类别决策函数f(BTzi)和空间转换矩阵B为定值时,类别成员函数vk(BTzi)变化的情况下,优化求解获得类别成员函数vk(BTzi);
步骤4-2-3:对于优化求解空间转换矩阵B,固定f(BTzi)和vk(BTzi)本次迭代获得的封闭解,然后利用自然梯度下降法优化求取空间转换矩阵B,用于构建潜在的独立元子空间;
步骤4-2-4:判断目标函数|M(t)-M(t-1)|是否趋近于0,若是,则空间转换矩阵B和状态投影矩阵α求解完毕;否则,利用当前的类别成员函数vk(BTzi)、空间转换矩阵B和状态投影矩阵α返回执行步骤4-2-1;
步骤4-3:根据白化处理后的样本数据Z和求得的空间转换矩阵B,获得样本数据非线性独立元估计信号S,S=BTZ;
步骤5:将历史数据的估计信号S向状态投影空间的各个投影方向投影,根据用户所设定的置信度τ,获得建模样本在各个投影方向上的从属区间,进而构建各个运行状态类别的生产运行状态库;
步骤6:实时采集电熔镁炉炉内熔炼物料表层视频图像和物理变量过程数据,得到新的测试样本数据x0new,根据步骤2和步骤3的方法对新采集的样本数据进行预处理,得到新的白化样本数据znew
步骤7:根据步骤6中处理后的数据,再通过步骤4-2-4求得的空间转换矩阵B和状态投影矩阵α进行初步的故障诊断;根据步骤5获得的各个投影方向的置信区间求得实时工况数据的得分因子sf;依据实时工况数据在各个投影方向的得分因子,计算故障识别置信度统计量,简称FICD统计量,然后根据获得实时工况数据的FICD统计量进行精准的故障识别;
步骤8:判断实时工况数据的状态决策函数f(BTznew)的概率值,同时判断FICD统计量的数值,若状态决策函数的概率值低于0.9或者正常类别的FICD为0,则报警,否则,返回执行步骤6。
所述步骤4-2-1中优化求解获得的状态投影矩阵α如下式所示:
Figure GDA0002300701010000041
其中,G=[Gl,Gu],
Figure GDA0002300701010000042
Figure GDA0002300701010000043
Z=[Zl,Zu]由前nl列标记白化样本和后nu列未标记的白化样本组成,
Figure GDA0002300701010000044
由前nl列标记的LWMR和后nu列未标记的LWMR组成,n=nl+nu,Y表示标记样本的标签矩阵,
Figure GDA0002300701010000045
由C个nu×nu的单位阵组成,
Figure GDA0002300701010000046
由C个Lk组成,Lk的第k行全为1,其他位置为0,
Figure GDA0002300701010000047
是一个对角元素为V中元素平方的对角阵,
Figure GDA0002300701010000048
代表未标记数据的类别成员资格矩阵。
所述步骤4-2-2中优化求解获得的类别成员函数vk(BTzi)如下式所示:
Figure GDA0002300701010000049
其中,si=BTzi
Figure GDA0002300701010000051
vk(si)表示第i个独立元信号属于第k类的类别成员函数,si表示第i个独立元信号,f(si)表示第i个独立元信号的类别决策函数,
Figure GDA0002300701010000052
表示第i个重构独立元信号的类别决策函数,rk表示第k类的标签编码。
所述步骤4-2-3中优化求取的空间转换矩阵B如下式所示:
B+←B-γ·▽M3NGD(B);
其中,B+表示空间转换矩阵B利用上式优化求解得出的当前迭代步骤中的空间转换矩阵;γ为空间转换矩阵B的寻优步长,用户根据需要自定为定步长或变步长;▽M3NGD(B)=▽M3(B)BTB,▽M3(B)为优化求解空间转换矩阵B时目标函数M3的梯度,目标函数M3和梯度▽M3(B)的具体公式分别如下两式所示;
Figure GDA0002300701010000053
Figure GDA0002300701010000054
其中,
Figure GDA0002300701010000055
Qll=ZlYTαZT
Figure GDA0002300701010000056
Figure GDA0002300701010000057
Figure GDA0002300701010000058
tr(·)表示矩阵的迹,rank(I)表示单位阵I的秩,g(·)表示对数概率密度函数logPp(·)的一阶导数,g(ZTB)表示白化样本Z通过空间转换矩阵B转换后的独立元样本S的对数概率密度的一阶导数;Z=[Zl,Zu]由前nl列标记白化样本和后nu列未标记的白化样本组成,
Figure GDA0002300701010000059
由前nl列标记的LWMR和后nu列未标记的LWMR组成,n=nl+nu,Y表示标记样本的标签矩阵,
Figure GDA00023007010100000510
由C个nu×nu的单位阵组成,
Figure GDA00023007010100000511
由C个Lk组成,Lk的第k行全为1,其他位置为0,
Figure GDA00023007010100000512
是一个对角元素为V中元素平方的对角阵,
Figure GDA0002300701010000061
代表未标记数据的类别成员资格矩阵;η为拉格朗日乘子系数,η由下式求出:
Figure GDA0002300701010000062
步骤5所述的建模样本在各个投影方向上从属区间为
Figure GDA0002300701010000063
具体公式为:
Figure GDA0002300701010000064
Figure GDA0002300701010000065
其中,s表示白化样本经过空间转换后得到的独立元样本,Ω=[ω12,…,ωC]为投影方向矩阵,ωq为第q个投影方向,q=1,2,…,C;
Figure GDA0002300701010000066
表示第k类建模样本在第q个投影方向上的概率密度,所述建模样本即为空间转换后的第k类独立元样本;
Figure GDA0002300701010000067
分别表示第k类建模样本投影到第q个投影方向上从属区间的最小值和最大值。
所述步骤7中进行初步故障诊断的具体方法为:
将预处理后的白化样本数据znew投影到状态识别空间,根据类别决策函数
Figure GDA0002300701010000068
去判断样本的类别;对于类别决策函数f(BTznew)的每一个元素fk来说,当fk∈(0,1]时,fk表示x0new属于第k类的概率;当fk≥1,直接令fk=1,即测试样本x0new完全属于第k类;若fk≤0,则认为测试样本x0new不属于第k类。
所述步骤7中求得的实时工况数据的得分因子sf如下式所示:
Figure GDA0002300701010000069
其中,sfkq代表第k类样本在第q个投影方向上的得分因子;
Figure GDA00023007010100000610
分别表示第k类建模样本投影到第q个投影方向上从属区间的最小值和最大值,
Figure GDA00023007010100000611
表示新的待测样本在第q个投影方向上的投影值,其中snew表示转换到独立元空间后的新的待测样本。
所述步骤7中的故障识别置信度统计量FICD按如下公式计算:
Figure GDA0002300701010000071
Figure GDA0002300701010000072
其中,δkq表示第k类样本是否属于第q个投影方向的从属区间,FICDk表示待测样本是否属于第k类。
采用上述技术方案所产生的有益效果在于:本发明提供的基于大数据智能核独立元分析的过程故障识别方法,将KICA方法和半监督分类学习方法相结合形成了SSKICA,实现了充分利用未标记数据的分布特征,根据样本在各个类别的从属概率进行简要的故障诊断,达到了准确检测早期故障和临界稳定样本的目标,最终根据状态投影矩阵和构建相应的统计量对工业过程的运行状态进行故障诊断和精准的故障识别,能有效地提升识别电熔镁炉熔炼运行状态的识别度和准确性。本发明既解决原始的KICA方法应用已知状态比例较低的大数据建模的准确度低的问题,又能利用半监督分类方法在应用大数据进行过程监测时有良好的诊断手段;独立元方法可以去除变量间的强相关性转换到独立的子空间,这对提升分类算法的可分性和准确性提供了帮助。
附图说明
图1为本发明一种实施方式的基于大数据智能核独立元分析的过程故障识别方法流程图;
图2为本发明一种实施方式的不同类别样本在不同投影方向的概率密度图,其中,图(a)是不同类别样本在第一投影方向的概率密度图,图(b)不同类别样本在第二投影方向的概率密度图,图(c)不同类别样本在第三投影方向的概率密度图;
图3为本发明一种实施方式的通过投影到状态特征空间的故障诊断示意图;
图4为本发明一种实施方式的通过投影分析的故障识别示意图;
图5为本发明一种实施方式的电熔镁炉结构和监测系统示意图;
图6为本发明一种实施方式的基于SSKICA的故障诊断结果图;
图7为本发明一种实施方式的空间转换后电熔镁炉不同运行状态的故障诊断结果的二维可视化图;
图8为本发明一种实施方式的电熔镁炉不同运行状态原始数据分布的二维可视化图;
图9为本发明一种实施方式的基于SSKICA的故障识别结果图;
图10为本发明一种实施方式的基于SSCCM的故障诊断结果图;
图11为本发明一种实施方式的基于KICA的故障检测结果图。
图中:1、CCD摄像机;2、石墨电极;3、电极夹持器;4、钢丝绳;5、母线;6、电流互感器;7、电压互感器;8、控制中心;9、原料筒仓;10、振动给料机;11、炉壁;12、导轨。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本实施例提供的基于大数据智能核独立元分析的过程故障识别方法如下所述。
步骤1:采集电熔镁炉炉内熔炼物料表层视频图像和熔炼过程的物理变量,物理变量包括电压、电流和炉壳温度,并对其中明显且已知的运行状态进行标记;
本实施例中,初始的标记数据X0l,其相应的标签为
Figure GDA0002300701010000081
同时初始的未标记的数据集为X0u,X0=[X0l,X0u],样本数n=nl+nu,nl和nu分别为标记样本和未标记样本的数量;
步骤2:对电熔镁炉炉内熔炼物料表层视频图像进行特征提取,同时与物理变量的过程数据放在同一个数据集中作为样本数据;
本实施例中,视频特征提取后与物理变量放在同一个数据集中的标记数据
Figure GDA0002300701010000082
其相应的标签为
Figure GDA0002300701010000083
同时未标记的数据集为
Figure GDA0002300701010000084
X′=[X′l,X′u],样本数n=nl+nu,nl和nu分别为标记样本和未标记样本的数量;
本实施例中,特征提取后的数据集由16个变量组成,建模数据和实时工况数据的特征变量如表1所示。
表1电熔镁炉熔炼过程中的监测变量
Figure GDA0002300701010000085
Figure GDA0002300701010000091
步骤3:对特征提取后得到的样本数据进行数据预处理,包括标准化处理和白化处理。
本实施例中,为了消除变量的量纲和特征变量中的噪声,对特征数据集进行如下的标准化处理:
Figure GDA0002300701010000092
其中,m为变量的数量;
Figure GDA0002300701010000093
s′j分别表示变量的均值和标准差,标准化后的特征数据集X=[Xl,Xu]由标记数据
Figure GDA0002300701010000094
和未标记的数据集
Figure GDA0002300701010000095
组成。
为了进一步去除数据间的相关性,对标准化后的特征数据集进行白化处理,首先样本数据映射到非线性特征空间
Figure GDA0002300701010000096
然后白化数据可以根据如下公式给出:
Figure GDA0002300701010000097
其中,z为白化处理后的样本数据向量,
Figure GDA0002300701010000098
为标准化的核矩阵,Σ和H分别代表
Figure GDA0002300701010000099
的特征值矩阵和特征向量矩阵,P为样本在特征空间中的白化矩阵,n为样本总数。
步骤4:构建半监督核独立元分析算法,获得样本数据的空间转换矩阵和状态投影矩阵,具体步骤如下。
步骤4-1:在核独立元分析算法中引入基于类别成员资格的半监督分类方法,构建出半监督核独立元分析算法的目标函数。
在实际分类的过程中,当标记数据存在于各自类别的边缘时,利用基本的聚类假设“相似的样本含有相同的标签”进行分类会产生很糟糕的标签预测结果,不能充分地反映真实的数据分布状态。因为对于存在于边界处的样本而言,直接给出属于当前类别而不是临近区域类别的判断是很困难的。因此,需要考虑更加准确且充分的聚类假设“给定的样本应该具有与其邻域内相似样本相似的标签,组成邻域内的类别成员资格”,其能够很好地改善标记数据分布位置不好而影响分类结果的缺陷,同时能够充分地利用未标记数据的信息。基于类别成员资格的半监督分类方法(semi-supervised classification based onclass membership,SSCCM)能够充分考虑待分类样本在各个类别的从属类别可能,这对发现早期故障和判定临界稳定状态是极其重要的。下面对基于类别成员资格的半监督分类方法(SSCCM)进行详细的描述。
对于标准化后的特征数据集X=[Xl,Xu],标记数据为
Figure GDA0002300701010000101
其相应的标签为
Figure GDA0002300701010000102
未标记的数据集
Figure GDA0002300701010000103
为了很好地利用标记数据和未标记数据的分布信息且同时兼顾相似样本具有相似类别成员资格的假设,利用k近邻准则对样本数据进行重构,从而在后面分类的过程中用样本数据的估计来训练提高样本数据的标签成员资格的泛化能力获得尽可能的真实可靠的分类器。那么对样本数据进行重构称为局部权重归一化重构处理(local weight normalized reconstruction,LWNR),定义为:
Figure GDA0002300701010000104
其中,Ne(xi)代表样本数据xi邻域内由xj组成的k近邻,近邻关系可通过欧式距离来判定,且xi、xj∈X,Sij代表xi邻域内样本点与其距离的一种度量用于更好地表征离所估计样本点距离越近的点相应获得较大权重的特性,当xi与xj的距离增加时,构建单调递减函数Sij=exp(-||xi-xj||2)。
Figure GDA0002300701010000105
Figure GDA0002300701010000106
分别表示标记样本和未标记样本的LWNR。C个类的成员编码通过
Figure GDA0002300701010000107
来表示,rk表示第k类的标签编码,当xi存在于第k类中时,yi=rk,第k个输入对于每一个yi和rk为1,其余输入为-1。除了常规的类别决策函数f(x),还定义一个C维类别成员资格向量值函数v(x),对于任意的xi,vk(xi)代表第i个样本xi属于第k类的概率。最终,根据相似的样本应该具有相似的类别成员资格这个聚类假设,那么每一个示例和其LWNR都将会获得大致相同的类别成员资格向量,进而可以表示SSCCM为:
Figure GDA0002300701010000108
其中,f(xi)表示第i个样本的类别决策函数,
Figure GDA0002300701010000109
表示第i个重构样本的类别决策函数,λ和λs均为正则化系数,
Figure GDA00023007010100001010
表示类别决策函数的希尔伯特范数,C和n分别表示类别总数和样本总数,b为标签成员函数的指数权重因子用于调控所分类的样本属于各个类别的可能性,在本实施例中,b=2。
对于标记数据,其标签是确定的,也就是其类别成员资格是固定的,即:
Figure GDA0002300701010000111
其中,i=1,…,nl;k=1,…,C;
Figure GDA0002300701010000112
为样本{xi}中属于第k类的一个子集。由于标记数据具有确定的标签,所以式(4)将被转化如下:
Figure GDA0002300701010000113
这样每一个示例对应于所有的类别都有存在于各个类别的可能性,从而降低误分类的可能性。同时,利用LWNR来修正示例的标签同样能够提高分类的准确性。然而,所获取的示例数据间往往存在着耦合情况,若是能够找到数据间潜在的解耦的独立数据关系会大大提高分类的精度和降低分类的难度。因此,期望通过独立元变换在独立元潜空间进行数据简便且准确的分类。
当数据集在一般观测空间时,其获得的观测信号实质是实际现场中某些信号的线性组合或是某些潜在信号的叠加。那么当对常规的信号进行标签处理后,其经过一定的变换后,数据所具有的属性不会出现变化,也就是正常工况数据或是故障工况数据同样应该具有数据变换前具有的标签。基于这样的准则,对观测数据进行独立元分析,从而获取其潜在的独立元信息,即去耦合后的独立元信息将对提高分类器的分类精度有所帮助。由于独立元信息是潜在的且是独立不相关的,那么在独立元所在的空间进行数据分类进而实现在线监测能够在更加深入的层面对工况数据进行分类诊断分析。利用独立元信号信息进行数据分类能够去除原数据间存在的耦合且充分考虑数据的高阶统计量信息,同时对类别决策函数的求取,也就是分类面的优化提供便利。
因此,将KICA方法与SSCCM方法相结合实现在解混的非线性独立元信号空间的分类,从而实现基于半监督分类方法的故障检测与诊断。
当利用极大似然估价的思想去衡量数据潜在信号的独立性时,ICA算法的极大似然目标函数为:
Figure GDA0002300701010000114
上式可以看做是信息的最大化原则,其中,
Figure GDA0002300701010000115
表示第p个独立元信号的概率密度;bp表示空间转换矩阵的第p个列向量,也表示用于求解独立元信号的第p个解混向量;n表示样本数据的采样次数,zi为第i次实际采样的白化向量,detB为空间转换矩阵B的行列式值。
为了简化等式的表达和计算,ICA的极大似然目标函数转化为对数似然函数的期望形式:
Figure GDA0002300701010000121
其中,E{·}为期望。
通过优化等式(8)可以得到正交解混矩阵(空间转换矩阵)B,最后,用于解决工业非线性数据问题的KICA提取出如下的非线性独立元:
Figure GDA0002300701010000122
其中,
Figure GDA0002300701010000123
为标准化的核矩阵,Σ和H分别代表
Figure GDA0002300701010000124
的特征值矩阵和特征向量矩阵。
根据上面的分析,对基于ICA方法获得的独立元依据SSCCM进行数据分类。由于实际监测过程中的数据大部分具有非线性的特点,那么本方法对公式(9)求得的非线性独立元进行分类,SSKICA的目标函数为;
Figure GDA0002300701010000125
Figure GDA0002300701010000126
BTB=I
其中,zi表示第i个白化样本,
Figure GDA0002300701010000127
表示第i个白化样本局部权值归一化重构,所述局部权值归一化重构简称LWMR;vk(BTzi)表示第i个白化样本属于第k类的类别成员函数,B表示空间转换矩阵;f(BTzi)表示第i个白化样本的类别决策函数,
Figure GDA0002300701010000128
表示第i个重构样本的类别决策函数。
步骤4-2:根据循环迭代的思想对类别成员函数vk(BTzi)、空间转换矩阵B和状态投影矩阵α进行求解,具体如下:
步骤4-2-1:对于固定的类别成员函数vk(BTzi)和空间转换矩阵B,优化求解获得状态投影矩阵α;具体如下:
SSKICA的优化问题可以转化为:
Figure GDA0002300701010000131
函数可以利用表达定理
Figure GDA0002300701010000132
进一步转换为:
Figure GDA0002300701010000133
其中,Z=[Zl,Zu]由前nl列标记白化样本和后nu列未标记的白化样本组成,
Figure GDA0002300701010000134
由前nl列标记的LWMR和后nu列未标记的LWMR组成,n=nl+nu,Y表示标记样本的标签矩阵,
Figure GDA0002300701010000135
由C个nu×nu的单位阵组成,
Figure GDA0002300701010000136
由C个Lk组成,Lk的第k行全为1,其他位置为0,
Figure GDA0002300701010000137
是一个对角元素为V中元素平方的对角阵,
Figure GDA0002300701010000138
代表未标记数据的类别成员资格矩阵,αi是一个列向量,α=[α12,…,αn]∈Rc×n是拉格朗日乘子矩阵。
对等式(12)求取一阶导数可以得到:
Figure GDA0002300701010000139
求解获得状态投影矩阵为:
Figure GDA00023007010100001310
其是一个封闭的解析解,其中,G=[Gl,Gu],
Figure GDA00023007010100001311
Figure GDA00023007010100001312
步骤4-2-2:当类别决策函数f(BTzi)和空间转换矩阵B为定值时,类别成员函数vk(BTzi)变化的情况下,SSKICA的目标函数改变为:
Figure GDA0002300701010000141
由于求解过程中与B无关,为了方便表示,BTzi
Figure GDA0002300701010000142
都将被替换为si=BTzi
Figure GDA0002300701010000143
关于vk(BTzi)的目标函数变化为:
Figure GDA0002300701010000144
其中,vk(si)表示第i个独立元信号属于第k类的类别成员函数,si表示第i个独立元信号,f(si)表示第i个独立元信号的类别决策函数,
Figure GDA0002300701010000145
表示第i个重构独立元信号的类别决策函数,λi为拉格朗日乘子系数。
求取式(16)的一阶导数为:
Figure GDA0002300701010000146
可得起驻点为:
Figure GDA0002300701010000147
根据约束信息,可以得到:
Figure GDA0002300701010000148
通过式(19)可以求得λi并代入到式(18)得到关于vk(BTzi)的封闭解如下:
Figure GDA0002300701010000149
Figure GDA00023007010100001410
vk(BTzi)恰满足约束0≤vk(BTzi)≤1,k=1,…,C;i=nl+1,…,n。
步骤4-2-3:对于优化求解B,我们固定f(BTzi)和vk(BTzi)本次迭代获得的封闭解,然后优化求取正交解混矩阵B,用于构建潜在的独立元子空间,关于B的目标函数为:
Figure GDA0002300701010000151
根据拉格朗日乘子法变换为无约束问题并转化为矩阵的表达式为:
Figure GDA0002300701010000152
其中,tr(·)表示矩阵的迹,η为拉格朗日乘子系数,rank(I)表示单位阵I的秩,对B和η求一阶导数可得:
Figure GDA0002300701010000153
Figure GDA0002300701010000154
其中,
Figure GDA0002300701010000155
Qll=ZlYTαZT
Figure GDA0002300701010000156
Figure GDA0002300701010000157
Figure GDA0002300701010000158
一般情况下,对于所有的独立元,对数概率密度函数logPp的一阶导数g(·)都可以选择相同的函数:
g(s)=tanh(s) (26)
为了提高梯度下降法的收敛速度且在迭代中可能发散的问题,使用自然梯度下降法同时迭代步长γ可变(用户可自行选取)那么转化后的自然梯度下降法公式为:
Figure GDA0002300701010000161
进而,得到最终正交解混矩阵的迭代表达式:
B+←B-γ·▽M3NGD(B) (28)
本实施例中,γ=exp(-0.1(t-1))为可变步长,t为循环迭代次数,最大迭代次数tmax=200。空间转换矩阵B每一次迭代后都需要标准化处理。
步骤4-2-4:判断目标函数|M(t)-M(t-1)|是否趋近于0,若是,则空间转换矩阵B和状态投影矩阵α求解完毕;否则,利用当前的类别成员函数vk(BTzi)、空间转换矩阵B和状态投影矩阵α返回执行步骤4-2-1。
步骤4-3、根据白化处理后的样本数据Z和求得的空间转换矩阵B,获得样本数据非线性独立元估计信号S,S=BTZ。
步骤5、将历史数据的估计信号S向状态投影空间的各个投影方向投影,根据用户所设定的置信度τ,获得建模样本在各个投影方向上的从属区间,进而构建各个运行状态类别的生产运行状态库。
本实施例中,独立元投影到特征空间后的基矩阵可表示为
Figure GDA0002300701010000162
即Ω=[ω12,…,ωC],ωq为第q个投影方向,q=1,2,…,C。通过空间转换矩阵B,可以得到独立元样本s=BTz。进而可以定义得分因子(score factor,sf):
Figure GDA0002300701010000163
其中,sfkq代表第k类样本在第q个投影方向上的得分因子;
Figure GDA0002300701010000164
分别表示第k类建模样本投影到第q个投影方向上从属区间的最小值和最大值,
Figure GDA0002300701010000165
表示新的待测样本在第q个投影方向上的投影值,其中snew表示转换到独立元空间后的新的待测样本;
Figure GDA0002300701010000166
Figure GDA0002300701010000167
可以通过统计方式获得。根据从历史数据中随机选择的训练数据,统计分析各个类别数据的概率密度进而选择出各类数据分布最集中的部分作为置信区间,即[τ,1-τ],此外数据分布的边缘部分被视为数据类别(即运行状态)的模糊区域。置信区间的上限和下限可以通过变上下限积分获得,如下两式所示。
Figure GDA0002300701010000171
Figure GDA0002300701010000172
其中,s表示白化样本经过空间转换后得到的独立元样本,
Figure GDA0002300701010000173
表示映射到独立元空间的第k类建模样本在第q个投影方向上的概率密度,建模样本即为空间转换后的第k类独立元样本。
本实施例中,[τ,1-τ]=[0.05,0.95]。
然后,定义如下的统计量去识别测试样本的运行状态。
Figure GDA0002300701010000174
Figure GDA0002300701010000175
其中,δkq表示第k类样本是否属于第q个投影方向的从属区间,FICDk表示待测样本是否属于第k类。如果测试样本转换到独立元空间后投影到状态空间后在某个类别建模运行状态库的从属区间时,δkq为1时。运行状态库是指在投影置信区间内存在各种已知状态样本的数据集,用于新获取的监视样本状态的比较,判断和分析。此外,构建称为故障识别置信度(fault identification confidence degree,FICD)的统计量,以判断被测样本的投影是否位于各个类别的每个投影置信区间中,以排除异常数据并发现新的状态类。
本实施例中,将历史建模数据在状态投影空间的主要投影方向上进行投影,确定各个类别数据在各个投影方向上的从属区间,然后将所有的区间整合在一起形成运行状态库。图2中显示出不同类别数据在不同投影方向上的概率分布情况,在图2(a)、(b)和(c)中,从上到下的三个子图分别表示第1类、第2类和第3类的数据分布情况。根据公式(30)和公式(31),正常运行状态数据在三个主要投影方向上的从属区间为:{[0,1];[-0.53,0.25];[-0.53,0.11]},喷炉状态数据在三个主要投影方向上的从属区间为:{[-0.6,0.12];[0.2,0.91];[-0.55,0]},漏炉状态数据在三个主要投影方向上的从属区间为:{[-0.63,0.05];[-0.6,-0.06];[0,0.8]}。熔炼过程数据从属的运行状态库即构建结束。
步骤6、实时采集电熔镁炉炉内熔炼物料表层视频图像和电压电流温度物理变量过程数据,得到新的测试样本数据x0new,根据步骤2和步骤3的方法对新采集的样本数据进行预处理,得到新的白化样本数据znew
步骤7、根据步骤6中处理后的数据,再通过步骤4-2-4求得的空间转换矩阵B和状态投影矩阵α进行初步的故障诊断;根据步骤5获得的各个投影方向的置信区间求得实时工况数据的得分因子sf,依据实时工况数据在各个投影方向的得分因子,计算故障识别置信度FICD统计量,然后根据获得实时工况数据的FICD统计量进行精准的故障识别。
本实施例中,根据SSKICA方法,可以获得相对准确的分类界面,进而一个新的标准化处理后的观测样本xnew被映射到状态映射空间诊断其属于哪一类的运行状态。基于投影方式的故障诊断示意图如图3所示。由于在实际中我们无法表达高维的特征空间,在图中仅仅说明了非线性映射转换后在三维空间中的三类样本的分类结果,其与高维特征空间的形式是相似的。此示意图表明空间转换后的三类样本经过SSKICA方法对提升分类诊断给予可能,其能够很好地实现不同状态样本的故障诊断。
对于一个新的测试样本xnew,需要将其在高维特征空间中转化为白化数据znew,进一步被投影到状态识别空间根据类别决策函数
Figure GDA0002300701010000181
去判断样本的类别。对于类别决策函数f(BTznew)的每一个元素fk来说,当fk∈(0,1]时,fk表示xnew属于第k类的概率;当fk≥1,直接令fk=1,即测试样本xnew完全属于第k类;若fk≤0,则认为测试样本xnew不属于第k类。
因为这种诊断方式仅仅依靠数据投影后的部分信息,因此这种故障诊断方法仅作为粗略的初步诊断分析。
通过上面的映射,仅在转换后的独立空间中判断识别样本的大致位置,但是无法确定测试样本的确切位置信息,从而不能很好地识别出新的故障类别,并且可能对工业过程的运行状态给出错误的判断。因此,需要构建一种精确的基于SSKICA的故障识别方法。
对于从工业过程获得的数据,其不同类别的分布都是明确的。因此,各种类型的数据应该根据各自类别的分布进行大致的聚集。然而有异常样本出现时,数据的分布会表现出意想不到的结果。此外,可以将历史训练数据投影到独立元故障诊断空间中的每个轴上,以便学习各种数据类型的分布,从而更准确地排除异常样本,找到新类并确定工业过程的运行状态。样本的分布将由核密度拟合给出。这种故障识别的示意图如图4所示。
步骤8、判断实时工况数据的状态决策函数f(BTznew)的概率值,同时判断FICD统计量的数值,若是正常类别的状态决策函数的概率值低于0.9或者若是正常类别的FICD为0则报警;否则,返回执行步骤6。
电熔镁炉是一种埋弧炉,通过悬于其上方的电极传输大电流产生高温电弧,在菱镁矿粉层的下方形成超高温熔池,从而实现氧化镁的制取。整个炉体通过炉壳内耐高温绝缘材料,使炉体内部形成一个几乎封闭的熔炼空间,使得碳酸镁分解成氧化镁和二氧化碳。在熔炼的过程中往往由于电流大小的不平衡或是电极位置的微小偏离,都会使得产生的二氧化碳气体排放异常产生喷炉故障;由于电极的提升位置异常或是电流过大使得漏炉故障发生。因此,为了在实际生产中,及时的规避故障的发生,进行实时有效的故障诊断,准确的识别出故障及时报警,降低生产中的安全隐患是必要的。电熔镁炉的结构和监测系统示意图如图5所示。
在进行运行状态的识别过程中,随机选择600个历史样本建立模型,其中正常状态、喷炉状态(故障1)和漏炉状态(故障2)各为200个,各个类别的标记样本为20个。然后再随机选择300个历史数据点作为测试数据集,各个类别为100个。本实施例中,选择正则化系数λ和λs分别为1和0.15。
首先,根据SSKICA方法通过建模获得的状态投影矩阵B对测试样本进行简略的故障诊断,故障诊断结果如图6所示。本实施例中,认为第k类决策函数值大于0.9的样本即从属于第k类,同时第k类概率值为1的点则完全属于第k类。通过图6可以发现,SSKICA应用于故障诊断时,其性能是比较令人满意的。当测试状态分别处于正常运行状态,故障1和故障2时,所改进的SSKICA算法几乎对每一个测试样本都能检测并诊断。即使存在一定的误报和漏报,但是比例也是极低的且在可接受的范围内。
SSKICA算法是在独立元空间监测样本的状态。原始数据通过空间转换映射到独立元空间,SSKICA对于不同运行状态故障诊断的二维可视化结果如图7所示。在图7中,通过观察各个运行状态的建模样本和测试样本,发现SSKICA方法可以在半监督建模的条件下对电熔镁炉的运行状态进行有效地监测。这是由于算法充分考虑了未标记数据分布特征信息的结果。在图8中展示了原始样本数据的分布形式。故障1与故障2和正常状态数据集都有一定的重叠和交叉,这对于分类算法的识别结果的影响是巨大的。而在观察图7时,发现经过空间转换后的独立元数据交叉和重叠的区域大大减少,这对后续的分类工作会带来大大的帮助。通过图7和图8的对比,因为独立元能够使数据间的耦合解除,去除数据间的相关性,所以将独立元分析和半监督分类学习相结合应用于故障诊断是可行的。
在上面的算法测试中,已经验证将数据映射到独立元空间再进行特征分类优势明显且效果显著。进一步,为了更加准确地识别出电熔镁炉的运行状态,通过基于半监督核独立元分析的故障识别方法进行过程监测。下面根据步骤5构建的运行状态库,应用统计量FICD识别测试数据的运行状态,识别结果见图9。
在图9中,发现应用FICD可以准确识别出电熔镁炉真实的运行状态。然而,发现SSKICA算法在识别故障的过程中,正常运行状态存在误报情况,同时在喷炉和漏炉故障发生的情况下也发生了漏报。幸运的是,上述误报和漏报状态的比例是极低的,这样的结果也是令人满意的。
最后,为了显示出所改进算法良好的故障诊断性能,将SSKICA的监测结果与原始的SSCCM和KICA算法在电熔镁炉运行状态的过程监测结果进行比较。SSCCM算法的状态识别结果和KICA算法的故障检测结果分别展示在图10和图11中。图10说明了SSCCM算法在故障识别过程中也有良好的性能,但是通过比较图6和图10的监测结果,当运行于相应状态时,SSCCM决策出低于0.9的样本明显多于SSKICA。此外,根据图9的结果,SSKICA方法应用于故障识别时还可以给出准确的诊断结果,同时识别率更高。这再次展示出数据转换到独立元空间后再进行分类诊断的优势。在图11中,KICA算法应用T2和SPE统计量对电熔镁炉的运行状状态检测。可以发现KICA在正常状态出现了误报,在故障状态下出现了大量的漏报。这是由于建模数据仅利用了少量正常标记数据的结果,导致了算法的泛化能力大大下降。这也充分说明传统的KICA方法应用于已知状态较低的大数据为基础故障检测时有一定的困难。此外,传统的KICA算法仅仅能进行过程检测,并不能在检测的同时直接识别出故障的类型。
为了更加直观的比较出所提出算法的先进性能,将不同算法的检测率和诊断率总结在表2中。其中,检测率表示算法对正常运行状态的识别程度,即此时是正常运行还是故障运行。诊断率代表对当前运行状态的识别程度,即是正常状态,故障1还是故障2。因此诊断率仅考虑SSKICA算法和SSCCM算法。根据表2中的数据,再一次印证了SSKICA的优势。
表2.算法性能比较
算法 检测率 诊断率
SSKICA 97.33% 96.67%
SSCCM 97% 93.33%
KICA-T<sup>2</sup> 87.33%
KICA-SPE 89.67%
SSKICA方法在电熔镁炉过程监测的应用中展现出了优越的性能,这为规避电熔镁炉故障的出现并及时报警提供了帮助。通过实验分析,样本转换到独立元空间后对提高故障识别的准确度提供了可能。所构建的运行状态库和故障识别统计量使得运行状态的识别更加精准。此外,半监督分类方法和KICA相结合能够有效地处理当前的海量数据问题。同时,所提出的方法汲取了SSCCM方法的优势,对早期故障点和临界稳定点的检测更加准确,从而大大降低误报和漏报。总而言之,SSKICA方法能够解决电熔镁炉熔炼过程中喷炉和漏炉的检测和诊断问题,而且是行之有效的。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (8)

1.一种基于大数据智能核独立元分析的过程故障识别方法,其特征在于:包括以下步骤:
步骤1:采集电熔镁炉炉内熔炼物料表层视频图像和熔炼过程的物理变量,物理变量包括电压、电流和炉壳温度,并对其中明显且已知的运行状态进行标记;
步骤2:对电熔镁炉炉内熔炼物料表层视频图像进行特征提取,同时与物理变量的过程数据放在同一个数据集中作为样本数据;
步骤3:对特征提取后得到的样本数据进行数据预处理,包括标准化处理和白化处理,得到处理后的样本数据Z;
步骤4:构建半监督核独立元分析算法,获得样本数据的空间转换矩阵和状态投影矩阵,具体步骤如下:
步骤4-1:在核独立元分析算法中引入基于类别成员资格的半监督分类方法,构建出半监督核独立元分析算法的目标函数,具体公式如下:
Figure FDA0002300701000000011
其中,zi表示第i个白化样本,
Figure FDA0002300701000000012
表示第i个白化样本的局部权值归一化重构,所述局部权值归一化重构简称LWMR;rk表示第k类的标签编码;vk(BTzi)表示第i个白化样本属于第k类的类别成员函数,B表示空间转换矩阵;f(BTzi)表示第i个白化样本的类别决策函数,
Figure FDA0002300701000000013
表示第i个重构样本的类别决策函数;λ和λs均为正则化系数;E{·}为期望;
Figure FDA0002300701000000014
表示第p个独立元信号的概率密度;bp表示空间转换矩阵的第p个列向量,也表示用于求解独立元信号的第p个解混向量;detB表示空间转换矩阵B的行列式值,
Figure FDA0002300701000000015
表示类别决策函数的希尔伯特范数,C和n分别表示类别总数和样本总数;d表示空间转换矩阵B中解混向量的个数,也表示空间转换后独立元样本中独立元变量的个数;
步骤4-2:根据循环迭代的思想对类别成员函数vk(BTzi)、空间转换矩阵B和状态投影矩阵α进行求解,具体方法为:
步骤4-2-1:对于固定的类别成员函数vk(BTzi)和空间转换矩阵B,通过优化求解,获得状态投影矩阵α,α=[α12,…,αn]∈Rc×n,为利用表达定理
Figure FDA0002300701000000021
表示类别决策函数f(BTz)时的系数矩阵,其中,αi是矩阵α中的第i个列向量;
步骤4-2-2:当类别决策函数f(BTzi)和空间转换矩阵B为定值时,类别成员函数vk(BTzi)变化的情况下,优化求解获得类别成员函数vk(BTzi);
步骤4-2-3:对于优化求解空间转换矩阵B,固定f(BTzi)和vk(BTzi)本次迭代获得的封闭解,然后利用自然梯度下降法优化求取空间转换矩阵B,用于构建潜在的独立元子空间;
步骤4-2-4:判断目标函数|M(t)-M(t-1)|是否趋近于0,若是,则空间转换矩阵B和状态投影矩阵α求解完毕;否则,利用当前的类别成员函数vk(BTzi)、空间转换矩阵B和状态投影矩阵α返回执行步骤4-2-1;
步骤4-3:根据白化处理后的样本数据Z和求得的空间转换矩阵B,获得样本数据非线性独立元估计信号S,S=BTZ;
步骤5:将历史数据的估计信号S向状态投影空间的各个投影方向投影,根据用户所设定的置信度τ,获得建模样本在各个投影方向上的从属区间,进而构建各个运行状态类别的生产运行状态库;
步骤6:实时采集电熔镁炉炉内熔炼物料表层视频图像和物理变量过程数据,得到新的测试样本数据x0new,根据步骤2和步骤3的方法对新采集的样本数据进行预处理,得到新的白化样本数据znew
步骤7:根据步骤6中处理后的数据,再通过步骤4-2-4求得的空间转换矩阵B和状态投影矩阵α进行初步的故障诊断;根据步骤5获得的各个投影方向的置信区间求得实时工况数据的得分因子sf;依据实时工况数据在各个投影方向的得分因子,计算故障识别置信度统计量,简称FICD统计量,然后根据获得实时工况数据的FICD统计量进行精准的故障识别;
步骤8:判断实时工况数据的状态决策函数f(BTznew)的概率值,同时判断FICD统计量的数值,若状态决策函数的概率值低于0.9或者正常类别的FICD为0,则报警,否则,返回执行步骤6。
2.根据权利要求1所述的基于大数据智能核独立元分析的过程故障识别方法,其特征在于:所述步骤4-2-1中优化求解获得的状态投影矩阵α如下式所示:
Figure FDA0002300701000000022
其中,G=[Gl,Gu],
Figure FDA0002300701000000031
Figure FDA0002300701000000032
Z=[Zl,Zu]由前nl列标记白化样本和后nu列未标记的白化样本组成,
Figure FDA0002300701000000033
由前nl列标记的LWMR和后nu列未标记的LWMR组成,n=nl+nu,Y表示标记样本的标签矩阵,
Figure FDA0002300701000000034
由C个nu×nu的单位阵组成,
Figure FDA0002300701000000035
由C个Lk组成,Lk的第k行全为1,其他位置为0,
Figure FDA0002300701000000036
是一个对角元素为V中元素平方的对角阵,
Figure FDA0002300701000000037
代表未标记数据的类别成员资格矩阵。
3.根据权利要求1所述的基于大数据智能核独立元分析的过程故障识别方法,其特征在于:所述步骤4-2-2中优化求解获得的类别成员函数vk(BTzi)如下式所示:
Figure FDA0002300701000000038
其中,si=BTzi
Figure FDA0002300701000000039
vk(si)表示第i个独立元信号属于第k类的类别成员函数,si表示第i个独立元信号,f(si)表示第i个独立元信号的类别决策函数,
Figure FDA00023007010000000310
表示第i个重构独立元信号的类别决策函数,rk表示第k类的标签编码。
4.根据权利要求1所述的基于大数据智能核独立元分析的过程故障识别方法,其特征在于:所述步骤4-2-3中优化求取的空间转换矩阵B如下式所示:
Figure FDA00023007010000000311
其中,B+表示空间转换矩阵B利用上式优化求解得出的当前迭代步骤中的空间转换矩阵;γ为空间转换矩阵B的寻优步长,用户根据需要自定为定步长或变步长;
Figure FDA00023007010000000312
Figure FDA00023007010000000313
为优化求解空间转换矩阵B时目标函数M3的梯度,目标函数M3和梯度
Figure FDA00023007010000000314
的具体公式分别如下两式所示;
Figure FDA00023007010000000315
Figure FDA0002300701000000041
其中,
Figure FDA0002300701000000042
Qll=ZlYTαZT
Figure FDA0002300701000000043
Figure FDA0002300701000000044
Figure FDA0002300701000000045
tr(·)表示矩阵的迹,rank(I)表示单位阵I的秩,g(·)表示对数概率密度函数logPp(·)的一阶导数,g(ZTB)表示白化样本Z通过空间转换矩阵B转换后的独立元样本S的对数概率密度的一阶导数;Z=[Zl,Zu]由前nl列标记白化样本和后nu列未标记的白化样本组成,
Figure FDA0002300701000000046
由前nl列标记的LWMR和后nu列未标记的LWMR组成,n=nl+nu,Y表示标记样本的标签矩阵,
Figure FDA0002300701000000047
由C个nu×nu的单位阵组成,
Figure FDA0002300701000000048
由C个Lk组成,Lk的第k行全为1,其他位置为0,
Figure FDA0002300701000000049
是一个对角元素为V中元素平方的对角阵,
Figure FDA00023007010000000410
代表未标记数据的类别成员资格矩阵;η为拉格朗日乘子系数,η由下式求出:
Figure FDA00023007010000000411
5.根据权利要求1所述的基于大数据智能核独立元分析的过程故障识别方法,其特征在于:步骤5所述的建模样本在各个投影方向上从属区间为
Figure FDA00023007010000000412
具体公式为:
Figure FDA00023007010000000413
Figure FDA00023007010000000414
其中,s表示白化样本经过空间转换后得到的独立元样本,Ω=[ω12,…,ωC]为投影方向矩阵,ωq为第q个投影方向,q=1,2,…,C;
Figure FDA00023007010000000415
表示第k类建模样本在第q个投影方向上的概率密度,所述建模样本即为空间转换后的第k类独立元样本;
Figure FDA00023007010000000416
分别表示第k类建模样本投影到第q个投影方向上从属区间的最小值和最大值。
6.根据权利要求1所述的基于大数据智能核独立元分析的过程故障识别方法,其特征在于:所述步骤7中进行初步故障诊断的具体方法为:
将预处理后的白化样本数据znew投影到状态识别空间,根据类别决策函数
Figure FDA0002300701000000051
去判断样本的类别;对于类别决策函数f(BTznew)的每一个元素fk来说,当fk∈(0,1]时,fk表示x0new属于第k类的概率;当fk≥1,直接令fk=1,即测试样本x0new完全属于第k类;若fk≤0,则认为测试样本x0new不属于第k类。
7.根据权利要求1所述的基于大数据智能核独立元分析的过程故障识别方法,其特征在于:所述步骤7中求得的实时工况数据的得分因子sf如下式所示:
Figure FDA0002300701000000052
其中,sfkq代表第k类样本在第q个投影方向上的得分因子,q=1,2,…,C;
Figure FDA0002300701000000053
Figure FDA0002300701000000054
分别表示第k类建模样本投影到第q个投影方向上从属区间的最小值和最大值,
Figure FDA0002300701000000055
表示新的待测样本在第q个投影方向上的投影值,其中snew表示转换到独立元空间后的新的待测样本。
8.根据权利要求7所述的基于大数据智能核独立元分析的过程故障识别方法,其特征在于:所述步骤7中的故障识别置信度统计量FICD按如下公式计算:
Figure FDA0002300701000000056
Figure FDA0002300701000000057
其中,δkq表示第k类样本是否属于第q个投影方向的从属区间,q=1,2,…,C;FICDk表示待测样本是否属于第k类。
CN201711325148.2A 2017-12-13 2017-12-13 基于大数据智能核独立元分析的过程故障识别方法 Active CN108182445B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711325148.2A CN108182445B (zh) 2017-12-13 2017-12-13 基于大数据智能核独立元分析的过程故障识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711325148.2A CN108182445B (zh) 2017-12-13 2017-12-13 基于大数据智能核独立元分析的过程故障识别方法

Publications (2)

Publication Number Publication Date
CN108182445A CN108182445A (zh) 2018-06-19
CN108182445B true CN108182445B (zh) 2020-05-19

Family

ID=62546155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711325148.2A Active CN108182445B (zh) 2017-12-13 2017-12-13 基于大数据智能核独立元分析的过程故障识别方法

Country Status (1)

Country Link
CN (1) CN108182445B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108830006B (zh) * 2018-06-27 2022-02-18 中国石油大学(华东) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN109143851B (zh) * 2018-07-11 2021-06-01 佛山科学技术学院 多标记故障深度学习的识别及其结果智能表达的方法
CN109961428B (zh) * 2019-03-13 2023-10-20 东北大学 基于流形的非负矩阵分解电熔氧化镁工业故障检测方法
CN110221590B (zh) * 2019-05-17 2021-06-11 华中科技大学 一种基于判别分析的工业过程多故障诊断方法
CN110605393B (zh) * 2019-09-25 2021-06-08 中国兵器装备集团自动化研究所 一种激光立体成形过程检测方法及系统和应用
CN111062848A (zh) * 2019-11-26 2020-04-24 深圳大学 一种消防工程异常状态监测的智能监控方法
CN110991566B (zh) * 2019-12-26 2022-09-27 东北石油大学 通过信息融合方式进行风力发电机故障诊断的方法和装置
CN111650453B (zh) * 2020-05-25 2021-03-30 武汉大学 基于加窗特征希尔伯特图像化的电力设备诊断方法及系统
CN111914471A (zh) * 2020-06-13 2020-11-10 宁波大学 一种基于快速核独立成分分析的精馏塔故障检测方法
CN113420815B (zh) * 2021-06-24 2024-04-30 江苏师范大学 半监督rsdae的非线性pls间歇过程监测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069137A (zh) * 2015-08-18 2015-11-18 苏州大学张家港工业技术研究院 一种基于概念分解的半监督文档分类方法及系统
CN106839769A (zh) * 2017-03-24 2017-06-13 东北大学 基于多流形半监督局部‑全局的电熔镁炉故障监测方法
CN106907927A (zh) * 2017-04-05 2017-06-30 东北大学 一种核灵活流形嵌入电熔镁炉故障监测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011156001A1 (en) * 2010-06-07 2011-12-15 Sti Medical Systems, Llc Versatile video interpretation,visualization, and management system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069137A (zh) * 2015-08-18 2015-11-18 苏州大学张家港工业技术研究院 一种基于概念分解的半监督文档分类方法及系统
CN106839769A (zh) * 2017-03-24 2017-06-13 东北大学 基于多流形半监督局部‑全局的电熔镁炉故障监测方法
CN106907927A (zh) * 2017-04-05 2017-06-30 东北大学 一种核灵活流形嵌入电熔镁炉故障监测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Fault Detection of Non-Linear Processes Using Kernel Independent Component Analysis;Jong-Min Lee 等;《CHEMICAL ENGINEERING》;20070831;第85卷;第526-536页 *
Semi-supervised kernel partial least squares fault detection and identification approach with application to HGPWLTP;Qilong Jia 等;《CHEMOMETRICS》;20161231;第1-9页 *
基于DKPLS的非线性过程故障检测;张颖伟 等;《华中科技大学学报(自然科学版)》;20090831;第37卷;第58-61页 *

Also Published As

Publication number Publication date
CN108182445A (zh) 2018-06-19

Similar Documents

Publication Publication Date Title
CN108182445B (zh) 基于大数据智能核独立元分析的过程故障识别方法
CN110070074B (zh) 一种构建行人检测模型的方法
Yan et al. Unsupervised body part regression via spatially self-ordering convolutional neural networks
Bi et al. An improved multi-task learning approach with applications in medical diagnosis
CN111582349B (zh) 一种基于YOLOv3和核相关滤波改进的目标跟踪算法
CN110880024B (zh) 基于判别核慢特征分析的非线性过程故障辨识方法及系统
Zhu et al. Ordinal distribution regression for gait-based age estimation
Bi et al. Adaboost on low-rank psd matrices for metric learning
Wang et al. Rethinking the learning paradigm for dynamic facial expression recognition
Kunda et al. Improving multi-site autism classification via site-dependence minimization and second-order functional connectivity
CN108985161B (zh) 一种基于拉普拉斯正则化的低秩稀疏表征图像特征学习方法
CN114494973B (zh) 视频语义分割网络的训练方法、系统、设备及存储介质
CN116030538B (zh) 弱监督动作检测方法、系统、设备及存储介质
CN110874576B (zh) 一种基于典型相关分析融合特征的行人再识别方法
CN116309459A (zh) 基于改进网络的肺结节检测方法、装置、设备和存储介质
Wang et al. Prototype transfer generative adversarial network for unsupervised breast cancer histology image classification
Zhu et al. Semi-supervised multi-view fusion for identifying CAP and COVID-19 with unlabeled CT images
Huang et al. Evaluating and boosting uncertainty quantification in classification
Tian et al. Unsupervised road anomaly detection with language anchors
CN110045691B (zh) 一种多源异构大数据的多任务处理故障监测方法
Sameki et al. ICORD: Intelligent Collection of Redundant Data-A Dynamic System for Crowdsourcing Cell Segmentations Accurately and Efficiently.
Li et al. Efficient anomaly detection with budget annotation using semi-supervised residual transformer
Song et al. Generative method to discover emphysema subtypes with unsupervised learning using lung macroscopic patterns (LMPS): The MESA COPD study
CN108182302B (zh) 基于修改聚类半监督核主元分析的早期故障检测方法
CN116596836A (zh) 基于多视图邻域证据熵的肺炎ct影像属性约简方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant