CN113110403B - 一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统 - Google Patents

一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统 Download PDF

Info

Publication number
CN113110403B
CN113110403B CN202110568794.1A CN202110568794A CN113110403B CN 113110403 B CN113110403 B CN 113110403B CN 202110568794 A CN202110568794 A CN 202110568794A CN 113110403 B CN113110403 B CN 113110403B
Authority
CN
China
Prior art keywords
matrix
data set
data
kernel
industrial process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110568794.1A
Other languages
English (en)
Other versions
CN113110403A (zh
Inventor
黄科科
阳春华
文昊飞
孙备
李勇刚
桂卫华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202110568794.1A priority Critical patent/CN113110403B/zh
Publication of CN113110403A publication Critical patent/CN113110403A/zh
Application granted granted Critical
Publication of CN113110403B publication Critical patent/CN113110403B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0262Confirmation of fault detection, e.g. extra checks to confirm that a failure has indeed occurred
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统,其方法为:获取工业过程的历史数据集,设置隔离矩阵并添加到历史数据集的核字典学习目标函数中,利用L0范数对隔离矩阵的非零元素的个数加以约束,优化求解隔离矩阵;根据隔离矩阵对角线元素的均值和方差设置纯净样本取值区间,将取值不属于该区间的样本从历史数据样本集中剔除,得到纯净数据集;基于纯净数据集构建核字典,再利用核字典计算重构误差并设置工业过程监控的控制限;在线获取工业过程的待监测数据,通过计算重构误差并将其与控制限比较,根据比较结果判断工业系统是否异常。本发明对工业过程中的噪声有着良好的鲁棒性,可以有效进行过程监测。

Description

一种基于稀疏约束的工业过程离群点检测与故障诊断方法和 系统
技术领域
本发明属于工业过程监测领域,具体是指一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统。
背景技术
如今,随着工业系统的不断发展,许多工业过程都可以用数据模型的方式在信息空间中表达。然而,工业系统底层的物理设备往往处在恶劣的工业环境中,容易受到工业噪声的影响。比如网络通信波动,传感器失效等意外故障,使得采集到的数据往往存在着离群点。这类离群点在统计学上具有低密度和高残差的特性。与正常数据相比,离群点往往是稀疏的。此外,工业生产过程通常在非线性模式下工作。例如,在风机运行过程中,随着风速的增大,风机的功率通常也会随着增大。然而当风速达到一定程度后,功率却不再变化,因此,很难用一个线性的关系来描述过程变量间的关系。对于工业生产过程,不正确的动作可能会损害操作模式,从而进一步降低整个系统的性能,导致经济损失甚至造成巨大的人员伤亡。因此,工业过程运行状态的监测极为重要。目前,工业过程的在线监测方法往往依赖于专家经验,对过程数据的利用还很不充足。
数据驱动方法将多元统计和机器学习方法应用于工业过程的运行过程监测,这已成为过去二十年来学术界和工业界最富有成效的领域之一。多变量统计过程监控(MSPM)是一个有吸引力的分支,已经获得了相当大的研究兴趣。在MSPM中,有两种典型的方法:主成分分析(PCA)和偏最小二乘(PLS),这些方法已被广泛研究。对于PCA方法,Jackson在1991年总结了异常情况检测的开创性工作。通常,T2和SPE统计用于以联合方式检测失控情况。同时,其他互补的MSPM技术,如核学习方法(KPCA),动态主成分分析(DPCA),鲁棒主成分分析(RPCA)已被研究,以减轻基于PCA和PLS的方法的一些限制。
最近,提出了一种受稀疏编码思想启发的字典学习方法,由于其出色的泛化能力,在模式识别,图像处理和计算机视觉等许多领域得到了极大的关注。通常,字典学习方法被设计为在不使用训练数据中的标签信息的情况下学习用于特征提取的字典。为了使字典具有判别性,Jiang提出了LC-KSVD方法,它可以联合学习一个超完备字典和最优线性分类器。Yang提出来FDDL方法,能使不同类别的字典原子相互分开。Peng等人提出了一种局部保持的LPDL字典模型,使得数据间的局部特征在稀疏编码上得以保留。但是他们中的许多人都没有考虑实际工业过程中存在的非线性关系和离群点。这种假设与实际工业过程不一致,导致这些方法的性能有限。
发明内容
本发明提供一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统,可以自适应的对训练数据中的离群点进行剔除,使用纯净数据集训练核字典,提高过程监测的准确性和鲁棒性。
为实现上述技术目的,本发明采用如下技术方案:
一种基于稀疏约束的工业过程离群点检测与故障诊断方法,包括:
获取实际工业过程采集的历史数据集,设置历史数据集的隔离矩阵,将隔离矩阵添加到历史数据集的核字典学习目标函数中,并利用L0范数对隔离矩阵的非零元素的个数加以约束,优化求解隔离矩阵;
计算隔离矩阵的所有对角线元素的均值和方差,根据均值和方差设置纯净样本取值区间,将取值不属于纯净样本取值区间的样本从历史数据样本集中剔除,得到纯净数据集;
基于纯净数据集构建离线的核字典,再利用核字典计算纯净数据样本集的重构误差,并基于重构误差、利用核密度估计获取工业过程监控的控制限;
在线获取工业过程的待监测数据,计算待监测数据在核字典下的重构误差,并将待监测数据的重构误差与控制限比较,根据比较结果判断工业系统是否异常。
在更优的技术方案中,所述将隔离矩阵添加到历史数据集的核字典学习目标函数中,并利用L0范数对隔离矩阵的非零元素的个数加以约束,表示为:
Figure GDA0003569683420000021
式中,Y表示历史数据集,Y=[y1,y2,...,yN]∈Rm×N,y1,y2,...,yN分别为Y中的N个历史数据样本,每个数据样本由m个传感器数据组成;Φ(·)表示映射后的高维数据;A表示核字典,字典大小为K;X为历史数据集Y的稀疏编码矩阵,X=[x1,x2,...,xN]∈RK×N,x1,x2,...,xN分别为y1,y2,...,yN对应的稀疏编码,xi为X中的第i个稀疏编码;R表示隔离矩阵,且R的大小为N×N;r是由R的对角线元素构成的一个列向量,r中元素值的大小反映了对应位置的样本是离群点的可能性,||·||0表示0范数;||·||F表示F范数;T表示稀疏编码矩阵X中的每一列非零元素个数设定值。
在更优的技术方案中,采用迭代交替优化求解隔离矩阵,具体为:
首先,固定X,R的取值不变,采取按列更新的方式更新变量A,ak表示A的第k列,
Figure GDA0003569683420000022
表示X的第k行,式(1)可写成如下形式:
Figure GDA0003569683420000031
定义集合
Figure GDA0003569683420000032
表示
Figure GDA0003569683420000033
中非零项所在索引的索引集,定义Ωk为N×|ωk|矩阵,且Ωk在(ωk(i),i)处的值为1,其余值均为0;将
Figure GDA0003569683420000034
Ek分别与Ωk相乘后即可得到收缩后的矩阵
Figure GDA0003569683420000035
Figure GDA0003569683420000036
对ak求导后,得到ak的解析解:
Figure GDA0003569683420000037
接着,固定A,R的取值不变,采取按列更新的方式更新变量X;
Figure GDA0003569683420000038
通过核正交匹配追踪法,得到式(4)的优化结果为:
Figure GDA0003569683420000039
式(5)中,K(g)为核函数,Ki,j=Φ(yi)TΦ(yj);矩阵AS由矩阵A中与
Figure GDA00035696834200000310
中非零项对应的列构成;
最后,固定X,A的取值不变,更新变量R:基于||r||0不可导,首先对其余可导部分求解,得到下式:
Figure GDA00035696834200000311
其中,KYY为K(Y,Y)的简写形式,
Figure GDA00035696834200000312
表示对公式(1)中可求导的部分对R求偏导,则可导部分的梯度下降的解为
Figure GDA00035696834200000313
上标j表示当前迭代次数,μ表示梯度下降的步长;再将不可导的部分加入到约束中,得到:
Figure GDA00035696834200000314
式中,
Figure GDA00035696834200000315
表示实数域,R*是没有考虑不可导部分的最优解,R是考虑了不可导部分的最优解;通过代数运算后,得到R的优化结果为:
Figure GDA0003569683420000041
式中,
Figure GDA0003569683420000042
表示R*的第i行第i列的元素,
Figure GDA0003569683420000043
表示第j次迭代得到的隔离矩阵Rj的第i行第i列的元素;
不断重复式(2)-(8),直至算法达到设定的迭代次数。
在更优的技术方案中,根据均值和方差设置的纯净样本取值区间为[μ-2σ,μ+2σ],μ和σ分别为隔离矩阵所有对角线元素的均值和方差。
在更优的技术方案中,基于纯净数据集构建离线的核字典时,隔离矩阵R为0矩阵,采用迭代交替优化求解的方法,求解得到核字典Ac和稀疏编码矩阵Xc
在更优的技术方案中,所述利用核字典计算纯净数据集的重构误差,其中纯净数据集Yc第i个数据样本yci的重构误差的计算式为:
Figure GDA0003569683420000044
式中,eci为数据样本yci的重构误差,Ac为纯净数据集的核字典,Xc为纯净数据集Yc对应的稀疏编码矩阵,xci为稀疏编码矩阵Xc中的第i个稀疏编码;
然后,根据计算得到的重构误差,利用核密度估计方法得到纯净数据集的密度函数为:
Figure GDA0003569683420000045
其中,e泛指待拟合的纯净数据集的重构误差分布,n为纯净数据集中的样本总数,K[·]为高斯核函数;
Figure GDA0003569683420000046
是指在给定带宽矩阵H下,通过所有样本的重构误差拟合出的密度函数曲线;
最终以核密度函数在设定置信度下的取值作为控制限。
在更优的技术方案中,所述在线获取工业过程的待监测数据,计算待监测数据在核字典下的重构误差,具体为:
首先,利用核字典得到待监测数据ynew的稀疏编码xnew和重构误差enew分别为:
Figure GDA0003569683420000047
enew=K(ynew,ynew)-2K(ynew,Yc)Acxnew+xnew TAc TK(Yc,Yc)Acxnew (10)
式中,Yc为纯净数据集,Ac为纯净数据集的核字典,x泛指待求解的稀疏编码,K[·]为高斯核函数;
然后,将待监测数据的重构误差enew与控制限drr进行比较,以确定待监测数据是否正常,若待监测数据的重构误差enew大于阈值drr,则判断当前工业过程正常,否则判断当前工业过程异常。
在更优的技术方案中,所述工业过程具体为风力发电过程,数据样本包括有功功率、三相电流、三相电压、齿轮轴温度、齿轮箱油温和风速。
一种基于稀疏约束的工业过程离群点检测与故障诊断系统,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现上述任一技术方案所述的一种基于稀疏约束的工业过程离群点检测与故障诊断方法。
有益效果
为了适应复杂多变的工业过程,本发明提出的一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统,其中的核字典学习方法是一种新的鲁棒核字典学习方法(RKDL),首先建立一个鲁棒模型,利用离群点具有的稀疏特性,得到一个隔离矩阵对离群点进行自适应过滤,即可以自适应的对训练数据中的离群点进行剔除,再使用纯净数据集训练核字典,进而使用该字典对工业过程进行监测;另一方面本发明在高维空间中提取数据样本的特征,得到一个核字典来进行表征,因此可以更精确学习非线性数据中的特性,且对风力发电等工业过程中的噪声有着良好的鲁棒性,可以有效的进行过程监测。该方法无需过程先验知识,无需过程的标签数据,能够自适应的降低工业噪声的影响同时避免求解复杂的非线性优化问题,能够准确的监测过程的运行状态并对异常数据进行分析,为工业过程的安全生产提供了保证。
附图说明
图1是本发明实施例1所述方法的流程图。
具体实施方式
下面对本发明的实施例作详细说明,本实施例以本发明的技术方案为依据开展,给出了详细的实施方式和具体的操作过程,对本发明的技术方案作进一步解释说明。
实施例1
本实施例提供一种基于稀疏约束的工业过程离群点检测与故障诊断方法,如图1所示,包括:
1)获取实际工业过程采集的历史数据集,设置历史数据集的隔离矩阵,将隔离矩阵添加到历史数据集的核字典学习目标函数中,并利用L0范数对隔离矩阵的非零元素的个数加以约束,优化求解隔离矩阵。
在实际工业过程,若干个传感器在同一时刻采集到的数据往往被表示为一个样本。本实施例针对工业过程为风力发电过程,采用不同种类的传感器采集风力发电过程中的有功功率、三相电流、三相电压、齿轮轴温度、齿轮箱油温和风速等m类传感器数据,共采集了N个历史数据样本,并且将N个数据样本构成的历史数据集表示为Y=[y1,y2,...,yN]∈Rm×N。其中,N个样本中存在着有工业噪声产生少量的离群点。初始设置的隔离矩阵各元素,通过随机赋值于区间[0,1]内的数值得到。
首先对数据样本做非线性映射φ:Rm→Rn,使其在高维空间中线性可分;映射过程采用核函数的形式k(yi,yj)=Φ(yi)TΦ(yj)进行计算。考虑到少量离群点相比大量的正常数据,具有稀疏的特性,本实施例利用L0范数对隔离矩阵的非零元素的个数加以约束。因此,离线字典学习的目标函数可表示如下:
Figure GDA0003569683420000061
式中,Y表示历史数据集,Y=[y1,y2,...,yN]∈Rm×N,y1,y2,...,yN分别为Y中的N个历史数据样本,每个数据样本由m个传感器数据组成;Φ(·)表示映射后的高维数据;A表示核字典,字典大小为K;X为历史数据集Y的稀疏编码矩阵,X=[x1,x2,...,xN]∈RK×N,x1,x2,...,xN分别为y1,y2,...,yN对应的稀疏编码,xi为X中的第i个稀疏编码;R表示隔离矩阵,且R的大小为N×N;r是由R的对角线元素构成的一个列向量,r中元素值的大小反映了对应位置的样本是离群点的可能性,||·||0表示0范数;||·||F表示F范数;T表示稀疏编码矩阵X中的每一列非零元素个数设定值。
对于上式(1),本实施例采用迭代交替优化求解的方法进行最优化求解。即当更新一个变量时,固定其他变量,依次重复更新若干步后,得到优化结果。
首先,固定X,R的取值不变,采取按列更新的方式更新变量A,ak表示A的第k列,
Figure GDA0003569683420000062
表示X的第k行,式(1)可写成如下形式:
Figure GDA0003569683420000071
定义集合
Figure GDA0003569683420000072
表示
Figure GDA0003569683420000073
中非零项所在索引的索引集,定义Ωk为N×|ωk|矩阵,且Ωk在(ωk(i),i)处的值为1,其余值均为0;将
Figure GDA0003569683420000074
Ek分别与Ωk相乘后即可得到收缩后的矩阵
Figure GDA0003569683420000075
Figure GDA0003569683420000076
对ak进行简单的求导后,得到ak的解析解:
Figure GDA0003569683420000077
接着,固定A,R的取值不变,采取按列更新的方式更新变量X;
Figure GDA0003569683420000078
通过核正交匹配追踪法,得到式(4)的优化结果为:
Figure GDA0003569683420000079
式(5)中,K(g)为核函数,Ki,j=Φ(yi)TΦ(yj);矩阵AS由矩阵A中与
Figure GDA00035696834200000710
中非零项对应的列构成,比如
Figure GDA00035696834200000711
中第1,5个位置非零,As为A中第1、5列所构成的一个矩阵。
最后,固定X,A的取值不变,更新变量R:基于||r||0不可导,首先对其余可导部分求解,得到下式:
Figure GDA00035696834200000712
其中,KYY为K(Y,Y)的简写形式,
Figure GDA00035696834200000713
表示对公式(1)中可求导的部分对R求偏导,则可导部分的梯度下降的解为
Figure GDA00035696834200000714
上标j表示当前迭代次数,μ表示梯度下降的步长;再将不可导的部分加入到约束中,得到:
Figure GDA00035696834200000715
式中,
Figure GDA00035696834200000716
表示实数域,R*是没有考虑不可导部分的最优解,R是考虑了不可导部分的最优解;
通过简单代数运算后,得到R的优化结果为:
Figure GDA0003569683420000081
不断重复式(2)-(8),直至算法达到设定的迭代次数。
Figure GDA0003569683420000082
2)计算隔离矩阵的所有对角线元素的均值和方差,根据均值和方差设置纯净样本取值区间,将取值不属于纯净样本取值区间的样本从历史数据样本集中剔除,得到纯净数据集。
通过步骤1)得到隔离矩阵R后,将其对角线元素组成列向量r。计算列向量r的均值μ和方差σ,设置纯净样本取值区间为[μ-2σ,μ+2σ]。然后将历史数据样本集中取值在[μ-2σ,μ+2σ]之外的样本剔除,将保留的样本作为纯净数据集Yc进行下一步核字典学习。
3)基于纯净数据集构建离线的核字典,再利用核字典计算纯净数据样本集的重构误差,并基于重构误差、利用核密度估计获取工业过程监控的控制限。
首先,基于步骤2)得到的纯净数据集Yc构建离线的核字典时,由于纯净数据集Yc中没有离群点,因此隔离矩阵为0矩阵,此时核字典的目标函数如下所示,本采用与步骤1)中相同的迭代交替优化方法求解得到纯净数据集Yc的核字典Ac和稀疏编码矩阵Xc,目标函数为:
Figure GDA0003569683420000091
式中,xci为稀疏编码矩阵Xc中的第i个稀疏编码。
然后,利用核字典计算纯净数据集的重构误差,其中纯净数据集Yc第i个数据样本yci的重构误差的计算式为:
Figure GDA0003569683420000092
式中,eci为数据样本yci的重构误差,Ac为纯净数据集的核字典,Xc为纯净数据集Yc对应的稀疏编码矩阵,xci为稀疏编码矩阵Xc中的第i个稀疏编码;
再根据计算得到的重构误差,利用核密度估计方法得到纯净数据集的密度函数为:
Figure GDA0003569683420000093
其中,e泛指待拟合的纯净数据集的重构误差分布,n为纯净数据集中的样本总数,K[·]为高斯核函数;
Figure GDA0003569683420000094
是指在给定带宽矩阵
Figure GDA0003569683420000095
通过纯净数据集中所有样本的重构误差拟合出的密度函数曲线。
最终,对核密度函数进行积分,将设定置信度下的取值作为控制限drr。
4)在线获取工业过程的待监测数据,计算待监测数据在核字典下的重构误差,并将待监测数据的重构误差与控制限比较,根据比较结果判断工业系统是否异常。具体为:
首先,利用核字典得到待监测数据ynew的稀疏编码xnew和重构误差enew分别为:
Figure GDA0003569683420000096
enew=K(ynew,ynew)-2K(ynew,Yc)Acxnew+xnew TAc TK(Yc,Yc)Acxnew (12)
式中,Yc为纯净数据集,Ac为纯净数据集的核字典,x泛指待求解的稀疏编码,K[·]为高斯核函数;
然后,将待监测数据的重构误差enew与控制限drr进行比较,以确定待监测数据是否正常,若待监测数据的重构误差enew大于阈值drr,则判断当前工业过程正常,否则判断当前工业过程异常。
为了适应复杂多变的工业过程,本发明提出的一种基于纯净数据集学习核字典的工业过程监测方法,其中的核字典学习方法是一种新的鲁棒核字典学习方法(RKDL),首先建立一个鲁棒模型,利用离群点具有的稀疏特性,得到一个隔离矩阵对离群点进行自适应过滤,即可以自适应的对训练数据中的离群点进行剔除;另一方面本发明在高维空间中提取数据样本的特征,得到一个核字典来进行表征,因此可以更精确学习非线性数据中的特性,且对风力发电等工业过程中的噪声有着良好的鲁棒性,可以有效的进行过程监测。
实施例2
本实施例提供一种基于纯净数据集学习核字典的工业过程监测系统,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现实施例1所述的基于纯净数据集学习核字典的工业过程监测方法。
以上实施例为本申请的优选实施例,本领域的普通技术人员还可以在此基础上进行各种变换或改进,在不脱离本申请总的构思的前提下,这些变换或改进都应当属于本申请要求保护的范围之内。

Claims (9)

1.一种基于稀疏约束的工业过程离群点检测与故障诊断方法,其特征在于,包括:
获取实际工业过程采集的历史数据集,设置历史数据集的隔离矩阵,将隔离矩阵添加到历史数据集的核字典学习目标函数中,并利用L0范数对隔离矩阵的非零元素的个数加以约束,优化求解隔离矩阵;
计算隔离矩阵的所有对角线元素的均值和方差,根据均值和方差设置纯净样本取值区间,将取值不属于纯净样本取值区间的样本从历史数据样本集中剔除,得到纯净数据集;
基于纯净数据集构建离线的核字典,再利用核字典计算纯净数据样本集的重构误差,并基于重构误差、利用核密度估计获取工业过程监控的控制限;
在线获取工业过程的待监测数据,计算待监测数据在核字典下的重构误差,并将待监测数据的重构误差与控制限比较,根据比较结果判断工业系统是否异常。
2.根据权利要求1所述的方法,其特征在于,所述将隔离矩阵添加到历史数据集的核字典学习目标函数中,并利用L0范数对隔离矩阵的非零元素的个数加以约束,表示为:
Figure FDA0003569683410000011
式中,Y表示历史数据集,Y=[y1,y2,...,yN]∈Rm×N,y1,y2,...,yN分别为Y中的N个历史数据样本,每个数据样本由m个传感器数据组成;Φ(·)表示映射后的高维数据;A表示核字典,字典大小为K;X为历史数据集Y的稀疏编码矩阵,X=[x1,x2,...,xN]∈RK×N,x1,x2,...,xN分别为y1,y2,...,yN对应的稀疏编码,xi为X中的第i个稀疏编码;R表示隔离矩阵,且R的大小为N×N;r是由R的对角线元素构成的一个列向量,r中元素值的大小反映了对应位置的样本是离群点的可能性,||·||0表示0范数;||·||F表示F范数;T表示稀疏编码矩阵X中的每一列非零元素个数设定值。
3.根据权利要求2所述的方法,其特征在于,采用迭代交替优化求解隔离矩阵,具体为:
首先,固定X,R的取值不变,采取按列更新的方式更新变量A,ak表示A的第k列,
Figure FDA0003569683410000012
表示X的第k行,式(1)可写成如下形式:
Figure FDA0003569683410000013
定义集合
Figure FDA0003569683410000014
表示
Figure FDA0003569683410000015
中非零项所在索引的索引集,定义Ωk为N×|ωk|矩阵,且Ωk在(ωk(i),i)处的值为1,其余值均为0;将
Figure FDA0003569683410000021
Ek分别与Ωk相乘后即可得到收缩后的矩阵
Figure FDA0003569683410000022
Figure FDA0003569683410000023
对ak求导后,得到ak的解析解:
Figure FDA0003569683410000024
接着,固定A,R的取值不变,采取按列更新的方式更新变量X;
Figure FDA0003569683410000025
通过核正交匹配追踪法,得到式(4)的优化结果为:
Figure FDA0003569683410000026
式(5)中,K(g)为核函数,Ki,j=Φ(yi)TΦ(yj);矩阵AS由矩阵A中与
Figure FDA0003569683410000027
中非零项对应的列构成;
最后,固定X,A的取值不变,更新变量R:基于||r||0不可导,首先对其余可导部分求解,得到下式:
Figure FDA0003569683410000028
其中,KYY为K(Y,Y)的简写形式,
Figure FDA0003569683410000029
表示对公式(1)中可求导的部分对R求偏导,则可导部分的梯度下降的解为
Figure FDA00035696834100000210
上标j表示当前迭代次数,μ表示梯度下降的步长;再将不可导的部分加入到约束中,得到:
Figure FDA00035696834100000211
式中,
Figure FDA00035696834100000212
表示实数域,R*是没有考虑不可导部分的最优解,R是考虑了不可导部分的最优解;通过代数运算后,得到R的优化结果为:
Figure FDA00035696834100000213
式中,
Figure FDA00035696834100000214
表示R*的第i行第i列的元素,
Figure FDA00035696834100000215
表示第j次迭代得到的隔离矩阵Rj的第i行第i列的元素;
不断重复式(2)-(8),直至算法达到设定的迭代次数。
4.根据权利要求1所述的方法,其特征在于,根据均值和方差设置的纯净样本取值区间为[μ-2σ,μ+2σ],μ和σ分别为隔离矩阵所有对角线元素的均值和方差。
5.根据权利要求2所述的方法,其特征在于,基于纯净数据集构建离线的核字典时,隔离矩阵R为0矩阵,采用迭代交替优化求解的方法,求解得到核字典Ac和稀疏编码矩阵Xc
6.根据权利要求2所述的方法,其特征在于,所述利用核字典计算纯净数据集的重构误差,其中纯净数据集Yc第i个数据样本yci的重构误差的计算式为:
Figure FDA0003569683410000031
式中,eci为数据样本yci的重构误差,Ac为纯净数据集的核字典,Xc为纯净数据集Yc对应的稀疏编码矩阵,xci为稀疏编码矩阵Xc中的第i个稀疏编码;
然后,根据计算得到的重构误差,利用核密度估计方法得到纯净数据集的密度函数为:
Figure FDA0003569683410000032
其中,e泛指待拟合的纯净数据集的重构误差分布,n为纯净数据集中的样本总数,K[·]为高斯核函数;
Figure FDA0003569683410000033
是指在给定带宽矩阵H下,通过所有样本的重构误差拟合出的密度函数曲线;
最终以核密度函数在设定置信度下的取值作为控制限。
7.根据权利要求2所述的方法,其特征在于,所述在线获取工业过程的待监测数据,计算待监测数据在核字典下的重构误差,具体为:
首先,利用核字典得到待监测数据ynew的稀疏编码xnew和重构误差enew分别为:
Figure FDA0003569683410000034
enew=K(ynew,ynew)-2K(ynew,Yc)Acxnew+xnew TAc TK(Yc,Yc)Acxnew (10)
式中,Yc为纯净数据集,Ac为纯净数据集的核字典,x泛指待求解的稀疏编码,K[·]为高斯核函数;
然后,将待监测数据的重构误差enew与控制限drr进行比较,以确定待监测数据是否正常,若待监测数据的重构误差enew大于阈值drr,则判断当前工业过程正常,否则判断当前工业过程异常。
8.根据权利要求1所述的方法,其特征在于,所述工业过程具体为风力发电过程,数据样本包括有功功率、三相电流、三相电压、齿轮轴温度、齿轮箱油温和风速。
9.一种基于纯净数据集学习核字典的工业过程监测系统,其特征在于,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现如权利要求1~8中任一项所述的方法。
CN202110568794.1A 2021-05-25 2021-05-25 一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统 Active CN113110403B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110568794.1A CN113110403B (zh) 2021-05-25 2021-05-25 一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110568794.1A CN113110403B (zh) 2021-05-25 2021-05-25 一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统

Publications (2)

Publication Number Publication Date
CN113110403A CN113110403A (zh) 2021-07-13
CN113110403B true CN113110403B (zh) 2022-05-17

Family

ID=76723171

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110568794.1A Active CN113110403B (zh) 2021-05-25 2021-05-25 一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统

Country Status (1)

Country Link
CN (1) CN113110403B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113466779B (zh) * 2021-07-14 2024-01-30 国网四川省电力公司营销服务中心 一种具备抗扰动能力的电能表计量故障诊断方法及系统
CN117851752A (zh) * 2023-12-04 2024-04-09 广州市广软物联网科技有限公司 目标物重量监测方法、系统及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10114206A1 (de) * 2000-03-23 2001-11-29 Simsci Ltd Invensys House Lond Überwachung und Steuerung von Prozessen unter Verwendung selbstüberprüfender Sensoren
CN107886054A (zh) * 2017-10-27 2018-04-06 天津大学 一种基于稀疏核字典的视频摘要选择方法
EP3379360A2 (en) * 2017-03-23 2018-09-26 Hitachi, Ltd. Anomaly detection system and anomaly detection method
CN109446189A (zh) * 2018-10-31 2019-03-08 成都天衡智造科技有限公司 一种工业参数离群点检测系统及方法
CN109947076A (zh) * 2019-03-14 2019-06-28 华中科技大学 一种基于贝叶斯信息准则的工业过程故障诊断方法
CN111538759A (zh) * 2020-04-20 2020-08-14 中南大学 一种基于分布式字典学习的工业过程智能监测方法与系统
CN111967509A (zh) * 2020-07-31 2020-11-20 北京赛博星通科技有限公司 一种对工业设备采集的数据进行处理和检测的方法及装置
CN112666918A (zh) * 2020-12-01 2021-04-16 沈阳化工大学 一种基于在线压缩keca自适应工业过程故障检测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10114206A1 (de) * 2000-03-23 2001-11-29 Simsci Ltd Invensys House Lond Überwachung und Steuerung von Prozessen unter Verwendung selbstüberprüfender Sensoren
EP3379360A2 (en) * 2017-03-23 2018-09-26 Hitachi, Ltd. Anomaly detection system and anomaly detection method
CN107886054A (zh) * 2017-10-27 2018-04-06 天津大学 一种基于稀疏核字典的视频摘要选择方法
CN109446189A (zh) * 2018-10-31 2019-03-08 成都天衡智造科技有限公司 一种工业参数离群点检测系统及方法
CN109947076A (zh) * 2019-03-14 2019-06-28 华中科技大学 一种基于贝叶斯信息准则的工业过程故障诊断方法
CN111538759A (zh) * 2020-04-20 2020-08-14 中南大学 一种基于分布式字典学习的工业过程智能监测方法与系统
CN111967509A (zh) * 2020-07-31 2020-11-20 北京赛博星通科技有限公司 一种对工业设备采集的数据进行处理和检测的方法及装置
CN112666918A (zh) * 2020-12-01 2021-04-16 沈阳化工大学 一种基于在线压缩keca自适应工业过程故障检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A Comparative Study of Cluster Based Outlier Detection,Distance Based Outlier Detection and Density Based Outlier Detection Techniques;Harshada C. Mandhare;《International Conference on Intelligent Computing and Control Systems》;20171231;全文 *
基于强化稀疏PCA 的时变过程离群点检测研究;胡田;《软件导刊》;20200831;全文 *
基于核密度估计的分布数据流离群点检测;杨宜东;《计算机研究与发展》;20051231;全文 *

Also Published As

Publication number Publication date
CN113110403A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
Cabrera et al. Automatic feature extraction of time-series applied to fault severity assessment of helical gearbox in stationary and non-stationary speed operation
CN113110403B (zh) 一种基于稀疏约束的工业过程离群点检测与故障诊断方法和系统
CN108803520B (zh) 一种基于变量非线性自相关性剔除的动态过程监测方法
CN114065862B (zh) 一种多维时序数据异常检测方法和系统
CN111666982B (zh) 一种基于深度神经网络的机电设备故障诊断方法
CN109146246B (zh) 一种基于自动编码器和贝叶斯网络的故障检测方法
KR20140041766A (ko) 예측 및 예지를 위한 순차적 커널 회귀 모델링 방법
CN117290800B (zh) 一种基于超图注意力网络的时序异常检测方法及系统
CN115329986A (zh) 基于可解释性图神经网络的风电机组异常检测与定位方法
Cheng et al. A novel process monitoring approach based on Feature Points Distance Dynamic Autoencoder
CN117034003A (zh) 航空航天重大产品制造装备的全生命周期自适应故障诊断方法、系统、设备及介质
Fazai et al. Online fault detection and isolation of an AIR quality monitoring network based on machine learning and metaheuristic methods
Van den Hoogen et al. An improved wide-kernel CNN for classifying multivariate signals in fault diagnosis
CN112947649B (zh) 一种基于互信息矩阵投影的多变量过程监控方法
CN113984389A (zh) 一种基于多感受野与改进胶囊图神经网络的滚动轴承故障诊断方法
Ding et al. A zero-shot soft sensor modeling approach using adversarial learning for robustness against sensor fault
CN113420815A (zh) 半监督rsdae的非线性pls间歇过程监测方法
Brandsæter et al. Cluster based anomaly detection with applications in the maritime industry
Jiang et al. Enhancing convolutional neural network deep learning for remaining useful life estimation in smart factory applications
TW202100863A (zh) 異常診斷裝置及方法
CN116204781A (zh) 旋转机械故障迁移诊断方法及系统
Zhang et al. Automated fault detection using convolutional auto encoder and k nearest neighbor rule for semiconductor manufacturing processes
CN115470838A (zh) 一种基于鲁棒动态变分贝叶斯字典学习的过程监测方法
CN115130500A (zh) 一种基于sdae算法的电机故障诊断系统及方法
CN110674461B (zh) 基于多块投影非负矩阵分解的化工生产过程监控方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant