CN111126425B - 复杂工业过程工况监测和分类方法 - Google Patents
复杂工业过程工况监测和分类方法 Download PDFInfo
- Publication number
- CN111126425B CN111126425B CN201811360326.XA CN201811360326A CN111126425B CN 111126425 B CN111126425 B CN 111126425B CN 201811360326 A CN201811360326 A CN 201811360326A CN 111126425 B CN111126425 B CN 111126425B
- Authority
- CN
- China
- Prior art keywords
- data
- pure
- dictionary
- noise
- normal sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/28—Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种复杂工业过程工况监测和分类方法、装置、计算机设备和存储介质。所述方法包括:获取历史正常样本数据;并采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码;之后根据历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码,确定所述历史正常样本数据的阈值;进而监测所述纯净数据的二范数的平方或噪声数据的二范数的平方是否超过所述历史正常样本数据的阈值。采用本方法可以提升监测和分类的性能。
Description
技术领域
本申请涉及工业过程技术领域,特别是涉及一种复杂工业过程工况监测和分类方法、装置、计算机设备和存储介质。
背景技术
随着信息技术的发展,出现了字典学习方法,这个方法具有出色的泛化能力,通过在工业过程的监测中,字典学习方法被设计为在不使用训练数据中的标签信息的情况下学习用于特征提取的字典。
尽管字典学习在工业系统的故障检测中取得了令人鼓舞的成功,但是他们中的许多人都认为过程数据的噪声来自预定义的分布,例如高斯分布。但是,这种假设与实际工业过程不一致,这些方法的性能有限。
目前的字典学习方法,存在性能低等问题。
发明内容
基于此,有必要针对上述技术问题,提供一种复杂工业过程工况监测和分类方法、装置、计算机设备和存储介质。
一种复杂工业过程工况监测方法,所述方法包括:
获取历史正常样本数据;
采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码;
根据历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码,确定所述历史正常样本数据的阈值;
获取监测数据,并通过所述第一字典、第二字典和监测数据,确定所述监测数据中的纯净数据的二范数的平方以及噪声数据的二范数的平方,并监测所述纯净数据的二范数的平方或噪声数据的二范数的平方是否超过所述历史正常样本数据的阈值。
在其中一个实施例中,所述采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码包括:
提取所述历史正常样本数据中的纯净数据和基于工况的噪声数据;
利用稀疏表示方法分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一稀疏编码和基于工况的噪声数据的第二稀疏编码;
利用自适应字典分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一字典和基于工况的噪声数据的第二字典。
在其中一个实施例中,所述根据历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码,确定所述历史正常样本数据的阈值包括:
获取所述历史正常样本数据中的高斯噪声数据;
根据所述历史正常样本数据以及所述纯净数据所对应的第一字典和第一稀疏编码,分别确定历史正常样本数据中纯净数据和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据;
基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获取纯净数据所对应的第一阈值和噪声数据所对应的第二阈值。
在其中一个实施例中,所述基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获取纯净数据所对应的第一阈值和噪声数据所对应的第二阈值包括:
基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获得所述纯净数据和噪声数据的密度分布;
根据所述纯净数据的密度分布,计算所述纯净数据的密度分布所对应的函数的第一区间估计,并获取所述第一区间估计的置信上限作为纯净数据所对应的第一阈值;
根据所述噪声数据的密度分布,计算所述噪声数据的密度分布所对应的函数的第二区间估计,并获取所述第二区间估计的置信上限作为噪声数据所对应的第二阈值。
在其中一个实施例中,所述获取监测数据,并通过所述第一字典、第二字典和监测数据,确定所述监测数据中的纯净数据的二范数的平方以及噪声数据的二范数的平方,并监测所述纯净数据的二范数的平方或噪声数据的二范数的平方是否超过所述历史正常样本数据的阈值包括:
采用所述字典,对监测数据进行重构,获取所述监测数据中纯净数据所对应的第三稀疏编码,并根据所述字典、第三稀疏编码和监测数据,提取所述监测数据中的高斯噪声数据;
根据所述监测数据、纯净数据的第一字典和监测数据中纯净数据的第三稀疏编码,分别确定监测数据中纯净数据和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据;
判断所述监测数据中的纯净数据的二范数的平方是否超过第一阈值,以及噪声数据的二范数的平方是否超过第二阈值。
在其中一个实施例中,所述判断所述监测数据中的纯净数据的二范数的平方是否超过第一阈值,以及噪声数据的二范数的平方是否超过第二阈值之后还包括:
若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,对所述工况类别进行识别。
在其中一个实施例中,所述若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,对所述工况类别进行识别包括:
若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,计算所述历史正常样本数据的线性变换矩阵与监测数据中纯净数据对应的第三稀疏编码的乘积的值;
选取所述值中的最大值,将所述最大值所对应的工况类别作为当前监测数据所对应的工况类别。
在其中一个实施例中,所述计算所述历史正常样本数据的线性变换矩阵包括:
将用于辨别稀疏编码的函数引入初始优化模型,得到目标优化模型,其中,所述初始优化模型用于对所述历史正常样本数据的字典和稀疏编码进行近似;
采用最小化方法对所述目标优化模型进行求解,得到所述历史正常样本数据的线性变换矩阵。
一种复杂工业过程工况监测装置,所述装置包括:
数据获取模块,用于获取历史正常样本数据;
学习模块,用于采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码;
处理模块,用于根据历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码,确定所述历史正常样本数据的阈值;
监测模块,用于获取监测数据,并通过所述第一字典、第二字典和监测数据,确定所述监测数据中的纯净数据的二范数的平方以及噪声数据的二范数的平方,并监测所述纯净数据的二范数的平方或噪声数据的二范数的平方是否超过所述历史正常样本数据的阈值。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上任一项所述方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的方法的步骤。
上述一种复杂工业过程工况监测方法,通过获取历史正常样本数据;并采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码;之后根据历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码,确定所述历史正常样本数据的阈值;进而获取监测数据,并通过所述第一字典、第二字典和监测数据,确定所述监测数据中的纯净数据的二范数的平方以及噪声数据的二范数的平方,并监测所述纯净数据的二范数的平方或噪声数据的二范数的平方是否超过所述历史正常样本数据的阈值,此方法可以自适应地处理数据中的噪声和准确地提取纯净的数据,消除基于工况的噪声和密集高斯噪声对过程监控的负面影响,从而提升监测和分类性能。
附图说明
图1为一个实施例中一种复杂工业过程工况监测方法的应用环境图;
图2为一个实施例中一种复杂工业过程工况监测方法的流程示意图;
图3为一个实施例中历史正常样本数据表征结构示意图;
图4为另一个实施例中步骤S200的流程示意图;
图5为另一个实施例中步骤S300的流程示意图;
图6为另一个实施例中步骤S330的流程示意图;
图7为另一个实施例中步骤S400的流程示意图;
图8为另一个实施例中步骤S440的流程示意图;
图9为另一个实施例中步骤S441的流程示意图;
图10为一个实施例中一种复杂工业过程工况监测装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的复杂工业过程工况监测和分类方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102通过网络将历史正常样本数据传输给服务器104,服务器104对所述历史正常样本数据进行处理。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种复杂工业过程工况监测方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S100,获取历史正常样本数据。
在步骤S100中,服务器获取历史正常样本数据,其中所述历史正常样本数据为工业过程中的操作模式或者条件等数据,具体包括工业过程中冷槽、热槽、阳极更换和出铝等数据。
步骤S200,采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况噪声的数据对应的第二字典和第二稀疏编码。
在步骤S200中,结合图3,考虑到实际工业过程,假设本申请文件已经收集了M个具有m个传感器的样本数据,并且将数据表示为X=[x1,x2,...,xM]∈Rm×M。由于从传感器采集的数据总是受到系统自身干扰或者外界环境干扰等造成的噪声的影响。因此,每个采样数据可以通过以下形式来描述
在本申请文件中历史正常样本数据包括纯净的数据,基于工况的噪声和高斯噪声,然后分别表征它们。我们使用自适应字典来表征以上数据,显然,在所提出的方法中存在两个独立的字典,分别为纯净数据对于的第一字典和工况数据对于的第二字典。因此,我们将其称为多字典学习(multiple dictionary learning)方法。
通过上述多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据xC对应的第一字典DC和第一稀疏编码WC,以及基于工况的噪声数据对应的第二字典DM和第二稀疏编码WM。
步骤S300,根据历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码,确定所述历史正常样本数据的阈值。
在步骤S300中,根据历史正常样本数据中纯净数据xC对应的第一字典DC和第一稀疏编码WC,以及工况噪声数据eM对应的第二字典DM和第二稀疏编码WM,确定所述历史正常样本数据的阈值CL。
步骤S400,获取监测数据,并通过所述第一字典、第二字典和监测数据,确定所述监测数据中的纯净数据的二范数的平方以及噪声数据的二范数的平方,并监测所述纯净数据的二范数的平方或噪声数据的二范数的平方是否超过所述历史正常样本数据的阈值。
在步骤S400中,所述监测数据是工业过程中根据模式或者条件的变化,获取的新的过程数据,且所述监测数据与历史正常数据的类型相同。服务器104接收到监测数据,并结合历史正常数据通过多字典学习方法获取的第一字典DC、第二字典DM,确定监测数据中的纯净数据的二范数的平方E1和噪声数据的二范数的平方E2,监测纯净数据的二范数的平方E1与噪声数据的二范数的平方E2是否超过历史正常样本数据的阈值CL。
上述一种复杂工业过程工况监测方法,通过获取历史正常样本数据;并采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码;之后根据历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码,确定所述历史正常样本数据的阈值;进而获取监测数据,并通过所述第一字典、第二字典和监测数据,确定所述监测数据中的纯净数据和噪声数据的二范数的平方,并监测所述纯净数据或噪声数据的二范数的平方是否超过所述历史正常样本数据的阈值,此方法中新的多字典学习方法可以自适应地处理数据中的噪声和准确地提取纯净的数据,以消除基于工况的噪声和密集高斯噪声对过程监控的负面影响。
在一个实施例中,结合图4,所述步骤S200包括:
步骤S210,提取所述历史正常样本数据中的纯净数据和基于工况的噪声数据。
步骤S220,利用稀疏表示方法分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一稀疏编码和基于工况的噪声数据的第二稀疏编码。
在步骤S220中,对于纯净数据xC,尽管它属于Rm维空间,但它们通常稀疏地分布在空间中,因此它可以通过子空间很好地表征。具体来说,同一类中的纯净数据xC应该位于相同的低维数据中。因此,本申请文件利用稀疏表示方法对它们进行建模,对纯净数据xC和基于工况的噪声数据eM进行表征,得到纯净数据xC对应的第一稀疏编码WC,以及基于工况的噪声数据eM对应的第二稀疏编码WM
步骤S230,利用自适应字典分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一字典和基于工况的噪声数据的第二字典。
在步骤S230中,基于工况的噪声eM总是随工况而改变,并且很难通过某些预定义的分布来定义,因此我们使用自适应字典来表征它。此外,对于纯净数据xC,尽管它属于Rm维空间,但它们通常稀疏地分布在空间中,因此它可以通过子空间很好地表征。具体来说,同一类中的纯净数据应该位于相同的低维数据中。因此,本申请文件利用稀疏表示方法对它们进行建模。
显然,在所提出的方法中存在两个独立的字典,即纯净数据xC的第一字典DC和基于工况的噪声数据eM的第二字典DM。
在一个实施例中,结合图5,所述步骤S300包括:
步骤S310,获取所述历史正常样本数据中的高斯噪声数据。
在步骤S310中,获取历史正常样本数据中的高斯噪声数据eG,其中,所述高斯噪声数据eG,由于它具有密集,随机性和小幅度的特征,我们采用L2范数来表征它。
步骤S320,根据所述历史正常样本数据以及所述纯净数据所对应的第一字典和第一稀疏编码,分别确定历史正常样本数据中纯净数据的二范数的平方和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据。
在步骤S320中,在离线多字典学习阶段,得到了纯净数据所对应的第一字典DC,并采用稀疏模型对来表示历史正常样本数据xi,其中历史正常样本数据中纯净数据所对应的第一稀疏编码通过OMP算法解得,解得第一稀疏编码后,计算历史正常样本数据xi的纯净数据部分xC和噪声部分e的二范数的平方。
步骤S330,基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获取纯净数据所对应的第一阈值和噪声数据所对应的第二阈值。
在步骤S330中,核密度估计方法(Kernel Density Estimation),由给定的历史正常样本数据的样本集合求解随机变量的分布密度函数。通过核密度估计方法,分别得到纯净数据的二范数的平方的密度分布和噪声数据的二范数的平方的密度分布。
在一个实施例中,结合图6,所述步骤S330包括:
步骤S331:基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获得所述纯净数据和噪声数据的密度分布;
步骤S332:根据所述纯净数据的密度分布,计算所述纯净数据的密度分布所对应的函数的第一区间估计,并获取所述第一区间估计的置信上限作为纯净数据所对应的第一阈值;
步骤S333:根据所述噪声数据的密度分布,计算所述噪声数据的密度分布所对应的函数的第二区间估计,并获取所述第二区间估计的置信上限作为噪声数据所对应的第二阈值。
具体地,本申请文件只需要一个单变量核估计量,它的定义如下:
其中xj是所考虑的数据点,xi是来自数据集的观测值,H是带宽矩阵,而K是核函数,其满足以下条件:
K(x)≥0
∫RPK(x)dx=1
在一个实施例中,结合图7,所述步骤S400包括:
步骤S410:采用所述字典,对监测数据进行重构,获取所述监测数据中纯净数据所对应的第三稀疏编码,并根据所述字典、第三稀疏编码和监测数据,提取所述监测数据中的噪声数据。
在步骤S410中,输入监测数据,采用历史正常样本数据获得的第一字典和第二字典对监测数据进行重建。如历史正常样本数据是铝电解过程中的数据样本,如果之后改变铝电解过程中的某些控制数据,那么新的监测数据与历史正常样本数据就会存在偏差,采用历史正常样本数据的字典对新的监测数据进行重构,也必然会存在偏差。
在离线多字典学习阶段,本申请文件基于训练得到的第一字典,对新数据进行监测。主要包括以下步骤:使用稀疏模型来表示监测数据xnew,
基于稀疏编码的过程监测,通过监测数据xnew和字典DC,解得wnew,如下公式所示:
其中稀疏编码wnew通过OMP算法解得。
步骤S420:根据所述监测数据、纯净数据的第一字典和监测数据中纯净数据的第三稀疏编码,分别确定监测数据中纯净数据的二范数的平方和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据。
步骤S430:判断所述监测数据中的纯净数据的二范数的平方是否超过第一阈值,以及噪声数据的二范数的平方是否超过第二阈值。
在步骤S430中,比较监测数据中的纯净数据的二范数的平方E1与第一阈值CLC的大小,判断监测数据中的纯净数据的二范数的平方E1是否大于第一阈值CLC;比较监测数据中的噪声数据的二范数的平方E2与第二阈值CLE的大小,判断监测数据中的噪声数据的二范数的平方E2是否大于第二阈值CLE。
在一个实施例中,所述步骤S430之后还包括:
步骤S440:若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,对所述工况类别进行识别。
在步骤S440中,满足以下条件,就对所述工况类别进行识别,具体如下:如果所述纯净数据的二范数的平方E1小于或等于第一阈值CLC且所述噪声数据的二范数的平方E2小于或等于第二阈值CLE,则对所述复杂工业过程工况类别进行识别。
在一个实施例中,结合图8,所述步骤S440包括:
步骤S441:若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,计算所述历史正常样本数据的线性变换矩阵与监测数据中纯净数据对应的第三稀疏编码的乘积的值。
步骤S442:选取所述值中的最大值,将所述最大值所对应的工况类别作为当前监测数据所对应的工况类别。
具体地,对于工况类别的分析,如所述纯净数据的二范数的平方超过第一阈值且所述噪声数据的二范数的平方超过第二阈值时,计算所述历史正常样本数据的线性变换矩阵与监测数据中纯净数据对应的第三稀疏编码的乘积的值,具体计算过程如下:
监测数据xnew属于类别l,如果满足以下条件:
E1≤CLC and E2≤CLE,
否则,监测数据为异常。
在一个实施例中,结合图9,所述步骤S441包括:
步骤S441a:将用于辨别稀疏编码的函数引入初始优化模型,得到目标优化模型,其中,所述初始优化模型用于对所述历史正常样本数据的字典和稀疏编码进行近似。
在步骤S441a中,历史正常样本数据中纯净数据xC对应的第一字典DC和第一稀疏编码WC,以及工况噪声数据eM对应的第二字典DM和第二稀疏编码WM,通过初始优化模型进行近似,具体为:
在此基础上,本申请文件将分类特性引入多字典学习的目标函数中建立的目标优化模型为:
其中表示输入数据X的用于辨别稀疏码,如果第i个训练样本xi与第j个字典原子dj有相同的标签,则矩阵Q的第i行第j列的原子为1,否则为0。和都是线性变换矩阵,H=[h1,h2,...,hM]∈RL×M是输入数据X的标签,如果第i个训练样本是属于第j种公况,则hi=[0,0,...,1,...,0,0]其中只有第j个元素为1。α和β是控制每个项的相对贡献的标量。
步骤S441b:采用最小化方法对所述目标优化模型进行求解,得到所述历史正常样本数据的线性变换矩阵。
在步骤S441b中,上述目标优化模型(2)不能直接由K-SVD算法求解,经验上,应采用交替优化策略来解决优化模型(2)。详细而言,提出了迭代最小化方法来交替地更新每个变量。算法1给出了该方法的全面描述,也可以看作是K-SVD算法的修改,具体如下:
输入:X,Q,H,α,β,T1,T2,ε=1e-10,iteration;
步骤1:给定Dc(k),Wc(k),DM(k)使用正交匹配追踪OMP算法求解优化问题(3)得到WM(k+1);
步骤2:给定Dc(k),Wc(k),WM(k+1)使用K-SVD算法求解优化问题(4)得到DM(k+1);
步骤3:给定DM(k+1),WM(k+1),A(k),F(k),Dc(k)使用正交匹配追踪OMP算法求解问题(5)得到Wc(k+1);
步骤4:给定DM(k+1),WM(k+1)和Wc(k+1)使用K-SVD算法求解优化问题(6)和公式(7)得到Dc(k+1),A(k+1),F(k+1);
步骤5:令k=k+1;
输出:Dc(k),Wc(k),A(k),F(k),DM(k),WM(k)。
其中,公式(3)至(7)具体为:
算法1中Dc(0),Wc(0),DM(0),WM(0),A(0),F(0)的初始化在算法2中给出,具体如下:
算法2:MDL初始化算法
输入:X,Q,H;
步骤1(初始化Dc(0)):在采样数据中的每类工况中使用K-SVD算法,然后组合每类数据的K-SVD输出得到Dc(0);
步骤2(初始化Wc(0)):给定Dc(0),使用正交匹配追踪OMP算法得到稀疏编码矩阵Wc(0);
步骤3(初始化A(0)):给定Q,Wc(0),采用下列多元岭回归模型得到A(0),
A(0)=QWc(0)T(Wc(0)Wc(0)T+λ1I)-1;
步骤4(初始化F(0)):同上,使用岭回归模型求解得到F(0):
F(0)=HWc(0)T(Wc(0)Wc(0)T+λ2I)-1;
步骤5(初始化DM(0)):给定Dc(0),Wc(0),使用K-SVD算法得到DM(0);
步骤6(初始化WM(0))给定Dc(0),Wc(0),DM(0),使用正交匹配追踪OMP算法得到噪声信号X-Dc(0)Wc(0)的稀疏编码矩阵WM(0);
输出:Dc(0),Wc(0),DM(0),WM(0),A(0),F(0)。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图10所示,提供了一种复杂工业过程工况监测装置,包括:数据获取模块、学习模块、处理模块和监测模块,其中:
数据获取模块10,用于获取历史正常样本数据;
学习模块20,用于采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码;
处理模块30,用于根据历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码,确定所述历史正常样本数据的阈值;
监测模块40,用于获取监测数据,并通过所述第一字典、第二字典和监测数据,确定所述监测数据中的纯净数据的二范数的平方以及噪声数据的二范数的平方,并监测所述纯净数据的二范数的平方或噪声数据的二范数的平方是否超过所述历史正常样本数据的阈值;
在一个实施例中,所述学习模块20包括:
提取模块201,用于提取所述历史正常样本数据中的纯净数据和基于工况的噪声数据;
第一计算模块202:用于利用稀疏表示方法分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一稀疏编码和基于工况的噪声数据的第二稀疏编码;
第二计算模块203:用于利用自适应字典分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一字典和基于工况的噪声数据的第二字典。
在一个实施例中,所述处理模块30包括:
第一数据获取模块301:用于获取所述历史正常样本数据中的高斯噪声数据;
第一处理模块302:用于根据所述历史正常样本数据以及所述纯净数据所对应的第一字典和第一稀疏编码,分别确定历史正常样本数据中纯净数据和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据;
第二处理模块303:用于基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获取纯净数据所对应的第一阈值和噪声数据所对应的第二阈值。
在一个实施例中,所述第二处理模块303包括:
第三计算模块3031:用于基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获得所述纯净数据和噪声数据的密度分布;
第四计算模块3032:用于根据所述纯净数据的密度分布,计算所述纯净数据的密度分布所对应的函数的第一区间估计,并获取所述第一区间估计的置信上限作为纯净数据所对应的第一阈值;
第五计算模块3033:用于根据所述噪声数据的密度分布,计算所述噪声数据的密度分布所对应的函数的第二区间估计,并获取所述第二区间估计的置信上限作为噪声数据所对应的第二阈值。
在一个实施例中,所述监测模块40包括:
第三处理模块401:用于采用所述字典,对监测数据进行重构,获取所述监测数据中纯净数据所对应的第三稀疏编码,并根据所述字典、第三稀疏编码和监测数据,提取所述监测数据中的高斯噪声数据;
第四处理模块402:用于根据所述监测数据、纯净数据的第一字典和监测数据中纯净数据的第三稀疏编码,分别确定监测数据中纯净数据和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据;
判断模块403:用于判断所述监测数据中的纯净数据的二范数的平方是否超过第一阈值,以及噪声数据的二范数的平方是否超过第二阈值。
在一个实施例中,所述判断模块403之后还包括:
识别模块404:用于若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,对所述工况类别进行识别。
在一个实施例中,所述识别模块404包括:
第六计算模块4041:用于若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,计算所述历史正常样本数据的线性变换矩阵与监测数据中纯净数据对应的第三稀疏编码的乘积的值;
选取模块4042:用于选取所述值中的最大值,将所述最大值所对应的工况类别作为当前监测数据所对应的工况类别。
在一个实施例中,所述第六计算模块4041包括:
引入模块4041a:用于将用于辨别稀疏编码的函数引入初始优化模型,得到目标优化模型,其中,所述初始优化模型用于对所述历史正常样本数据的字典和稀疏编码进行近似;
获取模块4041b:采用最小化方法对所述目标优化模型进行求解,得到所述历史正常样本数据的线性变换矩阵。
关于工况监测装置的具体限定可以参见上文中对于工况监测方法的限定,在此不再赘述。上述工况监测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储工况监测数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种工况监测方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行实现如上所述方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行实现如上所述方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种复杂工业过程工况监测方法,其特征在于,所述方法包括:
获取历史正常样本数据;
采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码;
获取所述历史正常样本数据中的高斯噪声数据;
根据所述历史正常样本数据以及所述纯净数据所对应的第一字典和第一稀疏编码,分别确定历史正常样本数据中纯净数据和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据;
基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获得所述纯净数据和噪声数据的密度分布;
根据所述纯净数据的密度分布,计算所述纯净数据的密度分布所对应的函数的第一区间估计,并获取所述第一区间估计的置信上限作为纯净数据所对应的第一阈值;
根据所述噪声数据的密度分布,计算所述噪声数据的密度分布所对应的函数的第二区间估计,并获取所述第二区间估计的置信上限作为噪声数据所对应的第二阈值;
采用所述字典,对监测数据进行重构,获取所述监测数据中纯净数据所对应的第三稀疏编码,并根据所述字典、第三稀疏编码和监测数据,提取所述监测数据中的高斯噪声数据;
根据所述监测数据、纯净数据的第一字典和监测数据中纯净数据的第三稀疏编码,分别确定监测数据中纯净数据和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据;
判断所述监测数据中的纯净数据的二范数的平方是否超过第一阈值,以及噪声数据的二范数的平方是否超过第二阈值;
若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值,对所述工况类别进行识别。
2.根据权利要求1所述的方法,其特征在于,所述采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码包括:
提取所述历史正常样本数据中的纯净数据和基于工况的噪声数据;
利用稀疏表示方法分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一稀疏编码和基于工况的噪声数据的第二稀疏编码;
利用自适应字典分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一字典和基于工况的噪声数据的第二字典。
3.根据权利要求1所述的方法,其特征在于,所述若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,对所述工况类别进行识别包括:
若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,计算所述历史正常样本数据的线性变换矩阵与监测数据中纯净数据对应的第三稀疏编码的乘积的值;
选取所述值中的最大值,将所述最大值所对应的工况类别作为当前监测数据所对应的工况类别。
4.根据权利要求3所述的方法,其特征在于,所述计算所述历史正常样本数据的线性变换矩阵包括:
将用于辨别稀疏编码的函数引入初始优化模型,得到目标优化模型,其中,所述初始优化模型用于对所述历史正常样本数据的字典和稀疏编码进行近似;
采用最小化方法对所述目标优化模型进行求解,得到所述历史正常样本数据的线性变换矩阵。
5.一种复杂工业过程工况监测装置,其特征在于,所述装置包括:
数据获取模块,用于获取历史正常样本数据;
学习模块,用于采用多字典学习方法对所述历史正常样本数据进行训练,得到历史正常样本数据中纯净数据对应的第一字典和第一稀疏编码,以及基于工况的噪声数据对应的第二字典和第二稀疏编码;
第一数据获取模块,用于获取所述历史正常样本数据中的高斯噪声数据;
第一处理模块,用于根据所述历史正常样本数据以及所述纯净数据所对应的第一字典和第一稀疏编码,分别确定历史正常样本数据中纯净数据和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据;
第三计算模块,用于基于所述纯净数据的二范数的平方和噪声数据的二范数的平方,并采用核密度估计方法,分别获得所述纯净数据和噪声数据的密度分布;
第四计算模块,用于根据所述纯净数据的密度分布,计算所述纯净数据的密度分布所对应的函数的第一区间估计,并获取所述第一区间估计的置信上限作为纯净数据所对应的第一阈值;
第五计算模块,用于根据所述噪声数据的密度分布,计算所述噪声数据的密度分布所对应的函数的第二区间估计,并获取所述第二区间估计的置信上限作为噪声数据所对应的第二阈值;
第三处理模块,用于采用所述字典,对监测数据进行重构,获取所述监测数据中纯净数据所对应的第三稀疏编码,并根据所述字典、第三稀疏编码和监测数据,提取所述监测数据中的高斯噪声数据;
第四处理模块,用于根据所述监测数据、纯净数据的第一字典和监测数据中纯净数据的第三稀疏编码,分别确定监测数据中纯净数据和噪声数据的二范数的平方,其中,所述噪声数据包括基于工况的噪声数据和高斯噪声数据;
判断模块,用于判断所述监测数据中的纯净数据的二范数的平方是否超过第一阈值,以及噪声数据的二范数的平方是否超过第二阈值;
识别模块,用于若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值,对所述工况类别进行识别。
6.根据权利要求5所述的装置,其特征在于,所述学习模块,包括:
提取模块,用于提取所述历史正常样本数据中的纯净数据和基于工况的噪声数据;
第一计算模块,用于利用稀疏表示方法分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一稀疏编码和基于工况的噪声数据的第二稀疏编码;
第二计算模块,用于利用自适应字典分别对所述纯净数据和基于工况的噪声数据进行表征,得到所述纯净数据的第一字典和基于工况的噪声数据的第二字典。
7.根据权利要求5所述的装置,其特征在于,所述识别模块,包括:
第六计算模块,用于若所述纯净数据的二范数的平方小于或等于第一阈值且所述噪声数据的二范数的平方小于或等于第二阈值时,计算所述历史正常样本数据的线性变换矩阵与监测数据中纯净数据对应的第三稀疏编码的乘积的值;
选取模块,用于选取所述值中的最大值,将所述最大值所对应的工况类别作为当前监测数据所对应的工况类别。
8.根据权利要求7所述的装置,其特征在于,所述第六计算模块,包括:
引入模块,用于将用于辨别稀疏编码的函数引入初始优化模型,得到目标优化模型,其中,所述初始优化模型用于对所述历史正常样本数据的字典和稀疏编码进行近似;
获取模块,采用最小化方法对所述目标优化模型进行求解,得到所述历史正常样本数据的线性变换矩阵。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2018112952988 | 2018-11-01 | ||
CN201811295298 | 2018-11-01 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111126425A CN111126425A (zh) | 2020-05-08 |
CN111126425B true CN111126425B (zh) | 2023-04-25 |
Family
ID=70495055
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811360326.XA Active CN111126425B (zh) | 2018-11-01 | 2018-11-15 | 复杂工业过程工况监测和分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111126425B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740911A (zh) * | 2016-02-02 | 2016-07-06 | 温州大学 | 基于保持结构稀疏化的半监督字典学习方法 |
CN106289508A (zh) * | 2016-07-19 | 2017-01-04 | 西南交通大学 | 一种面向机械故障诊断的振动信号重构方法 |
CN107368668A (zh) * | 2017-05-30 | 2017-11-21 | 中国石油大学(华东) | 基于双重稀疏字典学习的地震数据去噪方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9870519B2 (en) * | 2014-07-08 | 2018-01-16 | Nec Corporation | Hierarchical sparse dictionary learning (HiSDL) for heterogeneous high-dimensional time series |
-
2018
- 2018-11-15 CN CN201811360326.XA patent/CN111126425B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740911A (zh) * | 2016-02-02 | 2016-07-06 | 温州大学 | 基于保持结构稀疏化的半监督字典学习方法 |
CN106289508A (zh) * | 2016-07-19 | 2017-01-04 | 西南交通大学 | 一种面向机械故障诊断的振动信号重构方法 |
CN107368668A (zh) * | 2017-05-30 | 2017-11-21 | 中国石油大学(华东) | 基于双重稀疏字典学习的地震数据去噪方法 |
Non-Patent Citations (2)
Title |
---|
Xin Peng 等.《Multimode Process Monitoring and Fault Detection:A Sparse Modeling and Dictionary Learning Method》.《IEEETRANSACTIONS ON INDUSTRIAL ELECTRONICS》.2017,第1-10页. * |
吴奇 等;.《惩罚复杂诊断系统混合噪音的模糊小波分类机》.《自动化学报》.2009,第第35卷卷(第第35卷期),第773-779页;. * |
Also Published As
Publication number | Publication date |
---|---|
CN111126425A (zh) | 2020-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3620983B1 (en) | Computer-implemented method, computer program product and system for data analysis | |
CN113343847B (zh) | 异常数据检测方法、装置、计算机设备和可读存储介质 | |
CN110580488B (zh) | 基于字典学习的多工况工业监测方法、装置、设备及介质 | |
CN112862127B (zh) | 一种传感器数据的异常处理方法、装置、电子设备及介质 | |
CN110659667A (zh) | 图片分类模型训练方法、系统和计算机设备 | |
CN116597384B (zh) | 基于小样本训练的空间目标识别方法、装置及计算机设备 | |
CN113284002A (zh) | 用电数据异常检测方法、装置、计算机设备和存储介质 | |
CN116629435A (zh) | 风险预测方法、装置、计算机设备和存储介质 | |
CN111679953B (zh) | 基于人工智能的故障节点识别方法、装置、设备和介质 | |
CN111126425B (zh) | 复杂工业过程工况监测和分类方法 | |
CN113110961A (zh) | 设备异常检测方法、装置、计算机设备及可读存储介质 | |
CN111898249A (zh) | 滑坡位移非参数概率密度预测方法、设备及存储介质 | |
CN117195044A (zh) | 故障分析方法、装置、计算机设备、存储介质和程序产品 | |
CN114401205B (zh) | 无标注多源网络流量数据漂移检测方法和装置 | |
CN114553681B (zh) | 设备状态异常检测方法、装置和计算机设备 | |
CN116383441A (zh) | 社群检测方法、装置、计算机设备和存储介质 | |
CN114398228A (zh) | 一种设备资源使用情况的预测方法、装置及电子设备 | |
CN116893924B (zh) | 设备故障处理方法、装置、电子设备和存储介质 | |
CN116952954B (zh) | 一种基于条纹光的凹凸检测方法、装置、设备及存储介质 | |
US12001949B2 (en) | Computer-implemented method, computer program product and system for data analysis | |
CN117457110A (zh) | 蛋白质溶解度预测方法、计算机设备及计算机存储介质 | |
CN117523259A (zh) | 半监督模型训练方法、装置、计算机设备和存储介质 | |
CN116881099A (zh) | 系统性能的评估方法、装置、计算机设备和存储介质 | |
US20200074269A1 (en) | Computer-implemented method, computer program product and system for data analysis | |
CN116761176A (zh) | 多步攻击识别模型的训练方法、多步攻击识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |