CN112488202A - 基于互信息和投影字典对学习的分布式过程监测方法 - Google Patents

基于互信息和投影字典对学习的分布式过程监测方法 Download PDF

Info

Publication number
CN112488202A
CN112488202A CN202011376749.8A CN202011376749A CN112488202A CN 112488202 A CN112488202 A CN 112488202A CN 202011376749 A CN202011376749 A CN 202011376749A CN 112488202 A CN112488202 A CN 112488202A
Authority
CN
China
Prior art keywords
block
dictionary
abnormal
representing
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011376749.8A
Other languages
English (en)
Inventor
陈晓方
邓紫晴
谢永芳
岑丽辉
孙玉波
张红亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202011376749.8A priority Critical patent/CN112488202A/zh
Publication of CN112488202A publication Critical patent/CN112488202A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于互信息和投影字典对学习的分布式过程监测方法,获取多模态历史数据,并将正常多模态历史数据作为训练样本;根据各模态的过程变量间的互信息对训练样本进行自动分块,得到各模态训练样本的分块结果。本发明通过考虑多模态过程变量之间的交叉关系和高阶统计信息来自动划分块以进行分布式过程监测,降低了过程复杂性,建立投影字典对学习模型,为整个工业过程提供更准确的描述;通过引入投影字典对学习框架,将传统的判别合成型字典学习扩展为判别合成型与解析型字典对学习,在实现复杂工业过程局部建模的同时,利用解析编码方法来有效提高建模和监测阶段效率。

Description

基于互信息和投影字典对学习的分布式过程监测方法
技术领域
本发明涉及工业过程监测技术领域,特别涉及一种基于互信息和投影字典对学习的分布式过程监测方法。
背景技术
在现代工业系统中,各子系统之间机制复杂,相互作用频繁,在整个工业生产过程中,过程变量多,变量之间相关性复杂,工业过程具有复杂性和分散性。因此,不适合为工业过程建立全局监测模型,它忽略了局部行为,并且监测结果通常难以解释,因此,分布式过程监测方法被提出,通常采用多块方法来降低过程复杂性,以及为整个工业过程提供准确的描述。
通常,整个工厂范围的过程涉及大量具有复杂关系的监测变量,在块划分过程中应考虑大量变量信息,分布式监测方法将过程变量分为几个子块,从而降低过程复杂性。考虑到多块监测,传统方法通常基于先前的过程知识来获得子块。但是,有关块划分的准确知识并非可以经常获得,特别是获得对于具有多个操作状态的全局过程。
随着人工智能的兴起,机器学习方法成为解决复杂数据驱动的有效方案。字典学习是一种有效的机器学习方法,与传统的多元统计过程监测(MSPM)方法相比,它在表示和特征提取方面功能更强大。根据稀疏编码的方式不同,字典学习(DL)方法主要可以分成两大类,一类是合成型字典学习(SDL)方法,另一类是解析型字典学习(ADL)方法。利用预定义的解析型字典(如小波字典、Gabor字典)表示信号,可以通过简单的内积运算产生表示系数,使得编码快速而明确。然而,解析型字典学习对复杂工业过程的局部结构建模的效率较低,基于合成型字典的稀疏表示模型可以较好地模拟复杂的局部结构,并易于学习到所需要的字典。但是,合成型字典学习方法对表示系数的l0或l1范数稀疏约束使得建模和监测阶段耗费大量时间。
发明内容
本发明提供了一种基于互信息和投影字典对学习的分布式过程监测方法,其目的是为了解决通过先验知识获得子块不准确,在全局监测模型中采用解析型字典学习和合成型字典学习存在不足,建模和监测阶段的效率低,全局监测模型不能为整个工业过程提供准确的描述的问题。
为了达到上述目的,本发明的实施例提供了一种基于互信息和投影字典对学习的分布式过程监测方法,包括:
步骤1,获取多模态历史数据,并将正常多模态历史数据作为训练样本;
步骤2,根据各模态的过程变量间的互信息对训练样本进行自动分块,得到各模态训练样本的分块结果;
步骤3,对训练样本每种模态的每个子块建立投影字典对学习模型,并获得相应的合成型字典和解析型字典;
步骤4,根据对训练样本每种模态的每个子块建立的投影字典对学习模型计算训练样本各块的重构误差,对自动分块后的训练样本使用核密度估计方法计算训练样本各块的控制阈值;
步骤5,在投影字典对学习模型中输入新的过程数据,将新的过程数据作为测试样本,使用互信息方法将测试样本按不同模态下训练数据分块方式进行分块,并根据分块后的测试样本的每个子块相应的投影字典对学习模型计算测试样本各块的重构误差;
步骤6,将测试样本各块的重构误差转换为模态概率,根据模态概率计算各模态下通过测试样本所有块的联合概率,根据各模态下通过测试样本所有块的联合概率对测试样本进行模态识别;
步骤7,通过贝叶斯推理方法将测试样本各块的重构误差和训练样本各块的控制阈值融合至全局异常指标中,对测试样本进行异常检测,将测试样本各块的重构误差转换为正常和异常的概率,根据贝叶斯法则得出测试样本的块异常后验概率;
步骤8,通过判断全局异常指标是否超过显著性水平α,判断测试样本是否异常,当全局异常指标未超过显著性水平α时,测试样本被检测为正常,当全局异常指标超过显著性水平α时,测试样本被检测为异常;
步骤9,对检测为异常后的测试样本通过块贡献指标定位测试样本中的异常块,并将异常块进行隔离;
步骤10,对检测为异常后的测试样本通过变量贡献指标定位异常块中的异常变量,并将异常变量进行隔离。
其中,所述步骤1和所述步骤2具体包括:
收集多模态历史数据,将多模态历史数据作为训练样本表示为X=[X1,X2,…,XK]∈RpK×n,其中K表示训练样本的模态数,p表示训练样本的维数,n表示各模态的训练样本数,将第K种模态下的训练样本变量集表示为
Figure BDA0002807339840000031
在第K种模态的训练样本
Figure BDA0002807339840000032
中选择变量
Figure BDA0002807339840000033
作为目标变量,计算训练样本中的变量
Figure BDA0002807339840000034
与目标变量
Figure BDA0002807339840000035
之间的互信息值
Figure BDA0002807339840000036
如下所示:
Figure BDA0002807339840000037
其中,
Figure BDA0002807339840000038
表示训练样本中的变量
Figure BDA0002807339840000039
与目标变量
Figure BDA00028073398400000310
之间的互信息值,
Figure BDA00028073398400000311
表示联合概率密度函数,i=1,2,…,p,j=1,2,…,p;
Figure BDA00028073398400000312
Figure BDA00028073398400000313
表示边缘概率密度函数,i=1,2,…,p,j=1,2,…,p;
Figure BDA00028073398400000314
表示目标变量,i=1,2,…,p;
Figure BDA00028073398400000315
表示训练样本中的变量,j=1,2,…,p;
通过确定阈值ηK,判断各变量与目标变量间的互信息值是否满足
Figure BDA00028073398400000316
Figure BDA00028073398400000317
时,将变量
Figure BDA00028073398400000318
与目标变量
Figure BDA00028073398400000319
划分在第N个训练样本变量集SN中,训练样本的剩余变量集为{S-SN};
对第K种模态的训练样本
Figure BDA00028073398400000320
中的剩余变量重复上述步骤,直至第K种模态的训练样本
Figure BDA00028073398400000321
中的剩余变量的个数小于M,其中,M表示给定最小剩余变量数,将第K种模态的训练样本
Figure BDA00028073398400000322
中的剩余的变量划分至最后一个变量集SN中;
将第K种模态的训练样本XK的分块集合表示为
Figure BDA00028073398400000323
其中,NK表示分块数;
将通过互信息方法自动分块后的训练样本表示为:
Figure BDA00028073398400000324
其中,
Figure BDA0002807339840000041
表示第K种模态的第NK个子块中的训练样本。
其中,所述步骤3具体包括:
在第K种模态的第NK个子块的训练样本
Figure BDA0002807339840000042
中构建投影字典对学习模型,如下所示:
Figure BDA0002807339840000043
其中,
Figure BDA0002807339840000044
表示数据重构函数,
Figure BDA0002807339840000045
Figure BDA0002807339840000046
表示判别函数,||·||F表示Frobenius范数,
Figure BDA0002807339840000047
表示第K种模态的第NK个子块的训练样本,
Figure BDA0002807339840000048
Figure BDA0002807339840000049
表示合成型字典,
Figure BDA00028073398400000410
Figure BDA00028073398400000411
表示解析型字典,
Figure BDA00028073398400000412
Figure BDA00028073398400000413
表示解析编码矩阵,
Figure BDA00028073398400000414
Figure BDA00028073398400000415
表示
Figure BDA00028073398400000416
的互补数据矩阵,τ表示常量,λ表示恒大于零的常量,di表示合成型字典
Figure BDA00028073398400000417
的第i个原子。
其中,所述步骤3还包括:
使用Frobenius范数对随机矩阵进行单位化处理,对合成型字典
Figure BDA00028073398400000418
和解析型字典
Figure BDA00028073398400000419
进行初始化,交替更新解析编码矩阵
Figure BDA00028073398400000420
Figure BDA00028073398400000421
对公式(3)中目标函数的优化过程如下所示:
将合成型字典
Figure BDA00028073398400000422
和解析型字典
Figure BDA00028073398400000423
固定,更新解析编码矩阵
Figure BDA00028073398400000424
如下所示:
Figure BDA00028073398400000425
公式(4)为标准的最小二乘问题,存在一个闭型解,如下所示:
Figure BDA00028073398400000426
其中,I表示单位矩阵,
Figure BDA00028073398400000427
Figure BDA00028073398400000428
表示
Figure BDA00028073398400000429
的转置矩阵;
将解析编码矩阵
Figure BDA00028073398400000430
固定,更新合成型字典
Figure BDA00028073398400000431
和解析型字典
Figure BDA00028073398400000432
如下所示:
Figure BDA00028073398400000433
将解析型字典
Figure BDA00028073398400000434
的闭型解表示为:
Figure BDA00028073398400000435
其中,γ=10-4
将变量矩阵
Figure BDA0002807339840000051
引入合成型字典
Figure BDA0002807339840000052
中进行优化,并对优化后的合成型字典
Figure BDA0002807339840000053
进行求解,如下所示:
Figure BDA0002807339840000054
其中,si表示变量矩阵
Figure BDA0002807339840000055
的第i列;
通过交替方向乘子法得到公式(8)的最优解,如下所示:
Figure BDA0002807339840000056
其中,
Figure BDA0002807339840000057
表示第t+1次迭代的合成型字典
Figure BDA0002807339840000058
Figure BDA0002807339840000059
表示第t+1次迭代的变量矩阵
Figure BDA00028073398400000510
Figure BDA00028073398400000511
表示第t+1次迭代的变量矩阵
Figure BDA00028073398400000512
Figure BDA00028073398400000513
表示第t次迭代的合成型字典
Figure BDA00028073398400000514
Figure BDA00028073398400000515
表示第t次迭代的变量矩阵
Figure BDA00028073398400000516
Figure BDA00028073398400000517
表示表示第t次迭代的变量矩阵
Figure BDA00028073398400000518
Figure BDA00028073398400000519
表示初始合成型字典
Figure BDA00028073398400000520
Figure BDA00028073398400000521
表示初始变量矩阵
Figure BDA00028073398400000522
Figure BDA00028073398400000523
表示初始变量矩阵
Figure BDA00028073398400000524
ρ表示给定参数;
在对合成型字典
Figure BDA00028073398400000525
进行优化的每一步中都存在解析编码矩阵
Figure BDA00028073398400000526
和解析型字典
Figure BDA00028073398400000527
的封闭解,且合成型字典
Figure BDA00028073398400000528
基于交替方向乘子法优化收敛迅速。
其中,所述步骤4具体包括:
通过对训练样本每种模态的每个子块建立的投影字典对学习模型,计算第K种模态的第NK个子块的训练样本
Figure BDA00028073398400000529
的重构误差,如下所示:
Figure BDA00028073398400000530
其中,
Figure BDA00028073398400000531
表示第K种模态的第NK个子块的训练样本
Figure BDA00028073398400000532
的重构误差;
通过核密度估计方法从训练样本X=[X1,X2,…,XK]∈RpK×n中获得第K种模态的第NK个子块的训练样本
Figure BDA00028073398400000533
的控制阈值
Figure BDA00028073398400000534
基于训练样本
Figure BDA00028073398400000535
使用单变量核密度估计,如下所示:
Figure BDA00028073398400000536
其中,x表示考虑的变量,M表示训练样本大小,h表示带宽,Ei表示块中第i个训练样本的重构误差,K(x)表示选择均匀核函数。
其中,所述步骤5和所述步骤6具体包括:
将新的测试样本
Figure BDA00028073398400000611
输入投影字典对学习模型,通过互信息方法将新的测试样本
Figure BDA00028073398400000612
按不同模态下训练样本分块方式划分为Ynew=[y1,y2,…,yB]T,将Ynew=[y1,y2,…,yB]T进行标准化处理,并根据相应投影字典对学习模型计算测试样本各块的重构误差,如下所示:
Figure BDA0002807339840000061
其中,
Figure BDA0002807339840000062
表示Ynew=[y1,y2,…,yB]T中第B个块的重构误差,DB表示各模态下第B个块投影字典对学习模型中的合成型字典,PB表示各模态下第B个块投影字典对学习模型中的解析型字典,yB表示ynew的第B个子块;
将Ynew=[y1,y2,…,yB]T中第B个块的重构误差
Figure BDA0002807339840000063
转换为模态概率,如下所示:
Figure BDA0002807339840000064
其中,p(yB∈Mi)表示模态概率,Mi表示第i种模态,
Figure BDA0002807339840000065
表示测试样本在第i种模态下第B个块的重构误差;
事件Ynew∈Mi等价于(y1∈Mi)∩(y2∈Mi)∩…∩(yB∈Mi),将事件Ynew∈Mi的概率表示为所有块的联合概率,如下所示:
Figure BDA0002807339840000066
其中,p(Ynew∈Mi)表示联合概率。
其中,所述步骤7和所述步骤8具体包括:
将测试样本Ynew=[y1,y2,…,yB]T中第B个块的重构误差
Figure BDA0002807339840000067
转换成正常和异常的概率,如下所示:
Figure BDA0002807339840000068
Figure BDA0002807339840000069
其中,
Figure BDA00028073398400000610
表示训练样本的第K种模态下第B个块的控制阈值,pB(yB|N)表示块正常条件概率,pB(yB|A)表示块异常条件概率;
根据贝叶斯法则得出块异常后验概率,如下所示:
Figure BDA0002807339840000071
其中,pB(A|yB)表示块异常后验概率,pB(N)表示块正常概率,pB(A)表示块异常概率,块正常概率pB(N)和块异常概率pB(A)通过显著性水平α给出,即pB(N)=1-α,pB(A)=α;
通过贝叶斯推理方法将测试样本各块的重构误差和训练样本各块的控制阈值融合至全局异常指标,将全局异常指标定义为:
Figure BDA0002807339840000072
其中,N表示每种模态下的分块数;
当全局异常指标GAI小于显著性水平α,即GAI<α时,测试样本为正常,当GAI>α时,测试样本为异常。
其中,所述步骤9和所述步骤10具体包括:
将块异常标志定义为:
Figure BDA0002807339840000073
其中,
Figure BDA0002807339840000074
表示块异常标志,
Figure BDA0002807339840000075
表示第B个块中的第k个样本;当测试样本的块中存在异常样本k时,相应的测试样本的块异常后验概率
Figure BDA0002807339840000076
大于显著性水平α时,块异常标志
Figure BDA0002807339840000077
置1;
将块异常指标定义为:
Figure BDA0002807339840000078
其中,BAIB表示块异常指标,K表示测试样本块中异常样本数;
将块贡献指标定义为:
Figure BDA0002807339840000079
其中,BCIB表示块贡献指标,N表示每种模态下的分块数。
其中,所述步骤10还包括:
基于块贡献指标BCIB通过贡献图方法计算变量贡献指标,当块中存在异常样本
Figure BDA0002807339840000081
时,异常样本
Figure BDA0002807339840000082
对应的合成型字典和解析编码矩阵分别为DB
Figure BDA0002807339840000083
将异常样本
Figure BDA0002807339840000084
表示为:
Figure BDA0002807339840000085
其中,I表示单位矩阵,I∈Rm×m,m表示块中变量数;f表示向量,f具有非零项的异常位置和大小;异常样本
Figure BDA0002807339840000086
在增广合成型字典
Figure BDA0002807339840000087
下新的解析编码矩阵表示为:
Figure BDA0002807339840000088
其中,
Figure BDA0002807339840000089
表示增广合成型典,
Figure BDA00028073398400000810
表示新的测试样本,
Figure BDA00028073398400000811
其中,所述步骤10还包括:
根据贡献图方法,将测试样本的第B块中第j个变量贡献指标表示为:
Figure BDA00028073398400000812
其中,
Figure BDA00028073398400000813
表示测试样本的第B块中第j个变量贡献指标,S表示由零矩阵和单位矩阵I组成的矩阵,S=[O,I]∈Rm×(p+m),p表示合成型字典DB的原子数;
Figure BDA00028073398400000814
表示新的解析编码矩阵,通过
Figure BDA00028073398400000815
选择新的解析编码矩阵
Figure BDA00028073398400000816
的后面m个元素,
Figure BDA00028073398400000817
与向量f相同,ej表示单位向量,
Figure BDA00028073398400000818
本发明的上述方案有如下的有益效果:
本发明的上述实施例所述的基于互信息和投影字典对学习的分布式过程监测方法,通过考虑多模态过程变量之间的交叉关系和高阶统计信息来自动划分块以进行分布式过程监测,降低了过程复杂性,建立投影字典对学习模型,为整个工业过程提供更准确的描述;通过引入投影字典对学习框架,将传统的判别合成型字典学习扩展为判别合成型与解析型字典对学习,在实现复杂工业过程局部建模的同时,利用解析编码方法来有效提高建模和监测阶段效率;提出了贝叶斯推理方法以融合所有子模型的监测统计信息来获得全局状态,针对已经成功检测到的异常,定义块异常指标来确定块级别的异常位置,并采用贡献图方法在变量级上进一步定位异常源。
附图说明
图1为本发明的流程图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有的通过先验知识获得子块不准确,在全局监测模型中采用解析型字典学习和合成型字典学习存在不足,建模和监测阶段的效率低,全局监测模型不能为整个工业过程提供准确的描述的问题,提供了一种基于互信息和投影字典对学习的分布式过程监测方法。
如图1所示,本发明的实施例提供了一种基于互信息和投影字典对学习的分布式过程监测方法,包括:步骤1,获取多模态历史数据,并将正常多模态历史数据作为训练样本;步骤2,根据各模态的过程变量间的互信息对训练样本进行自动分块,得到各模态训练样本的分块结果;步骤3,对训练样本每种模态的每个子块建立投影字典对学习模型,并获得相应的合成型字典和解析型字典;步骤4,根据对训练样本每种模态的每个子块建立的投影字典对学习模型计算训练样本各块的重构误差,对自动分块后的训练样本使用核密度估计方法计算训练样本各块的控制阈值;步骤5,在投影字典对学习模型中输入新的过程数据,将新的过程数据作为测试样本,使用互信息方法将测试样本按不同模态下训练数据分块方式进行分块,并根据分块后的测试样本的每个子块相应的投影字典对学习模型计算测试样本各块的重构误差;步骤6,将测试样本各块的重构误差转换为模态概率,根据模态概率计算各模态下通过测试样本所有块的联合概率,根据各模态下通过测试样本所有块的联合概率对测试样本进行模态识别;步骤7,通过贝叶斯推理方法将测试样本各块的重构误差和训练样本各块的控制阈值融合至全局异常指标中,对测试样本进行异常检测,将测试样本各块的重构误差转换为正常和异常的概率,根据贝叶斯法则得出测试样本的块异常后验概率;步骤8,通过判断全局异常指标是否超过显著性水平α,判断测试样本是否异常,当全局异常指标未超过显著性水平α时,测试样本被检测为正常,当全局异常指标超过显著性水平α时,测试样本被检测为异常;步骤9,对检测为异常后的测试样本通过块贡献指标定位测试样本中的异常块,并将异常块进行隔离;步骤10,对检测为异常后的测试样本通过变量贡献指标定位异常块中的异常变量,并将异常变量进行隔离。
本发明的上述实施例所述的基于互信息和投影字典对学习的分布式过程监测方法,主要包括离线建模、在线监测和异常隔离三个阶段,离线建模:分别利用不同模态的过程变量间的互信息进行自动分块,为每个块建立投影字典对学习模型,并获得相应的合成型字典、解析型字典及控制阈值;在线监测:使用互信息方法对新获得的测试样本分块,定义块的联合概率以识别测试样本的模态,通过贝叶斯推理方法将子块的重构误差和控制阈值融合至全局异常指标,从而对测试样本进行异常检测;异常隔离:通过定义块贡献指标和变量贡献指标对异常样本进行异常源定位与隔离。
其中,所述步骤1和所述步骤2具体包括:收集多模态历史数据,将多模态历史数据作为训练样本表示为X=[X1,X2,…,XK]∈RpK×n,其中K表示训练样本的模态数,p表示训练样本的维数,n表示各模态的训练样本数,将第K种模态下的训练样本变量集表示为
Figure BDA0002807339840000101
在第K种模态的训练样本
Figure BDA0002807339840000102
中选择变量
Figure BDA0002807339840000103
作为目标变量,计算训练样本中的变量
Figure BDA0002807339840000104
与目标变量
Figure BDA0002807339840000105
之间的互信息值
Figure BDA0002807339840000106
如下所示:
Figure BDA0002807339840000107
其中,
Figure BDA0002807339840000108
表示训练样本中的变量
Figure BDA0002807339840000109
与目标变量
Figure BDA00028073398400001010
之间的互信息值,
Figure BDA00028073398400001011
表示联合概率密度函数,i=1,2,…,p,j=1,2,…,p;
Figure BDA00028073398400001012
Figure BDA00028073398400001013
表示边缘概率密度函数,i=1,2,…,p,j=1,2,…,p;
Figure BDA00028073398400001014
表示目标变量,i=1,2,…,p;
Figure BDA00028073398400001015
表示训练样本中的变量,j=1,2,…,p;
通过确定阈值ηK,判断各变量与目标变量间的互信息值是否满足
Figure BDA00028073398400001016
Figure BDA00028073398400001017
时,将变量
Figure BDA00028073398400001018
与目标变量
Figure BDA00028073398400001019
划分在第N个训练样本变量集SN中,训练样本的剩余变量集为{S-SN};
对第K种模态的训练样本
Figure BDA0002807339840000111
中的剩余变量重复上述步骤,直至第K种模态的训练样本
Figure BDA0002807339840000112
中的剩余变量的个数小于M,其中,M表示给定最小剩余变量数,将第K种模态的训练样本
Figure BDA0002807339840000113
中的剩余的变量划分至最后一个变量集SN中;
将第K种模态的训练样本XK的分块集合表示为
Figure BDA0002807339840000114
其中,NK表示分块数;
将通过互信息方法自动分块后的训练样本表示为:
Figure BDA0002807339840000115
其中,
Figure BDA0002807339840000116
表示第K种模态的第NK个子块中的训练样本。
其中,所述步骤3具体包括:在第K种模态的第NK个子块的训练样本
Figure BDA0002807339840000117
中构建投影字典对学习模型,如下所示:
Figure BDA0002807339840000118
其中,
Figure BDA0002807339840000119
表示数据重构函数,
Figure BDA00028073398400001110
Figure BDA00028073398400001111
表示判别函数,||·||F表示Frobenius范数,
Figure BDA00028073398400001112
表示第K种模态的第NK个子块的训练样本,
Figure BDA00028073398400001113
Figure BDA00028073398400001114
表示合成型字典,
Figure BDA00028073398400001115
Figure BDA00028073398400001116
表示解析型字典,
Figure BDA00028073398400001117
Figure BDA00028073398400001118
表示解析编码矩阵,
Figure BDA00028073398400001119
Figure BDA00028073398400001120
表示
Figure BDA00028073398400001121
的互补数据矩阵,τ表示常量,λ表示恒大于零的常量,di表示合成型字典
Figure BDA00028073398400001122
的第i个原子。
本发明的上述实施例所述的基于互信息和投影字典对学习的分布式过程监测方法,在实际工作中,基于互信息方法自动划分块按照以下方式进行迭代:第一步:输入第K种模态的训练样本
Figure BDA00028073398400001123
将训练样本变量集表示为
Figure BDA00028073398400001124
第二步:重复以下步骤,直到训练样本XK中所剩变量个数小于M,N=N+1,并将所剩变量划分至最后一个变量集SN中;第三步:从训练样本XK中随机选择一个变量
Figure BDA00028073398400001128
作为目标变量,计算训练样本中的变量
Figure BDA00028073398400001125
与目标变量之间的互信息值
Figure BDA00028073398400001126
令N=1;第四步:确定阈值ηK,判断各变量与目标变量之间的互信息值是否满足
Figure BDA00028073398400001127
若满足,则将该变量划分在第N个变量集SN中,训练样本的剩余变量集为{S-SN};第五步:令N=N+1;第六步:输出第K种模态下训练样本XK的分块集合
Figure BDA0002807339840000121
分块数NK
其中,所述步骤3还包括:使用Frobenius范数对随机矩阵进行单位化处理,对合成型字典
Figure BDA0002807339840000122
和解析型字典
Figure BDA0002807339840000123
进行初始化,交替更新解析编码矩阵
Figure BDA0002807339840000124
Figure BDA0002807339840000125
对公式(3)中目标函数的优化过程如下所示:
将合成型字典
Figure BDA0002807339840000126
和解析型字典
Figure BDA0002807339840000127
固定,更新解析编码矩阵
Figure BDA0002807339840000128
如下所示:
Figure BDA0002807339840000129
公式(4)为标准的最小二乘问题,存在一个闭型解,如下所示:
Figure BDA00028073398400001210
其中,I表示单位矩阵,I∈RK×K
Figure BDA00028073398400001211
表示
Figure BDA00028073398400001212
的转置矩阵;
将解析编码矩阵
Figure BDA00028073398400001213
固定,更新合成型字典
Figure BDA00028073398400001214
和解析型字典
Figure BDA00028073398400001215
如下所示:
Figure BDA00028073398400001216
将解析型字典
Figure BDA00028073398400001217
的闭型解表示为:
Figure BDA00028073398400001218
其中,γ=10-4
将变量矩阵
Figure BDA00028073398400001219
引入合成型字典
Figure BDA00028073398400001220
中进行优化,并对优化后的合成型字典
Figure BDA00028073398400001221
进行求解,如下所示:
Figure BDA00028073398400001222
其中,si表示变量矩阵
Figure BDA00028073398400001223
的第i列;
通过交替方向乘子法得到公式(8)的最优解,如下所示:
Figure BDA00028073398400001224
其中,
Figure BDA00028073398400001225
表示第t+1次迭代的合成型字典
Figure BDA00028073398400001226
Figure BDA00028073398400001227
表示第t+1次迭代的变量矩阵
Figure BDA0002807339840000131
Figure BDA0002807339840000132
表示第t+1次迭代的变量矩阵
Figure BDA0002807339840000133
Figure BDA0002807339840000134
表示第t次迭代的合成型字典
Figure BDA0002807339840000135
Figure BDA0002807339840000136
表示第t次迭代的变量矩阵
Figure BDA0002807339840000137
Figure BDA0002807339840000138
表示表示第t次迭代的变量矩阵
Figure BDA0002807339840000139
Figure BDA00028073398400001310
表示初始合成型字典
Figure BDA00028073398400001311
Figure BDA00028073398400001312
表示初始变量矩阵
Figure BDA00028073398400001313
Figure BDA00028073398400001314
表示初始变量矩阵
Figure BDA00028073398400001315
ρ表示给定参数;
在对合成型字典
Figure BDA00028073398400001316
进行优化的每一步中都存在解析编码矩阵
Figure BDA00028073398400001317
和解析型字典
Figure BDA00028073398400001318
的封闭解,且合成型字典
Figure BDA00028073398400001319
基于交替方向乘子法优化收敛迅速。
本发明的上述实施例所述的基于互信息和投影字典对学习的分布式过程监测方法,在实际工作中,判别合成型字典和解析型字典对学习按照以下方式进行迭代:第一步:输入第K种模态的第NK个子块中的训练样本
Figure BDA00028073398400001320
参数λ,τ,γ;第二步:生成随机矩阵作为初始合成型字典
Figure BDA00028073398400001321
和初始解析型字典
Figure BDA00028073398400001322
并进行列归一化处理;第三步:重复第二步,直到满足停止条件(给定的求解迭代次数);第四步:令t=t+1,其中,t表示迭代次数;第五步:通过公式(5)对更新解析编码矩阵
Figure BDA00028073398400001323
进行更新:
Figure BDA00028073398400001324
第六步:通过公式(7)对解析型字典
Figure BDA00028073398400001325
进行更新:
Figure BDA00028073398400001326
第七步:通过公式(9)对合成型字典
Figure BDA00028073398400001327
进行更新:
Figure BDA00028073398400001328
第八步:输出第K种模态的第NK个子块中训练样本
Figure BDA00028073398400001329
的解析型字典
Figure BDA00028073398400001330
合成型字典
Figure BDA00028073398400001331
其中,所述步骤4具体包括:通过对训练样本每种模态的每个子块建立的投影字典对学习模型,计算第K种模态的第NK个子块的训练样本
Figure BDA00028073398400001332
的重构误差,如下所示:
Figure BDA00028073398400001333
其中,
Figure BDA00028073398400001334
表示第K种模态的第NK个子块的训练样本
Figure BDA00028073398400001335
的重构误差;
通过核密度估计方法从训练样本X=[X1,X2,…,XK]∈RpK×n中获得第K种模态的第NK个子块的训练样本
Figure BDA0002807339840000141
的控制阈值
Figure BDA0002807339840000142
基于训练样本
Figure BDA0002807339840000143
使用单变量核密度估计,如下所示:
Figure BDA0002807339840000144
其中,x表示考虑的变量,M表示训练样本大小,h表示带宽,Ei表示块中第i个训练样本的重构误差,K(x)表示选择均匀核函数。
其中,所述步骤5和所述步骤6具体包括:将新的测试样本
Figure BDA00028073398400001413
输入投影字典对学习模型,通过互信息方法将新的测试样本
Figure BDA00028073398400001414
按不同模态下训练样本分块方式划分为Ynew=[y1,y2,…,yB]T,将Ynew=[y1,y2,…,yB]T进行标准化处理,并根据相应投影字典对学习模型计算测试样本各块的重构误差,如下所示:
Figure BDA0002807339840000145
其中,
Figure BDA0002807339840000146
表示Ynew=[y1,y2,…,yB]T中第B个块的重构误差,DB表示各模态下第B个块投影字典对学习模型中的合成型字典,PB表示各模态下第B个块投影字典对学习模型中的解析型字典,yB表示ynew的第B个子块;
将Ynew=[y1,y2,…,yB]T中第B个块的重构误差
Figure BDA0002807339840000147
转换为模态概率,如下所示:
Figure BDA0002807339840000148
其中,p(yB∈Mi)表示模态概率,Mi表示第i种模态,
Figure BDA0002807339840000149
表示测试样本在第i种模态下第B个块的重构误差;
事件Ynew∈Mi等价于(y1∈Mi)∩(y2∈Mi)∩…∩(yB∈Mi),将事件Ynew∈Mi的概率表示为所有块的联合概率,如下所示:
Figure BDA00028073398400001410
其中,p(Ynew∈Mi)表示联合概率。
其中,所述步骤7和所述步骤8具体包括:将测试样本Ynew=[y1,y2,…,yB]T中第B个块的重构误差
Figure BDA00028073398400001411
转换成正常和异常的概率,如下所示:
Figure BDA00028073398400001412
Figure BDA0002807339840000151
其中,
Figure BDA0002807339840000152
表示训练样本的第K种模态下第B个块的控制阈值,pB(yB|N)表示块正常条件概率,pB(yB|A)表示块异常条件概率;
根据贝叶斯法则得出块异常后验概率,如下所示:
Figure BDA0002807339840000153
其中,pB(A|yB)表示块异常后验概率,pB(N)表示块正常概率,pB(A)表示块异常概率,块正常概率pB(N)和块异常概率pB(A)通过显著性水平α给出,即pB(N)=1-α,pB(A)=α;
通过贝叶斯推理方法将测试样本各块的重构误差和训练样本各块的控制阈值融合至全局异常指标,将全局异常指标定义为:
Figure BDA0002807339840000154
其中,N表示每种模态下的分块数;
当全局异常指标GAI小于显著性水平α,即GAI<α时,测试样本为正常,当GAI>α时,测试样本为异常。
其中,所述步骤9和所述步骤10具体包括:将块异常标志定义为:
Figure BDA0002807339840000155
其中,
Figure BDA0002807339840000156
表示块异常标志,
Figure BDA0002807339840000157
表示第B个块中的第k个样本;当测试样本的块中存在异常样本k时,相应的测试样本的块异常后验概率
Figure BDA0002807339840000158
大于显著性水平α时,块异常标志
Figure BDA0002807339840000159
置1;
将块异常指标定义为:
Figure BDA00028073398400001510
其中,BAIB表示块异常指标,K表示测试样本块中异常样本数;
将块贡献指标定义为:
Figure BDA0002807339840000161
其中,BCIB表示块贡献指标,N表示每种模态下的分块数。
本发明的上述实施例所述的基于互信息和投影字典对学习的分布式过程监测方法,通过定义块异常指标和块贡献指标,确保了块级异常隔离的可靠性。
其中,所述步骤10还包括:基于块贡献指标BCIB通过贡献图方法计算变量贡献指标,当块中存在异常样本
Figure BDA0002807339840000162
时,异常样本
Figure BDA0002807339840000163
对应的合成型字典和解析编码矩阵分别为DB
Figure BDA0002807339840000164
将异常样本
Figure BDA0002807339840000165
表示为:
Figure BDA0002807339840000166
其中,I表示单位矩阵,I∈Rm×m,m表示块中变量数;f表示向量,f具有非零项的异常位置和大小;异常样本
Figure BDA0002807339840000167
在增广合成型字典
Figure BDA0002807339840000168
下新的解析编码矩阵表示为:
Figure BDA0002807339840000169
其中,
Figure BDA00028073398400001610
表示增广合成型典,
Figure BDA00028073398400001611
表示新的测试样本,
Figure BDA00028073398400001612
其中,所述步骤10还包括:
根据贡献图方法,将测试样本的第B块中第j个变量贡献指标表示为:
Figure BDA00028073398400001613
其中,
Figure BDA00028073398400001614
表示测试样本的第B块中第j个变量贡献指标,S表示由零矩阵和单位矩阵I组成的矩阵,S=[O,I]∈Rm×(p+m),p表示合成型字典DB的原子数;
Figure BDA00028073398400001615
表示新的解析编码矩阵,通过
Figure BDA00028073398400001616
选择新的解析编码矩阵
Figure BDA00028073398400001617
的后面m个元素,
Figure BDA00028073398400001618
与向量f相同,ej表示单位向量,
Figure BDA00028073398400001619
本发明的上述实施例所述的基于互信息和投影字典对学习的分布式过程监测方法,通过建立投影字典对学习模型,采用分布式过程监测方法,引入互信息方法考虑变量之间的交叉关系和高阶统计信息来自动划分块以进行分布式过程监测,降低了工业过程复杂性,为整个工业过程提供了更准确的描述,通过引入投影字典对学习框架将传统的判别合成型字典学习扩展为判别合成型与解析型字典对学习,在实现复杂工业过程局部建模的同时,利用解析编码方法来有效提高建模和监测阶段效率,利用块联合概率和贝叶斯推理方法实现模态识别和异常检测,通过定义块贡献指标和变量贡献指标进行异常源定位与隔离。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,包括:
步骤1,获取多模态历史数据,并将正常多模态历史数据作为训练样本;
步骤2,根据各模态的过程变量间的互信息对训练样本进行自动分块,得到各模态训练样本的分块结果;
步骤3,对训练样本每种模态的每个子块建立投影字典对学习模型,并获得相应的合成型字典和解析型字典;
步骤4,根据对训练样本每种模态的每个子块建立的投影字典对学习模型计算训练样本各块的重构误差,对自动分块后的训练样本使用核密度估计方法计算训练样本各块的控制阈值;
步骤5,在投影字典对学习模型中输入新的过程数据,将新的过程数据作为测试样本,使用互信息方法将测试样本按不同模态下训练数据分块方式进行分块,并根据分块后的测试样本的每个子块相应的投影字典对学习模型计算测试样本各块的重构误差;
步骤6,将测试样本各块的重构误差转换为模态概率,根据模态概率计算各模态下通过测试样本所有块的联合概率,根据各模态下通过测试样本所有块的联合概率对测试样本进行模态识别;
步骤7,通过贝叶斯推理方法将测试样本各块的重构误差和训练样本各块的控制阈值融合至全局异常指标中,对测试样本进行异常检测,将测试样本各块的重构误差转换为正常和异常的概率,根据贝叶斯法则得出测试样本的块异常后验概率;
步骤8,通过判断全局异常指标是否超过显著性水平α,判断测试样本是否异常,当全局异常指标未超过显著性水平α时,测试样本被检测为正常,当全局异常指标超过显著性水平α时,测试样本被检测为异常;
步骤9,对检测为异常后的测试样本通过块贡献指标定位测试样本中的异常块,并将异常块进行隔离;
步骤10,对检测为异常后的测试样本通过变量贡献指标定位异常块中的异常变量,并将异常变量进行隔离。
2.根据权利要求1所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤1和所述步骤2具体包括:
收集多模态历史数据,将多模态历史数据作为训练样本表示为X=[X1,X2,…,XK]∈RpK ×n,其中K表示训练样本的模态数,p表示训练样本的维数,n表示各模态的训练样本数,将第K种模态下的训练样本变量集表示为
Figure FDA0002807339830000021
在第K种模态的训练样本
Figure FDA0002807339830000022
中选择变量
Figure FDA0002807339830000023
作为目标变量,计算训练样本中的变量
Figure FDA0002807339830000024
与目标变量
Figure FDA0002807339830000025
之间的互信息值
Figure FDA0002807339830000026
如下所示:
Figure FDA0002807339830000027
其中,
Figure FDA0002807339830000028
表示训练样本中的变量
Figure FDA0002807339830000029
与目标变量
Figure FDA00028073398300000210
之间的互信息值,
Figure FDA00028073398300000211
表示联合概率密度函数,i=1,2,…,p,j=1,2,…,p;
Figure FDA00028073398300000212
Figure FDA00028073398300000213
表示边缘概率密度函数,i=1,2,…,p,j=1,2,…,p;
Figure FDA00028073398300000214
表示目标变量,i=1,2,…,p;
Figure FDA00028073398300000215
表示训练样本中的变量,j=1,2,…,p;
通过确定阈值ηK,判断各变量与目标变量间的互信息值是否满足
Figure FDA00028073398300000216
Figure FDA00028073398300000217
时,将变量
Figure FDA00028073398300000218
与目标变量
Figure FDA00028073398300000219
划分在第N个训练样本变量集SN中,训练样本的剩余变量集为{S-SN};
对第K种模态的训练样本
Figure FDA00028073398300000220
中的剩余变量重复上述步骤,直至第K种模态的训练样本
Figure FDA00028073398300000221
中的剩余变量的个数小于M,其中,M表示给定最小剩余变量数,将第K种模态的训练样本
Figure FDA00028073398300000222
中的剩余的变量划分至最后一个变量集SN中;
将第K种模态的训练样本XK的分块集合表示为
Figure FDA00028073398300000223
其中,NK表示分块数;
将通过互信息方法自动分块后的训练样本表示为:
Figure FDA00028073398300000224
其中,
Figure FDA00028073398300000225
表示第K种模态的第NK个子块中的训练样本。
3.根据权利要求2所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤3具体包括:
在第K种模态的第NK个子块的训练样本
Figure FDA0002807339830000031
中构建投影字典对学习模型,如下所示:
Figure FDA0002807339830000032
其中,
Figure FDA0002807339830000033
表示数据重构函数,
Figure FDA0002807339830000034
Figure FDA0002807339830000035
表示判别函数,||·||F表示Frobenius范数,
Figure FDA0002807339830000036
表示第K种模态的第NK个子块的训练样本,
Figure FDA0002807339830000037
Figure FDA0002807339830000038
表示合成型字典,
Figure FDA0002807339830000039
Figure FDA00028073398300000310
表示解析型字典,
Figure FDA00028073398300000311
Figure FDA00028073398300000312
表示解析编码矩阵,
Figure FDA00028073398300000313
Figure FDA00028073398300000314
表示
Figure FDA00028073398300000315
的互补数据矩阵,τ表示常量,λ表示恒大于零的常量,di表示合成型字典
Figure FDA00028073398300000316
的第i个原子。
4.根据权利要求3所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤3还包括:
使用Frobenius范数对随机矩阵进行单位化处理,对合成型字典
Figure FDA00028073398300000317
和解析型字典
Figure FDA00028073398300000318
进行初始化,交替更新解析编码矩阵
Figure FDA00028073398300000319
Figure FDA00028073398300000320
对公式(3)中目标函数的优化过程如下所示:
将合成型字典
Figure FDA00028073398300000321
和解析型字典
Figure FDA00028073398300000322
固定,更新解析编码矩阵
Figure FDA00028073398300000323
如下所示:
Figure FDA00028073398300000324
公式(4)为标准的最小二乘问题,存在一个闭型解,如下所示:
Figure FDA00028073398300000325
其中,I表示单位矩阵,I∈RK×K
Figure FDA00028073398300000326
表示
Figure FDA00028073398300000327
的转置矩阵;
将解析编码矩阵
Figure FDA00028073398300000328
固定,更新合成型字典
Figure FDA00028073398300000329
和解析型字典
Figure FDA00028073398300000330
如下所示:
Figure FDA00028073398300000331
将解析型字典
Figure FDA00028073398300000332
的闭型解表示为:
Figure FDA00028073398300000333
其中,γ=10-4
将变量矩阵
Figure FDA0002807339830000041
引入合成型字典
Figure FDA0002807339830000042
中进行优化,并对优化后的合成型字典
Figure FDA0002807339830000043
进行求解,如下所示:
Figure FDA0002807339830000044
其中,si表示变量矩阵
Figure FDA0002807339830000045
的第i列;
通过交替方向乘子法得到公式(8)的最优解,如下所示:
Figure FDA0002807339830000046
其中,
Figure FDA0002807339830000047
表示第t+1次迭代的合成型字典
Figure FDA0002807339830000048
表示第t+1次迭代的变量矩阵
Figure FDA0002807339830000049
表示第t+1次迭代的变量矩阵
Figure FDA00028073398300000410
表示第t次迭代的合成型字典
Figure FDA00028073398300000411
表示第t次迭代的变量矩阵
Figure FDA00028073398300000412
表示表示第t次迭代的变量矩阵
Figure FDA00028073398300000413
表示初始合成型字典
Figure FDA00028073398300000414
表示初始变量矩阵
Figure FDA00028073398300000429
Figure FDA00028073398300000415
表示初始变量矩阵
Figure FDA00028073398300000416
ρ表示给定参数;
在对合成型字典
Figure FDA00028073398300000417
进行优化的每一步中都存在解析编码矩阵
Figure FDA00028073398300000418
和解析型字典
Figure FDA00028073398300000419
的封闭解,且合成型字典
Figure FDA00028073398300000420
基于交替方向乘子法优化收敛迅速。
5.根据权利要求3所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤4具体包括:
通过对训练样本每种模态的每个子块建立的投影字典对学习模型,计算第K种模态的第NK个子块的训练样本
Figure FDA00028073398300000421
的重构误差,如下所示:
Figure FDA00028073398300000422
其中,
Figure FDA00028073398300000423
表示第K种模态的第NK个子块的训练样本
Figure FDA00028073398300000424
的重构误差;
通过核密度估计方法从训练样本X=[X1,X2,…,XK]∈RpK×n中获得第K种模态的第NK个子块的训练样本
Figure FDA00028073398300000425
的控制阈值
Figure FDA00028073398300000426
基于训练样本
Figure FDA00028073398300000427
使用单变量核密度估计,如下所示:
Figure FDA00028073398300000428
其中,x表示考虑的变量,M表示训练样本大小,h表示带宽,Ei表示块中第i个训练样本的重构误差,K(x)表示选择均匀核函数。
6.根据权利要求3所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤5和所述步骤6具体包括:
将新的测试样本
Figure FDA00028073398300000510
输入投影字典对学习模型,通过互信息方法将新的测试样本
Figure FDA00028073398300000511
按不同模态下训练样本分块方式划分为Ynew=[y1,y2,…,yB]T,将Ynew=[y1,y2,…,yB]T进行标准化处理,并根据相应投影字典对学习模型计算测试样本各块的重构误差,如下所示:
Figure FDA0002807339830000051
其中,
Figure FDA0002807339830000052
表示Ynew=[y1,y2,…,yB]T中第B个块的重构误差,DB表示各模态下第B个块投影字典对学习模型中的合成型字典,PB表示各模态下第B个块投影字典对学习模型中的解析型字典,yB表示ynew的第B个子块;
将Ynew=[y1,y2,…,yB]T中第B个块的重构误差
Figure FDA0002807339830000053
转换为模态概率,如下所示:
Figure FDA0002807339830000054
其中,p(yB∈Mi)表示模态概率,Mi表示第i种模态,
Figure FDA0002807339830000055
表示测试样本在第i种模态下第B个块的重构误差;
事件Ynew∈Mi等价于(y1∈Mi)∩(y2∈Mi)∩…∩(yB∈Mi),将事件Ynew∈Mi的概率表示为所有块的联合概率,如下所示:
Figure FDA0002807339830000056
其中,p(Ynew∈Mi)表示联合概率。
7.根据权利要求6所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤7和所述步骤8具体包括:
将测试样本Ynew=[y1,y2,…,yB]T中第B个块的重构误差
Figure FDA0002807339830000057
转换成正常和异常的概率,如下所示:
Figure FDA0002807339830000058
Figure FDA0002807339830000059
其中,
Figure FDA0002807339830000061
表示训练样本的第K种模态下第B个块的控制阈值,pB(yB|N)表示块正常条件概率,pB(yB|A)表示块异常条件概率;
根据贝叶斯法则得出块异常后验概率,如下所示:
Figure FDA0002807339830000062
其中,pB(A|yB)表示块异常后验概率,pB(N)表示块正常概率,pB(A)表示块异常概率,块正常概率pB(N)和块异常概率pB(A)通过显著性水平α给出,即pB(N)=1-α,pB(A)=α;
通过贝叶斯推理方法将测试样本各块的重构误差和训练样本各块的控制阈值融合至全局异常指标,将全局异常指标定义为:
Figure FDA0002807339830000063
其中,N表示每种模态下的分块数;
当全局异常指标GAI小于显著性水平α,即GAI<α时,测试样本为正常,当GAI>α时,测试样本为异常。
8.根据权利要求6所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤9和所述步骤10具体包括:
将块异常标志定义为:
Figure FDA0002807339830000064
其中,
Figure FDA0002807339830000065
表示块异常标志,
Figure FDA0002807339830000066
表示第B个块中的第k个样本;当测试样本的块中存在异常样本k时,相应的测试样本的块异常后验概率
Figure FDA0002807339830000067
大于显著性水平α时,块异常标志
Figure FDA0002807339830000068
置1;
将块异常指标定义为:
Figure FDA0002807339830000069
其中,BAIB表示块异常指标,K表示测试样本块中异常样本数;
将块贡献指标定义为:
Figure FDA0002807339830000071
其中,BCIB表示块贡献指标,N表示每种模态下的分块数。
9.根据权利要求6所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤10还包括:
基于块贡献指标BCIB通过贡献图方法计算变量贡献指标,当块中存在异常样本
Figure FDA0002807339830000072
时,异常样本
Figure FDA0002807339830000073
对应的合成型字典和解析编码矩阵分别为DB
Figure FDA0002807339830000074
将异常样本
Figure FDA0002807339830000075
表示为:
Figure FDA0002807339830000076
其中,I表示单位矩阵,I∈Rm×m,m表示块中变量数;f表示向量,f具有非零项的异常位置和大小;异常样本
Figure FDA0002807339830000077
在增广合成型字典
Figure FDA0002807339830000078
下新的解析编码矩阵表示为:
Figure FDA0002807339830000079
其中,
Figure FDA00028073398300000710
表示增广合成型典,
Figure FDA00028073398300000711
表示新的测试样本,
Figure FDA00028073398300000712
10.根据权利要求9所述的基于互信息和投影字典对学习的分布式过程监测方法,其特征在于,所述步骤10还包括:
根据贡献图方法,将测试样本的第B块中第j个变量贡献指标表示为:
Figure FDA00028073398300000713
其中,
Figure FDA00028073398300000719
表示测试样本的第B块中第j个变量贡献指标,S表示由零矩阵和单位矩阵I组成的矩阵,S=[O,I]∈Rm×(p+m),p表示合成型字典DB的原子数;
Figure FDA00028073398300000714
表示新的解析编码矩阵,通过
Figure FDA00028073398300000715
选择新的解析编码矩阵
Figure FDA00028073398300000716
的后面m个元素,
Figure FDA00028073398300000717
与向量f相同,ej表示单位向量,
Figure FDA00028073398300000718
CN202011376749.8A 2020-11-30 2020-11-30 基于互信息和投影字典对学习的分布式过程监测方法 Pending CN112488202A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011376749.8A CN112488202A (zh) 2020-11-30 2020-11-30 基于互信息和投影字典对学习的分布式过程监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011376749.8A CN112488202A (zh) 2020-11-30 2020-11-30 基于互信息和投影字典对学习的分布式过程监测方法

Publications (1)

Publication Number Publication Date
CN112488202A true CN112488202A (zh) 2021-03-12

Family

ID=74937690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011376749.8A Pending CN112488202A (zh) 2020-11-30 2020-11-30 基于互信息和投影字典对学习的分布式过程监测方法

Country Status (1)

Country Link
CN (1) CN112488202A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780456A (zh) * 2021-09-17 2021-12-10 陕西科技大学 一种疼痛识别方法、系统及计算机存储介质
CN114897047A (zh) * 2022-04-02 2022-08-12 西安交通大学 基于深度字典的多传感器数据漂移检测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113780456A (zh) * 2021-09-17 2021-12-10 陕西科技大学 一种疼痛识别方法、系统及计算机存储介质
CN113780456B (zh) * 2021-09-17 2023-10-27 陕西科技大学 一种疼痛识别方法、系统及计算机存储介质
CN114897047A (zh) * 2022-04-02 2022-08-12 西安交通大学 基于深度字典的多传感器数据漂移检测方法
CN114897047B (zh) * 2022-04-02 2023-07-28 西安交通大学 基于深度字典的多传感器数据漂移检测方法

Similar Documents

Publication Publication Date Title
CN111079836B (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN111504676B (zh) 基于多源监控数据融合的设备故障诊断方法、装置及系统
Xu et al. Distributed plant-wide process monitoring based on PCA with minimal redundancy maximal relevance
CN110579967B (zh) 基于同时降维和字典学习的过程监控方法
CN112488202A (zh) 基于互信息和投影字典对学习的分布式过程监测方法
CN111046961B (zh) 基于双向长短时记忆单元和胶囊网络的故障分类方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN113642754A (zh) 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
Wang et al. Time-weighted kernel-sparse-representation-based real-time nonlinear multimode process monitoring
CN111639304A (zh) 基于Xgboost回归模型的CSTR故障定位方法
Sun et al. A wireless sensor network node fault diagnosis model based on belief rule base with power set
CN113159225B (zh) 多变量工业过程故障分类方法
CN113919540A (zh) 一种生产过程运行状态的监测方法及相关设备
Liu et al. Structured sequential Gaussian graphical models for monitoring time-varying process
CN117407313A (zh) 一种基于机器学习分析自动化测试质量的方法及系统
CN110244690B (zh) 一种多变量工业过程故障辨识方法及系统
CN110320802B (zh) 基于数据可视化的复杂系统信号时序识别方法
CN111160393A (zh) 一种基于数据驱动的运载火箭健康评估模型模块化建模方法
CN114897047B (zh) 基于深度字典的多传感器数据漂移检测方法
CN115860243A (zh) 一种基于工业物联网数据的故障预测方法和系统
CN113315781B (zh) 基于hmm模型的异常数据检测方法
CN115659135A (zh) 一种面向多源异构工业传感器数据的异常检测方法
CN113378009A (zh) 基于二元决策图的二值神经网络定量分析方法
Wu et al. Fault detection and diagnosis based on sparse representation classification (SRC)
CN113076211B (zh) 一种基于故障重构的质量相关故障诊断及误报警反馈方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination