CN113110402B - 知识与数据驱动的大规模工业系统分布式状态监测方法 - Google Patents

知识与数据驱动的大规模工业系统分布式状态监测方法 Download PDF

Info

Publication number
CN113110402B
CN113110402B CN202110565642.6A CN202110565642A CN113110402B CN 113110402 B CN113110402 B CN 113110402B CN 202110565642 A CN202110565642 A CN 202110565642A CN 113110402 B CN113110402 B CN 113110402B
Authority
CN
China
Prior art keywords
fault
variables
variable
subsystems
directed graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110565642.6A
Other languages
English (en)
Other versions
CN113110402A (zh
Inventor
宋春跃
吴炜强
徐祖华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202110565642.6A priority Critical patent/CN113110402B/zh
Publication of CN113110402A publication Critical patent/CN113110402A/zh
Application granted granted Critical
Publication of CN113110402B publication Critical patent/CN113110402B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0262Confirmation of fault detection, e.g. extra checks to confirm that a failure has indeed occurred
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/24Pc safety
    • G05B2219/24065Real time diagnostics

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种知识与数据驱动的大规模工业系统分布式状态监测方法。首先,基于系统拓扑知识建立大规模工业系统的有向图模型,并根据复杂网络的社区分团方法将有向图模型分解成多个独立的子系统。其次,考虑系统的动态性,利用各子系统之间的通信信息,在每个子系统中分别建立典型变量分析模型进行故障检测,然后将所有子系统的检测结果通过贝叶斯推理融合成最终的全局检测结果。最后,针对检测出的故障,利用分布式贡献图分析方法确定故障负责变量,并通过有向图推理法进行故障溯源,定位故障发生的根源。本发明结合系统知识与数据,实现了对大规模工业系统的分布式状态监测,提高了故障检测的准确度,验证了故障溯源的可行性。

Description

知识与数据驱动的大规模工业系统分布式状态监测方法
技术领域
本发明属于工业系统故障诊断技术领域,具体涉及了一种知识与数据驱动的大规模工业系统分布式状态监测方法。
背景技术
以智能制造为主导方向的工业自动化发展迅速,现代工业系统逐渐形成以大型集散控制系统为核心,配备了大量直接用于测量的传感器,间接检测的软测量设备和结构复杂的控制回路,不断朝着复杂化、信息化和智能化的方向发展。在此背景下,大规模工业系统的数量逐年增加,逐渐成为了现代工业系统中的主角,也受到了各界广泛的关注。
工业系统的生产安全问题一直是企业生产中关注的重点,故障诊断技术也在过去几十年中得到了迅速地发展,为企业安全生产提供了保障。但是对于大规模系统来说,其具有结构复杂建模难度大,工作系统中的变量众多且变量间关系复杂,数据容量大、类型多和采样率多等特点。传统工业系统的集中式监测方法在大规模工业系统上既面临着检测准确度的问题,也存在计算复杂度的压力,因此这也给大规模工业系统的故障诊断带来了很大的挑战。
针对大规模工业系统的复杂特点和故障诊断所面临的挑战,前人已经做了相应的研究和探讨,许多分级或分块的监测算法被提出,这些方法的基本思想是首先将系统分解成多个不同的子系统,然后在不同的子系统中分别建立监测模型,最后将所有子系统的监测结果融合形成全局监测结果。在这种监测框架下,大规模系统的监测问题可以分解为几个部分:系统分解、子系统监测模型的建立、决策融合、故障诊断和传播路径分析等。
但是,现有的方法仍然存在以下几点问题:一是未能充分利用现有的机理知识。对于大规模工业系统来说,设备间的耦合关系,物料连接信息传递等系统知识总是可得的,但是纯数据驱动的方法常常忽略了对这些知识的使用,从而会降低监测的准确度和可解释性;二是未能充分挖掘系统的动态信息,工业系统中的变量总是具有自相关性的,即动态信息,但是常用的监测模型例如主成分分析法 (PCA)、偏最小二乘法(PLS)等常常忽略这一系统特性,从而导致监测性能的下降;三是未能充分考虑子系统间的通信信息,现有方法往往只关注于子系统内部的变量变化,而没有考虑到子系统之间的信息交流,但是实际上子系统间的变量也存在耦合关系,未能将这些信息同时纳入监测范围会导致信息的损失,影响子系统内部的监测性能;四是现有数据驱动的故障诊断方法大都是基于变量之间的相关性而非因果关系,因此在故障变量隔离和传播路径的分析上通常受蔓延现象的影响,导致对故障原因的判断出现偏差。
发明内容
本发明的目的在于克服上述现有方法的不足,结合系统先验知识和数据,基于有向图分解和分布式典型变量分析方法,实现对大规模工业系统的分布式故障检测与诊断。
本发明的目的通过以下技术方案实现:
一种知识与数据驱动的大规模工业系统分布式状态监测方法,其步骤如下:
S1、针对待监测的工业系统,根据系统知识建立大规模系统的有向图模型,并将有向图分解成多个子系统;
S2、在每个子系统中分别建立典型变量分析模型,所有子系统的检测结果通过贝叶斯推理进行融合,形成全局故障检测结果;
S3、通过分布式贡献图方法确定故障负责变量,并根据有向图推理法定位故障根源。
进一步地,所述S1中,有向图模型的节点表示系统变量,节点间的有向边表示变量之间的因果关系,并且该模型是根据系统知识建立的。
进一步地,所述S1中,有向图模型通过复杂网络中的基于模块度的快速展开算法分解成多个子系统,具体步骤为:
S11、将有向图模型中的每个节点当作一个子系统,得到与节点数相同的子系统数;
S12、计算将节点i划分到相邻节点所在子系统的模块度增益,最大增益表示最好的划分结果;只有当增益为正时,才进行划分,否则节点将保持在原先的子系统中;
S13、对有向图模型中的所有节点重复S12,直到模块度的值不再增加;
S14、将经过步骤S13得到的子系统当作一个新的节点,构造一个新的有向图模型;
S15、不断重复S11~S14,直到有向图结构不再变化以及模块度的值达到最大,大规模系统中的所有变量被划分到了不同的子系统中,最终获得有向图的分解结果。
进一步地,所述模块度Q的计算公式为:
Figure BDA0003080893460000031
其中:Ai,j表示节点i和节点j之间边的权重,ki=∑jAi,j表示与节点i相连的边的权重的总和,kj表示与节点j相连的边的权重的总和,
Figure BDA0003080893460000032
表示有向图中所有边的权重和,ci和cj分别表示节点i和节点j所在的子系统;δ(ci,cj)是一个二值函数,当ci和cj在同一个子系统时等于1,否则等于0。
进一步地,所述S2中,在每个子系统中建立典型变量分析模型来获取系统的动态性,进而实现故障检测,具体步骤为:
S21、假设第b个子系统t时刻的输入数据为
Figure BDA0003080893460000033
t时刻的输出数据为
Figure BDA0003080893460000034
mu,b和my,b分别表示输入变量的数目和输出变量的数目;根据输入输出数据时间序列分别构造过去信息向量pb(t)和未来信息向量fb(t):
pb(t)=[yb(t-1)T,yb(t-2)T,…,yb(t-l)T,ub(t-1)T,ub(t-2)T,…,ub(t-l)T]T
fb(t)=[yb(t)T,yb(t+1)T,…,yb(t+h)T]T
式中:l表示过去信息向量中的时间滞后;h表示未来信息向量中的时间滞后;上标T表示转置;
S22、计算过去信息向量和未来信息向量的协方差矩阵分别为Σpp,b=E(pb(t)pb(t)T)、Σff,b=E(fb(t)fb(t)T)和Σpf,b=E(pb(t)fb(t)T),典型变量分析模型通过最大化典型变量cb(t)=Jbpb(t)和db(t)=Lbfb(t)之间的相关性,从而获得代表过去信息向量pb(t)和未来信息向量fb(t)线性组合的投影矩阵Jb和Lb
S23、通过奇异值分解来获得具有最大相关性的典型变量:
Figure BDA0003080893460000041
式中:Ub和Vb均为酉矩阵;
进而求得投影矩阵
Figure BDA0003080893460000042
Figure BDA0003080893460000043
S24、假设第b个子系统状态空间模型的阶次为sb,得到状态子空间向量
Figure BDA0003080893460000044
和残差子空间向量
Figure BDA0003080893460000045
Figure BDA0003080893460000046
Figure BDA0003080893460000047
其中:
Figure BDA0003080893460000048
Figure BDA0003080893460000049
分别为t时刻的状态子空间向量
Figure BDA00030808934600000410
和残差子空间向量
Figure BDA00030808934600000411
矩阵
Figure BDA00030808934600000412
是矩阵Jb的前sb行,矩阵
Figure BDA00030808934600000413
是矩阵Jb除前sb行之外的剩余行,矩阵
Figure BDA00030808934600000414
是矩阵Ub的前sb列,矩阵
Figure BDA00030808934600000415
是矩阵Ub除前sb列之外的剩余列;
S25、根据Hotelling T2检验,在状态子空间和残差子空间内分别构造T2统计量为
Figure BDA00030808934600000416
Figure BDA00030808934600000417
Figure BDA00030808934600000418
Figure BDA00030808934600000419
式中:
Figure BDA00030808934600000420
Figure BDA00030808934600000421
分别为t时刻的T2统计量
Figure BDA00030808934600000422
Figure BDA00030808934600000423
S26、在给定置信水平α下,状态空间控制限
Figure BDA00030808934600000424
和残差空间控制限
Figure BDA00030808934600000425
满足如下F分布:
Figure BDA00030808934600000426
Figure BDA00030808934600000427
式中:n为典型变量分析模型的训练数据集样本数,Fα(sb,n-sb)和 Fα(eb,n-eb)分别是状态空间和残差空间所满足的F分布。
进一步地,在对子系统进行监测时,根据拓扑连接知识获取子系统间的通信信息,将子系统内变量的本地信息与子系统间的通信信息同时纳入典型变量分析模型中。
进一步地,所述S2中,所有子系统的检测结果通过贝叶斯推理法融合形成全局监测结果
Figure BDA0003080893460000051
Figure BDA0003080893460000052
其具体计算公式为:
Figure BDA0003080893460000053
Figure BDA0003080893460000054
其中:
Figure BDA0003080893460000055
Figure BDA0003080893460000056
分别表示第b个子系统内状态空间和残差空间发生故障的概率,
Figure BDA0003080893460000057
Figure BDA0003080893460000058
分别表示第b个子系统内状态空间和残差空间的故障条件概率,
Figure BDA0003080893460000059
表示第b个子系统内状态空间发生故障的先验概率,
Figure BDA00030808934600000510
表示第b个子系统内状态空间的似然函数,
Figure BDA00030808934600000511
表示第b个子系统内残差空间发生故障的先验概率,
Figure BDA00030808934600000512
表示第b个子系统内残差空间的似然函数,
Figure BDA00030808934600000513
表示第b个子系统内所有样本的状态子空间T2统计量,
Figure BDA00030808934600000514
表示第b个子系统内所有样本的残差子空间T2统计量,B表示子系统的总数。
进一步地,对于全局监测结果
Figure BDA00030808934600000515
Figure BDA00030808934600000516
进行故障检测,进而得到全局故障监测结果,故障检测的判断逻辑为:
Figure BDA00030808934600000517
进一步地,所述S3中,通过分布式贡献图方法确定故障负责变量,并根据有向图推理法定位故障根源包括两个步骤:
S31、基于分布式典型变量分析模型的故障贡献分析:针对所有发生故障的样本,计算所有发生故障的子系统内变量的状态空间贡献、残差空间贡献,并由此计算组合贡献值,然后根据组合贡献值的大小确定故障负责变量集合;
S32、基于有向图推理的故障溯源:针对所有故障负责变量,通过系统知识确定它们之间的因果关系,构造故障有向图,然后通过有向图推理法确定故障传播路径和根源。
进一步地,所述S31中基于分布式典型变量分析模型的故障贡献分析的计算具体步骤为:
S311、对于状态空间贡献,第b个子系统的状态空间监测统计量
Figure BDA0003080893460000061
分析为:
Figure BDA0003080893460000062
其中:
Figure BDA0003080893460000063
表示pb(t,g)在状态空间的贡献值,
Figure BDA0003080893460000064
表示矩阵
Figure BDA0003080893460000065
的第g行, pb(t,g)时过去信息向量pb(t)的第g个元素,通过下式确定:
Figure BDA0003080893460000066
其中:j=1,2,...,l是时间滞后,yb(t-j,i)是输出向量yb(t-j)的第i个变量, ub(t-j,i)是输入向量ub(t-j)的第i个变量;
S312、对于所有nF个故障样本,计算在所有B个子系统内的l个滞后观测样本中,假设输出变量my在第b个子系统所有输出变量中的序号是
Figure BDA0003080893460000067
输入变量mu在第b个子系统所有输入变量中的序号是
Figure BDA0003080893460000068
则输出变量my和输入变量mu在状态空间的贡献分别为:
Figure BDA0003080893460000069
Figure BDA00030808934600000610
S313、对于残差空间贡献,第b个子系统的状态空间监测统计量
Figure BDA0003080893460000071
可以分析为:
Figure BDA0003080893460000072
其中:
Figure BDA0003080893460000073
表示pb(t,g)在残差空间的贡献值,
Figure BDA0003080893460000074
表示矩阵
Figure BDA0003080893460000075
的第g行;
S314、对于所有nF个故障样本,计算在所有B个子系统内的l个滞后观测样本中,假设输出变量my在第b个子系统所有输出变量中的序号是
Figure BDA0003080893460000076
输入变量mu在第b个子系统所有输入变量中的序号是
Figure BDA0003080893460000077
那么输出变量my和输入变量 mu在残差空间的贡献分别为:
Figure BDA0003080893460000078
Figure BDA0003080893460000079
S315、由变量的状态空间贡献和残差空间贡献,分别计算输出变量和输入变量的组合贡献:
Figure BDA00030808934600000710
Figure BDA00030808934600000711
S316、设定故障变量选择阈值CT,在所有变量的组合贡献中选择累计贡献百分比大于CT的最少数目变量来确定最终的故障负责变量集合,其中累计贡献百分比为选择变量的贡献和与全部组合贡献的比值。
进一步地,所述S32中基于有向图推理的故障溯源的具体步骤为:
S321、针对所有故障负责变量,根据系统知识确定变量间的因果关系;
S322、根据所得因果关系构建故障有向图,有向图中变量间的连接关系代表了故障的传播路径;
S323、确定故障有向图中没有其他节点指向的变量为故障根源。
知识与数据驱动的大规模工业系统分布式状态监测方法与现有技术相比,本发明的有益效果是:
(1)本发明实现了系统知识与数据的融合,实现了从知识到数据,再由数据到知识的逻辑闭环,为大规模工业系统的知识利用与数据挖掘提供了一种可行的思路;
(2)本发明通过系统知识挖掘变量之间的联系,并通过基于模块度的社区分团法实现对有向图的分解,实现了对复杂大规模系统的化简,为分布式监控提供了基础;
(3)本发明通过系统拓扑知识获取子系统之间的通信信息,基于CVA模型捕获系统的动态信息,并利用贝叶斯推理对所有子系统的监测结果进行融合,有效地实现了对大规模动态系统的系统监测,大大提高了故障检测模型的性能,保证了系统安全可靠的运行;
(4)本发明采用一种两步的故障诊断方法,利用分布式贡献图法确定故障负责变量集合,并基于因果关系,利用有向图推理实现对故障原因的溯源和传播路径的分析,提高了对故障原因定位的准确度,可以为现场操作人员提供故障修复的建议与参考。
附图说明
图1是本发明所应用的化工生产系统工艺流程图;
图2是本发明所述的大规模工业系统分布式监控与故障诊断算法的流程图;
图3是本发明建立的系统有向图;
图4是本发明所述的故障检测结果图;其中(a)故障5;(b)故障16;(c) 故障19;
图5是本发明所述的各子系统内的检测结果图;
图6是本发明所述的变量贡献结果图;
图7是本发明所述的故障传播路径与溯源结果图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步阐述和说明。
本发明以田纳西-伊斯曼化工过程(TE过程)为例,该过程包括五个运行单元:反应器、冷凝器、压缩机、分离器和汽提塔,其工艺流程图如图1所示。此外,该过程包括33个过程变量,这些变量涉及压力、温度、流量等,本次实例包括21种各类型的故障作为本次诊断过程说明的故障类型。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
本发明的算法由离线建模,在线检测和故障根源诊断三部分组成,其流程图如图2所示。在离线建模阶段,首先通过系统知识建立系统有向图,并将其分解为多个子系统,随后基于历史知识在个子系统内建立典型变量分析(CVA);在在线检测阶段,根据实时数据计算监测统计量,并将各子系统的监测结果融合成全局监测结果用于故障检测;在故障根源诊断阶段,通过分布式贡献图分析法确定故障负责变量,然后基于有向图推理确定故障根源和传播路径,具体实施方式如下:
首先根据系统知识建立大规模系统的有向图模型,并将有向图分解成多个子系统;然后在每个子系统中分别建立典型变量分析(CVA)模型,所有子系统的检测结果通过贝叶斯推理进行融合,形成全局故障检测结果;最后通过分布式贡献图方法确定故障负责变量,并根据有向图推理法定位故障根源。
(1)以节点表示过程变量,节点间的有向边表示变量之间的因果关系,根据过程知识建立过程的有向图模型,结果如图3所示。
(2)通过复杂网络中的快速展开算法将上述有向图模型分解成多个子系统,具体步骤为:
(2.1)将有向图模型中的每个节点当作一个子系统,得到与节点数相同的子系统数;
(2.2)计算将节点i划分到相邻节点所在子系统的模块度增益,最大增益表示最好的划分结果;只有当增益为正时,才进行划分,否则节点将保持在原先的子系统中;
(2.3)对有向图模型中的所有节点重复(2.2),直到模块度的值不再增加;
(2.4)将经过步骤(2.3)得到的子系统当作一个新的节点,构造一个新的有向图模型;
(2.5)不断重复(2.1)~(2.4),直到有向图结构不再变化以及模块度的值达到最大,大规模系统中的所有变量被划分到了不同的子系统中,最终获得有向图的分解结果。
前述模块度的计算公式为:
Figure BDA0003080893460000101
其中:Ai,j表示节点i和节点j之间边的权重,ki=∑jAi,j表示与节点i相连的边的权重的总和,kj表示与节点j相连的边的权重的总和,
Figure BDA0003080893460000102
表示有向图中所有边的权重和,ci和cj分别表示节点i和节点j所在的子系统;δ(ci,cj)是一个二值函数,当ci和cj在同一个子系统时等于1,否则等于0。
对于图3所示的过程有向图,通过基于模块度的社区分团算法分解后,该过程被分为9个子系统,具体分块结果如表1第二列所示。
表1 TE过程的分解结果
Figure BDA0003080893460000103
(3)在每个子系统中建立CVA模型来获取系统的动态性,进而实现故障检测,该步分为离线建模和在线检测两个阶段,其中在离线建模阶段,根据采集到的历史数据训练得到CVA模型的投影矩阵以及控制限,在在线检测阶段,根据实时采集到的数据构造T2统计量并根据判断逻辑进行判断,具体步骤为:
(3.1)假设第b个子系统t时刻的输入数据为
Figure BDA0003080893460000104
t时刻的输出数据为
Figure BDA0003080893460000105
mu,b和my,b分别表示输入变量的数目和输出变量的数目;根据输入输出数据时间序列分别构造过去信息向量pb(t)和未来信息向量fb(t):
pb(t)=[yb(t-1)T,yb(t-2)T,…,yb(t-l)T,ub(t-1)T,ub(t-2)T,…,ub(t-l)T]T
fb(t)=[yb(t)T,yb(t+1)T,…,yb(t+h)T]T
式中:l表示过去信息向量中的时间滞后;h表示未来信息向量中的时间滞后;上标T表示转置;
(3.2)计算过去信息向量和未来信息向量的协方差矩阵分别为Σpp,b=E(pb(t)pb(t)T)、Σff,b=E(fb(t)fb(t)T)和Σpf,b=E(pb(t)fb(t)T),典型变量分析通过最大化典型变量cb(t)=Jbpb(t)和db(t)=Lbfb(t)之间的相关性,从而获得代表过去信息向量pb(t)和未来信息向量fb(t)线性组合的投影矩阵Jb和Lb
(3.3)为了求得投影矩阵Jb和Lb,可以通过奇异值分解来获得具有最大相关性的典型变量:
Figure BDA0003080893460000111
式中:Ub和Vb均为酉矩阵;
可得投影矩阵
Figure BDA0003080893460000112
(3.4)假设第b个子系统状态空间模型的阶次为sb,那么可以得到状态子空间向量
Figure BDA0003080893460000113
和残差子空间向量
Figure BDA0003080893460000114
Figure BDA0003080893460000115
Figure BDA0003080893460000116
其中:
Figure BDA0003080893460000117
Figure BDA0003080893460000118
分别为t时刻的状态子空间向量
Figure BDA0003080893460000119
和残差子空间向量
Figure BDA00030808934600001110
矩阵
Figure BDA00030808934600001111
是矩阵Jb的前sb行,矩阵
Figure BDA00030808934600001112
是矩阵Jb除前sb行之外的剩余行,矩阵
Figure BDA00030808934600001113
是矩阵Ub的前sb列,矩阵
Figure BDA00030808934600001114
是矩阵Ub除前sb列之外的剩余列;
(3.5)根据Hotelling T2检验,在状态子空间和残差子空间内分别构造T2统计量
Figure BDA00030808934600001115
Figure BDA00030808934600001116
为:
Figure BDA00030808934600001117
Figure BDA00030808934600001118
式中:
Figure BDA00030808934600001119
Figure BDA00030808934600001120
分别为t时刻的T2统计量
Figure BDA00030808934600001121
Figure BDA00030808934600001122
(3.6)在给定置信水平α下,状态空间和残差空间控制限满足如下F分布:
Figure BDA0003080893460000121
Figure BDA0003080893460000122
式中:n为典型变量分析模型的训练数据集样本数,Fα(sb,n-sb)和 Fα(eb,n-eb)分别是状态空间和残差空间所满足的F分布。
进一步地,在对子系统进行监测时,根据拓扑连接知识获取子系统间的通信信息,将子系统内变量的本地信息与子系统间的通信信息同时纳入典型变量分析模型中,各子系统的监测变量如表1第三列所示。
(4)所有子系统的检测结果通过贝叶斯推理法融合形成全局监测结果
Figure BDA0003080893460000123
Figure BDA0003080893460000124
其具体计算公式为:
Figure BDA0003080893460000125
Figure BDA0003080893460000126
其中:
Figure BDA0003080893460000127
Figure BDA0003080893460000128
分别表示第b个子系统内状态空间和残差空间发生故障的概率,
Figure BDA0003080893460000129
Figure BDA00030808934600001210
分别表示第b个子系统内状态空间和残差空间的故障条件概率,
Figure BDA00030808934600001211
表示第b个子系统内状态空间发生故障的先验概率,
Figure BDA00030808934600001212
表示第b个子系统内状态空间的似然函数,
Figure BDA00030808934600001213
表示第b个子系统内残差空间发生故障的先验概率,
Figure BDA00030808934600001214
表示第b个子系统内残差空间的似然函数,
Figure BDA00030808934600001215
表示第b个子系统内所有样本的状态子空间T2统计量,
Figure BDA00030808934600001216
表示第b个子系统内所有样本的残差子空间T2统计量,B表示子系统的总数。
(5)对于全局监测结果
Figure BDA00030808934600001217
Figure BDA00030808934600001218
进行故障检测,进而得到全局故障监测结果,故障检测的判断逻辑为:
Figure BDA0003080893460000131
分布式主成分分析法(DPCA)和多系统主成分分析法(MPCA)是两种典型的大规模系统的分布式故障检测算法,将本发明所提方法(DG-DCVA)与这两种已有的方法进行对比,具体结果如表2所示。从表2中可以看出,基于本发明方法的故障检测性能减小了故障检测的漏报率和误报警率,提高了实际在线故障检测的准确性和可靠性。具体地,以TE过程的故障5、16和19为例,其故障检测结果如图4所示,可以看出,本发明所提方法能够很好的检测出故障。此外,故障5在各个子系统内的检测结果如图5所示,故障5的主要负责变量被划分在子系统7中,因此在子系统7内能够检测出故障,而在其他子系统内则无法检测出故障,这也说明了若采用集中式检测方法,那么故障有效信息很有可能会因其他无关变量的信息的加入而减小,从而导致检测性能下降,本发明所提分布式检测方法可以很好地提取出故障相关变量,保证检测性能。
(6)进一步地,故障溯源部分包括两个步骤:一是基于分布式典型变量分析模型的故障贡献分析:针对所有发生故障的样本,计算所有发生故障的子系统内变量的状态空间贡献、残差空间贡献,并由此计算组合贡献值,然后根据组合贡献值的大小确定故障负责变量集合;二是基于有向图推理的故障溯源:针对所有故障负责变量,通过系统知识确定它们之间的因果关系,构造故障有向图,然后通过有向图推理法确定故障传播路径和根源。
(7)上述基于分布式典型变量分析模型的故障贡献分析的计算具体步骤为:
(7.1)对于状态空间贡献,第b个子系统的状态空间监测统计量
Figure BDA0003080893460000132
可以分析为:
Figure BDA0003080893460000133
其中:
Figure BDA0003080893460000141
表示pb(t,g)在状态空间的贡献值,
Figure BDA0003080893460000142
表示矩阵
Figure BDA0003080893460000143
的第g行, pb(t,g)时过去信息向量pb(t)的第g个元素,可以通过下式确定:
Figure BDA0003080893460000144
其中:j=1,2,...,l是时间滞后,yb(t-j,i)是输出向量yb(t-j)的第i个变量, ub(t-j,i)是输入向量ub(t-j)的第i个变量。
(7.2)对于所有nF个故障样本,计算在所有B个子系统内的l个滞后观测样本中,假设输出变量my在第b个子系统所有输出变量中的序号是
Figure BDA0003080893460000145
输入变量mu在第b个子系统所有输入变量中的序号是
Figure BDA0003080893460000146
那么输出变量my和输入变量 mu在状态空间的贡献分别为:
Figure BDA0003080893460000147
Figure BDA0003080893460000148
(7.3)对于残差空间贡献,第b个子系统的状态空间监测统计量
Figure BDA0003080893460000149
可以分析为:
Figure BDA00030808934600001410
其中:
Figure BDA00030808934600001411
表示pb(t,g)在残差空间的贡献值,
Figure BDA00030808934600001412
表示矩阵
Figure BDA00030808934600001413
的第g行。
(7.4)对于所有nF个故障样本,计算在所有B个子系统内的l个滞后观测样本中,假设输出变量my在第b个子系统所有输出变量中的序号是
Figure BDA00030808934600001414
输入变量mu在第b个子系统所有输入变量中的序号是
Figure BDA00030808934600001415
那么输出变量my和输入变量 mu在残差空间的贡献分别为:
Figure BDA0003080893460000151
Figure BDA0003080893460000152
(7.5)由变量的状态空间贡献和残差空间贡献,分别计算输出变量和输入变量的组合贡献:
Figure BDA0003080893460000153
Figure BDA0003080893460000154
(7.6)设定故障变量选择阈值CT,在所有变量的组合贡献中选择累计贡献百分比大于CT的最少数目变量来确定最终的故障负责变量集合,其中累计贡献百分比为选择变量的贡献和与全部组合贡献的比值。
(8)上述基于有向图推理的故障溯源的具体步骤为:
(8.1)针对所有故障负责变量,根据系统知识确定变量间的因果关系;
(8.2)根据所得因果关系构建故障有向图,有向图中变量间的连接关系代表了故障的传播路径;
(8.3)确定故障有向图中没有其他节点指向的变量为故障根源。
表2三种方法的故障检测性能对比(衡量指标:故障漏报率)
Figure BDA0003080893460000161
以故障4为例说明故障诊断与溯源方法的结果,图6展示了基于CVA模型的分布式贡献图的计算结果,在预设阈值设为0.95的情况下,故障负责变量集合包含{x32,x15,x29,x17,x9,x11,x6,x8}。针对所有故障负责变量,建立故障有向图,并通过有向图推理确定故障传播路径以及故障根源,具体结果如图7所示,根据有向图推理结果可知变量6与变量32是故障根源,这与故障发生机理原因是相吻合的,也证明了本发明所提故障溯源方法的有效性与可行性。

Claims (7)

1.一种知识与数据驱动的大规模工业系统分布式状态监测方法,其特征在于,步骤如下:
S1、针对待监测的工业系统,根据系统知识建立大规模系统的有向图模型,并将有向图分解成多个子系统;
S2、在每个子系统中分别建立典型变量分析模型,所有子系统的检测结果通过贝叶斯推理进行融合,形成全局故障检测结果;
S3、通过分布式贡献图方法确定故障负责变量,并根据有向图推理法定位故障根源;
所述S1中,有向图模型通过复杂网络中的基于模块度的快速展开算法分解成多个子系统,具体步骤为:
S11、将有向图模型中的每个节点当作一个子系统,得到与节点数相同的子系统数;
S12、计算将节点i划分到相邻节点所在子系统的模块度增益,最大增益表示最好的划分结果;只有当增益为正时,才进行划分,否则节点将保持在原先的子系统中;
S13、对有向图模型中的所有节点重复S12,直到模块度的值不再增加;
S14、将经过步骤S13得到的子系统当作一个新的节点,构造一个新的有向图模型;
S15、不断重复S11~S14,直到有向图结构不再变化以及模块度的值达到最大,大规模系统中的所有变量被划分到了不同的子系统中,最终获得有向图的分解结果;
所述S2中,在每个子系统中建立典型变量分析模型来获取系统的动态性,进而实现故障检测,具体步骤为:
S21、假设第b个子系统t时刻的输入数据为
Figure FDA0003506815340000011
t时刻的输出数据为
Figure FDA0003506815340000012
mu,b和my,b分别表示输入变量的数目和输出变量的数目;根据输入输出数据时间序列分别构造过去信息向量pb(t)和未来信息向量fb(t):
pb(t)=[yb(t-1)T,yb(t-2)T,…,yb(t-l)T,ub(t-1)T,ub(t-2)T,…,ub(t-l)T]T
fb(t)=[yb(t)T,yb(t+1)T,…,yb(t+h)T]T
式中:l表示过去信息向量中的时间滞后;h表示未来信息向量中的时间滞后;上标T表示转置;
S22、计算过去信息向量和未来信息向量的协方差矩阵分别为Σpp,b=E(pb(t)pb(t)T)、Σff,b=E(fb(t)fb(t)T)和Σpf,b=E(pb(t)fb(t)T),典型变量分析模型通过最大化典型变量cb(t)=Jbpb(t)和db(t)=Lbfb(t)之间的相关性,从而获得代表过去信息向量pb(t)和未来信息向量fb(t)线性组合的投影矩阵Jb和Lb
S23、通过奇异值分解来获得具有最大相关性的典型变量:
Figure FDA0003506815340000021
式中:Ub和Vb均为酉矩阵;
进而求得投影矩阵
Figure FDA0003506815340000022
Figure FDA0003506815340000023
S24、假设第b个子系统状态空间模型的阶次为sb,得到状态子空间向量
Figure FDA0003506815340000024
和残差子空间向量
Figure FDA0003506815340000025
Figure FDA0003506815340000026
Figure FDA0003506815340000027
其中:
Figure FDA0003506815340000028
Figure FDA0003506815340000029
分别为t时刻的状态子空间向量
Figure FDA00035068153400000210
和残差子空间向量
Figure FDA00035068153400000211
矩阵
Figure FDA00035068153400000212
是矩阵Jb的前sb行,矩阵
Figure FDA00035068153400000213
是矩阵Jb除前sb行之外的剩余行,矩阵
Figure FDA00035068153400000214
是矩阵Ub的前sb列,矩阵
Figure FDA00035068153400000215
是矩阵Ub除前sb列之外的剩余列;
S25、根据Hotelling T2检验,在状态子空间和残差子空间内分别构造T2统计量为
Figure FDA00035068153400000216
Figure FDA00035068153400000217
Figure FDA00035068153400000218
Figure FDA00035068153400000219
式中:
Figure FDA00035068153400000220
Figure FDA00035068153400000221
分别为t时刻的T2统计量
Figure FDA00035068153400000222
Figure FDA00035068153400000223
S26、在给定置信水平α下,状态空间控制限
Figure FDA00035068153400000224
和残差空间控制限
Figure FDA00035068153400000225
满足如下F分布:
Figure FDA0003506815340000031
Figure FDA0003506815340000032
式中:n为典型变量分析模型的训练数据集样本数,Fα(sb,n-sb)和Fα(eb,n-eb)分别是状态空间和残差空间所满足的F分布;
所述S3中,通过分布式贡献图方法确定故障负责变量,并根据有向图推理法定位故障根源包括两个步骤:
S31、基于分布式典型变量分析模型的故障贡献分析:针对所有发生故障的样本,计算所有发生故障的子系统内变量的状态空间贡献、残差空间贡献,并由此计算组合贡献值,然后根据组合贡献值的大小确定故障负责变量集合;
S32、基于有向图推理的故障溯源:针对所有故障负责变量,通过系统知识确定它们之间的因果关系,构造故障有向图,然后通过有向图推理法确定故障传播路径和根源。
2.根据权利要求1所述的一种知识与数据驱动的大规模工业系统分布式状态监测方法,其特征在于:所述S1中,有向图模型的节点表示系统变量,节点间的有向边表示变量之间的因果关系,并且该模型是根据系统知识建立的。
3.根据权利要求1所述的一种知识与数据驱动的大规模工业系统分布式状态监测方法,其特征在于:所述模块度Q的计算公式为:
Figure FDA0003506815340000033
其中:Ai,j表示节点i和节点j之间边的权重,ki=∑jAi,j表示与节点i相连的边的权重的总和,kj表示与节点j相连的边的权重的总和,
Figure FDA0003506815340000034
表示有向图中所有边的权重和,ci和cj分别表示节点i和节点j所在的子系统;δ(ci,cj)是一个二值函数,当ci和cj在同一个子系统时等于1,否则等于0。
4.根据权利要求1所述的一种知识与数据驱动的大规模工业系统分布式状态监测方法,其特征在于:在对子系统进行监测时,根据拓扑连接知识获取子系统间的通信信息,将子系统内变量的本地信息与子系统间的通信信息同时纳入典型变量分析模型中。
5.根据权利要求1所述的一种知识与数据驱动的大规模工业系统分布式状态监测方法,其特征在于:所述S2中,所有子系统的检测结果通过贝叶斯推理法融合形成全局监测结果
Figure FDA0003506815340000041
Figure FDA0003506815340000042
其具体计算公式为:
Figure FDA0003506815340000043
Figure FDA0003506815340000044
其中:
Figure FDA0003506815340000045
Figure FDA0003506815340000046
分别表示第b个子系统内状态空间和残差空间发生故障的概率,
Figure FDA0003506815340000047
Figure FDA0003506815340000048
分别表示第b个子系统内状态空间和残差空间的故障条件概率,
Figure FDA0003506815340000049
表示第b个子系统内状态空间发生故障的先验概率,
Figure FDA00035068153400000410
表示第b个子系统内状态空间的似然函数,
Figure FDA00035068153400000411
表示第b个子系统内残差空间发生故障的先验概率,
Figure FDA00035068153400000412
表示第b个子系统内残差空间的似然函数,
Figure FDA00035068153400000413
表示第b个子系统内所有样本的状态子空间T2统计量,
Figure FDA00035068153400000414
表示第b个子系统内所有样本的残差子空间T2统计量,B表示子系统的总数。
6.根据权利要求5所述的一种知识与数据驱动的大规模工业系统分布式状态监测方法,其特征在于:对于全局监测结果
Figure FDA00035068153400000415
Figure FDA00035068153400000416
进行故障检测,进而得到全局故障监测结果,故障检测的判断逻辑为:
Figure FDA00035068153400000417
7.根据权利要求1所述的一种知识与数据驱动的大规模工业系统分布式状态监测方法,其特征在于:
所述S31中基于分布式典型变量分析模型的故障贡献分析的计算具体步骤为:
S311、对于状态空间贡献,第b个子系统的状态空间监测统计量
Figure FDA0003506815340000051
分析为:
Figure FDA0003506815340000052
其中:
Figure FDA0003506815340000053
表示pb(t,g)在状态空间的贡献值,
Figure FDA0003506815340000054
表示矩阵
Figure FDA0003506815340000055
的第g行,pb(t,g)时过去信息向量pb(t)的第g个元素,通过下式确定:
Figure FDA0003506815340000056
其中:j=1,2,...,l是时间滞后,yb(t-j,i)是输出向量yb(t-j)的第i个变量,ub(t-j,i)是输入向量ub(t-j)的第i个变量;
S312、对于所有nF个故障样本,计算在所有B个子系统内的l个滞后观测样本中,假设输出变量my在第b个子系统所有输出变量中的序号是
Figure FDA0003506815340000057
输入变量mu在第b个子系统所有输入变量中的序号是
Figure FDA0003506815340000058
则输出变量my和输入变量mu在状态空间的贡献分别为:
Figure FDA0003506815340000059
Figure FDA00035068153400000510
S313、对于残差空间贡献,第b个子系统的状态空间监测统计量
Figure FDA00035068153400000511
可以分析为:
Figure FDA0003506815340000061
其中:
Figure FDA0003506815340000062
表示pb(t,g)在残差空间的贡献值,
Figure FDA0003506815340000063
表示矩阵
Figure FDA0003506815340000064
的第g行;
S314、对于所有nF个故障样本,计算在所有B个子系统内的l个滞后观测样本中,假设输出变量my在第b个子系统所有输出变量中的序号是
Figure FDA0003506815340000065
输入变量mu在第b个子系统所有输入变量中的序号是
Figure FDA0003506815340000066
那么输出变量my和输入变量mu在残差空间的贡献分别为:
Figure FDA0003506815340000067
Figure FDA0003506815340000068
S315、由变量的状态空间贡献和残差空间贡献,分别计算输出变量和输入变量的组合贡献:
Figure FDA0003506815340000069
Figure FDA00035068153400000610
S316、设定故障变量选择阈值CT,在所有变量的组合贡献中选择累计贡献百分比大于CT的最少数目变量来确定最终的故障负责变量集合,其中累计贡献百分比为选择变量的贡献和与全部组合贡献的比值;
所述知识与数据驱动的大规模工业系统分布式状态监测方法S32中基于有向图推理的故障溯源的具体步骤为:
S321、针对所有故障负责变量,根据系统知识确定变量间的因果关系;
S322、根据所得因果关系构建故障有向图,有向图中变量间的连接关系代表了故障的传播路径;
S323、确定故障有向图中没有其他节点指向的变量为故障根源。
CN202110565642.6A 2021-05-24 2021-05-24 知识与数据驱动的大规模工业系统分布式状态监测方法 Active CN113110402B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110565642.6A CN113110402B (zh) 2021-05-24 2021-05-24 知识与数据驱动的大规模工业系统分布式状态监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110565642.6A CN113110402B (zh) 2021-05-24 2021-05-24 知识与数据驱动的大规模工业系统分布式状态监测方法

Publications (2)

Publication Number Publication Date
CN113110402A CN113110402A (zh) 2021-07-13
CN113110402B true CN113110402B (zh) 2022-04-01

Family

ID=76723021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110565642.6A Active CN113110402B (zh) 2021-05-24 2021-05-24 知识与数据驱动的大规模工业系统分布式状态监测方法

Country Status (1)

Country Link
CN (1) CN113110402B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114237202B (zh) * 2021-12-08 2024-04-05 浙江大学 基于fia-cva与迭代增强框架的过程监测方法
CN115933604B (zh) * 2022-12-20 2023-11-07 广东石油化工学院 基于数据驱动的故障检测与预测控制方法
CN115780530B (zh) * 2023-01-19 2023-05-09 北京科技大学 基于专家知识与数据联合驱动的轧钢故障溯源方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109491816A (zh) * 2018-10-19 2019-03-19 中国船舶重工集团公司第七六研究所 基于知识的故障诊断方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITCO20120008A1 (it) * 2012-03-01 2013-09-02 Nuovo Pignone Srl Metodo e sistema per monitorare la condizione di un gruppo di impianti
CN103713628B (zh) * 2013-12-31 2017-01-18 上海交通大学 基于符号有向图和数据重构的故障诊断方法
CN104102773B (zh) * 2014-07-05 2017-06-06 山东鲁能软件技术有限公司 一种设备故障预警及状态监测方法
CN106406229B (zh) * 2016-12-20 2018-04-03 吉林大学 一种数控机床故障诊断方法
CN107423414B (zh) * 2017-07-28 2020-04-28 西安交通大学 一种基于信息传递模型的流程工业复杂机电系统故障溯源方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109491816A (zh) * 2018-10-19 2019-03-19 中国船舶重工集团公司第七六研究所 基于知识的故障诊断方法

Also Published As

Publication number Publication date
CN113110402A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
CN113110402B (zh) 知识与数据驱动的大规模工业系统分布式状态监测方法
Chen et al. A distributed canonical correlation analysis-based fault detection method for plant-wide process monitoring
Capozzoli et al. Fault detection analysis using data mining techniques for a cluster of smart office buildings
CN111222549B (zh) 一种基于深度神经网络的无人机故障预测方法
Chau et al. A hybrid model coupled with singular spectrum analysis for daily rainfall prediction
CN103901880A (zh) 基于多分类器和d-s证据融合的工业过程故障检测方法
CN112598144B (zh) 基于相关性分析的cnn-lstm突发故障预警方法
CN108960309B (zh) 一种基于rbf神经网络自相关性剔除的动态过程监测方法
CN116205265A (zh) 一种基于深层神经网络的电网故障诊断方法及装置
Wang et al. Decentralized plant-wide monitoring based on mutual information-Louvain decomposition and support vector data description diagnosis
CN110009126B (zh) 基于pls模型与pca贡献度融合的在线报警分析方法
CN114553671A (zh) 一种电力通信网故障告警的诊断方法
Ruan et al. Deep learning-based fault prediction in wireless sensor network embedded cyber-physical systems for industrial processes
Jiang et al. RBF-based real-time hierarchical intrusion detection systems
CN111275136B (zh) 基于小样本下的故障预测系统及其预警方法
CN115237091A (zh) 一种机电装备故障溯源方法及系统
Zhang et al. Fault diagnosis of energy networks: A graph embedding learning approach
CN109547248A (zh) 基于人工智能的在轨飞行器自组网故障诊断方法及装置
Mbuli et al. Root causes analysis and fault prediction in intelligent transportation systems: coupling unsupervised and supervised learning techniques
De La Fuente et al. Dynamic decentralized monitoring for large-scale industrial processes using multiblock canonical variate analysis based regression
Yin et al. Process decomposition and distributed fault detection of large-scale industrial processes
Lin et al. A semi-supervised approach for abnormal event prediction on large operational network time-series data
Wang et al. Detection of sequential alarm patterns in complex industrial facilities using clasp and top-k algorithms
CN113268927B (zh) 基于全连接神经网络的大功率激光装置输出能量预测方法
Yin et al. Distributed incipient fault detection with causality-based multi-perspective subblock partitioning for large-scale nonlinear processes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant