CN112184037A - 一种基于加权svdd的多模态过程故障检测方法 - Google Patents

一种基于加权svdd的多模态过程故障检测方法 Download PDF

Info

Publication number
CN112184037A
CN112184037A CN202011065955.7A CN202011065955A CN112184037A CN 112184037 A CN112184037 A CN 112184037A CN 202011065955 A CN202011065955 A CN 202011065955A CN 112184037 A CN112184037 A CN 112184037A
Authority
CN
China
Prior art keywords
sample
fault detection
svdd
weighted
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011065955.7A
Other languages
English (en)
Other versions
CN112184037B (zh
Inventor
王兆静
郑英
张洪
王彦伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN202011065955.7A priority Critical patent/CN112184037B/zh
Publication of CN112184037A publication Critical patent/CN112184037A/zh
Application granted granted Critical
Publication of CN112184037B publication Critical patent/CN112184037B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Abstract

本发明公开了一种基于加权SVDD的多模态过程故障检测方法,属于工业制造过程的多模态监控技术领域,包括:获取不同模态的正常数据,组成初始数据集X,并利用长度为w的滑动窗口在X上滑动,得到窗口数据序列;计算各窗口数据的统计量作为样本,分别计算各样本的局部可达密度比,作为对应的权重因子,利用加权SVDD算法建立超球体模型,优化计算得到拉格朗日因子αi,超球体的中心a和半径R;局部可达密度比为局部可达密度归一化之后的值;计算待检测的检测窗口数据Xon的统计量,作为待检测样本;根据αi计算待检测样本到a的距离DIST;若DIST>R,则判定系统发生故障;若DIST≤R,则判定系统正常。本发明能够提高多模态过程故障检测过程的准确度和灵敏度。

Description

一种基于加权SVDD的多模态过程故障检测方法
技术领域
本发明属于工业制造过程的多模态监控技术领域,更具体地,涉及一种基于加权SVDD的多模态过程故障检测方法。
背景技术
由于外界环境等条件的变化、生产方案的变动或是过程的固有特性等因素,导致生产过程具有多个稳定工况。多模态的数据分布的多峰性使得传统的多元统计过程监测方法无法直接应用到多模态的过程监控中来。
目前大部分监测算法直接面向多模态的原始数据,但模态间的有些特征很难在原始数据中反映出来。如果两个模态在变化方向上有很大差异,但在空间位置上却有大量重叠部分,在很多现有算法中,会认为重叠部分是同一模态数据,最终导致监控效果不理想。而统计量模式分析则可以通过计算低阶和高阶统计量,挖掘出不同模态的潜在特征。
已有的多模态过程监控方法主要可以分为单模型和多模型两类。相对于多模型的方法,单模型建模更简单,但在监控效果上存在劣势。所以,如何提高单模型的监控性能依然是要研究的问题。
此外,多模态过程数据往往带有非线性和非高斯的特性,这无疑增加了监控的难度。已有的研究中,有学者将可以处理非线性和非高斯的问题的SVDD(Support VectorData Description,支持向量数据描述)单模型应用到了复杂的多模态过程监控中。但是,当训练数据中存在多个模态的数据或是离群点时,SVDD会出现过拟合的现象,故障检测的效果会大打折扣。为了解决此问题,加权SVDD的方法被提出。其中,加权因子对监控效果的影响很大,目前存在的方法还有改进的空间。
综上所述,现有的多模态监控方法缺乏对多模态数据潜在特征的利用,很少考虑多模态数据的非线性和非高斯特征;而加权SVDD中加权因子的设计有待改进。
发明内容
针对现有技术的缺陷和改进需求,本发明提供了一种基于加权SVDD的多模态过程故障检测方法,其目的在于,通过对加权SVDD中样本的加权因子进行改进,使得加权SVDD在解决数据非线性和非高斯型问题的同时,提高多模态过程故障检测过程的准确度和灵敏度。
为实现上述目的,按照本发明的一个方面,提供了一种基于加权SVDD的多模态过程故障检测方法,包括:离线建模阶段和故障检测阶段;
离线建模阶段包括:
获取不同模态的正常数据,组成初始数据集X,并利用长度为w的滑动窗口在初始数据集X上滑动,得到窗口数据序列;
计算窗口数据序列中各窗口数据的统计量,分别作为一个样本,并分别计算各样本的局部可达密度比,作为各样本对应的权重因子,以利用加权SVDD算法建立超球体模型;样本的局部可达密度比为该样本的局部可达密度归一化之后的值;
对超球体模型进行优化计算,得到拉格朗日因子αi,以及超球体的中心a和半径R;其中,1≤i≤N,N表示窗口数据序列的长度;
故障检测阶段包括:
将待检测数据预处理为长度为w的检测窗口数据Xon,并计算检测窗口数据Xon的统计量,作为待检测样本;
根据拉格朗日因子αi计算待检测样本到超球体的中心a的距离DIST;
若DIST>R,则判定系统发生故障;若DIST≤R,则判定系统正常。
本发明在利用加权SVDD建立超球体模型时,以样本的局部可达密度比作为对应的加权因子,由于该加权因子具体是样本的局部可达密度经归一化之后的结果,在反映样本分布的密度信息的同时,将该密度信息约束在了指定范围内,使得该加权因子能够更加准确、灵敏地识别多模态过程和离群点,从而避免过拟合,由此能够有效提高多模态过程故障检测过程的准确度和灵敏度。
进一步地,统计量包括一阶统计量、二阶统计量和至少一个高阶统计量。
本发明计算窗口数据的统计量作为加权SVDD的样本,该样本具体包括一阶统计量、二阶统计量和高阶统计量,由于高阶统计量对于某些特定的故障类型较为敏感,本发明能够提取多模态过程的潜在特征,有利于建模,从而进一步提高多模态过程故障检测的准确度和灵敏度
进一步地,统计量包括一阶统计量、二阶统计量、三阶统计量和四阶统计量。
本发明所计算的窗口数据的统计量,具体包括一阶统计量、二阶统计量、三阶统计量和四阶统计量,能够获得较好的检测效果。
进一步地,离线建模阶段中,对于任意第i个样本si,其局部可达密度比为:
Figure BDA0002713761190000031
其中,KNN(si)表示样本si的邻居集合,sj表示集合KNN(si)中的样本,LRD(si)和LRD(si)分别表示样本si和样本sj的局部可达密度。
本发明首先获得样本及其邻居所在集合中,各样本局部可达密度的最大值,并以该样本的局部可达密度与该最大值的比值作为对应样本的局部可达密度比,由此能够将样本的密度信息约束在(0,1]范围内,适合于作为加权SVDD中的加权因子,能够更加准确、灵敏地识别多模态过程和离群点,避免过拟合,从而提高多模态过程故障检测过程的准确度和灵敏度。
进一步地,样本si的邻居集合KNN(si)由样本si的K个邻居构成,且K个邻居包括K1个空间上的邻居和K2个时间上的邻居;
其中,K为预设的正整数,K1和K2均为整数,且K1≥0,K2≥0。
本发明在计算样本的加权因子,即局部可达密度比时,会同时考虑样本在时间上的邻居信息和空间上的邻居信息,与空间上的邻居类似,时间上越近的邻居也越有可能属于一个类别,即正常类别或故障类别,但时间上和空间上的邻居不是完全重叠的,所以本发明同时考虑两者来计算样本点的局部可达密度,可以更加全面地体现其局部特性,最终使得模型的超球面更合理,从而能够提高多模态过程故障检测的准确度和灵敏度。
进一步地,离线建模阶段中,对超球体模型进行优化计算,包括:
(S1)通过引入拉格朗日因子α=[α12,…,αN]T,将目标函数转化成其对偶形式:
Figure BDA0002713761190000041
Figure BDA0002713761190000042
其中,si和sj均表示样本,αi和αj分别表示样本si和样本sj对应的拉格朗日因子,wi为样本si对应的加权因子,C表示惩罚因子;K(·)为核函数,且K(xi,xj)=<Φ(xi),Φ(xj)>,Φ(·)是用于将样本映射到高维特征空间的非线性映射函数,<·>表示高维空间中的非线性内积;
(S2)根据KKT(Karush-Kuhn-Tucher)条件,筛选出所有满足0≤αi≤wiC的样本,得到支持向量,利用筛选出的支持向量,计算超球体的半径R和中心a为分别:
Figure BDA0002713761190000051
Figure BDA0002713761190000052
进一步地,惩罚因子C的计算表达式为:
Figure BDA0002713761190000053
其中,β表示所允许的误报率。
进一步地,故障检测阶段中,根据拉格朗日因子αi计算待检测样本到超球体的中心a的距离DIST,其计算公式为:
Figure BDA0002713761190000054
其中,Son为待检测样本,si和sj均表示样本,αi和αj分别表示样本si和样本sj对应的拉格朗日因子,K(·)为核函数,且K(xi,xj)=<Φ(xi),Φ(xj)>,Φ(·)是用于将样本映射到高维特征空间的非线性映射函数,<·>表示高维空间中的非线性内积。
按照本发明的另一个方面,提供了一种计算机可读存储介质,包括存储的计算机程序,计算机程序被处理器执行时,控制计算机可读存储介质所在设备执行本发明提供的基于加权SVDD的多模态过程故障检测方法。
总体而言,通过本发明所构思的以上技术方案,能够取得以下有益效果:
(1)本发明在利用加权SVDD建立超球体模型时,以样本的局部可达密度比作为对应的加权因子,由于该加权因子具体是样本的局部可达密度经归一化之后的结果,在反映样本分布的密度信息的同时,将该密度信息约束在了指定范围内,使得该加权因子能够更加准确、灵敏地识别多模态过程和离群点,从而避免过拟合,由此能够有效提高多模态过程故障检测过程的准确度和灵敏度。
(2)本发明计算窗口数据的统计量作为加权SVDD的样本,该样本具体包括一阶统计量、二阶统计量和高阶统计量,由于高阶统计量对于某些特定的故障类型较为敏感,本发明能够提取多模态过程的潜在特征,有利于建模,从而进一步提高多模态过程故障检测的准确度和灵敏度。
(3)本发明在计算样本的加权因子,即局部可达密度比时,会同时考虑样本在时间上的邻居信息和空间上的邻居信息,所计算的样本点的局部可达密度可以更加全面地体现其局部特性,最终使得模型超球面更合理,从而能够提高多模态过程故障检测的准确度和灵敏度。
附图说明
图1为本发明实施例提供的基于加权SVDD的多模态过程故障检测方法流程图;
图2为本发明实施例提供的数值案例中各样本的密度值示意图;
图3为本发明实施例提供的数值案例中各样本的权重因子示意图;
图4为本发明实施例提供的数值案例中决策边界图;
图5为本发明实施例提供的TE过程示意图;
图6为本发明实施例提供的TE过程各样本的密度值示意图;
图7为本发明实施例提供的TE过程中各样本的权重因子示意图;
图8是本发明实施例提供的TE过程情况1监控效果示意图;
图9是本发明实施例提供的TE过程情况2监控效果示意图;
图10是本发明实施例提供的TE过程情况3监控效果示意图;
图11是本发明实施例提供的TE过程情况4监控效果示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
在本发明中,本发明及附图中的术语“第一”、“第二”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
为了解决现有的基于加权SVDD算法的多模态过程故障检测方法在故障检测方面存在的准确度和灵敏度不高的问题,本发明提供了一种基于加权SVDD多模态过程故障检测方法,其整体思路在于:涉及全新的加权因子,使得该加权因子在反映样本分布的密度信息的同时,能够有效防止过拟合,从而在利用加权SVDD解决数据非线性和非高斯性问题的同时,更准确更灵敏地检测到多模态过程故障。以下为实施例。
实施例1:
一种基于加权SVDD的多模态过程故障检测方法,如图1所示,包括:离线建模阶段和故障检测阶段;
离线建模阶段包括:
获取不同模态的正常数据,组成初始数据集X,并利用长度为w的滑动窗口在初始数据集X上滑动,得到窗口数据序列;
计算窗口数据序列中各窗口数据的统计量,分别作为一个样本,并分别计算各样本的局部可达密度比,作为各样本对应的权重因子,以利用加权SVDD算法建立超球体模型;样本的局部可达密度比为该样本的局部可达密度归一化之后的值;
对超球体模型进行优化计算,得到拉格朗日因子αi,以及超球体的中心a和半径R;其中,1≤i≤N,N表示窗口数据序列的长度;
故障检测阶段包括:
将待检测数据预处理为长度为w的检测窗口数据Xon,并计算检测窗口数据Xon的统计量,作为待检测样本;待检测数据可为在线数据;
根据拉格朗日因子αi计算待检测样本到超球体的中心a的距离DIST;
若DIST>R,则判定系统发生故障;若DIST≤R,则判定系统正常;
本实施例中,所获取的初始数据集X∈Rn×m,其中,m表示数据维度,n表示数据项数;
利用滑动窗口获取的窗口数据表示为:
Figure BDA0002713761190000081
其中,k表示窗口数据的序号,1≤k≤N;
作为一种优选的实施方式,在本实施例中,统计量包括一阶统计量、二阶统计量、三阶统计量和四阶统计量;
对于窗口数据Xk,其一阶统计量记为μ=[u1,u2,…,um],则
Figure BDA0002713761190000082
对于窗口数据Xk,其二阶统计量记为V=[v1,v2,…vm],包含方差ηt,相关系数rt,r,自相关系数
Figure BDA0002713761190000083
和互相关系数
Figure BDA0002713761190000084
它们分别为:
Figure BDA0002713761190000085
Figure BDA0002713761190000086
Figure BDA0002713761190000091
Figure BDA0002713761190000092
其中,d代表最大滞后时间;
对于窗口数据Xk,其三阶统计量记为H=[γ12,…γm],则
Figure BDA0002713761190000093
对于窗口数据Xk,其四阶统计量记为Λ=[κ12,…κm],则
Figure BDA0002713761190000094
将其中的三阶统计量和四阶统计量拼接为高阶统计量Ξ=[H|Λ],则最终,数据窗口Xk的统计量表示为Sk≡[μ|V|Ξ];每个窗口数据的统计量作为一个样本,最终可由所有的样本构建得到统计量矩阵S∈RN×(m×p),其中,p表示选取的统计量的个数;
高阶统计量,具体是指三阶以上的统计量;由于高阶统计量对于某些特定的故障类型较为敏感,本发明能够提取多模态过程的潜在特征,有利于建模,从而进一步提高多模态过程故障检测的准确度和灵敏度;
应当说明的是,本实施例中,选取一阶统计量、二阶统计量、三阶统计量及四阶统计量构成加权SVDD的样本,仅为本发明的一种优选的实施方式,不应理解为对本发明的唯一限定;视具体多模态过程中的数据特征的不同,在本发明的其他一些实施例中,也可以选取其他的一个或一些高阶统计量来构建加权SVDD的样本,在此将不作一一列举。
本实施例中,离线建模阶段中,对于任意第i个样本si,其局部可达密度比为:
Figure BDA0002713761190000101
其中,KNN(si)表示样本si的邻居集合,sj表示集合KNN(si)中的样本,LRD(si)和LRD(si)分别表示样本si和样本sj的局部可达密度;
在基于加权SVDD算法进行多模态过程故障检测时,需要根据样本分布的密度信息设计加权因子,局部可达密度可以很好地反映样本分布的密度信息,但局部可达密度的值比较分散,不适合作为权重;本实施例首先获得样本及其邻居所在集合中,各样本局部可达密度的最大值,并以该样本的局部可达密度与该最大值的比值作为对应样本的局部可达密度比,由此能够将样本的密度信息约束在(0,1]范围内,适合于作为加权SVDD中的加权因子,并且保证了样本的局部可达密度越大,其权重越大,对建模的影响越大,由此能够更加准确、灵敏地识别多模态过程和离群点,避免过拟合,从而提高多模态过程故障检测过程的准确度和灵敏度。
为了进一步提高多模态过程故障检测的准确度和灵敏度,本实施例获取的样本si的邻居集合KNN(si)由样本si的K个邻居构成,且K个邻居包括K1个空间上的邻居和K2个时间上的邻居;
其中,K为预设的正整数,K1和K2均为整数,且K1≥0,K2≥0;
相应地,计算样本si的局部可达密度,包括如下步骤:
(T1)计算每个样本si与其K个邻居的距离
Figure BDA0002713761190000102
k=1,2,...,K,其中
Figure BDA0002713761190000103
表示样本si的第k个邻居的统计量;定义K_distance(si)为其与第K个邻居的距离;
(T2)计算样本si的可达距离;
Figure BDA0002713761190000111
(T3)计算样本si的局部可达密度;
Figure BDA0002713761190000112
本实施例在计算样本的加权因子,即局部可达密度比时,会同时考虑样本在时间上的邻居信息和空间上的邻居信息,与空间上的邻居类似,时间上越近的邻居也越有可能属于一个类别,即正常类别或故障类别,但时间上和空间上的邻居不是完全重叠的,所以本实施例同时考虑两者来计算样本点的局部可达密度,可以更加全面地体现其局部特性,最终使得模型超球面更合理,从而能够提高多模态过程故障检测的准确度和灵敏度;
基于加权SVDD算法建立的超球体模型,其参数包括超球体的球心a,半径R以及拉格朗日因子;为了求得这些参数,本实施例中,离线建模阶段中,对超球体模型进行优化计算,包括:
(S1)通过引入拉格朗日因子α=[α12,…,αN]T,将目标函数转化成其对偶形式:
Figure BDA0002713761190000113
Figure BDA0002713761190000114
其中,si和sj均表示样本,αi和αj分别表示样本si和样本sj对应的拉格朗日因子,wi为样本si对应的加权因子(即局部可达密度比),C表示惩罚因子;K(·)为核函数,且K(xi,xj)=<Φ(xi),Φ(xj)>,Φ(·)是用于将样本映射到高维特征空间的非线性映射函数,<·>表示高维空间中的非线性内积;
(S2)根据KKT条件,仅有部分αi满足0≤αi≤wiC,其对应的样本即为支持向量;筛选出所有满足0≤αi≤wiC的样本,得到支持向量,利用筛选出的支持向量,计算超球体的半径R和中心a为分别:
Figure BDA0002713761190000121
Figure BDA0002713761190000122
本实施例中,惩罚因子C的计算表达式为:
Figure BDA0002713761190000123
其中,β表示所允许的误报率。
故障检测阶段中,根据拉格朗日因子αi计算待检测样本到超球体的中心a的距离DIST,其计算公式为:
Figure BDA0002713761190000124
其中,Son为待检测样本,si和sj均表示样本,αi和αj分别表示样本si和样本sj对应的拉格朗日因子,K(·)为核函数,且K(xi,xj)=<Φ(xi),Φ(xj)>,Φ(·)是用于将样本映射到高维特征空间的非线性映射函数,<·>表示高维空间中的非线性内积;
本实施例计算的待检测样本与SVDD构造的超球体球心的距离能有效地表征待检测样本与正常模式类的相似度。
总体而言,利用加权SVDD作为监控模型,能够同时考虑多模态过程数据的非线性和非高斯特性;以样本的局部可达密度比作为样本的加权因子,能够准确、灵敏地识别多模态过程和离群点,提高多模态故障检测的准确度和灵敏度;在计算加权因子时,同时考虑样本在时间上和空间上的邻居信息,能够进一步提高故障检测的灵敏度和准确度;通过提取多模态数据的潜在低阶和高阶信息,更有利于建模。
实施例2:
一种计算机可读存储介质,包括存储的计算机程序,计算机程序被处理器执行时,控制计算机可读存储介质所在设备执行上述实施例1提供的基于加权SVDD的多模态过程故障检测方法。
以下结合具体的应用场景对本发明所能取得的有益效果做进一步的解释说明。
在其中一个应用场景中,生成200个低密度的香蕉型分布二维样本作为模态1,100个高密度的正态分布二维样本作为模态2,以及3个靠近高密度样本的离群点。每个样本的全局密度和加权因子分别如图2和3所示,其中第1~200个采样点为模态1的采样点,第201~300个采样点为模态2的采样点,第301~303个采样点为离群点,图2中的“.”、“+”和“△”分别代表模态1、模态2和离群点的全局密度,图3中的“.”、“+”和“△”分别代表模态1、模态2和离群点的加权因子。由图2可以看出,来自两个模态的样本的密度差异很大,图3中权加权因子分布差异不大,由此可知,本发明提出的加权因子可以去除数据的多峰性。虽然离群点和模态1的密度差异不大,但是离群点的加权因子远远小于两个模态,这说明了本发明所提出的加权因子对离群点是敏感的,从而能够在故障检测过程中准确识别离群点,保证检测的准确性和灵敏度。图4为得到的SVDD模型超球面可视化图,可以看出几乎所有的正常值都被包含在了超球面以内,而离群点被隔离在外边。这说明了此加权因子下的SVDD模型是有效的。
在另一个应用场景中,通过Tennessee Eastman(TE)过程对上述基于SVDD的多模态过程故障检测方法进行验证。TE过程是一个基于真实工业过程的仿真平台,在基于数据驱动的故障检测研究领域被广泛应用于各种监控方法的性能评价中,包含5个部分:反应器、冷凝器、循环压缩机、气液分离器、汽提塔,该过程示意图如图5所示,包含41个测量变量和12个操作变量。根据产品G/H质量比的不同,TE过程有六个操作模式,各模式参数如表1所示,工业过程中根据不同的需求使系统工作在相应的模式下。
表1
Figure BDA0002713761190000141
本次验证采用41个测量变量和9个有变化的操作变量。研究对象为模态1和模态3,分别生成800和200个样本作为训练数据。如表2所示,4种情况作为在线监控的对象。每个情况对应的在线数据采集1000个,其中,前200个采样为正常数据,后800个采样为故障数据。
表2
Figure BDA0002713761190000142
类似于第一中应用场景下的数值案例,为了验证本发明提出的加权因子的有效性,在训练样本中加入3个离群点。每个采样的全局密度和加权因子分别如图6和7所示。第1~800、801~1000和1001~1003个采样点点分别代表模态1、模态3和离群点,图6中“.”、“+”和“△”分别代表模态1、模态3和离群点的全局密度,图7中“.”、“+”和“△”分别代表模态1、模态3和离群点的加权因子。很明显地,虽然不同模态的密度差异很大,但其加权因子分布很均衡,并且离群点的加权因子远远小于正常数据。
图8~11分别为表2中四种情况的监控图,其中“Dist”表示样本距离距离超球体球心的距离,“Limit”表示超球体的半径R。情况1和情况2中的有一些故障数据和正常数据的差异较小,所以故障检测的难度大,通过图8和图9可以看出,本发明提出基于加权SVDD的多模态过程故障检测方法可以将这两种故障与正常数据很明显得分离开来,且漏报率为0,说明该方法检测准确率很高;情况3和情况4中故障是缓慢偏离正常状态的,所以开始的故障数据和正常数据差异很小,那么初始阶段的故障是很难被检测到的。通过图10和图11可以看出,本发明提出的方法可以分别在6和9个样本以后就可以判断这两种情况发生了故障,说明该方法在故障检测上有很高的灵敏度。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于加权SVDD的多模态过程故障检测方法,其特征在于,包括:离线建模阶段和故障检测阶段;
所述离线建模阶段包括:
获取不同模态的正常数据,组成初始数据集X,并利用长度为w的滑动窗口在所述初始数据集X上滑动,得到窗口数据序列;
计算所述窗口数据序列中各窗口数据的统计量,分别作为一个样本,并分别计算各样本的局部可达密度比,作为各样本对应的权重因子,以利用加权SVDD算法建立超球体模型;样本的局部可达密度比为该样本的局部可达密度归一化之后的值;
对所述超球体模型进行优化计算,得到拉格朗日因子αi,以及超球体的中心a和半径R;其中,1≤i≤N,N表示窗口数据序列的长度;
所述故障检测阶段包括:
将待检测数据预处理为长度为w的检测窗口数据Xon,并计算所述检测窗口数据Xon的统计量,作为待检测样本;
根据所述拉格朗日因子αi计算所述待检测样本到所述超球体的中心a的距离DIST;
若DIST>R,则判定系统发生故障;若DIST≤R,则判定系统正常。
2.如权利要求1所述的基于加权SVDD的多模态过程故障检测方法,其特征在于,所述统计量包括一阶统计量、二阶统计量和至少一个高阶统计量。
3.如权利要求2所述的基于加权SVDD的多模态过程故障检测方法,其特征在于,所述统计量包括一阶统计量、二阶统计量、三阶统计量和四阶统计量。
4.如权利要求1-3任一项所述的基于加权SVDD的多模态过程故障检测方法,其特征在于,所述离线建模阶段中,对于任意第i个样本si,其局部可达密度比为:
Figure FDA0002713761180000021
其中,KNN(si)表示所述样本si的邻居集合,sj表示所述集合KNN(si)中的样本,LRD(si)和LRD(si)分别表示所述样本si和所述样本sj的局部可达密度。
5.如权利要求4所述的基于加权SVDD的多模态过程故障检测方法,其特征在于,所述样本si的邻居集合KNN(si)由所述样本si的K个邻居构成,且所述K个邻居包括K1个空间上的邻居和K2个时间上的邻居;
其中,K为预设的正整数,K1和K2均为整数,且K1≥0,K2≥0。
6.如权利要求1-3任一项所述的基于加权SVDD的多模态过程故障检测方法,其特征在于,所述离线建模阶段中,对所述超球体模型进行优化计算,包括:
(S1)通过引入拉格朗日因子α=[α12,…,αN]T,将目标函数转化成其对偶形式:
Figure FDA0002713761180000022
Figure FDA0002713761180000023
其中,si和sj均表示样本,αi和αj分别表示所述样本si和所述样本sj对应的拉格朗日因子,wi为所述样本si对应的加权因子,C表示惩罚因子;K(·)为核函数,且K(xi,xj)=<Φ(xi),Φ(xj)>,Φ(·)是用于将样本映射到高维特征空间的非线性映射函数,<·>表示高维空间中的非线性内积;
(S2)根据KKT条件,筛选出所有满足0≤αi≤wiC的样本,得到支持向量,利用筛选出的支持向量,计算超球体的半径R和中心a为分别:
Figure FDA0002713761180000031
Figure FDA0002713761180000032
7.如权利要求6所述的基于加权SVDD的多模态过程故障检测方法,其特征在于,所述惩罚因子C的计算表达式为:
Figure FDA0002713761180000033
其中,β表示所允许的误报率。
8.如权利要求1-3任一项所述的基于加权SVDD的多模态过程故障检测方法,其特征在于,所述故障检测阶段中,根据所述拉格朗日因子αi计算所述待检测样本到所述超球体的中心a的距离DIST,其计算公式为:
Figure FDA0002713761180000034
其中,Son为所述待检测样本,si和sj均表示样本,αi和αj分别表示所述样本si和所述样本sj对应的拉格朗日因子,K(·)为核函数,且K(xi,xj)=<Φ(xi),Φ(xj)>,Φ(·)是用于将样本映射到高维特征空间的非线性映射函数,<·>表示高维空间中的非线性内积。
9.一种计算机可读存储介质,其特征在于,包括存储的计算机程序,所述计算机程序被处理器执行时,控制所述计算机可读存储介质所在设备执行权利要求1-8任一项所述的基于加权SVDD的多模态过程故障检测方法。
CN202011065955.7A 2020-09-30 2020-09-30 一种基于加权svdd的多模态过程故障检测方法 Active CN112184037B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011065955.7A CN112184037B (zh) 2020-09-30 2020-09-30 一种基于加权svdd的多模态过程故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011065955.7A CN112184037B (zh) 2020-09-30 2020-09-30 一种基于加权svdd的多模态过程故障检测方法

Publications (2)

Publication Number Publication Date
CN112184037A true CN112184037A (zh) 2021-01-05
CN112184037B CN112184037B (zh) 2022-11-11

Family

ID=73947609

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011065955.7A Active CN112184037B (zh) 2020-09-30 2020-09-30 一种基于加权svdd的多模态过程故障检测方法

Country Status (1)

Country Link
CN (1) CN112184037B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449809A (zh) * 2021-07-15 2021-09-28 长沙理工大学 一种基于kpca-nsvdd的电缆绝缘在线监测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4554642A (en) * 1982-07-16 1985-11-19 At&T Bell Laboratories Digital filtering with monitored settling time
CN101458522A (zh) * 2009-01-08 2009-06-17 浙江大学 基于主元分析和支持向量数据描述的多工况过程监控方法
WO2017191872A1 (ko) * 2016-05-04 2017-11-09 두산중공업 주식회사 플랜트 이상 감지 방법 및 시스템
CN109490814A (zh) * 2018-09-07 2019-03-19 广西电网有限责任公司电力科学研究院 基于深度学习和支持向量数据描述的计量自动化终端故障诊断方法
CN109508846A (zh) * 2017-09-15 2019-03-22 新奥(中国)燃气投资有限公司 一种机组数据异常波动的检测方法及装置
CN109697463A (zh) * 2018-12-13 2019-04-30 中国航空工业集团公司上海航空测控技术研究所 基于支持向量数据描述集成学习的齿轮故障识别方法
CN109901557A (zh) * 2019-03-28 2019-06-18 山东科技大学 一种基于数据域描述的可变控制限故障检测方法
EP3531387A1 (en) * 2018-02-27 2019-08-28 Upstreem SA An electronic bracelet and an offender monitoring system
CN110298385A (zh) * 2019-06-05 2019-10-01 浙江工业大学 一种基于*信息与增量svdd在线早期故障检测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4554642A (en) * 1982-07-16 1985-11-19 At&T Bell Laboratories Digital filtering with monitored settling time
CN101458522A (zh) * 2009-01-08 2009-06-17 浙江大学 基于主元分析和支持向量数据描述的多工况过程监控方法
WO2017191872A1 (ko) * 2016-05-04 2017-11-09 두산중공업 주식회사 플랜트 이상 감지 방법 및 시스템
CN109508846A (zh) * 2017-09-15 2019-03-22 新奥(中国)燃气投资有限公司 一种机组数据异常波动的检测方法及装置
EP3531387A1 (en) * 2018-02-27 2019-08-28 Upstreem SA An electronic bracelet and an offender monitoring system
CN109490814A (zh) * 2018-09-07 2019-03-19 广西电网有限责任公司电力科学研究院 基于深度学习和支持向量数据描述的计量自动化终端故障诊断方法
CN109697463A (zh) * 2018-12-13 2019-04-30 中国航空工业集团公司上海航空测控技术研究所 基于支持向量数据描述集成学习的齿轮故障识别方法
CN109901557A (zh) * 2019-03-28 2019-06-18 山东科技大学 一种基于数据域描述的可变控制限故障检测方法
CN110298385A (zh) * 2019-06-05 2019-10-01 浙江工业大学 一种基于*信息与增量svdd在线早期故障检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GRYLLIAS K ET AL: "A semi-supervised SVDD-based fault detection method for rolling element bearings", 《FIRST WORLD CONGRESS ON CONDITION MONITORING》 *
谢彦红等: "基于差分的动态加权SVDD在多模态过程故障检测中的应用", 《计算机应用研究》 *
郑英等: "基于无记忆降阶观测器的网络化控制系统故障检测方法", 《自动化学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449809A (zh) * 2021-07-15 2021-09-28 长沙理工大学 一种基于kpca-nsvdd的电缆绝缘在线监测方法

Also Published As

Publication number Publication date
CN112184037B (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
CN115018021B (zh) 基于图结构与异常注意力机制的机房异常检测方法及装置
CN109242223B (zh) 城市公共建筑火灾风险的量子支持向量机评估与预测方法
CN110087207B (zh) 无线传感器网络缺失数据重建方法
CN111062508A (zh) 一种基于大数据技术评估风电机组实时运行状态的方法
CN116448419A (zh) 基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法
CN113411821B (zh) 一种复杂网络的体系重构能力测评方法及系统
CN115712873A (zh) 一种基于数据分析和红外图像信息融合的光伏并网运行异常检测系统及方法
CN114266289A (zh) 一种复杂装备健康状态评估方法
CN115438897A (zh) 一种基于blstm神经网络的工业过程产品质量预测方法
Huang et al. The Mahalanobis–Taguchi system–Neural network algorithm for data-mining in dynamic environments
CN112184037B (zh) 一种基于加权svdd的多模态过程故障检测方法
CN108830407B (zh) 多工况条件下结构健康监测中的传感器分布优化方法
Dan et al. Application of machine learning in forecasting energy usage of building design
CN116109039A (zh) 一种数据驱动异常检测与预警系统
CN115730248A (zh) 一种机器账号检测方法、系统、设备及存储介质
CN114943328A (zh) 基于bp神经网络非线性组合的sarima-gru时序预测模型
Maleki et al. Robust hierarchical clustering for novelty identification in sensor networks: With applications to industrial systems
CN114137915A (zh) 一种工业设备的故障诊断方法
Kalinowski et al. The adaptive spatio-temporal clustering method in classifying direct labor costs for the manufacturing industry
CN113742204A (zh) 一种基于模糊测试的深度学习算子测试工具
Nourizadeh et al. Seismic damage identification of moment frames based on random forest algorithm and enhanced gray wolf optimization
Yao et al. An improved GM (1, 1) model based on iterative weighted least square criterion parameter estimation
Zheng Dataset Outlier Detection Method Based on Random Forest Algorithm
Weichbroth et al. The adaptive spatio-temporal clustering method in classifying direct labor costs for the manufacturing industry
Patuelli et al. A rank-order test on the statistical performance of neural network models for regional labor market forecasts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant