CN109901557A - 一种基于数据域描述的可变控制限故障检测方法 - Google Patents
一种基于数据域描述的可变控制限故障检测方法 Download PDFInfo
- Publication number
- CN109901557A CN109901557A CN201910242418.6A CN201910242418A CN109901557A CN 109901557 A CN109901557 A CN 109901557A CN 201910242418 A CN201910242418 A CN 201910242418A CN 109901557 A CN109901557 A CN 109901557A
- Authority
- CN
- China
- Prior art keywords
- sample
- fault detection
- fault
- formula
- control limit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于数据域描述的可变控制限故障检测方法,具体涉及故障诊断技术领域。解决了现有的故障检测中存在正常样本和故障样本混叠现象时,高的故障检测率(FDR)低的误报率(FAR)无法兼顾的问题。该方法首先通过局部可达密度(LRD)加权的支持向量数据域描述(SVDD),对离线数据进行建模,利用高斯核函数得到具有软边界的超球体,在此基础上定义样本的故障检测统计量。在线故障检测时,根据最近w个样本的故障检测统计量信息,使控制限在接近0的正数ρ和接近0的负数σ之间进行切换,可同时兼顾FDR和FAR两个指标,大大提高混叠区域样本的故障检测性能。
Description
技术领域
本发明涉及故障诊断技术领域,具体公开了一种基于数据域描述的可变控制限故障检测方法。
背景技术
数据域描述也可称为一类分类器,其主要思想是寻找目标数据集的边界,以涵盖所有目标数据,但不包含多余的空间。数据集的边界可以用于检测新数据或异常值。支持向量数据域描述(SVDD)是一种常用的数据域描述方法,也叫一类支持向量机(One-ClassSVM),可得到具有软边界的超球体,并用于有监督的故障检测问题。但是,当正常样本和故障样本混叠时,超球体的边界会穿过样本混叠区域。因此,对于落在混叠区域内的样本,采用该边界进行故障检测会导致故障误报率(FAR)偏大,同时故障检测率(FDR)偏小。
发明内容
本发明的目的是针对上述不足,提出了一种根据最近w个样本的检测统计量信息,对进行故障检测的边界进行切换,可同时兼顾FDR和FAR两个指标,大大提高混叠区域样本的故障检测性能的基于数据域描述的可变控制限故障检测方法。
本发明具体采用如下技术方案:
一种基于数据域描述的可变控制限故障检测方法,具体包括:
11.建立离线故障检测模型,生成具有软边界的超球体:
111.假设所检测的对象包含d个传感器或变量,离线数据集共包含n个正常样本和m个故障样本,分别组成正常样本矩阵X=[x1,x2,…,xn]T∈Rn×d以及故障样本矩阵Y=[y1,y2,…,ym]T∈Rm×d;
112.对正常样本和故障样本分别计算局部可达密度,对正常样本xi,其局部可达密度如式(1):
其中,Nk(xi)代表正常样本xi的k个近邻组成的集合,为高斯核映射,其内积满足式(2):
其中,s为高斯核函数带宽,RDk(a,b)为样本a到样本b的可达距离,定义如式(3):
RDk(a,b)=max(||a-a(k)||,||a-b||) (3)
其中,a(k)代表距离样本a第k近的邻居;
113.采用LRD加权的带负样本的SVDD方法,生成具有软边界的超球,基于式(4)所示的含约束的对偶问题:
s.t.0≤αi≤ci,i=1,...,n
0≤βj≤dj,j=1,...,m
其中,ci和dj分别为样本xi和yj的局部可达密度;
114.通过序列最小最优化算法进行求解式(4),得到一组最优的α,β,任选一个0<αi<ci对应的样本xi,将其记做xsv;
12.基于故障检测统计量确定可变控制限策略:
121.对于待检测的样本zl,故障检测统计量定义如式(5)所示:
故障检测统计量表示样本z与超球球心a的距离与超球体半径R的关系;
122.给定一个自然数w,采用式(6)定义待检测的样本zl平均检测统计量:
123.可变控制限策略为:
初始控制限设置为ρ>0;
将控制限切换为σ<0;
将控制限切换为ρ>0;
13.在线故障检测:
对于待检测样本zi,计算T(zi);
根据可变控制限策略,确定当前控制限θ(θ=ρ或θ=σ);
如果T(zi)≤θ,则判断zi正常,否则,判断zi为故障样本。
优选地,采用数值仿真,将正常样本数据和故障样本数据生成如式(7)所示的模型:
其中,x代表正常样本,y代表故障样本,e1~e4服从零均值正态分布并相互独立,e1,e2标准差为1.5,e3,e4标准差为1,首先进行离线建模,基于该模型产生3000个正常样本和500个故障样本,采用以下参数进行离线模型的训练:LRD邻居数量k=3,高斯核函数带宽s=5。
本发明具有如下有益效果:
该基于数据域描述的可变控制限故障检测方法根据最近w个样本的检测统计量信息,对进行故障检测的边界进行切换,可同时兼顾FDR和FAR两个指标,大大提高混叠区域样本的故障检测性能。
附图说明
图1为基于数据域描述的故障检测统计量等高线示意图;
图2为数值仿真故障检测结果示意图。
具体实施方式
下面结合附图和具体实施例对本发明的具体实施方式做进一步说明:
一种基于数据域描述的可变控制限故障检测方法,具体包括:
11.建立离线故障检测模型,生成具有软边界的超球体:
111.假设所检测的对象包含d个传感器或变量,离线数据集共包含n个正常样本和m个故障样本,分别组成正常样本矩阵X=[x1,x2,…,xn]T∈Rn×d以及故障样本矩阵Y=[y1,y2,…,ym]T∈Rm×d;
112.对正常样本和故障样本分别计算局部可达密度,对正常样本xi,其局部可达密度如式(1):
其中,Nk(xi)代表正常样本xi的k个近邻组成的集合,为高斯核映射,其内积满足式(2):
其中,s为高斯核函数带宽,RDk(a,b)为样本a到样本b的可达距离,定义如式(3):
RDk(a,b)=max(||a-a(k)||,||a-b||) (3)
其中,a(k)代表距离样本a第k近的邻居;
113.采用LRD加权的带负样本的SVDD方法,生成具有软边界的超球,基于式(4)所示的含约束的对偶问题:
s.t.0≤αi≤ci,i=1,...,n
0≤βj≤dj,j=1,...,m
其中,ci和dj分别为样本xi和yj的局部可达密度;
114.通过序列最小最优化算法进行求解式(4),得到一组最优的α,β,任选一个0<αi<ci对应的样本xi,将其记做xsv;
12.基于故障检测统计量确定可变控制限策略:
121.对于待检测的样本zl,故障检测统计量定义如式(5)所示:
故障检测统计量表示样本z与超球球心a的距离与超球体半径R的关系;
122.给定一个自然数w,采用式(6)定义待检测的样本zl平均检测统计量:
123.可变控制限策略为:
初始控制限设置为ρ>0;
将控制限切换为σ<0;
将控制限切换为ρ>0;
13.在线故障检测:
对于待检测样本zi,计算T(zi);
根据可变控制限策略,确定当前控制限θ(θ=ρ或θ=σ);
如果T(zi)≤θ,则判断zi正常,否则,判断zi为故障样本。
在采用LRD加权的带负样本的SVDD方法,生成具有软边界的超球中,通过序列最小最优化算法进行求解,并得到一组最优的α,β,任选一个0<αi<ci对应的样本xi,xi位于超球体的边界上,为支持向量,将其记做xsv。
采用数值仿真,将正常样本数据和故障样本数据生成如式(7)所示的模型:
其中,x代表正常样本,y代表故障样本,e1~e4服从零均值正态分布并相互独立,e1,e2标准差为1.5,e3,e4标准差为1,首先进行离线建模,基于该模型产生3000个正常样本和500个故障样本,采用以下参数进行离线模型的训练:LRD邻居数量k=3,高斯核函数带宽s=5。
图1显示了存在正负样本混叠情况下,应用数据域描述方法得到的故障检测统计量等高线,不同等高线对应不同的控制限,这里选取ρ=0.0005,σ=-0.0005。
基于上述模型进行在线故障检测。测试样本共3000个,其中第601~2400的样本为故障样本,采用可变控制限策略,w=5,故障检测结果如图2所示,其中,FAR和FDR分别为3.5%和92.56%。同等条件下,当不采用可变控制限策略时,FAR和FDR分别为12.58%和73.67%。
当然,上述说明并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换,也应属于本发明的保护范围。
Claims (2)
1.一种基于数据域描述的可变控制限故障检测方法,其特征在于,具体包括:
11.建立离线故障检测模型,生成具有软边界的超球体:
111.假设所检测的对象包含d个传感器或变量,离线数据集共包含n个正常样本和m个故障样本,分别组成正常样本矩阵X=[x1,x2,…,xn]T∈Rn×d以及故障样本矩阵Y=[y1,y2,…,ym]T∈Rm×d;
112.对正常样本和故障样本分别计算局部可达密度,对正常样本xi,其局部可达密度如式(1):
其中,Nk(xi)代表正常样本xi的k个近邻组成的集合,为高斯核映射,其内积满足式(2):
其中,s为高斯核函数带宽,RDk(a,b)为样本a到样本b的可达距离,定义如式(3):
RDk(a,b)=max(||a-a(k)||,||a-b||) (3)
其中,a(k)代表距离样本a第k近的邻居;
113.采用LRD加权的带负样本的SVDD方法,生成具有软边界的超球,基于式(4)所示的含约束的对偶问题:
其中,ci和dj分别为样本xi和yj的局部可达密度;
114.通过序列最小最优化算法进行求解式(4),得到一组最优的α,β,任选一个0<αi<ci对应的样本xi,将其记做xsv;
12.基于故障检测统计量确定可变控制限策略:
121.对于待检测的样本zl,故障检测统计量定义如式(5)所示:
故障检测统计量表示样本zl与超球球心a的距离与超球体半径R的关系;
122.给定一个自然数w,采用式(6)定义待检测的样本zl平均检测统计量:
123.可变控制限策略为:
初始控制限设置为ρ>0;
将控制限切换为σ<0;
将控制限切换为ρ>0;
13.在线故障检测:
对于待检测样本zi,计算T(zi);
根据可变控制限策略,确定当前控制限θ(θ=ρ或θ=σ);
如果T(zi)≤θ,则判断zi正常,否则,判断zi为故障样本。
2.如权利要求1所述的基于数据域描述的可变控制限故障检测方法,其特征在于,采用数值仿真,将正常样本数据和故障样本数据生成如式(7)所示的模型:
其中,x代表正常样本,y代表故障样本,e1~e4服从零均值正态分布并相互独立,e1,e2标准差为1.5,e3,e4标准差为1,首先进行离线建模,基于该模型产生3000个正常样本和500个故障样本,采用以下参数进行离线模型的训练:LRD邻居数量k=3,高斯核函数带宽s=5。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910242418.6A CN109901557B (zh) | 2019-03-28 | 2019-03-28 | 一种基于数据域描述的可变控制限故障检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910242418.6A CN109901557B (zh) | 2019-03-28 | 2019-03-28 | 一种基于数据域描述的可变控制限故障检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109901557A true CN109901557A (zh) | 2019-06-18 |
CN109901557B CN109901557B (zh) | 2021-06-22 |
Family
ID=66953115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910242418.6A Active CN109901557B (zh) | 2019-03-28 | 2019-03-28 | 一种基于数据域描述的可变控制限故障检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109901557B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110320894A (zh) * | 2019-08-01 | 2019-10-11 | 陕西工业职业技术学院 | 一种准确划分混叠区域数据类别的火电厂制粉系统故障检测方法 |
CN112184037A (zh) * | 2020-09-30 | 2021-01-05 | 华中科技大学 | 一种基于加权svdd的多模态过程故障检测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488091A (zh) * | 2013-09-27 | 2014-01-01 | 上海交通大学 | 一种数据驱动的基于动态成分分析的控制过程监控方法 |
CN103870682A (zh) * | 2014-02-28 | 2014-06-18 | 湖州师范学院 | 一种局部分块的一类支持向量数据描述方法 |
CN105894023A (zh) * | 2016-03-31 | 2016-08-24 | 华东理工大学 | 基于聚簇的支持向量数据描述改进算法 |
US9639809B1 (en) * | 2016-02-10 | 2017-05-02 | Sas Institute Inc. | Monitoring system based on a support vector data description |
CN107544477A (zh) * | 2017-10-23 | 2018-01-05 | 中国石油大学(华东) | 基于核主元分析的非线性工业过程故障检测方法 |
CN107576949A (zh) * | 2017-08-23 | 2018-01-12 | 电子科技大学 | 基于密度权重和混合核函数的svdd雷达目标一维距离像识别方法 |
-
2019
- 2019-03-28 CN CN201910242418.6A patent/CN109901557B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488091A (zh) * | 2013-09-27 | 2014-01-01 | 上海交通大学 | 一种数据驱动的基于动态成分分析的控制过程监控方法 |
CN103870682A (zh) * | 2014-02-28 | 2014-06-18 | 湖州师范学院 | 一种局部分块的一类支持向量数据描述方法 |
US9639809B1 (en) * | 2016-02-10 | 2017-05-02 | Sas Institute Inc. | Monitoring system based on a support vector data description |
CN105894023A (zh) * | 2016-03-31 | 2016-08-24 | 华东理工大学 | 基于聚簇的支持向量数据描述改进算法 |
CN107576949A (zh) * | 2017-08-23 | 2018-01-12 | 电子科技大学 | 基于密度权重和混合核函数的svdd雷达目标一维距离像识别方法 |
CN107544477A (zh) * | 2017-10-23 | 2018-01-05 | 中国石油大学(华东) | 基于核主元分析的非线性工业过程故障检测方法 |
Non-Patent Citations (3)
Title |
---|
BO LIU, ETC.: ""An Efficient Approach for Outlier Detection with Imperfect Data Labels"", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 * |
刘英杰 等: ""基于SVD和SVDD的轴承故障诊断"", 《控制工程》 * |
许圆圆 等: ""基于局部特征的多模态过程监控方法"", 《华东理工大学学报(自然科学版)》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110320894A (zh) * | 2019-08-01 | 2019-10-11 | 陕西工业职业技术学院 | 一种准确划分混叠区域数据类别的火电厂制粉系统故障检测方法 |
CN112184037A (zh) * | 2020-09-30 | 2021-01-05 | 华中科技大学 | 一种基于加权svdd的多模态过程故障检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109901557B (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107656154B (zh) | 基于改进模糊c均值聚类算法的变压器故障诊断方法 | |
WO2019233189A1 (zh) | 一种传感网络异常数据检测方法 | |
CN109816119A (zh) | 一种基于无监督学习的无线传感器异常数据检测方法 | |
CN105718715A (zh) | 异常检测方法和设备 | |
CN109901557A (zh) | 一种基于数据域描述的可变控制限故障检测方法 | |
CN105956702A (zh) | 一种基于数据融合的水产养殖水质溶解氧预测方法 | |
CN110501646A (zh) | 一种离线锂电池剩余电量估计方法 | |
CN108900622A (zh) | 基于物联网的数据融合方法、装置与计算机可读存储介质 | |
CN110348665A (zh) | 一种低压台区电力系统数据质量评价方法及装置 | |
CN104792674A (zh) | 一种颗粒浓度测量方法 | |
CN110285781B (zh) | 一种相对于基准面的平面平行度快速评定方法 | |
CN109255363A (zh) | 一种基于加权卡方距离度量的模糊k近邻分类方法及系统 | |
CN109856494A (zh) | 一种基于支持向量机的变压器故障诊断方法 | |
CN107679089A (zh) | 一种用于电力传感数据的清洗方法、装置和系统 | |
CN108229494A (zh) | 网络训练方法、处理方法、装置、存储介质和电子设备 | |
CN109009084A (zh) | 多导联心电信号的qrs波群校验方法、装置及设备、介质 | |
CN108460462A (zh) | 一种基于区间参数优化的区间神经网络学习方法 | |
CN109446931A (zh) | 基于时序关联分析的动物运动行为判别方法及装置 | |
CN109683594A (zh) | 一种异常变量精确识别与定位方法 | |
CN107330550A (zh) | 基于二次退火教与学算法的空间圆柱度评定方法 | |
CN109861845A (zh) | 一种基于神经网络和用户访问行为的数据监控与预警方法 | |
CN108875842A (zh) | 一种金融时间序列预测方法、服务器及装置 | |
CN106444578B (zh) | 一种基于异构测地线距离svdd的故障检测方法 | |
CN105894023A (zh) | 基于聚簇的支持向量数据描述改进算法 | |
Li et al. | Ship traffic flow prediction based on AIS data mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |