CN109901557A

CN109901557A - 一种基于数据域描述的可变控制限故障检测方法

Info

Publication number: CN109901557A
Application number: CN201910242418.6A
Authority: CN
Inventors: 周东华; 陈茂银; 桑建学; 郭天序; 台秀华; 纪洪泉; 钟麦英
Original assignee: Shandong University of Science and Technology
Current assignee: Shandong University of Science and Technology
Priority date: 2019-03-28
Filing date: 2019-03-28
Publication date: 2019-06-18
Anticipated expiration: 2039-03-28
Also published as: CN109901557B

Abstract

本发明公开了一种基于数据域描述的可变控制限故障检测方法，具体涉及故障诊断技术领域。解决了现有的故障检测中存在正常样本和故障样本混叠现象时，高的故障检测率(FDR)低的误报率(FAR)无法兼顾的问题。该方法首先通过局部可达密度(LRD)加权的支持向量数据域描述(SVDD)，对离线数据进行建模，利用高斯核函数得到具有软边界的超球体，在此基础上定义样本的故障检测统计量。在线故障检测时，根据最近w个样本的故障检测统计量信息，使控制限在接近0的正数ρ和接近0的负数σ之间进行切换，可同时兼顾FDR和FAR两个指标，大大提高混叠区域样本的故障检测性能。

Description

一种基于数据域描述的可变控制限故障检测方法

技术领域

本发明涉及故障诊断技术领域，具体公开了一种基于数据域描述的可变控制限故障检测方法。

背景技术

数据域描述也可称为一类分类器，其主要思想是寻找目标数据集的边界，以涵盖所有目标数据，但不包含多余的空间。数据集的边界可以用于检测新数据或异常值。支持向量数据域描述(SVDD)是一种常用的数据域描述方法，也叫一类支持向量机(One-ClassSVM)，可得到具有软边界的超球体，并用于有监督的故障检测问题。但是，当正常样本和故障样本混叠时，超球体的边界会穿过样本混叠区域。因此，对于落在混叠区域内的样本，采用该边界进行故障检测会导致故障误报率(FAR)偏大，同时故障检测率(FDR)偏小。

发明内容

本发明的目的是针对上述不足，提出了一种根据最近w个样本的检测统计量信息，对进行故障检测的边界进行切换，可同时兼顾FDR和FAR两个指标，大大提高混叠区域样本的故障检测性能的基于数据域描述的可变控制限故障检测方法。

本发明具体采用如下技术方案：

一种基于数据域描述的可变控制限故障检测方法，具体包括：

11.建立离线故障检测模型，生成具有软边界的超球体：

111.假设所检测的对象包含d个传感器或变量，离线数据集共包含n个正常样本和m个故障样本，分别组成正常样本矩阵X＝[x₁,x₂,…,x_n]^T∈R^n×d以及故障样本矩阵Y＝[y₁,y₂,…,y_m]^T∈R^m×d；

112.对正常样本和故障样本分别计算局部可达密度，对正常样本x_i，其局部可达密度如式(1)：

其中，N_k(x_i)代表正常样本x_i的k个近邻组成的集合，为高斯核映射，其内积满足式(2)：

其中，s为高斯核函数带宽，RD_k(a,b)为样本a到样本b的可达距离，定义如式(3)：

RD_k(a,b)＝max(||a-a^(k)||,||a-b||) (3)

其中，a^(k)代表距离样本a第k近的邻居；

113.采用LRD加权的带负样本的SVDD方法，生成具有软边界的超球，基于式(4)所示的含约束的对偶问题：

s.t.0≤α_i≤c_i，i＝1,...,n

0≤β_j≤d_j，j＝1,...,m

其中，c_i和d_j分别为样本x_i和y_j的局部可达密度；

114.通过序列最小最优化算法进行求解式(4)，得到一组最优的α,β，任选一个0＜α_i＜c_i对应的样本x_i，将其记做x_sv；

12.基于故障检测统计量确定可变控制限策略：

121.对于待检测的样本z_l，故障检测统计量定义如式(5)所示：

故障检测统计量表示样本z与超球球心a的距离与超球体半径R的关系；

122.给定一个自然数w，采用式(6)定义待检测的样本z_l平均检测统计量：

123.可变控制限策略为：

初始控制限设置为ρ＞0；

将控制限切换为σ＜0；

将控制限切换为ρ＞0；

13.在线故障检测：

对于待检测样本z_i，计算T(z_i)；

根据可变控制限策略，确定当前控制限θ(θ＝ρ或θ＝σ)；

如果T(z_i)≤θ，则判断z_i正常，否则，判断z_i为故障样本。

优选地，采用数值仿真，将正常样本数据和故障样本数据生成如式(7)所示的模型：

其中，x代表正常样本，y代表故障样本，e₁～e₄服从零均值正态分布并相互独立，e₁,e₂标准差为1.5，e₃,e₄标准差为1，首先进行离线建模，基于该模型产生3000个正常样本和500个故障样本，采用以下参数进行离线模型的训练：LRD邻居数量k＝3，高斯核函数带宽s＝5。

本发明具有如下有益效果：

该基于数据域描述的可变控制限故障检测方法根据最近w个样本的检测统计量信息，对进行故障检测的边界进行切换，可同时兼顾FDR和FAR两个指标，大大提高混叠区域样本的故障检测性能。

附图说明

图1为基于数据域描述的故障检测统计量等高线示意图；

图2为数值仿真故障检测结果示意图。

具体实施方式

下面结合附图和具体实施例对本发明的具体实施方式做进一步说明：

11.建立离线故障检测模型，生成具有软边界的超球体：

RD_k(a,b)＝max(||a-a^(k)||,||a-b||) (3)

其中，a^(k)代表距离样本a第k近的邻居；

s.t.0≤α_i≤c_i，i＝1,...,n

0≤β_j≤d_j，j＝1,...,m

其中，c_i和d_j分别为样本x_i和yj的局部可达密度；

12.基于故障检测统计量确定可变控制限策略：

121.对于待检测的样本z_l，故障检测统计量定义如式(5)所示：

123.可变控制限策略为：

初始控制限设置为ρ＞0；

将控制限切换为σ＜0；

将控制限切换为ρ＞0；

13.在线故障检测：

对于待检测样本z_i，计算T(z_i)；

根据可变控制限策略，确定当前控制限θ(θ＝ρ或θ＝σ)；

如果T(z_i)≤θ，则判断z_i正常，否则，判断z_i为故障样本。

在采用LRD加权的带负样本的SVDD方法，生成具有软边界的超球中，通过序列最小最优化算法进行求解，并得到一组最优的α,β，任选一个0＜α_i＜c_i对应的样本x_i，x_i位于超球体的边界上，为支持向量，将其记做x_sv。

采用数值仿真，将正常样本数据和故障样本数据生成如式(7)所示的模型：

图1显示了存在正负样本混叠情况下，应用数据域描述方法得到的故障检测统计量等高线，不同等高线对应不同的控制限，这里选取ρ＝0.0005，σ＝-0.0005。

基于上述模型进行在线故障检测。测试样本共3000个，其中第601～2400的样本为故障样本，采用可变控制限策略，w＝5，故障检测结果如图2所示，其中，FAR和FDR分别为3.5％和92.56％。同等条件下，当不采用可变控制限策略时，FAR和FDR分别为12.58％和73.67％。

当然，上述说明并非是对本发明的限制，本发明也并不仅限于上述举例，本技术领域的技术人员在本发明的实质范围内所做出的变化、改型、添加或替换，也应属于本发明的保护范围。

Claims

1.一种基于数据域描述的可变控制限故障检测方法，其特征在于，具体包括：

11.建立离线故障检测模型，生成具有软边界的超球体：

RD_k(a,b)＝max(||a-a^(k)||,||a-b||) (3)

其中，a^(k)代表距离样本a第k近的邻居；

其中，c_i和d_j分别为样本x_i和y_j的局部可达密度；

12.基于故障检测统计量确定可变控制限策略：

121.对于待检测的样本z_l，故障检测统计量定义如式(5)所示：

故障检测统计量表示样本z_l与超球球心a的距离与超球体半径R的关系；

123.可变控制限策略为：

初始控制限设置为ρ＞0；

将控制限切换为σ＜0；

将控制限切换为ρ＞0；

13.在线故障检测：

对于待检测样本z_i，计算T(z_i)；

根据可变控制限策略，确定当前控制限θ(θ＝ρ或θ＝σ)；

如果T(z_i)≤θ，则判断z_i正常，否则，判断z_i为故障样本。

2.如权利要求1所述的基于数据域描述的可变控制限故障检测方法，其特征在于，采用数值仿真，将正常样本数据和故障样本数据生成如式(7)所示的模型：