CN109492705A - 一种基于马氏距离(md)面积度量的故障诊断方法 - Google Patents
一种基于马氏距离(md)面积度量的故障诊断方法 Download PDFInfo
- Publication number
- CN109492705A CN109492705A CN201811413217.XA CN201811413217A CN109492705A CN 109492705 A CN109492705 A CN 109492705A CN 201811413217 A CN201811413217 A CN 201811413217A CN 109492705 A CN109492705 A CN 109492705A
- Authority
- CN
- China
- Prior art keywords
- data
- sample
- area
- follows
- positive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明公开了一种基于马氏距离(MD)面积度量的故障诊断方法,包括:MD方法应用;面积度量方法应用;MD面积度量诊断算法的提出。利用MD方法将多变量数据转换为单变量数据,利用面积度量法比较单变量数据的累积分布函数之间的差异,根据定积分计算分布曲线之间的面积值,面积值较小的则为该样本故障的类别。本发明的优点是:针对以往故障诊断方法中存在的多指标相关问题以及考虑多重积分时计算复杂、效率低等缺点,对已知数据样本的马氏距离的分布与观测数据样本的马氏距离的分布进行比较,根据定积分计算分布曲线下的面积,比较面积的大小判断观测样本类别,避免了求解多变量联合分布的复杂性以及不确定性,本发明简单有效,所需测点少,故障诊断正确率高,且大大降低了计算成本,提高了计算效率。
Description
技术领域
本发明涉及一种高效诊断故障类型的分析方法,特别针对大型复杂系统仿真实验过程繁杂、人力物力消耗巨大的问题,提出简单易用的数学分析法,结合MD面积度量模型进行故障类型的判别,高效的提高故障诊断的准确度,属于系统工程与信息科学的交叉领域。
背景技术
随着工业生产和科学技术的发展,大型系统设备的结构和运行环境的复杂性使得设备的故障率变高,且故障危害性也很大。系统设备的可靠性与安全性越来越受到人们的关注,从而促进了各研究人员对机械设备故障机理及诊断技术的研究,故障诊断技术为提高系统可靠性和降低事故风险开辟了一条新的途径。
早期的故障诊断方法是基于专家系统规定的规则的方法,这些规则从专家的经验中总结出来,用来描述故障和症状的关系。它的优点是直观形象,推理速度快,对数据的存储空间的要求相对较小,缺点是对历史故障经验的依赖性强,当知识库中没有与症状匹配的相应规则时,容易造成误诊或诊断失败。故障树是一种体现故障传播关系的有向图,它以诊断对象最不希望发生的事件作为顶事件,按照对象的结构和功能关系逐层展开,直到不可分事件(底事件)为止。它的优点是可以较好地表达设备故障的层次关系及关联关系,赋予各个事件故障概率后也可以进行诊断策略优化的研究,诊断速度快,能保持一致性,并且应用领域广,只要给定相应的故障树就可以实现诊断。它的缺点是故障树一旦建造好就不容易更改,难于将与设备故障无关但可以用以诊断故障的相关信息纳入故障诊断过程之中。而且诊断结果严重依赖故障树信息的完整性,不能诊断不可预知的故障。而贝叶斯网络通过实践积累可以随时进行学习改进网络结构和参数,提高了故障诊断能力。贝叶斯网络具有很强的学习能力,在接受了新信息后立即更新网络中的概率信息。在设备故障诊断应用中,将人机交互信息、与设备诊断相关的所有信息以适当的节点变量表示后,贝叶斯网络可以进行统一处理,即建造贝叶斯网络时变量的广义性可以将与设备故障诊断有关的所有信息来源纳入网络结构中,适合于表达更为复杂的、不确定性的问题。现在很多研究人员更倾向于把故障树和贝叶斯网络结合起来。
验证度量被定义为一个数学运算符,一般用于测量从仿真结果获得的模型预测与从实验得到的物理观测之间的差异。在度量模型之间的差异时,当模型预测的真实联合累积分布函数(CDF)由经验联合CDF近似时,需要大量的随机样本来构建模型的多元联合CDF以及需要大量时间用于分类,计算成本较高。且数据量少时,获得的联合CDF不能表示出模型的真实分布。Ferson等人提出了基于面积度量的方法来测量预测分布和观测分布之间的整体差异。作者通过引入马氏距离(MD),将在特定位置收集的多变量实验观察结果和模拟的多个模型响应分别通过MD转换为单变量数据序列。MD面积度量提供了模型的MD的CDF与实验观测的MD的经验CDF之间的比较。由于MD的单变量性质,所提出的度量方法适用于验证具有多个响应的模型。
本文提出一种基于MD面积度量的新的故障诊断方法。对于在某一设备监测的故障数据,采用MD面积度量方法对已知数据样本与观测数据样本的分布进行比较,首先利用MD方法将多变量数据转换为单变量数据,接着利用面积度量法比较单变量数据的累积分布函数之间的差异,面积值较小的则为设备故障的类别。
发明内容
本发明的目的是在有限的预算和时间内,发明一个更准确判别故障类型的方法,即采用MD面积度量方法对已知数据样本与观测数据样本的分布进行比较,基于该方法,可以分别得到各类别的MD的累积分布函数,从而使得故障类别更接近真实值,提高了诊断精度。本发明的具体技术方案包括以下几个步骤:
步骤一:明确故障设备,在特定监测点收集正常数据集与故障数据集,进行预处理。
步骤二:求解历史及新观测的正常数据与故障数据的MD,将多维数据样本转换为一维数据序列,求出各MD的累积分布函数,构建MD面积度量模型,根据分布曲线下面积的大小判断观测样本类别。
步骤三:实验设计,根据性能评价指标得出故障诊断的精度。
本发明的有益效果是:
本发明所提出的基于MD面积度量方法对已知数据样本与观测数据样本的分布进行比较,针对大型复杂系统仿真实验过程繁杂、人力物力消耗巨大的问题,提出简单易用的数学分析法,结合MD面积度量模型进行故障类型的判别,高效的提高故障诊断的准确度。
附图说明
图1是本发明方法的总体流程图。
具体实施方式
下面结合附图和相关算法,对本发明做进一步的说明。
本发明的总体流程如图1所示。
本发明基于在特定监测点收集正常数据集与故障数据集,采用归一化方法进行预处理,求解历史及新观测的正常数据与故障数据的MD,将多维数据样本转换为一维数据序列,接着求出各MD的累积分布函数,构建MD面积度量模型,根据分布曲线下面积的大小判断观测样本类别。具体实施步骤如下:
1.数据采集与归一化
数据归一化(标准化)处理是数据挖掘的一项基础工作,不同数据指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比应用。
min-max标准化(Min-Max Normalization)也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0 -1]之间。
本实验采用min-max标准化方法进行归一。min-max标准化具体过程如算法1所示:
算法1:数据归一化
%对故障训练集、故障测试集、正常训练集、正常测试集进行归一化
[m n]=size(guzhangTrain);
for i=1:n
guzhangTrain(:,i)=guzhangTrain(:,i)/norm(guzhangTrain(:,i));
guzhangTest(:,i)=guzhangTest(:,i)/norm(guzhangTest(:,i));
zhengchangTrain(:,i)=zhengchangTrain(:,i)/norm(zhengchangTrain(:,i));
zhengchangTest(:,i)=zhengchangTest(:,i)/norm(zhengchangTest(:,i));
end
2.马氏距离(MD)
马氏距离是一种有效的计算一个样本和一个样本集“重心”的最近距离,或者有效计算两个未知样本集的相似度的方法。它考虑到各种特性之间的联系,可以排除变量之间的相关性的干扰,并且马氏距离是尺度无关的,即独立于测量尺度。当∑是单位矩阵的时候,马氏距离即为欧氏距离。综上所述,马氏距离能够很方便的度量观测样本与已知样本集间的距离,因而很适合用在故障诊断中。
马氏距离(MD)具体过程如算法2所述。
算法2:马氏距离
%求出各自MD
D1=mahal(guzhangTrain,guzhangTrain);
D2=mahal(guzhangTest,guzhangTest);
D3=mahal(zhengchangTrain,zhengchangTrain);
D4=mahal(zhengchangTest,zhengchangTest);
%求出各MD的累积分布函数
[bd1,xd1]=hist(D1,1000);
numd1=numel(D1);
cd1=cumsum(bd1/numd1);
%求出各CDF之间的面积
f1=@(x11)3.716*exp(-23)*x11+0.908;
s1=integral(f1,min(x11),max(x11));
3.MD面积度量模型
MD面积度量用于度量观测数据与已知数据之间的差异。已知历史多变量数据样本,表示为(i=1,…,d),x是监测点可控输入的向量,d是变量的个数。观测数据由(i=1,…,d)表示。考虑到多个变量之间的不确定性和相关性,观测数据由具有均值向量μ和协方差矩阵∑的联合CDF表示。
MD面积度量过程如下:
(1)在流程图左侧,数据集是通过在特定监测点x处获得的历史数据样本,其中(j=1,…,k)是第j个数据集,k是数据集的大小。
(2)在流程图右侧,观测数据集是在相同监测点处获得的,其中 (h=1,…,n)是第h个监测数据,n是数据样本的大小。
(3)对观测数据样本集进行归一化,将归一化后的数据样本通过公式(4)转换为随机样本集。是从第h个监测数据到μ的随机MD样本,则基于来估计监测数据的MD的CDF
(4)对历史数据样本集进行归一化,将归一化后的数据样本通过公式(5)转换成一维数据序列。是从历史数据集的第j个MD到μ的MD,则历史数据的MD的经验CDF Se(r)基于来估计。
(5)根据度量算子比较两个分布曲线和Se(r)之间的面积差异。
4.故障诊断精度提高
本发明所提出的基于MD面积度量方法对已知数据样本与观测数据样本的分布进行比较,利用MD方法将多变量数据转换为单变量数据,利用面积度量法比较单变量数据的累积分布函数之间的差异,根据积分计算分布曲线之间的面积值大小判断观测样本类别,避免了求解多变量联合分布的复杂性以及不确定性,高效的提高了故障诊断的准确度。
Claims (4)
1.提高基于马氏距离(MD)面积度量的故障诊断正确率的方法,其特征包括如下步骤:
(1)明确故障设备,在特定监测点收集正常数据集与故障数据集,进行预处理。
(2)求解历史及新观测的正常数据与故障数据的MD,将多维数据样本转换为一维数据序列,求出各MD的累积分布函数,构建MD面积度量模型,根据定积分求解分布曲线下面积,比较面积大小判断观测样本类别。
(3)实验设计,根据性能评价指标得出故障诊断的精度。
2.根据权利要求1所述方法,其特征在于,步骤(1)针对故障设备的样本数据集预处理方法如下:
min-max标准化(Min-Max Normalization)也称为离差标准化,是对原始数据的线性变换,使结果值映射到[0-1]之间。转换函数如下:
其中max为样本数据的最大值,min为样本数据的最小值。
3.根据权利要求1所述的方法,其特征在于,步骤(2)利用MD面积度量模型,根据分布曲线下面积的大小判断观测样本类别。分为两个步骤,一是利用MD公式求解历史及新观测的正常数据与故障数据的MD,将多维数据样本转换为一维数据序列;二是求出各MD的累积分布函数,利用面积度量法比较单变量数据的累积分布函数之间的差异,根据定积分计算分布曲线之间的面积值,面积值较小的则为该样本故障的类别。MD及面积度量公式如下所示。
从y到均值向量μ的马氏距离(MD)为:
其中:
MD1的与MD2的之间的差异值为:
。
4.根据权利要求1所述方法,其特征在于,步骤(3)基于构建MD面积度量模型,根据评价指标得出故障诊断的精度。
应用MD面积度量模型,首先利用MD方法将归一化后的多变量数据转换为单变量数据,通过计算历史样本之间及观测样本之间的马氏距离,求解所有马氏距离的累积分布函数,利用面积度量法比较单变量数据的累积分布函数之间的差异,根据面积度量公式求出分布函数之间的面积差,面积值较小的则为设备故障的类别。
评价指标为真阳性,真阴性,假阳性,假阴性,正确率,并据此画出ROC曲线求出AUC。指标值越大,诊断结果越好。
(1)真阳性(True Positive)
也称为召回率,对应真阳性率(TPR),指的是按分类器分类标准正确判断正类为正类的样本数占该类实际样本总数的百分比。公式为:
TP/(TP+FN)
(2)假阳性(False Positive)
对应假阳性率(FPR),指的是按分类器分类标准把不是正类的样本判为正类的样本数占非该类样本总数的百分比。公式为:
FP/(TN+FP)
(3)真阴性(True Negative)
对应真阴性率(TNR),指的是按分类器分类标准将负类样本正确判为负类样本样本数占非该类样本总数的百分比。公式为:
TN/(TN+FP)
(4)假阴性(False Negative)
对应假阴性率(FNR),指的是按分类器分类标准将正类样本误判断为反类的样本数占该类实际样本总数的百分比。公式为:
FN/(TP+FN)
(5)正确率(PRE)
指的是预测为正例的样本中的真正正例,公式为:
TP/(TP+FP)
(6)ROC曲线下的面积(AUC)
顾名思义,AUC的值就是处于ROC曲线下方的那部分面积的大小。公式为:
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811413217.XA CN109492705A (zh) | 2018-11-20 | 2018-11-20 | 一种基于马氏距离(md)面积度量的故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811413217.XA CN109492705A (zh) | 2018-11-20 | 2018-11-20 | 一种基于马氏距离(md)面积度量的故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109492705A true CN109492705A (zh) | 2019-03-19 |
Family
ID=65696747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811413217.XA Pending CN109492705A (zh) | 2018-11-20 | 2018-11-20 | 一种基于马氏距离(md)面积度量的故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492705A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101458A (zh) * | 2020-09-16 | 2020-12-18 | 河海大学常州校区 | 一种基于田口函数-信噪比的特性度量方法和装置 |
CN115048985A (zh) * | 2022-05-17 | 2022-09-13 | 国网浙江省电力有限公司嘉兴供电公司 | 一种电气设备故障判别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427846A (zh) * | 2018-03-16 | 2018-08-21 | 厦门大学 | 一种基于概率盒框架的多响应模型确认度量方法 |
CN105550426B (zh) * | 2015-12-08 | 2018-08-28 | 东北大学 | 一种基于样本分割的多尺度二叉树高炉故障诊断方法 |
-
2018
- 2018-11-20 CN CN201811413217.XA patent/CN109492705A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105550426B (zh) * | 2015-12-08 | 2018-08-28 | 东北大学 | 一种基于样本分割的多尺度二叉树高炉故障诊断方法 |
CN108427846A (zh) * | 2018-03-16 | 2018-08-21 | 厦门大学 | 一种基于概率盒框架的多响应模型确认度量方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101458A (zh) * | 2020-09-16 | 2020-12-18 | 河海大学常州校区 | 一种基于田口函数-信噪比的特性度量方法和装置 |
CN112101458B (zh) * | 2020-09-16 | 2024-04-19 | 河海大学常州校区 | 一种基于田口函数-信噪比的特性度量方法和装置 |
CN115048985A (zh) * | 2022-05-17 | 2022-09-13 | 国网浙江省电力有限公司嘉兴供电公司 | 一种电气设备故障判别方法 |
CN115048985B (zh) * | 2022-05-17 | 2024-02-13 | 国网浙江省电力有限公司嘉兴供电公司 | 一种电气设备故障判别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103914064B (zh) | 基于多分类器和d-s证据融合的工业过程故障诊断方法 | |
CN106355030B (zh) | 一种基于层次分析法和加权投票决策融合的故障检测方法 | |
CN104712542B (zh) | 一种基于物联网的往复压缩机敏感特征提取与故障诊断方法 | |
CN109146246B (zh) | 一种基于自动编码器和贝叶斯网络的故障检测方法 | |
CN107273924B (zh) | 基于模糊聚类分析的多数据融合的电厂故障诊断方法 | |
Yu et al. | A new deep model based on the stacked autoencoder with intensified iterative learning style for industrial fault detection | |
Tian et al. | Identification of abnormal conditions in high-dimensional chemical process based on feature selection and deep learning | |
CN111899905B (zh) | 一种基于核动力装置的故障诊断方法及系统 | |
CN109389325B (zh) | 基于小波神经网络的变电站电子式互感器状态评估方法 | |
CN112904810B (zh) | 基于有效特征选择的流程工业非线性过程监测方法 | |
Li et al. | Ensemble learning with diversified base models for fault diagnosis in nuclear power plants | |
Zhou et al. | Trustworthy fault diagnosis with uncertainty estimation through evidential convolutional neural networks | |
Si et al. | Fault prediction model based on evidential reasoning approach | |
Adam et al. | Multiple faults diagnosis for an industrial robot fuse quality test bench using deep-learning | |
Chen et al. | A novel Bayesian-optimization-based adversarial TCN for RUL prediction of bearings | |
Jyoti et al. | Data clustering approach to industrial process monitoring, fault detection and isolation | |
CN116109039A (zh) | 一种数据驱动异常检测与预警系统 | |
CN109492705A (zh) | 一种基于马氏距离(md)面积度量的故障诊断方法 | |
Lei et al. | Fault diagnosis of rotating machinery based on a new hybrid clustering algorithm | |
CN117032165A (zh) | 一种工业设备故障诊断方法 | |
Chen et al. | Bayesian hierarchical graph neural networks with uncertainty feedback for trustworthy fault diagnosis of industrial processes | |
Li et al. | Knowledge enhanced ensemble method for remaining useful life prediction under variable working conditions | |
CN117312972A (zh) | 一种刮板输送机减速器健康状态识别方法 | |
CN117150337A (zh) | 基于分诊制的化工过程故障诊断方法 | |
Ding et al. | Deep Forest‐Based Fault Diagnosis Method for Chemical Process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190319 |