CN106326915A - 一种基于改进核Fisher的化工过程故障诊断方法 - Google Patents

一种基于改进核Fisher的化工过程故障诊断方法 Download PDF

Info

Publication number
CN106326915A
CN106326915A CN201610653460.3A CN201610653460A CN106326915A CN 106326915 A CN106326915 A CN 106326915A CN 201610653460 A CN201610653460 A CN 201610653460A CN 106326915 A CN106326915 A CN 106326915A
Authority
CN
China
Prior art keywords
sample
class
data
fault
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610653460.3A
Other languages
English (en)
Other versions
CN106326915B (zh
Inventor
徐发富
马立玲
王军政
沈伟
汪首坤
李静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201610653460.3A priority Critical patent/CN106326915B/zh
Publication of CN106326915A publication Critical patent/CN106326915A/zh
Application granted granted Critical
Publication of CN106326915B publication Critical patent/CN106326915B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种基于改进核Fisher的化工过程故障诊断方法如下:步骤1、采集原始的化工过程故障数据并进行归一化处理,将此数据分为训练集和测试集;步骤2、将训练集输入改进类间距的核Fisher方法中,输出阈值参数并用交叉验证法优化选取高斯径向基核函数的参数;步骤3、将步骤1输出的测试集输入改进类间距的核Fisher方法进行投影;步骤4、根据步骤2输出的阈值参数判断经步骤3投影后数据是否为边界点,并采用马氏距离结合改进后的K‑NN算法来判断故障类别。本发明所提方法改善了样本数据在投影空间的分布,并引入边界阈值参数,马氏距离与改进K‑NN算法的配合,在保证分类时间尽量短的情况下提高了总体样本的分类准确率。

Description

一种基于改进核Fisher的化工过程故障诊断方法
技术领域
本发明涉及一种化工过程的故障诊断方法,尤其涉及一种基于改进核Fisher的化工过程故障诊断方法,属于自动化检测技术领域。
背景技术
现代的化工过程具有大规模、高复杂性、多变量和在闭环控制下运行等特点。但是化工过程存在着许多不安全因素,比其他生产有着更大的危险性,如果化工过程的设备发生了一些小故障而不能及时排除,可能导致整个生产过程都不能正常的工作,会造成一定的人力和财力的损失。所以确保化工过程安全可靠的运行是很重要的,而进行故障诊断是最重要的一种手段。故障诊断技术通过监控生产过程的运行状态,检测状态信息,在故障发生后迅速定位故障源,隔离并消除故障。化工过程产生了大量数据,这些数据具有多变量、非线性、时变、强耦合和高噪声等特点。基于数据驱动的统计方法在化工过程得到了广泛的运用,目前常用的统计方法有:主元分析、最小二乘、独立元分析、Fisher判别分析等方法,然而这些方法有其局限性,都是基于线性变换的方法,但是对于复杂的化工过程,这些方法已经不能满足需要。将核方法引入Fisher判别分析中,很大程度上解决了原始数据呈非线性分布问题,引起了人们的重视。
但是运用核Fisher分析法进行故障诊断时,还是存在一些问题:1、对于故障样本在投影空间的投影数据,存在边界数据由于远离类中心且处于不同类的分界处,导致归类模糊误判的问题;2、在投影空间,有的样本类间距离存在很大差异性,导致类间距小的类别间出现投影数据混叠,互相掩盖的现象。针对以上问题,目前缺乏比较好的解决办法。
本发明提出的方法不仅适用于映射样本空间不同类别数据出现混叠的情况,而且适用于映射样本空间出现边界样本较多的情况,不仅能有效的兼顾测试样本的分类时间,而且能提高分类的准确率。
发明内容
本发明的目的是针对现有故障诊断方法存在的部分故障样本的映射空间仍然会出现混叠现象以及类别边界上数据归类模糊问题,提出了一种基于改进核Fisher的化工过程故障诊断方法。
为达到上述目的,本发明采用以下技术方案。
一种基于改进核Fisher的化工过程故障诊断方法,具体步骤如下:
步骤1、采集原始的化工过程故障数据,对此原始数据进行归一化处理,再将归一化处理后的原始数据分为两部分:训练集和测试集;
其中,所述的采集原始的化工过程故障数据,称为原始数据;
步骤2、将步骤1输出的训练集输入改进类间距的核Fisher方法中,输出阈值参数,并用交叉验证法优化选取高斯径向基核函数的参数,得到训练好的改进类间距的核Fisher方法;
所述的改进类间距的核Fisher方法具体步骤见实施例1;
所述的阈值参数记为ε,其详细定义见实施例1;
所述的交叉验证法见文献:2013年,范永东,题目为“模型选择中的交叉验证方法综述”;
步骤3、将步骤1输出的测试集输入改进类间距的核Fisher方法进行投影;
步骤4、根据步骤2输出的阈值参数判断经步骤3投影后的测试集中的数据是否为边界点,并决定采用马氏距离还是用改进后的K-NN算法来判断此测试集中数据的故障类别;
其中,测试集中的数据简称测试数据;步骤4具体如下:
4.1如果测试数据不是边界点,则采用马氏距离来判断该数据的故障类别;
4.2如果测试数据是边界点,则用改进后的K-NN算法来判别该数据的故障类别;
至此,经过步骤1到步骤4,完成了一种基于改进核Fisher的化工过程故障诊断方法。
有益效果
本发明所提出的一种基于改进核Fisher的化工过程故障诊断方法,与其他故障诊断方法相比,具有如下有益效果:
1.改进类间距的核Fisher方法能够改善样本数据在投影空间的分布,利于后续的故障类别分类;
2.在测试数据不是边界点时,采用马氏距离来进行分类,马氏距离可以排除不同变量间的相关性干扰,能计算样本与不同总体间的相似性,更适合用来判断故障类别;
3.本发明提出的方法改进了投影后故障样本的具体分类方法,通过引入边界阈值参数ε,有效的分离出了边界样本点,通过改进K-NN算法,大大提高了边界样本点的分类准确率;
4.通过马氏距离与改进K-NN算法的配合,在保证分类时间尽量短的情况下,使得总体样本的分类准确率得到了提高。
附图说明
图1为本发明一种基于改进核Fisher的化工过程故障诊断方法及实施例1的流程图;
图2为本发明一种基于改进核Fisher的化工过程故障诊断方法实施例2中三类故障的核Fisher特征向量分布图;
图3为本发明一种基于改进核Fisher的化工过程故障诊断方法实施例2中时间随阈值的变化;
图4为本发明一种基于改进核Fisher的化工过程故障诊断方法实施例3中核Fisher投影;
图5为本发明一种基于改进核Fisher的化工过程故障诊断方法实施例3中改进类间距的核Fisher投影。
具体实施方式
本发明提供了一种基于改进核Fisher的化工过程故障诊断方法,对于化工过程的故障诊断具有实际的借鉴意义。传统的故障诊断方法大多是基于线性变换的方法,但是针对化工过程故障诊断数据呈非线性分布,数据类别复杂的现象,这些传统的方法显然已经不能满足需要。而核Fisher方法很好的解决了数据的非线性分布问题,它首先利用核函数的映射将低维非线性问题转化为高维的线性问题,然后依据样本的不同特征,将测试数据投影到某个方向,使得测试数据的投影的类间离散度最大化并同时最小化类内离散度,从而达到分离故障样本的效果。
下面结合说明书附图及实施例,对本发明方法作进一步说明。
实施例1
本发明提出的一种基于改进核Fisher的化工过程故障诊断方法,更是在核Fisher方法的基础上,从类间离散度和边界数据的分类方法两方面进行改进,提高了故障诊断的准确率。图1是本发明一种基于改进核Fisher的化工过程故障诊断方法,其中也包含了本实施例中相应步骤的流程图。
从图1可以看出,本发明包括如下步骤:
步骤A、输入原始数据;
步骤B、归一化处理,并输出训练集和测试集;
步骤C、针对步骤B输出的不同类型数据,分别进行如下操作:
C.1对训练集中数据采用交叉验证法选取核参数,得到改进类间距的核Fisher方法;
C.2对测试集中数据直接输入改进类间距的核Fisher方法进行处理;
步骤D、根据投影后的测试数据是否为边界点,采用改进的K-NN算法配合马氏距离判别法来进行故障类别判断,最后输出测试集故障数据类别。
本实施例将本发明所提出的一种基于改进核Fisher的化工过程故障诊断方法的步骤进行细化,具体针对步骤2中改进类间距的核Fisher方法,以及步骤4中的具体故障判别方法进行深入阐述。
改进类间距的核Fisher方法基于核Fisher方法,核Fisher方法包含如下:
假设在p维空间的所有样本点有C类,即p维空间的所有样本点包含在C个集合中,这些集合记为G1,G2,…,GC,此C个集合中的样本总数为N;第j(j=1,2,...C)个类Gj包含Nj个样本记做且N1+N2+...NC=N;
样本x∈Rp,其中,Rp是p维空间,通过非线性高维映射φ后,即:φ(x)∈H,其中,H为高维特征空间;在H中,训练样本的类内离散度SW和类间的离散度SB分别通过公式(1)和公式(2)计算:
S W = 1 N Σ i = 1 C Σ j = 1 N i ( φ ( x i j ) - m i ) ( φ ( x i j ) - m i ) T - - - ( 1 )
S B = 1 N Σ i = 1 C N i ( m i - m ) ( m i - m ) T - - - ( 2 )
其中,训练样本为步骤1输出的训练集中的一个样本;上式(1)和(2)中,mi表示H中第i类训练集的均值:而m表示所有样本点在特征空间H中的均值:T代表转置。
计算公式(1)和公式(2)的展开式时,需要计算两个高维特征空间的向量内积,如mi.m,而所有这些向量内积计算麻烦,因此引入核函数来计算:
在默认参数的情况下,RBF核函数(高斯核函数)具有较好的分类能力;采用RBF核函数计算公式(1)和公式(2)中的内积:
k ( x , z ) = exp ( - | | x - z | | 2 δ 2 ) - - - ( 3 )
式(3)中,参数δ为正常数,代表高斯宽度;k(x,z)表示H空间的任意向量x和z的内积。本发明采用交叉验证法选取参数δ。
上述核Fisher方法在计算类间离散度存在如下问题:
类间差异的权重(对应公式(2)中的Ni参数,)仅仅是依据不同类别样本数在总体样本中所占比例计算,但是在实际情况中,会出现有部分类距离其他类别很远,但是有些类别的间距很小,容易出现类间差异较小的类信息被差异较大的类信息覆盖的情况,导致故障分类效果不佳。
本发明步骤2中采用改进类间距的核Fisher方法,具体如下:
通过公式(4)计算类间离散度;
S B = 1 N 2 Σ i = 1 C - 1 Σ j = i + 1 C N i N j W ( d i j ) ( m i - m j ) ( m i - m j ) T - - - ( 4 )
其中,dij表示第i类和第j类的类间距离,其中,权重为类间距离dij的一个函数:W(dij)=dij -q(q∈N,q≥3),其中,权重记为W(dij),q的取值范围为3至10之间。dij通过公式(5)计算:
d i j = | | m i - m j | | = ( Σ x i 1 ∈ C i φ ( x i 1 ) N i - Σ x j 1 ∈ C j φ ( x j 1 ) N j ) T ( Σ x i 2 ∈ C i φ ( x i 2 ) N i - Σ x j 2 ∈ C j φ ( x j 2 ) N j ) = Σ x i 1 , x i 2 ∈ C i k i 1 , i 2 N i 2 + Σ x j 1 , x j 2 ∈ C j k j 1 , j 2 N j 2 - 2 Σ x i 1 ∈ C i , x j 1 ∈ C j k i 1 , j 1 N i N j - - - ( 5 )
其中,
步骤4中根据阈值参数判断步骤3投影后的测试集中的数据是否为边界点,并决定采用马氏距离还是用改进后的K-NN算法来判断该数据的故障类别,即:将马氏距离与改进后的K-NN算法相结合,具体为:
待判样本投影点:经步骤3投影后的测试集中的数据样本点。
求出待判样本投影点距离每个类别的欧式距离dis1,dis1,...,disC,按照距离由小到大排序为dis1',dis2',...,disC',边界判别标准如下:
| dis 1 &prime; - dis 2 &prime; dis 1 &prime; | < &epsiv; - - - ( 6 )
其中,ε为阈值参数,其取值范围为(0,1)间的小数;判断(6)式是否成立,若成立,表明待判样本投影点属于边界点,采用改进后的K-NN算法对测试集中的数据进行故障分类;否则,采用马氏距离进行故障分类;
其中,所述的采用马氏距离对测试集中的数据进行故障分类,具体为:
将任意一个原始故障数据样本x=[x1,x2,...,xp]T经过核Fisher判别投影后得到投影向量y=[y1,y2,...,yr]T(r≤p),同样第i类组均值经过投影后得到投影向量再采用马氏距离来判别故障类别如下:
则x∈Gi,即样本属于第i类故障。其中Σi为第i类样本投影后的协方差矩阵;
其中,所述的采用改进后的K-NN算法对测试集中的数据进行故障分类,具体为:
求出距离待判样本投影点最近的K个样本点z1,z2,...,zK到待判样本投影点的距离dis1,dis1,...,disK.设函数表示和待判样本投影点距离小的邻近点权值大,记这K个样本点属于g个类别Gr1,Gr2,...,Grg。则判别准则如下:
则该待判测试集数据点属于Grj类。
实施例2
为检验本发明所提出的故障诊断方法及实施例1中细化的步骤的有效性,本实施例利用田纳西-伊斯曼(TE)过程来验证本发明及实施例1的正确性。TE过程作为各种统计数据分析算法的数据源,得到了广泛的认可与运用。TE过程包括五个主要过程单元:反应器、冷凝器、压缩机、分离器、汽提塔,以及12个控制变量,41个观测变量和20个类型的典型故障。关于TE过程的详细介绍见文献:2010年,王婷,题目为“面向TE过程的实时优化技术研究”。
本实施例选取故障4、9、11来进行相关实验验证,且选取53个特征变量中的特征变量{51,9}来构成每一个故障样本。针对每一类故障类型,各自选用两组数据:训练集和测试集,各自包含400个样本。即训练集共400×3个样本,测试集共400×3个样本。
故障4、故障9、故障11的原始观测数据复杂,各类别之间具有很强的非线性,详细观测数据分布图见参考文献:《化工学报》2009年9期,题目为“基于二阶互信息特征选取的TE过程故障诊断”。
采用传统的核Fisher对训练集进行投影,投影效果如图2(为方便观看,每类故障仅画了100个样本的投影情况)所示。图2中,横坐标是第一特征轴,纵坐标是第二特征轴;圆圈代表故障4,正方形代表故障9,五角星代表故障11。由图2可以看出,三类故障数据的投影间距较均匀,没有出现混叠现象,主要是投影的边界点存在归类困难问题。
针对采集到的训练集和测试集各1200个样本,采用本发明提出的方法进行故障诊断。经过交叉验证法选取核参数δ的平方取0.08,q取3。表1显示的是随着边界判断阈值ε的变化,训练集和测试集的故障诊断准确率的变化。
表1不同阈值ε的故障诊断结果
通过表1可以知道,当阈值0.1≤ε≤0.6时,随着ε的增大,训练样本的准确率和测试样本的准确率均有明显增大。但是当ε超过0.6以后,测试样本的准确率不在上升,说明对于ε>0.6的投影数据,用改进的K-NN方法并不能有效提高故障诊断正确率,但是反而会增加诊断时间,如图3所示。图3中,横坐标代表阈值,纵坐标代表时间。
从图3可以看出,随着阈值ε的增大,刚开始的时候时间增长的很快,后来时间增长的速度越来越慢,直至不变。越来越多的测试样本投影后采用改进的K-NN算法来归类,花费的时间越来越长,ε=0.6时,仅需要0.21s,而当ε=140时,即几乎所有的测试样本投影后都用改进的K-NN算法归类时,需要将近3s。最重要的是,当ε≥0.6后,测试精度基本不在增大。通过以上分析可知,当ε取0.6时,在保证分类精度达到最大的同时,保证测试时间最短。
实施例3
TE过程故障诊断,共有21种故障类型,这21个故障都是预先设定的,其中前7类故障类型均为阶跃的,选取其中的第3、4、5、7类故障作为研究对象。每一种故障类型,取两组数据,即训练数据和测试数据,每组数据各100个样本,每个样本由所有52个特征变量组成。训练集和测试集各包含400个样本。
对训练集样本采用核Fisher投影,得到的在第一、二特征轴上的投影图如图4所示,核参数δ取200。图4中,横坐标是第一特征轴,纵坐标是第二特征轴;圆圈代表故障3,五角星代表故障4,三角形代表故障5,正方形代表故障7。同样的对训练集样本采用改进类间距的核Fisher投影,得到的投影图如图5所示,核参数δ取100,权重函数参数q取3。同样的,图5中,横坐标是第一特征轴,纵坐标是第二特征轴;圆圈代表故障3,五角星代表故障4,三角形代表故障5,正方形代表故障7。
通过图4可以看出,通过核Fisher投影,得到的故障3和5的投影信息互相掩盖,互相重叠,难以凸显二者的类间差异,不利于后续的分类。而在图5中,通过采用改进的类间距核Fisher投影,可以将故障3、5区分开来,增大两者间的类间距。
采用改进的类间距核Fisher投影(不同的q值)、核Fisher投影,使用马氏距离结合改进K-NN算法对样本进行分类,得到的故障诊断结果如表2所示。
表2不同方法的故障诊断结果
由表2可以看出,改进的类间距核Fisher投影分类方法明显比核Fisher投影分类方法要好,前者的训练样本和测试样本的诊断精度可以高达100%和99%,后者的诊断精度分别为95.25%和92.25%。
通过对比上述两个实施例可以发现,本发明提出的方法因为引入了改进的类间离散度计算方法,对于故障样本3、4、5、7,投影后类间距离呈现很大差异性的样本,很好的改进了样本在投影空间的分布,更有利于故障的分类,分类效果也较好。对于故障样本4、9、11,马氏距离结合改进的K-NN算法能够在兼顾诊断时间的同时,很好的提高了边界样本的故障诊断正确率。实施例1、2、3有效的证明了本发明的有效性和正确性。
以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。

Claims (6)

1.一种基于改进核Fisher的化工过程故障诊断方法,其特征在于:
具体步骤如下:
步骤1、采集原始的化工过程故障数据,对此原始数据进行归一化处理,再将归一化处理后的原始数据分为两部分:训练集和测试集;
步骤2、将步骤1输出的训练集输入改进类间距的核Fisher方法中,输出阈值参数,并用交叉验证法优化选取高斯径向基核函数的参数;
步骤3、将步骤1输出的测试集输入改进类间距的核Fisher方法进行投影;
步骤4、根据步骤2输出的阈值参数判断经步骤3投影后的测试集中的数据是否为边界点,并决定采用马氏距离还是用改进后的K-NN算法来判断此测试集中数据的故障类别,具体为:
4.1如果测试数据不是边界点,则采用马氏距离来判断该数据的故障类别;
4.2如果测试数据是边界点,则用改进后的K-NN算法来判别该数据的故障类别;
至此,经过步骤1到步骤4,完成了一种基于改进核Fisher的化工过程故障诊断方法。
2.如权利要求1所述的一种基于改进核Fisher的化工过程故障诊断方法,其特征还在于:
步骤1中,所述的采集原始的化工过程故障数据,称为原始数据。
3.如权利要求1所述的一种基于改进核Fisher的化工过程故障诊断方法,其特征还在于:
步骤2中所述的阈值参数记为ε,所述的改进类间距的核Fisher方法基于核Fisher方法,核Fisher方法如下:
步骤I、构造核Fisher方法并计算类内离散度和类间离散度;
假设在p维空间的所有样本点有C类,即p维空间的所有样本点包含在C个集合中,这些集合记为G1,G2,…,GC,此C个集合中的样本总数为N;第j(j=1,2,...C)个类Gj包含Nj个样本记做且N1+N2+...NC=N;
样本x∈Rp,其中,Rp是p维空间,通过非线性高维映射φ后,即:φ(x)∈H,其中,H为高维特征空间;在H中,训练样本的类内离散度SW和类间的离散度SB分别通过公式(1)和公式(2)计算:
S W = 1 N &Sigma; i = 1 C &Sigma; j = 1 N i ( &phi; ( x i j ) - m i ) ( &phi; ( x i j ) - m i ) T - - - ( 1 )
S B = 1 N &Sigma; i = 1 C N i ( m i - m ) ( m i - m ) T - - - ( 2 )
其中,训练样本为步骤1输出的训练集中的一个样本;上式(1)和(2)中,mi表示H中第i类训练集的均值:而m表示所有样本点在特征空间H中的均值:T代表转置;
计算公式(1)和公式(2)的展开式时,需要计算两个高维特征空间的向量内积,如mi.m,而所有这些向量内积计算麻烦,因此引入核函数来计算:
在默认参数的情况下,RBF核函数(高斯核函数)具有较好的分类能力;采用RBF核函数计算公式(1)和公式(2)中的内积:
k ( x , z ) = exp ( - | | x - z | | 2 &delta; 2 ) - - - ( 3 )
式(3)中,参数δ为正常数,代表高斯宽度;k(x,z)表示H空间的任意向量x和z的内积,本发明采用交叉验证法选取参数δ;
上述核Fisher方法在计算类间离散度存在如下问题:
类间差异的权重(对应公式(2)中的Ni参数,)仅仅是依据不同类别样本数在总体样本中所占比例计算,但是在实际情况中,会出现有部分类距离其他类别很远,但是有些类别的间距很小,容易出现类间差异较小的类信息被差异较大的类信息覆盖的情况,导致故障分类效果不佳;
步骤2中的改进类间距的核Fisher方法,具体如下:
通过公式(4)计算类间离散度;
S B = 1 N 2 &Sigma; i = 1 C - 1 &Sigma; j = i + 1 C N i N j W ( d i j ) ( m i - m j ) ( m i - m j ) T - - - ( 4 )
其中,dij表示第i类和第j类的类间距离,其中,权重为类间距离dij的一个函数:W(dij)=dij -q(q∈N,q≥3);
其中,权重记为W(dij),q的取值范围为3至10之间;dij通过公式(5)计算:
d i j = | | m i - m j | | = ( &Sigma; x i 1 &Element; C i &phi; ( x i 1 ) N i - &Sigma; x j 1 &Element; C j &phi; ( x j 1 ) N j ) T ( &Sigma; x i 2 &Element; C i &phi; ( x i 2 ) N i - &Sigma; x j 2 &Element; C j &phi; ( x j 2 ) N j ) = &Sigma; x i 1 , x i 2 &Element; C i k i 1 , i 2 N i 2 + &Sigma; x j 1 , x j 2 &Element; C j k j 1 , j 2 N j 2 - 2 &Sigma; x i 1 &Element; C i , x j 1 &Element; C i k i 1 , j 1 N i N j - - - ( 5 )
其中,
4.如权利要求1所述的一种基于改进核Fisher的化工过程故障诊断方法,其特征还在于:
步骤2中所述的交叉验证法见文献:2013年,范永东,题目为“模型选择中的交叉验证方法综述”。
5.如权利要求1所述的一种基于改进核Fisher的化工过程故障诊断方法,其特征还在于:
4.1中如果测试数据不是边界点采用马氏距离来判断该数据的故障类别,即将任意一个原始故障数据样本x=[x1,x2,...,xp]T,即待判别样本,经过核Fisher判别投影后得到投影向量y=[y1,y2,...,yr]T(r≤p),同样第i类组均值经过投影后得到投影向量再采用马氏距离来判别故障类别,具体如下:
则x∈Gi,即样本属于第i类故障;其中,Σi为第i类样本投影后的协方差矩阵。
6.如权利要求1所述的一种基于改进核Fisher的化工过程故障诊断方法,其特征还在于:
4.2中如果测试数据是边界点,则用改进后的K-NN算法来判别该数据的故障类别,具体为:
求出待判样本经过步骤3投影后的点(即待判样本投影点)距离每个类别的欧式距离dis1,dis1,...,disC,按照距离由小到大排序为dis1',dis2',...,disC',边界判别标准如下:
| dis 1 &prime; - dis 2 &prime; dis 1 &prime; | < &epsiv; - - - ( 6 )
式中,阈值参数ε是一个(0,1)间的小数;当满足(6)式时,认为待判样本投影点属于边界点;
若待判样本投影点不满足(6)式,则采用4.1中的马氏距离来判别;
若待判样本投影点确定为边界点,则采用改进的K-NN算法来分类,具体为:
求出距离待判样本投影点最近的K个样本点z1,z2,...,zK到待判样本投影点的距离dis1,dis1,...,disK.设函数表示和待判样本投影点距离小的邻近点权值大。记这K个样本点属于g个类别Gr1,Gr2,...,Grg;则判别准则如下:
则该待判点属于Grj类。
CN201610653460.3A 2016-08-10 2016-08-10 一种基于改进核Fisher的化工过程故障诊断方法 Active CN106326915B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610653460.3A CN106326915B (zh) 2016-08-10 2016-08-10 一种基于改进核Fisher的化工过程故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610653460.3A CN106326915B (zh) 2016-08-10 2016-08-10 一种基于改进核Fisher的化工过程故障诊断方法

Publications (2)

Publication Number Publication Date
CN106326915A true CN106326915A (zh) 2017-01-11
CN106326915B CN106326915B (zh) 2019-08-02

Family

ID=57739973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610653460.3A Active CN106326915B (zh) 2016-08-10 2016-08-10 一种基于改进核Fisher的化工过程故障诊断方法

Country Status (1)

Country Link
CN (1) CN106326915B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537414A (zh) * 2018-03-19 2018-09-14 杭州拓深科技有限公司 一种基于lda算法的故障电弧检测方法
CN109427050A (zh) * 2017-08-23 2019-03-05 阿里巴巴集团控股有限公司 导轮质量检测方法及设备
CN111638427A (zh) * 2020-06-03 2020-09-08 西南交通大学 一种基于核胶囊神经元覆盖的变压器故障检测方法
CN113657556A (zh) * 2021-09-23 2021-11-16 华北电力大学 基于多元统计分析的燃气轮机进口导叶系统故障诊断方法
CN114968647A (zh) * 2022-08-02 2022-08-30 中海油能源发展股份有限公司采油服务分公司 基于闪蒸汽压缩机组故障诊断的监测数据深度挖掘方法
CN115268417A (zh) * 2022-09-29 2022-11-01 南通艾美瑞智能制造有限公司 一种自适应ecu故障诊断控制方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101750210A (zh) * 2009-12-24 2010-06-23 重庆大学 基于正交局部保持映射(olpp)特征约简的故障诊断方法
CN106096649A (zh) * 2016-06-08 2016-11-09 北京科技大学 基于核线性判别分析的味觉感应信号差异性特征提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101750210A (zh) * 2009-12-24 2010-06-23 重庆大学 基于正交局部保持映射(olpp)特征约简的故障诊断方法
CN106096649A (zh) * 2016-06-08 2016-11-09 北京科技大学 基于核线性判别分析的味觉感应信号差异性特征提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GHISLAIN VERDIER,ET AL.: "Adaptive Mahalanobis Distance and k-Nearest Neighbor Rule for Fault Detection in Semiconductor Manufacturing", 《IEEE TRANSACTIONS ON SEMICONDUCTOR MANUFACTURING》 *
ZHENGWEI LI,ET AL.: "Fault Diagnosis Based on Improved Kernel Fisher Discriminant Analysis", 《JOURNAL OF SOFTWARE》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109427050A (zh) * 2017-08-23 2019-03-05 阿里巴巴集团控股有限公司 导轮质量检测方法及设备
CN108537414A (zh) * 2018-03-19 2018-09-14 杭州拓深科技有限公司 一种基于lda算法的故障电弧检测方法
CN111638427A (zh) * 2020-06-03 2020-09-08 西南交通大学 一种基于核胶囊神经元覆盖的变压器故障检测方法
CN111638427B (zh) * 2020-06-03 2021-05-28 西南交通大学 一种基于核胶囊神经元覆盖的变压器故障检测方法
CN113657556A (zh) * 2021-09-23 2021-11-16 华北电力大学 基于多元统计分析的燃气轮机进口导叶系统故障诊断方法
CN113657556B (zh) * 2021-09-23 2023-12-26 华北电力大学 基于多元统计分析的燃气轮机进口导叶系统故障诊断方法
CN114968647A (zh) * 2022-08-02 2022-08-30 中海油能源发展股份有限公司采油服务分公司 基于闪蒸汽压缩机组故障诊断的监测数据深度挖掘方法
CN115268417A (zh) * 2022-09-29 2022-11-01 南通艾美瑞智能制造有限公司 一种自适应ecu故障诊断控制方法
CN115268417B (zh) * 2022-09-29 2022-12-16 南通艾美瑞智能制造有限公司 一种自适应ecu故障诊断控制方法

Also Published As

Publication number Publication date
CN106326915B (zh) 2019-08-02

Similar Documents

Publication Publication Date Title
CN106326915A (zh) 一种基于改进核Fisher的化工过程故障诊断方法
CN106355030B (zh) 一种基于层次分析法和加权投票决策融合的故障检测方法
CN106371427B (zh) 基于层次分析法和模糊融合的工业过程故障分类方法
CN110008584B (zh) 一种基于GitHub的半监督异构软件缺陷预测方法
US6466929B1 (en) System for discovering implicit relationships in data and a method of using the same
Wahono et al. A comparison framework of classification models for software defect prediction
CN102291392B (zh) 一种基于Bagging算法的复合式入侵检测方法
CN113962259B (zh) 一种燃料电池系统多模式双层故障诊断方法
CN107436597A (zh) 一种基于稀疏过滤和逻辑回归的化工过程故障检测方法
CN103632168A (zh) 一种机器学习中的分类器集成方法
CN106709349B (zh) 一种基于多维度行为特征的恶意代码分类方法
CN113516228B (zh) 一种基于深度神经网络的网络异常检测方法
CN112990286A (zh) 一种数据不平衡场景下的恶意流量检测方法
CN111338950A (zh) 一种基于谱聚类的软件缺陷特征选择方法
CN114707571B (zh) 基于增强隔离森林的信用数据异常检测方法
CN110794360A (zh) 一种基于机器学习预测智能电能表故障的方法及系统
CN101738998A (zh) 一种基于局部判别分析的工业过程监测系统及方法
CN111539451A (zh) 样本数据优化方法、装置、设备及存储介质
CN115112372A (zh) 轴承故障诊断方法、装置、电子设备及存储介质
CN117056834A (zh) 基于决策树的大数据分析方法
CN114611604A (zh) 一种基于电驱总成载荷特征融合与聚类的用户筛选方法
CN113064976A (zh) 基于深度学习算法的事故车判定方法
CN112748331A (zh) 一种基于ds证据融合的断路器机械故障识别方法及装置
CN106991171A (zh) 基于智慧校园信息服务平台的话题发现方法
CN111340196A (zh) 对抗网络数据生成方法以及异常事件检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant