CN102339389B - 一种基于密度的参数优化单分类支持向量机故障检测方法 - Google Patents

一种基于密度的参数优化单分类支持向量机故障检测方法 Download PDF

Info

Publication number
CN102339389B
CN102339389B CN 201110271842 CN201110271842A CN102339389B CN 102339389 B CN102339389 B CN 102339389B CN 201110271842 CN201110271842 CN 201110271842 CN 201110271842 A CN201110271842 A CN 201110271842A CN 102339389 B CN102339389 B CN 102339389B
Authority
CN
China
Prior art keywords
sample
module
value
expression
normal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110271842
Other languages
English (en)
Other versions
CN102339389A (zh
Inventor
姚马
王焕钢
张琳
徐文立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN 201110271842 priority Critical patent/CN102339389B/zh
Priority to PCT/CN2011/082850 priority patent/WO2013037169A1/zh
Publication of CN102339389A publication Critical patent/CN102339389A/zh
Application granted granted Critical
Publication of CN102339389B publication Critical patent/CN102339389B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks

Abstract

本发明涉及一种基于密度的参数优化单分类支持向量机故障检测方法,其包括以下步骤:1)设置一包括数据采集设备、置信水平设置模块和监控计算机的故障检测设备;2)通过数据采集设备采集生产过程中产生的正常数据,输入监控计算机,归一化预处理得到总样本集Q;3)设定置信水平值α;4)将总样本集Q和置信水平值α输入到优化故障检测器生成模块中,寻优得到优化故障检测器的模型;5)优化故障检测器应用模块存储优化故障检测器的模型;6)工业生产过程中,通过数据采集设备将采集到的数据输入监控计算机,归一化处理后,输入优化故障检测器应用模块,通过优化故障检测器应用模块中存储的优化故障检测器,实时输出故障检测结果。本发明可广泛用于工业生产线运行状态的故障检测中。

Description

一种基于密度的参数优化单分类支持向量机故障检测方法
技术领域
本发明涉及一种基于数据驱动的生产过程故障检测方法,特别是关于一种基于密度的参数优化单分类支持向量机(One-class Support Vector Machine,OCSVM)故障检测方法。
背景技术
工业生产的自动化过程需要对工业生产过程的设备运行状态通过各种传感器进行实时的检测,并根据检测到的数据分析生产过程是否处于异常运行状态,通常将这种利用传感器检测数据分析生产过程异常的方法称为基于数据驱动的生产过程故障检测方法。当检测数据之间具有较强的线性关系,且满足高斯分布时,可以采用PCA(Principal Component Analysis,主成分分析)辅助以SPE(SquaredPrediction Error,平方预测误差)和霍特林T2统计量进行生产过程的故障检测。这方面已经有大量的文献报道和发明专利,并且已经开始应用到生产过程当中,并取得了一定的实际应用效果。
但是很多生产过程的检测数据之间具有较强的非线性特性,而且数据分布特点也不满足高斯分布。在这种情况下,基于PCA的故障检测方法就不能满足实际应用的要求。对此,一些用于解决非线性的数据驱动故障检测方法被逐渐提出,例如ICA(Independent Component Analysis,独立成分分析)、K-近邻(K-nearestneighbour,K-NN)等方法。其中OCSVM(One-class Support Vector Machine,单分类支持向量机)的故障检测方法是一种最新发展起来且行之有效的故障检测方法。与其他非线性方法相比,OCSVM方法的最大特点是通过构造分类面将正常数据集包围起来,并判断新检测到的数据是否位于该分类面外,若新数据位于分类面外,则说明该数据是异常数据,生产过程处于异常运行状态,由此达到故障检测的目的。而分类面的构成只和数据集中支持向量的部分有关,又支持向量的个数通常远远小于数据集的个数,因此该方法可以大大降低数据处理的复杂度。
在基于OCSVM的故障检测方法具体应用过程中,有两个对故障检测性能起到至关重要的参数需要确定。其中一个参数是控制参数,记为v——在引入允许分类面外的数据点被判为正常数据的松弛变量后,需要对松弛变量带来的错误进行惩罚,控制参数v用于控制对错分样本惩罚的程度:v越小,对错分样本的惩罚程度越高;反之,v越大,对错分样本的惩罚程度越低。另外一个参数是高斯核函数的宽度参数,该参数反映了高斯核函数的图形形状:该参数值越小,高斯核函数的图形越窄,衰减越快;反之,该参数值越大,高斯核函数的图形越宽,衰减越慢。高斯核函数在使用中有多种形式,应用较为普遍的形式是K(xi,xj)=exp(-||xi-xj||22),该形式中的参数σ即为宽度参数,以下均以符号σ表示宽度参数。
当数据的维数(即传感器的个数)较低时,技术人员可以通过图形观测判断参数选择是否合适。但是,当数据的维数增加时,技术人员无法绘制高维图形以判断参数选择是否合适,这种情形在实际生产过程中普遍存在,因为实际应用中传感器的数量通常都很大。为此,有学者引入ROC曲线(Receiver OperatingCharacteristics curve,接受者操作特征曲线),并以AUC值(Area under an ROCcurve,ROC曲线下的面积值)作为判断参数选择是否合适的指标。ROC曲线是以FPR(False Positive Rate,异常样本被判为正常的比率)作为横坐标、以TPR(True Positive Rate,正常样本被判为正常的比率)作为纵坐标绘制出的二维图形。一个固定的分类器产生一个(FPR,TPR)数据对,对应ROC空间上的一个点。AUC性能指标综合考虑了TPR和FPR这两项数据,从而能够合理地评价分类器的运行效果。AUC值越大,保证了分类结果能够同时获得较大的TPR值和较小的FPR值。而AUC的计算过程并不随着数据维数的增加而有太大的变化。
但是,使用AUC作为评价指标时,需要一定数量的异常样本才能绘制出具有实际使用价值的ROC曲线和相应的AUC值。而工业生产过程中采集到的绝大部分数据是正常样本,因此很难得到足够数量的异常样本,或者得到的异常样本并不能反映全部的异常情况。所以,如何只根据正常样本或者根据含有极少量异常样本的数据集进行故障检测是上述数据处理过程中遇到的关键问题。
发明内容
针对上述问题,本发明的目的是提供一种基于密度的参数优化单分类支持向量机故障检测方法,该方法只需要正常样本集,应用范围广,寻优过程简单,故障检测性能好,得到的分类面能够很好地反映样本集的结构特性、推广能力强。
为实现上述目的,本发明采取以下技术方案:一种基于密度的参数优化单分类支持向量机故障检测方法,其包括以下步骤:1)设置一包括数据采集设备、置信水平设置模块和监控计算机的故障检测设备;所述监控计算机内预设置有一数据预处理模块、一优化故障检测器生成模块和一优化故障检测器应用模块;2)数据采集设备采集工业生产线中各监测传感器产生的正常数据,并传输给监控计算机的数据预处理模块,数据预处理模块进行归一化预处理后得到总样本集Q={x1,x2,...,xN};其中,N表示数据采集设备对各个监测传感器进行N次数据采集;xi=(xi,1,xi,2,...,xi,m)T∈Rm,表示对m个监测传感器进行第i次数据采集,并经过归一化处理后得到的样本,m表示监测传感器的个数,Rm表示m维列向量;i=1,2,...,N;xi,j表示在样本xi中,对第j个传感器在第i次数据采集并经过归一化处理后得到的单个样本数据值,j=1,2,...,m;3)在置信水平设置模块中,对生产过程中采集到的正常数据的真实程度进行评估,设定置信水平值α;4)将上述步骤2)中的总样本集Q和步骤3)中设定的置信水平值α输入到优化故障检测器生成模块中,寻优得到优化故障检测器的模型:
f ( x ) = sgn ( Σ i = 1 N T α i * K ( x , x ~ i ) - ρ - C _ Limits )
其中,当f(x)=1时,表示待测样本x为正常样本,f(x)=-1时,表示待测样本x为异常样本;sgn(·)是符号函数且满足 sgn ( x ) = 1 x &GreaterEqual; 0 - 1 x < 0 ; NT表示训练集的样本总数;表示训练集样本;
Figure BDA00000910410200034
表示拉格朗日乘子的最优解;
Figure BDA00000910410200035
表示高斯核函数;ρ表示分类面的偏移量;C_Limits表示控制限;5)优化故障检测器应用模块存储步骤4)得到的优化故障检测器的模型;6)工业生产过程中,实时通过数据采集设备采集各监测传感器输出的数据,并通过监控计算机中的数据预处理模块归一化处理后,输入优化故障检测器应用模块中,通过优化故障检测器应用模块中存储的优化故障检测器,实时输出故障检测结果。
所述步骤4)中,寻优得到优化故障检测器模型的关键是通过优化过程得到控制参数v和宽度参数σ的最优值,最终得到优化故障检测器模型,其步骤如下:①在所述优化故障检测器生成模块中预置以下子模块:样本密度估计模块、虚拟异常样本生成模块、训练集生成模块、测试集生成模块、OCSVM(One-class SupportVector Machine,单分类支持向量机)训练模块、ROC(Receiver OperatingCharacteristics curve,接受者操作特征曲线)性能计算模块、控制参数设置模块、宽度参数优化模块、终止条件判定模块、初始分类器生成模块、控制限生成模块以及优化分类器合成模块;②将步骤2)中,数据预处理模块归一化预处理后得到的总样本集Q输入样本密度估计模块,通过样本密度估计模块得到各个样本的估计样本密度值,并输入给虚拟异常样本生成模块,虚拟异常样本生成模块根据各个样本的估计样本密度值生成虚拟异常样本集
Figure BDA00000910410200041
同时得到正常样本集
Figure BDA00000910410200042
其中,β为指定的密度限值,即选取前
Figure BDA00000910410200043
个估计样本密度值最小的样本点作为异常样本点;
Figure BDA00000910410200044
表示取整运算;③训练集生成模块从虚拟异常样本生成模块中得到正常样本集
Figure BDA00000910410200045
并从正常样本集中随机选取部分正常样本构成训练集
Figure BDA00000910410200046
NT表示训练集的样本总数;④测试集生成模块从虚拟异常样本生成模块中得到正常样本集
Figure BDA00000910410200047
和虚拟异常样本集
Figure BDA00000910410200048
并将正常样本集和虚拟异常样本集组合得到测试集T:
Figure BDA00000910410200049
其中,yi为样本类别标签,yi=-1表示虚拟异常样本,yi=1表示正常样本,且
⑤将步骤③中训练集生成模块得到的训练集
Figure BDA000009104102000411
以及控制参数设置模块中设置的控制参数v、当前宽度参数优化模块中设置的宽度参数σ输入到OCSVM训练模块中,OCSVM训练模块通过求解如下的优化问题:
min &alpha; 1 2 &Sigma; i = 1 N T &Sigma; j = 1 N T &alpha; i &alpha; j K ( x ~ i , x ~ j )
s . t . 0 &le; &alpha; i &le; 1 v N T , i = 1 , . . . , N T - - - ( 1 )
&Sigma; i = 1 N T &alpha; i = 1
得到寻优向量
Figure BDA000009104102000415
的最优解,记为
Figure BDA000009104102000416
从而得到分类面,分类面表达式为:
&Sigma; i = 1 N T &alpha; i * K ( x , x ~ i ) - &rho; = 0 - - - ( 2 )
其中:式(1)中的为拉格朗日乘子,且为优化问题的寻优向量;
Figure BDA00000910410200053
为训练集样本;
Figure BDA00000910410200054
为高斯核函数,NT为训练集的样本总数;式(2)中x为变量;满足
Figure BDA00000910410200055
的样本
Figure BDA00000910410200056
称为支持向量;ρ由式(3)给出,其中,
Figure BDA00000910410200057
对应的
Figure BDA00000910410200058
满足
Figure BDA00000910410200059
&rho; = &Sigma; i = 1 N T &alpha; i * K ( x ~ k , x ~ i ) - - - ( 3 )
⑥将步骤⑤得到的分类面和步骤④测试集生成模块得到的测试集T输入ROC性能计算模块,计算AUC(Area under an ROC curve,ROC曲线下的面积值)值,记为A;⑦将上述步骤⑥得到的最终AUC值A输入到终止条件判定模块中,比较当前AUC值A和当前终止条件判定模块中的AUC最优值A*,根据智能优化算法选择二者中的较大值存储为A*,相应的宽度参数值记为σ*;其中,初始状态下,终止条件判定模块中的AUC最优值A*为0,相应的宽度参数σ*也为0;终止条件判定模块判断当前状态是否满足终止条件判定模块中预置的对宽度参数σ寻优的终止条件:如果当前状态不满足终止条件,则进入宽度参数优化模块,根据智能优化算法更新宽度参数σ的值,并返回步骤⑤继续迭代;如果当前状态满足终止条件,则输出AUC最优值A*对应的宽度参数值σ*;⑧将步骤⑦优化后得到的宽度参数σ*输入初始分类器生成模块,形成初始的故障检测器,其表达式如下:
f first ( x ) = sgn ( &Sigma; i = 1 N T &alpha; i * K ( x , x ~ i ) - &rho; ) - - - ( 4 )
其中,
Figure BDA000009104102000512
为式(1)所示优化问题在宽度参数取σ*时得到的最优解;
Figure BDA000009104102000513
与NT的含义与步骤⑤所述相同,x为待检测的样本数据,sgn(·)是符号函数且满足 sgn ( x ) = 1 x &GreaterEqual; 0 - 1 x < 0 ; ρ由上式(3)给出;ffirst(x)=1表示样本x为正常样本,ffirst(x)=-1表示样本x为异常样本;⑨将步骤3)中设定的置信水平值α、总样本集Q={x1,x2,...,xN}以及步骤⑧得到的初始故障检测器输入控制限生成模块,根据置信水平值α和各个样本到初始分类面的近似距离确定控制限的大小,记为C_Limits;⑩将步骤⑧得到的初始故障检测器和步骤⑨得到的控制限C_Limits输入优化分类器合成模块,得到最终的优化故障检测器,其表达式如下:
f ( x ) = sgn ( &Sigma; i = 1 N T &alpha; i * K ( x , x ~ i ) - &rho; - C _ Limits )
其中,各符号的含义和计算方式与上述步骤相同;当f(x)=1时,表示待测样本x为正常样本,f(x)=-1表示待测样本x为异常样本。
所述步骤②中,通过样本密度估计模块得到各个样本的估计样本密度值,虚拟异常样本生成模块根据各个样本的估计样本密度值生成虚拟异常样本集和正常样本集的步骤如下:(a)估计各个样本点处的密度ρi(i=1,...,N)的表达式为;
Figure BDA00000910410200062
其中,ρi(i=1,...,N)表示第i个样本点的密度估计值;
Figure BDA00000910410200063
表示第i个样本点和与其距离最近的K个最近邻样本点间距离的平均值;
Figure BDA00000910410200064
表示所有样本点上述距离值的平均值;εd表示指定的充分小的正数,优选范围为10-7~10-4,以防分母出现为零的情况;(b)将各个样本点处的密度按从小到大排序,排序后记为ρ′1≤ρ′2≤…≤ρ′N,排序后的密度对应的样本数据记为{x1′,x2′,...,xN′},即样本x′i处的密度值为ρ′i;(c)指定密度限值β,密度限值β可以根据经验公式β=min(0.015*m,0.1)进行选择,其中,m为样本的维数,即监测传感器的个数;并选取前
Figure BDA00000910410200066
个密度最小的样本点作为异常样本点,其中,
Figure BDA00000910410200067
表示取整运算,从而得到虚拟异常样本集
Figure BDA00000910410200068
和正常样本集
所述步骤⑤中,控制参数设置模块中的控制参数v表示错分样本数占总样本数比例的上界;支持向量数占总样本数比例的下界,控制参数v的优选范围为0.01~0.1;宽度参数优化模块中宽度参数σ的寻优范围和初始值为:选择样本之间距离的平均值的1/10作为下界,选择样本之间距离的最大值作为上界,上下界的平均值作为初始值。
所述步骤⑥中,ROC性能计算模块计算AUC值的具体步骤如下:(a)计算测试集T中的每个样本点到步骤⑤得到的分类面的近似距离,第j个测试样本x′j到分类面的近似距离d′j
d j &prime; = &Sigma; i = 1 N T &alpha; i * K ( x j &prime; , x ~ i ) - &rho; - - - ( 7 )
其中,j=1,...,N,
Figure BDA00000910410200072
Figure BDA00000910410200073
以及NT的含义与步骤⑤所述相同,ρ由上式(3)给出;按照近似距离大小递减排序,测试集T排序后重新记为:
{ ( x &OverBar; 1 , y &OverBar; 1 ) , ( x &OverBar; 2 , y &OverBar; 2 ) , . . . , ( x &OverBar; N , y &OverBar; N ) }
其中,
Figure BDA00000910410200075
对应的近似距离记为
Figure BDA00000910410200076
Figure BDA00000910410200077
(b)初始化:记测试集中正常样本的数目为Np,虚拟异常样本的数目为Nn;正常样本被判为正常的数目TP=TP_pre=0,异常样本被判为正常的数目FP=FP_pre=0;AUC面积值A=0,样本点到分类面的近似距离值d_pre=-∞,迭代步数i=1;(c)如果排序后的第i个测试样本
Figure BDA00000910410200078
对应的近似距离
Figure BDA00000910410200079
满足:
Figure BDA000009104102000710
则:令A=A+|FP-FP_pre|*(TP+TP_pre)/2,
Figure BDA000009104102000711
FP_pre=FP,TP_pre=TP,进入步骤(d);如果
Figure BDA000009104102000712
直接进入步骤(d);(d)如果第i个测试样本
Figure BDA000009104102000713
的类别标签
Figure BDA000009104102000714
则TP=TP+1;否则FP=FP+1;(e)i=i+1,并判断i≤N是否满足:若满足该条件,则转步骤(c)继续迭代;若条件不满足,则终止循环,进入下面的步骤(f);(f)A=A+|Nn-FP_pre |*(Np+TP_pre)/2;(g)由于ROC曲线是以异常样本被判为正常的比率FPR作为横坐标、以正常样本被判为正常的比率TPR作为纵坐标绘制出的二维图形,因此,步骤(f)中得到的AUC面积值A的最终结果为A=A/(Np×Nn),输出最终的AUC面积值A,结束。
所述步骤⑦中,终止条件判定模块中,预置总的优化迭代次数的上限值作为宽度参数σ寻优的终止条件。
所述步骤⑨中,控制限生成模块根据置信水平值α和各个样本到初始分类面的近似距离,确定控制限C_Limits的步骤如下:(a)在{1,2,...,N}中随机选取一个整数,并记录该整数对应的总样本集Q={x1,x2,...,xN}中的样本;重复上述选取,直至选取出N个样本,组成一个新的集合,作为一组自助样本,记为
Figure BDA00000910410200081
Figure BDA00000910410200082
中的样本数与总样本集Q={x1,x2,...,xN}中的样本数相同,都为N个;(b)将上述步骤(a)重复q次,生成q组与总样本集Q={x1,x2,...,xN}含量相同的自助样本;(c)对每一个自助样本进行以下操作:计算该自助样本中各样本点到初始分类面的近似距离,表达式为:
d ^ j = &Sigma; i = 1 N T &alpha; i * K ( x ^ j , x ~ i ) - &rho; - - - ( 8 )
其中,
Figure BDA00000910410200084
以及NT的含义与步骤⑧所述相同,为自助样本中的第j个样本,ρ由式(3)确定;按照近似距离从小到大排序,根据指定的置信水平值α选取第
Figure BDA00000910410200087
个距离值作为该自助样本的控制限;第k个自助样本的控制限记为C_Limitsk,k=1,2,...,q;(d)取q个控制限的平均值作为最终控制限C_Limits的值,即:
C _ Limits = 1 q &Sigma; k = 1 q C _ Limit s k - - - ( 9 )
本发明由于采取以上技术方案,其具有以下优点:1、本发明利用样本的密度信息构造出虚拟异常样本以用于后续的分类器优化过程当中,从而不需要系统本身提供足够数量的异常样本,因此,能够应用于只基于正常样本数据集的故障检测问题,应用范围广。2、本发明通过样本密度信息和密度限构造虚拟异常样本,使得分类面的形状能够反映正常样本在空间中的分布特点,从而使优化分类面能够更加适当地包围样本数据,松紧程度适中。3、本发明以AUC值作为评价指标,使故障检测器在保证得到较高TPR的同时,降低了FPR的值,从而提高了分类面的推广能力。4、本发明采用单参数寻优,寻优过程简单。5、本发明通过控制限调整分类面的位置,使得分类面处于人为可控的状态,从而可以根据实际需要在线折中调节第一类错误率(正常样本被判为异常的概率)和第二类错误率(异常样本被判为正常的概率)的大小,同时,控制限还降低了数据采集误差等噪声对分类面的影响。本方法构思巧妙,精确实用,可广泛应用于工业生产线运行状态的故障检测中。
附图说明
图1是本发明结构示意图
图2是本发明模块结构示意图
图3是本发明优化故障检测器生成模块的子模块结构示意图
图4是本发明在二维圆环形数据集下得到的二维样本点及分类面显示图,图4a是宽度参数σ初始值取1.4067得到的结果,图4b是经过本发明优化后得到的结果
图5是本发明在二维圆环形数据集下得到的ROC曲线,图5a是宽度参数σ初始值取1.4067得到的结果,图5b是经过本发明优化后得到的结果
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
本发明方法包括以下步骤:
1)如图1所示,设置一包括数据采集设备A、置信水平设置模块B和带显示屏的监控计算机C的故障检测设备;数据采集设备A的输入端连接工业生产线中的各个监测传感器,输出端电连接至监控计算机C,置信水平设置模块B的输出端连接监控计算机C。如图2所示,监控计算机C内预设置有一数据预处理模块1、一优化故障检测器生成模块2和一优化故障检测器应用模块3。如图3所示,优化故障检测器生成模块2又包括以下子模块:样本密度估计模块21、虚拟异常样本生成模块22、训练集生成模块23、测试集生成模块24、OCSVM训练模块25、ROC性能计算模块26、控制参数设置模块27、宽度参数优化模块28、终止条件判定模块29、初始分类器生成模块210、控制限生成模块211以及优化分类器合成模块212。
2)如图1~3所示,通过数据采集设备A采集生产过程中产生的正常数据,并将正常数据传输到监控计算机C中,通过数据预处理模块1对上述正常数据进行归一化预处理,从而得到总样本集Q。
在监测工业生产过程中,数据采集设备A连接的监测传感器的数量为m个,对上述m个监测传感器进行N次数据采集,则N次采集后,通过数据预处理模块1对上述数据进行归一化处理得到的样本数据集合即为总样本集Q:
Q={x1,x2,...,xN}
其中,对m个监测传感器进行第i次数据采集,并经过归一化处理后得到的样本为xX=(xi,1,xi,2,...,xi,m)T∈Rm,Rm表示m维列向量;i=1,2,...,N;在样本xi中,对第j个监测传感器在第i次数据采集并经过归一化处理后得到的单个样本数据值为xi,j,j=1,2,...,m。
3)在置信水平设置模块B中,对生产过程中采集到的正常数据的真实程度进行评估,设定置信水平值α。置信水平值α的含义为:由于测量噪声等因素的影响,使得得到的正常数据的可信赖程度降低,若通过经验认为得到的正常数据中有(1-α)%的正常数据是可信赖的,则确信该(1-α)%的正常数据是正常的。
4)将上述步骤2)中的总样本集Q和步骤3)中设定的置信水平值α输入到优化故障检测器生成模块2中,寻优得到优化故障检测器的模型。
5)优化故障检测器应用模块3存储步骤4)得到的优化故障检测器的模型。
6)工业生产过程中,通过各监测传感器检测到的数据经过数据采集设备A采集和监控计算机C中的数据预处理模块1归一化处理后,输入优化故障检测器应用模块3中,通过优化故障检测器应用模块3中存储的优化故障检测器,实时输出故障检测结果。
上述步骤4)中,寻优得到优化故障检测器模型的关键是通过优化过程得到控制参数v和宽度参数σ的最优值,最终得到优化故障检测器模型,其步骤如下:
①将步骤2)中,数据预处理模块1归一化预处理后得到的总样本集Q输入样本密度估计模块21,通过样本密度估计模块21得到各个样本的估计样本密度值后,输入给虚拟异常样本生成模块22,虚拟异常样本生成模块22根据各个样本的估计样本密度值生成虚拟异常样本集,同时得到正常样本集,具体步骤如下:
(a)估计各个样本点处的密度ρi(i=1,...,N);目前应用较为广泛的样本点密度估计方法有以下两种:K-近邻密度估计法和Parzen窗密度估计法;本实施步骤中采用K-近邻密度估计法,该方法的密度公式为:
Figure BDA00000910410200101
其中,ρi(i=1,...,N)表示第i个样本点的密度估计值;
Figure BDA00000910410200102
表示第i个样本点和与其距离最近的K个最近邻样本点间距离的平均值;
Figure BDA00000910410200103
表示所有样本点上述距离值
Figure BDA00000910410200104
的平均值;εd表示指定的充分小的正数,优选范围为10-7~10-4,以防分母出现为零的情况;
(b)将各个样本点处的密度按从小到大排序,排序后记为ρ′1≤ρ′2≤…≤ρ′N,排序后的密度对应的样本数据记为{x1′,x2′,...,xN′},即样本xi′处的密度值为ρ′i
(c)指定密度限值β,密度限值β可以根据经验公式β=min(0.015*m,0.1)进行选择,其中,m为样本的维数,即传感器的个数;并选取前
Figure BDA00000910410200111
个估计样本密度值最小的样本点作为虚拟异常样本点,其中,
Figure BDA00000910410200112
表示取整运算,从而得到虚拟异常样本集和正常样本集
Figure BDA00000910410200114
②训练集生成模块23从虚拟异常样本生成模块22中得到正常样本集
Figure BDA00000910410200115
并从正常样本集中随机选取部分正常样本构成训练集
Figure BDA00000910410200116
NT表示训练集的样本总数。
③测试集生成模块24从虚拟异常样本生成模块22中得到正常样本集
Figure BDA00000910410200117
和虚拟异常样本集
Figure BDA00000910410200118
并将正常样本集和虚拟异常样本集组合得到测试集T:
其中,yi为样本类别标签,yi=-1表示虚拟异常样本,yi=1表示正常样本,且
Figure BDA000009104102001110
④将步骤②中训练集生成模块23得到的训练集
Figure BDA000009104102001111
控制参数设置模块27中设置的控制参数v,以及当前宽度参数优化模块28中设置的宽度参数σ输入到OCSVM训练模块25中,得到一个分类面,具体步骤如下。
控制参数设置模块27中控制参数v的物理意义:错分样本数(正常样本被判为异常样本或异常样本被判为正常样本)占总样本数比例的上界;支持向量数占总样本数比例的下界。控制参数v的优选范围为0.01~0.1。
宽度参数优化模块28中宽度参数σ的寻优范围和初始值:现有不少文献针对宽度参数σ的选择进行了分析,得到了一些有用的结果;实际选择宽度参数σ的上下界和初始值时,可以参考已有的结论并综合考虑计算复杂度进行选择。如可以选择样本之间距离的平均值的1/10作为下界,选择样本之间距离的最大值作为上界,上下界的平均值作为初始值;或采用后面具体仿真例中使用的选择方法等。
OCSVM训练模块25通过求解如下的优化问题:
min &alpha; 1 2 &Sigma; i = 1 N T &Sigma; j = 1 N T &alpha; i &alpha; j K ( x ~ i , x ~ j )
s . t . 0 &le; &alpha; i &le; 1 v N T , i = 1 , . . . , N T - - - ( 2 )
&Sigma; i = 1 N T &alpha; i = 1
得到寻优向量
Figure BDA00000910410200124
的最优解,记为
Figure BDA00000910410200125
从而得到分类面,分类面表达式为:
&Sigma; i = 1 N T &alpha; i * K ( x , x ~ i ) - &rho; = 0 - - - ( 3 )
其中:式(2)中的
Figure BDA00000910410200127
为拉格朗日乘子,且为优化问题(式(2))的寻优向量;
Figure BDA00000910410200128
为训练集样本;为高斯核函数,NT为训练集的样本总数;式(3)中x为变量;满足
Figure BDA000009104102001210
的样本
Figure BDA000009104102001211
称为支持向量,显然,只有当
Figure BDA000009104102001212
时,式(3)中的对应项
Figure BDA000009104102001213
才有计算的必要;ρ表示分类面的偏移量,由式(4)给出,其中
Figure BDA000009104102001214
对应的满足
Figure BDA000009104102001216
条件:
&rho; = &Sigma; i = 1 N T &alpha; i * K ( x ~ k , x ~ i ) - - - ( 4 )
⑤将上述步骤④得到的分类面和步骤③测试集生成模块24得到的测试集T输入ROC性能计算模块26,计算AUC值,记为A。
计算AUC值的具体步骤如下:
(a)根据式(5)计算测试集T中的每个样本点到步骤④得到的分类面的近似距离,第j个测试样本xj′到分类面的近似距离dj′为
d j &prime; = &Sigma; i = 1 N T &alpha; i * K ( x j &prime; , x ~ i ) - &rho; - - - ( 5 )
其中,j=1,...,N,
Figure BDA000009104102001219
Figure BDA000009104102001220
以及NT的含义与步骤④所述相同,ρ由上式(4)给出;按照近似距离大小递减排序,测试集T排序后重新记为:
{ ( x &OverBar; 1 , y &OverBar; 1 ) , ( x &OverBar; 2 , y &OverBar; 2 ) , . . . , ( x &OverBar; N , y &OverBar; N ) }
其中,对应的近似距离记为
Figure BDA00000910410200133
Figure BDA00000910410200134
(b)初始化:记测试集中正常样本的数目为Np,虚拟异常样本的数目为Nn;正常样本被判为正常的数目TP=TP_pre=0,异常样本被判为正常的数目FP=FP_pre=0,其中ROC曲线的横坐标FPR=FP/Nn,纵坐标TPR=TP/Np;AUC面积值A=0,当前循环的前一步存储的近似距离值d_pre=-∞,迭代步数i=1;
(c)如果排序后的第i个测试样本对应的近似距离满足:则:令A=A+|FP-FP_pre|*(TP+TP_pre)/2,
Figure BDA00000910410200138
FP_pre=FP,TP_pre=TP,进入步骤(d);如果直接进入步骤(d);
(d)如果第i个测试样本
Figure BDA000009104102001310
的类别标签
Figure BDA000009104102001311
则TP=TP+1;否则FP=FP+1;
(e)i=i+1,并判断i≤N是否满足:若满足该条件,则转步骤(c)继续迭代;若条件不满足,则终止循环,进入下面的步骤(f);
(f)令A=A+|Nn-FP_pre |*(Np+TP_pre)/2;
(g)由于ROC曲线是以FPR(False Positive Rate,异常样本被判为正常的比率)作为横坐标、以TPR(True Positive Rate,正常样本被判为正常的比率)作为纵坐标绘制出的二维图形,因此,步骤(f)中得到的AUC面积值A的最终结果为A=A/(Np×Nn),输出最终的AUC面积值A,结束。
⑥将上述步骤⑤得到的最终AUC面积值A输入到终止条件判定模块29中,比较当前AUC面积值A和当前终止条件判定模块29中的AUC最优值A*,根据智能优化算法选择二者中的较大值存储为A*,相应的宽度参数值记为σ*;其中,初始状态下,终止条件判定模块29中的AUC最优值A*为0,相应的宽度参数σ*也为0;终止条件判定模块29判断当前状态是否满足终止条件判定模块29中预置的对宽度参数σ寻优的终止条件:
如果当前状态不满足终止条件,则进入宽度参数优化模块28,根据智能优化算法更新宽度参数σ的值,并返回步骤④继续迭代;
如果当前状态满足终止条件,则输出AUC最优值A*对应的宽度参数值σ*
终止条件判定模块29中预置的终止条件不唯一,因此,采用不同的智能优化算法进行宽度参数σ寻优,该终止条件就可能不同,例如:可以设置总的优化迭代次数的上限值作为宽度参数σ寻优的终止条件;或采用仿真例中模拟退火算法中使用的终止条件——系统温度是否降至终止温度等。
⑦将步骤⑥优化后得到的宽度参数σ*输入初始分类器生成模块210,形成初始的故障检测器,并进入后续步骤;此初始故障检测器的检测模型如下式所示:
f first ( x ) = sgn ( &Sigma; i = 1 N T &alpha; i * K ( x - x ~ i ) - &rho; ) - - - ( 6 )
其中,
Figure BDA00000910410200142
是上述式(2)所示优化问题在宽度参数取σ*时得到的最优解;
Figure BDA00000910410200143
与NT的含义与步骤④所述相同,x为待检测的样本数据,sgn(·)是符号函数且满足 sgn ( x ) = 1 x &GreaterEqual; 0 - 1 x < 0 ; ρ由上式(4)给出;ffirst(x)=1表示样本x为正常样本,ffirst(x)=-1表示样本x为异常样本。
⑧将步骤3)中设定的置信水平值α、总样本集Q={x1,x2,...,xN}以及步骤⑦得到的初始故障检测器输入控制限生成模块211,根据置信水平值α和各个样本到初始分类面的近似距离确定控制限的大小,记为C_Limits,控制限的具体计算步骤如下:
(a)在{1,2,...,N}中随机选取一个整数,并记录该整数对应的总样本集Q={x1,x2,...,xN}中的样本;重复上述选取(包括多次选取同一整数的情况),直至选取出N个样本,组成一个新的集合,这个新集合便是一组自助样本,记为
Figure BDA00000910410200145
Figure BDA00000910410200146
中的样本数与总样本集Q={x1,x2,...,xN}中的样本数相同,都为N个,但是
Figure BDA00000910410200147
中的样本有可能会出现重复。
(b)将步骤(a)重复q次,生成q组与总样本集Q={x1,x2,...,xN}含量相同的自助样本;
(c)对每一个自助样本进行以下操作:计算该自助样本中各样本点到初始分类面的近似距离,计算公式如下式(7)所示:
d ^ j = &Sigma; i = 1 N T &alpha; i * K ( x ^ j , x ~ i ) - &rho; - - - ( 7 )
其中,
Figure BDA000009104102001410
以及NT的含义与步骤⑦所述相同,
Figure BDA000009104102001411
为自助样本中的第j个样本,ρ由式(4)确定;按照近似距离从小到大排序,根据指定的置信水平值α选取第个距离值作为该自助样本的控制限;第k个自助样本的控制限记为C_Limitsk,k=1,2,...,q;
(d)取q个控制限的平均值作为最终控制限C_Limits的值,即:
C _ Limits = 1 q &Sigma; k = 1 q C _ Limit s k - - - ( 8 )
⑨将步骤⑦得到的初始故障检测器和步骤⑧得到的控制限C_Limits输入优化分类器合成模块212,得到最终的优化故障检测器,其检测模型函数表达式如下:
f ( x ) = sgn ( &Sigma; i = 1 N T &alpha; i * K ( x , x ~ i ) - &rho; - C _ Limits ) - - - ( 9 )
其中,各符号的含义和计算方式与上述步骤相同;当f(x)=1时,表示待测样本x为正常样本,f(x)=-1表示待测样本x为异常样本。
下面列举一具体的仿真例进行说明:
本仿真例采用二维圆环形数据集进行仿真实验,该数据集共有600个正常样本数据,即N=600,m=2(即有两个传感器)。其仿真步骤及参数设定情况如下:
(1)对数据集进行归一化处理,得到样本集Q={x1,x2,...,xN}。
(2)指定置信水平α的值为0.03。
(3)根据式(1)计算各个样本点处的密度ρi(i=1,...,N),其中εd取为10-6。密度限β取为β=min(0.015*m,0.1)=0.03,得到含有582个样本点的正常样本集
Figure BDA00000910410200153
和含有18个样本点的虚拟异常样本集
Figure BDA00000910410200154
随机选取正常样本集中的2/3部分构成训练集
Figure BDA00000910410200155
因此训练集共含有388个样本,即NT=388。综合正常样本集和虚拟异常样本集并添加类别标签得到测试集,其含有600个样本。
(4)根据参数的物理概念选择控制参数v为0.05。记训练集中任意两两不同样本点之间的欧式距离组成的集合为
Figure BDA00000910410200156
则宽度参数σ的上限可取为σmax=dmax(其中,dmax是集合{dij}中的最大值),下限可取为σmin=mean(dij)/10(其中,mean(dij)是集合{dij}所有元素的平均值),初始值取为
Figure BDA00000910410200157
(其中,
Figure BDA00000910410200158
)。
(5)本仿真例中使用的智能优化算法为模拟退火算法,使用模拟退火算法对参数σ进行寻优的过程如下:
①初始化:初始温度T0=0.005,终止温度Tf=0.0001,降温函数的温差系数ΔT=0.0005,εAUC=0.001为很小的正数,Δσ=(σmaxmin)/20,并计算初始σ值下0CSVM训练结果的AUC值和支持向量的数目nSV
②设置内循环次数n为,初始化p=1;
③在单次内循环中:在σ的邻域[σ-Δ*σ,σ+Δ*σ](其中Δ*σ=min(Δσ,σ-σmin,σmax-σ))内随机产生一个新的σnew;在新参数下进行0CSVM训练,生成新的分类面,并求取新的AUC值AUCnew和相应的支持向量数目nSV,new;若下述三种情况中的任意一种满足:(a)AUCnew-AUC>εAUC;(b)AUCnew-AUC<-εAUC
Figure BDA00000910410200162
大于(0,1)区间上产生的随机数;(c)|AUCnew-AUC|≤εAUC且nSV,new<nSV;则更新σ=σnew、AUC=AUCnew、nSV=nSV,new
④p=p+1;如果p≤n,则转步骤③继续迭代;否则,结束内循环,转步骤⑤;
⑤降温函数T0=T0-ΔT,比较此时的T0和Tf的大小:如果T0≥Tf,则返回步骤②继续迭代;否则,结束整个模拟退火算法,输出最终得到的参数σ的值,记为最优值σ*
(6)根据最优参数对(v,σ*)训练样本,得到初始分类器。选择q=30,再根据置信水平α=0.03、测试集和初始分类器计算得到控制限C_Limits。再将初始分类器和控制限合成,便可得到优化故障检测器,其检测模型表达式如式(8)所示。
仿真得到的结果如图4和图5所示。其中,图4显示的是在二维圆环形数据集下得到的二维样本点及分类面显示图,图4a为σ取初始值得到的结果,图4b为经过本发明优化后得到的结果。从图4中可以看出,图4a中分类面内部有很大的空隙,分类面并没有很好地包围样本点;而图4b中的分类面则将样本点包围地恰到好处,松紧程度适中。图5显示的是对应上述两种情况的ROC曲线,其中,图5a为σ取初始值得到的ROC曲线,其AUC值为0.6816;图5b为经过本发明优化后得到的ROC曲线,其AUC值为0.9918。可见,经过本发明的优化处理后,故障检测器对应的AUC值有了很大的提升,大大提高了故障检测器的检测性能。
上述各实施例仅用于说明本发明,其中各部件的结构、连接方式等都是可以有所变化的,凡是在本发明技术方案的基础上进行的等同变换和改进,均不应排除在本发明的保护范围之外。

Claims (1)

1.一种基于密度的参数优化单分类支持向量机故障检测方法,其包括以下步骤: 
1)设置一包括数据采集设备、置信水平设置模块和监控计算机的故障检测设备;所述监控计算机内预设置有一数据预处理模块、一优化故障检测器生成模块和一优化故障检测器应用模块; 
2)数据采集设备采集工业生产线中各监测传感器产生的正常数据,并传输给监控计算机的数据预处理模块,数据预处理模块进行归一化预处理后得到总样本集Q={x1,x2,...,xN}; 
其中,N表示数据采集设备对各个监测传感器进行N次数据采集;xi=(xi,1,xi,2,...,xi,m)T∈Rm,表示对m个监测传感器进行第i次数据采集,并经过归一化处理后得到的样本,m表示监测传感器的个数,Rm表示m维列向量;i=1,2,...,N;xi,j表示在样本xi中,对第j个传感器在第i次数据采集并经过归一化处理后得到的单个样本数据值,j=1,2,…,m; 
3)在置信水平设置模块中,对生产过程中采集到的正常数据的真实程度进行评估,设定置信水平值α; 
4)将上述步骤2)中的总样本集Q和步骤3)中设定的置信水平值α输入到优化故障检测器生成模块中,寻优得到优化故障检测器的模型: 
Figure FDA00002487584600011
其中,当f(x)=1时,表示待测样本x为正常样本,f(x)=-1时,表示待测样本x为异常样本;sgn(·)是符号函数且满足
Figure FDA00002487584600012
NT表示训练集的样本总数;
Figure FDA00002487584600013
表示训练集样本;
Figure FDA00002487584600014
表示拉格朗日乘子的最优解;
Figure FDA00002487584600015
表示高斯核函数;ρ表示分类面的偏移量;C_Limits表示控制限; 
5)优化故障检测器应用模块存储步骤4)得到的优化故障检测器的模型; 
6)工业生产过程中,实时通过数据采集设备采集各监测传感器输出的数据,并通过监控计算机中的数据预处理模块归一化处理后,输入优化故障检测器应用模块中,通过优化故障检测器应用模块中存储的优化故障检测器,实时输出故障检测结果; 
所述步骤4)中,寻优得到优化故障检测器模型的关键是通过优化过程得到控制参数v和宽度参数σ的最优值,最终得到优化故障检测器模型,其步骤如下: 
①在所述优化故障检测器生成模块中预置以下子模块:样本密度估计模块、虚拟异常样本生成模块、训练集生成模块、测试集生成模块、OCSVM训练模块、ROC性能计算模块、控制参数设置模块、宽度参数优化模块、终止条件判定模块、初始分类器生成模块、控制限生成模块以及优化分类器合成模块,其中的OCSVM是单分类支持向量机One-class Support Vector Machine,ROC是接受者操作特征曲线Receiver Operating Characteristics curve; 
②将步骤2)中,数据预处理模块归一化预处理后得到的总样本集Q输入样本密度估计模块,通过样本密度估计模块得到各个样本的估计样本密度值,并输入给虚拟异常样本生成模块,虚拟异常样本生成模块根据各个样本的估计样本密度值生成虚拟异常样本集
Figure FDA00002487584600021
同时得到正常样本集 其中,β为指定的密度限值,即选取前
Figure FDA00002487584600023
个估计样本密度值最小的样本点作为异常样本点;
Figure FDA00002487584600024
表示取整运算; 
③训练集生成模块从虚拟异常样本生成模块中得到正常样本集 
Figure FDA00002487584600025
并从正常样本集中随机选取部分正常样本构成训练集 NT表示训练集的样本总数; 
④测试集生成模块从虚拟异常样本生成模块中得到正常样本集 
Figure FDA00002487584600027
和虚拟异常样本集
Figure FDA00002487584600028
并将正常样本集和虚拟异常样本集组合得到测试集T: 
Figure FDA00002487584600029
其中,yi为样本类别标签,yi=-1表示虚拟异常样本,yi=1表示正常样本,且 
Figure FDA000024875846000210
⑤将步骤③中训练集生成模块得到的训练集
Figure FDA000024875846000211
以及控制参数设 置模块中设置的控制参数v、当前宽度参数优化模块中设置的宽度参数σ输入到OCSVM训练模块中,OCSVM训练模块通过求解如下的优化问题: 
Figure FDA00002487584600031
Figure FDA00002487584600032
Figure FDA00002487584600033
得到寻优向量的最优解,记为从而得到分类面,分类面表达式为: 
Figure FDA00002487584600036
其中:式(1)中的
Figure FDA00002487584600037
为拉格朗日乘子,且为优化问题的寻优向量; 
Figure FDA00002487584600038
为训练集样本,其中i,j=1,2,...,NT
Figure FDA00002487584600039
为高斯核函数,NT为训练集的样本总数;式(2)中x为待检测的样本数据;满足的样本
Figure FDA000024875846000311
称为支持向量;ρ由式(3)给出,其中,对应的
Figure FDA000024875846000313
满足
⑥将步骤⑤得到的分类面和步骤④测试集生成模块得到的测试集T输入ROC性能计算模块,计算AUC值,记为A,其中AUC是ROC曲线下的面积值Area underan ROC curve; 
⑦将上述步骤⑥得到的最终AUC值A输入到终止条件判定模块中,比较当前AUC值A和当前终止条件判定模块中的AUC最优值A*,根据智能优化算法选择二者中的较大值存储为A*,相应的宽度参数值记为σ*;其中,初始状态下,终止条件判定模块中的AUC最优值A*为0,相应的宽度参数σ*也为0;终止条件判定模块判断当前状态是否满足终止条件判定模块中预置的对宽度参数σ寻优的终止条件: 
如果当前状态不满足终止条件,则进入宽度参数优化模块,根据智能优化算 法更新宽度参数σ的值,并返回步骤⑤继续迭代; 
如果当前状态满足终止条件,则输出AUC最优值A*对应的宽度参数值σ*; 
⑧将步骤⑦优化后得到的宽度参数σ*输入初始分类器生成模块,形成初始的故障检测器,其表达式如下: 
Figure FDA00002487584600041
其中,
Figure FDA00002487584600042
为式(1)所示优化问题在宽度参数取σ*时得到的最优解;
Figure FDA00002487584600043
与NT的含义与步骤⑤所述相同,x为待检测的样本数据,sgn(·)是符号函数且满足
Figure FDA00002487584600044
ρ由上式(3)给出;ffrirst(x)=1表示样本x为正常样本,ffirst(x)=-1表示样本x为异常样本; 
⑨将步骤3)中设定的置信水平值α、总样本集Q={x1,x2,...,xN}以及步骤⑧得到的初始故障检测器输入控制限生成模块,根据置信水平值α和各个样本到初始分类面的近似距离确定控制限的大小,记为C_Limits; 
⑩将步骤⑧得到的初始故障检测器和步骤⑨得到的控制限C_Limits输入优化分类器合成模块,得到最终的优化故障检测器,其表达式如下: 
Figure FDA00002487584600045
其中,各符号的含义和计算方式与上述步骤相同;当f(x)=1时,表示待测样本x为正常样本,f(x)=-1表示待测样本x为异常样本; 
所述步骤②中,通过样本密度估计模块得到各个样本的估计样本密度值,虚拟异常样本生成模块根据各个样本的估计样本密度值生成虚拟异常样本集和正常样本集的步骤如下: 
(a)估计各个样本点处的密度ρi的表达式为; 
Figure FDA00002487584600046
其中,ρi表示第i个样本点的密度估计值,i=1,...,N;
Figure FDA00002487584600047
表示第i个样本点和与其距离最近的K个最近邻样本点间距离的平均值;
Figure FDA00002487584600048
表示所有样本点上述距离值
Figure FDA00002487584600049
的平均值;εd表示指定的充分小的正数,范围为10-7~ 10-4,以防分母出现为零的情况; 
(b)将各个样本点处的密度按从小到大排序,排序后记为ρ′1≤ρ′2≤...≤ρ′N,排序后的密度对应的样本数据记为{x′1,x′2,...,x′N},即样本x′i处的密度值为ρ′i; 
(c)指定密度限值β,密度限值β根据经验公式β=min(0.015*m,0.1)进行选择,其中,m为样本的维数,即监测传感器的个数;并选取前
Figure FDA00002487584600051
个密度最小的样本点作为异常样本点,其中,
Figure FDA00002487584600052
表示取整运算,从而得到虚拟异常样本集 
Figure FDA00002487584600053
和正常样本集
Figure FDA00002487584600054
所述步骤⑤中,控制参数设置模块中的控制参数v不仅表示错分样本数占总样本数比例的上界,还表示支持向量数占总样本数比例的下界,控制参数v的范围为0.01~0.1;宽度参数优化模块中宽度参数σ的寻优范围和初始值为:选择样本之间距离的平均值的1/10作为下界,选择样本之间距离的最大值作为上界,上下界的平均值作为初始值; 
所述步骤⑥中,ROC性能计算模块计算AUC值的具体步骤如下: 
(a)计算测试集T中的每个样本点到步骤⑤得到的分类面的近似距离,第j个测试样本x′j到分类面的近似距离d′j为 
Figure FDA00002487584600055
其中,j=1,...,N,
Figure FDA00002487584600056
以及NT的含义与步骤⑤所述相同,ρ由上式(3)给出;按照近似距离大小递减排序,测试集T排序后重新记为: 
Figure FDA00002487584600057
其中,
Figure FDA00002487584600058
对应的近似距离记为
Figure FDA00002487584600059
(b)初始化:记测试集中正常样本的数目为Np,虚拟异常样本的数目为Nn;正常样本被判为正常的数目TP=TP_pre=0,异常样本被判为正常的数目FP=FP_pre=0;AUC面积值A=0,样本点到分类面的近似距离值d_pre=-∞,迭代步数i=1; 
(c)如果排序后的第i个测试样本对应的近似距离
Figure FDA000024875846000512
满足:
Figure FDA000024875846000513
则: 
令A=A+|FP-FP_pre|*(TP+TP_pre)/2,
Figure FDA00002487584600061
FP_pre=FP,TP_pre=TP,进入步骤(d);如果
Figure FDA00002487584600062
直接进入步骤(d); 
(d)如果第i个测试样本
Figure FDA00002487584600063
的类别标签
Figure FDA00002487584600064
则TP=TP+1;否则FP=FP+1; 
(e)i=i+1,并判断i≤N是否满足:若满足该条件,则转步骤(c)继续迭代;若条件不满足,则终止循环,进入下面的步骤(f); 
(f)A=A+|Nn-FP_pre |*(Np+TP_pre)/2; 
(g)由于ROC曲线是以异常样本被判为正常的比率FPR作为横坐标、以正常样本被判为正常的比率TPR作为纵坐标,绘制出的二维图形,因此,步骤(f)中得到的AUC面积值A的最终结果为A=A/(Np×Nn),输出最终的AUC面积值A,结束; 
所述步骤⑦中,终止条件判定模块中,预置总的优化迭代次数的上限值作为宽度参数σ寻优的终止条件; 
所述步骤⑨中,控制限生成模块根据置信水平值α和各个样本到初始分类面的近似距离,确定控制限C_Limits的步骤如下: 
(a)在{1,2,...,N}中随机选取一个整数,并记录该整数对应的总样本集Q={x1,x2,...,xN}中的样本;重复上述选取,直至选取出N个样本,组成一个新的集合,作为一组自助样本,记为
Figure FDA00002487584600065
Figure FDA00002487584600066
中的样本数与总样本集Q={x1,x2,...,xN}中的样本数相同,都为N个; 
(b)将上述步骤(a)重复q次,生成q组与总样本集Q={x1,x2,...,xN}含量相同的自助样本; 
(c)对每一组自助样本进行以下操作:计算该自助样本中各样本点到初始分类面的近似距离,表达式为: 
Figure FDA00002487584600067
其中,
Figure FDA00002487584600068
以及NT的含义与步骤⑧所述相同,
Figure FDA00002487584600069
为自助样本中的第j个样本,ρ由式(3)确定;按照近似距离从小到大排序,根据指定的置信水平值α选取第 
Figure FDA000024875846000610
个距离值作为该自助样本的控制限;第k个自助样本的控制限记为C_Limitsk,k=1,2,...,q; 
(d)取q个控制限的平均值作为最终控制限C_Limits的值,即: 
Figure FDA000024875846000611
CN 201110271842 2011-09-14 2011-09-14 一种基于密度的参数优化单分类支持向量机故障检测方法 Active CN102339389B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN 201110271842 CN102339389B (zh) 2011-09-14 2011-09-14 一种基于密度的参数优化单分类支持向量机故障检测方法
PCT/CN2011/082850 WO2013037169A1 (zh) 2011-09-14 2011-11-24 基于密度的参数优化单分类支持向量机故障检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110271842 CN102339389B (zh) 2011-09-14 2011-09-14 一种基于密度的参数优化单分类支持向量机故障检测方法

Publications (2)

Publication Number Publication Date
CN102339389A CN102339389A (zh) 2012-02-01
CN102339389B true CN102339389B (zh) 2013-05-29

Family

ID=45515111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110271842 Active CN102339389B (zh) 2011-09-14 2011-09-14 一种基于密度的参数优化单分类支持向量机故障检测方法

Country Status (2)

Country Link
CN (1) CN102339389B (zh)
WO (1) WO2013037169A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103439964B (zh) * 2013-08-13 2015-10-28 清华大学 一种ocsvm监控模型的在线更新系统及方法
JP2015076058A (ja) * 2013-10-11 2015-04-20 株式会社日立製作所 設備の監視診断装置
CN103914064B (zh) * 2014-04-01 2016-06-08 浙江大学 基于多分类器和d-s证据融合的工业过程故障诊断方法
CN105704103B (zh) 2014-11-26 2017-05-10 中国科学院沈阳自动化研究所 基于OCSVM双轮廓模型的Modbus TCP通信行为异常检测方法
CN105703963B (zh) * 2014-11-26 2017-04-05 中国科学院沈阳自动化研究所 基于pso‑ocsvm的工业控制系统通信行为异常检测方法
CN104504583B (zh) * 2014-12-22 2018-06-26 广州品唯软件有限公司 分类器的评价方法
CN107451515A (zh) * 2016-06-01 2017-12-08 易程(苏州)电子科技股份有限公司 一种旋转机械设备故障识别方法及系统
CN106295712A (zh) * 2016-08-19 2017-01-04 苏州大学 一种故障检测方法和系统
CN106404442B (zh) * 2016-09-22 2018-09-04 宁波大学 基于数据邻域特征与非邻域特征保持的工业过程故障检测方法
CN107194815B (zh) * 2016-11-15 2018-06-22 平安科技(深圳)有限公司 客户分类方法及系统
CN107728028A (zh) * 2017-11-07 2018-02-23 武汉大学 基于单类支持向量机的gis局部放电故障判别方法
CN108563548B (zh) * 2018-03-19 2020-10-16 创新先进技术有限公司 异常检测方法及装置
CN108717496B (zh) * 2018-05-22 2022-04-05 北京无线电测量研究所 雷达天线阵面故障检测方法及系统
CN110874088B (zh) * 2018-09-03 2022-12-23 中国船舶集团有限公司第七一一研究所 基于多维向量模型的船舶关键设备系统的监测方法
CN110689324A (zh) * 2019-09-29 2020-01-14 国网湖北省电力有限公司电力科学研究院 一种配电变压器检测结果的辅助评判方法
CN110705654B (zh) * 2019-10-22 2022-11-08 中国工商银行股份有限公司 用于监控资产的方法、装置、电子设备及介质
CN111178436A (zh) * 2019-12-30 2020-05-19 深圳信息职业技术学院 数据处理方法、装置、计算机设备及存储介质
CN111461533B (zh) * 2020-03-31 2023-04-25 佛山科学技术学院 一种基于大数据的工业生产流水线的故障监测方法及系统
CN111898313B (zh) * 2020-06-30 2022-05-20 电子科技大学 一种基于ica与svm集成学习的故障检测方法
CN113266921A (zh) * 2021-06-08 2021-08-17 深圳市英维克信息技术有限公司 一种空调设备故障检测方法、装置、设备及介质
CN114453630B (zh) * 2022-01-20 2023-04-04 湖北文理学院 控制机床铣削不粘刀的方法、装置、电子设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1987697A (zh) * 2006-12-22 2007-06-27 浙江大学 工业生产过程小样本条件下的故障诊断系统及方法
CN101907681A (zh) * 2010-07-15 2010-12-08 南京航空航天大学 基于gsd_svdd的模拟电路动态在线故障诊断方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101216436A (zh) * 2008-01-03 2008-07-09 东华大学 一种基于支持向量数据描述理论的织物瑕疵自动检测方法
CN101907088B (zh) * 2010-05-27 2012-07-04 中国人民解放军国防科学技术大学 基于单类支持向量机的故障诊断方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1987697A (zh) * 2006-12-22 2007-06-27 浙江大学 工业生产过程小样本条件下的故障诊断系统及方法
CN101907681A (zh) * 2010-07-15 2010-12-08 南京航空航天大学 基于gsd_svdd的模拟电路动态在线故障诊断方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Anomaly detection combining one-class SVMs and particle swarm optimization algorithms;Jiang Tian et al.;《Nonlinear Dyn》;20101231(第61期);303~310 *
Jiang Tian et al..Anomaly detection combining one-class SVMs and particle swarm optimization algorithms.《Nonlinear Dyn》.2010,(第61期),303~310.
双阈值单类支持矢量机在线故障检测算法及应用;胡雷等;《机械工程学报》;20090331;第45卷(第3期);169~173 *
胡雷等.双阈值单类支持矢量机在线故障检测算法及应用.《机械工程学报》.2009,第45卷(第3期),169~173.

Also Published As

Publication number Publication date
WO2013037169A1 (zh) 2013-03-21
CN102339389A (zh) 2012-02-01

Similar Documents

Publication Publication Date Title
CN102339389B (zh) 一种基于密度的参数优化单分类支持向量机故障检测方法
CN110441065B (zh) 基于lstm的燃气轮机在线检测方法与装置
CN113256066B (zh) 基于PCA-XGBoost-IRF的作业车间实时调度方法
US20220146462A1 (en) Method for predicting remaining life of numerical control machine tool
Paynabar et al. Monitoring and diagnosis of multichannel nonlinear profile variations using uncorrelated multilinear principal component analysis
CN106295692B (zh) 基于降维与支持向量机的产品早期故障根原因识别方法
CN113255848B (zh) 基于大数据学习的水轮机空化声信号辨识方法
EP2476073A2 (en) Methods and systems for energy prognosis
CN106845526A (zh) 一种基于大数据融合聚类分析的关联参数故障分类方法
CN109117380A (zh) 一种软件质量评价方法、装置、设备及可读存储介质
CN106663086A (zh) 用于核回归模型的集体的设备和方法
CN116272363B (zh) 船舶废气混合式脱硫系统及其方法
CN116341901B (zh) 一种滑坡面域-单体危险性预警的一体化评价方法
CN114925536A (zh) 机载系统phm测试性建模与诊断策略优化方法和装置
CN113889198A (zh) 一种基于油色谱时频域信息和残差注意力网络的变压器故障诊断方法及设备
CN102103691A (zh) 一种基于主成分分析人脸的识别方法
CN115324843A (zh) 基于监测数据的风力发电机组的故障诊断系统及其方法
CN116304853A (zh) 一种极限学习机与特征提取相结合的数据分类方法及系统
Carrizosa et al. Binarized support vector machines
CN114357372A (zh) 一种基于多传感器数据驱动的飞机故障诊断模型生成方法
JP5155740B2 (ja) モニタリング条件決定装置、モニタリング条件の決定方法および監視診断装置
CN113343123A (zh) 一种生成对抗多关系图网络的训练方法和检测方法
Othman et al. Abnormal patterns detection in control charts using classification techniques
CN116597635B (zh) 无线通讯智能燃气表控制器及其控制方法
Powers Visualization of tradeoff in evaluation: from precision-recall & PN to LIFT, ROC & BIRD

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant