CN108509973B - 基于Cholesky分解的最小二乘支持向量机学习算法及其应用 - Google Patents

基于Cholesky分解的最小二乘支持向量机学习算法及其应用 Download PDF

Info

Publication number
CN108509973B
CN108509973B CN201810052864.6A CN201810052864A CN108509973B CN 108509973 B CN108509973 B CN 108509973B CN 201810052864 A CN201810052864 A CN 201810052864A CN 108509973 B CN108509973 B CN 108509973B
Authority
CN
China
Prior art keywords
samples
support vector
sample
formula
positive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810052864.6A
Other languages
English (en)
Other versions
CN108509973A (zh
Inventor
赵永平
习鹏鹏
李兵
李智强
潘颖庭
宋房全
黄功
胡乾坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201810052864.6A priority Critical patent/CN108509973B/zh
Publication of CN108509973A publication Critical patent/CN108509973A/zh
Application granted granted Critical
Publication of CN108509973B publication Critical patent/CN108509973B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Abstract

本发明提供一种基于Cholesky分解的最小二乘支持向量机学习算法及其应用。本发明对正常类样本和故障类样本分别添加不同的正则化参数C+和C以保持分类边界位于理想位置,建立分类效果优良的分类器,消除了经典的SVM和LSSVM对所有误差都是同一个惩罚系数运用在类不平衡学习中时不便调整分类边界至理想位置的缺陷。对实时性敏感的航空发动机故障检测实例,有必要对算法进行稀疏化缩短算法的测试时间,本发明采用迭代策略和约简技术相结合的方法实现。再运用Cholesky分解方法解决迭代策略中用Sherman‑Morrison公式直接对矩阵求逆导致结果不稳定的问题并缩短了算法的训练时间。

Description

基于Cholesky分解的最小二乘支持向量机学习算法及其应用
技术领域
本发明针对航空发动机故障检测,用最小二乘支持向量机(Least SquaresSupport Vector Machine)改进算法解决正常类和故障类样本的类不平衡问题并用于航空发动机故障检测。
背景技术
近年来不平衡数据的分类越来越受到学术界、工业界和其他领域的关注。正常状态下的样本容易得到而且数据量庞大,然而故障样本不像正常样本那么多,获取它的成本却很高。为了解决类不平衡学习问题,许多不同的技术被提出,比如欠/过采样,敏感函数学习方法。随机欠采样(under-sampling)的方法是通过减少分类中多数类样本的数量实现两类样本数平衡,目的是通过随机消除多数类的样本来平衡类分布,直到多数类和少数类样本实现平衡。对于代价敏感函数学习方法,不同误分类代价是不一样的。
支持向量机(Support Vector Machine,简称SVM)广泛应用于实际问题,具有扎实的数学背景,泛化能力强,在各领域中解决分类问题时性能良好。然而SVM应用于不平衡数据集时表现不良。SVM的分类边界偏向于多数类,对少数类预测的性能较差。大多数经典的算法都假设类分布平衡或者误分类代价相等。因此,遇到不平衡数据集时,这些算法不能正确地代表数据的分布特征。那么对数据各类预测的精度就不高,算法价值不大。为了解决类不平衡学习问题,许多改进的提高分类性能的技术被提出,它们普遍称为类不平衡学习(Class Imbalance Learning,简称CIL)方法。许多应用都面临CIL 问题,如脸部识别,故障诊断,奇异点检测,邮件分类等。近年来CIL课题受到越来越多学者的关注。
数据样本中正类和负类样本数不平衡,即存在多数类和少数类时,CIL问题就出现了。One-class classification(OCC)的思想被提出并用来解决CIL。在OCC中,负类样本被视为异常值。One-class support vector machine(OCSVM)为OCC算法的典型代表。 OCSVM算法广泛应用于故障检测,文件分类,奇异点检测等等。
然而经典的SVM仅有一个正则化参数,在处理类不平衡数据时,没有高效的策略来调整边界到理想位置。分类边界会倾斜到多数类,少数类的性能指标会下降。为了消除这个问题,给正类和负类的松弛变量加以不同正则化参数的方法被提出,这个方法是分别用C+和C-衡量正类和负类误分类的代价,使类不平衡对分类器造成的影响降低。另外一种用于CIL的方法是z-SVM,在生成SVM模型后,通过改变偏差b,决策边界朝少数类移动,提升了分类性能。但是如何选择最佳的z却是一个困扰的问题,需要更深入的研究。
用等式约束代替不等式约束,随之提出最小二乘支持向量机。和经典的SVM相比,LSSVM的缺点是非稀疏化的,这个缺点限制了算法的预测速度。有许多快速稀疏化的方法用来解决LSSVM的稀疏性问题,然而这些技术经常会忽略非支持向量产生的约束。一般来说,完全忽略这部分约束是不合理的。约简技术就是用来解决这个困境的,在优化时它考虑了所有的约束。约简技术的方法是随机选择1-10%的训练样本作为支持向量集。然而这种随机选取支持向量的方法会降低分类器的泛化能力。
发明内容
发明目的:为克服在处理类标准SVM、LSSVM分类效果不佳的问题,本发明对正常类样本和故障类样本分别添加不同的正则化参数C+和C-以保持分类边界位于理想位置,建立分类效果优良的分类器,消除了经典的SVM和LSSVM对所有误差都是同一个惩罚系数而不便调整分类边界的缺陷。用迭代策略和约简策略相结合的方法实现算法的稀疏化,Cholesky分解方法解决迭代策略中矩阵求逆导致结果不稳定的问题及缩短训练时间。
技术方案:
一种基于Cholesky分解的最小二乘支持向量机学习算法,分别对正类样本和负类样本的松弛变量加以不同的正则化参数,包括如下步骤:
步骤1:建立最小二乘支持向量机的数学模型:
Figure GDA0003300719630000021
其中x是样本,Y=[y1,...,yi,...,yN+,y1,...,yj,...,yN-]T是样本的标签,N表示样本的规模, N+表示正类样本的规模,N-为负类样本的规模,N=N++N-,ξ=[ξ1,...,ξi,...,ξN+1,...,ξj,...,...,ξN-]T代表样本松弛变量,C+和C-是正则化参数,
Figure GDA0003300719630000031
是一个非线性变换,用来把输入空间中的非线性拟合问题转化为高维特征空间中的线性拟合问题。
构造Lagrange函数:
Figure GDA0003300719630000032
其中,α=[α1,...,αi,...,αN+1,...,αj,...,αN-]T为Lagrange乘子,由Karush-Kuhn-Tucker 条件可以得到下式:
Figure GDA0003300719630000033
消去式(3)中的ξi、ξj和w,得到如下的线性方程组
Figure GDA0003300719630000034
其中
Figure GDA0003300719630000035
Figure GDA0003300719630000036
1=[1,...,1]T,I为适宜维度的单位矩阵,k(·,·)为核函数,α为Lagrange乘子,b为偏差。
步骤2:利用约简技术约简最小二乘支持向量机:
Figure GDA0003300719630000037
S表示支持向量的索引集,并代入式(2),得到:
Figure GDA0003300719630000041
Figure GDA0003300719630000042
Figure GDA0003300719630000043
可得:
Figure GDA0003300719630000044
其中
Figure GDA0003300719630000045
Figure GDA0003300719630000046
算子⊙表示Hadamard积。
步骤3:将式(6)中矩阵
Figure GDA0003300719630000047
进行Cholesky分解,采用迭代策略求解式(6)得到模型参数(α,b)。
若矩阵
Figure GDA0003300719630000048
是奇异的,对其正则化Z+μI使矩阵非奇异,μ=10-6
假设给定下三角矩阵
Figure GDA0003300719630000049
满足下列Cholesky分解:
Figure GDA00033007196300000410
式(7)为第n步更新,当样本xq选为支持向量时,第n+1步更新为:
Figure GDA00033007196300000411
其中
Figure GDA00033007196300000412
Figure GDA00033007196300000413
第n步迭代时,由式(6)可计算得到
Figure GDA00033007196300000414
第n+1步迭代时,上式更新为
Figure GDA0003300719630000051
步骤4:根据
Figure GDA0003300719630000052
得到如下决策函数:
Figure GDA0003300719630000053
优选的,采用迭代策略从样本索引集Q中选出支持向量索引q,训练样本中与索引对应的样本作为支持向量xq
在第n步时,式(5)简化成为下式:
Figure GDA0003300719630000054
固定
Figure GDA0003300719630000055
和bn不变,式(14)转化成:
Figure GDA0003300719630000056
其中
Figure GDA0003300719630000057
Figure GDA0003300719630000058
Figure GDA0003300719630000059
式(15)的最优值是:
Figure GDA00033007196300000510
通过下式从样本索引集Q中选出支持向量索引q到支持向量索引集S中:
Figure GDA00033007196300000511
迭代初始时刻Q={1,2,...,N},
Figure GDA0003300719630000061
q被选为支持向量索引后,S=S∪{q},Q=Q\{q}。
迭代停机标准为n>M或者
Figure GDA0003300719630000062
M为支持向量个数,ε为数量级为10-4的正数。
优选的,所述C+和C-通过十折交叉验证的方法选取,对应的备选集分别为 {103,2·103,...,104}、{105,106,...,1010}。
上述算法在航空发动机故障检测中的应用,包括如下步骤:
步骤1:采集全飞行包线内,航空发动机各部件正常状态下的样本,记为正类样本,故障状态下的参数样本,记为负类样本;
步骤2:将样本归一化后,将样本与其对应的样本标签作为训练样本训练最小二乘支持向量机;
步骤3:用最小二乘支持向量机对航空发动机各部件进行故障检测。
有益效果:类不平衡学习问题中,对正常类和故障类样本引入两个不同的正则化参数改善经典LSSVM的分类性能;迭代策略和约简技术相结合使算法稀疏化满足航空发动机故障检测对实时性的要求;再采用Cholesky分解保证了发明算法的稳定性,减少了算法的训练时间,并使性能指标G-mean优秀,提升了算法分类效果。
附图说明
图1为CFRRLSSVM-CIL算法流程图。
图2为航空发动机主要部件。
图3.1-3.4为不同情况下四个算法性能比较图。
具体实施方式
航空发动机故障检测中,把正常误诊为故障的代价和故障误诊为正常的代价是不同的,因而本发明对正常样本的误差和故障样本的误差给以不同的正则化参数C+和C-实现分类边界的优化。得到的数学模型为
Figure GDA0003300719630000063
其中Y=[y1,...,yi,...,yN+,y1,...,yj,...,yN-]T是样本的标签,ξ=[ξ1,...,ξi,...,ξN+1,...,ξj,...,...,ξN-]T代表松弛变量,其中的N=N++N-,C+和C-是正则化参数,
Figure GDA0003300719630000077
是一个非线性变换,用来把输入空间中的非线性拟合问题转化为高维特征空间中的线性拟合问题。为解决这个优化问题,构造一个Lagrange函数:
Figure GDA0003300719630000071
其中α=[α1,...,αi,...,αN+1,...,αj,...,αN-]T为Lagrange乘子。由Karush-Kuhn-Tucker (KKT)条件可以得到下式:
Figure GDA0003300719630000072
消去式(3)中的ξi、ξj和w,可以得到如下的线性方程组
Figure GDA0003300719630000073
其中
Figure GDA0003300719630000074
Figure GDA0003300719630000075
Figure GDA0003300719630000076
1=[1,...,1]T,I为适宜维度的单位矩阵,k(·,·)为核函数,求解式(4)可以得到如下决策函数来预测新样本:
Figure GDA0003300719630000081
由式(3)中αi=C+ξi、αj=C-ξj可知,只要训练误差ξi、ξj不为零,αi、αj就不为零。一般情况下训练误差几乎不可能为零,那么αi、αj就不会为0,这就意味着所有的训练样本几乎都是支持向量。在处理数据量小的训练样本时算法无不良影响。当训练样本数足够大时,决策函数的运算时间会大大增加,式(5)的实时性能会下降。在对实时性要求高的应用中,就有必要提高LSSVM的实时性,也即对该算法进行稀疏化。
本发明实现算法稀疏性的方法是迭代策略和约简的技术相结合,得到迭代约简最小二乘支持向量机(Recursive Reduced Least Squares Support Vector Machine,简称RRLSSVM)。由式(3)中
Figure GDA0003300719630000082
N=N++N-。可知w与整个训练样本集都相关,这就导致经典LSSVM的解缺乏稀疏性。为解决这个问题,采用约简策略,强制令
Figure GDA0003300719630000083
其中
Figure GDA0003300719630000084
S为选择子集索引的集合,并代入式(2)中可以得到:
Figure GDA0003300719630000085
Figure GDA0003300719630000086
Figure GDA0003300719630000087
可得:
Figure GDA0003300719630000088
其中Kij=k(xi,xj)(i,j∈S),
Figure GDA0003300719630000089
Figure GDA00033007196300000810
若矩阵
Figure GDA00033007196300000811
是奇异的,可以对其进行正则化处理 Z+10-6I。通过求解式(6),可以由如下决策函数预测新样本:
Figure GDA00033007196300000812
由式(8)知,子集{(xi,yi)}i∈S未知。如果随机选取子集{(xi,yi)}i∈S,这会导致LSSVM 的稀疏性不够或者泛化能力不够。因而子集的选择非常重要,选择到子集中的样本应该能充分代表整个样本训练集的特征,即在构成约简LSSVM的模型中起到关键性的作用。下一步就采用迭代策略选择对目标函数贡献大的样本作为支持向量,最终得到子集{(xi,yi)}i∈S
式(6)改写成:
Figure GDA0003300719630000091
将式(9)展开如下:
Figure GDA0003300719630000092
如果在第(n+1)步xq被作为支持向量,则
Figure GDA0003300719630000093
其中
Figure GDA0003300719630000094
Figure GDA0003300719630000095
在第n步时,
Figure GDA0003300719630000096
已知,由Sherman-Morrison公式可以得到下式:
Figure GDA0003300719630000097
其中
Figure GDA0003300719630000098
根据式(12),在第(n+1) 步,αn+1和bn+1可以由下式得到:
Figure GDA0003300719630000099
在第n步时,
Figure GDA00033007196300000910
和bn已计算出来,如下式:
Figure GDA00033007196300000911
那么将式(14)代入式(13)可以得到:
Figure GDA0003300719630000101
由式(12)和式(15)就可有效地更新U、b和α。
下面将介绍迭代策略来选择约简的子集。在第n步时,子集大小为S,且
Figure GDA0003300719630000109
和bn已经计算出来,式(9)简化成为下式:
Figure GDA0003300719630000102
固定
Figure GDA0003300719630000103
和bn不变,式(16)转化成:
Figure GDA0003300719630000104
其中
Figure GDA0003300719630000105
式(17)的最优值是:
Figure GDA0003300719630000106
这样可以通过下式从集合Q中选出索引q到子集S中,公式如下:
Figure GDA0003300719630000107
然后考虑停机标准,当集合S中元素个数达到预先定义的一个正整数M或者
Figure GDA0003300719630000108
时ε为数量级为10-4的正数,停止从集合Q中选择q。如果ε增加,集合S 的元素个数减少,反之元素个数增加。至此,结合迭代策略和约简技术,就可以提出用于类不平衡学习的RRLSSVM-CIL。
下面给出RRLSSVM-CIL算法的实现过程:
算法1:RRLSSVM-CIL
Figure GDA0003300719630000111
下面是算法RRLSSVM-CIL的收敛性证明。
定理1:式(6)中的目标函数LS随着M的增加或者ε的减小而单调下降。
证明:在第n步迭代时(此时样本xq没有被选中),式(6)的目标函数为:
Figure GDA0003300719630000112
在样本xq被选中后,此时的目标函数变为:
Figure GDA0003300719630000113
比较式(21)和(22)可知,αq=0不在式(22)的约束中,则式(21)是式(22)的一个特例,继而得到
Figure GDA0003300719630000114
证毕。
为补足迭代策略中矩阵求逆方法导致结果不稳定和时间复杂度太大的缺点,采用Cholesky分解的方法迭代更新。
定理2:假设给定下三角矩阵
Figure GDA0003300719630000115
满足下列cholesky分解:
Figure GDA0003300719630000116
式(23)为第n步更新,当样本xq选为支持向量时,第n+1步更新为:
Figure GDA0003300719630000121
其中
Figure GDA0003300719630000122
Figure GDA0003300719630000123
证明:
Figure GDA0003300719630000124
是矩阵
Figure GDA0003300719630000125
的Cholesky分解的逆,那么:
Figure GDA0003300719630000126
由Sherman-Morrison公式知:
Figure GDA0003300719630000127
其中A、B、D是适宜维度的矩阵,而且A、B可逆,那么:
Figure GDA0003300719630000128
证毕。
第n步迭代时,由式(10)可计算得到
Figure GDA0003300719630000129
第n+1步迭代时,上式更新为
Figure GDA00033007196300001210
将式(24)代入式(31)中得到:
Figure GDA0003300719630000131
那么S=S∪{q}且Q=Q\{q}。当算法不满足停机准则时,继续执行选择新的索引。
下面是CFRRLSSVM-CIL算法的实现过程:
算法2:CFRRLSSVM-CIL
Figure GDA0003300719630000132
由式(24)可知,当选择一个新的支持向量时,更新分解矩阵的逆的计算代价是O(nN+n2),如果
Figure GDA0003300719630000133
是从零开始计算,要包含Cholesky分解矩阵
Figure GDA0003300719630000134
和求解它的逆,那么计算复杂度是O(nN+n3)。因此缓解了计算压力,比RRLSSVM-CIL算法更优。
选择Radial-Basis Function(RBF)核函数
Figure GDA0003300719630000135
用于这些算法训练。然后LSSVM和LSOCSVM算法分别从备选集{101,102,...,1010}和{2-3,2-2,...,20,...23} 中选择最优的正则化参数C和σ。对于RRLSSVM-CIL和CFRRLSSVM-CIL算法,需要同时优化正则化参数C+、C-和σ,其对应的备选集分别为{103,2·103,...,104}、{105,106,...,1010}、 {2-3,2-2,...,20,...23}。所有算法中选择最优参数的方法是十折交叉验证。十折交叉验证用来测试算法的准确性,是常用的测试方法。具体做法是,将数据集等分成十份,轮流将其中的9份作为训练集,1份作为测试集进行试验。试验选
Figure GDA0003300719630000136
(TP代表预测为正且标签为正的样本数,TN代表预测为负且标签为负的样本数,FP代表预测为正但标签为负的样本数,FN代表预测为负但标签为正的样本数)作为评价算法好坏的性能指标,每次试验都会得出相应的G-mean。10次结果的G-mean平均值作为对算法性能的估计,对每一组C+、C-和σ都有一个估计的G-mean值,最大的G-mean值对应的那一组参数即为实验选取到的最优参数。
所有实验都在配置为IntelR CoreTM、i5-7400 CPU、3.00GHz主频、8G内存、Windows10系统和MATLAB2016a版本的台式电脑上执行。
本发明用双转子涡轮喷气发动机做测试,如图2所示,该发动机主要部件包括进气道,低压压气机(Low Pressure Compressor,简称LPC),高压压气机(High PressureCompressor,简称HPC),燃烧室,高压涡轮(High Pressure Turbine,简称HPT),低压涡轮(Low Pressure Turbine LPT)和尾喷管。2表示进气道出口,22表示低压压气机出口,3表示高压压气机出口,42表示高压涡轮出口,46表示低压涡轮出口。气流经进气道流入压气机,通过低压压气机和高压压气机后气体为高压气。在燃烧室内,燃油喷入并和高压气体混合燃烧形成混合气,混合气流经高压涡轮和低压涡轮时,通过高压轴和低压轴分别相连的高压压气机和低压压气机被驱动。最终热气以高速排入大气中。
与航空发动机转子相连的LPC,HPC,HPT和LPT在高转速下易发生故障,因此仅考虑这四个部件出现的故障。实验前收集全飞行包线的仿真数据,其中包含2324个正常状态样本,2321个LPC故障样本,2325个HPC故障样本,2333个HPT故障样本和2349个LPT故障样本。把正常状态归为正类,其余故障归为负类,即为二分类问题。每个样本有14维,分别是飞行高度、飞行马赫数、高压转子转速、低压转子转速、T22、 P22、T3、P3、T42、P42、T46、P46、压比(T46/T2)和燃油流量,其中T22表示低压压气机出口温度,P22表示低压压气机出口压力,其余参数是依照相同的规则命名。实验前对样本归一化处理。实际上航空发动机故障类数据难以获得,故障样本是少于正常样本的,因此航空发动机的故障检测是一个类不平衡问题。为进行多次试验,调整类不平衡的比例(正类/负类)分别为5、10、15和20,共4种情况。把每一类的数据集随机划分为训练集和测试集。对于航空发动机实例,把故障判为正常的代价是非常巨大的,这是在航空发动机故障检测中不希望看到的结果。综合考虑正常和故障的查准率或查全率是合理的,那么用G-mean作为评价指标就能同时关注到预测为正常和故障的情况,并能评价分类器的性能。
由图3.1-3.4可知,从G-mean稳定值看,LSSVM值比LSOCSVM大,LSSVM算法比LSOCSVM好。而且CFRRLSSVM-CIL算法的值远高于LSSVM、LSOCSVM、 RRLSSVM-CIL三种,这表明CFRRLSSVM-CIL算法几乎完全正确预测出正常样本和故障样本,Cholesky分解方法使预测效果显著提高。RRLSSVM-CIL和CFRRLSSVM-CIL 算法的G-mean值比LSSVM大,意味着引入两个不同的正则化参数分别作用于正常类松弛变量和故障类松弛变量这种思路把分类边界调整得更优,是可行且有效的。与 LSSVM、LSOCSVM、RRLSSVM-CIL算法相比,CFRRLSSVM-CIL需要更少的支持向量但同时保持了优秀的性能,CFRRLSSVM-CIL和RRLSSCMCIL算法实现了稀疏化,这会减少预测时间,达到提高航空发动机故障检测的实时性目的。与RRLSSVM-CIL算法相比,CFRRLSSVM-CIL在支持向量逐渐增加时,G-mean值是稳定上升的,而RRLSSVM-CIL随着支持向量个数变化G-mean值上下波动,CFRRLSSVM-CIL弥补了算法迭代策略中求矩阵的逆使结果不稳定的缺陷。通过以上分析,航空发动机故障检测算法优劣排序为CFRRLSSVM-CIL>RRLSSVM-CIL>LSSVM>LSOCSVM。
一般情况下支持向量个数越多,算法的性能越佳。但是随着支持向量个数增多,测试时间严重增加,这使算法缺乏实时性。为克服这个缺点,本发明提出的约简技术和迭代策略相结合的方法来减少支持向量个数被证实是高效的。由表1可知,从测试时间看,四种情况的结果均表明RRLSSVM-CIL和CFRRLSSVM-CIL算法的测试时间远低于 LSSVM、LSOCSVM算法。这表明约简技术和迭代策略相结合的方法的确减少了支持向量的个数。对实时性要求严格的航空发动机故障检测,RRLSSVM-CIL和 CFRRLSSVM-CIL算法是适用的。从训练时间看,LSSVM和LSOCSVM算法的训练时间远小于RRLSSVM-CIL和CFRRLSSVM-CIL算法,因为LSSVM和LSOCSVM只需求解一个线性方程组,而提出的算法RRLSSVM-CIL和CFRRLSSVM-CIL要多次迭代求解线性方程组。比较RRLSSVM-CIL和CFRRLSSVM-CIL算法,后者所需时间比前者少,表明Cholesky分解方法求解矩阵的逆降低了时间计算复杂度。从G-mean值看,达到最大值时,CFRRLSSVM比RRLSSVM-CIL所需的支持向量个数少,而LSSVM和 LSOCSVM算法往往达不到该值。但是LSOCSVM比LSSVM好。综合以上分析可知, CFRRLSSVM-CIL和RRLSSVM-CIL算法都能很好地用于航空发动机故障检测,而且 CFRRLSSVM-CIL算法更优。
表1航空发动机数据实验结果
Figure GDA0003300719630000161
注:表中case1、case2、case3和case4分别对应类不平衡比为5、10、15、20这四种情况,#SV表示支持向量个数。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (3)

1.基于Cholesky分解的最小二乘支持向量机学习算法的航空发动机故障检测方法,其特征在于,包括如下步骤:
步骤1:采集全飞行包线内,航空发动机各部件正常状态下的参数,记为正类样本,故障状态下的参数,记为负类样本;
步骤2:将样本归一化后,将样本与其对应的样本标签作为训练样本训练基于Cholesky分解的最小二乘支持向量机;
步骤3:用基于Cholesky分解的最小二乘支持向量机判断航空发动机新样本属于正类样本还是负类样本;
步骤2分别对正类样本和负类样本的松弛变量加以不同的正则化参数,包括如下步骤:
步骤2.1:建立最小二乘支持向量机的数学模型:
Figure FDA0003300719620000011
其中x是样本,
Figure FDA0003300719620000014
是样本的标签,N表示样本的规模,N+表示正类样本的规模,N-为负类样本的规模,N=N++N-
Figure FDA0003300719620000015
代表样本松弛变量,C+和C-是正则化参数,
Figure FDA0003300719620000012
是一个非线性变换,用来把输入空间中的非线性拟合问题转化为高维特征空间中的线性拟合问题;
构造Lagrange函数:
Figure FDA0003300719620000013
其中,
Figure FDA0003300719620000016
为Lagrange乘子,由Karush-Kuhn-Tucker条件得到下式:
Figure FDA0003300719620000021
消去式(3)中的ξi、ξj和w,得到如下的线性方程组
Figure FDA0003300719620000022
其中
Figure FDA0003300719620000023
Figure FDA0003300719620000024
Figure FDA0003300719620000025
Figure FDA00033007196200000214
1=[1,...,1]T,I为适宜维度的单位矩阵,k(·,·)为核函数,α为Lagrange乘子向量,b为偏差;
步骤2.2:利用约简技术约简最小二乘支持向量机:
Figure FDA0003300719620000027
S表示选取的支持向量的索引集,q表示集合S中的元素,并代入式(2),得到:
Figure FDA0003300719620000028
Figure FDA0003300719620000029
Figure FDA00033007196200000210
可得:
Figure FDA00033007196200000211
其中,
Figure FDA00033007196200000212
Figure FDA00033007196200000213
算子⊙表示Hadamard积;
步骤2.3:将式(6)中矩阵
Figure FDA0003300719620000031
进行Cholesky分解,采用迭代策略求解式(6)得到模型参数(α,b);
若矩阵
Figure FDA0003300719620000032
是奇异的,对其进行正则化处理Z+μI,μ=10-6
假设给定下三角矩阵
Figure FDA0003300719620000033
满足下列Cholesky分解:
Figure FDA0003300719620000034
式(7)为第n步更新,当样本xq选为支持向量时,第n+1步更新为:
Figure FDA0003300719620000035
其中
Figure FDA0003300719620000036
Figure FDA0003300719620000037
Figure FDA0003300719620000038
Figure FDA0003300719620000039
第n步迭代时,由式(6)可计算得到
Figure FDA00033007196200000310
Figure FDA00033007196200000311
S代表已选择支持向量的索引集合;
第n+1步迭代时,上式更新为
Figure FDA00033007196200000312
步骤2.4:根据
Figure FDA0003300719620000041
得到如下决策函数:
Figure FDA0003300719620000042
所述C+和C-通过十折交叉验证的方法选取,并以
Figure FDA0003300719620000043
作为评价基于Cholesky分解的最小二乘支持向量机学习算法好坏的性能指标,TP代表预测为正且标签为正的样本数,TN代表预测为负且标签为负的样本数,FP代表预测为正但标签为负的样本数,FN代表预测为负但标签为正的样本数。
2.根据权利要求1所述的方法,其特征在于,采用迭代策略从样本索引集Q中选出支持向量索引q,训练样本中与索引对应的样本作为支持向量xq
在第n步时,式(5)简化成为下式:
Figure FDA0003300719620000044
固定
Figure FDA0003300719620000045
和bn不变,式(14)转化成:
Figure FDA0003300719620000046
其中
Figure FDA0003300719620000047
Figure FDA0003300719620000048
Figure FDA0003300719620000049
Figure FDA00033007196200000410
Figure FDA00033007196200000411
式(15)的最优值是:
Figure FDA00033007196200000412
则通过下式从样本索引集Q中选出支持向量索引q到支持向量索引集S中:
Figure FDA0003300719620000051
迭代初始时刻Q={1,2,...,N},
Figure FDA0003300719620000052
q被选为支持向量索引后,S=S∪{q},Q=Q\{q};迭代停机标准为n>M或者
Figure FDA0003300719620000053
M为支持向量个数,ε为数量级为10-4的正的常数值。
3.根据权利要求1所述的方法,其特征在于,所述C+和C-通过十折交叉验证的方法选取,对应的备选集分别为{101,102,103,104}、{105,106,...,1010}。
CN201810052864.6A 2018-01-19 2018-01-19 基于Cholesky分解的最小二乘支持向量机学习算法及其应用 Expired - Fee Related CN108509973B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810052864.6A CN108509973B (zh) 2018-01-19 2018-01-19 基于Cholesky分解的最小二乘支持向量机学习算法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810052864.6A CN108509973B (zh) 2018-01-19 2018-01-19 基于Cholesky分解的最小二乘支持向量机学习算法及其应用

Publications (2)

Publication Number Publication Date
CN108509973A CN108509973A (zh) 2018-09-07
CN108509973B true CN108509973B (zh) 2022-04-05

Family

ID=63374954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810052864.6A Expired - Fee Related CN108509973B (zh) 2018-01-19 2018-01-19 基于Cholesky分解的最小二乘支持向量机学习算法及其应用

Country Status (1)

Country Link
CN (1) CN108509973B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726230B (zh) * 2018-12-04 2021-06-01 重庆大学 一种大数据分析模型预测发动机性能的方法
CN110826587B (zh) * 2019-08-15 2024-03-19 南京航空航天大学 基于改进的加权一类支持向量机的涡轴发动机故障检测方法
CN110795732A (zh) * 2019-10-10 2020-02-14 南京航空航天大学 基于SVM的Android移动网络终端恶意代码的动静结合检测方法
CN111104986B (zh) * 2019-12-25 2023-09-29 南京航空航天大学 一种基于部件特征的航空发动机多故障并发诊断方法
CN111368370A (zh) * 2020-03-04 2020-07-03 南京航空航天大学 基于类特定重定向极限学习机学习算法的航空发动机故障诊断方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101980202A (zh) * 2010-11-04 2011-02-23 西安电子科技大学 不平衡数据的半监督分类方法
CN103983453A (zh) * 2014-05-08 2014-08-13 南京航空航天大学 一种航空发动机的执行机构和传感器故障诊断的区分方法
KR20160029252A (ko) * 2014-09-05 2016-03-15 국방과학연구소 패턴 인식을 이용한 평판 구조물의 결함 위치 탐지 방법 및 그 장치
CN105628383A (zh) * 2016-02-01 2016-06-01 东南大学 基于改进型lssvm迁移学习的轴承故障诊断方法和系统
CN105893256A (zh) * 2016-03-30 2016-08-24 西北工业大学 基于机器学习算法的软件故障定位方法
CN106126482A (zh) * 2016-07-01 2016-11-16 西安电子科技大学 鲁棒最小二乘支持向量机稀疏解的求解方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101980202A (zh) * 2010-11-04 2011-02-23 西安电子科技大学 不平衡数据的半监督分类方法
CN103983453A (zh) * 2014-05-08 2014-08-13 南京航空航天大学 一种航空发动机的执行机构和传感器故障诊断的区分方法
KR20160029252A (ko) * 2014-09-05 2016-03-15 국방과학연구소 패턴 인식을 이용한 평판 구조물의 결함 위치 탐지 방법 및 그 장치
CN105628383A (zh) * 2016-02-01 2016-06-01 东南大学 基于改进型lssvm迁移学习的轴承故障诊断方法和系统
CN105893256A (zh) * 2016-03-30 2016-08-24 西北工业大学 基于机器学习算法的软件故障定位方法
CN106126482A (zh) * 2016-07-01 2016-11-16 西安电子科技大学 鲁棒最小二乘支持向量机稀疏解的求解方法

Also Published As

Publication number Publication date
CN108509973A (zh) 2018-09-07

Similar Documents

Publication Publication Date Title
CN108509973B (zh) 基于Cholesky分解的最小二乘支持向量机学习算法及其应用
Xi et al. Least squares support vector machine for class imbalance learning and their applications to fault detection of aircraft engine
US9818242B2 (en) Gas turbine engine anomaly detections and fault identifications
CN109359668B (zh) 一种航空发动机多故障并发诊断方法
Chen et al. Interval analysis of the standard of adaptive cycle engine component performance deviation
Joly et al. Machine learning enabled adaptive optimization of a transonic compressor rotor with precompression
Ying et al. Nonlinear steady-state model based gas turbine health status estimation approach with improved particle swarm optimization algorithm
Kim et al. Adaptation method for overall and local performances of gas turbine engine model
CN111160457B (zh) 基于软一类极限学习机的涡轴发动机故障检测方法
Chang et al. Classifier utility modeling and analysis of hypersonic inlet start/unstart considering training data costs
Miro et al. Reliability analysis of an axial compressor based on one-dimensional flow modeling and survival signature
Antonopoulos et al. WEAK CHAOS DETECTION IN THE FERMI–PASTA–ULAM-α SYSTEM USING q-GAUSSIAN STATISTICS
Zheng et al. Aero-engine dynamic model based on an improved compact propulsion system dynamic model
Zhang et al. Support vector regression-based multidisciplinary design optimization in aircraft conceptual design
CN114077867A (zh) 一种基于可迁移神经网络的航空发动机故障诊断方法
Sureshbabu et al. Deep-Learning Methods for Non-Linear Transonic Flow-Field Prediction
Yu et al. A novel modeling method for aircraft engine using nonlinear autoregressive exogenous (NARX) models based on wavelet neural networks
Viale et al. Least squares smoothed k-nearest neighbors online prediction of the remaining useful life of a NASA turbofan
Chang et al. Operation pattern classification of hypersonic inlets
Zheng et al. Surge Fault Detection of Aeroengines Based on Fusion Neural Network.
Joly et al. Machine learning enabled adaptive optimization of a transonic compressor rotor with pre-compression
Zhang et al. Optimization of cycle parameters of variable cycle engine based on response surface model
Ivanov et al. Fast Compressor Map Computation by Utilizing Support Vector Machine and Response Surface Approximation
Wang et al. A multi-input based full envelope acceleration schedule design method for gas turbine engine based on multilayer perceptron network
Ramerth et al. A Probabilistic Secondary Flow System Design Process for Gas Turbine Engines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20220405

CF01 Termination of patent right due to non-payment of annual fee