一种矿井提升机无线传输的故障诊断系统及方法
技术领域
本发明涉及一种矿井提升机无线传输的故障诊断系统及方法,属于煤矿机械设备监测领域。
背景技术
矿井提升机是煤矿生产的关键核心设备,主要由电机、减速器、滚筒、天轮、液压制动等部分组成。从振动、压力、温度等机械运行参数提取故障有关信息,实现对矿井提升机的运行状态的监测,是当前提升机故障监测研究的主要内容。大量的生产实践和理论研究表明,70%以上的故障都隐藏子在振动信号中。然而设备温度测量信号带有很多重要的设备状态信息,能够在一定程度上反映故障的部位和程度的有效因素,可以用于不同故障类型的分析。比如轴承发生故障时,回油温度、振动信号往往均会发生变化。润滑油量不足导致摩擦、一些内部和外部环境或工况以及不对中均会影响温度值,因此综合使用温度信号可以提高设备故障监测的准确性和可靠性。
无线传感器网络是综合了多个学科而发展起来的一种新兴交叉技术,并且已经广泛应用于建筑与城市管理、环境科学、航空航天、工业制造业、军事、智能农业、核科学和煤矿安全监测等领域。其中,由于无线传感器网络技术在我国的飞速发展,在一定程度上已经开始应用于煤矿安全领域。随着微传感器技术、数字电子线路技术、嵌入式技术和无线通信技术的飞速发展和日益成熟,具有感知、计算和通信能力的微型智能传感器开始在世界范围内广泛出现,由此构成的微传感器网络引起了研究人员们极大关注,得到了深入的研究和发展。无线传感器网络可以使人们在全天候情况下获取其感兴趣的大量详实、可靠的信息,实现“无处不在的计算”理念。经过一段时间的研究发展,无线传感器网络已经广泛的应用到国家安全、环境监测、国防军事、公共交通、医疗卫生、工业制造业、高危区域的远程控制及抗灾反恐等领域。无线传感器网络的发展受到包括能量供应、存储数据量、数据处理能力、数据传输速率、同步率、系统鲁棒性等诸多条件的限制和挑战。为提高无线传感器网络性能,需要对资源管理和信息融合两部分进行研究和优化。资源管理主要优化网络性能、减少网络能耗、提高网络稳定性等。
发明内容
发明目的:针对以上问题,本发明提出一种矿井提升机无线传输的故障诊断系统及方法,解决了振动信号无线传输的需求,通过该矿井提升机无线传输的故障诊断方法,实现了提升机各部件振动信号特征的提取,实现了对提升系统的机械早期故障监测。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:一种矿井提升机无线传输的故障诊断系统,该系统包括信号采集模块、无线信号传输模块、信号调理模块、工业控制计算机、以太网、远程工业控制计算机组成:
所述的信号采集模块,包括安装在天轮轴承上的振动传感器,用于采集天轮轴承的振动信号、安装在电机轴承上的振动传感器,用于采集电机轴承上的振动信号、安装在减速器上的振动传感器,用于采集减速器上的振动信号、安装在滚筒轴承上的振动传感器,用于采集滚筒轴承上的振动信号、安装在电气控制柜内的温度传感器,用于采集电气控制柜内部的异常温度信号;
所述的无线信号传输模块,包括Zigbee网络和Zigbee信息接收处理终端组成,是通过Zigbee网络将天轮上采集的振动信号通过无线网络实现数据的传输;
所述的信号调理模块,实现对振动信号的调理处理,进行抗干扰处理;
所述的工业控制计算机,实现信号的诊断处理,其处理算法为设计的噪声自适应完全集成局部均值分解算法,并对数据进行处理同时对井下安全状况作出评估。上位机软件安装在工业控制计算机上,该上位机软件为具有数据处理的计算中心。该数据处理中心还要具有数据库管理系统功能,能对历史数据储存、查询、打印报表等功能;
所述的以太网,实现对故障诊断数据的远程传输,用于监测机械设备故障的工业控制计算机接入矿区的以太网,将数据发布到网上,供远程客户访问查询;
所述的远程工业控制计算机,具备与用于天轮振动信号采集的ZigBee采集终端进行通讯的功能。该终端将起网关作用,将Zigbee协议转换为以太网协。
此外,本发明还提出一种由上述系统实现的一种矿井提升机无线传输的故障诊断方法,该方法包括以下步骤:
步骤1:信号采集与初始参数,获取提升机系统的天轮、电机、减速器和滚筒上的轴承振动信号,并设置SKSFDA模型初始参数及CELMDAN算法参数;
步骤2:多成分信号分离,使用完备总体局部均值分解(CELMDAN)方法对振动信号进行分解,从多成分、原始时域振动信号中自适应分离出纯调频信号和包络信号,由此得到多个具有物理意义的PFs分量,PFs分量的瞬时幅值和瞬时频率包含振动信号瞬态特征信息,以突出机械设备运行中的振动信号状态特征;
步骤3:选取乘积函数(PFs)及特征抽取,计算每个PF的周期调制强度(PMI),根据PMI值选择PFs作为重要的信号成分,从而达到消除原始信号噪声、抽取与机械状态密切信号成分的目的;然后从PFs信号的时域和频域抽取统计量和信息熵作为信号特征,生成机械状态的训练数据集和测试数据集;
步骤4:确定核慢特征判别分析(SKSFDA)模型参数,使用基于类内局部结构测度最小、全局部结构测度最大准则以确定最优SKSFDA模型核函数参数,提高算法性能;
步骤5:构建SKSFDA模型,使用SKSFDA对机械状态训练和测试数据集进行训练建立SKSFDA模型,根据SKSFDA模型把原始数据集进行维数约简,得到具有保持全局和局部数据鉴别几何结构的低维数据集;
步骤6:构建监测统计量,计算基于Bayesian推理的监测统计量并确定预设百分比置信度下的阈值,根据监测统计量超出阈值判别是否出现新故障,若无发现新故障则使用KNN分类器确定当前提升机设备的运行状态。
其中,所述步骤3中,从PF中抽取时域特征参数计算公式为:
时域特征1:
时域特征2:
时域特征3:
其中,均值方差pfi(n)为CLMDAN对信号分解得到的第i个乘积函数分量PF;
(2)频域特征计算公式为假设信号频谱为s(k),fk表示kth谱线的值,k=1,2,…,K,K为功率谱项的数量,那么频域特征计算公式为:
平均频率:
平均能量:
频率标准差特征值:
上述三个统计量分别表示信号在频域上的平均频率、平均能量、频率标准差特征值;
LMD信息熵是振动信号的复杂度和各个频段上能量分布能够在一定程度上反映振动信号的规则程度以及特征,因此从分解的乘积函数(PFs)中抽取信息熵特征作为机械故障诊断的判断依据;
1)乘积函数奇异熵
令pfi(n)为CLMDAN对信号分解得到的第i个乘积函数分量PF,DM×N∈RM×N为由pfi(n)构成的矩阵,对DM×N进行奇异值分解并有B个非负奇异值Λj,j=1,2,…,B,那么用乘积函数时频熵定义为用pj描述了该乘积函数信号熵贡献率在总频率成分的百分比;
2)乘积函数时频熵
根据分析信号的时频矩阵DM×N,根据时间参数n和测量参数i定义如下两个向量其中,n=1,2,…,N,i=1,2,…,M,N表示信号PF的数据点数,M为乘积函数(PFs)的数量;
那么PFTFE定义为:
3)乘积函数能量熵
PF能量熵的定义为:
其中,表示能量概率,
其中,所述步骤5中,具体的SKSFDA模型构建步骤为:
为了区分判断故障的类型,将已知的故障样本按照故障类型进行标记,假设标记样本和未标记数据集分别记为XL与XU,全体数据集记为X=[XL,XU],假设标记数据集XL包含C类数据集,第c类的样本数据集记为Nc表示样本集Xc中样本的数量,表示标记样本数量,首先通过非线性映射φ(·)把样本数据映射到高维特征空间,令对每个训练样本把非线性的从样本Bc中移出,然后使用Bc的其余样本集对进行线性表示;根据稀疏表示理论,由Bc对样本重构的权重通过下面基于l1-范数的最优重构问题求得其过程如下:
其中,表示满足Mercer条件的核函数,比如高斯核函数、小波核函数、多项式核函数等,本文选取平移不变小波函数ψ(x)=(d-x2/σ2)exp(-x2/(2σ2))作为仿真实验使用的核函数,其中d为x的维数,σ核函数的尺度系数,求解上述优化问题后,对进行填0扩展使得其中,B=[B1,B2,…,Bc,BU]表示所有标记和未标记样本集组成字典,Bu为未标记高维样本数据形式,令假设给定投影变换矩阵W,根据稀疏鉴别嵌入理论和流形学习理论,类内散度矩阵Sw被定义样本在原始高维空间到低维嵌入空间中被同类样本稀疏重构残差量,其类内散度矩阵Sw定义如下:
其中,W表示给定投影变换矩阵,代表了维数变换的结构,表示流形内相似性矩阵Gw∈RN×N的元素,其定义为:
其中,l(xi)表示样本xi的类别标记,l(xi)=l(xj)=c,表示样本xi和xj均属于第c类,令表示从XL移出Xc后的数据集,对每个训练样本由对线性表示的最优权重可通过求解下面优化问题:
其中,l(xi)表示样本xi的类别标记,l(xi)=l(xj)=c,表示样本xi和xj均属于第c类,令表示从XL移出Xc后的数据集,对每个训练样本由对线性表示的最优权重可通过求解下面优化问题:
其中,rj为线性表示的权重,表示流形间分离矩阵Gb∈RN×N的元素,其定义如下:
其中,样本类标签为C+1时表示该样本为未标签样本,那么对样本φ(xi)∈B,使用φ(xi)从B移出后剩余样本线性表示φ(xi),那么重构权重向量pi可以通过求解下面的优化问题求得:
那么总体数据集散度矩阵St定义为:
其中,散度矩阵St、Sw和Sb可以写成如下形式:
其中,Sv为φ(xi)分解过程中的中间变量,即Sv=D-GVT-VG+VDVT,D为对角矩阵,其对角元素vi表示St、Sw和Sb上式中对应维数的可转置矩阵;W为投影变换矩阵;是对称矩阵,根据式(20)形式,上面三个散度矩阵可得计算结果,分别如下3个计算公式:
Sw=tr(WTBSsBTW) (21)
Sb=tr(WTBSrBTW) (22)
St=tr(WTBSpBTW) (23)
式中,sw为类内散度矩阵,sb为类间散度矩阵,st为总体散度矩阵,ss为变换前类内散度矩阵,sr为变换前类间散度矩阵,sp为变换前总体散度矩阵;
受半监督稀疏LDA算法的启发,正则化类间散度矩阵、类内散度矩阵定义为:
Srb=(1-β)Sb+βSt (24)
Srw=(1-β)Sw+βtr(WTW) (25)
其中,It表示合适维数的单位矩阵;β∈[0,1]为正则化因子,当β=1时,SSFDA退化为PCA方法;当β=0时,SFDA退化为FDA方法,半监督鉴别向量由下面的SFDA优化问题求取:
其最优解可以归结如下广义特征值问题;
((1-β)BSrBT+βBSpBT)w=λ((1-β)BSsBT+βI)w (27)
其中,λ是广义特征值,投影向量w为相应的特征向量,根据核学习机理论,投影向量w可以改用w=Bq来表示,矩阵B和矩阵q的乘积构成了矩阵向量w,q为特征矩阵向量,那么式(27)转化为如下形式:
BTB((1-β)Sr+βSp)BTBq=λBTB((1-β)Ss+βI)BTBq (28)
由于,K=BTB=[k(xi,xj)]i,j=1,2,…,N,那么上式(28)转化如下形式:
((1-β)Sr+βSp)Kq=λ((1-β)Ss+βI)Kq (29)
假设式(29)对应的广义特征值降序排列记为λ1≥λ2≥…≥λm,m为广义特征值的标号,相应的特征向量q1,q2,…,qm作为SSFDA模型的方向,如果选择公式(28)中特征向量Qr=[q1,q2,…,qr]作为鉴别分析,那么新的数据样本x通过下面形式计算鉴别向量:
式中,kx=[k(x1,x),k(x2,x),…,k(xN,x)]T为对应的各个核矩阵;
在使用核方法时,需要考虑对核矩阵K均值中心化,假设其中心化核矩阵为其计算方法为:
矩阵新样本对应的中心化核向量为:
I1×N=(1/N)1×N,IN×N=(1/N)N×N。
其中,述步骤4中,SKSFDA模型参数计算步骤为:
假设给定C类数据样本集X={X1,X2,…,XC},Xi表示第i个数据集,相应类别的数据量记为Ni,且令X/Xi表示移出Xi后的数据集,对数据样本集{Xi,X/Xi}计算Xi与Xi中的样本距离,X/Xi与X/Xi样本距离,以及Xi与X/Xi数据样本距离,并分别对上述计算结果按照升序方式进行排列,删除掉0-距离,X/Xi表示从X移出Xi后的样本集;选用坐标距离作为距离判断依据,选取αNc(Nc-1)对应的样本距离如果被测试的样本距离小于坐标距离,则属于这类样本,否则就是不属于这类样本;并用α(N-Nc)(N-Nc-1)对应样本距离作为局部结构测度,(1-α)Nc(N-Nc)对应的样本距离作为非局部结构测度,这里i=1,2,…,C,0<α≤0.5;根据定义可知,表示第i类数据集的局部测度,表示非第i类数据集的局部测度,表示第i类数据与其它类别数据集之间非局部测度;
显然在特征空间内,我们希望同类映射数据之间尽可能靠近、非同类数据之间尽可能靠近,与此同时同类数据与异类数据之间尽可能远离。一般说来,我们不建议选取a值接近0。原因是如果a取值接近0,数据集的局部和非局部结构测度分别为最小、最大,这两类值差别最大,且数据集中噪声或者在野点会影响基于局部测度与非局部测度的模型选择策略的有效性。最优径向基小波核函数参数σ*应该使得局部测度和非局部测度差别最大,即和尽可能小、尽可能大。根据上述思想,最优核函数参数σ可以通过下面优化问题求取,即中间计算过程如下:
上述优化问题具有明确的物理意义,最优模型参数值能够使得特征空间中类内数据集尽可能靠近、类间数据集尽可能远离,因此相应的模型对数据具有更好的鉴别分析能力,提高数据维数约简性能。显然上述优化问题为非凸优化问题,我们可以使用梯度下降法求取优化问题的最优解。为简单起见,我们令γ=1/2σ2,上述优化问题的目标函数可以写为diff(γ)。令d为样本距离,dst为测度标准距离,下式是通过计算diff(γ)对γ求微分:
式中,为公式(35)中的一般展开形式,那么其最优解可由下面公式迭代求取:
其中,t为迭代次数,λ为步长,由于上述优化问题是非凸优化问题,初始值直接影响对优化问题解。我们给出一种新的核函数参数初始值设定方法。该方法首先对数据样本进行归一化处理为均值为0、方差为1,然后使用下面公式确定核函数参数初始值,即
其中,所述步骤6中,监测统计量计算公式为:
其中,ω为阈值,yi为根据公式(38)来计算样本xi的鉴别向量,作为判断样本分类的标准,与Ξc分别表示第c类样本的均值和方差,SSKFDA的隐藏变量yi是高斯分布,因此,每类样本的条件概率分布使用多变量高斯分布估计:
监测统计量BID的控制上限在置信度水平γ下服从自由度为m的χ2分布,用概率的置信区间的判断标准,来判别监测统计量BID是否属于该高斯分布的可靠置信区间,在实际应用中,γ通常取95%或99%,当新样本出现时,其对应的监测统计量BID持续超过置信区间上限时,即表示系统产生了未知故障,否则,该样本属于已知类别,使用KNN分类器判断该样本属于已知类别。
有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
通过该系统可实现对无线振动信号的传输,通过该方法可以提取提升机系统的机械振动故障特征,可实现对提升机故障早期诊断识别,避免恶性故障的出现,提高了提升机系统的安全性能。
附图说明
图1是矿井提升机系统结构示意图;
图2是一种矿井提升机无线传输的故障诊断系统框图。
具体实施方式
下面结合附图和实施例对本发明的技术方案作进一步的说明。
如图1所示,本发明提出一种矿井提升机无线传输的故障诊断系统,该系统包括信号采集模块、无线信号传输模块、信号调理模块、工业控制计算机、以太网、远程工业控制计算机组成:
所述的信号采集模块,包括安装在天轮轴承上的振动传感器,用于采集天轮轴承的振动信号、安装在电机轴承上的振动传感器,用于采集电机轴承上的振动信号、安装在减速器上的振动传感器,用于采集减速器上的振动信号、安装在滚筒轴承上的振动传感器,用于采集滚筒轴承上的振动信号、安装在电气控制柜内的温度传感器,用于采集电气控制柜内部的异常温度信号;
所述的无线信号传输模块,包括Zigbee网络和Zigbee信息接收处理终端组成,是通过Zigbee网络将天轮上采集的振动信号通过无线网络实现数据的传输;
所述的信号调理模块,实现对振动信号的调理处理,进行抗干扰处理;
所述的工业控制计算机,实现信号的诊断处理,其处理算法为设计的噪声自适应完全集成局部均值分解算法,并对数据进行处理同时对井下安全状况作出评估。上位机软件安装在工业控制计算机上,该上位机软件为具有数据处理的计算中心。该数据处理中心还要具有数据库管理系统功能,能对历史数据储存、查询、打印报表等功能;
所述的以太网,实现对故障诊断数据的远程传输,用于监测机械设备故障的工业控制计算机接入矿区的以太网,将数据发布到网上,供远程客户访问查询;
所述的远程工业控制计算机,具备与用于天轮振动信号采集的ZigBee采集终端进行通讯的功能。该终端将起网关作用,将Zigbee协议转换为以太网协。
此外,本发明还提出一种矿井提升机无线传输的故障诊断方法,该方法包括以下步骤:
步骤1:信号采集与初始参数,获取提升机系统的天轮、电机、减速器和滚筒上的轴承振动信号,并设置SKSFDA模型初始参数及CELMDAN算法参数;
步骤2:多成分信号分离,使用完备总体局部均值分解(CELMDAN)方法对振动信号进行分解,从多成分、原始时域振动信号中自适应分离出纯调频信号和包络信号,由此得到多个具有物理意义的PFs分量,PFs分量的瞬时幅值和瞬时频率包含振动信号瞬态特征信息,以突出机械设备运行中的振动信号状态特征;
步骤3:选取乘积函数(PFs)及特征抽取,计算每个PF的周期调制强度(PMI),根据PMI值选择PFs作为重要的信号成分,从而达到消除原始信号噪声、抽取与机械状态密切信号成分的目的;然后从PFs信号的时域和频域抽取统计量和信息熵作为信号特征,生成机械状态的训练数据集和测试数据集;
步骤4:确定核慢特征判别分析(SKSFDA)模型参数,使用基于类内局部结构测度最小、全局部结构测度最大准则以确定最优SKSFDA模型核函数参数,提高算法性能;
步骤5:构建SKSFDA模型,使用SKSFDA对机械状态训练和测试数据集进行训练建立SKSFDA模型,根据SKSFDA模型把原始数据集进行维数约简,得到具有保持全局和局部数据鉴别几何结构的低维数据集;
步骤6:构建监测统计量,计算基于Bayesian推理的监测统计量并确定预设百分比置信度下的阈值,根据监测统计量超出阈值判别是否出现新故障,若无发现新故障则使用KNN分类器确定当前提升机设备的运行状态。
其中,所述步骤3中,从PF中抽取时域特征参数计算公式为:
时域特征1:
时域特征2:
时域特征3:
其中,均值方差pfi(n)为CLMDAN对信号分解得到的第i个乘积函数分量PF;
频域特征计算公式为:
假设信号频谱为s(k),fk表示kth谱线的值,k=1,2,…,K,K为功率谱项的数量,那么频域特征计算公式为:
平均频率:
平均能量:
频率标准差特征值:
上述三个统计量分别表示信号在频域上的平均频率、平均能量、频率标准差特征值;
LMD信息熵是振动信号的复杂度和各个频段上能量分布能够在一定程度上反映振动信号的规则程度以及特征,因此从分解的乘积函数(PFs)中抽取信息熵特征作为机械故障诊断的判断依据;
1)乘积函数奇异熵
令pfi(n)为CLMDAN对信号分解得到的第i个乘积函数分量PF,DM×N∈RM×N为由pfi(n)构成的矩阵,对DM×N进行奇异值分解并有B个非负奇异值Λj,j=1,2,…,B,那么用乘积函数时频熵定义为用pj描述了该乘积函数信号熵贡献率在总频率成分的百分比;
2)乘积函数时频熵
根据分析信号的时频矩阵DM×N,根据时间参数n和测量参数i定义如下两个向量其中,n=1,2,…,N,i=1,2,…,M,N表示信号PF的数据点数,M为乘积函数(PFs)的数量;
那么PFTFE定义为:
3)乘积函数能量熵
PF能量熵的定义为:
其中,表示能量概率,
其中,所述步骤5中,具体的SKSFDA模型构建步骤为:
为了区分判断故障的类型,将已知的故障样本按照故障类型进行标记,假设标记样本和未标记数据集分别记为XL与XU,全体数据集记为X=[XL,XU],假设标记数据集XL包含C类数据集,第c类的样本数据集记为Nc表示样本集Xc中样本的数量,表示标记样本数量,首先通过非线性映射φ(·)把样本数据映射到高维特征空间,令对每个训练样本把非线性的从样本Bc中移出,然后使用Bc的其余样本集对进行线性表示;根据稀疏表示理论,由Bc对样本重构的权重通过下面基于l1-范数的最优重构问题求得其过程如下:
其中,表示满足Mercer条件的核函数,比如高斯核函数、小波核函数、多项式核函数等,本文选取平移不变小波函数ψ(x)=(d-x2/σ2)exp(-x2/(2σ2))作为仿真实验使用的核函数,其中d为x的维数,σ核函数的尺度系数,求解上述优化问题后,对进行填0扩展使得其中,B=[B1,B2,…,Bc,BU]表示所有标记和未标记样本集组成字典,Bu为未标记高维样本数据形式,令假设给定投影变换矩阵W,根据稀疏鉴别嵌入理论和流形学习理论,类内散度矩阵Sw被定义样本在原始高维空间到低维嵌入空间中被同类样本稀疏重构残差量,其类内散度矩阵Sw定义如下:
其中,W表示给定投影变换矩阵,代表了维数变换的结构,表示流形内相似性矩阵Gw∈RN×N的元素,其定义为:
其中,l(xi)表示样本xi的类别标记,l(xi)=l(xj)=c,表示样本xi和xj均属于第c类,令表示从XL移出Xc后的数据集,对每个训练样本i=1,2,…,Nc,由对线性表示的最优权重可通过求解下面优化问题:
其中,l(xi)表示样本xi的类别标记,l(xi)=l(xj)=c,表示样本xi和xj均属于第c类,令表示从XL移出Xc后的数据集,对每个训练样本i=1,2,…,Nc,由对线性表示的最优权重可通过求解下面优化问题:
其中,rj为对线性表示的权重,表示流形间分离矩阵Gb∈RN×N的元素,其定义如下:
其中,样本类标签为C+1时表示该样本为未标签样本,那么对样本φ(xi)∈B,使用φ(xi)从B移出后剩余样本线性表示φ(xi),那么重构权重向量pi可以通过求解下面的优化问题求得:
那么总体数据集散度矩阵St定义为:
其中,散度矩阵St、Sw和Sb可以写成如下形式:
其中,Sv为φ(xi)分解过程中的中间变量,即Sv=D-GVT-VG+VDVT,D为对角矩阵,其对角元素vi表示St、Sw和Sb上式中对应维数的可转置矩阵;W为投影变换矩阵;是对称矩阵,根据式(20)形式,上面三个散度矩阵可得计算结果,分别如下3个计算公式:
Sw=tr(WTBSsBTW) (21)
Sb=tr(WTBSrBTW) (22)
St=tr(WTBSpBTW) (23)
式中,sw为类内散度矩阵,sb为类间散度矩阵,st为总体散度矩阵,ss为变换前类内散度矩阵,sr为变换前类间散度矩阵,sp为变换前总体散度矩阵;
受半监督稀疏LDA算法的启发,正则化类间散度矩阵、类内散度矩阵定义为:
Srb=(1-β)Sb+βSt (24)
Srw=(1-β)Sw+βtr(WTW) (25)
其中,It表示合适维数的单位矩阵;β∈[0,1]为正则化因子,当β=1时,SSFDA退化为PCA方法;当β=0时,SFDA退化为FDA方法,半监督鉴别向量由下面的SFDA优化问题求取:
其最优解可以归结如下广义特征值问题;
((1-β)BSrBT+βBSpBT)w=λ((1-β)BSsBT+βI)w (27)
其中,λ是广义特征值,投影向量w为相应的特征向量,根据核学习机理论,投影向量w可以改用w=Bq来表示,矩阵B和矩阵q的乘积构成了矩阵向量w,q为特征矩阵向量,那么式(27)转化为如下形式:
BTB((1-β)Sr+βSp)BTBq=λBTB((1-β)Ss+βI)BTBq (28)
由于,K=BTB=[k(xi,xj)]i,j=1,2,…,N,那么上式(28)转化如下形式:
((1-β)Sr+βSp)Kq=λ((1-β)Ss+βI)Kq (29)
假设式(29)对应的广义特征值降序排列记为λ1≥λ2≥…≥λm,m为广义特征值的标号,相应的特征向量q1,q2,…,qm作为SSFDA模型的方向,如果选择公式(28)中特征向量Qr=[q1,q2,…,qr]作为鉴别分析,那么新的数据样本x通过下面形式计算鉴别向量:
式中,kx=[k(x1,x),k(x2,x),…,k(xN,x)]T为对应的各个核矩阵;
在使用核方法时,需要考虑对核矩阵K均值中心化,假设其中心化核矩阵为其计算方法为:
矩阵新样本对应的中心化核向量为:
I1×N=(1/N)1×N,IN×N=(1/N)N×N。
其中,述步骤4中,SKSFDA模型参数计算步骤为:
假设给定C类数据样本集X={X1,X2,…,XC},Xi表示第i个数据集,相应类别的数据量记为Ni,且令X/Xi表示移出Xi后的数据集,对数据样本集{Xi,X/Xi}计算Xi与Xi中的样本距离,X/Xi与X/Xi样本距离,以及Xi与X/Xi数据样本距离,并分别对上述计算结果按照升序方式进行排列,删除掉0-距离,X/Xi表示从X移出Xi后的样本集;选用坐标距离作为距离判断依据,选取αNc(Nc-1)对应的样本距离如果被测试的样本距离小于坐标距离,则属于这类样本,否则就是不属于这类样本;并用α(N-Nc)(N-Nc-1)对应样本距离作为局部结构测度,(1-α)Nc(N-Nc)对应的样本距离作为非局部结构测度,这里i=1,2,…,C,0<α≤0.5;根据定义可知,表示第i类数据集的局部测度,表示非第i类数据集的局部测度,表示第i类数据与其它类别数据集之间非局部测度;
显然在特征空间内,我们希望同类映射数据之间尽可能靠近、非同类数据之间尽可能靠近,与此同时同类数据与异类数据之间尽可能远离。一般说来,我们不建议选取a值接近0。原因是如果a取值接近0,数据集的局部和非局部结构测度分别为最小、最大,这两类值差别最大,且数据集中噪声或者在野点会影响基于局部测度与非局部测度的模型选择策略的有效性。最优径向基小波核函数参数σ*应该使得局部测度和非局部测度差别最大,即和尽可能小、尽可能大。根据上述思想,最优核函数参数σ可以通过下面优化问题求取,即中间计算过程如下:
上述优化问题具有明确的物理意义,最优模型参数值能够使得特征空间中类内数据集尽可能靠近、类间数据集尽可能远离,因此相应的模型对数据具有更好的鉴别分析能力,提高数据维数约简性能。显然上述优化问题为非凸优化问题,我们可以使用梯度下降法求取优化问题的最优解。为简单起见,我们令γ=1/2σ2,上述优化问题的目标函数可以写为diff(γ)。令d为样本距离,dst为测度标准距离,下式是通过计算diff(γ)对γ求微分:
式中,为公式(35)中的一般展开形式,那么其最优解可由下面公式迭代求取:
其中,t为迭代次数,λ为步长,由于上述优化问题是非凸优化问题,初始值直接影响对优化问题解。我们给出一种新的核函数参数初始值设定方法。该方法首先对数据样本进行归一化处理为均值为0、方差为1,然后使用下面公式确定核函数参数初始值,即:
其中,所述步骤6中,监测统计量计算公式为:
其中,ω为阈值,yi为根据公式(38)来计算样本xi的鉴别向量,作为判断样本分类的标准,与Ξc分别表示第c类样本的均值和方差,SSKFDA的隐藏变量yi是高斯分布,因此,每类样本的条件概率分布使用多变量高斯分布估计:
监测统计量BID的控制上限在置信度水平γ下服从自由度为m的χ2分布,用概率的置信区间的判断标准,来判别监测统计量BID是否属于该高斯分布的可靠置信区间,在实际应用中,γ通常取95%或99%,当新样本出现时,其对应的监测统计量BID持续超过置信区间上限时,即表示系统产生了未知故障,否则,该样本属于已知类别,使用KNN分类器判断该样本属于已知类别。