CN111738309B - 多尺度分析和集成学习的气敏传感器故障模式识别方法 - Google Patents

多尺度分析和集成学习的气敏传感器故障模式识别方法 Download PDF

Info

Publication number
CN111738309B
CN111738309B CN202010496367.2A CN202010496367A CN111738309B CN 111738309 B CN111738309 B CN 111738309B CN 202010496367 A CN202010496367 A CN 202010496367A CN 111738309 B CN111738309 B CN 111738309B
Authority
CN
China
Prior art keywords
fault
feature
scale
class
gas sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010496367.2A
Other languages
English (en)
Other versions
CN111738309A (zh
Inventor
许永辉
刘玉奇
杨子萱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202010496367.2A priority Critical patent/CN111738309B/zh
Publication of CN111738309A publication Critical patent/CN111738309A/zh
Application granted granted Critical
Publication of CN111738309B publication Critical patent/CN111738309B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法,包括:对气敏传感器故障信号进行多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵构成复合多尺度加权排列熵特征向量;通过Fisher判别法对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本;利用集成学习方法构建多个基学习器,用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行汇总,得到气敏传感器故障模式识别结果。本发明能够突出不同故障类型的差异性,并且选择的集成学习分类器对气敏传感器故障识别具有更优越的泛化性能和更好的分类准确率,避免严重事故发生。

Description

多尺度分析和集成学习的气敏传感器故障模式识别方法
技术领域
本发明属于机器嗅觉技术领域,涉及一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法。
背景技术
模式识别是当前实现传感器故障识别的主要方法。主要过程是:首先,对传感器正常情况下和各种不同故障情况下的传感器信号进行采集,构成传感器各种不同状态的训练样本集;然后选择合适的故障信号特征提取方法,提取不同故障状态下的故障特征信息,构成故障特征训练样本集;接下来,利用故障特征训练样本集训练基于模式识别方法的分类器;最后,利用训练好的分类器对传感器测试样本进行模式识别,并由分类器输出识别出的故障类型。通过以上的过程描述可知,传感器模式识别方法主要有两个关键步骤,分别是故障特征提取方法的选择和分类器的选择。
时频分析方法是当前传感器信号故障特征分析的主要方法,其主要通过傅里叶变换、小波变换、经验模态分解等方法在时域和频域对传感器信号进行分解。将原始故障信号分解成若干个简单的平稳分量信号,然后通过对各分量信号进行处理获取时频域的数据信息,实现特征提取。但是由于传感器信号通常表现为非线性行为,时频分析的信号分解过程,难免会丢失一定的故障信息。非线性分析的方法可以不对信号进行分解,而是直接对传感器信号中的数据信息进行特征提取。非线性分析方法主要包括关联维数、样本熵、排列熵、多尺度熵等。但从MOS气敏传感器故障信号中提取的特征信息对于不同故障类型区分性较差。
传感器故障识别过程中的分类方法多采用模式识别方法,通过训练样本对分类器进行模型构建,然后将测试样本输入到训练模型中得到分类结果,例如决策树、贝叶斯分类器、K近邻法(KNN)、支持向量机(SVM)、神经网络等算法均被广泛应用在传感器故障识别中。而为了提高各分类器的分类性能,研究学者们提出了各种分类器的改进方法,包括基于SLIQ算法的决策树、Tan贝叶斯网络、LS-SVM、SVR等等。但上述改进方法都比较复杂,并且分类结果依赖模型本身的性能,不同的参数设置很大程度影响最终分类结果,模型训练过程容易发生过拟合现象,从而导致分类准确率不高。
因此,提供一种对不同故障类型区分性强,且分类准确率高的基于多尺度分析和集成学习的气敏传感器故障模式识别方法是本领域技术人员亟待解决的技术问题。
发明内容
本发明针对传感器故障模式识别过程中,提取的故障特征对不同故障类型区分性差以及分类器分类准确率不佳的问题。提出一种基于复合多尺度加权排列熵,Fisher判别和bagging集成学习分类器的气敏传感器故障模式识别方法。该方法能够突出不同故障类型的差异性,并且选择的基于bagging集成学习的分类器对MOS气敏传感器最终故障识别具有更优越的泛化性能和更好的分类准确率。
为实现上述目的其具体方案如下:
一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法,包括如下步骤:
S1、对气敏传感器输出的故障信号进行复合多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵并构成复合多尺度加权排列熵特征向量,作为故障信号的特征;
S2、通过Fisher判别法计算复合多尺度加权排列熵的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本集;
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果。
优选的,所述S1包括:
S11、对故障信号时间序列{x(1),x(2),...x(N)}进行改进的粗粒化处理,得到粗粒化序列
其中,τ为尺度因子;
S12、计算每个尺度因子τ对应的粗粒化序列的加权排列熵,再对当前τ对应的加权排列熵求均值,则得到当前尺度因子下的CMWPE:
S13、将得到的CMWPE表示成尺度因子τ的函数,得到复合多尺度加权排列熵,其中给定τmax,则τ∈[1,τmax]。
优选的,所述S2中,将m组故障信号时间序列对应的CMWPE作为样本矩阵XL进行映射变换,使同类别故障信号时间序列间距离最近,具体包括:
定义Fisher判别的目标函数:
其中,W为映射矩阵,Sw为类内离散度矩阵,Sb为类间离散度矩阵;
调整W的值,使得类内离散度矩阵Sw的值达到最小,类间离散度矩阵Sb达到最大,得到映射矩阵W的最优鉴别矢量解;
确定样本矩阵从m维空间到K-1维空间的降维的线性变换过程为:
ZL=WTXL
得到故障特征样本集ZL
优选的,所述S3中,采用决策树进行基学习器的训练,并基于故障特征样本集的信息增益率作为属性选择度量进行类别划分。
本发明相较现有技术具有以下有益效果:
本发明针对现有技术中不同传感器故障类型区分性差以及故障模式识别准确率低的问题,提出一种基于复合多尺度加权排列熵(CMWPE),Fisher判别(FDA)和bagging集成学习分类器的MOS气敏传感器故障模式识别方法。根据综合特征评估方法计算提取的特征样本集中复合多尺度加权排列熵特征向量的评估因子可知,本发明提出的特征提取方法相对于传统方法提取的特征值包含更为丰富的特征信息,很好的突出不同故障类型的差异性。并且选择的基于bagging集成学习的分类器对MOS气敏传感器最终故障识别准确率达到97.85%。集成学习方法通过集合多个弱学习器可以采用投票方式获取最终分类结果,相比传统单一学习器具有更优越的泛化性能和更好的分类准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明基于多尺度分析和集成学习的气敏传感器故障模式识别方法流程图;
图2是本发明Bagging算法原理框图;
图3是本发明实施例提供的不同故障类型下CMWPE值示意图;
图4是本发明实施例提供的不同故障类型下CMWPE值的FDA降维结果比较结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见附图1,为本实施例提供的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法流程图,本实施例的具体执行过程如下:
S1、对气敏传感器输出的故障信号时间序列进行加权排列熵的多尺度分析,得到故障信号在不同尺度因子下的复合多尺度加权排列熵。
S1的执行过程是在现有加权排列熵的技术基础之上提出的,因此,首先对加权排列熵WPE进行说明:
排列熵是一种不需要考虑时间序列的具体大小的非线性分析方法,它通过相邻数据对时间序列的复杂性进行度量,进而获得时间序列的特征信息。然而排列熵忽略了相同序数模式之间的幅度差异,丢失了有关信号幅值的信息。因此保留了信号中有用的幅值信息并提出了加权排列熵(WPE)。具体计算方法如下:
考虑长度为N的时间序列{x(1),x(2),...x(N)},对其进行相空间重构,得到如下时间序列:
式中,m为嵌入维度,λ为时延。
将X(i)的m个数据按升序排列,得到
如果存在x(i+(j1-1)τ)=x(i+(j2-1)τ),则按j值的大小进行排序。当ji1<ji2,有x(i+(ji1-1)τ)≤x(i+(ji2-1)τ)。因此,任意数据X(i)都可以得到一组符号序列:
Se(g)={j1,j2,...,jm} (3)
其中,g=1,2,...k,k≤m!,m个不同的符号{j1,j2,...,jm}共有m!种不同的排列,共有m!种不同的序号序列,Se(g)是m!中符号序列中的一种。
时间序列中第g个时间序列出现的频率为:
其中s=1,2,...,S,S表示相同序数模式中可能的时间序列的数目,ωg为权值。每个序数模式的加权概率为
已知其中权值ωg(s)计算公式
其中为算数平均值
最终,加权排列熵计算为
同样,对加权排列熵进行标准化得到Hω
由于上述介绍的加权排列熵只能分析时间序列在单一尺度上的复杂性和动力学突变行为。因此本实施例对WPE进行复合多尺度分析。
复合多尺度排列熵(CMWPE)在粗粒化过程中采用统一尺度因子τ下,能够得到τ组不同的粗粒化时间序列,具体过程如下:
(1)对m组气敏传感器故障信号时间序列{x(1),x(2),...x(N)}进行改进的粗粒化处理,定义
(2)对每个尺度因子τ,计算每个粗粒化序列的加权排列熵,再对每个τ熵值求均值,则得到这一尺度因子下的CMWPE:
对每一个故障信号时间序列的不同τ值计算CMWPE,得到1×m维的加权排列熵向量,再将得到的熵值表示成尺度因子τ的函数,此过程即为复合多尺度加权排列熵的分析过程。CMWPE综合了统一尺度下所有粗粒化序列的排列熵信息,相对于传统的多尺度分析方法更为合理。复合多尺度加权排列熵曲线也反映了时间序列在不同尺度因子下的复杂性。当某一时间序列的熵值在大部分尺度上都比里一个时间序列的值大,则认为前者比后者更为复杂。
S2、通过Fisher判别法计算复合多尺度加权排列熵的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,得到故障特征样本集。
Fisher判别分析(FDA)本身属于一种有监督的降维技术,该方法在投影过程中将数据的类型考虑进去,因此被广泛应用于模式识别领域当中。Fisher判别方法的目标是求取一组最优投影轴组成鉴别矢量集,通过该映射集,能够使得各类样本经投影后,在新的空间中能保证方差最小的情况下,实现不同类别样本的有效分离。具体实现过程如下:
定义nl个训练样本矩阵XL=[x1,x2,...,nl],将m组故障信号时间序列对应的CMWPE作为训练样本矩阵,其中xi∈Rm。假设所有nl个训练样本包含K个类别,且第k个(1≤k≤K)类别Ck中有nk个样本。将原始样本经过映射矩阵W变换后变成样本矩阵ZL=[z1,z2,...,zl],zi∈Rm。则变换规则为:
ZL=WTXL (12)
变换的目的在于使得同一类别的样本被映射矩阵W作用后距离更近,而不同类别的样本被映射矩阵W作用后距离更远。
定义类内离散度矩阵Sw,类间离散度矩阵Sb,:
其中是第k个类别内的样本均值,而是所有样本均值。
由于Fisher判别的目的是通过投影使得同类样本之间距离最近,不同类样本之间距离最远,以此来获取最后参数。通过定义的类内离散度矩阵Sw和类间离散度矩阵Sb,并依据判别准则求解最优向量,不断循环,最终获得最优鉴别矢量集。基于方法如下:
首先定义Fisher判别的目标函数:
算法的最终目的就是求取W值,使得W令目标函数J最大。上式中,调节W的幅值并不会使J(W)的幅值发生变化,同时也不会影响W的方向。因此,可以通过调整W的值,使得类内离散度矩阵Sw的值达到最小,类间离散度矩阵Sb达到最大,便可以得到转换矩阵W最优鉴别矢量解。
为了求解令目标函数最大的矢量解,借助拉格朗日算法,将目标函数的分子最大化,分母为非零常数,则有
WTSwW=c≠0 (16)
拉格朗日的无约束极值表示为
L(W,λ)=WTSbW-λ(WTSw-c) (17)
式中λ为拉格朗日乘子,当对上式求取极值点是,有
令式得零,有
SbW=λSwW (19)
当样本数大于数据特征维数时,即Sw可逆是,左右乘以Sw -1,有
Sw -1SbW=λW (20)
通过对公式(20)进行求解,W为矩阵Sw -1Sb的特征向量构成的矩阵,λ为所有特征值构成的矩阵。这里特征值λ的大小代表通过把所有类别的样本投影到W上,其整体的分离程度。由于Sb的秩小于类个数K,所以至多可以求出有K-1个不等于零的特征值。因此Fisher判别只在非零特征值对应的方向上对特征向量进行有意义的排序。用K-1个向量作为列组成投影矩阵W∈Rm×(K-1),因此,通过上述过程就实现了训练样本数据从m维空到K-1维空间的降维过程。线性变换过程为:
ZL=WTXL (21)
ZL为k-1×m维的故障特征样本集[Z1,Z2,…,ZK-1]T
综上所述,Fisher判别通过计算鉴别矢量集W,把包含K个类别的数据样本集x1,x2,...,nl映射到K-1维空间上,实现了对多类别数据的最优分离。
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果。
首先,集成学习(Ensemble Method,EM)是一种通过合并多个学习模型进而提升机器学习性能的方法。集成学习法利用训练样本数据构建一组基分类器,然后通过对每个基分类器的预测结果进行投票,来确定最终的集成算法的分类结果。
如图2是基于bagging的集成学习方法原理框图。由于bagging算法是利用Boostrap采样获取训练样本子集,被抽取的几率是均等的,因此bagging算法对训练样本中的个体是没有偏重的。而且bagging算法一定程度上类似于对不稳定点进行“平滑处理”,因此能够很好地提升不稳定学习方法的预测精度。
Bagging算法的具体实现原理如下:
1.训练数据获取:对原始训练样本集使用Boostrap采样,有放回的从M个训练样本中抽取M个样本作为训练样本集,经过T次采样后,获得原始训练样本的T个样本子集,用于对基学习器进行训练;
2.分类器训练:利用生成的T个训练样本训练T个基学习器,构成集成学习模型;
3.分类结果汇总:将测试样本输入到训练好的分类模型中,输出T个分类结果,利用投票的方式得到最终分类结果;
本发明采用决策树作为bagging集成学习的基学习器,它在机器学习领域是常用的分类算法,它有分类速度快,准确率高得优点。虽然决策树算法得到的分类器存在过拟合的现象,但当它作为bagging算法的基学习器时,由于训练样本采样的随机性,使得最终投票结果一定程度避免了过拟合的情况。
本实施例采用决策树算法中的C4.5算法进行基学习器的训练,它主要采用基于信息增益率作为属性选择度量。具体过程如下:
(1)令训样本集为xi=(xi,1,xi,2,...,xi,n)T,类标号集合为Y={y1,y2,...,ym},将根节点作为这个样本集合。其中,训练样本集为经过T次采样后,获得的原始训练样本的T个样本子集,用这T个样本子集对T个决策树进行训练。
(2)针对每一个样本属性,分别计算当概述作为节点分裂属性是对应的信息增益率,选择具有最高信息增益率的属性。具体信息增益率计算过程如下:
对训练样本集进行封,假设分为个m不同部分,表示为Ti(1≤i≤m)。设属性集合An={A1,A2,...,An},按照第j(1≤j≤n)个属性Aj,原始数据集T被划分为w个不同的子集绝对值表示相应集合中的样本个数。
原始数据集T的信息熵Entrogy(T)为:
其中,pi=|Ci|/|T|。
依据Aj划分的T的信息熵:
为子集占整个数据集的百分比,为子集的信息熵。
Gain(Aj)依据Aj划分的T的信息增益:
为划分信息:
GainRatio(Aj)为依据Aj划分的T的信息增益率:
(3)根据第(2)不的信息增益率作为最佳属性划分当前节点,将节点分成两个子集,建立分支,得到两个新的节点。
(4)对于产生的两个新的节点,分别重复步骤(2)(3),知道所有分支达到最大深度,即所有节点中的样本都属于同一类,分类终止。
为了验证本实施例提出的针对MOS气敏传感器故障模式识别方法的有效性,实验采用基于实验获取的MOS气体传感器阵列采集得到的数据集。以装配有20个FIGARO公司生产的商用MOS气敏传感器组成的传感器阵列作为研究对象,建立了数据采集系统。在气体传感器阵列正常工作情况下,进行长时间采集获取充足的实验样本,作为算法验证的数据集。并利用故障注入方式叠加故障信号,产生不同故障类型的实验样本。具体故障类型包括:正常情况、冲击故障、偏置故障、恒定输出、掉电故障、噪声干扰、漂移故障。
实验样本为MOS气体传感器阵列正常工作输出信号,随机选择某一MOS气敏传感器作为故障传感器,叠加上述的不同故障类型的仿真故障信号,其中故障开始时间为随机设置。共获得各种故障类型下各200组信号,每组信号长度为1000个样本点,并随机选择100组数据作为训练样本,另外100组数据为测试样本。
气敏传感器的故障特征提取方法实验结果和分析:
为了提取不同故障类型下的MOS气敏传感器故障特征,首先利用CMWPE对不同故障类型下的MOS气敏传感器训练样本进行多尺度化分析。通过实验分析,分别设置复合多尺度加权排列熵主要包括三个参数:延迟时间λ=1、尺度因子τ=25和嵌入维度m=4。
如图3所示为不同故障类型的CMWPE值。复合多尺度分析方法能够有效的对单一维度的MOS气敏传感器信号进行多尺度扩维,得到不同粗粒化程度下的时间序列片段。由图中曲线可以看出,通过计算每一尺度时间序列的加权排列熵可以得到每一尺度信号的复杂性。不同尺度下的WPE值可以构成传感器故障信号的特征向量。同时,通过对比不同故障类型的CMWPE曲线可以看出,该方法能够突出不同故障类型的差异性。
本实验选取了不同故障类型下的实验样本计算了相应复合多尺度加权排列熵,构建了基本的故障特征样本集。在多尺度分析过程中,尺度因子设置为25,因此获得的故障特征中包含了25个特征值。如果采用所有尺度下的特征值对分类器进行训练和测试,可能会有一些无关和冗余的信息对模式识别结果产生影响。因此为了提高模式识别的速度和精度,本实验采用一种有监督的降维方法——FDA方法对高维故障特征进行降维处理。
如图4所示为不同故障类型下CMWPE值的FDA降维结果比较。通过直方图幅值大小对比可以看出,不同故障类型下获得的特征向量中各元素存在差异,这说明本章提出的故障特征提取方法可以使得不同故障类别很好的得到区分。
为了说明提出的基于CMWPE和FDA的特征提取方法的优越性,本实验采用综合特征评估方法对基于不同的特征提取方法进行评估。该方法主要思想是当特征向量中的某一特征在同类别的类内距离最小,而不同类别之间类间距离最大,则对于所有故障类别而言,该特征的可区分性最大。下面对综合特征评估方法的原理进行说明:
为了对提出的基于CMWPE和FDA的MOS气敏传感器故障特征提取方法得到的特征向量的可分性进行评估,研究基于距离的类别可分性判据原理。该综合特征评估方法的主要思想是为特征向量中的某一特征在同类别的类内距离最小,而不同类别之间类间距离最大,则对于所有故障类别而言,该特征的可区分性最大。传感器信号综合特征评估方法具体原理如下:
计算第i类特征向量中的第k个特征的类内距离
m,n=1,2,...,N,m≠n,k=1,2,...,K,i=1,2,...,M
式中,N表示特征向量样本总数量,K表示特征向量中特征的个数,M为类别总个数,分别是第i类的第m个和第n个特征向量中的第k个特征。
利用式(2-27)求特征向量第k个特征M个类别的平均类内距离
再计算特征向量中第k个特征对第i类与第j类的类内距离
其中,表示第i类N个样本第k个特征的均值,公式如下
可以获得第k个特征M个类别的类间距离的均值
根据第k个特征类内距离与类间距离可以定义区分度因子
的大小决定第k个特征对第i类与第j类的可区分性,越大表示第k个特征对第i类与第j类的可区分性越强。
第k个特征的综合评估因子为
βk=D'k/Dk (33)
βk的大小可以综合评定第k个特征对M个类的可分性,βk越大则表示第k个特征对M个类的区分能力越强。
利用上述综合评估方法即可对传感器故障特征进行可分性评估,区分度因子能够评价某一个特征对两个类别的区分能力,综合评估因子能够评价某一个特征对所有类别的区分能力。
具体不同特征提取方法的综合特征评估结果如表格1所示,表格中的方法包括:采用时频分析方法的基于集合经验模态分解(EEMD)和排列熵(PE)的特征提取方法,将信号分解为5个本征模态函数(IMFs)和一个残余分量。采用复合多尺度排列熵(CMPE)作为了实验对比算法,相关参数延迟时间λ、尺度因子τ和嵌入维度m设置同上文CMWPE的参数相同。基于CMWPE和PCA降维的特征提取方法中,PCA方法中主元个数选择与FDA降维方法相同的6个。
表1不同特征提取方法综合特征评估结果
特征提取方法 综合特征评估因子
EEMD+PE [5.5917,2.4954,1.6760,0.9547,0.3991,0.1040]
CMPE+FDA [8.8575,6.6729,3.9535,1.3697,0.5308,0.2373]
CMWPE+PCA [9.2955,3.9232,2.8992,1.1615,0.9680,0.5381]
CMWPE+FDA [13.7618,4.1107,2.2459,1.3889,0.7550,0.4057]
由表1所示的不同特征提取方法的综合特征评估结果说明,相对于EEMD排列熵时频分析方法获得的特征向量,CMWPE分析方法能够更好的提取出隐含在传感器时间信号序列中的丰富信息。同时与CMPE相比,CMWPE方法因为将信号幅值信息也加入排列熵的计算过程中,使得获得故障特征对不同故障类型的可分性更好。最后对比利用PCA和FDA对CMWPE进行降维后的综合特征评估因子,可以知道有监督的FDA方法能够进一步提高不同故障特征的可分性。
故障模式识别实验结果与分析:
如表2所示为传感器故障模式识别算法性能比较结果。对比算法中的SVM采用高斯核。其中,惩罚因子c和核参数g利用网格搜索和三折交叉验证的方法确定。通过对一定范围内的c和g取值,对于取定的c和g把训练样本作为原始数据利用三折交叉验证得到相应c和g下训练样本集的分类准确率,确定最终选定的c和g,并作为SVM模型的最佳参数。
表2不同故障识别算法性能比较结果
由故障模式识别结果可以看出,相对于时频分析的EEMD排列熵与SVM结合方法,CMPE、FDA和SVM相结合的故障识别方法,基于CMWPE和FDA的特征提取方法与基于Bagging的集成学习分类器相结合的MOS气敏传感器故障模式识别具有更高的故障识别准确率,达到了97.85%。分别比两种对比算法的平均故障识别准确率高了8.42%和5.56%。
以上对本发明所提供的一种基于多尺度分析和集成学习的气敏传感器故障模式识别方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (2)

1.基于多尺度分析和集成学习的气敏传感器故障模式识别方法,其特征在于,包括如下步骤:
S1、对气敏传感器输出的故障信号进行复合多尺度分析,得到不同尺度因子下的时间序列,分别计算每个时间序列的加权排列熵并构成复合多尺度加权排列熵特征向量;包括:
S11、对故障信号时间序列{x(1),x(2),...x(N)}进行改进的粗粒化处理,得到粗粒化序列
其中,τ为尺度因子;
S12、计算每个尺度因子τ对应的粗粒化序列的加权排列熵,再对当前τ对应的加权排列熵求均值,则得到当前尺度因子下的CMWPE:
S13、将得到的CMWPE表示成尺度因子τ的函数,得到复合多尺度加权排列熵,其中给定τmax,则τ∈[1,τmax];
S2、通过Fisher判别法计算复合多尺度加权排列熵特征向量的最优鉴别矢量集,对复合多尺度加权排列熵进行降维,作为模式识别的故障特征样本集;
S3、利用bagging集成学习方法构建多个基学习器,基学习器用于对故障特征样本集的子样本集进行分类预测,然后将多个基学习器的分类结果进行筛选汇总,得到气敏传感器故障模式识别结果;故障类型包括:正常情况、冲击故障、偏置故障、恒定输出、掉电故障、噪声干扰、漂移故障;
所述S2中,将m组故障信号时间序列对应的CMWPE作为样本矩阵XL进行映射变换,使同类别故障信号时间序列间距离最近,具体包括:
定义Fisher判别的目标函数:
其中,W为映射矩阵,Sw为类内离散度矩阵,Sb为类间离散度矩阵;
调整W的值,使得类内离散度矩阵Sw的值达到最小,类间离散度矩阵Sb达到最大,得到映射矩阵W的最优鉴别矢量解;
确定样本矩阵从m维空间到K-1维空间的降维的线性变换过程为:
ZL=WTXL
得到故障特征样本集ZL
其中是第k个类别内的样本均值,而是所有样本均值;
对基于CMWPE和FDA的气敏传感器故障特征提取方法得到的特征向量的可分性进行评估,研究基于距离的类别可分性判据原理,传感器信号综合特征评估方法具体如下:
计算第i类特征向量中的第k个特征的类内距离
m,n=1,2,...,N,m≠n,k=1,2,...,K,i=1,2,...,M
式中,N表示特征向量样本总数量,K表示特征向量中特征的个数,M为类别总个数,分别是第i类的第m个和第n个特征向量中的第k个特征;
利用公式求特征向量第k个特征M个类别的平均类内距离
再计算特征向量中第k个特征对第i类与第j类的类内距离
其中,表示第i类N个样本第k个特征的均值,公式如下
获得第k个特征M个类别的类间距离的均值
根据第k个特征类内距离与类间距离定义区分度因子
的大小决定第k个特征对第i类与第j类的可区分性,越大表示第k个特征对第i类与第j类的可区分性越强;
第k个特征的综合评估因子为
βk=D'k/Dk
βk的大小能够综合评定第k个特征对M个类的可分性,βk越大则表示第k个特征对M个类的区分能力越强;
利用综合评估方法对传感器故障特征进行可分性评估,区分度因子能够评价某一个特征对两个类别的区分能力,综合评估因子能够评价某一个特征对所有类别的区分能力。
2.根据权利要求1所述的基于多尺度分析和集成学习的气敏传感器故障模式识别方法,其特征在于,所述S3中,采用决策树进行基学习器的训练,并基于故障特征样本集的信息增益率作为属性选择度量进行类别划分。
CN202010496367.2A 2020-06-03 多尺度分析和集成学习的气敏传感器故障模式识别方法 Active CN111738309B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010496367.2A CN111738309B (zh) 2020-06-03 多尺度分析和集成学习的气敏传感器故障模式识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010496367.2A CN111738309B (zh) 2020-06-03 多尺度分析和集成学习的气敏传感器故障模式识别方法

Publications (2)

Publication Number Publication Date
CN111738309A CN111738309A (zh) 2020-10-02
CN111738309B true CN111738309B (zh) 2024-07-12

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980822A (zh) * 2017-03-14 2017-07-25 北京航空航天大学 一种基于选择性集成学习的旋转机械故障诊断方法
CN111191740A (zh) * 2020-01-10 2020-05-22 福州大学 一种滚动轴承故障诊断方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106980822A (zh) * 2017-03-14 2017-07-25 北京航空航天大学 一种基于选择性集成学习的旋转机械故障诊断方法
CN111191740A (zh) * 2020-01-10 2020-05-22 福州大学 一种滚动轴承故障诊断方法

Similar Documents

Publication Publication Date Title
CN108846259B (zh) 一种基于聚类和随机森林算法的基因分类方法及系统
CN107515895B (zh) 一种基于目标检测的视觉目标检索方法与系统
Jamali et al. Identification of optimal features for fast and accurate classification of power quality disturbances
Cabello et al. Fast and accurate time series classification through supervised interval search
CN106371610B (zh) 一种基于脑电信号的驾驶疲劳的检测方法
CN110175195B (zh) 基于极端随机树的混合气体检测模型构建方法
CN113962259B (zh) 一种燃料电池系统多模式双层故障诊断方法
CN103245907A (zh) 一种模拟电路故障诊断方法
CN101833671A (zh) 一种基于支持向量机的表面肌电信号多类别模式识别方法
CN102663447B (zh) 基于判别相关分析的跨媒体检索方法
CN110377605B (zh) 一种结构化数据的敏感属性识别与分类分级方法
CN112819059A (zh) 一种基于流行保持迁移学习的滚动轴承故障诊断方法
CN109948726B (zh) 一种基于深度森林的电能质量扰动分类方法
CN114564982A (zh) 雷达信号调制类型的自动识别方法
CN111985533A (zh) 一种基于多尺度信息融合的增量式水声信号识别方法
CN107590604B (zh) 一种结合s变换和2dpca的同调机组分群方法及系统
CN105046323A (zh) 一种正则化rbf网络多标签分类方法
CN112861066A (zh) 基于机器学习和fft的盲源分离信源数目并行估计方法
CN104143088B (zh) 一种基于图像检索和特征权重学习的人脸识别方法
CN111738309B (zh) 多尺度分析和集成学习的气敏传感器故障模式识别方法
CN105006231A (zh) 基于模糊聚类决策树的分布式大型人口语者识别方法
CN116610990A (zh) 一种基于特征空间差异化的断路器隐患识别方法及装置
CN111738309A (zh) 多尺度分析和集成学习的气敏传感器故障模式识别方法
CN114819365A (zh) 一种基于lsgan-dcn网络的短期光伏功率预测方法
Chun et al. Research on music classification based on MFCC and BP neural network

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant