CN115545086A - 一种可迁移的特征自动选取声学诊断方法及系统 - Google Patents

一种可迁移的特征自动选取声学诊断方法及系统 Download PDF

Info

Publication number
CN115545086A
CN115545086A CN202211381286.3A CN202211381286A CN115545086A CN 115545086 A CN115545086 A CN 115545086A CN 202211381286 A CN202211381286 A CN 202211381286A CN 115545086 A CN115545086 A CN 115545086A
Authority
CN
China
Prior art keywords
feature
model
knn
svm
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211381286.3A
Other languages
English (en)
Other versions
CN115545086B (zh
Inventor
余永升
章林柯
胡永文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haina Kede Hubei Technology Co ltd
Original Assignee
Haina Kede Hubei Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haina Kede Hubei Technology Co ltd filed Critical Haina Kede Hubei Technology Co ltd
Priority to CN202211381286.3A priority Critical patent/CN115545086B/zh
Publication of CN115545086A publication Critical patent/CN115545086A/zh
Application granted granted Critical
Publication of CN115545086B publication Critical patent/CN115545086B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及声学诊断领域,提供一种可迁移的特征自动选取声学诊断方法及系统,包括:S1:获取原始音频,对所述原始音频进行特征提取处理,获得声学特征;S2:通过混合特征选择模型对所述声学特征进行筛选,获得最优特征子集;S3:通过所述最优特征子集构建特征矩阵;S4:通过集成诊断模块对所述特征矩阵进行诊断,获得声学诊断结果。本发明通过SFS‑SVM模型、SFS‑KNN模型、RFE‑RF模型、RFE‑XGB模型和MIC模型综合构建的混合特征选择模型,可以将多种特征选择方法获得的选择结果进行综合分析,获得最佳的声学诊断,极大的提高了声学诊断结果的鲁棒性。

Description

一种可迁移的特征自动选取声学诊断方法及系统
技术领域
本发明涉及声学诊断领域,尤其涉及一种可迁移的特征自动选取声学诊断方法及系统。
背景技术
基于声学特征的诊断主要包含特征提取和分类识别两个部分。当某一设备在运行的过程中,会由振动产生声信号,声信号中包含着设备的状态信息。当设备的某一状态发生变化时,其声信号的某些特征也会发生相应的变化。特征提取,是声学诊断中最具难点的部分,其任务在于利用一系列有目的的数据运算方式对信号进行处理,使信号更加接近纯粹本质的信息。
而声音信号的特征参数一般可以分为时域特征、频域特征等类型,特征的种类繁多,如何使提取的特征更有利于后续的分类识别是整个声学诊断的核心。因此,声学特征选择技术在声学诊断领域尤为重要。
目前,声学诊断领域选取声学信号的特征大多是凭借专家经验进行选取,而特征选择对模型性能有着直接的影响。如果选取的特征不合适或者特征选取不足,可能不能准确的涵盖故障信息,如果选取的特征过多又会使数据包含许多无关特征和冗余特征,直接使用这样的训练数据不但会消耗大量的计算资源,而且可能给模型带来过拟合的风险。
所以需要研究合适的特征选择方法来优选特征。由于单一的特征选择方法在空间中搜索的能力有限,不同的特征选择方法可能产生不同的选择结果。
因此,单一的特征选择方法可能会在筛选特征过程中忽略一些潜在信息,存在容易陷入局部最优,鲁棒性较差的问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
为解决上述技术问题,本发明提供一种可迁移的特征自动选取声学诊断方法,包括:
S1:获取原始音频,对所述原始音频进行特征提取处理,获得声学特征;
S2:通过混合特征选择模型对所述声学特征进行筛选,获得最优特征子集;
S3:通过所述最优特征子集构建特征矩阵;
S4:通过集成诊断模块对所述特征矩阵进行诊断,获得声学诊断结果。
优选的,步骤S1具体为:
S11:对所述原始音频依次进行预加重处理、分帧处理和加窗处理,获得预处理后的音频;
S12:从所述预处理后的音频中提取声学特征,所述声学特征包括:时域特征、频域特征、小波域特征和波形特征。
优选的,所述混合特征选择模型包括:SFS-SVM模型、SFS-KNN模型、RFE-RF模型、RFE-XGB模型和MIC模型。
优选的,步骤S2具体为:
S21:通过SFS-SVM模型计算获得SFS-SVM模型准确率达到最高时所用的特征集合FT1,通过SFS-KNN模型计算获得SFS-KNN模型准确率达到最高时所用的特征集合FT2
S22:通过RFE-RF模型计算获得RFE-RF模型准确率达到最高时所用的特征集合FT3,通过RFE-XGB模型计算获得RFE-XGB模型准确率达到最高时所用的特征集合FT4
S23:通过MIC模型计算获得MIC模型的最优特征的排序RankMIC
S24:计算获得最优特征子集的最大集合Fmax和最优特征子集的最小集合Fmin
Figure 463560DEST_PATH_IMAGE001
Figure 504198DEST_PATH_IMAGE002
S25:构建新排名,获取新排名下前T个特征集合FT,FT满足条件:
Figure 756187DEST_PATH_IMAGE003
S26:计算获得最优特征子集Fa
Figure 452748DEST_PATH_IMAGE004
Figure 81175DEST_PATH_IMAGE005
为最小特征子集选取函数。
优选的,步骤S21具体为:
S211:设置SVM特征集合、KNN特征集合和计数k,将SVM特征集合初始化为空集F(SVM,0),将KNN特征集合初始化为空集F(KNN,0),将k的值初始化为1;
S212:判断计数k的值,若k≤m则进入步骤S213,否则进入步骤S218;m为提取的声学特征集合中的特征数量;
S213:计算获得第k次SFS-SVM模型的最优特征ft k,计算公式为:
Figure 448090DEST_PATH_IMAGE006
其中,
Figure 870981DEST_PATH_IMAGE007
为最优特征选取函数,F(SVM,k-1)为第k-1次更新后的SVM特征集合,GSVM ()为SFS-SVM模型的评价函数,X为声学特征数据,F为声学特征集合,fj为声学特征集合中 的第j个特征,j为特征的编号;
S214:将ft k添加至SVM特征集合中,获得第k次更新后的SVM特征集合F(SVM,k),计算 公式为:
Figure 992521DEST_PATH_IMAGE008
通过第k次svm的评价函数获得第k次更新后的svm特征集合的准确率
Figure 159060DEST_PATH_IMAGE009
, 计算公式为:
Figure 111973DEST_PATH_IMAGE010
S215:计算获得第k次SFS-KNN模型的最优特征fp k,计算公式为:
Figure 768082DEST_PATH_IMAGE011
其中,F(KNN,k-1)为第k-1次更新后的KNN特征集合,GKNN()为SFS-KNN模型的评价函数;
S216:将fp k添加至KNN特征集合中,获得第k次更新后的KNN特征集合F(KNN,k),计算 公式为:
Figure 439235DEST_PATH_IMAGE012
通过第k次KNN的评价函数获得第k次更新后的KNN特征集合的准确率
Figure 675044DEST_PATH_IMAGE013
,计算公式为:
Figure 482463DEST_PATH_IMAGE014
S217:令k=k+1,返回步骤S212;
S218:计算获得svm的最终排序,计算公式为:
Figure 509806DEST_PATH_IMAGE015
其中,Rank(SVM,F)为SVM特征集合中最优特征的排序,
Figure 668255DEST_PATH_IMAGE016
为SVM特征集 合中准确率的排序;
计算获得KNN的最终排序,计算公式为:
Figure 114280DEST_PATH_IMAGE017
其中,Rank(KNN,F)为KNN特征集合中最优特征的排序,
Figure 41785DEST_PATH_IMAGE018
为KNN特征 集合中准确率的排序;
S219:计算获得SFS-SVM模型准确率达到最高时所用的特征集合FT1,计算公式为:
Figure 242959DEST_PATH_IMAGE019
其中,T1为SFS-SVM模型达到最高准确率时所用特征个数;
计算获得SFS-KNN模型准确率达到最高时所用的特征集合FT2,计算公式为:
Figure 623125DEST_PATH_IMAGE020
其中,T2为SFS-KNN模型达到最高准确率时所用特征个数。
优选的,步骤S22具体为:
S221:设置RF特征集合、XGB特征集合和计数k,将RF特征集合初始化为满集,将XGB特征集合初始化为满集,将k的值初始化为1;
S222:判断计数k的值,若k≤m则进入步骤S223,否则进入步骤S228;m为提取的声学特征特征数量;
S223:计算获得第k次RFE-RF模型的贡献度最小特征fq k,计算公式为:
Figure 731895DEST_PATH_IMAGE021
其中,DRF()为RFE-RF模型的建模函数,F(RF,k-1)为第k-1次更新后的RF特征集合,X为声学特征数据,F为声学特征集合,fj为声学特征集合中的第j个特征,j为特征的编号;
S224:将fq k从RF特征集合中剔除,获得第k次更新后的RF特征集合F(RF,k),计算公式 为:
Figure 779485DEST_PATH_IMAGE022
通过第k次RF的评价函数获得第k次更新后的RF特征集合的准确率
Figure 151561DEST_PATH_IMAGE023
,计算公式为:
Figure 21952DEST_PATH_IMAGE024
S225:计算获得第k次RFE-XGB模型的贡献度最小特征fz k,计算公式为:
Figure 137676DEST_PATH_IMAGE025
其中,F(XGB,k-1)为第k-1次更新后的XGB特征集合,DXGB()为RFE-XGB模型的建模函数;
S226:将fz k从XGB特征集合中剔除,获得第k次更新后的XGB特征集合F(XGB,k),计算 公式为:
Figure 711877DEST_PATH_IMAGE026
通过第k次XGB的评价函数获得第k次更新后的XGB特征集合的准确率
Figure 254854DEST_PATH_IMAGE027
,计算公式为:
Figure 344032DEST_PATH_IMAGE028
S227:令k=k+1,返回步骤S222;
S228:计算获得RF的最终排序,计算公式为:
Figure 60184DEST_PATH_IMAGE029
其中,Rank(RF,F)为RF特征集合中最优特征的排序,
Figure 816788DEST_PATH_IMAGE030
为RF特征集 合中准确率的排序;
计算获得XGB的最终排序,计算公式为:
Figure 530666DEST_PATH_IMAGE031
其中,Rank(XGB,F)为XGB特征集合中最优特征的排序,
Figure 372720DEST_PATH_IMAGE032
为XGB特 征集合中准确率的排序;
S229:计算获得RFE-RF模型准确率达到最高时所用的特征集合FT3,计算公式为:
Figure 850754DEST_PATH_IMAGE033
其中,T3为RFE-RF模型达到最高准确率时所用特征个数;
计算获得RFE-XGB模型准确率达到最高时所用的特征集合FT4,计算公式为:
Figure 461864DEST_PATH_IMAGE034
其中,T4为RFE-XGB模型达到最高准确率时所用特征个数。
优选的,步骤S25中所述新排名的表达式为:
Figure 612223DEST_PATH_IMAGE035
其中,ReRank(F)为新排名;Li依次代表SFS-SVM模型,SFS-KNN模型,RFE-RF模型,RFE-XGB模型和MIC模型对应的最优特征的排序,其中i=1,…,n,n=5。
优选的,所述集成诊断模块包括:SVM学习器、KNN学习器、随机森林学习器和XGBoost学习器;
通过所述SVM学习器对所述特征矩阵进行诊断,获得SVM诊断结果;
通过所述KNN学习器对所述特征矩阵进行诊断,获得KNN诊断结果;
通过所述随机森林学习器对所述特征矩阵进行诊断,获得随机森林诊断结果;
通过所述XGBoost学习器对所述特征矩阵进行诊断,获得XGBoost诊断结果;
通过所述XGBoost学习器对所述SVM诊断结果、所述KNN诊断结果、所述随机森林诊断和所述XGBoost诊断结果进行结合,获得声学诊断结果。
一种可迁移的特征自动选取声学诊断系统,包括:
声学特征获取模块,用于获取原始音频,对所述原始音频进行特征提取处理,获得声学特征;
最优特征子集获取模块,用于通过混合特征选择模型对所述声学特征进行筛选,获得最优特征子集;
矩阵构建模块,用于通过所述最优特征子集构建特征矩阵;
诊断模块,用于通过集成诊断模块对所述特征矩阵进行诊断,获得声学诊断结果。
本发明具有以下有益效果:
本发明通过SFS-SVM模型、SFS-KNN模型、RFE-RF模型、RFE-XGB模型和MIC模型综合构建的混合特征选择模型,可以将多种特征选择方法获得的选择结果进行综合分析,获得最佳的声学诊断,极大的提高了声学诊断结果的鲁棒性。
附图说明
图1为本发明实施例方法流程图;
图2为本发明实施例系统结构图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,本发明提供一种可迁移的特征自动选取声学诊断方法,包括:
S1:获取原始音频,对所述原始音频进行特征提取处理,获得声学特征;
S2:通过混合特征选择模型对所述声学特征进行筛选,获得最优特征子集;
S3:通过所述最优特征子集构建特征矩阵;
S4:通过集成诊断模块对所述特征矩阵进行诊断,获得声学诊断结果。
本实施例中,步骤S1具体为:
S11:对所述原始音频依次进行预加重处理、分帧处理和加窗处理,获得预处理后的音频;
S12:从所述预处理后的音频中提取声学特征,所述声学特征包括:
时域特征(mean value、variance、mean amplitude、short time energy、rootmean square、square root amplitude、standard deviation、zero crossing rate);
频域特征(MFCC、mel spectrogram、spectral centroid、spectral bandwidth、spectral contrast、spectral flatness、spectral rolloff);
小波域特征(wavelet mean frequency、wavelet entropy);
和波形特征(crest factor、shape factor、skewness factor、impulse factor、margin factor、kurtosis、kurtosis factor);
和一些其它特征(tonnetz、chroma stft、chroma cqt、chroma cens)。
本实施例中,所述混合特征选择模型(HFS)包括:SFS-SVM模型、SFS-KNN模型、RFE-RF模型、RFE-XGB模型和MIC模型。
具体的,通过多种模型构建的混合特征选择模型能有效减少无关特征和冗余特征,优选出最优特征子集;
在HFS算法中,为了让特征选择方法具有代表性,一共选取了5种基于不同原理的特征选择方法,涵盖了过滤法、包装法和嵌入法。
包装法(Wrapper)是一种特征选择过程与学习算法结合的特征选择方法,Wrapper将选用的学习器封装成黑盒,根据它在特征子集上的预测精度评价所选特征的优良,并采用搜索策略调整子集,最终获得近似的最优子集。
包装式特征选择方法每每由两部分组成,即搜索策略和学习算法,学习算法主要用来评判特征子集的优劣,学习算法的选取不受限制,分类问题可使用支持向量机(SVM)、k近邻(KNN)等。这里我们选用序列前向搜索(SFS)作为搜索策略,SVM和KNN作为学习算法。序列前向搜索(SFS)是每次贪心地把得分最高的特征加入到已选特征子集当中。构建SFS-SVM模型和SFS-KNN模型,每个模型依次不停地选择单个特征加入上一步骤刚开始为空集的特征子集中,每次加入的单个特征是使得评估器准确率在当前特征个数下取得最优特征;
嵌入式特征选择算法嵌入在学习算法当中,当分类算法训练过程结束就可以得到特征子集。嵌入式特征选择算法没有统一的流程框架图,不同的算法框架各异。分类树模型是经典的嵌入式特征选择算法。
随机森林(RF)和XGBoost(XGB)是目前以树模型为结构的具有代表性的特征选择算法,因此嵌入法选用随机森林(RF)和XGBoost(XGB),为了能反映特征子集影响分类器性能的变化,使用去除冗余特征较好的递归消除法(RFE)结合随机森林和XGBoost,构建RFE-RF和RFE-XGB模型,模型通过多轮训练,每轮剔除掉一个特征贡献度最小的特征重新建模。
过滤法是利用各特征的数理特性来对特征进行选择,可以反映特征与标签之间的相关性。具有很强的普适性,可识别任何函数关系,对复杂的声学特征具有很好的识别效果。因此过滤法中采用MIC。
本实施例中,步骤S2具体为:
S21:通过SFS-SVM模型计算获得SFS-SVM模型准确率达到最高时所用的特征集合FT1,通过SFS-KNN模型计算获得SFS-KNN模型准确率达到最高时所用的特征集合FT2
S22:通过RFE-RF模型计算获得RFE-RF模型准确率达到最高时所用的特征集合FT3,通过RFE-XGB模型计算获得RFE-XGB模型准确率达到最高时所用的特征集合FT4
S23:通过MIC模型计算获得MIC模型的最优特征的排序RankMIC
S24:计算获得最优特征子集的最大集合Fmax和最优特征子集的最小集合Fmin
Figure 941573DEST_PATH_IMAGE036
Figure 202790DEST_PATH_IMAGE002
具体的,
Figure 340510DEST_PATH_IMAGE037
表示两个集合合并,
Figure 661770DEST_PATH_IMAGE038
表示两个集合相交;
S25:构建新排名,获取新排名下前T个特征集合FT,FT满足条件:
Figure 212837DEST_PATH_IMAGE003
具体的,T=MAX(T1,T2,T3,T4),即T选取T1,T2,T3,T4中的最大值;
S26:计算获得最优特征子集Fa
Figure 808903DEST_PATH_IMAGE004
Figure 397535DEST_PATH_IMAGE005
为最小特征子集选取函数。然后取其中的最大值个数T为阈值,输 出新特征排名下的前T个数为最优特征子集Fa
本实施例中,步骤S21具体为:
S211:设置SVM特征集合、KNN特征集合和计数k,将SVM特征集合初始化为空集F(SVM,0),将KNN特征集合初始化为空集F(KNN,0),将k的值初始化为1;
S212:判断计数k的值,若k≤m则进入步骤S213,否则进入步骤S218;m为提取的声学特征集合中的特征数量;
S213:计算获得第k次SFS-SVM模型的最优特征ft k,计算公式为:
Figure 889696DEST_PATH_IMAGE006
其中,
Figure 662480DEST_PATH_IMAGE007
为最优特征选取函数,F(SVM,k-1)为第k-1次更新后的SVM特征集合,GSVM ()为SFS-SVM模型的评价函数,X为声学特征数据,F为声学特征集合,fj为声学特征集合中 的第j个特征,j为特征的编号;
具体的,最优特征选取函数
Figure 265500DEST_PATH_IMAGE039
的运算过程为:在特征集合中选取特征fj,fj 能使评价函数GSVM()的值取得最大,此时将特征fj作为最优特征ft k;声学特征集合F用于存 放各声学特征数据;
S214:将ft k添加至SVM特征集合中,获得第k次更新后的SVM特征集合F(SVM,k),计算 公式为:
Figure 643392DEST_PATH_IMAGE040
通过第k次svm的评价函数获得第k次更新后的svm特征集合的准确率
Figure 802060DEST_PATH_IMAGE041
,计算公式为:
Figure 593298DEST_PATH_IMAGE010
S215:计算获得第k次SFS-KNN模型的最优特征fp k,计算公式为:
Figure 734430DEST_PATH_IMAGE011
其中,F(KNN,k-1)为第k-1次更新后的KNN特征集合,GKNN()为SFS-KNN模型的评价函数;
具体的,最优特征选取函数
Figure 294724DEST_PATH_IMAGE039
的运算过程为:在特征集合中选取特征fj,fj 能使评价函数GKNN()的值取得最大,此时将特征fj作为最优特征fp k
S216:将fp k添加至KNN特征集合中,获得第k次更新后的KNN特征集合F(KNN,k),计算 公式为:
Figure 866038DEST_PATH_IMAGE012
通过第k次KNN的评价函数获得第k次更新后的KNN特征集合的准确率
Figure 144573DEST_PATH_IMAGE042
,计算公式为:
Figure 89395DEST_PATH_IMAGE043
S217:令k=k+1,返回步骤S212;
S218:计算获得svm的最终排序,计算公式为:
Figure 504196DEST_PATH_IMAGE015
其中,Rank(SVM,F)为SVM特征集合中最优特征的排序,
Figure 509061DEST_PATH_IMAGE016
为SVM特征集 合中准确率的排序;
计算获得KNN的最终排序,计算公式为:
Figure 681416DEST_PATH_IMAGE017
其中,Rank(KNN,F)为KNN特征集合中最优特征的排序,
Figure 164350DEST_PATH_IMAGE018
为KNN特征 集合中准确率的排序;
S219:计算获得SFS-SVM模型准确率达到最高时所用的特征集合FT1,计算公式为:
Figure 699237DEST_PATH_IMAGE019
其中,T1为SFS-SVM模型达到最高准确率时所用特征个数;
计算获得SFS-KNN模型准确率达到最高时所用的特征集合FT2,计算公式为:
Figure 343845DEST_PATH_IMAGE020
其中,T2为SFS-KNN模型达到最高准确率时所用特征个数。
本实施例中,步骤S22具体为:
S221:设置RF特征集合、XGB特征集合和计数k,将RF特征集合初始化为满集,将XGB特征集合初始化为满集,将k的值初始化为1;
S222:判断计数k的值,若k≤m则进入步骤S223,否则进入步骤S228;m为提取的声学特征集合中的特征数量;
S223:计算获得第k次RFE-RF模型的贡献度最小特征fq k,计算公式为:
Figure 328463DEST_PATH_IMAGE044
其中,DRF()为RFE-RF模型的建模函数,F(RF,k-1)为第k-1次更新后的RF特征集合,X为声学特征数据,F为声学特征集合,fj为声学特征集合中的第j个特征,j为特征的编号;
具体的,最差特征选取函数
Figure 411825DEST_PATH_IMAGE045
的运算过程为:将fj从F(RF,k-1)中剔除,使用 RFE-RF模型的建模函数DRF()从剔除后的F(RF,k-1)中获取此次最差特征fq k
S224:将fq k从RF特征集合中剔除,获得第k次更新后的RF特征集合F(RF,k),计算公式 为:
Figure 801218DEST_PATH_IMAGE022
通过第k次RF的评价函数获得第k次更新后的RF特征集合的准确率
Figure 147886DEST_PATH_IMAGE046
,计算公式为:
Figure 357150DEST_PATH_IMAGE024
S225:计算获得第k次RFE-XGB模型的贡献度最小特征fz k,计算公式为:
Figure 181887DEST_PATH_IMAGE047
其中,F(XGB,k-1)为第k-1次更新后的XGB特征集合,DXGB()为RFE-XGB模型的建模函数;
具体的,最差特征选取函数
Figure 425786DEST_PATH_IMAGE048
的运算过程为:将fj从F(XGB,k-1)中剔除,使用 RFE-XGB模型的建模函数DXGB()从剔除后的F(XGB,k-1)中获取此次最差特征fz k
S226:将fz k从XGB特征集合中剔除,获得第k次更新后的XGB特征集合F(XGB,k),计算 公式为:
Figure 943355DEST_PATH_IMAGE026
通过第k次XGB的评价函数获得第k次更新后的XGB特征集合的准确率
Figure 577599DEST_PATH_IMAGE049
,计算公式为:
Figure 536852DEST_PATH_IMAGE028
S227:令k=k+1,返回步骤S222;
S228:计算获得RF的最终排序,计算公式为:
Figure 635258DEST_PATH_IMAGE029
其中,Rank(RF,F)为RF特征集合中最优特征的排序,
Figure 995833DEST_PATH_IMAGE030
为RF特征集 合中准确率的排序;
计算获得XGB的最终排序,计算公式为:
Figure 445268DEST_PATH_IMAGE031
其中,Rank(XGB,F)为XGB特征集合中最优特征的排序,
Figure 611808DEST_PATH_IMAGE032
为XGB特 征集合中准确率的排序;
S229:计算获得RFE-RF模型准确率达到最高时所用的特征集合FT3,计算公式为:
Figure 830299DEST_PATH_IMAGE033
其中,T3为RFE-RF模型达到最高准确率时所用特征个数;
计算获得RFE-XGB模型准确率达到最高时所用的特征集合FT4,计算公式为:
Figure 424092DEST_PATH_IMAGE034
其中,T4为RFE-XGB模型达到最高准确率时所用特征个数。
本实施例中,步骤S25中所述新排名的表达式为:
Figure 95244DEST_PATH_IMAGE035
其中,ReRank(F)为新排名;Li依次代表SFS-SVM模型,SFS-KNN模型,RFE-RF模型,RFE-XGB模型和MIC模型对应的最优特征的排序,其中i=1,…,n,n=5。
本实施例中,所述集成诊断模块包括:
SVM学习器(持向量机(Support Vector Machine,SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。在机器学习中,支持向量机(SVM,还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析);
KNN学习器(kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别);
随机森林学习器(机森林就是用过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支------集成学习(EnsembleLearning)方法。集成学习就是使用一系列学习器进行学习,并将各个学习方法通过某种特定的规则进行整合,以获得比单个学习器更好的学习效果。集成学习通过建立几个模型,并将它们组合起来来解决单一预测问题。它的工作原理主要是生成多个分类器或者模型,各自独立地学习和作出预测);
和XGBoost学习器(XGBoost是boosting算法的其中一种。Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。因为XGBoost是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器。而所用到的树模型则是CART回归树模型);
通过所述SVM学习器对所述特征矩阵进行诊断,获得SVM诊断结果;
通过所述KNN学习器对所述特征矩阵进行诊断,获得KNN诊断结果;
通过所述随机森林学习器对所述特征矩阵进行诊断,获得随机森林诊断结果;
通过所述XGBoost学习器对所述特征矩阵进行诊断,获得XGBoost诊断结果;
通过所述XGBoost学习器对所述SVM诊断结果、所述KNN诊断结果、所述随机森林诊断和所述XGBoost诊断结果进行结合,获得声学诊断结果。
本发明提供一种可迁移的特征自动选取声学诊断系统,包括:
声学特征获取模块,用于获取原始音频,对所述原始音频进行特征提取处理,获得声学特征;
最优特征子集获取模块,用于通过混合特征选择模型对所述声学特征进行筛选,获得最优特征子集;
矩阵构建模块,用于通过所述最优特征子集构建特征矩阵;
诊断模块,用于通过集成诊断模块对所述特征矩阵进行诊断,获得声学诊断结果。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。词语第一、第二、以及第三等的使用不表示任何顺序,可将这些词语解释为标识。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种可迁移的特征自动选取声学诊断方法,其特征在于,包括:
S1:获取原始音频,对所述原始音频进行特征提取处理,获得声学特征;
S2:通过混合特征选择模型对所述声学特征进行筛选,获得最优特征子集;
S3:通过所述最优特征子集构建特征矩阵;
S4:通过集成诊断模块对所述特征矩阵进行诊断,获得声学诊断结果。
2.根据权利要求1所述的可迁移的特征自动选取声学诊断方法,其特征在于,步骤S1具体为:
S11:对所述原始音频依次进行预加重处理、分帧处理和加窗处理,获得预处理后的音频;
S12:从所述预处理后的音频中提取声学特征,所述声学特征包括:时域特征、频域特征、小波域特征和波形特征。
3.根据权利要求1所述的可迁移的特征自动选取声学诊断方法,其特征在于,所述混合特征选择模型包括:SFS-SVM模型、SFS-KNN模型、RFE-RF模型、RFE-XGB模型和MIC模型。
4.根据权利要求3所述的可迁移的特征自动选取声学诊断方法,其特征在于,步骤S2具体为:
S21:通过SFS-SVM模型计算获得SFS-SVM模型准确率达到最高时所用的特征集合FT1,通过SFS-KNN模型计算获得SFS-KNN模型准确率达到最高时所用的特征集合FT2
S22:通过RFE-RF模型计算获得RFE-RF模型准确率达到最高时所用的特征集合FT3,通过RFE-XGB模型计算获得RFE-XGB模型准确率达到最高时所用的特征集合FT4
S23:通过MIC模型计算获得MIC模型的最优特征的排序RankMIC
S24:计算获得最优特征子集的最大集合Fmax和最优特征子集的最小集合Fmin
Figure 45483DEST_PATH_IMAGE002
Figure 27870DEST_PATH_IMAGE003
S25:构建新排名,获取新排名下前T个特征集合FT,FT满足条件:
Figure 869924DEST_PATH_IMAGE004
S26:计算获得最优特征子集Fa
Figure 327450DEST_PATH_IMAGE005
Figure 469718DEST_PATH_IMAGE006
为最小特征子集选取函数。
5.根据权利要求4所述的可迁移的特征自动选取声学诊断方法,其特征在于,步骤S21具体为:
S211:设置SVM特征集合、KNN特征集合和计数k,将SVM特征集合初始化为空集F(SVM,0),将KNN特征集合初始化为空集F(KNN,0),将k的值初始化为1;
S212:判断计数k的值,若k≤m则进入步骤S213,否则进入步骤S218;m为提取的声学特征集合中的特征数量;
S213:计算获得第k次SFS-SVM模型的最优特征ft k,计算公式为:
Figure 354498DEST_PATH_IMAGE007
其中,
Figure 683848DEST_PATH_IMAGE008
为最优特征选取函数,F(SVM,k-1)为第k-1次更新后的SVM特征集合,GSVM ()为SFS-SVM模型的评价函数,X为声学特征数据,F为声学特征集合,fj为声学特征集合中 的第j个特征,j为特征的编号;
S214:将ft k添加至SVM特征集合中,获得第k次更新后的SVM特征集合F(SVM,k),计算公式 为:
Figure 679486DEST_PATH_IMAGE009
通过第k次svm的评价函数获得第k次更新后的svm特征集合的准确率
Figure 410681DEST_PATH_IMAGE010
,计算 公式为:
Figure 138466DEST_PATH_IMAGE011
S215:计算获得第k次SFS-KNN模型的最优特征fp k,计算公式为:
Figure 975620DEST_PATH_IMAGE012
其中,F(KNN,k-1)为第k-1次更新后的KNN特征集合,GKNN()为SFS-KNN模型的评价函数;
S216:将fp k添加至KNN特征集合中,获得第k次更新后的KNN特征集合F(KNN,k),计算公式 为:
Figure 774949DEST_PATH_IMAGE013
通过第k次KNN的评价函数获得第k次更新后的KNN特征集合的准确率
Figure 95072DEST_PATH_IMAGE014
,计 算公式为:
Figure 587233DEST_PATH_IMAGE015
S217:令k=k+1,返回步骤S212;
S218:计算获得svm的最终排序,计算公式为:
Figure 891175DEST_PATH_IMAGE016
其中,Rank(SVM,F)为SVM特征集合中最优特征的排序,
Figure 228616DEST_PATH_IMAGE017
为SVM特征集合中 准确率的排序;
计算获得KNN的最终排序,计算公式为:
Figure 731141DEST_PATH_IMAGE018
其中,Rank(KNN,F)为KNN特征集合中最优特征的排序,
Figure 128625DEST_PATH_IMAGE019
为KNN特征集合 中准确率的排序;
S219:计算获得SFS-SVM模型准确率达到最高时所用的特征集合FT1,计算公式为:
Figure 922793DEST_PATH_IMAGE020
其中,T1为SFS-SVM模型达到最高准确率时所用特征个数;
计算获得SFS-KNN模型准确率达到最高时所用的特征集合FT2,计算公式为:
Figure 63924DEST_PATH_IMAGE021
其中,T2为SFS-KNN模型达到最高准确率时所用特征个数。
6.根据权利要求4所述的可迁移的特征自动选取声学诊断方法,其特征在于,步骤S22具体为:
S221:设置RF特征集合、XGB特征集合和计数k,将RF特征集合初始化为满集,将XGB特征集合初始化为满集,将k的值初始化为1;
S222:判断计数k的值,若k≤m则进入步骤S223,否则进入步骤S228;m为提取的声学特征特征数量;
S223:计算获得第k次RFE-RF模型的贡献度最小特征fq k,计算公式为:
Figure 624218DEST_PATH_IMAGE022
其中,DRF()为RFE-RF模型的建模函数,F(RF,k-1)为第k-1次更新后的RF特征集合,X为声学特征数据,F为声学特征集合,fj为声学特征集合中的第j个特征,j为特征的编号;
S224:将fq k从RF特征集合中剔除,获得第k次更新后的RF特征集合F(RF,k),计算公式为:
Figure 458182DEST_PATH_IMAGE023
通过第k次RF的评价函数获得第k次更新后的RF特征集合的准确率
Figure 471138DEST_PATH_IMAGE024
,计算 公式为:
Figure 150381DEST_PATH_IMAGE025
S225:计算获得第k次RFE-XGB模型的贡献度最小特征fz k,计算公式为:
Figure 565181DEST_PATH_IMAGE026
其中,F(XGB,k-1)为第k-1次更新后的XGB特征集合,DXGB()为RFE-XGB模型的建模函数;
S226:将fz k从XGB特征集合中剔除,获得第k次更新后的XGB特征集合F(XGB,k),计算公式 为:
Figure 570047DEST_PATH_IMAGE027
通过第k次XGB的评价函数获得第k次更新后的XGB特征集合的准确率
Figure 742402DEST_PATH_IMAGE028
,计 算公式为:
Figure 222406DEST_PATH_IMAGE029
S227:令k=k+1,返回步骤S222;
S228:计算获得RF的最终排序,计算公式为:
Figure 491713DEST_PATH_IMAGE030
其中,Rank(RF,F)为RF特征集合中最优特征的排序,
Figure 667480DEST_PATH_IMAGE031
为RF特征集合中 准确率的排序;
计算获得XGB的最终排序,计算公式为:
Figure 655027DEST_PATH_IMAGE032
其中,Rank(XGB,F)为XGB特征集合中最优特征的排序,
Figure 941652DEST_PATH_IMAGE033
为XGB特征集 合中准确率的排序;
S229:计算获得RFE-RF模型准确率达到最高时所用的特征集合FT3,计算公式为:
Figure 65466DEST_PATH_IMAGE034
其中,T3为RFE-RF模型达到最高准确率时所用特征个数;
计算获得RFE-XGB模型准确率达到最高时所用的特征集合FT4,计算公式为:
Figure 208871DEST_PATH_IMAGE035
其中,T4为RFE-XGB模型达到最高准确率时所用特征个数。
7.根据权利要求4所述的可迁移的特征自动选取声学诊断方法,其特征在于,步骤S25中所述新排名的表达式为:
Figure 683715DEST_PATH_IMAGE036
其中,ReRank(F)为新排名;Li依次代表SFS-SVM模型,SFS-KNN模型,RFE-RF模型,RFE-XGB模型和MIC模型对应的最优特征的排序,其中i=1,…,n,n=5。
8.根据权利要求1所述的可迁移的特征自动选取声学诊断方法,其特征在于,所述集成诊断模块包括:SVM学习器、KNN学习器、随机森林学习器和XGBoost学习器;
通过所述SVM学习器对所述特征矩阵进行诊断,获得SVM诊断结果;
通过所述KNN学习器对所述特征矩阵进行诊断,获得KNN诊断结果;
通过所述随机森林学习器对所述特征矩阵进行诊断,获得随机森林诊断结果;
通过所述XGBoost学习器对所述特征矩阵进行诊断,获得XGBoost诊断结果;
通过所述XGBoost学习器对所述SVM诊断结果、所述KNN诊断结果、所述随机森林诊断和所述XGBoost诊断结果进行结合,获得声学诊断结果。
9.一种可迁移的特征自动选取声学诊断系统,其特征在于,包括:
声学特征获取模块,用于获取原始音频,对所述原始音频进行特征提取处理,获得声学特征;
最优特征子集获取模块,用于通过混合特征选择模型对所述声学特征进行筛选,获得最优特征子集;
矩阵构建模块,用于通过所述最优特征子集构建特征矩阵;
诊断模块,用于通过集成诊断模块对所述特征矩阵进行诊断,获得声学诊断结果。
CN202211381286.3A 2022-11-07 2022-11-07 一种可迁移的特征自动选取声学诊断方法及系统 Active CN115545086B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211381286.3A CN115545086B (zh) 2022-11-07 2022-11-07 一种可迁移的特征自动选取声学诊断方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211381286.3A CN115545086B (zh) 2022-11-07 2022-11-07 一种可迁移的特征自动选取声学诊断方法及系统

Publications (2)

Publication Number Publication Date
CN115545086A true CN115545086A (zh) 2022-12-30
CN115545086B CN115545086B (zh) 2023-04-18

Family

ID=84721358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211381286.3A Active CN115545086B (zh) 2022-11-07 2022-11-07 一种可迁移的特征自动选取声学诊断方法及系统

Country Status (1)

Country Link
CN (1) CN115545086B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151470A (zh) * 2023-03-06 2023-05-23 联宝(合肥)电子科技有限公司 一种产品质量预测方法、装置、设备及存储介质
CN116631516A (zh) * 2023-05-06 2023-08-22 海南大学 基于混合特征模型和提升模型集成的抗结核肽预测系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190361919A1 (en) * 2018-05-23 2019-11-28 Tata Consultancy Services Limited Method and system for joint selection of a feature subset-classifier pair for a classification task
CN112685947A (zh) * 2021-01-19 2021-04-20 广州科技贸易职业学院 一种板料回弹模型参数优化方法、装置、终端及存储介质
CN112819059A (zh) * 2021-01-26 2021-05-18 中国矿业大学 一种基于流行保持迁移学习的滚动轴承故障诊断方法
CN113360730A (zh) * 2021-06-03 2021-09-07 哈尔滨理工大学 一种基于过滤器和rf-rfe算法的特征选择方法
CN113795853A (zh) * 2019-04-15 2021-12-14 甲骨文国际公司 基于元学习的自动特征子集选择
CN113971961A (zh) * 2021-09-13 2022-01-25 武汉声与声科技合伙企业(有限合伙) 降噪后残留的周期性信号评估算法
CN114528868A (zh) * 2022-01-04 2022-05-24 东南大学 一种压缩机叶片裂纹故障检测方法
CN114861719A (zh) * 2022-04-29 2022-08-05 西安理工大学 基于集成学习的高速列车轴承故障诊断方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190361919A1 (en) * 2018-05-23 2019-11-28 Tata Consultancy Services Limited Method and system for joint selection of a feature subset-classifier pair for a classification task
CN113795853A (zh) * 2019-04-15 2021-12-14 甲骨文国际公司 基于元学习的自动特征子集选择
CN112685947A (zh) * 2021-01-19 2021-04-20 广州科技贸易职业学院 一种板料回弹模型参数优化方法、装置、终端及存储介质
CN112819059A (zh) * 2021-01-26 2021-05-18 中国矿业大学 一种基于流行保持迁移学习的滚动轴承故障诊断方法
CN113360730A (zh) * 2021-06-03 2021-09-07 哈尔滨理工大学 一种基于过滤器和rf-rfe算法的特征选择方法
CN113971961A (zh) * 2021-09-13 2022-01-25 武汉声与声科技合伙企业(有限合伙) 降噪后残留的周期性信号评估算法
CN114528868A (zh) * 2022-01-04 2022-05-24 东南大学 一种压缩机叶片裂纹故障检测方法
CN114861719A (zh) * 2022-04-29 2022-08-05 西安理工大学 基于集成学习的高速列车轴承故障诊断方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JING ZHANG等: "A Hybrid Feature Selection Approach by Correlation based Filters and SVM-RFE", 《2014 22ND INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION》 *
吴青等: "支持向量机特征选择方法综述", 《西安邮电大学学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116151470A (zh) * 2023-03-06 2023-05-23 联宝(合肥)电子科技有限公司 一种产品质量预测方法、装置、设备及存储介质
CN116631516A (zh) * 2023-05-06 2023-08-22 海南大学 基于混合特征模型和提升模型集成的抗结核肽预测系统

Also Published As

Publication number Publication date
CN115545086B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
CN115545086B (zh) 一种可迁移的特征自动选取声学诊断方法及系统
Priyadarshani et al. Automated birdsong recognition in complex acoustic environments: a review
Mittermaier et al. Small-footprint keyword spotting on raw audio data with sinc-convolutions
Cao et al. Deep learning-based recognition of underwater target
Piczak Recognizing bird species in audio recordings using deep convolutional neural networks
CN111899757B (zh) 针对目标说话人提取的单通道语音分离方法及系统
Huang et al. Large-scale weakly-supervised content embeddings for music recommendation and tagging
CN108478216A (zh) 一种基于卷积神经网络的癫痫病发作前期智能预测方法
CN110992985A (zh) 识别跑步机异音的识别模型确定方法、识别方法、系统
Anders et al. Compensating class imbalance for acoustic chimpanzee detection with convolutional recurrent neural networks
CN116340746A (zh) 一种基于随机森林改进的特征选择方法
CN115830436A (zh) 一种基于深度学习的海洋生物智能检测方法
Noumida et al. Stacked Res2Net-CBAM with Grouped Channel Attention for Multi-Label Bird Species Classification
Kereliuk et al. Deep learning, audio adversaries, and music content analysis
CN113837266A (zh) 一种基于特征提取和Stacking集成学习的软件缺陷预测方法
CN117831570A (zh) 一种基于原型分类器的完全小样本类别增量音频分类方法
CN116884435A (zh) 一种基于音频提示学习的声音事件检测方法及装置
Chaves et al. Katydids acoustic classification on verification approach based on MFCC and HMM
CN109117787A (zh) 一种情感脑电信号识别方法及系统
Kalkan et al. Online feature selection and classification
CN111326164B (zh) 一种半监督式音乐主旋律提取方法
CN111274989A (zh) 一种基于深度学习的野外车辆识别方法
CN114781492B (zh) 一种面向样本不均衡的网络流量数据增强方法
CN114863939B (zh) 一种基于声音的大熊猫属性识别方法及系统
Mancusi et al. Towards the evaluation of marine acoustic biodiversity through data-driven audio source separation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant