CN112885368B - 基于改进胶囊网络的多频带谱减法振动信号去噪方法 - Google Patents
基于改进胶囊网络的多频带谱减法振动信号去噪方法 Download PDFInfo
- Publication number
- CN112885368B CN112885368B CN202110096683.5A CN202110096683A CN112885368B CN 112885368 B CN112885368 B CN 112885368B CN 202110096683 A CN202110096683 A CN 202110096683A CN 112885368 B CN112885368 B CN 112885368B
- Authority
- CN
- China
- Prior art keywords
- vibration signal
- noise
- denoising
- spectrum
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002775 capsule Substances 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000003595 spectral effect Effects 0.000 title claims abstract description 29
- 238000001228 spectrum Methods 0.000 claims abstract description 126
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 238000009432 framing Methods 0.000 claims abstract description 4
- 230000002452 interceptive effect Effects 0.000 claims abstract description 4
- 230000001131 transforming effect Effects 0.000 claims abstract description 4
- 239000002245 particle Substances 0.000 claims description 50
- 238000009499 grossing Methods 0.000 claims description 30
- 238000010586 diagram Methods 0.000 claims description 27
- 239000013598 vector Substances 0.000 claims description 22
- 230000006870 function Effects 0.000 claims description 17
- 238000012549 training Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 10
- 230000004927 fusion Effects 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 8
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 4
- 239000000654 additive Substances 0.000 claims description 3
- 230000000996 additive effect Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 12
- 230000004913 activation Effects 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000011410 subtraction method Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Complex Calculations (AREA)
Abstract
本发明公开了一种基于改进胶囊网络的多频带谱减法振动信号去噪方法。该方法的主要步骤为:1、获取两路振动信号,分别为含噪振动信号以及纯净振动信号;2、对含噪振动信号进行加窗,分帧,傅里叶变换得到含噪振动信号的幅度谱和相位谱;3、将含噪振动信号的幅度谱切割成任意不重复且彼此互不干扰的多个子带;4、采用谱减法对每个子带中含噪振动信号进行初步去噪,获得初步去噪后的振动信号;5、采用神经网络对初步去噪后的振动信号进行二次去噪。通过该方法结合了谱减法易于实现和理解的优点以及深度神经网络强大学习能力的特点,避免了噪声种类繁多的问题,同时也大大提升了去噪效果。
Description
技术领域
本发明涉及一种噪声处理方法,特别涉及一种基于改进胶囊网络的多频带谱减法振动信号去噪方法。
背景技术
由于工业现场环境复杂,在振动信号采集时混入噪声是无法避免的,这样就造成了振动信号特征提取及分析的不准确或不可靠,工作人员就不能准确检测设备的运行状况,更不能准确分析判断设备的安全性。在对振动信号进行特征提取及相关分析前,需要进行降噪处理。利用经过处理分析的信号,可以迅速、准确地对设备出现的异常状态或故障状态做出诊断、预防和消除,对设备的运行进行必要的指导,提高设备的可靠性、安全性和有效性,从而将故障损失降到最低水平。
传统的谱减算法简单高效,其基本思路是,从带噪信号的功率谱中减去估计到的噪声功率谱,从而得到纯净的信号频谱。谱减法物理意义直接,实现简单,相对于其它一些基于参数统计及训练的方法,运算量小,在实时性方面具有突出的优势,同时降噪效果也不错。
传统的谱减算法中噪声估计采用无振动信号段噪声的统计平均代替当前帧的噪声,但在实际检测中,这种理想的平稳噪声几乎不存在,对于有振动信号部分,由于噪声和振动信号叠加在一起,如果仅使用无振动信号段噪声的统计平均代替当前帧的噪声,在进行功率谱相减时,会残留谱峰,这些谱峰会产生新的残余噪声,该残余噪声在频域上成为离散的谱峰,相应地在时域上就呈现出类正弦信号的叠加,这种残余噪声就是“音乐噪声”。“音乐噪声”的产生会降低振动信号的去噪效果。
发明内容
为了解决采用传统的谱减算法对振动信号进行去噪时会产生新的残余噪声,从而大大降低振动信号去噪效果的问题,本发明提供给了一种基于改进胶囊网络的多频带谱减法振动信号去噪方法。
本发明的具体技术方案是:
提供了一种基于改进胶囊网络的多频带谱减法振动信号去噪方法,具体实现步骤如下:
步骤1:获取两路振动信号,分别为含噪振动信号y(n)以及纯净振动信号x(n);
其中,含噪振动信号y(n)是由纯净振动信号x(n)和加性噪声d(n)组成,其表达式为:
y(n)=x(n)+d(n)
式中,n表示采样点;
步骤2:对含噪振动信号进行加窗,分帧,傅里叶变换得到含噪振动信号的幅度谱|Y(f)|和相位谱f表示频率;
步骤3:将含噪振动信号的幅度谱|Y(f)|切割成任意不重复且彼此互不干扰的多个子带;
步骤4:采用谱减法对每个子带中含噪振动信号进行初步去噪,获得初步去噪后的振动信号;
步骤4.1:任意子带K的第1帧信号的处理
步骤4.1.1:设置第1帧噪声信号幅度谱估计值并将其代入谱减公式计算第1帧去噪振动信号幅度谱估计值/>
其中,|Y1(f)|为第1帧含噪振动信号的幅度谱,δ为减法因子,β为谱下限参数;
步骤4.1.2:给定第1帧自适应平滑参数c1,c1=min[θ,1],θ为平滑控制常数,θ>0;
步骤4.1.3:计算第1帧平滑的噪声谱估计;
步骤4.1.4:计算第1帧去噪信号的平滑功率谱;
步骤4.2:第j帧去噪振动信号幅度谱估计值的求解,j≥2;
步骤4.2.1:基于第j-1帧平滑的噪声谱估计以及第j-1帧去噪信号的平滑功率谱/>构建第j帧维纳滤波器模型,具体表达式为:
步骤4.2.2:计算第j帧噪声幅度谱的估计值
其中,|Yj(f)|为第j帧含噪振动信号的幅度谱;
步骤4.2.3:根据谱减法获取第j帧去噪振动信号的幅度谱估计值
步骤4.2.4:确定第j帧自适应平滑参数cj;
式中:θ为平滑控制常数,θ>0;
步骤4.2.5:计算第j帧平滑的噪声谱估计
步骤4.2.6:计算第j帧去噪信号的平滑功率谱
步骤4.2.7:重复步骤4.2.1-4.2.6,获取当前子带K内所有帧去噪振动信号的幅度谱估计值
步骤4.3:对每个子带重复执行步骤4.1和4.2,获得每个子带初步去噪后的振动信号幅度谱;
步骤4.4:对每个子带初步去噪后的振动信号幅度谱进行叠加,并结合含噪振动信号的相位谱进行逆傅里叶变换,恢复出初步去噪后的振动信号;
步骤5:采用神经网络对初步去噪后的振动信号进行二次去噪;
步骤5.1:将步骤4.4中恢复出初步去噪后的振动信号,结合纯净振动信号组合生成数据集,并将该数据集分为训练集和测试集;
步骤5.2:利用训练集对神经网络进行训练;
所述神经网络模型包括输入层、空洞卷积层、BiLSTM网络、胶囊网络层、第一全连接层、特征融合层、第二全连接层以及输出层,且神经网络模型中从输入层至输出层的各个连接权值赋予取值范围为[-1,1]的随机值,初始化胶囊网络动态路由过程中间变量bij为0;
步骤5.3:将测试集输入训练完成的神经网络模型中进一步去噪;
步骤5.3.1:首先空洞卷积层提取一维振动信号Y′的卷积特征;
步骤5.3.2:空洞卷积层输出的卷积特征经胶囊网络层处理得到为特征标量,然后通过第一全连接层进行映射,并输出特征图Iq;
同时,空洞卷积层输出卷积特征经BiLSTM网络处理输出特征图Ip;
步骤5.3.3:利用特征融合层对特征图Iq以及特征图Ip进行拼接得到特征图Ijoin,再进行降维处理得到特征图yconv;
步骤5.3.4:最后对特征图yconv通过第二全连接层进行映射,最终得到进一步去噪后的振动信号。
进一步地,执行完步骤4.2之后,还包括采用粒子群算法对平滑控制常数θ、减法因子δ以及谱下限参数β进行优化,并采用优化后的平滑控制常数θ、减法因子δ以及谱下限参数β再次对当前子带K采用步骤4.1和4.2的方式进行初步去噪,获得当前子带K所有去噪振动信号的幅度谱估计值
进一步地,上述采用粒子群算法对平滑控制常数θ、减法因子δ以及谱下限参数β进行优化的具体步骤为:
步骤A1:设置粒子群算法的初始参数:最大迭代次数为50,随机初始化得到任意粒子i的初始位置和速度;任意粒子i的位置表示为xi,速度表示为vi;所述粒子i为平滑控制常数θ、减法因子δ以及谱下限参数β;
步骤A2:根据当前含噪振动信号的幅度谱和步骤4.2.7获得的去噪振动信号的幅度谱估计值将输出信噪比作为适应度函数,公式如下:
步骤A3:依据适应度函数依次求得各个粒子适应度值;
步骤A4:依据各个粒子适应度值计算每个粒子的个体最优位置pid和整个种群的最优位置pgd;
步骤A5:更新粒子速度和位置;
粒子的速度和位置更新策略如下:
w为惯性权重,c1,c2代表学习因子,c1=1.4945,c2=1.4945,r1,r2为[0,1]之间的随机数,增加搜索的随机性;vid表示粒子i速度矢量的第d维分量,xid表示粒子i位置矢量的第d维分量,t表示迭代次数;
步骤A6:更新粒子的个体最优位置及种群的全局最优位置;
粒子位置更新后求出相应的适应度函数值,并与之前所找到的粒子个体最优值及群体最优值进行比较,从而更新pid和pgd,更新公式如下,f为适应度函数;
步骤A7:重复执行步骤A5和A6,若达到最大迭代次数则退出循环,输出平滑控制常数θ,减法因子δ,谱下限参数β的最优解。
进一步地,上述空洞卷积层包括由扩张系数σ分别为1、2、3的卷积核,且大小均为1×3的卷积层串联而成,扩张系数σ为1的卷积层就是普通的卷积层,扩张系数σ为2的卷积核相邻两个卷积核权值之间会有一个空洞,扩张系数σ为3的卷积核相邻两个卷积核权值之间会有2个空洞。
进一步地,上述步骤2的具体实现过程为:
对含噪振动信号使用汉明窗加窗分帧:
yw(n)=w(n)y(n)=w(n)[x(n)+d(n)]=xw(n)+dw(n)
其中,w(n)表示汉明窗函数,L表示窗长;
假设信号是经过加窗处理的,将信号的下标w省略,再进行傅里叶变换得到含噪振动信号的幅度谱|Y(f)|和相位谱
相比现有技术,本发明的有益效果是:
1、本发明在不同频带内独立使用扩展谱减法进行去噪,更具有针对性,且更加准确。在每个频带内单独使用谱减法,可以满足不同频带噪声的抑制需求,达到更好的去噪效果。
2、在神经网络处理之前使用扩展谱减法进行噪声估计和频谱相减,经过初步谱减降噪后的振动信号含有的噪声相比于原始的含噪振动信号减轻了许多,同时含有的噪声类型也变得比较统一,而不像原始的带噪振动信号可能包含各种各样的噪声,并且使用神经网络也可用来减少谱减法中带来的音乐噪声。这个算法结合了谱减法易于实现和理解的优点以及深度神经网络强大学习能力的特点,避免了噪声种类繁多的问题。
3、采用粒子群算法优化参数打破了传统的扩展谱减法需要人工选择和微调参数的弊端,提高了去噪效果。
4、使用胶囊网络处理振动信号的去噪问题。胶囊网络擅长识别重叠物体,而含噪信号就是纯净信号和噪声信号的重叠,因此胶囊网络也非常适合处理振动信号的去噪问题。
附图说明
图1为本发明的实现流程图。
图2为粒子群优化算法的流程图。
图3为神经网络模型图。
图4为本发明的空洞卷积层结构示意图。
图5为BiLSTM网络结构图。
图6为LSTM网络结构图。
图7(a)为含噪振动信号时域波形图。
图7(b)为含噪振动信号频谱图。
图7(c)为采用本发明进行去噪处理后的时域波形图。
图7(d)为采用本发明进行去噪处理后的信号频谱图。
具体实施方式
下面结合附图对本发明的方法作进一步详细的描述。
一种基于改进胶囊网络的多频带谱减法振动信号去噪方法,其具体实现流程如图1所示:
1、获取纯净振动信号x(n)以及与之对应的含噪振动信号y(n);
设y(n)表示含噪振动信号,其由纯净振动信号x(n)和加性噪声d(n)组成,即:
y(n)=x(n)+d(n)
2、对含噪振动信号进行加窗,分帧,傅里叶变换(FFT)得到含噪振动信号的幅度谱|Y(f)|和相位谱
其具体过程为:
对含噪振动信号使用汉明窗加窗分帧:
yw(n)=w(n)y(n)=w(n)[x(n)+d(n)]=xw(n)+dw(n)
其中,w(n)表示汉明窗函数,L表示窗长;
假设信号是经过加窗处理的,为了简便,将信号的下标w省略,通过傅里叶变换(FFT)得到含噪振动信号y(n)的幅度谱|Y(f)|和相位谱
3、划分频带
将含噪振动信号的幅度谱|Y(f)|切割成任意不重复且彼此互不干扰的K个子带。
4、采用谱减法对含噪振动信号进行初步去噪
扩展谱减法是基于维纳滤波与谱减原理的结合,使用维纳滤波器估计噪声幅度谱,即利用前一帧的纯净信号和噪声信号对这一帧的噪声信号进行估计,也就是由谱减的输出作为维纳滤波器的输入信号,通过维纳滤波器再作用回谱减运算中,形成了循环结构。
针对任意子带K中去噪振动信号的幅度谱估计值的获取过程如下:
4.1、第1帧信号的处理
4.1.1、设置第1帧噪声信号幅度谱估计值并将其代入谱减公式计算第1帧去噪振动信号幅度谱估计值/>
其中,|Y1(f)|为第1帧含噪振动信号的幅度谱,δ为减法因子,β为谱下限参数;
4.1.2、给定第1帧自适应平滑参数c1,c1=min[θ,1],θ为平滑控制常数,θ>0;
4.1.3、计算第1帧平滑的噪声谱估计;
4.1.4、计算第1帧去噪信号的平滑功率谱;
4.2、第j帧去噪振动信号幅度谱估计值的求解,j≥2;
4.2.1、基于第j-1帧平滑的噪声谱估计以及第j-1帧去噪信号的平滑功率谱/>构建第j帧维纳滤波器模型,具体表达式为:
4.2.2、计算第j帧噪声幅度谱的估计值
其中,|Yj(f)|为第j帧含噪振动信号的幅度谱;
4.2.3、根据谱减法获取第j帧去噪振动信号的幅度谱估计值:
其中,δ为减法因子,可以独立设置,以满足不同频带噪声的抑制需求,β为谱下限参数;
4.2.4、确定第j帧自适应平滑参数cj;
式中:θ为平滑控制常数,θ>0;
4.2.5、计算第j帧平滑的噪声谱估计
4.2.6、计算第j帧去噪信号的平滑功率谱
4.2.7、重复步骤4.2.1-4.2.6,获取子带K内所有帧去噪振动信号的幅度谱估计值
上述运算过程中,由于平滑控制常数θ、减法因子δ以及谱下限参数β主观选择会存在很大的偶然性和随机性,影响信号去噪的结果,因此本发明还增加粒子群算法对参数进行优化后再次对子带K进行谱减从而获得更加精确的子带K内所有去噪振动信号的幅度谱估计值,其具体执行过程,如图2所示:
4.3:采用粒子群算法对子带K中平滑控制常数θ、减法因子δ以及谱下限参数β进行优化;
4.3.1、设置粒子群算法的初始参数:最大迭代次数为50,随机初始化得到任意粒子i的初始位置和速度;任意粒子i的位置表示为xi,速度表示为vi;
所述粒子为步骤4.1和4.2中的平滑控制常数θ、减法因子δ以及谱下限参数β;
4.3.2、根据当前含噪振动信号的幅度谱|Y(f)|和步骤4.2.7获得的去噪振动信号的幅度谱估计值计算输出信噪比SNR作为适应度函数,公式如下:
4.3.3、依据适应度函数依次求得各个粒子适应度值;
4.3.4、依据各个粒子适应度值计算每个粒子的个体最优位置pid和整个种群的最优位置pgd;
4.3.5、更新粒子速度和位置;
粒子的速度和位置更新策略如下:
w为惯性权重,c1,c2代表学习因子,c1=1.4945,c2=1.4945,r1,r2为[0,1]之间的随机数,增加搜索的随机性;vid表示粒子i速度矢量的第d维分量,xid表示粒子i位置矢量的第d维分量,t表示迭代次数;
4.3.6、更新粒子的个体最优位置及种群的全局最优位置;
粒子位置更新后求出相应的适应度函数值,并与之前所找到的粒子个体最优值及群体最优值进行比较,从而更新pid和pgd,更新公式如下,f为适应度函数。
4.3.7、重复执行步骤4.3.5和4.3.6,若达到最大迭代次数则退出循环,输出平滑控制常数θ、减法因子δ以及谱下限参数β的最优解;
4.3.8、根据优化后的平滑控制常数θ、减法因子δ以及谱下限参数β值的最优解重新执行步骤4.1和4.2,获得当前子带(即子带K)去噪内所有去噪振动信号的幅度谱估计值
4.4、对每个子带重复执行步骤4.1-4.3,获得每个子带初步去噪后的振动信号幅度谱;
4.5、对每个子带初步去噪后的振动信号幅度谱进行叠加,并结合相位谱进行逆傅里叶变换,恢复出初步去噪后的振动信号。
5、采用神经网络进行进一步去噪
为了提高传统的神经网络模型泛化性不佳的问题,对神经网络从模型层面进行优化。胶囊网络擅长识别重叠物体,而含噪信号就是纯净信号和噪声的重叠,因此胶囊网络非常适合处理信号的去噪问题。
应用空洞卷积层替代传统胶囊网络单一卷积层进行特征提取,得到更深层次的特征数据。更大的感受野有助于利用信号的全局信息,提升特征的表达能力,随之胶囊网络和BiLSTM网络两个支路分别提取信号的局部空间特征信息和时间序列特征信息,并且使用特征融合层融合特征信息。这样的网络会比使用单一网络表现更出色、更具鲁棒性。
如图3所示,本发明使用的神经网络具体模型结构:包括输入层、空洞卷积层、BiLSTM网络、胶囊网络层、第一全连接层、特征融合层、第二全连接层以及输出层,且神经网络模型中从输入层至输出层的各个连接权值赋予取值范围为[-1,1]的随机值,初始化胶囊网络动态路由过程中间变量bij为0;
以下对模型中每层进行具体介绍:
空洞卷积层
本发明中采用级联三层空洞卷积来对信号进行特征提取,得到信号的卷积特征。空洞卷积在进行卷积操作的时候,会在卷积核元素之间填充空洞。假定原来的一维卷积核的尺寸为n,膨胀因子为l,则填充空洞后得到的卷积核的尺寸为k:
k=n+(n-1)×(l-1)=l×(n-1)+1
在保证网络参数量相同的情况下,空洞卷积核拥有更大的感受野。更大的感受野有助于利用信号的全局信息,提升特征的表达能力。
本发明的空洞卷积层的示意图如图4所示,包括由扩张系数σ分别为1、2、3的卷积核且大小均为1×3的卷积层串联而成,扩张系数为1的卷积层就是普通的卷积层,扩张系数为2的卷积核相邻两个卷积核权值之间会有一个空洞,扩张系数为3的卷积核相邻两个卷积核权值之间会有2个空洞。
BiLSTM网络
BiLSTM相比LSTM还考虑了振动信号反向时序信息的影响,也即“未来”对“现在”的影响。输入分别以从前和从后输入到两个独立的LSTM网络中,两者的输出共同汇集到一个线性输出层,线性合并后进行输出。图6是沿时间展开的双向LSTM结构图:
LSTM网络如图6所示,由一个记忆单元和三个控制单元组成,即遗忘门,输入门,输出门。相应的计算公式为:
it=σ(Wixt+Uiht-1+bi)
ft=σ(Wfxt+Ufht-1+bf)
ot=σ(Woxt+Uoht-1+bo)
ht=ot×tanh(Ct)
其中,xt:t时刻记忆单元的输入,it:输入门的激活值;ft:遗忘门的激活值;ot:输出门的激活值;ht,ht-1:t时刻和t-1时刻的记忆单元的输出,Ct,Ct-1:t时刻和t-1时刻记忆单元的状态;记忆单元的候选状态;Wi,Ui,Wc,Uc,Wf,Uf,Wo,Uo分别是记忆单元中对应门的权重向量;bi,bc,bf,bo分别为记忆单元中对应门的偏置。
由图5所示,BiLSTM中有两个隐藏层,分别是正向隐藏层和反向隐藏层。自前向后的正向隐藏层更新公式为:
自后向前的反向隐藏层更新公式为:
综合了网络的正反向隐藏层信息的输出层更新公式为:
胶囊网络层
基础胶囊层将每个卷积层的不同通道的信息组合成高维向量,然后通过数字胶囊层将高维向量进行全连接映射。数字胶囊层输出向量可以表征输入信息的多个特征属性,因此可以获得更多的局部特征信息。
首先将空洞卷积层输出的特征标量进行向量重组,得到基础胶囊层u。构建向量神经元的方法是将特征层的每4个通道合并成为一个新的胶囊单元,新组成胶囊单元的每个神经元向量的维度则为4,而所得到的胶囊单元的通道数将由减少为原来通道数的1/4。
基础胶囊层和数字胶囊层之间使用动态路算法来进行选择性连接,数字胶囊层中的第j个数字胶囊表示的向量为:
其中Wij是第i个基础胶囊与第j个数字胶囊之间的连接权重。ui是第i个基础胶囊表示的向量,其中cij是第i个基础胶囊与第j个数字胶囊之间的耦合系数。
耦合系数c根据下面公式计算:
其中bij的初始值为0,更新方式为:
bij=bij+Wijui·hj
数字胶囊表示的向量经过非线性激活函数处理后得到胶囊输出向量h,利用||·||表示向量的范数,则数字胶囊层中第j个数字胶囊对应的胶囊输出向量hj为:
综上所述,胶囊网络的输入为空洞卷积层的输出,胶囊网络的输出向量为h;将胶囊网络的输出向量h转换为特征标量,然后通过第一全连接层进行映射,最终维度为1×N的特征图。
特征融合层
融合对象为胶囊网络层和BiLSTM网络的输出特征图,定义fjoin为拼接函数,特征图的拼接操作定义如下:
Ijoin=fjoin(Ip,Iq)
其中,Ip,Iq分别为BiLSTM网络和胶囊网络层对应的输出特征图,维度均为D,Ijoin为拼接后的特征图,维度为2D,保留两个特征图的特征信息。其中D=1。
再通过卷积融合方法对拼接特征图执行卷积操作,实现对特征图的降维处理:
yconv=Ijoinw+b
其中,w为卷积核,b为偏置项。
基于上述对改进性胶囊网络的介绍,现对采用改进性胶囊网络进一步去噪的过程进行描述:
5.1、将步骤4.5获得的初步去噪后的振动信号和纯净振动信号组合生成数据集,并将该数据集分为训练集和测试集;
5.2、利用训练集对上述神经网络模型进行训练;
5.3、将测试集输入训练完成的网络模型中进一步去噪;
5.3.1、首先空洞卷积层提取一维振动信号Y′的卷积特征;
5.3.2、空洞卷积层输出的卷积特征经胶囊网络层处理得到为特征标量,然后通过第一全连接层进行映射,并输出特征图Iq;
同时,空洞卷积层输出卷积特征经BiLSTM网络处理输出特征图Ip;
5.3.3、利用特征融合层对特征图Iq以及特征图Ip进行拼接得到特征图Ijoin,再进行降维处理得到特征图yconv;
5.3.4、最后对特征图yconv通过第二全连接层进行映射,最终进一步去噪后的振动信号。
5、试验验证
为了验证本发明所提方法的有效性,实际采集某型滚动轴承振动加速度信号,将采集到的数据进行适当地预处理后,将数据集分为训练数据集和测试数据集。实际的振动测试不可能采集到纯粹干净的加速度信号,因此原始信号在实际测试中已经受到了不同级别和不同种类的噪声的污染。含噪信号是通过对预处理后的原始信号进一步加入一定信噪比的高斯白噪声而产生的。将含噪信号与原始信号组合成对并进行归一化处理,便于训练的稳定性。归一化过程如下式所示:
使用信噪比SNR评价去噪后信号的质量,以分贝(dB)表示的信噪比计算公式为:
其中,yi为含噪信号,yi′为纯净信号,n是采样点的数量。
图7(a)和7(b)分别为含噪振动信号时域波形图及频谱图,图7(c)和7(d)使用本方法进行去噪处理后振动信号的时域波形图及频谱图,结合附图可以看出本方法的去噪效果好,波形未出现失真现象。
使用四种不同的信号去噪方法进行降噪处理,四种方法分别为胶囊网络,BiLSTM网络,谱减法以及本专利所提方法,含噪信号和去噪后信号的信噪比如表1所示。
表1四种方法的输出信噪比比较
四种算法的去噪效果在不同信噪比的噪声强度下作用不同。低信噪比时本发明方法去噪效果最好,信噪比得以很大提升。10dB高信噪比时,四种算法均有效减少了背景噪声,但噪声谱对信号的影响较小,因此本专利所提算法对于信噪比的改善效果没有低信噪比时明显。总体而言,采用基于改进胶囊网络的多频带谱减法振动信号去噪方法充分考虑了谱减法易于实现和理解的优点以及深度神经网络强大的学习能力的特点,可以有效地抑制背景噪声和“音乐噪声”。
Claims (5)
1.一种基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于,具体实现步骤如下:
步骤1:获取两路振动信号,分别为含噪振动信号y(n)以及纯净振动信号x(n);
其中,含噪振动信号y(n)是由纯净振动信号x(n)和加性噪声d(n)组成,其表达式为:
y(n)=x(n)+d(n)
式中,n表示采样点;
步骤2:对含噪振动信号进行加窗,分帧,傅里叶变换得到含噪振动信号的幅度谱|Y(f)|和相位谱f表示频率;
步骤3:将含噪振动信号的幅度谱|Y(f)|切割成任意不重复且彼此互不干扰的多个子带;
步骤4:采用谱减法对每个子带中含噪振动信号进行初步去噪,获得初步去噪后的振动信号;
步骤4.1:任意子带K的第1帧信号的处理
步骤4.1.1:设置第1帧噪声信号幅度谱估计值并将其代入谱减公式计算第1帧去噪振动信号幅度谱估计值/>
其中,|Y1(f)|为第1帧含噪振动信号的幅度谱,δ为减法因子,β为谱下限参数;
步骤4.1.2:给定第1帧自适应平滑参数c1,c1=min[θ,1],θ为平滑控制常数,θ>0;
步骤4.1.3:计算第1帧平滑的噪声谱估计;
步骤4.1.4:计算第1帧去噪信号的平滑功率谱;
步骤4.2:第j帧去噪振动信号幅度谱估计值的求解,j≥2;
步骤4.2.1:基于第j-1帧平滑的噪声谱估计以及第j-1帧去噪信号的平滑功率谱/>构建第j帧维纳滤波器模型,具体表达式为:
步骤4.2.2:计算第j帧噪声幅度谱的估计值
其中,|Yj(f)|为第j帧含噪振动信号的幅度谱;
步骤4.2.3:根据谱减法获取第j帧去噪振动信号的幅度谱估计值
步骤4.2.4:确定第j帧自适应平滑参数cj;
式中:θ为平滑控制常数,θ>0;
步骤4.2.5:计算第j帧平滑的噪声谱估计
步骤4.2.6:计算第j帧去噪信号的平滑功率谱
步骤4.2.7:重复步骤4.2.1-4.2.6,获取当前子带K内所有帧去噪振动信号的幅度谱估计值
步骤4.3:对每个子带重复执行步骤4.1和4.2,获得每个子带初步去噪后的振动信号幅度谱;
步骤4.4:对每个子带初步去噪后的振动信号幅度谱进行叠加,并结合含噪振动信号的相位谱进行逆傅里叶变换,恢复出初步去噪后的振动信号;
步骤5:采用神经网络对初步去噪后的振动信号进行二次去噪;
步骤5.1:将步骤4.4中恢复出初步去噪后的振动信号,结合纯净振动信号组合生成数据集,并将该数据集分为训练集和测试集;
步骤5.2:利用训练集对神经网络进行训练;
所述神经网络模型包括输入层、空洞卷积层、BiLSTM网络、胶囊网络层、第一全连接层、特征融合层、第二全连接层以及输出层,且神经网络模型中从输入层至输出层的各个连接权值赋予取值范围为[-1,1]的随机值,初始化胶囊网络动态路由过程中间变量bij为0;
步骤5.3:将测试集输入训练完成的神经网络模型中进一步去噪;
步骤5.3.1:首先空洞卷积层提取一维振动信号Y′的卷积特征;
步骤5.3.2:空洞卷积层输出的卷积特征经胶囊网络层处理得到为特征标量,然后通过第一全连接层进行映射,并输出特征图Iq;
同时,空洞卷积层输出卷积特征经BiLSTM网络处理输出特征图Ip;
步骤5.3.3:利用特征融合层对特征图Iq以及特征图Ip进行拼接得到特征图Ijoin,再进行降维处理得到特征图yconv;
步骤5.3.4:最后对特征图yconv通过第二全连接层进行映射,最终得到进一步去噪后的振动信号。
2.根据权利要求1所述的基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于:执行完步骤4.2之后,还包括采用粒子群算法对平滑控制常数θ、减法因子δ以及谱下限参数β进行优化,并采用优化后的平滑控制常数θ、减法因子δ以及谱下限参数β再次对当前子带K采用步骤4.1和4.2的方式进行初步去噪,获得当前子带K所有去噪振动信号的幅度谱估计值
3.根据权利要求2所述的基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于:所述粒子群算法对平滑控制常数θ、减法因子δ以及谱下限参数β进行优化的具体步骤为:
步骤A1:设置粒子群算法的初始参数:最大迭代次数为50,随机初始化得到任意粒子i的初始位置和速度;任意粒子i的位置表示为xi,速度表示为vi;所述粒子i为平滑控制常数θ、减法因子δ以及谱下限参数β;
步骤A2:根据当前含噪振动信号的幅度谱和步骤427获得的去噪振动信号的幅度谱估计值将输出信噪比作为适应度函数,公式如下:
步骤A3:依据适应度函数依次求得各个粒子适应度值;
步骤A4:依据各个粒子适应度值计算每个粒子的个体最优位置pid和整个种群的最优位置pgd;
步骤A5:更新粒子速度和位置;
粒子的速度和位置更新策略如下:
w为惯性权重,c1,c2代表学习因子,c1=1.4945,c2=1.4945,r1,r2为[0,1]之间的随机数,增加搜索的随机性;vid表示粒子i速度矢量的第d维分量,xid表示粒子i位置矢量的第d维分量,t表示迭代次数;
步骤A6:更新粒子的个体最优位置及种群的全局最优位置;
粒子位置更新后求出相应的适应度函数值,并与之前所找到的粒子个体最优值及群体最优值进行比较,从而更新pid和pgd,更新公式如下,f为适应度函数;
步骤A7:重复执行步骤A5和A6,若达到最大迭代次数则退出循环,输出平滑控制常数θ,减法因子δ,谱下限参数β的最优解。
4.根据权利要求1所述的基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于:所述空洞卷积层包括由扩张系数σ分别为1、2、3的卷积核,且大小均为1×3的卷积层串联而成,扩张系数σ为1的卷积层就是普通的卷积层,扩张系数σ为2的卷积核相邻两个卷积核权值之间会有一个空洞,扩张系数σ为3的卷积核相邻两个卷积核权值之间会有2个空洞。
5.根据权利要求1所述的基于改进胶囊网络的多频带谱减法振动信号去噪方法,其特征在于:所述步骤2的具体实现过程为:
对含噪振动信号使用汉明窗加窗分帧:
yw(n)=w(n)y(n)=w(n)[x(n)+d(n)]=xw(n)+dw(n)
其中,w(n)表示汉明窗函数,L表示窗长;
假设信号是经过加窗处理的,将信号的下标w省略,再进行傅里叶变换得到含噪振动信号的幅度谱|Y(f)|和相位谱
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110096683.5A CN112885368B (zh) | 2021-01-25 | 2021-01-25 | 基于改进胶囊网络的多频带谱减法振动信号去噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110096683.5A CN112885368B (zh) | 2021-01-25 | 2021-01-25 | 基于改进胶囊网络的多频带谱减法振动信号去噪方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112885368A CN112885368A (zh) | 2021-06-01 |
CN112885368B true CN112885368B (zh) | 2023-07-21 |
Family
ID=76050972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110096683.5A Active CN112885368B (zh) | 2021-01-25 | 2021-01-25 | 基于改进胶囊网络的多频带谱减法振动信号去噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112885368B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113687433B (zh) * | 2021-09-15 | 2022-07-12 | 湖南师范大学 | 一种基于Bi-LSTM的大地电磁信号去噪方法及系统 |
CN114239759B (zh) * | 2022-02-25 | 2022-05-10 | 武汉工程大学 | 电动汽车的故障诊断方法、装置、电子设备及存储介质 |
CN115116446A (zh) * | 2022-06-21 | 2022-09-27 | 成都理工大学 | 一种噪声环境下说话人识别模型构建方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200019073A (ko) * | 2018-08-13 | 2020-02-21 | 한국과학기술원 | 캡슐 네트워크 기반의 종단간 음성 인식 방법 및 장치 |
CN111914883A (zh) * | 2020-06-18 | 2020-11-10 | 西安交通大学 | 一种基于深度融合网络的主轴轴承状态评估方法及装置 |
-
2021
- 2021-01-25 CN CN202110096683.5A patent/CN112885368B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200019073A (ko) * | 2018-08-13 | 2020-02-21 | 한국과학기술원 | 캡슐 네트워크 기반의 종단간 음성 인식 방법 및 장치 |
CN111914883A (zh) * | 2020-06-18 | 2020-11-10 | 西安交通大学 | 一种基于深度融合网络的主轴轴承状态评估方法及装置 |
Non-Patent Citations (2)
Title |
---|
基于深度神经网络的单通道语音增强方法回顾;鲍长春;项扬;;信号处理(12);全文 * |
改进的CNN-LSTM轴承故障诊断方法;汪友明等;《西安邮电大学学报》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112885368A (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112885368B (zh) | 基于改进胶囊网络的多频带谱减法振动信号去噪方法 | |
CN109841226B (zh) | 一种基于卷积递归神经网络的单通道实时降噪方法 | |
EP3776534B1 (en) | Systems, methods, and computer-readable media for improved real-time audio processing | |
CN110619885B (zh) | 基于深度完全卷积神经网络的生成对抗网络语音增强方法 | |
Choi et al. | Phase-aware speech enhancement with deep complex u-net | |
CN107845389B (zh) | 一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法 | |
CN110867181B (zh) | 基于scnn和tcnn联合估计的多目标语音增强方法 | |
CN107452389A (zh) | 一种通用的单声道实时降噪方法 | |
CN112735456B (zh) | 一种基于dnn-clstm网络的语音增强方法 | |
CN110148420A (zh) | 一种适用于噪声环境下的语音识别方法 | |
EP3633676A1 (en) | Rnn-based noise reduction method and device for real-time conference | |
CN106340292A (zh) | 一种基于连续噪声估计的语音增强方法 | |
CN111899757B (zh) | 针对目标说话人提取的单通道语音分离方法及系统 | |
CN113936681B (zh) | 一种基于掩膜映射和混合空洞卷积网络的语音增强方法 | |
Tse et al. | Blind source separation and blind equalization algorithms for mechanical signal separation and identification | |
CN111816200B (zh) | 一种基于时频域二值掩膜的多通道语音增强方法 | |
CN111899750B (zh) | 联合耳蜗语音特征和跳变深层神经网络的语音增强算法 | |
CN117111000A (zh) | 一种基于双通道注意力残差网络的sar梳状谱干扰抑制方法 | |
Lim et al. | Harmonic and percussive source separation using a convolutional auto encoder | |
CN115410589A (zh) | 一种基于联合感知损失的注意力生成对抗语音增强方法 | |
Koh et al. | Underwater signal denoising using deep learning approach | |
Duangpummet et al. | A robust method for blindly estimating speech transmission index using convolutional neural network with temporal amplitude envelope | |
Bactor et al. | Different Techniques for the Enhancement of the Intelligibility of a Speech Signal | |
CN115497492A (zh) | 一种基于全卷积神经网络的实时语音增强方法 | |
TWI749547B (zh) | 應用深度學習的語音增強系統 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |