CN113851144A - 一种基于改进变分模态分解和主成分分析的语音信号去噪方法 - Google Patents
一种基于改进变分模态分解和主成分分析的语音信号去噪方法 Download PDFInfo
- Publication number
- CN113851144A CN113851144A CN202111159300.0A CN202111159300A CN113851144A CN 113851144 A CN113851144 A CN 113851144A CN 202111159300 A CN202111159300 A CN 202111159300A CN 113851144 A CN113851144 A CN 113851144A
- Authority
- CN
- China
- Prior art keywords
- component
- modal
- imf
- noise
- formula
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000000513 principal component analysis Methods 0.000 title claims abstract description 29
- 238000009826 distribution Methods 0.000 claims abstract description 35
- 238000010586 diagram Methods 0.000 claims abstract description 23
- 239000011159 matrix material Substances 0.000 claims description 29
- 230000003190 augmentative effect Effects 0.000 claims description 9
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000000470 constituent Substances 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000009827 uniform distribution Methods 0.000 claims description 3
- 238000012847 principal component analysis method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种基于改进变分模态分解和主成分分析的语音信号去噪方法,包括:S1:选取带噪语音信号作为样本;S2:对带噪语音信号进行分解,得到K个IMF模态分量;S3:计算每个IMF模态分量与原带噪语音信号的相关系数,画出相关系数分布图,从相关系数分布图中确定虚假分量和噪声主导的IMF模态分量;S4:去除虚假分量和噪声主导的IMF模态分量后,剩余的IMF模态分量记为信号主导的IMF模态分量;S5:去除噪声主导的IMF模态分量中的残余噪声;S6:噪声主导的IMF模态分量的主成分分量与信号主导的IMF模态分量进行重构,得到去除噪声的语音信号。本发明消除了VMD分解后重构信号中残留噪声的问题。
Description
技术领域
本发明属于信号处理技术领域,尤其涉及一种语音信号去噪方法。
背景技术
语音信号在采集和传输的过程中不可避免的会受到各种各样的干扰,这会使采集到的语音信号准确度低,不利于后续分析,因此语音去噪成为语音信号处理过程中最为关键的一步。
传统进行语音去噪的方法有很多,基于谱减法的语音去噪是假定语音信号是短时平稳的,然而语音信号本身是一种非线性非平稳信号,使用谱减法有一定的局限性,且会产生一种新的背景噪声。基于小波阈值的语音去噪的关键在于阈值函数的选取,然而硬阈值的重构信号会产生振荡,软阈值的重构信号会产生失真。经验模态分解(EMD)是由huang等人提出的一种处理非线性非平稳信号的方法,将信号分解成有限个本征模态函数分量(IMF)与一个残差,频率由高到低排列下来,我们可以根据所处理信号的特点,把不符合信号特征的分量去除,对符合信号特征的其他分量进行处理,将最终剩余且处理完成的分量叠加重构,获得去噪后的信号。常规EMD分解法得到的IMF模态分量的选取没有统一的标准,通常是认为高频IMF模态分量中以噪声信号为主导并舍弃,然而这会导致有效信号被剔除,使得重构后的信号失真,同时,EMD分解法中极值点和包络线无法精确的确定,这就会产生包含虚假频率成分的IMF模态分量,这部分分量如果得不到剔除会使重构后的信号不准确。
发明内容
针对现有技术的不足,本发明提出了一种改进的语音信号去噪方法,是一种变分模态分解法(VMD)和主成分分析法(PCA)相结合的技术。
本发明通过向原信号中添加高斯白噪声的方法消除VMD分解后重构信号中残留噪声的问题,采用VMD完成对原语音信号的分解,计算各个模态分量与原信号的相关系数并画相关系数分布图,通过模态分量判断准则将模态分量分为无效分量、信号分量、噪声分量三个类别。其中,无效分量直接剔除,信号分量予以保留,噪声分量经过后续PCA降噪后与信号分量进行重构,得到最终去噪后的语音信号。
术语解释:
1、VMD分解,即变分模态分解,是一种自适应、完全非递归的模态变分和信号处理的方法。该技术具有可以确定模态分解个数的优点,其自适应性表现在根据实际情况确定所给序列的模态分解个数,随后的搜索和求解过程中可以自适应地匹配每种模态的最佳中心频率和有限带宽,并且可以实现固有模态分量(IMF)的有效分离、信号的频域划分、进而得到给定信号的有效分解成分,最终获得变分问题的最优解。
2、EMD,经验模态分解,是由黄锷(N.E.Huang)等人于1998年创造性地提出的一种新型自适应信号时频处理方法,特别适用于非线性非平稳信号的分析处理。
本发明的技术方案为:
一种基于改进变分模态分解和主成分分析的语音信号去噪方法,包括步骤如下:
S1:选取一段带噪语音信号y(t)作为样本;
S2:使用改进的VMD方法对带噪语音信号y(t)进行分解,得到K个IMF模态分量;
S3:计算每个IMF模态分量与原带噪语音信号的相关系数,画出相关系数分布图,依据虚假分量判断原则从相关系数分布图中确定虚假分量,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量;
S4:去除虚假分量和噪声主导的IMF模态分量后,剩余的IMF模态分量记为信号主导的IMF模态分量;
S5:对于噪声主导的IMF模态分量,采取主成分分析(PCA)法,根据累计贡献率选择一定数目的主成分分量进行重构,去除噪声主导的IMF模态分量中的残余噪声;
S6:将经过主成分分析(PCA)后的噪声主导的IMF模态分量的主成分分量与信号主导的IMF模态分量进行重构,得到去除噪声的语音信号。
根据本发明优选的,步骤S2的具体实现过程包括:
S2-1:设定VMD分解参数,包括最佳分解层数和模态分量频率带宽控制参数α;
S2-2:构造约束变分模型,引入拉格朗日函数,构造增广拉格朗日方程;
S2-3:求解增广拉格朗日方程,初始化分量的频率,得到初始分量频率u^k 1,与u^k 1对应的初始中心频率ω^k 1,初始拉格朗日乘数λ^k 1;
S2-4:根据VMD算法公式更新分量频率u^k,中心频率ω^k;
S2-5:在每次更新完分量频率u^k、中心频率ω^k之后,更新拉格朗日乘数λ^;
S2-6:判断迭代更新后的分量频率是否满足收敛方程,如果不满足,则继续迭代,同时加入噪声强度逐渐递减的高斯白噪声,继续执行步骤S2-S5;如果满足收敛方程,则结束迭代,获得完成VMD分解的模态分量。
进一步优选的,步骤S2-1中,设定最佳分解层数的方法如下:
对原带噪语音信号进行EMD分解,设某一次分解的层数为K,分解后得到K个模态分量,计算各个模态分量与原带噪语音信号的相关系数,选相关系数最大的模态分量IMFmax,计算其峭度并记为λ,之后每一次分解的层数都加1,且分解层数为K+1时相关系数最大的模态分量的峭度记为λ’,不断迭代,直至某一次出现一个λ<λ’,这时λ对应的分解的层数为最佳分解层数;峭度H计算公式如式(Ⅰ)所示:
式(Ⅰ)中,IMFi(t)为第i个模态分量,μi为第i个模态分量的均值,σi为第i个模态分量的标准差。
进一步优选的,设定模态分量频率带宽控制参数α为2000。
进一步优选的,步骤S2-2中,约束变分模型即VMD约束模型表达式如式(Ⅱ)所示:
式(Ⅱ)中,δ(t)为单位冲激函数,K是VMD分解层数,{uk}={u1,u2,......,uk}是所有IMF分量的集合,{ωk}={ω1,ω2,......,ωk}是各个模态分量中心频率的集合,j为虚数单位。
进一步优选的,步骤S2-3中,增广拉格朗日方程L如式(Ⅲ)所示:
式(Ⅲ)中,α为模态分量频率带宽控制参数,λ为拉格朗日乘数,ωk为第k个模态分量的中心频率。
进一步优选的,步骤S2-4中,模态分量频率的更新公式如式(Ⅳ)所示:
式(Ⅳ)中,x(ω)是信号x(t)的频域形式,λ^(ω)为拉格朗日算子λ(t)的频域形式,上标^均表示共轭形式,n为迭代次数;
IMF分量对应的中心频率的更新公式如式(Ⅴ)所示:
式(Ⅴ)中,u^k(ω)为第k个IMF模态分量频率。
进一步优选的,步骤S2-5中,拉格朗日乘数λ的更新公式如式(Ⅵ)所示:
式(Ⅵ)中,τ为拉格朗日乘数的更新参数,τ=10-3。
进一步优选的,步骤S2-6中,收敛方程如式(Ⅶ)所示:
式(Ⅶ)中,ε为收敛准则容差值,ε为10-6;步骤S2-6中,得到的分解后的模态分量记为IMF1,IMF2,......,IMFm。
进一步优选的,步骤S2-6中,加入噪声强度逐渐递减的高斯白噪声的具体方法是:向分量频率不满足收敛方程的模态分量加入幅度分布服从高斯分布、功率谱密度分布服从均匀分布的噪声,且噪声强度要按照逐渐递减的原则,即后一次添加的噪声强度要比前一次添加的噪声强度要低。
根据本发明优选的,步骤S2-1、步骤S3中,相关系数ρxy计算公式如式(Ⅷ)所示:
式(Ⅷ)中,x(i)为待计算相关系数的信号,y(i)为原始信号。
根据本发明优选的,步骤S3中,依据虚假分量判断原则从相关系数分布图中确定虚假分量,具体是指:从相关系数分布图中找到第一个相关系数小于h的点,将这个点对应的模态分量记作IMFh,h是指相关系数,取值范围为0.10~0.15,将IMFh+1~IMFk记为虚假分量。
进一步优选的,h=0.15。
根据本发明优选的,步骤S3中,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量,具体是指:去除虚假分量后重新绘制相关系数分布曲线,找到曲线上的第一个转折点记作p,此点对应的IMF模态分量记作IMFp,将IMF1~IMFp记为噪声主导的IMF模态分量。
进一步地,步骤S5的具体实现过程如下:
S5-1:从一个噪声主导的模态分量中提取m个特征值Mi,i=1,2,...,m特征值Mi的维度为n{Mi1,Mi2,...,Mij},j=1,2,...,n;
S5-3:根据计算标准化矩阵的协方差矩阵B,如式(IX)所示:
式(IX)中,协方差矩阵B也称为矩阵Amn的相关系数矩阵;
S5-4:计算协方差矩阵B的特征值λ与特征值对应的特征向量p,将特征值重新按照从大到小的顺序排列为λ1≥λ1≥...≥λa,与其相对应的特征向量为pi,i=1,2,...,a,特征向量之间彼此正交,由特征向量构成一个矩阵P=(p1,p2,......,pn);
S5-5:令Y=PTB,Y=(y1,y2,...,yn)T,其中y1,y2,...,yi,...彼此不相关,称y1,y2,...,yn分别为第1、第2、...、第i...个主成分变量;
S5-6:选择前p个主成分变量,通过它们对应的特征值计算主成分累计贡献率,如式(Ⅹ)所示:
式(Ⅹ)中,αp为前p个主成分变量的累计贡献率;
S5-7:选择累计贡献率达到85%以上的主成分变量重构得到一个新的模态分量IMFPCA,与步骤S4得到的信号主导的IMF模态分量进行重构,生成新的信号,这个新的信号就是去除噪声的语音信号。
重构公式如式(Ⅺ)所示:
d(t)=IMF信号(t)+IMFPCA(t)(Ⅺ)
式(Ⅺ)中,IMF信号(t)为信号主导的模态分量,IMFPCA(t)为累计贡献率达到85%以上的主成分变量重构得到的模态分量。
本发明的有益效果为:
1、本发明采用了VMD(变分模态分解)法来处理语音信号这种非线性非平稳信号,相比于其他方法,VMD分解法的自适应性更强,它可以降低信号的复杂度以及非平稳性,对语音信号的处理有显著的效果
2、本发明改进了最佳分解层数的确定方法,相比于传统方法,提高了VMD分解的精度,使得分解的结果更加准确,减少了分解的时间,提高了分解效率。
3、本发明采用相关系数分布图的来确定噪声主导分量、信号主导分量以及无效分量,相比于其他方法,本发明不会使得有用的分量被误去除。
4、本发明通过加入高斯白噪声来消除了VMD分解法产生的端点效应以及模态混叠,相比于其他方法,本发明模态分量的分解更加准确。
5、本发明使用主成分分析(PCA)方法对噪声主导的分量降噪,并将降噪后的信号用于信号重构,相比于其他方法,本发明重构后的信号更加准确。
附图说明
图1是本发明VMD分解以及模态分量分类的流程图。
图2是本发明主成分分析过程的流程图。
图3是原始语音信号的波形图。
图4是加入的噪声波形图。
图5是加入噪声后的语音信号波形图。
图6是去噪后语音信号的波形图。
具体实施方式
下面结合说明书附图和具体实施示例对本发明做进一步说明,但不限于此。
实施例1
一种基于改进变分模态分解和主成分分析的语音信号去噪方法,包括步骤如下:
S1:选取一段带噪语音信号作为样本;
S2:使用改进的VMD方法对带噪语音信号进行分解,得到K个IMF模态分量;
S3:计算每个IMF模态分量与原带噪语音信号的相关系数,画出相关系数分布图,依据虚假分量判断原则从相关系数分布图中确定虚假分量,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量;
S4:去除虚假分量和噪声主导的IMF模态分量后,剩余的IMF模态分量记为信号主导的IMF模态分量;
S5:对于噪声主导的IMF模态分量,采取主成分分析(PCA)法,根据累计贡献率选择一定数目的主成分分量进行重构,去除噪声主导的IMF模态分量中的残余噪声;
S6:将经过主成分分析后的噪声主导的IMF模态分量的主成分分量与信号主导的IMF模态分量进行重构,得到去除噪声的语音信号。
如图1所示,是本发明的原理流程图,其中,x(t)是采集到的语音信号,该语音信号含有噪声,经VMD分解后,得到n个模态分量,其中n是大于等于2的整数。计算各个IMF模态分量与x(t)的相关系数,画出相关系数分布图,并按照判断准则将IMF模态分量归为噪声主导和信号主导两类,其中噪声主导的分量进一步经PCA法进行分解,取其中贡献率大的主元分量进行重构,得到去噪后的分量,最终将去噪后的噪声主导IMF模态分量与信号主导IMF模态分量进行重构,得到去噪后的语音信号y(t)。
图3是原始语音信号的波形图。图4是加入的噪声波形图。图5是加入噪声后的语音信号波形图。图6是本发明去噪后语音信号的波形图。
图5和图6比对,可知,大部分噪声干扰已经被去除。图3和图6比对,可知,去噪后的信号在最初始的位置存有部分噪声,其他位置已经接近原始信号,去噪效果较好。
实施例2
根据实施例1所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其区别在于:
步骤S2的具体实现过程包括:
如图2所示,S2-1:设定VMD分解参数,包括最佳分解层数和模态分量频率带宽控制参数α;
步骤S2-1中,本发明中VMD分解法的改进在于改进了最佳分解层数的确定方法,设定最佳分解层数的方法如下:
对原带噪语音信号进行EMD分解,设某一次分解的层数为K,分解后得到K个模态分量,计算各个模态分量与原带噪语音信号的相关系数,选相关系数最大的模态分量IMFmax,计算其峭度并记为λ,之后每一次分解的层数都加1,且分解层数为K+1时相关系数最大的模态分量的峭度记为λ’,不断迭代,直至某一次出现一个λ<λ’,这时λ对应的分解的层数为最佳分解层数;峭度H计算公式如式(Ⅰ)所示:
式(Ⅰ)中,IMFi(t)为第i个模态分量,μi为第i个模态分量的均值,σi为第i个模态分量的标准差。由于是语音信号,设定模态分量频率带宽控制参数α为2000。
S2-2:构造约束变分模型,引入拉格朗日函数,构造增广拉格朗日方程;
步骤S2-2中,VMD分解过程可以看作约束变分问题的构造与求解,约束变分模型即VMD约束模型表达式如式(Ⅱ)所示:
式(Ⅱ)中,δ(t)为单位冲激函数,K是VMD分解层数,{uk}={u1,u2,......,uk}是所有IMF模态分量的集合,{ωk}={ω1,ω2,......,ωk}是各个模态分量中心频率的集合,j为虚数单位。
S2-3:求解增广拉格朗日方程,初始化分量的频率,得到初始分量频率u^k 1,与u^k 1对应的初始中心频率ω^k 1,初始拉格朗日乘数λ^k 1;
步骤S2-3中,增广拉格朗日方程L如式(Ⅲ)所示:
式(Ⅲ)中,α为模态分量频率带宽控制参数,λ为拉格朗日乘数,ωk为第k个模态分量的中心频率。
S2-4:根据VMD算法公式更新分量频率u^k,中心频率ω^k;
步骤S2-4中,模态分量频率的更新公式如式(Ⅳ)所示:
式(Ⅳ)中,x(ω)是信号x(t)的频域形式,λ^(ω)为拉格朗日算子λ(t)的频域形式,上标^均表示共轭形式,n为迭代次数;
IMF分量对应的中心频率的更新公式如式(Ⅴ)所示:
式(Ⅴ)中,u^k(ω)为第k个IMF模态分量频率。
S2-5:在每次更新完分量频率u^k、中心频率ω^k之后,更新拉格朗日乘数λ^;
步骤S2-5中,拉格朗日乘数λ的更新公式如式(Ⅵ)所示:
式(Ⅵ)中,τ为拉格朗日乘数的更新参数,τ=10-3。
S2-6:判断迭代更新后的分量频率是否满足收敛方程,如果不满足,则继续迭代,同时加入噪声强度逐渐递减的高斯白噪声,继续执行步骤S2-S5;如果满足收敛方程,则结束迭代,获得完成VMD分解的模态分量。
步骤S2-6中,收敛方程如式(Ⅶ)所示:
式(Ⅶ)中,ε为收敛准则容差值,ε为10-6;步骤S2-6中,得到的分解后的模态分量记为IMF1,IMF2,......,IMFm。
步骤S2-6中,加入噪声强度逐渐递减的高斯白噪声的具体方法是:向分量频率不满足收敛方程的模态分量加入幅度分布服从高斯分布、功率谱密度分布服从均匀分布的噪声,且噪声强度要按照逐渐递减的原则,即后一次添加的噪声强度要比前一次添加的噪声强度要低。
实施例3
根据实施例2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其区别在于:
步骤S2-1、步骤S3中,相关系数ρxy计算公式如式(Ⅷ)所示:
式(Ⅷ)中,x(i)为待计算相关系数的信号,y(i)为原始信号。
步骤S3中,依据虚假分量判断原则从相关系数分布图中确定虚假分量,具体是指:从相关系数分布图中找到第一个相关系数小于h的点,将这个点对应的模态分量记作IMFh,h是指相关系数,h=0.15,将IMFh+1~IMFk记为虚假分量。
步骤S3中,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量,具体是指:去除虚假分量后重新绘制相关系数分布曲线,找到曲线上的第一个转折点记作p,此点对应的IMF模态分量记作IMFp,将IMF1~IMFp记为噪声主导的IMF模态分量。
实施例4
根据实施例2或3所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其区别在于:
步骤S5的具体实现过程如下:
S5-1:从一个噪声主导的模态分量中提取m个特征值Mi,i=1,2,...,m特征值Mi的维度为n{Mi1,Mi2,...,Mij},j=1,2,...,n;
S5-3:根据计算标准化矩阵的协方差矩阵B,如式(IX)所示:
式(IX)中,协方差矩阵B也称为矩阵Amn的相关系数矩阵;
S5-4:计算协方差矩阵B的特征值λ与特征值对应的特征向量p,在matlab中使用eig函数求特征值及特征向量,具体步骤为,在命令行窗口中输入矩阵Amn,然后输入[x,y]=eig(Amn),计算得到x,y两个矩阵,其中x的每一列值表示矩阵a的一个特征向量,y的对角元素值代表a矩阵的特征值。将特征值重新按照从大到小的顺序排列为λ1≥λ1≥...≥λa,与其相对应的特征向量为pi,i=1,2,...,a,特征向量之间彼此正交,由特征向量构成一个矩阵P=(p1,p2,......,pn);
S5-5:令Y=PTB,Y=(y1,y2,...,yn)T,其中y1,y2,...,yi,...彼此不相关,称y1,y2,...,yn分别为第1、第2、...、第i...个主成分变量;
S5-6:选择前p个主成分变量,通过它们对应的特征值计算主成分累计贡献率,如式(Ⅹ)所示:
式(Ⅹ)中,αp为前p个主成分变量的累计贡献率;
S5-7:选择累计贡献率达到85%以上的主成分变量与步骤S4得到的信号主导的IMF分量进行重构,生成新的信号,这个新的信号就是去除噪声的语音信号。
重构公式如式(Ⅺ)所示:
d(t)=IMF信号(t)+IMFPCA(t)(Ⅺ)
式(Ⅺ)中,IMF信号(t)为信号主导的模态分量,IMFPCA(t)为累计贡献率达到85%以上的主成分变量重构得到的模态分量。
Claims (10)
1.一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,包括步骤如下:
S1:选取一段带噪语音信号y(t)作为样本;
S2:使用改进的VMD方法对带噪语音信号y(t)进行分解,得到K个IMF模态分量;
S3:计算每个IMF模态分量与原带噪语音信号的相关系数,画出相关系数分布图,依据虚假分量判断原则从相关系数分布图中确定虚假分量,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量;
S4:去除虚假分量和噪声主导的IMF模态分量后,剩余的IMF模态分量记为信号主导的IMF模态分量;
S5:对于噪声主导的IMF模态分量,采取主成分分析法,根据累计贡献率选择一定数目的主成分分量进行重构,去除噪声主导的IMF模态分量中的残余噪声;
S6:将经过主成分分析后的噪声主导的IMF模态分量的主成分分量与信号主导的IMF模态分量进行重构,得到去除噪声的语音信号。
2.根据权利要求1所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2的具体实现过程包括:
S2-1:设定VMD分解参数,包括最佳分解层数和模态分量频率带宽控制参数α;
S2-2:构造约束变分模型,引入拉格朗日函数,构造增广拉格朗日方程;
S2-3:求解增广拉格朗日方程,初始化分量的频率,得到初始分量频率u^k 1,与u^k 1对应的初始中心频率ω^k 1,初始拉格朗日乘数λ^k 1;
S2-4:根据VMD算法公式更新分量频率u^k,中心频率ω^k;
S2-5:在每次更新完分量频率u^k、中心频率ω^k之后,更新拉格朗日乘数λ^;
S2-6:判断迭代更新后的分量频率是否满足收敛方程,如果不满足,则继续迭代,同时加入噪声强度逐渐递减的高斯白噪声,继续执行步骤S2-S5;如果满足收敛方程,则结束迭代,获得完成VMD分解的模态分量。
3.根据权利要求2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2-1中,设定最佳分解层数的方法如下:
对原带噪语音信号进行EMD分解,设某一次分解的层数为K,分解后得到K个模态分量,计算各个模态分量与原带噪语音信号的相关系数,选相关系数最大的模态分量IMFmax,计算其峭度并记为λ,之后每一次分解的层数都加1,且分解层数为K+1时相关系数最大的模态分量的峭度记为λ’,不断迭代,直至某一次出现一个λ<λ’,这时λ对应的分解的层数为最佳分解层数;峭度H计算公式如式(Ⅰ)所示:
式(Ⅰ)中,IMFi(t)为第i个模态分量,μi为第i个模态分量的均值,σi为第i个模态分量的标准差;
进一步优选的,设定模态分量频率带宽控制参数α为2000。
7.根据权利要求2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2-5中,拉格朗日乘数λ的更新公式如式(Ⅵ)所示:
式(Ⅵ)中,τ为拉格朗日乘数的更新参数,τ=10-3;
步骤S2-6中,收敛方程如式(Ⅶ)所示:
式(Ⅶ)中,ε为收敛准则容差值,ε为10-6;步骤S2-6中,得到的分解后的模态分量记为IMF1,IMF2,......,IMFm;
步骤S2-6中,加入噪声强度逐渐递减的高斯白噪声的具体方法是:向分量频率不满足收敛方程的模态分量加入幅度分布服从高斯分布、功率谱密度分布服从均匀分布的噪声,且噪声强度要按照逐渐递减的原则,即后一次添加的噪声强度要比前一次添加的噪声强度要低。
9.根据权利要求1所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S3中,依据虚假分量判断原则从相关系数分布图中确定虚假分量,具体是指:从相关系数分布图中找到第一个相关系数小于h的点,将这个点对应的模态分量记作IMFh,h是指相关系数,取值范围为0.10~0.15,将IMFh+1~IMFk记为虚假分量;
步骤S3中,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量,具体是指:去除虚假分量后重新绘制相关系数分布曲线,找到曲线上的第一个转折点记作p,此点对应的IMF模态分量记作IMFp,将IMF1~IMFp记为噪声主导的IMF模态分量;
进一步优选的,h=0.15。
10.根据权利要求1-9任一所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S5的具体实现过程如下:
S5-1:从一个噪声主导的模态分量中提取m个特征值Mi,i=1,2,...,m特征值Mi的维度为n{Mi1,Mi2,...,Mij},j=1,2,...,n;
S5-3:根据计算标准化矩阵的协方差矩阵B,如式(Ⅸ)所示:
式(Ⅸ)中,协方差矩阵B也称为矩阵Amn的相关系数矩阵;
S5-4:计算协方差矩阵B的特征值λ与特征值对应的特征向量p,将特征值重新按照从大到小的顺序排列为λ1≥λ1≥...≥λa,与其相对应的特征向量为pi,i=1,2,...,a,特征向量之间彼此正交,由特征向量构成一个矩阵P=(p1,p2,......,pn);
S5-5:令Y=PTB,Y=(y1,y2,...,yn)T,其中y1,y2,...,yi,...彼此不相关,称y1,y2,...,yn分别为第1、第2、...、第i...个主成分变量;
S5-6:选择前p个主成分变量,通过它们对应的特征值计算主成分累计贡献率,如式(Ⅹ)所示:
式(Ⅹ)中,αp为前p个主成分变量的累计贡献率;
S5-7:选择累计贡献率达到85%以上的主成分变量重构得到一个新的模态分量IMFPCA,与步骤S4得到的信号主导的IMF分量进行重构,生成新的信号,这个新的信号就是去除噪声的语音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111159300.0A CN113851144A (zh) | 2021-09-30 | 2021-09-30 | 一种基于改进变分模态分解和主成分分析的语音信号去噪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111159300.0A CN113851144A (zh) | 2021-09-30 | 2021-09-30 | 一种基于改进变分模态分解和主成分分析的语音信号去噪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113851144A true CN113851144A (zh) | 2021-12-28 |
Family
ID=78977290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111159300.0A Pending CN113851144A (zh) | 2021-09-30 | 2021-09-30 | 一种基于改进变分模态分解和主成分分析的语音信号去噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113851144A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114023313A (zh) * | 2022-01-04 | 2022-02-08 | 北京世纪好未来教育科技有限公司 | 语音处理模型的训练、语音处理方法、装置、设备及介质 |
CN114611329A (zh) * | 2022-04-01 | 2022-06-10 | 长江大学 | 一种基于变分模态分解的时域电磁法近场噪声压制方法 |
CN115014313A (zh) * | 2022-05-30 | 2022-09-06 | 中北大学 | 一种基于并行多尺度的偏振光罗盘航向误差处理方法 |
CN116013240A (zh) * | 2023-01-07 | 2023-04-25 | 广西大学 | 基于变分模态分解与数字滤波的钢管混凝土信号降噪方法 |
CN116825121A (zh) * | 2023-08-30 | 2023-09-29 | 北京神码数字技术有限公司 | 基于人工智能的智能语音识别与机器翻译系统 |
CN117713144A (zh) * | 2024-02-06 | 2024-03-15 | 西安热工研究院有限公司 | 一种基于熔盐储能的火电机组的调频方法和系统 |
-
2021
- 2021-09-30 CN CN202111159300.0A patent/CN113851144A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114023313A (zh) * | 2022-01-04 | 2022-02-08 | 北京世纪好未来教育科技有限公司 | 语音处理模型的训练、语音处理方法、装置、设备及介质 |
CN114023313B (zh) * | 2022-01-04 | 2022-04-08 | 北京世纪好未来教育科技有限公司 | 语音处理模型的训练、语音处理方法、装置、设备及介质 |
CN114611329A (zh) * | 2022-04-01 | 2022-06-10 | 长江大学 | 一种基于变分模态分解的时域电磁法近场噪声压制方法 |
CN114611329B (zh) * | 2022-04-01 | 2023-09-26 | 长江大学 | 一种基于变分模态分解的时域电磁法近场噪声压制方法 |
CN115014313A (zh) * | 2022-05-30 | 2022-09-06 | 中北大学 | 一种基于并行多尺度的偏振光罗盘航向误差处理方法 |
CN115014313B (zh) * | 2022-05-30 | 2023-08-22 | 中北大学 | 一种基于并行多尺度的偏振光罗盘航向误差处理方法 |
CN116013240A (zh) * | 2023-01-07 | 2023-04-25 | 广西大学 | 基于变分模态分解与数字滤波的钢管混凝土信号降噪方法 |
CN116013240B (zh) * | 2023-01-07 | 2023-10-31 | 广西大学 | 基于变分模态分解与数字滤波的钢管混凝土信号降噪方法 |
CN116825121A (zh) * | 2023-08-30 | 2023-09-29 | 北京神码数字技术有限公司 | 基于人工智能的智能语音识别与机器翻译系统 |
CN116825121B (zh) * | 2023-08-30 | 2023-11-10 | 北京神码数字技术有限公司 | 基于人工智能的智能语音识别与机器翻译系统 |
CN117713144A (zh) * | 2024-02-06 | 2024-03-15 | 西安热工研究院有限公司 | 一种基于熔盐储能的火电机组的调频方法和系统 |
CN117713144B (zh) * | 2024-02-06 | 2024-04-30 | 西安热工研究院有限公司 | 一种基于熔盐储能的火电机组的调频方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113851144A (zh) | 一种基于改进变分模态分解和主成分分析的语音信号去噪方法 | |
CN110688964B (zh) | 一种基于稀疏分解的小波阈值与emd联合降噪方法 | |
CN109785854B (zh) | 一种经验模态分解和小波阈值去噪相结合的语音增强方法 | |
CN109446928B (zh) | 一种基于变分模态分解和最小均方误差自适应滤波器的信号降噪方法 | |
CN106441288B (zh) | 一种加速度计的自适应小波降噪方法 | |
CN110246106B (zh) | 基于量子和声搜索模糊集的nsst域浮选泡沫图像增强及去噪方法 | |
CN111982489B (zh) | 选择集成的改进局部特征分解的微弱故障特征提取方法 | |
CN107729845B (zh) | 一种基于子空间特征值分解的实测频响函数降噪方法 | |
CN113962244A (zh) | 瑞雷波地震数据噪声去除方法、存储介质及电子设备 | |
CN111260131A (zh) | 一种短期交通流的预测方法及装置 | |
Prasadh et al. | Efficiency analysis of noise reduction algorithms: Analysis of the best algorithm of noise reduction from a set of algorithms | |
CN113917490A (zh) | 激光测风雷达信号去噪方法及装置 | |
CN117158999A (zh) | 一种基于ppmcc和自适应vmd的脑电信号去噪方法及系统 | |
CN109724693B (zh) | 一种基于平稳小波的融合光谱去噪方法 | |
CN113568058B (zh) | 一种基于多分辨率奇异值分解的大地电磁信噪分离方法及系统 | |
CN110634112A (zh) | 一种双域分解的矿井下含噪声图像的增强方法 | |
CN113255532A (zh) | 一种基于层间相关系数的小波双阈值去噪方法 | |
CN112580451A (zh) | 一种基于改进emd和med的数据降噪方法 | |
Pentari et al. | Graph-based denoising of EEG signals in impulsive environments | |
CN110146929B (zh) | 基于过完备字典与压缩感知重构算法的低频大地电磁数据去噪方法 | |
CN115014313B (zh) | 一种基于并行多尺度的偏振光罗盘航向误差处理方法 | |
CN112652321B (zh) | 一种基于深度学习相位更加友好的语音降噪系统及方法 | |
Panda et al. | Impulsive noise cancellation from ECG signal using adaptive filters and their comparison | |
CN112363217A (zh) | 一种地震数据随机噪声压制方法及系统 | |
CN113567129A (zh) | 一种列车轴承振动信号基于ceemd的降噪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |