CN113851144A - 一种基于改进变分模态分解和主成分分析的语音信号去噪方法 - Google Patents

一种基于改进变分模态分解和主成分分析的语音信号去噪方法 Download PDF

Info

Publication number
CN113851144A
CN113851144A CN202111159300.0A CN202111159300A CN113851144A CN 113851144 A CN113851144 A CN 113851144A CN 202111159300 A CN202111159300 A CN 202111159300A CN 113851144 A CN113851144 A CN 113851144A
Authority
CN
China
Prior art keywords
component
modal
imf
noise
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111159300.0A
Other languages
English (en)
Inventor
李康
陈阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202111159300.0A priority Critical patent/CN113851144A/zh
Publication of CN113851144A publication Critical patent/CN113851144A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种基于改进变分模态分解和主成分分析的语音信号去噪方法,包括:S1:选取带噪语音信号作为样本;S2:对带噪语音信号进行分解,得到K个IMF模态分量;S3:计算每个IMF模态分量与原带噪语音信号的相关系数,画出相关系数分布图,从相关系数分布图中确定虚假分量和噪声主导的IMF模态分量;S4:去除虚假分量和噪声主导的IMF模态分量后,剩余的IMF模态分量记为信号主导的IMF模态分量;S5:去除噪声主导的IMF模态分量中的残余噪声;S6:噪声主导的IMF模态分量的主成分分量与信号主导的IMF模态分量进行重构,得到去除噪声的语音信号。本发明消除了VMD分解后重构信号中残留噪声的问题。

Description

一种基于改进变分模态分解和主成分分析的语音信号去噪 方法
技术领域
本发明属于信号处理技术领域,尤其涉及一种语音信号去噪方法。
背景技术
语音信号在采集和传输的过程中不可避免的会受到各种各样的干扰,这会使采集到的语音信号准确度低,不利于后续分析,因此语音去噪成为语音信号处理过程中最为关键的一步。
传统进行语音去噪的方法有很多,基于谱减法的语音去噪是假定语音信号是短时平稳的,然而语音信号本身是一种非线性非平稳信号,使用谱减法有一定的局限性,且会产生一种新的背景噪声。基于小波阈值的语音去噪的关键在于阈值函数的选取,然而硬阈值的重构信号会产生振荡,软阈值的重构信号会产生失真。经验模态分解(EMD)是由huang等人提出的一种处理非线性非平稳信号的方法,将信号分解成有限个本征模态函数分量(IMF)与一个残差,频率由高到低排列下来,我们可以根据所处理信号的特点,把不符合信号特征的分量去除,对符合信号特征的其他分量进行处理,将最终剩余且处理完成的分量叠加重构,获得去噪后的信号。常规EMD分解法得到的IMF模态分量的选取没有统一的标准,通常是认为高频IMF模态分量中以噪声信号为主导并舍弃,然而这会导致有效信号被剔除,使得重构后的信号失真,同时,EMD分解法中极值点和包络线无法精确的确定,这就会产生包含虚假频率成分的IMF模态分量,这部分分量如果得不到剔除会使重构后的信号不准确。
发明内容
针对现有技术的不足,本发明提出了一种改进的语音信号去噪方法,是一种变分模态分解法(VMD)和主成分分析法(PCA)相结合的技术。
本发明通过向原信号中添加高斯白噪声的方法消除VMD分解后重构信号中残留噪声的问题,采用VMD完成对原语音信号的分解,计算各个模态分量与原信号的相关系数并画相关系数分布图,通过模态分量判断准则将模态分量分为无效分量、信号分量、噪声分量三个类别。其中,无效分量直接剔除,信号分量予以保留,噪声分量经过后续PCA降噪后与信号分量进行重构,得到最终去噪后的语音信号。
术语解释:
1、VMD分解,即变分模态分解,是一种自适应、完全非递归的模态变分和信号处理的方法。该技术具有可以确定模态分解个数的优点,其自适应性表现在根据实际情况确定所给序列的模态分解个数,随后的搜索和求解过程中可以自适应地匹配每种模态的最佳中心频率和有限带宽,并且可以实现固有模态分量(IMF)的有效分离、信号的频域划分、进而得到给定信号的有效分解成分,最终获得变分问题的最优解。
2、EMD,经验模态分解,是由黄锷(N.E.Huang)等人于1998年创造性地提出的一种新型自适应信号时频处理方法,特别适用于非线性非平稳信号的分析处理。
本发明的技术方案为:
一种基于改进变分模态分解和主成分分析的语音信号去噪方法,包括步骤如下:
S1:选取一段带噪语音信号y(t)作为样本;
S2:使用改进的VMD方法对带噪语音信号y(t)进行分解,得到K个IMF模态分量;
S3:计算每个IMF模态分量与原带噪语音信号的相关系数,画出相关系数分布图,依据虚假分量判断原则从相关系数分布图中确定虚假分量,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量;
S4:去除虚假分量和噪声主导的IMF模态分量后,剩余的IMF模态分量记为信号主导的IMF模态分量;
S5:对于噪声主导的IMF模态分量,采取主成分分析(PCA)法,根据累计贡献率选择一定数目的主成分分量进行重构,去除噪声主导的IMF模态分量中的残余噪声;
S6:将经过主成分分析(PCA)后的噪声主导的IMF模态分量的主成分分量与信号主导的IMF模态分量进行重构,得到去除噪声的语音信号。
根据本发明优选的,步骤S2的具体实现过程包括:
S2-1:设定VMD分解参数,包括最佳分解层数和模态分量频率带宽控制参数α;
S2-2:构造约束变分模型,引入拉格朗日函数,构造增广拉格朗日方程;
S2-3:求解增广拉格朗日方程,初始化分量的频率,得到初始分量频率u^k 1,与u^k 1对应的初始中心频率ω^k 1,初始拉格朗日乘数λ^k 1
S2-4:根据VMD算法公式更新分量频率u^k,中心频率ω^k
S2-5:在每次更新完分量频率u^k、中心频率ω^k之后,更新拉格朗日乘数λ^;
S2-6:判断迭代更新后的分量频率是否满足收敛方程,如果不满足,则继续迭代,同时加入噪声强度逐渐递减的高斯白噪声,继续执行步骤S2-S5;如果满足收敛方程,则结束迭代,获得完成VMD分解的模态分量。
进一步优选的,步骤S2-1中,设定最佳分解层数的方法如下:
对原带噪语音信号进行EMD分解,设某一次分解的层数为K,分解后得到K个模态分量,计算各个模态分量与原带噪语音信号的相关系数,选相关系数最大的模态分量IMFmax,计算其峭度并记为λ,之后每一次分解的层数都加1,且分解层数为K+1时相关系数最大的模态分量的峭度记为λ’,不断迭代,直至某一次出现一个λ<λ’,这时λ对应的分解的层数为最佳分解层数;峭度H计算公式如式(Ⅰ)所示:
Figure BDA0003289499000000031
式(Ⅰ)中,IMFi(t)为第i个模态分量,μi为第i个模态分量的均值,σi为第i个模态分量的标准差。
进一步优选的,设定模态分量频率带宽控制参数α为2000。
进一步优选的,步骤S2-2中,约束变分模型即VMD约束模型表达式如式(Ⅱ)所示:
Figure BDA0003289499000000032
式(Ⅱ)中,δ(t)为单位冲激函数,K是VMD分解层数,{uk}={u1,u2,......,uk}是所有IMF分量的集合,{ωk}={ω12,......,ωk}是各个模态分量中心频率的集合,j为虚数单位。
进一步优选的,步骤S2-3中,增广拉格朗日方程L如式(Ⅲ)所示:
Figure BDA0003289499000000033
式(Ⅲ)中,α为模态分量频率带宽控制参数,λ为拉格朗日乘数,ωk为第k个模态分量的中心频率。
进一步优选的,步骤S2-4中,模态分量频率的更新公式如式(Ⅳ)所示:
Figure BDA0003289499000000034
式(Ⅳ)中,x(ω)是信号x(t)的频域形式,λ^(ω)为拉格朗日算子λ(t)的频域形式,上标^均表示共轭形式,n为迭代次数;
IMF分量对应的中心频率的更新公式如式(Ⅴ)所示:
Figure BDA0003289499000000041
式(Ⅴ)中,u^k(ω)为第k个IMF模态分量频率。
进一步优选的,步骤S2-5中,拉格朗日乘数λ的更新公式如式(Ⅵ)所示:
Figure BDA0003289499000000042
式(Ⅵ)中,τ为拉格朗日乘数的更新参数,τ=10-3
进一步优选的,步骤S2-6中,收敛方程如式(Ⅶ)所示:
Figure BDA0003289499000000043
式(Ⅶ)中,ε为收敛准则容差值,ε为10-6;步骤S2-6中,得到的分解后的模态分量记为IMF1,IMF2,......,IMFm
进一步优选的,步骤S2-6中,加入噪声强度逐渐递减的高斯白噪声的具体方法是:向分量频率不满足收敛方程的模态分量加入幅度分布服从高斯分布、功率谱密度分布服从均匀分布的噪声,且噪声强度要按照逐渐递减的原则,即后一次添加的噪声强度要比前一次添加的噪声强度要低。
根据本发明优选的,步骤S2-1、步骤S3中,相关系数ρxy计算公式如式(Ⅷ)所示:
Figure BDA0003289499000000044
式(Ⅷ)中,x(i)为待计算相关系数的信号,y(i)为原始信号。
根据本发明优选的,步骤S3中,依据虚假分量判断原则从相关系数分布图中确定虚假分量,具体是指:从相关系数分布图中找到第一个相关系数小于h的点,将这个点对应的模态分量记作IMFh,h是指相关系数,取值范围为0.10~0.15,将IMFh+1~IMFk记为虚假分量。
进一步优选的,h=0.15。
根据本发明优选的,步骤S3中,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量,具体是指:去除虚假分量后重新绘制相关系数分布曲线,找到曲线上的第一个转折点记作p,此点对应的IMF模态分量记作IMFp,将IMF1~IMFp记为噪声主导的IMF模态分量。
进一步地,步骤S5的具体实现过程如下:
S5-1:从一个噪声主导的模态分量中提取m个特征值Mi,i=1,2,...,m特征值Mi的维度为n{Mi1,Mi2,...,Mij},j=1,2,...,n;
S5-2:为特征值建立样本矩阵Amn,即由
Figure BDA0003289499000000051
组成的标准化m×n矩阵Amn作为样本矩阵,
Figure BDA0003289499000000052
的求取公式如式(Ⅷ)所示:
Figure BDA0003289499000000053
式(Ⅷ)中,
Figure BDA0003289499000000054
为Mij的标准化值,μj为第j个分量的样本均值,
Figure BDA0003289499000000055
sj为第j个分量的样本标准差,
Figure BDA0003289499000000056
S5-3:根据计算标准化矩阵的协方差矩阵B,如式(IX)所示:
Figure BDA0003289499000000057
式(IX)中,协方差矩阵B也称为矩阵Amn的相关系数矩阵;
S5-4:计算协方差矩阵B的特征值λ与特征值对应的特征向量p,将特征值重新按照从大到小的顺序排列为λ1≥λ1≥...≥λa,与其相对应的特征向量为pi,i=1,2,...,a,特征向量之间彼此正交,由特征向量构成一个矩阵P=(p1,p2,......,pn);
S5-5:令Y=PTB,Y=(y1,y2,...,yn)T,其中y1,y2,...,yi,...彼此不相关,称y1,y2,...,yn分别为第1、第2、...、第i...个主成分变量;
S5-6:选择前p个主成分变量,通过它们对应的特征值计算主成分累计贡献率,如式(Ⅹ)所示:
Figure BDA0003289499000000058
式(Ⅹ)中,αp为前p个主成分变量的累计贡献率;
S5-7:选择累计贡献率达到85%以上的主成分变量重构得到一个新的模态分量IMFPCA,与步骤S4得到的信号主导的IMF模态分量进行重构,生成新的信号,这个新的信号就是去除噪声的语音信号。
重构公式如式(Ⅺ)所示:
d(t)=IMF信号(t)+IMFPCA(t)(Ⅺ)
式(Ⅺ)中,IMF信号(t)为信号主导的模态分量,IMFPCA(t)为累计贡献率达到85%以上的主成分变量重构得到的模态分量。
本发明的有益效果为:
1、本发明采用了VMD(变分模态分解)法来处理语音信号这种非线性非平稳信号,相比于其他方法,VMD分解法的自适应性更强,它可以降低信号的复杂度以及非平稳性,对语音信号的处理有显著的效果
2、本发明改进了最佳分解层数的确定方法,相比于传统方法,提高了VMD分解的精度,使得分解的结果更加准确,减少了分解的时间,提高了分解效率。
3、本发明采用相关系数分布图的来确定噪声主导分量、信号主导分量以及无效分量,相比于其他方法,本发明不会使得有用的分量被误去除。
4、本发明通过加入高斯白噪声来消除了VMD分解法产生的端点效应以及模态混叠,相比于其他方法,本发明模态分量的分解更加准确。
5、本发明使用主成分分析(PCA)方法对噪声主导的分量降噪,并将降噪后的信号用于信号重构,相比于其他方法,本发明重构后的信号更加准确。
附图说明
图1是本发明VMD分解以及模态分量分类的流程图。
图2是本发明主成分分析过程的流程图。
图3是原始语音信号的波形图。
图4是加入的噪声波形图。
图5是加入噪声后的语音信号波形图。
图6是去噪后语音信号的波形图。
具体实施方式
下面结合说明书附图和具体实施示例对本发明做进一步说明,但不限于此。
实施例1
一种基于改进变分模态分解和主成分分析的语音信号去噪方法,包括步骤如下:
S1:选取一段带噪语音信号作为样本;
S2:使用改进的VMD方法对带噪语音信号进行分解,得到K个IMF模态分量;
S3:计算每个IMF模态分量与原带噪语音信号的相关系数,画出相关系数分布图,依据虚假分量判断原则从相关系数分布图中确定虚假分量,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量;
S4:去除虚假分量和噪声主导的IMF模态分量后,剩余的IMF模态分量记为信号主导的IMF模态分量;
S5:对于噪声主导的IMF模态分量,采取主成分分析(PCA)法,根据累计贡献率选择一定数目的主成分分量进行重构,去除噪声主导的IMF模态分量中的残余噪声;
S6:将经过主成分分析后的噪声主导的IMF模态分量的主成分分量与信号主导的IMF模态分量进行重构,得到去除噪声的语音信号。
如图1所示,是本发明的原理流程图,其中,x(t)是采集到的语音信号,该语音信号含有噪声,经VMD分解后,得到n个模态分量,其中n是大于等于2的整数。计算各个IMF模态分量与x(t)的相关系数,画出相关系数分布图,并按照判断准则将IMF模态分量归为噪声主导和信号主导两类,其中噪声主导的分量进一步经PCA法进行分解,取其中贡献率大的主元分量进行重构,得到去噪后的分量,最终将去噪后的噪声主导IMF模态分量与信号主导IMF模态分量进行重构,得到去噪后的语音信号y(t)。
图3是原始语音信号的波形图。图4是加入的噪声波形图。图5是加入噪声后的语音信号波形图。图6是本发明去噪后语音信号的波形图。
图5和图6比对,可知,大部分噪声干扰已经被去除。图3和图6比对,可知,去噪后的信号在最初始的位置存有部分噪声,其他位置已经接近原始信号,去噪效果较好。
实施例2
根据实施例1所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其区别在于:
步骤S2的具体实现过程包括:
如图2所示,S2-1:设定VMD分解参数,包括最佳分解层数和模态分量频率带宽控制参数α;
步骤S2-1中,本发明中VMD分解法的改进在于改进了最佳分解层数的确定方法,设定最佳分解层数的方法如下:
对原带噪语音信号进行EMD分解,设某一次分解的层数为K,分解后得到K个模态分量,计算各个模态分量与原带噪语音信号的相关系数,选相关系数最大的模态分量IMFmax,计算其峭度并记为λ,之后每一次分解的层数都加1,且分解层数为K+1时相关系数最大的模态分量的峭度记为λ’,不断迭代,直至某一次出现一个λ<λ’,这时λ对应的分解的层数为最佳分解层数;峭度H计算公式如式(Ⅰ)所示:
Figure BDA0003289499000000081
式(Ⅰ)中,IMFi(t)为第i个模态分量,μi为第i个模态分量的均值,σi为第i个模态分量的标准差。由于是语音信号,设定模态分量频率带宽控制参数α为2000。
S2-2:构造约束变分模型,引入拉格朗日函数,构造增广拉格朗日方程;
步骤S2-2中,VMD分解过程可以看作约束变分问题的构造与求解,约束变分模型即VMD约束模型表达式如式(Ⅱ)所示:
Figure BDA0003289499000000082
式(Ⅱ)中,δ(t)为单位冲激函数,K是VMD分解层数,{uk}={u1,u2,......,uk}是所有IMF模态分量的集合,{ωk}={ω12,......,ωk}是各个模态分量中心频率的集合,j为虚数单位。
S2-3:求解增广拉格朗日方程,初始化分量的频率,得到初始分量频率u^k 1,与u^k 1对应的初始中心频率ω^k 1,初始拉格朗日乘数λ^k 1
步骤S2-3中,增广拉格朗日方程L如式(Ⅲ)所示:
Figure BDA0003289499000000083
式(Ⅲ)中,α为模态分量频率带宽控制参数,λ为拉格朗日乘数,ωk为第k个模态分量的中心频率。
S2-4:根据VMD算法公式更新分量频率u^k,中心频率ω^k
步骤S2-4中,模态分量频率的更新公式如式(Ⅳ)所示:
Figure BDA0003289499000000084
式(Ⅳ)中,x(ω)是信号x(t)的频域形式,λ^(ω)为拉格朗日算子λ(t)的频域形式,上标^均表示共轭形式,n为迭代次数;
IMF分量对应的中心频率的更新公式如式(Ⅴ)所示:
Figure BDA0003289499000000091
式(Ⅴ)中,u^k(ω)为第k个IMF模态分量频率。
S2-5:在每次更新完分量频率u^k、中心频率ω^k之后,更新拉格朗日乘数λ^;
步骤S2-5中,拉格朗日乘数λ的更新公式如式(Ⅵ)所示:
Figure BDA0003289499000000092
式(Ⅵ)中,τ为拉格朗日乘数的更新参数,τ=10-3
S2-6:判断迭代更新后的分量频率是否满足收敛方程,如果不满足,则继续迭代,同时加入噪声强度逐渐递减的高斯白噪声,继续执行步骤S2-S5;如果满足收敛方程,则结束迭代,获得完成VMD分解的模态分量。
步骤S2-6中,收敛方程如式(Ⅶ)所示:
Figure BDA0003289499000000093
式(Ⅶ)中,ε为收敛准则容差值,ε为10-6;步骤S2-6中,得到的分解后的模态分量记为IMF1,IMF2,......,IMFm
步骤S2-6中,加入噪声强度逐渐递减的高斯白噪声的具体方法是:向分量频率不满足收敛方程的模态分量加入幅度分布服从高斯分布、功率谱密度分布服从均匀分布的噪声,且噪声强度要按照逐渐递减的原则,即后一次添加的噪声强度要比前一次添加的噪声强度要低。
实施例3
根据实施例2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其区别在于:
步骤S2-1、步骤S3中,相关系数ρxy计算公式如式(Ⅷ)所示:
Figure BDA0003289499000000101
式(Ⅷ)中,x(i)为待计算相关系数的信号,y(i)为原始信号。
步骤S3中,依据虚假分量判断原则从相关系数分布图中确定虚假分量,具体是指:从相关系数分布图中找到第一个相关系数小于h的点,将这个点对应的模态分量记作IMFh,h是指相关系数,h=0.15,将IMFh+1~IMFk记为虚假分量。
步骤S3中,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量,具体是指:去除虚假分量后重新绘制相关系数分布曲线,找到曲线上的第一个转折点记作p,此点对应的IMF模态分量记作IMFp,将IMF1~IMFp记为噪声主导的IMF模态分量。
实施例4
根据实施例2或3所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其区别在于:
步骤S5的具体实现过程如下:
S5-1:从一个噪声主导的模态分量中提取m个特征值Mi,i=1,2,...,m特征值Mi的维度为n{Mi1,Mi2,...,Mij},j=1,2,...,n;
S5-2:为特征值建立样本矩阵Amn,即由
Figure BDA0003289499000000102
组成的标准化m×n矩阵Amn作为样本矩阵,
Figure BDA0003289499000000103
的求取公式如式(Ⅷ)所示:
Figure BDA0003289499000000104
式(Ⅷ)中,
Figure BDA0003289499000000105
为Mij的标准化值,μj为第j个分量的样本均值,
Figure BDA0003289499000000106
sj为第j个分量的样本标准差,
Figure BDA0003289499000000107
S5-3:根据计算标准化矩阵的协方差矩阵B,如式(IX)所示:
Figure BDA0003289499000000108
式(IX)中,协方差矩阵B也称为矩阵Amn的相关系数矩阵;
S5-4:计算协方差矩阵B的特征值λ与特征值对应的特征向量p,在matlab中使用eig函数求特征值及特征向量,具体步骤为,在命令行窗口中输入矩阵Amn,然后输入[x,y]=eig(Amn),计算得到x,y两个矩阵,其中x的每一列值表示矩阵a的一个特征向量,y的对角元素值代表a矩阵的特征值。将特征值重新按照从大到小的顺序排列为λ1≥λ1≥...≥λa,与其相对应的特征向量为pi,i=1,2,...,a,特征向量之间彼此正交,由特征向量构成一个矩阵P=(p1,p2,......,pn);
S5-5:令Y=PTB,Y=(y1,y2,...,yn)T,其中y1,y2,...,yi,...彼此不相关,称y1,y2,...,yn分别为第1、第2、...、第i...个主成分变量;
S5-6:选择前p个主成分变量,通过它们对应的特征值计算主成分累计贡献率,如式(Ⅹ)所示:
Figure BDA0003289499000000111
式(Ⅹ)中,αp为前p个主成分变量的累计贡献率;
S5-7:选择累计贡献率达到85%以上的主成分变量与步骤S4得到的信号主导的IMF分量进行重构,生成新的信号,这个新的信号就是去除噪声的语音信号。
重构公式如式(Ⅺ)所示:
d(t)=IMF信号(t)+IMFPCA(t)(Ⅺ)
式(Ⅺ)中,IMF信号(t)为信号主导的模态分量,IMFPCA(t)为累计贡献率达到85%以上的主成分变量重构得到的模态分量。

Claims (10)

1.一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,包括步骤如下:
S1:选取一段带噪语音信号y(t)作为样本;
S2:使用改进的VMD方法对带噪语音信号y(t)进行分解,得到K个IMF模态分量;
S3:计算每个IMF模态分量与原带噪语音信号的相关系数,画出相关系数分布图,依据虚假分量判断原则从相关系数分布图中确定虚假分量,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量;
S4:去除虚假分量和噪声主导的IMF模态分量后,剩余的IMF模态分量记为信号主导的IMF模态分量;
S5:对于噪声主导的IMF模态分量,采取主成分分析法,根据累计贡献率选择一定数目的主成分分量进行重构,去除噪声主导的IMF模态分量中的残余噪声;
S6:将经过主成分分析后的噪声主导的IMF模态分量的主成分分量与信号主导的IMF模态分量进行重构,得到去除噪声的语音信号。
2.根据权利要求1所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2的具体实现过程包括:
S2-1:设定VMD分解参数,包括最佳分解层数和模态分量频率带宽控制参数α;
S2-2:构造约束变分模型,引入拉格朗日函数,构造增广拉格朗日方程;
S2-3:求解增广拉格朗日方程,初始化分量的频率,得到初始分量频率u^k 1,与u^k 1对应的初始中心频率ω^k 1,初始拉格朗日乘数λ^k 1
S2-4:根据VMD算法公式更新分量频率u^k,中心频率ω^k
S2-5:在每次更新完分量频率u^k、中心频率ω^k之后,更新拉格朗日乘数λ^;
S2-6:判断迭代更新后的分量频率是否满足收敛方程,如果不满足,则继续迭代,同时加入噪声强度逐渐递减的高斯白噪声,继续执行步骤S2-S5;如果满足收敛方程,则结束迭代,获得完成VMD分解的模态分量。
3.根据权利要求2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2-1中,设定最佳分解层数的方法如下:
对原带噪语音信号进行EMD分解,设某一次分解的层数为K,分解后得到K个模态分量,计算各个模态分量与原带噪语音信号的相关系数,选相关系数最大的模态分量IMFmax,计算其峭度并记为λ,之后每一次分解的层数都加1,且分解层数为K+1时相关系数最大的模态分量的峭度记为λ’,不断迭代,直至某一次出现一个λ<λ’,这时λ对应的分解的层数为最佳分解层数;峭度H计算公式如式(Ⅰ)所示:
Figure FDA0003289498990000021
式(Ⅰ)中,IMFi(t)为第i个模态分量,μi为第i个模态分量的均值,σi为第i个模态分量的标准差;
进一步优选的,设定模态分量频率带宽控制参数α为2000。
4.根据权利要求2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2-2中,约束变分模型即VMD约束模型表达式如式(Ⅱ)所示:
Figure FDA0003289498990000022
式(Ⅱ)中,δ(t)为单位冲激函数,K是VMD分解层数,{uk}={u1,u2,......,uk}是所有IMF分量的集合,{ωk}={ω12,......,ωk}是各个模态分量中心频率的集合,j为虚数单位。
5.根据权利要求2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2-3中,增广拉格朗日方程L如式(Ⅲ)所示:
Figure FDA0003289498990000023
式(Ⅲ)中,α为模态分量频率带宽控制参数,λ为拉格朗日乘数,ωk为第k个模态分量的中心频率。
6.根据权利要求2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2-4中,模态分量频率的更新公式如式(Ⅳ)所示:
Figure FDA0003289498990000024
式(Ⅳ)中,x(ω)是信号x(t)的频域形式,λ^(ω)为拉格朗日算子λ(t)的频域形式,上标^均表示共轭形式,n为迭代次数;
IMF分量对应的中心频率的更新公式如式(Ⅴ)所示:
Figure FDA0003289498990000031
式(Ⅴ)中,u^k(ω)为第k个IMF模态分量频率。
7.根据权利要求2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2-5中,拉格朗日乘数λ的更新公式如式(Ⅵ)所示:
Figure FDA0003289498990000032
式(Ⅵ)中,τ为拉格朗日乘数的更新参数,τ=10-3
步骤S2-6中,收敛方程如式(Ⅶ)所示:
Figure FDA0003289498990000033
式(Ⅶ)中,ε为收敛准则容差值,ε为10-6;步骤S2-6中,得到的分解后的模态分量记为IMF1,IMF2,......,IMFm
步骤S2-6中,加入噪声强度逐渐递减的高斯白噪声的具体方法是:向分量频率不满足收敛方程的模态分量加入幅度分布服从高斯分布、功率谱密度分布服从均匀分布的噪声,且噪声强度要按照逐渐递减的原则,即后一次添加的噪声强度要比前一次添加的噪声强度要低。
8.根据权利要求2所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S2-1、步骤S3中,相关系数ρxy计算公式如式(Ⅷ)所示:
Figure FDA0003289498990000034
式(Ⅷ)中,x(i)为待计算相关系数的信号,y(i)为原始信号。
9.根据权利要求1所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S3中,依据虚假分量判断原则从相关系数分布图中确定虚假分量,具体是指:从相关系数分布图中找到第一个相关系数小于h的点,将这个点对应的模态分量记作IMFh,h是指相关系数,取值范围为0.10~0.15,将IMFh+1~IMFk记为虚假分量;
步骤S3中,依据噪声分量判断原则从相关系数分布图中确定噪声主导的IMF模态分量,具体是指:去除虚假分量后重新绘制相关系数分布曲线,找到曲线上的第一个转折点记作p,此点对应的IMF模态分量记作IMFp,将IMF1~IMFp记为噪声主导的IMF模态分量;
进一步优选的,h=0.15。
10.根据权利要求1-9任一所述的一种基于改进变分模态分解和主成分分析的语音信号去噪方法,其特征在于,步骤S5的具体实现过程如下:
S5-1:从一个噪声主导的模态分量中提取m个特征值Mi,i=1,2,...,m特征值Mi的维度为n{Mi1,Mi2,...,Mij},j=1,2,...,n;
S5-2:为特征值建立样本矩阵Amn,即由
Figure FDA0003289498990000041
组成的标准化m×n矩阵Amn作为样本矩阵,
Figure FDA0003289498990000042
的求取公式如式(Ⅷ)所示:
Figure FDA0003289498990000043
式(Ⅷ)中,
Figure FDA0003289498990000044
为Mij的标准化值,μj为第j个分量的样本均值,
Figure FDA0003289498990000045
sj为第j个分量的样本标准差,
Figure FDA0003289498990000046
S5-3:根据计算标准化矩阵的协方差矩阵B,如式(Ⅸ)所示:
Figure FDA0003289498990000047
式(Ⅸ)中,协方差矩阵B也称为矩阵Amn的相关系数矩阵;
S5-4:计算协方差矩阵B的特征值λ与特征值对应的特征向量p,将特征值重新按照从大到小的顺序排列为λ1≥λ1≥...≥λa,与其相对应的特征向量为pi,i=1,2,...,a,特征向量之间彼此正交,由特征向量构成一个矩阵P=(p1,p2,......,pn);
S5-5:令Y=PTB,Y=(y1,y2,...,yn)T,其中y1,y2,...,yi,...彼此不相关,称y1,y2,...,yn分别为第1、第2、...、第i...个主成分变量;
S5-6:选择前p个主成分变量,通过它们对应的特征值计算主成分累计贡献率,如式(Ⅹ)所示:
Figure FDA0003289498990000051
式(Ⅹ)中,αp为前p个主成分变量的累计贡献率;
S5-7:选择累计贡献率达到85%以上的主成分变量重构得到一个新的模态分量IMFPCA,与步骤S4得到的信号主导的IMF分量进行重构,生成新的信号,这个新的信号就是去除噪声的语音信号。
CN202111159300.0A 2021-09-30 2021-09-30 一种基于改进变分模态分解和主成分分析的语音信号去噪方法 Pending CN113851144A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111159300.0A CN113851144A (zh) 2021-09-30 2021-09-30 一种基于改进变分模态分解和主成分分析的语音信号去噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111159300.0A CN113851144A (zh) 2021-09-30 2021-09-30 一种基于改进变分模态分解和主成分分析的语音信号去噪方法

Publications (1)

Publication Number Publication Date
CN113851144A true CN113851144A (zh) 2021-12-28

Family

ID=78977290

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111159300.0A Pending CN113851144A (zh) 2021-09-30 2021-09-30 一种基于改进变分模态分解和主成分分析的语音信号去噪方法

Country Status (1)

Country Link
CN (1) CN113851144A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114023313A (zh) * 2022-01-04 2022-02-08 北京世纪好未来教育科技有限公司 语音处理模型的训练、语音处理方法、装置、设备及介质
CN114611329A (zh) * 2022-04-01 2022-06-10 长江大学 一种基于变分模态分解的时域电磁法近场噪声压制方法
CN115014313A (zh) * 2022-05-30 2022-09-06 中北大学 一种基于并行多尺度的偏振光罗盘航向误差处理方法
CN116013240A (zh) * 2023-01-07 2023-04-25 广西大学 基于变分模态分解与数字滤波的钢管混凝土信号降噪方法
CN116825121A (zh) * 2023-08-30 2023-09-29 北京神码数字技术有限公司 基于人工智能的智能语音识别与机器翻译系统
CN117713144A (zh) * 2024-02-06 2024-03-15 西安热工研究院有限公司 一种基于熔盐储能的火电机组的调频方法和系统

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114023313A (zh) * 2022-01-04 2022-02-08 北京世纪好未来教育科技有限公司 语音处理模型的训练、语音处理方法、装置、设备及介质
CN114023313B (zh) * 2022-01-04 2022-04-08 北京世纪好未来教育科技有限公司 语音处理模型的训练、语音处理方法、装置、设备及介质
CN114611329A (zh) * 2022-04-01 2022-06-10 长江大学 一种基于变分模态分解的时域电磁法近场噪声压制方法
CN114611329B (zh) * 2022-04-01 2023-09-26 长江大学 一种基于变分模态分解的时域电磁法近场噪声压制方法
CN115014313A (zh) * 2022-05-30 2022-09-06 中北大学 一种基于并行多尺度的偏振光罗盘航向误差处理方法
CN115014313B (zh) * 2022-05-30 2023-08-22 中北大学 一种基于并行多尺度的偏振光罗盘航向误差处理方法
CN116013240A (zh) * 2023-01-07 2023-04-25 广西大学 基于变分模态分解与数字滤波的钢管混凝土信号降噪方法
CN116013240B (zh) * 2023-01-07 2023-10-31 广西大学 基于变分模态分解与数字滤波的钢管混凝土信号降噪方法
CN116825121A (zh) * 2023-08-30 2023-09-29 北京神码数字技术有限公司 基于人工智能的智能语音识别与机器翻译系统
CN116825121B (zh) * 2023-08-30 2023-11-10 北京神码数字技术有限公司 基于人工智能的智能语音识别与机器翻译系统
CN117713144A (zh) * 2024-02-06 2024-03-15 西安热工研究院有限公司 一种基于熔盐储能的火电机组的调频方法和系统
CN117713144B (zh) * 2024-02-06 2024-04-30 西安热工研究院有限公司 一种基于熔盐储能的火电机组的调频方法和系统

Similar Documents

Publication Publication Date Title
CN113851144A (zh) 一种基于改进变分模态分解和主成分分析的语音信号去噪方法
CN110688964B (zh) 一种基于稀疏分解的小波阈值与emd联合降噪方法
CN109785854B (zh) 一种经验模态分解和小波阈值去噪相结合的语音增强方法
CN109446928B (zh) 一种基于变分模态分解和最小均方误差自适应滤波器的信号降噪方法
CN106441288B (zh) 一种加速度计的自适应小波降噪方法
CN110246106B (zh) 基于量子和声搜索模糊集的nsst域浮选泡沫图像增强及去噪方法
CN111982489B (zh) 选择集成的改进局部特征分解的微弱故障特征提取方法
CN107729845B (zh) 一种基于子空间特征值分解的实测频响函数降噪方法
CN113962244A (zh) 瑞雷波地震数据噪声去除方法、存储介质及电子设备
CN111260131A (zh) 一种短期交通流的预测方法及装置
Prasadh et al. Efficiency analysis of noise reduction algorithms: Analysis of the best algorithm of noise reduction from a set of algorithms
CN113917490A (zh) 激光测风雷达信号去噪方法及装置
CN117158999A (zh) 一种基于ppmcc和自适应vmd的脑电信号去噪方法及系统
CN109724693B (zh) 一种基于平稳小波的融合光谱去噪方法
CN113568058B (zh) 一种基于多分辨率奇异值分解的大地电磁信噪分离方法及系统
CN110634112A (zh) 一种双域分解的矿井下含噪声图像的增强方法
CN113255532A (zh) 一种基于层间相关系数的小波双阈值去噪方法
CN112580451A (zh) 一种基于改进emd和med的数据降噪方法
Pentari et al. Graph-based denoising of EEG signals in impulsive environments
CN110146929B (zh) 基于过完备字典与压缩感知重构算法的低频大地电磁数据去噪方法
CN115014313B (zh) 一种基于并行多尺度的偏振光罗盘航向误差处理方法
CN112652321B (zh) 一种基于深度学习相位更加友好的语音降噪系统及方法
Panda et al. Impulsive noise cancellation from ECG signal using adaptive filters and their comparison
CN112363217A (zh) 一种地震数据随机噪声压制方法及系统
CN113567129A (zh) 一种列车轴承振动信号基于ceemd的降噪方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination