CN112530449B - 基于仿生小波变换的语音增强方法 - Google Patents
基于仿生小波变换的语音增强方法 Download PDFInfo
- Publication number
- CN112530449B CN112530449B CN202011128758.5A CN202011128758A CN112530449B CN 112530449 B CN112530449 B CN 112530449B CN 202011128758 A CN202011128758 A CN 202011128758A CN 112530449 B CN112530449 B CN 112530449B
- Authority
- CN
- China
- Prior art keywords
- threshold
- function
- new
- honey source
- bionic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 239000011664 nicotinic acid Substances 0.000 title claims abstract description 35
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 41
- 235000012907 honey Nutrition 0.000 claims description 66
- 241000256844 Apis mellifera Species 0.000 claims description 54
- 230000008569 process Effects 0.000 claims description 27
- 230000009466 transformation Effects 0.000 claims description 17
- 241000257303 Hymenoptera Species 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 13
- 238000011423 initialization method Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 235000013305 food Nutrition 0.000 claims description 3
- 230000009191 jumping Effects 0.000 claims description 3
- 238000010187 selection method Methods 0.000 claims description 3
- 241000764238 Isis Species 0.000 claims description 2
- 238000013459 approach Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 241000256837 Apidae Species 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 10
- 230000007547 defect Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 3
- 210000005069 ears Anatomy 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000011410 subtraction method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Abstract
本发明的一种基于仿生小波变换的语音增强方法,采用构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪等步骤,能够有效的降低噪声对语音信号的干扰,提高语音信号的信噪比,具有科学合理、结构简单、去噪效果好、适用范围广等优点。
Description
技术领域
本发明属于语音信号处理技术领域,涉及一种基于仿生小波变换的语音增强方法。
背景技术
语音增强算法基本划分为四类方法,即参数方法、非参数方法、统计方法和其他方法。参数方法多利用语音生成模型的方式进行去噪,例如AR模型,提取模型其中的参数如基音周期、系数等,且往往会采用迭代方法。假如实际噪音或语音条件与模型存在的差距较大或模型参数的提取相对困难,那么这种方法很可能没有效果。非参数方法则不用从带噪语音信号中提取模型参数,因而约束条件比较少,所以非参数方法的使用范围较大,也因为限制比较少,可利用统计信息几乎没有,去噪效果通常不是最优化的。统计方法是基于语音和噪音统计特性的方法,通常需构建模型库,并需在训练过程中获得初始统计参数,同时它与语音识别系统紧密关联。其它方法,如小波滤波去噪法。
使用传统的语音增强算法对环境噪声进行去噪处理时,谱减法适用的信噪比范围相对较小,同时信噪比较低时对语音的可懂度损伤较大,且频谱相减会产生“音乐噪声”;维纳滤波法,对带噪语音增强后信噪比提高通常不明显;谐波增强方法,仅适用于平稳白噪声的去除,当噪声强度较大时,基音周期无法准确估计;MMSE估计方法去噪,该方法的计算量相对较大,且语音频谱先验分布的求取在一定程度上由统计结果的代表性和重现性来决定。小波变换其自身拥有多分辨率分析、多尺度分析、低SNR下仍有效去除噪声、对非平稳信号处理效果相对较好等优点,成为语音增强算法研究热点之一。目前,随着对小波变换语音增强算法的不断研究,小波变换仍还存在着某些缺陷:一是不能较好地反应人耳对信号幅度和频率的听觉特性;二是当语音信号与噪声信号于频谱上相互重叠时,噪声信号不一定会被全部分离出,且语音信号有时也会误被分离出;三是软阈值法过度光滑易让信号失真和硬阈值法去噪效果欠佳。
传统小波变换阈值去噪法,小波变换不能很好地反应人耳对信号幅度和频率的听觉特性;其次,软硬阈值算法中存在固定值偏移、函数不连续、无固定偏差、阈值处收缩效果不明显等特点,以及噪声阈值估计问题,假如阈值估计的较小,去噪算法很大程度上会失效,增强的语音信号中噪声大多会保留;阈值估计的较大,那么语音信号会被错当作噪声处理掉,重构信号时将出现的失真现象等缺点。而且当噪声与语音信号在频谱上相互重叠时,小波变换后噪声信号不一定会被全部分离出,语音信号也不一定会被全部保留。
发明内容
本发明的目的是,为了降低噪声对语音信号的干扰,提高语音信号的信噪比,提出一种基于仿生小波变换的语音增强方法,实现语音信号的增强。
本发明的目的是由以下技术方案来实现的:一种基于仿生小波变换的语音增强方法,其特征是,它包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪,
1)所述构建仿生小波变换阈值函数
为解决阈值函数,包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数与wj,k之间总会产生恒定的偏差,这在很大程度上影响重构信号和真实信号的逼近程度,为此,采用硬阈值函数及软硬阈值折衷函数构造了一种新阈值函数,表达式为:
式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数,但改变了当|wj,k|<λ时,将当前小波系数置为0的缺陷;
①新阈值函数具有连续性
当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
因此,由式(2)和式(3)可以看出,新阈值函数在wj,k=±λ时,函数的值是固定的,因此该函数在wj,k=±λ时是连续的,克服了硬阈值函数在wj,k=±λ时不连续的缺点,改善了硬阈值函数的缺陷;
当|wj,k|≥λ时,新阈值函数
由式(4)和(5)可知,而的阈值函数的数学表达形式为奇函数,所以,仍等于1,因此新阈值函数是以为渐近线的,即随着wj,k的增大,是无限趋近于|wj,k|,因而弥补了估计小波系数与wj,k之间恒定会产生偏差的不足,改善了软阈值函数的缺陷;
2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值
将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取,采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,增强阈值去噪效果,
在人工蜂群算法过程中,种群大小为SN,最大迭代次数为MaxCycle,控制参数为limit,在搜索过程中获得随机初始解xi(i=1,2,…,SN),在搜寻过程中,首先进行初始化种群:
式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,D}及k∈{1,2,…,N}是随机产生的,同时k≠i,
适应度值的表达式为:
其中,fi表示优化问题的目标函数。带噪语音信号增强后的信噪比SNR:
式中,fitnessi表示第i个解对应的适应度值,
当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃,如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源,
xi,j=xminj+rand(0,1)(xmaxj-xminj) (10)
式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,D},然后采蜜蜂继续搜寻过程,重复循环上述过程;
人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:
人工蜂群算法实现步骤为:
(a)采用随机初始化的方法初始化种群,包括种群的大小SN,最大迭代次数(MaxCycle)以及控制参数limit:
(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;
(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数(MaxCycle),并且标记此时的最优蜜源位置;
(f)假如在一只采蜜蜂的位置周围搜索上限达到limit时,仍然未寻找到更优的位置,那么依据式(10)随机获取新解并进行替代;
(z)如果到达最大迭代次数,那么输出此时的最优解,如果没有到达最大迭代次数,则跳转到(b)步骤;
采用人工蜂群算法优化去噪过程中对阈值的选取,在对阈值的选取时,加入调节参数θ,利用人工蜂群算法,对调节参数θ进行寻优处理,优化选取的阈值估计,因此阈值的选取表达式为:
其中,σj为第j层噪声方差;N表示语音信号长度;θ表示语音相关性的调节参数,采用人工蜂群算法来搜索θ的最优解,而后进行阈值的调节,以此来获得更优的阈值估计;
3)所述基于构建新阈值函数和最优阈值实现语音信号去噪
采用分帧的方式处理输入的语音信号,将经过预处理后的语音信号进行小波变换,获得各个尺度的小波系数,然后将小波变换转变为仿生小波变换,获得仿生小波变换系数,对变换后的仿生小波系数实行阈值处理,这里阈值往往取为:
式中,σ是噪声方差,N为语音信号长度,然而,现实操作中噪声方差的确定值是无法获取到的,因而,用式(14)来估计噪声方差值,
其中,MAD表示平均绝对偏差(Mean Absolute Deviation),对噪声方差值的求取,采用第1层分解获取的高频系数cD1,主要取噪声信号系数,其次,每一层可以分别取不同的阈值,即λj,
式中,σ为噪声方差,根据每一层,估计噪声方差:
式中,{dp,i,i=1,2…N/2}表示最高分辨率时的细节信号,基于人工蜂群算法的阈值估计,得:
对于阈值函数采用新阈值函数,进行阈值处理,阈值函数去噪后,将仿生小波系数转换到普通小波域上,然后进行小波逆变换,即重构语音信号,最终得到去噪后语音信号。
本发明的一种基于仿生小波变换的语音增强方法,采用构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪等步骤,能够有效的降低噪声对语音信号的干扰,提高语音信号的信噪比,具有科学合理、结构简单、去噪效果好、适用范围广等优点。
附图说明
图1为基于仿生小波变换阈值去噪方法流程图。
具体实施方式
下面利用附图和具体实施方式对本发明作进一步说明。
参照图1,本发明的基于仿生小波变换的语音增强方法,包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪。
1)所述构建仿生小波变换阈值函数方法
主要是为了解决传统的阈值函数包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数与wj,k之间总会产生恒定的偏差,这在很大程度上影响重构信号和真实信号的逼近程度。为此,采用硬阈值函数及软硬阈值折衷函数构造一种新构造了一种新的新阈值函数,表达式为:
式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数,但改变了当|wj,k|<λ时,将当前小波系数置为0的缺陷。
①新阈值函数具有连续性
当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
因此,由式(2)和式(3)可以看出,新阈值函数在wj,k=±λ时,函数的值是固定的,因此该函数在wj,k=±λ时是连续的,克服了硬阈值函数在wj,k=±λ时不连续的缺点,改善了硬阈值函数的缺陷。
当|wj,k|≥λ时,新阈值函数
由式(4)和(5)可知,而阈值函数的数学表达形式为奇函数,所以,仍等于1,因此新阈值函数是以为渐近线的,即随着wj,k的增大,是无限趋近于|wj,k|,因而弥补了估计小波系数与wj,k之间恒定会产生偏差的不足,改善了软阈值函数的缺陷。
2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值
在阈值去噪的过程中,阈值的如何选取是阈值去噪的核心问题之一,阈值的估计影响着最终对带噪语音信号的去噪效果。如果阈值估计较大,带噪语音信号中的原始语音信号很可能会被误判为噪声信号而被去除掉,导致去噪后语音信号失真严重;如果阈值估计较小,那么带噪语音信号中的噪声信号不能被清除干净,去噪后语音信号存在着大量的噪声信号,导致去噪效果下降。
将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取。采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,增强阈值去噪效果。
在人工蜂群算法过程中,种群大小为SN,最大迭代次数(MaxCycle),控制参数为limit。在搜索过程中获得随机初始解xi(i=1,2,…,SN)。在搜寻过程中,首先进行初始化种群:
式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,D}及k∈{1,2,…,N}是随机产生的,同时k≠i。
适应度值的表达式为:
其中,fi表示优化问题的目标函数。带噪语音信号增强后的信噪比SNR:
式中,fitnessi表示第i个解对应的适应度值。
当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃。如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源。
xi,j=xminj+rand(0,1)(xmaxj-xminj) (10)
式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,D},然后采蜜蜂继续搜寻过程,重复循环上述过程。
人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:
人工蜂群算法实现步骤为:
(a)采用随机初始化的方法初始化种群,包括种群的大小SN,最大迭代次数(MaxCycle)以及控制参数limit:
(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;
(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数(MaxCycle),并且标记此时的最优蜜源位置;
(f)假如在一只采蜜蜂的位置周围搜索上限达到limit时,仍然未寻找到更优的位置,那么依据式(10)随机获取新解并进行替代;
(z)如果到达最大迭代次数,那么输出此时的最优解,如果没有到达最大迭代次数,则跳转到(b)步骤;
采用人工蜂群算法优化去噪过程中对阈值的选取,在对阈值的选取时,加入调节参数θ,利用人工蜂群算法,对调节参数θ进行寻优处理,优化选取的阈值估计,因此阈值的选取表达式为:
其中,σj为第j层噪声方差;N表示语音信号长度;θ表示语音相关性的调节参数,采用人工蜂群算法来搜索θ的最优解,而后进行阈值的调节,以此来获得更优的阈值估计。
3)所述基于构建的新阈值函数和最优阈值实现语音信号去噪
具体过程如下:采用分帧的方式处理输入的语音信号。将经过预处理后的语音信号进行小波变换,获得各个尺度的小波系数,然后将小波变换转变为仿生小波变换,获得仿生小波变换系数。对变换后的仿生小波系数实行阈值处理,这里阈值往往取为:
式中,σ是噪声方差,N为语音信号长度。然而,现实操作中噪声方差的确定值是无法获取到的,因而,用下式来估计噪声方差值。
其中,MAD表示平均绝对偏差(Mean Absolute Deviation),对噪声方差值的求取,采用第1层分解获取的高频系数cD1,主要取噪声信号系数。其次,每一层可以分别取不同的阈值,即λj。
式中,σ为噪声方差。根据每一层,噪声方差可以这样估计:
式中,{dp,i,i=1,2…N/2}表示最高分辨率时的细节信号。基于人工蜂群算法的阈值估计,得:
对于阈值函数采用新阈值函数,进行阈值处理。阈值函数去噪后,将仿生小波系数转换到普通小波域上,然后进行小波逆变换,即重构语音信号,最终得到去噪后语音信号。
本发明的软件程序依据自动化、网络和计算机处理技术编制,是本领域技术人员所熟悉的技术。
Claims (1)
1.一种基于仿生小波变换的语音增强方法,其特征是,它包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪,
1)所述构建仿生小波变换阈值函数
采用硬阈值函数及软硬阈值折衷函数构造一种新阈值函数,表达式为:
式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数;
①新阈值函数具有连续性
当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
所述式(2)和(3)中,函数在wj,k=±λ时的值固定且连续;
当|wj,k|≥λ时,新阈值函数
2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值
将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取,采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,
在人工蜂群算法过程中,种群大小为SN,最大迭代次数MaxCycle,控制参数为limit,在搜索过程中获得随机初始解xi(i=1,2,…,SN),在搜寻过程中,首先进行初始化种群:
式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,D}及k∈{1,2,…,N}是随机产生的,同时k≠i,
适应度值的表达式为:
其中,fi表示优化问题的目标函数;带噪语音信号增强后的信噪比SNR:
式中,fitnessi表示第i个解对应的适应度值,
当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃,如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源,
xi,j=xminj+rand(0,1)(xmaxj-xminj) (10)
式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,D},然后采蜜蜂继续搜寻过程,重复循环上述过程;
人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:
人工蜂群算法实现步骤为:
(a)采用随机初始化的方法初始化种群,包括种群的大小SN,最大迭代次数MaxCycle以及控制参数limit:
(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;
(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数MaxCycle,并且标记此时的最优蜜源位置;
(f)假如在一只采蜜蜂的位置周围搜索上限达到limit时,仍然未寻找到更优的位置,那么依据式(10)随机获取新解并进行替代;
(z)如果到达最大迭代次数,那么输出此时的最优解,如果没有到达最大迭代次数,则跳转到(b)步骤;
采用人工蜂群算法优化去噪过程中对阈值的选取,在对阈值的选取时,加入调节参数θ,利用人工蜂群算法,对调节参数θ进行寻优处理,优化选取的阈值估计,因此阈值的选取表达式为:
其中,σj为第j层噪声方差;N表示语音信号长度;θ表示语音相关性的调节参数,采用人工蜂群算法来搜索θ的最优解,而后进行阈值的调节,以此来获得更优的阈值估计;
3)所述基于构建的新阈值函数和最优阈值实现语音信号去噪
采用分帧的方式处理输入的语音信号,将经过预处理后的语音信号进行小波变换,获得各个尺度的小波系数,然后将小波变换转变为仿生小波变换,获得仿生小波变换系数,对变换后的仿生小波系数实行阈值处理,阈值取为:
式中,σ是噪声方差,N为语音信号长度,用式(14)来估计噪声方差值,
其中,MAD表示平均绝对偏差(Mean Absolute Deviation),对噪声方差值的求取,采用第1层分解获取的高频系数cD1,主要取噪声信号系数,其次,每一层可以分别取不同的阈值,即λj,
式中,σ为噪声方差,根据每一层,估计噪声方差:
式中,{dp,i,i=1,2…N/2}表示最高分辨率时的细节信号,基于人工蜂群算法的阈值估计,得:
对于阈值函数采用新阈值函数,进行阈值处理,阈值函数去噪后,将仿生小波系数转换到普通小波域上,然后进行小波逆变换,即重构语音信号,最终得到去噪后语音信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011128758.5A CN112530449B (zh) | 2020-10-20 | 2020-10-20 | 基于仿生小波变换的语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011128758.5A CN112530449B (zh) | 2020-10-20 | 2020-10-20 | 基于仿生小波变换的语音增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112530449A CN112530449A (zh) | 2021-03-19 |
CN112530449B true CN112530449B (zh) | 2022-09-23 |
Family
ID=74979052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011128758.5A Active CN112530449B (zh) | 2020-10-20 | 2020-10-20 | 基于仿生小波变换的语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112530449B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114091983B (zh) * | 2022-01-21 | 2022-05-10 | 网思科技股份有限公司 | 一种工程车辆智能管理系统 |
CN114757242B (zh) * | 2022-06-16 | 2022-09-23 | 中国空气动力研究与发展中心低速空气动力研究所 | 基于循环维纳滤波的直升机噪声增强方法以及检测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103854264A (zh) * | 2014-03-28 | 2014-06-11 | 中国石油大学(华东) | 一种基于改进型阈值函数的小波变换图像去噪方法 |
CN103901474A (zh) * | 2014-04-18 | 2014-07-02 | 成都新核中创信息科技有限公司 | 一种基于折中小波阈值分析的微地震弱信号提取方法 |
CN104318305A (zh) * | 2014-10-30 | 2015-01-28 | 东北电力大学 | 一种基于小波与神经网络的逆变器低频噪声故障诊断方法 |
CN107274908A (zh) * | 2017-06-13 | 2017-10-20 | 南京邮电大学 | 基于新阈值函数的小波语音去噪方法 |
CN108133466A (zh) * | 2018-01-15 | 2018-06-08 | 集美大学 | 一种改进型自适应小波太赫兹图像去噪方法 |
CN110765834A (zh) * | 2019-08-25 | 2020-02-07 | 青岛科技大学 | 一种基于改进人工蜂群算法的参数小波阈值信号去噪方法 |
CN111681667A (zh) * | 2020-06-23 | 2020-09-18 | 青岛科技大学 | 基于自适应窗口滤波和小波阈值优化的水声信号去噪方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7054454B2 (en) * | 2002-03-29 | 2006-05-30 | Everest Biomedical Instruments Company | Fast wavelet estimation of weak bio-signals using novel algorithms for generating multiple additional data frames |
US7869994B2 (en) * | 2007-01-30 | 2011-01-11 | Qnx Software Systems Co. | Transient noise removal system using wavelets |
-
2020
- 2020-10-20 CN CN202011128758.5A patent/CN112530449B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103854264A (zh) * | 2014-03-28 | 2014-06-11 | 中国石油大学(华东) | 一种基于改进型阈值函数的小波变换图像去噪方法 |
CN103901474A (zh) * | 2014-04-18 | 2014-07-02 | 成都新核中创信息科技有限公司 | 一种基于折中小波阈值分析的微地震弱信号提取方法 |
CN104318305A (zh) * | 2014-10-30 | 2015-01-28 | 东北电力大学 | 一种基于小波与神经网络的逆变器低频噪声故障诊断方法 |
CN107274908A (zh) * | 2017-06-13 | 2017-10-20 | 南京邮电大学 | 基于新阈值函数的小波语音去噪方法 |
CN108133466A (zh) * | 2018-01-15 | 2018-06-08 | 集美大学 | 一种改进型自适应小波太赫兹图像去噪方法 |
CN110765834A (zh) * | 2019-08-25 | 2020-02-07 | 青岛科技大学 | 一种基于改进人工蜂群算法的参数小波阈值信号去噪方法 |
CN111681667A (zh) * | 2020-06-23 | 2020-09-18 | 青岛科技大学 | 基于自适应窗口滤波和小波阈值优化的水声信号去噪方法 |
Non-Patent Citations (4)
Title |
---|
"Research on adaptive image based on wavelet transform";Ning-Ling Wang;《Proceedings of 2004 Internationtal Conference on Machine Learning and Cybernetics》;20050131;全文 * |
"一种改进小波阈值函数的图像去噪方法研究";周峡 等;《南京工程学院学报(自然科学版)》;20190430;全文 * |
"基于改进阈值函数小波的微电网检测信号去噪";邓鹏 等;《电测与仪表》;20210615;全文 * |
"基于改进阈值函数的小波变换图像去噪算法";张绘娟;《计算机应用研究》;20200531;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112530449A (zh) | 2021-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108765319B (zh) | 一种基于生成对抗网络的图像去噪方法 | |
CN111307453B (zh) | 一种基于多信息融合的传动系统故障诊断方法 | |
CN103049892B (zh) | 基于相似块矩阵秩最小化的非局部图像去噪方法 | |
CN112530449B (zh) | 基于仿生小波变换的语音增强方法 | |
WO2019232846A1 (zh) | 语音区分方法、装置、计算机设备及存储介质 | |
CN110490816B (zh) | 一种水下异构信息数据降噪方法 | |
Liu et al. | The classification and denoising of image noise based on deep neural networks | |
Paul et al. | Modified convolutional neural network with pseudo-CNN for removing nonlinear noise in digital images | |
Qi et al. | Research on the image segmentation of icing line based on NSCT and 2-D OSTU | |
CN114283829B (zh) | 一种基于动态门控卷积循环网络的语音增强方法 | |
CN112331232B (zh) | 一种结合cgan谱图去噪和双边滤波谱图增强的语音情感识别方法 | |
Wang et al. | An adaptive learning image denoising algorithm based on eigenvalue extraction and the GAN model | |
Yang et al. | GAN-based sample expansion for underwater acoustic signal | |
CN113378673B (zh) | 一种基于一致性正则化的半监督脑电信号分类方法 | |
CN116013339A (zh) | 一种基于改进crn的单通道语音增强方法 | |
Ruikai | Research progress in image denoising algorithms based on deep learning | |
CN113066483B (zh) | 一种基于稀疏连续约束的生成对抗网络语音增强方法 | |
CN113553917A (zh) | 一种基于脉冲迁移学习的办公设备识别方法 | |
CN112907456A (zh) | 基于全局平滑约束先验模型的深度神经网络图像去噪方法 | |
CN115457611B (zh) | 一种基于特征解耦网络的静脉识别方法 | |
CN117974736B (zh) | 一种基于机器学习的水下传感器输出信号降噪方法及系统 | |
Cai et al. | Image filtering method using trimmed statistics and edge preserving | |
Nagendra et al. | A Novel approach to denoise an image using CNN | |
CN118013204B (zh) | 雷达调制信号时频图像去噪的方法及装置 | |
Wen et al. | Overview of traditional denoising and deep learning-based denoising |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |