CN112530449B - 基于仿生小波变换的语音增强方法 - Google Patents

基于仿生小波变换的语音增强方法 Download PDF

Info

Publication number
CN112530449B
CN112530449B CN202011128758.5A CN202011128758A CN112530449B CN 112530449 B CN112530449 B CN 112530449B CN 202011128758 A CN202011128758 A CN 202011128758A CN 112530449 B CN112530449 B CN 112530449B
Authority
CN
China
Prior art keywords
threshold
function
new
honey source
bionic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011128758.5A
Other languages
English (en)
Other versions
CN112530449A (zh
Inventor
张世强
王鸿飞
李俐欣
张婷娟
黄雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yichun Power Supply Co Of State Grid Heilongjiang Electric Power Co ltd
State Grid Corp of China SGCC
Northeast Electric Power University
Original Assignee
Yichun Power Supply Co Of State Grid Heilongjiang Electric Power Co ltd
State Grid Corp of China SGCC
Northeast Dianli University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yichun Power Supply Co Of State Grid Heilongjiang Electric Power Co ltd, State Grid Corp of China SGCC, Northeast Dianli University filed Critical Yichun Power Supply Co Of State Grid Heilongjiang Electric Power Co ltd
Priority to CN202011128758.5A priority Critical patent/CN112530449B/zh
Publication of CN112530449A publication Critical patent/CN112530449A/zh
Application granted granted Critical
Publication of CN112530449B publication Critical patent/CN112530449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/0332Details of processing therefor involving modification of waveforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)

Abstract

本发明的一种基于仿生小波变换的语音增强方法,采用构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪等步骤,能够有效的降低噪声对语音信号的干扰,提高语音信号的信噪比,具有科学合理、结构简单、去噪效果好、适用范围广等优点。

Description

基于仿生小波变换的语音增强方法
技术领域
本发明属于语音信号处理技术领域,涉及一种基于仿生小波变换的语音增强方法。
背景技术
语音增强算法基本划分为四类方法,即参数方法、非参数方法、统计方法和其他方法。参数方法多利用语音生成模型的方式进行去噪,例如AR模型,提取模型其中的参数如基音周期、系数等,且往往会采用迭代方法。假如实际噪音或语音条件与模型存在的差距较大或模型参数的提取相对困难,那么这种方法很可能没有效果。非参数方法则不用从带噪语音信号中提取模型参数,因而约束条件比较少,所以非参数方法的使用范围较大,也因为限制比较少,可利用统计信息几乎没有,去噪效果通常不是最优化的。统计方法是基于语音和噪音统计特性的方法,通常需构建模型库,并需在训练过程中获得初始统计参数,同时它与语音识别系统紧密关联。其它方法,如小波滤波去噪法。
使用传统的语音增强算法对环境噪声进行去噪处理时,谱减法适用的信噪比范围相对较小,同时信噪比较低时对语音的可懂度损伤较大,且频谱相减会产生“音乐噪声”;维纳滤波法,对带噪语音增强后信噪比提高通常不明显;谐波增强方法,仅适用于平稳白噪声的去除,当噪声强度较大时,基音周期无法准确估计;MMSE估计方法去噪,该方法的计算量相对较大,且语音频谱先验分布的求取在一定程度上由统计结果的代表性和重现性来决定。小波变换其自身拥有多分辨率分析、多尺度分析、低SNR下仍有效去除噪声、对非平稳信号处理效果相对较好等优点,成为语音增强算法研究热点之一。目前,随着对小波变换语音增强算法的不断研究,小波变换仍还存在着某些缺陷:一是不能较好地反应人耳对信号幅度和频率的听觉特性;二是当语音信号与噪声信号于频谱上相互重叠时,噪声信号不一定会被全部分离出,且语音信号有时也会误被分离出;三是软阈值法过度光滑易让信号失真和硬阈值法去噪效果欠佳。
传统小波变换阈值去噪法,小波变换不能很好地反应人耳对信号幅度和频率的听觉特性;其次,软硬阈值算法中存在固定值偏移、函数不连续、无固定偏差、阈值处收缩效果不明显等特点,以及噪声阈值估计问题,假如阈值估计的较小,去噪算法很大程度上会失效,增强的语音信号中噪声大多会保留;阈值估计的较大,那么语音信号会被错当作噪声处理掉,重构信号时将出现的失真现象等缺点。而且当噪声与语音信号在频谱上相互重叠时,小波变换后噪声信号不一定会被全部分离出,语音信号也不一定会被全部保留。
发明内容
本发明的目的是,为了降低噪声对语音信号的干扰,提高语音信号的信噪比,提出一种基于仿生小波变换的语音增强方法,实现语音信号的增强。
本发明的目的是由以下技术方案来实现的:一种基于仿生小波变换的语音增强方法,其特征是,它包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪,
1)所述构建仿生小波变换阈值函数
为解决阈值函数,包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数
Figure BDA0002734385130000024
与wj,k之间总会产生恒定的偏差,这在很大程度上影响重构信号和真实信号的逼近程度,为此,采用硬阈值函数及软硬阈值折衷函数构造了一种新阈值函数,表达式为:
Figure BDA0002734385130000021
式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数,但改变了当|wj,k|<λ时,将当前小波系数置为0的缺陷;
①新阈值函数具有连续性
当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
Figure BDA0002734385130000022
当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
Figure BDA0002734385130000023
因此,由式(2)和式(3)可以看出,新阈值函数在wj,k=±λ时,函数的值是固定的,因此该函数在wj,k=±λ时是连续的,克服了硬阈值函数在wj,k=±λ时不连续的缺点,改善了硬阈值函数的缺陷;
②新阈值函数的渐进线为
Figure BDA0002734385130000031
当|wj,k|≥λ时,新阈值函数
Figure BDA0002734385130000032
当|wj,k|≥λ时,
Figure BDA0002734385130000033
Figure BDA0002734385130000034
由式(4)和(5)可知,
Figure BDA0002734385130000035
而的阈值函数的数学表达形式为奇函数,所以,
Figure BDA0002734385130000036
仍等于1,因此新阈值函数是以
Figure BDA0002734385130000037
为渐近线的,即随着wj,k的增大,
Figure BDA0002734385130000038
是无限趋近于|wj,k|,因而弥补了估计小波系数
Figure BDA0002734385130000039
与wj,k之间恒定会产生偏差的不足,改善了软阈值函数的缺陷;
2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值
将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取,采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,增强阈值去噪效果,
在人工蜂群算法过程中,种群大小为SN,最大迭代次数为MaxCycle,控制参数为limit,在搜索过程中获得随机初始解xi(i=1,2,…,SN),在搜寻过程中,首先进行初始化种群:
Figure BDA00027343851300000310
式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,D}及k∈{1,2,…,N}是随机产生的,同时k≠i,
适应度值的表达式为:
Figure BDA00027343851300000311
其中,fi表示优化问题的目标函数。带噪语音信号增强后的信噪比SNR:
Figure BDA0002734385130000041
式中,N表示语音信号长度;y(t)和
Figure BDA0002734385130000042
分别表示去噪后的语音信号和带噪语音信号侦察蜂选择蜜源的概率计算:
Figure BDA0002734385130000043
式中,fitnessi表示第i个解对应的适应度值,
当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃,如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源,
xi,j=xminj+rand(0,1)(xmaxj-xminj) (10)
式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,D},然后采蜜蜂继续搜寻过程,重复循环上述过程;
人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:
Figure BDA0002734385130000044
人工蜂群算法实现步骤为:
(a)采用随机初始化的方法初始化种群,包括种群的大小SN,最大迭代次数(MaxCycle)以及控制参数limit:
(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;
(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数(MaxCycle),并且标记此时的最优蜜源位置;
(f)假如在一只采蜜蜂的位置周围搜索上限达到limit时,仍然未寻找到更优的位置,那么依据式(10)随机获取新解并进行替代;
(z)如果到达最大迭代次数,那么输出此时的最优解,如果没有到达最大迭代次数,则跳转到(b)步骤;
采用人工蜂群算法优化去噪过程中对阈值的选取,在对阈值的选取时,加入调节参数θ,利用人工蜂群算法,对调节参数θ进行寻优处理,优化选取的阈值估计,因此阈值的选取表达式为:
Figure BDA0002734385130000051
其中,σj为第j层噪声方差;N表示语音信号长度;θ表示语音相关性的调节参数,采用人工蜂群算法来搜索θ的最优解,而后进行阈值的调节,以此来获得更优的阈值估计;
3)所述基于构建新阈值函数和最优阈值实现语音信号去噪
采用分帧的方式处理输入的语音信号,将经过预处理后的语音信号进行小波变换,获得各个尺度的小波系数,然后将小波变换转变为仿生小波变换,获得仿生小波变换系数,对变换后的仿生小波系数实行阈值处理,这里阈值往往取为:
Figure BDA0002734385130000052
式中,σ是噪声方差,N为语音信号长度,然而,现实操作中噪声方差的确定值是无法获取到的,因而,用式(14)来估计噪声方差值,
Figure BDA0002734385130000053
其中,MAD表示平均绝对偏差(Mean Absolute Deviation),对噪声方差值的求取,采用第1层分解获取的高频系数cD1,主要取噪声信号系数,其次,每一层可以分别取不同的阈值,即λj
Figure BDA0002734385130000054
式中,σ为噪声方差,根据每一层,估计噪声方差:
Figure BDA0002734385130000055
式中,{dp,i,i=1,2…N/2}表示最高分辨率时的细节信号,基于人工蜂群算法的阈值估计,得:
Figure BDA0002734385130000056
对于阈值函数采用新阈值函数,进行阈值处理,阈值函数去噪后,将仿生小波系数转换到普通小波域上,然后进行小波逆变换,即重构语音信号,最终得到去噪后语音信号。
本发明的一种基于仿生小波变换的语音增强方法,采用构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪等步骤,能够有效的降低噪声对语音信号的干扰,提高语音信号的信噪比,具有科学合理、结构简单、去噪效果好、适用范围广等优点。
附图说明
图1为基于仿生小波变换阈值去噪方法流程图。
具体实施方式
下面利用附图和具体实施方式对本发明作进一步说明。
参照图1,本发明的基于仿生小波变换的语音增强方法,包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪。
1)所述构建仿生小波变换阈值函数方法
主要是为了解决传统的阈值函数包括软阈值函数、硬阈值函数在处理信号时存在着固有的缺点,硬阈值函数在阈值处存在着不连续的问题,而软阈值函数虽改善了平滑性,但其估计小波系数
Figure BDA0002734385130000061
与wj,k之间总会产生恒定的偏差,这在很大程度上影响重构信号和真实信号的逼近程度。为此,采用硬阈值函数及软硬阈值折衷函数构造一种新构造了一种新的新阈值函数,表达式为:
Figure BDA0002734385130000062
式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数,但改变了当|wj,k|<λ时,将当前小波系数置为0的缺陷。
①新阈值函数具有连续性
当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
Figure BDA0002734385130000071
当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
Figure BDA0002734385130000072
因此,由式(2)和式(3)可以看出,新阈值函数在wj,k=±λ时,函数的值是固定的,因此该函数在wj,k=±λ时是连续的,克服了硬阈值函数在wj,k=±λ时不连续的缺点,改善了硬阈值函数的缺陷。
②新阈值函数的渐进线为
Figure BDA0002734385130000073
当|wj,k|≥λ时,新阈值函数
Figure BDA0002734385130000074
当|wj,k|≥λ时,
Figure BDA0002734385130000075
Figure BDA0002734385130000076
由式(4)和(5)可知,
Figure BDA0002734385130000077
而阈值函数的数学表达形式为奇函数,所以,
Figure BDA0002734385130000078
仍等于1,因此新阈值函数是以
Figure BDA0002734385130000079
为渐近线的,即随着wj,k的增大,
Figure BDA00027343851300000710
是无限趋近于|wj,k|,因而弥补了估计小波系数
Figure BDA00027343851300000711
与wj,k之间恒定会产生偏差的不足,改善了软阈值函数的缺陷。
2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值
在阈值去噪的过程中,阈值的如何选取是阈值去噪的核心问题之一,阈值的估计影响着最终对带噪语音信号的去噪效果。如果阈值估计较大,带噪语音信号中的原始语音信号很可能会被误判为噪声信号而被去除掉,导致去噪后语音信号失真严重;如果阈值估计较小,那么带噪语音信号中的噪声信号不能被清除干净,去噪后语音信号存在着大量的噪声信号,导致去噪效果下降。
将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取。采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,增强阈值去噪效果。
在人工蜂群算法过程中,种群大小为SN,最大迭代次数(MaxCycle),控制参数为limit。在搜索过程中获得随机初始解xi(i=1,2,…,SN)。在搜寻过程中,首先进行初始化种群:
Figure BDA0002734385130000081
式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,D}及k∈{1,2,…,N}是随机产生的,同时k≠i。
适应度值的表达式为:
Figure BDA0002734385130000082
其中,fi表示优化问题的目标函数。带噪语音信号增强后的信噪比SNR:
Figure BDA0002734385130000083
式中,N表示语音信号长度;y(t)和
Figure BDA0002734385130000084
分别表示去噪后的语音信号和带噪语音信号侦察蜂选择蜜源的概率计算:
Figure BDA0002734385130000085
式中,fitnessi表示第i个解对应的适应度值。
当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃。如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源。
xi,j=xminj+rand(0,1)(xmaxj-xminj) (10)
式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,D},然后采蜜蜂继续搜寻过程,重复循环上述过程。
人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:
Figure BDA0002734385130000091
人工蜂群算法实现步骤为:
(a)采用随机初始化的方法初始化种群,包括种群的大小SN,最大迭代次数(MaxCycle)以及控制参数limit:
(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;
(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数(MaxCycle),并且标记此时的最优蜜源位置;
(f)假如在一只采蜜蜂的位置周围搜索上限达到limit时,仍然未寻找到更优的位置,那么依据式(10)随机获取新解并进行替代;
(z)如果到达最大迭代次数,那么输出此时的最优解,如果没有到达最大迭代次数,则跳转到(b)步骤;
采用人工蜂群算法优化去噪过程中对阈值的选取,在对阈值的选取时,加入调节参数θ,利用人工蜂群算法,对调节参数θ进行寻优处理,优化选取的阈值估计,因此阈值的选取表达式为:
Figure BDA0002734385130000092
其中,σj为第j层噪声方差;N表示语音信号长度;θ表示语音相关性的调节参数,采用人工蜂群算法来搜索θ的最优解,而后进行阈值的调节,以此来获得更优的阈值估计。
3)所述基于构建的新阈值函数和最优阈值实现语音信号去噪
具体过程如下:采用分帧的方式处理输入的语音信号。将经过预处理后的语音信号进行小波变换,获得各个尺度的小波系数,然后将小波变换转变为仿生小波变换,获得仿生小波变换系数。对变换后的仿生小波系数实行阈值处理,这里阈值往往取为:
Figure BDA0002734385130000101
式中,σ是噪声方差,N为语音信号长度。然而,现实操作中噪声方差的确定值是无法获取到的,因而,用下式来估计噪声方差值。
Figure BDA0002734385130000102
其中,MAD表示平均绝对偏差(Mean Absolute Deviation),对噪声方差值的求取,采用第1层分解获取的高频系数cD1,主要取噪声信号系数。其次,每一层可以分别取不同的阈值,即λj
Figure BDA0002734385130000103
式中,σ为噪声方差。根据每一层,噪声方差可以这样估计:
Figure BDA0002734385130000104
式中,{dp,i,i=1,2…N/2}表示最高分辨率时的细节信号。基于人工蜂群算法的阈值估计,得:
Figure BDA0002734385130000105
对于阈值函数采用新阈值函数,进行阈值处理。阈值函数去噪后,将仿生小波系数转换到普通小波域上,然后进行小波逆变换,即重构语音信号,最终得到去噪后语音信号。
本发明的软件程序依据自动化、网络和计算机处理技术编制,是本领域技术人员所熟悉的技术。

Claims (1)

1.一种基于仿生小波变换的语音增强方法,其特征是,它包括的内容有:构建仿生小波变换阈值函数,采用人工蜂群算法寻找最优阈值,利用构建的新阈值函数和最优阈值实现语音信号去噪,
1)所述构建仿生小波变换阈值函数
采用硬阈值函数及软硬阈值折衷函数构造一种新阈值函数,表达式为:
Figure FDA0003729559040000011
式中,α表示调节参数,α∈[0,0.5],当α=0时,新阈值函数近似为硬阈值函数,当α=0.5时,新阈值函数接近于软硬阈值折衷函数;
①新阈值函数具有连续性
当函数的定义域|wj,k|>λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
Figure FDA0003729559040000012
当函数的定义域|wj,k|<λ,新阈值函数|wj,k|→λ,即wj,k无限逼近于λ时
Figure FDA0003729559040000013
所述式(2)和(3)中,函数在wj,k=±λ时的值固定且连续;
②新阈值函数的渐进线为
Figure FDA0003729559040000014
当|wj,k|≥λ时,新阈值函数
Figure FDA0003729559040000015
当|wj,k|≥λ时,
Figure FDA0003729559040000016
Figure FDA0003729559040000017
所述式(4)和(5)中,
Figure FDA0003729559040000021
阈值函数为奇函数,阈值函数以
Figure FDA0003729559040000022
为渐近线,随着wj,k的增大
Figure FDA0003729559040000023
无限趋近于|wj,k|;
2)所述采用人工蜂群算法寻找小波仿生变换的最优阈值
将人工蜂群算法应用到语音信号阈值去噪的过程中,通过对阈值选取过程中增加调节参数,优化阈值的选取,采用人工蜂群算法最优蜜源搜索来求解优化问题,同时结合阈值去噪的特性,依照适应度函数获取适应度最优的参数,
在人工蜂群算法过程中,种群大小为SN,最大迭代次数MaxCycle,控制参数为limit,在搜索过程中获得随机初始解xi(i=1,2,…,SN),在搜寻过程中,首先进行初始化种群:
Figure FDA0003729559040000024
式中,vi,j和xi,j分别为采蜜蜂搜索的前后位置,i为第i个蜜源,j∈{1,2,…,D}及k∈{1,2,…,N}是随机产生的,同时k≠i,
适应度值的表达式为:
Figure FDA0003729559040000025
其中,fi表示优化问题的目标函数;带噪语音信号增强后的信噪比SNR:
Figure FDA0003729559040000026
式中,N表示语音信号长度;y(t)和
Figure FDA0003729559040000027
分别表示去噪后的语音信号和带噪语音信号侦察蜂选择蜜源的概率计算:
Figure FDA0003729559040000028
式中,fitnessi表示第i个解对应的适应度值,
当全部的观察蜂搜索完毕之后,判断这个解经历limit次循环后是否被更新,如果未被更新,那么此蜜源被舍弃,如果舍弃蜜源xi,那么该蜜源对应的采蜜蜂变化为侦察蜂,侦察蜂此时寻觅新的蜜源替代旧的蜜源,
xi,j=xminj+rand(0,1)(xmaxj-xminj) (10)
式中,xmaxj和xminj分别表示维度j的上界和下界,j∈{1,2,…,D},然后采蜜蜂继续搜寻过程,重复循环上述过程;
人工蜂群算法对食物源评价是采用贪婪选择的方法,表示为:
Figure FDA0003729559040000031
人工蜂群算法实现步骤为:
(a)采用随机初始化的方法初始化种群,包括种群的大小SN,最大迭代次数MaxCycle以及控制参数limit:
(b)通过式(7)采蜜蜂从相邻的域找寻新解和计算新解的适应度值,标记适应度值大的个体,而通过式(11)实行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(c)依据式(9)观察蜂选择一个蜜源位置,在此蜜源位置进行采蜜并侦察新的蜜源位置,仿照(b)步骤,标记适应度值大的个体,而后进行贪婪选择,在新蜜源和旧蜜源中选择更好的那一个;
(d)判断采蜜蜂和观察蜂的查找次数是否超出规定上限limit,若超过,则淘汰该蜜源,其对应的采蜜蜂或者观察蜂转换为侦查蜂,并依照式(6)随机产生一个新的蜜源,以新蜜源来代替旧蜜源;
(e)标记这时获取的最好的蜜源位置,同时转到(b)步骤,直至到达最大迭代次数MaxCycle,并且标记此时的最优蜜源位置;
(f)假如在一只采蜜蜂的位置周围搜索上限达到limit时,仍然未寻找到更优的位置,那么依据式(10)随机获取新解并进行替代;
(z)如果到达最大迭代次数,那么输出此时的最优解,如果没有到达最大迭代次数,则跳转到(b)步骤;
采用人工蜂群算法优化去噪过程中对阈值的选取,在对阈值的选取时,加入调节参数θ,利用人工蜂群算法,对调节参数θ进行寻优处理,优化选取的阈值估计,因此阈值的选取表达式为:
Figure FDA0003729559040000032
其中,σj为第j层噪声方差;N表示语音信号长度;θ表示语音相关性的调节参数,采用人工蜂群算法来搜索θ的最优解,而后进行阈值的调节,以此来获得更优的阈值估计;
3)所述基于构建的新阈值函数和最优阈值实现语音信号去噪
采用分帧的方式处理输入的语音信号,将经过预处理后的语音信号进行小波变换,获得各个尺度的小波系数,然后将小波变换转变为仿生小波变换,获得仿生小波变换系数,对变换后的仿生小波系数实行阈值处理,阈值取为:
Figure FDA0003729559040000041
式中,σ是噪声方差,N为语音信号长度,用式(14)来估计噪声方差值,
Figure FDA0003729559040000042
其中,MAD表示平均绝对偏差(Mean Absolute Deviation),对噪声方差值的求取,采用第1层分解获取的高频系数cD1,主要取噪声信号系数,其次,每一层可以分别取不同的阈值,即λj
Figure FDA0003729559040000043
式中,σ为噪声方差,根据每一层,估计噪声方差:
Figure FDA0003729559040000044
式中,{dp,i,i=1,2…N/2}表示最高分辨率时的细节信号,基于人工蜂群算法的阈值估计,得:
Figure FDA0003729559040000045
对于阈值函数采用新阈值函数,进行阈值处理,阈值函数去噪后,将仿生小波系数转换到普通小波域上,然后进行小波逆变换,即重构语音信号,最终得到去噪后语音信号。
CN202011128758.5A 2020-10-20 2020-10-20 基于仿生小波变换的语音增强方法 Active CN112530449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011128758.5A CN112530449B (zh) 2020-10-20 2020-10-20 基于仿生小波变换的语音增强方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011128758.5A CN112530449B (zh) 2020-10-20 2020-10-20 基于仿生小波变换的语音增强方法

Publications (2)

Publication Number Publication Date
CN112530449A CN112530449A (zh) 2021-03-19
CN112530449B true CN112530449B (zh) 2022-09-23

Family

ID=74979052

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011128758.5A Active CN112530449B (zh) 2020-10-20 2020-10-20 基于仿生小波变换的语音增强方法

Country Status (1)

Country Link
CN (1) CN112530449B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114091983B (zh) * 2022-01-21 2022-05-10 网思科技股份有限公司 一种工程车辆智能管理系统
CN114757242B (zh) * 2022-06-16 2022-09-23 中国空气动力研究与发展中心低速空气动力研究所 基于循环维纳滤波的直升机噪声增强方法以及检测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103854264A (zh) * 2014-03-28 2014-06-11 中国石油大学(华东) 一种基于改进型阈值函数的小波变换图像去噪方法
CN103901474A (zh) * 2014-04-18 2014-07-02 成都新核中创信息科技有限公司 一种基于折中小波阈值分析的微地震弱信号提取方法
CN104318305A (zh) * 2014-10-30 2015-01-28 东北电力大学 一种基于小波与神经网络的逆变器低频噪声故障诊断方法
CN107274908A (zh) * 2017-06-13 2017-10-20 南京邮电大学 基于新阈值函数的小波语音去噪方法
CN108133466A (zh) * 2018-01-15 2018-06-08 集美大学 一种改进型自适应小波太赫兹图像去噪方法
CN110765834A (zh) * 2019-08-25 2020-02-07 青岛科技大学 一种基于改进人工蜂群算法的参数小波阈值信号去噪方法
CN111681667A (zh) * 2020-06-23 2020-09-18 青岛科技大学 基于自适应窗口滤波和小波阈值优化的水声信号去噪方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7054454B2 (en) * 2002-03-29 2006-05-30 Everest Biomedical Instruments Company Fast wavelet estimation of weak bio-signals using novel algorithms for generating multiple additional data frames
US7869994B2 (en) * 2007-01-30 2011-01-11 Qnx Software Systems Co. Transient noise removal system using wavelets

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103854264A (zh) * 2014-03-28 2014-06-11 中国石油大学(华东) 一种基于改进型阈值函数的小波变换图像去噪方法
CN103901474A (zh) * 2014-04-18 2014-07-02 成都新核中创信息科技有限公司 一种基于折中小波阈值分析的微地震弱信号提取方法
CN104318305A (zh) * 2014-10-30 2015-01-28 东北电力大学 一种基于小波与神经网络的逆变器低频噪声故障诊断方法
CN107274908A (zh) * 2017-06-13 2017-10-20 南京邮电大学 基于新阈值函数的小波语音去噪方法
CN108133466A (zh) * 2018-01-15 2018-06-08 集美大学 一种改进型自适应小波太赫兹图像去噪方法
CN110765834A (zh) * 2019-08-25 2020-02-07 青岛科技大学 一种基于改进人工蜂群算法的参数小波阈值信号去噪方法
CN111681667A (zh) * 2020-06-23 2020-09-18 青岛科技大学 基于自适应窗口滤波和小波阈值优化的水声信号去噪方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Research on adaptive image based on wavelet transform";Ning-Ling Wang;《Proceedings of 2004 Internationtal Conference on Machine Learning and Cybernetics》;20050131;全文 *
"一种改进小波阈值函数的图像去噪方法研究";周峡 等;《南京工程学院学报(自然科学版)》;20190430;全文 *
"基于改进阈值函数小波的微电网检测信号去噪";邓鹏 等;《电测与仪表》;20210615;全文 *
"基于改进阈值函数的小波变换图像去噪算法";张绘娟;《计算机应用研究》;20200531;全文 *

Also Published As

Publication number Publication date
CN112530449A (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN108765319B (zh) 一种基于生成对抗网络的图像去噪方法
CN111307453B (zh) 一种基于多信息融合的传动系统故障诊断方法
CN103049892B (zh) 基于相似块矩阵秩最小化的非局部图像去噪方法
CN112530449B (zh) 基于仿生小波变换的语音增强方法
WO2019232846A1 (zh) 语音区分方法、装置、计算机设备及存储介质
CN110490816B (zh) 一种水下异构信息数据降噪方法
Liu et al. The classification and denoising of image noise based on deep neural networks
Paul et al. Modified convolutional neural network with pseudo-CNN for removing nonlinear noise in digital images
Qi et al. Research on the image segmentation of icing line based on NSCT and 2-D OSTU
CN114283829B (zh) 一种基于动态门控卷积循环网络的语音增强方法
CN112331232B (zh) 一种结合cgan谱图去噪和双边滤波谱图增强的语音情感识别方法
Wang et al. An adaptive learning image denoising algorithm based on eigenvalue extraction and the GAN model
Yang et al. GAN-based sample expansion for underwater acoustic signal
CN113378673B (zh) 一种基于一致性正则化的半监督脑电信号分类方法
CN116013339A (zh) 一种基于改进crn的单通道语音增强方法
Ruikai Research progress in image denoising algorithms based on deep learning
CN113066483B (zh) 一种基于稀疏连续约束的生成对抗网络语音增强方法
CN113553917A (zh) 一种基于脉冲迁移学习的办公设备识别方法
CN112907456A (zh) 基于全局平滑约束先验模型的深度神经网络图像去噪方法
CN115457611B (zh) 一种基于特征解耦网络的静脉识别方法
CN117974736B (zh) 一种基于机器学习的水下传感器输出信号降噪方法及系统
Cai et al. Image filtering method using trimmed statistics and edge preserving
Nagendra et al. A Novel approach to denoise an image using CNN
CN118013204B (zh) 雷达调制信号时频图像去噪的方法及装置
Wen et al. Overview of traditional denoising and deep learning-based denoising

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant