CN101625869A - 一种基于小波包能量的非空气传导语音增强方法 - Google Patents
一种基于小波包能量的非空气传导语音增强方法 Download PDFInfo
- Publication number
- CN101625869A CN101625869A CN200910023557A CN200910023557A CN101625869A CN 101625869 A CN101625869 A CN 101625869A CN 200910023557 A CN200910023557 A CN 200910023557A CN 200910023557 A CN200910023557 A CN 200910023557A CN 101625869 A CN101625869 A CN 101625869A
- Authority
- CN
- China
- Prior art keywords
- wavelet
- coefficient
- packet
- subband
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
一种基于小波包能量的非空气传导语音增强方法,在应用小波包分析技术对语音信号进行分解与重构的基础上,对分解后的小波包系数从尺度和时间两方面进行阈值自适应调节,再对此系数进行重构以实现语音信号的噪声自适应消除,从而实现算法的有效性和较强的针对性。采用这种方法的实例表明,这种新型非空气传导语音增强方法能够有效弥补传统语音增强方法针对性不强的弱点,且执行效率高,效果明显,因此具有较强的实用价值和应用前景。
Description
技术领域
本发明属于语音信号的探测与采集及语音增强技术领域,特别涉及一种基于小波包能量的非空气传导语音增强方法。
背景技术
语音的非空气传导探测技术是指利用除空气以外的其它介质来传导声音。大量的实验数据表明,采用雷达波探测出来的语音信号干扰成分,要比采用普通声学传感器复杂得多。其干扰主要来自以下几个方面:(a)目标说话时的体动干扰。如说话时的头部运动、手势、口唇运动、心跳、呼吸等;(b)雷达波的各次谐波、信道噪声及语音探测系统硬件本身的附加噪声;(c)外界环境噪声的干扰,这些噪声信号成份复杂,幅度更强,且多与语音信号频谱相混叠,严重影响了语音信号的质量。因此,对于在对所采集雷达语音信号进行特性分析的基础上,有针对性地进行语音的去噪增强,也是一项十分重要的工作。
发明内容
本发明的目的在于基于非空气传导语音存在的缺陷与不足,提供一种基于小波包能量的非空气传导语音增强方法,该方法能够弥补传统语音增强方法针对性不强的弱点,且执行效率高,效果明显,因此具有较强的实用价值和应用前景。
为达到上述目的,本发明采用的技术方案是:
1)首先,对雷达非空气传导的语音信号采样并做A/D转换,进行数字化处理得到带噪语音信号,其采样速率为5KHz~20KHz;
2)其次,对带噪语音信号进行小波包分解;
3)然后,分别基于尺度和时间计算小波包系数的自适应阈值;
4)最后,利用自适应阈值进行小波包系数更新,并进行小波包重构以恢复增强后的语音信号。
所说的对带噪语音信号进行小波包分解的步骤如下:
设带噪语音信号y(n)由纯净语音信号s(n)与噪声信号d(n)叠加而成,即:
y(n)=s(n)+d(n) (1)
选择小波函数,对带噪语音信号y(n)经j层小波包变换后得到2j个子带小波系数,j≥1,其中第k个子带中第m个小波系数值为wk,m j,并将小波分阶层数设为4层,
所说的基于尺度和时间计算小波包系数自适应阈值的方法如下:
1)首先,计算全局小波消噪阈值λ,其计算公式为:
式中σ为噪声信号的噪声水平,N为噪声信号的信号长度,MAD为小波系数绝对值的中值,MAD的取值由第1个尺度小波系数得到,将以上公式扩展至小波包变换,即得到基于尺度的自适应阈值,其中小波包变换第k个子带的阈值λk为:
式中σk为第k个子带的噪声水平,Nk为第k个子带的信号长度,MADk为第k个子带小波系数wk,m j绝对值的中值;
其次,根据以下公式得到小波包系数的Teager能量tk,m j:
经过Teager能量计算后采用二阶低通巴特沃思IIR滤波器hk(m)对Teager能量滤波并归一化,得到时间自适应掩模Mk,m j:
由于含有语音成分的帧其Teager能量值波动较大,因此对第k个子带Teager能量掩模Mk,m j分帧并作直方图分析,根据当前帧Mk,m j的偏移值Sk j区分语音帧和噪声帧;
上式中H表示Mk,m j的直方图分布,abscissa[·]函数表示直方图分布最大值的横坐标值,即Teager能量最集中的值,若 则第k个子带当前帧为语音帧,利用Sk j对Mk,m j进行修正即可得到最终的时间自适应阈值M′k,m j:
最后,利用式(8)得到的时间自适应阈值对式(4)得到的尺度自适应阈值进行修正,即可得到第k个子带的时间-尺度自适应阈值λk,m:
根据小波阈值消噪原理,将由上式计算得到的阈值代入软阈值消噪公式,
本发明应用小波包分析技术对语音信号进行分解与重构的基础上,对分解后的小波包系数从尺度和时间两方面进行阈值自适应调节,再对此系数进行重构以实现语音信号的噪声自适应消除,从而实现算法的有效性和较强的针对性。采用这种方法的实例表明,这种新型非空气传导语音增强方法能够有效弥补传统语音增强方法针对性不强的弱点,且执行效率高,效果明显,因此具有较强的实用价值和应用前景。
附图说明
图1为整个雷达非空气传导语音增强系统的结构框图;
图2为对某段指定的语音信号,使用本发明所述方法之前和之后,及与传统谱减法相比的雷达语音语谱图比较图。其中图2(a)为未增强语音的语谱图,图2(b)为使用传统谱减法增强后的语音谱图;图2(c)为使用本发明所述方法增强后语音的语谱图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
参见图1,本发明首先将接收到的雷达非空气传导语音信号进行数字化处理后进行小波包变换1;对所获得的小波包系数进行两方面的处理:一是计算全局阈值2;二是通过计算Teager能量算子3,进而计算二阶低通滤波器4,从而生成时间自适应掩模5。利用所生成的时间自适应掩模5,结合全局阈值2得到时间-尺度自适应阈值6。利用此时间-尺度自适应阈值对小波包系数进行阈值处理7,并经过小波包重构8得到增强后的语音。
其具体步骤如下:
1)首先,对雷达非空气传导的语音信号采样并做A/D转换,进行数字化处理得到带噪语音信号,其采样速率为5KHz~20KHz;
2)其次,对带噪语音信号进行小波包分解;
设带噪语音信号y(n)由纯净语音信号s(n)与噪声信号d(n)叠加而成,即:
y(n)=s(n)+d(n) (1)
选择小波函数,对带噪语音信号y(n)经j层小波包变换后得到2j个子带小波系数,j≥1,其中第k个子带中第m个小波系数值为wk,m j,并将小波分阶层数设为4层,
3)然后,分别基于尺度和时间计算小波包系数的自适应阈值;
其具体步骤如下:首先,计算全局小波消噪阈值λ,其计算公式为:
式中σ为噪声信号的噪声水平,N为噪声信号的信号长度,MAD为小波系数绝对值的中值,MAD的取值由第1个尺度小波系数得到,将以上公式扩展至小波包变换,即得到基于尺度的自适应阈值,其中小波包变换第k个子带的阈值λk为:
式中σk为第k个子带的噪声水平,Nk为第k个子带的信号长度,MADk为第k个子带小波系数wk,m j绝对值的中值;
其次,根据以下公式得到小波包系数的Teager能量tk,m j:
经过Teager能量计算后采用二阶低通巴特沃思IIR滤波器hk(m)对Teager能量滤波并归一化,得到时间自适应掩模Mk,m j:
由于含有语音成分的帧其Teager能量值波动较大,因此对第k个子带Teager能量掩模Mk,m j分帧并作直方图分析,根据当前帧Mk,m j的偏移值Sk j区分语音帧和噪声帧;
上式中H表示Mk,m j的直方图分布,abscissa[·]函数表示直方图分布最大值的横坐标值,即Teager能量最集中的值,若 则第k个子带当前帧为语音帧,利用Sk j对Mk,m j进行修正即可得到最终的时间自适应阈值M′k,m j:
最后,利用式(8)得到的时间自适应阈值对式(4)得到的尺度自适应阈值进行修正,即可得到第k个子带的时间-尺度自适应阈值λk,m:
根据小波阈值消噪原理,将由上式计算得到的阈值代入软阈值消噪公式,
其中Ts(λ,wk)为软阈值,由此得到消噪后的小波系数
以下是发明人给出的实施例,但并不局限于这些实施例:
一位男性在距离雷达式非空气传导语音探测仪前5米处以正常语速发声,语音材料为“第四军医大学”,语音时长为4.8秒。依下述步骤对此语音做增强处理:
1)对雷达非空气传导语音信号采样做A/D转换,采样速率为10KHz/秒;
2)对数字化后的雷达语音进行带噪信号的小波包分解;
3)计算基于尺度和时间的小波包系数自适应消噪阈值;
4)进行小波包重构以恢复增强语音信号;
处理结果见图2:从图2(a)中可以看出,原始语音中携带有具有较强能量的噪声,这些噪声在语音字句之间能够明显地观察到。图2(b)显示出传统的谱减法能够有效地减少2kHz以下的噪声,同时也能有效去除语音间隙的噪声,但是不能够去除高频噪声。图2(c)示出本专利申请所述的基于小波包能量的非空气传导语音增强方法的效果。它不仅能够减小语音及其间隙中的低频噪声,而且能较完全地去除高频噪声。说明与传统谱减法相比,基于小波包能量的非空气传导语音增强方法能够在全频率段内实现较好的语音增强效果。同步开展的听觉感知实验也表明本专利所述方法能够有效去除雷达语音的噪声,且不丢失语音信息。
此外,与传统谱滤波方法相比,本方法能在去噪度、语音畸变度及残留“音乐噪声”之间做出很好的折衷,这是因为算法能够同时在时间和频域尺度动态地调整阈值,并进而自适应调整小波包系数。因此,无论是从噪声谱估计还是语音谱估计上来看,该算法更能实时地自适应地跟踪语音的变化,从而使得算法中的谱增益以及噪声谱估计更符合假设的语音模型和人耳听觉特性,并在较大程度上提高了语音信号的可懂度。
本发明主要针对基于雷达的非空气传导语音增强,在一些特殊应用场合中,也能够应用于其它语音增强领域(如机器人的声音),同时兼顾语音信号分析及语音识别等学科领域的需要。
尽管本发明所论述的是针对基于雷达的非空气传导语音的增强方法,但本发明的使用范围并不仅限于雷达式非空气传导语音信号的增强,对于一些类似情况或相似条件下获取的语音信号(甚至其它声学信号),本发明所述方法都具有重要的直接或间接的使用和借鉴价值;
本发明所述的语音增强方法主要针对一般的雷达语音噪声环境,对于特殊的声学环境和过于嘈杂的声学背景则需要做有针对性的修改;
由于基于雷达的非空气传导语音的采集过程较传统语音采集过程复杂,因此本发明所述方法所适用语音信号的质量还要受到前端采集电路的影响,但大量的实验表明,本发明具有相当好的抗前端噪声影响的效果,具有较广泛的适用性。
Claims (4)
1、一种基于小波包能量的非空气传导语音增强方法,其特征在于:
1)首先,对雷达非空气传导的语音信号采样并做A/D转换,进行数字化处理得到带噪语音信号,其采样速率为5KHz~20KHz;
2)其次,对带噪语音信号进行小波包分解;
3)然后,分别基于尺度和时间计算小波包系数的自适应阈值;
4)最后,利用自适应阈值进行小波包系数更新,并进行小波包重构以恢复增强后的语音信号。
2、根据权利要求1所述的基于小波包能量的非空气传导语音增强方法,其特征在于:所说的对带噪语音信号进行小波包分解的步骤如下:
设带噪语音信号y(n)由纯净语音信号s(n)与噪声信号d(n)叠加而成,即:
y(n)=s(n)+d(n)(1)
选择小波函数,对带噪语音信号y(n)经j层小波包变换后得到2j个子带小波系数,j≥1,其中第k个子带中第m个小波系数值为wk,m j,并将小波分阶层数设为4层,
3、根据权利要求1所述的基于小波包能量的非空气传导语音增强方法,其特征在于:所说的基于尺度和时间计算小波包系数自适应阈值的方法如下:
1)首先,计算全局小波消噪阈值λ,其计算公式为:
式中σ为噪声信号的噪声水平,N为噪声信号的信号长度,MAD为小波系数绝对值的中值,MAD的取值由第1个尺度小波系数得到,将以上公式扩展至小波包变换,即得到基于尺度的自适应阈值,其中小波包变换第k个子带的阈值λk为:
式中σk为第k个子带的噪声水平,Nk为第k个子带的信号长度,MADk为第k个子带小波系数wk,m j绝对值的中值;
其次,根据以下公式得到小波包系数的Teager能量tk,m j:
经过Teager能量计算后采用二阶低通巴特沃思IIR滤波器hk(m)对Teager能量滤波并归一化,得到时间自适应掩模Mk,m j:
由于含有语音成分的帧其Teager能量值波动较大,因此对第k个子带Teager能量掩模Mk,m j分帧并作直方图分析,根据当前帧Mk,m j的偏移值Sk j区分语音帧和噪声帧;
上式中H表示Mk,m j的直方图分布,abscissa[·]函数表示直方图分布最大值的横坐标值,即Teager能量最集中的值,若 则第k个子带当前帧为语音帧,利用Sk j对Mk,m j进行修正即可得到最终的时间自适应阈值M′k,m j:
最后,利用式(8)得到的时间自适应阈值对式(4)得到的尺度自适应阈值进行修正,即可得到第k个子带的时间-尺度自适应阈值λk,m:
根据小波阈值消噪原理,将由上式计算得到的阈值代入软阈值消噪公式,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100235576A CN101625869B (zh) | 2009-08-11 | 2009-08-11 | 一种基于小波包能量的非空气传导语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100235576A CN101625869B (zh) | 2009-08-11 | 2009-08-11 | 一种基于小波包能量的非空气传导语音增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101625869A true CN101625869A (zh) | 2010-01-13 |
CN101625869B CN101625869B (zh) | 2012-05-30 |
Family
ID=41521684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100235576A Expired - Fee Related CN101625869B (zh) | 2009-08-11 | 2009-08-11 | 一种基于小波包能量的非空气传导语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101625869B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073881A (zh) * | 2011-01-17 | 2011-05-25 | 武汉理工大学 | 人体表面肌电信号消噪、特征提取和模式识别方法 |
CN102176312A (zh) * | 2011-01-07 | 2011-09-07 | 蔡镇滨 | 一种通过小波陷波来降低突发噪音的系统及方法 |
CN103700072A (zh) * | 2013-12-17 | 2014-04-02 | 北京工业大学 | 一种基于自适应小波阈值和双边滤波器的图像去噪方法 |
CN104048680A (zh) * | 2014-07-09 | 2014-09-17 | 哈尔滨工程大学 | 基于donoho阈值的自主式水下机器人外部干扰抑制方法 |
CN104269178A (zh) * | 2014-08-08 | 2015-01-07 | 华迪计算机集团有限公司 | 对语音信号进行自适应谱减和小波包消噪处理的方法和装置 |
CN104299620A (zh) * | 2014-09-22 | 2015-01-21 | 河海大学 | 一种基于emd算法的语音增强方法 |
CN106782588A (zh) * | 2016-11-15 | 2017-05-31 | 中国人民解放军第四军医大学 | 一种基于听觉小波包的毫米波生物雷达语音增强方法 |
CN107517380A (zh) * | 2012-09-24 | 2017-12-26 | 英特尔公司 | 用于视频编码和解码的基于直方图分段的局部自适应滤波器 |
CN108231084A (zh) * | 2017-12-04 | 2018-06-29 | 重庆邮电大学 | 一种基于Teager能量算子的改进小波阈值函数去噪方法 |
CN108507669A (zh) * | 2018-03-22 | 2018-09-07 | 国网湖南省电力有限公司 | 电力设备声级测量的间歇性突发环境噪声降噪方法及装置 |
CN110010142A (zh) * | 2019-03-28 | 2019-07-12 | 武汉大学 | 一种大容量音频信息隐藏的方法 |
CN113049913A (zh) * | 2021-03-15 | 2021-06-29 | 广东电网有限责任公司梅州供电局 | 配电线路在线监测方法、装置和系统 |
CN114265373A (zh) * | 2021-11-22 | 2022-04-01 | 煤炭科学研究总院 | 综采面一体式操控台控制系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1605878A (zh) * | 2004-11-17 | 2005-04-13 | 天津大学 | 基于小波分解频带特征的馈线单相及多相故障测距方法 |
JP4555185B2 (ja) * | 2005-07-25 | 2010-09-29 | パナソニック株式会社 | 送信機、受信機およびその制御方法 |
KR100789084B1 (ko) * | 2006-11-21 | 2007-12-26 | 한양대학교 산학협력단 | 웨이블릿 패킷 영역에서 비선형 구조의 과중 이득에 의한음질 개선 방법 |
CN101201901A (zh) * | 2006-12-13 | 2008-06-18 | 中国科学院沈阳自动化研究所 | 基于模糊小波包分解的小波特征提取方法 |
-
2009
- 2009-08-11 CN CN2009100235576A patent/CN101625869B/zh not_active Expired - Fee Related
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102176312A (zh) * | 2011-01-07 | 2011-09-07 | 蔡镇滨 | 一种通过小波陷波来降低突发噪音的系统及方法 |
CN102176312B (zh) * | 2011-01-07 | 2012-11-21 | 蔡镇滨 | 一种通过小波陷波来降低突发噪音的系统及方法 |
CN102073881A (zh) * | 2011-01-17 | 2011-05-25 | 武汉理工大学 | 人体表面肌电信号消噪、特征提取和模式识别方法 |
CN107517380A (zh) * | 2012-09-24 | 2017-12-26 | 英特尔公司 | 用于视频编码和解码的基于直方图分段的局部自适应滤波器 |
CN103700072A (zh) * | 2013-12-17 | 2014-04-02 | 北京工业大学 | 一种基于自适应小波阈值和双边滤波器的图像去噪方法 |
CN104048680A (zh) * | 2014-07-09 | 2014-09-17 | 哈尔滨工程大学 | 基于donoho阈值的自主式水下机器人外部干扰抑制方法 |
CN104269178A (zh) * | 2014-08-08 | 2015-01-07 | 华迪计算机集团有限公司 | 对语音信号进行自适应谱减和小波包消噪处理的方法和装置 |
CN104299620A (zh) * | 2014-09-22 | 2015-01-21 | 河海大学 | 一种基于emd算法的语音增强方法 |
CN106782588A (zh) * | 2016-11-15 | 2017-05-31 | 中国人民解放军第四军医大学 | 一种基于听觉小波包的毫米波生物雷达语音增强方法 |
CN108231084A (zh) * | 2017-12-04 | 2018-06-29 | 重庆邮电大学 | 一种基于Teager能量算子的改进小波阈值函数去噪方法 |
CN108231084B (zh) * | 2017-12-04 | 2021-09-10 | 重庆邮电大学 | 一种基于Teager能量算子的改进小波阈值函数去噪方法 |
CN108507669A (zh) * | 2018-03-22 | 2018-09-07 | 国网湖南省电力有限公司 | 电力设备声级测量的间歇性突发环境噪声降噪方法及装置 |
CN110010142A (zh) * | 2019-03-28 | 2019-07-12 | 武汉大学 | 一种大容量音频信息隐藏的方法 |
CN110010142B (zh) * | 2019-03-28 | 2021-05-04 | 武汉大学 | 一种大容量音频信息隐藏的方法 |
CN113049913A (zh) * | 2021-03-15 | 2021-06-29 | 广东电网有限责任公司梅州供电局 | 配电线路在线监测方法、装置和系统 |
CN114265373A (zh) * | 2021-11-22 | 2022-04-01 | 煤炭科学研究总院 | 综采面一体式操控台控制系统 |
Also Published As
Publication number | Publication date |
---|---|
CN101625869B (zh) | 2012-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101625869B (zh) | 一种基于小波包能量的非空气传导语音增强方法 | |
CN105788607B (zh) | 应用于双麦克风阵列的语音增强方法 | |
CN101320566B (zh) | 基于多带谱减法的非空气传导语音增强方法 | |
US8712074B2 (en) | Noise spectrum tracking in noisy acoustical signals | |
CN101976566B (zh) | 语音增强方法及应用该方法的装置 | |
CN106340292B (zh) | 一种基于连续噪声估计的语音增强方法 | |
CN100543842C (zh) | 基于多统计模型和最小均方误差实现背景噪声抑制的方法 | |
CN102157156B (zh) | 一种单通道语音增强的方法和系统 | |
CN105390142B (zh) | 一种数字助听器语音噪声消除方法 | |
CN102097095A (zh) | 一种语音端点检测方法及装置 | |
CN101930746B (zh) | 一种mp3压缩域音频自适应降噪方法 | |
CN103117066A (zh) | 基于时频瞬时能量谱的低信噪比语音端点检测方法 | |
Mitra et al. | Damped oscillator cepstral coefficients for robust speech recognition. | |
CN103827967B (zh) | 语音信号复原装置以及语音信号复原方法 | |
CN103208291A (zh) | 一种可用于强噪声环境的语音增强方法及装置 | |
CN101853665A (zh) | 语音中噪声的消除方法 | |
Sanam et al. | Enhancement of noisy speech based on a custom thresholding function with a statistically determined threshold | |
Li | Speech denoising based on improved discrete wavelet packet decomposition | |
CN103578466A (zh) | 基于分数阶傅里叶变换的语音非语音检测方法 | |
CN112185405B (zh) | 一种基于差分运算和联合字典学习的骨导语音增强方法 | |
CN203165457U (zh) | 一种可用于强噪声环境的语音采集装置 | |
CN106782588A (zh) | 一种基于听觉小波包的毫米波生物雷达语音增强方法 | |
Hassani et al. | Speech enhancement based on spectral subtraction in wavelet domain | |
CN111968627B (zh) | 一种基于联合字典学习和稀疏表示的骨导语音增强方法 | |
Radha et al. | Enhancing speech quality using artificial bandwidth expansion with deep shallow convolution neural network framework |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120530 Termination date: 20140811 |
|
EXPY | Termination of patent right or utility model |