CN105719658B - 基于新阈值函数和自适应阈值的小波包语音降噪方法 - Google Patents

基于新阈值函数和自适应阈值的小波包语音降噪方法 Download PDF

Info

Publication number
CN105719658B
CN105719658B CN201610124417.8A CN201610124417A CN105719658B CN 105719658 B CN105719658 B CN 105719658B CN 201610124417 A CN201610124417 A CN 201610124417A CN 105719658 B CN105719658 B CN 105719658B
Authority
CN
China
Prior art keywords
wavelet
wavelet packet
coefficient
threshold
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610124417.8A
Other languages
English (en)
Other versions
CN105719658A (zh
Inventor
刘冲冲
邹翔
周正仙
屈军
郑贤锋
崔执凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Zao An Technology Co ltd
Original Assignee
Anhui Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Normal University filed Critical Anhui Normal University
Priority to CN201610124417.8A priority Critical patent/CN105719658B/zh
Publication of CN105719658A publication Critical patent/CN105719658A/zh
Application granted granted Critical
Publication of CN105719658B publication Critical patent/CN105719658B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明揭示了一种基于新阈值函数和自适应阈值的小波包语音降噪方法,步骤1、带噪语音输入;步骤2、小波包分解;步骤3:对带噪语音进行小波包降噪;步骤4:小波包重构,得出去噪语音信号;步骤5、去噪语音输出;所述步骤4是通过对带噪语音的语音分量和噪音分量设定不同的阈值,并根据阈值限定抑制噪音分量,增强语音分量,完成小波包降噪,缓解了传统降噪阈值不变和软硬阈值函数带来的语音失真,通过阈值调整系数,对语音分量和噪音分量设定不同的阈值,结合本发明提出的新阈值函数,对语音分量和噪音分量实现区分和平滑处理,能更好的抑制噪音,增强语音,减少失真,从而获得更佳的听觉效果。

Description

基于新阈值函数和自适应阈值的小波包语音降噪方法
技术领域
本发明涉及小波包信号处理领域,尤其涉及一种基于新阈值函数和自适应阈值的小波包语音降噪方法。
背景技术
近年来,伴随高速通信的不断发展,音频通信成为国际热门研究课题。语音在产生和传输过程中,不可避免要受到噪声污染,提高音频通信系统通信质量的关键问题之一是消除干扰噪声。
近年来,小波包分析能根据信号特性,对信号高低频进行分解,在语音降噪方面得到广泛应用。小波包分析的基本方法是,信号进行小波包分解后,对外层每一个小波包系数设定阈值,根据阈值,采用阈值函数对小波包系数进行量化处理。目前小波包分析多数采用硬阈值函数或软阈值函数对分解系数进行量化处理。但是,硬阈值函数增加了信号的突变性和压制了原信号中的小的快变信息,软阈值函数会对整个信号能量产生一个偏移。这两种方法都可能造成信号的不连续性,会使去噪信号失真,虽能获得较高输出信噪比,但是实际的听觉效果并不理想。
针对上述问题,本发明提出一种基于新阈值函数和自适应阈值的小波包语音降噪方法,自适应阈值能对噪音分量和语音分量区分处理,新阈值函数能对信号进行平滑处理,实现对语音分量的保护,减小失真。实验证明,采用本发明提出的方法,可以获得更加清晰,听觉效果更好的增强语音。
发明内容
本发明提出一种基于新阈值函数和自适应阈值的小波包语音降噪方法,自适应阈值能对噪音分量和语音分量区分处理,新阈值函数能对信号进行平滑处理,实现对语音分量的保护,减小失真,获得更佳的听觉效果。
为实现上述目的,本发明提出一种基于小波包语音降噪的阈值调整系数实现阈值的自适应,对语音分量和噪音分量设定不同的阈值,结合本发明提出的新阈值函数(发明内容是自适应阈值和新阈值函数),对语音分量和噪音分量实现区分和平滑处理,最终实现抑制噪音,增强语音,减小失真,获得更佳语音效果的目的。
基于新阈值函数和自适应阈值的小波包语音降噪方法,
步骤1、带噪语音输入;
步骤2、小波包分解;
步骤3:对带噪语音进行小波包降噪;
步骤4:小波包重构,得出去噪语音信号;
步骤5、去噪语音输出;
所述步骤3是通过对带噪语音的语音分量和噪音分量设定不同的阈值,并结合新阈值函数对语音分量和噪音分量区分并且平滑处理,完成小波包降噪。
所述一种基于小波包分析的语音增强方法为:
1)对带噪语音进行小波包分解;
2)计算阈值并按照本发明提出的自适应阈值,结合本发明提出的新阈值函数,对带噪语音进行小波包降噪;
3)小波包重构,得出去噪语音信号。
所述的阈值调整系数的获取方法为:
1)对带噪语音信号进行小波包分解,分帧处理;
2)计算每一帧是语音帧的相对几率;
3)若某帧很大可能是语音帧,则k(λ)=1,否则k(λ)=0;
其中,λ是帧数,最终得到的k(λ)即为阈值调整系数。
所述的新阈值函数为:
其中sign(x)是符号函数,x小于0时,sign(x)=-1,x大于或者等于0时,sign(x)=1。A、B均是正常数,A根据实验所需取值,B在1附近取值,wjk是需要处理的小波包系数,w′jk是阈值量化处理后的小波包系数,T是经阈值调整系数调整后的自适应阈值。
本发明的优点在于:
1、本发明可以实现对小波包阈值自适应调整,从而保护语音分量,减小失真,获得更佳的听觉效果;
2、本发明可以实现对语音分量和噪音分量区分和平滑处理,能更好的抑制噪音,增强语音;
3、所述新阈值函数构造简单,可以调整,且在整个区间是光滑、连续、可导的,并且具有高阶导数,在远处收敛于y=x,方便更加深入的数据处理。
附图说明
下面对本发明说明书中每幅附图表达的内容作简要说明:
图1为获取本发明所述阈值调整系数的流程图;
图2为本发明所述新阈值函数的某个示意图像;
图3为本发明所述语音增强流程图。
具体实施方式
本发明提出一种基于小波包分析的语音增强方法,能对噪音分量和语音分量区分和平滑处理,从而更好的抑制噪音,减少失真,获得更佳的听觉效果。
为实现上述目的,本发明提出一种基于小波包语音降噪的阈值调整系数,对语音分量和噪音分量设定不同的阈值,结合本发明提出的新阈值函数,对语音分量和噪音分量实现区分和平滑处理,最终实现抑制噪音,减小失真,获得更佳语音效果的目的。
其具体实施方式如下:
所述一种基于小波包分析的语音增强方法如图3:
步骤1、对带噪语音进行小波包分解;
步骤2、按公式计算外层每一个小波包分解系数的基础阈值,其中σ为小波包分解系数的标准差,N为对应小波包系数的数据长度;;
步骤3、将t按照阈值调整系数调整,得最终自适应阈值T(λ)=t·(1-p·k(λ)),其中p为介于0到1之间的常数,根据实际调整,通常取0.6-0.95之间,k(λ)是阈值调整系数;
步骤4、按照阈值T(λ)和本发明提出的新阈值函数,对带噪语音进行小波包降噪;
步骤5、小波包重构,得出去噪语音信号。
所述的阈值调整系数的获取方法如图1:
步骤1、对带噪语音信号进行小波包分解;
步骤2、计算外层每一个小波包系数的方差,如果某个小波包系数的方差小于某一个设定的值(如0.0001),则该小波包系数对应的阈值系数全部设为0,否则跳入下一步;
步骤3、对外层的每一个小波包系数分帧,设帧长为L,帧移为L/2,帧号为λ,第j层第k个小波包系数为wjk(n)计算每一帧的绝对值的平均值,如下式:
步骤4、对得到的E(λ)进行由小到大排序,得到Es(λ),找出使Es(λ)变化最大的帧号,若该种帧号有多个,取最小的帧号,记为λmax,如下式:
Es(λ)=sort(E(λ)),
λmax=min(λi);
步骤5、对E(λ)按下式进行平滑处理:
E(λ)=α·E(λ-1)+(1-α)·E(λ),
其中α是平滑因子,根据实验决定其值,如0.3;
步骤6、k(λ)可由下式得到:
其中m是介于0-1之间的调节因子,根据实验决定其取值;
所述的新阈值函数为:
其某个图像如图2,其中sign(x)是符号函数,x小于0时,sign(x)=-1,x大于或者等于0时,sign(x)=1。A、B均是正常数,A根据实验所需取值,B在1附近取值,wjk是需要处理的小波包系数,w′jk是阈值量化处理后的小波包系数,T是经阈值调整系数调整后的自适应阈值。
上面结合附图对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。

Claims (1)

1.基于新阈值函数和自适应阈值的小波包语音降噪方法,
步骤1、带噪语音输入;
步骤2、小波包分解;
步骤3:对带噪语音进行小波包降噪;
步骤4:小波包重构,得出去噪语音信号;
步骤5、去噪语音输出;
其特征在于:所述步骤3是通过对带噪语音的语音分量和噪音分量设定不同的阈值,并结合新阈值函数对语音分量和噪音分量区分并且平滑处理,完成小波包降噪;
所述的新阈值函数为:
其中sign(x)是符号函数,x小于0时,sign(x)=-1,x大于或者等于0时,sign(x)=1,A、B均是正常数,A根据实验所需取值,B在1附近取值,wjk是需要处理的小波包系数,w′jk是阈值量化处理后的小波包系数,T是经阈值调整系数调整后的自适应阈值;
所述步骤3中带噪语音的小波包降噪采取的阈值设定方法如下:
步骤a、对带噪语音进行小波包分解;
步骤b、按公式计算外层每个小波包分解系数的基础阈值,其中σ为小波包分解系数的标准差,N为对应小波包系数的数据长度;
步骤c、计算外层每一个小波包系数的方差,如果某个小波包系数的方差小于某一个设定的值,则该小波包系数对应的阈值系数全部设为0,否则跳入下一步;
步骤d、对外层的每一个小波包系数分帧,设帧长为L,帧移为L/2,帧号为λ,第j层第k个小波包系数为wjk(n)计算每一帧小波包系数的绝对值的平均值,如下式:
步骤e、对得到的E(λ)进行从小到大排序,得到Es(λ),找出使Es(λ)变化最大的帧号,若该变化最大对应的帧号有多个,取最小的帧号,记为λmax,如下式:
Es(λ)=sort(E(λ)),
λmax=min(λi);
步骤f、对E(λ)按下式进行平滑处理:
E(λ)=α·E(λ-1)+(1-α)·E(λ),
其中α是平滑因子,根据实验决定其值;
步骤g、k(λ)是阈值调整系数,k(λ)可由下式得到:
其中m是介于0-1之间的调节因子,根据实验决定其取值;
步骤h、计算自适应阈值:
T(λ)=t·(1-p·k(λ))。
CN201610124417.8A 2016-03-04 2016-03-04 基于新阈值函数和自适应阈值的小波包语音降噪方法 Active CN105719658B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610124417.8A CN105719658B (zh) 2016-03-04 2016-03-04 基于新阈值函数和自适应阈值的小波包语音降噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610124417.8A CN105719658B (zh) 2016-03-04 2016-03-04 基于新阈值函数和自适应阈值的小波包语音降噪方法

Publications (2)

Publication Number Publication Date
CN105719658A CN105719658A (zh) 2016-06-29
CN105719658B true CN105719658B (zh) 2019-11-26

Family

ID=56156541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610124417.8A Active CN105719658B (zh) 2016-03-04 2016-03-04 基于新阈值函数和自适应阈值的小波包语音降噪方法

Country Status (1)

Country Link
CN (1) CN105719658B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106782588A (zh) * 2016-11-15 2017-05-31 中国人民解放军第四军医大学 一种基于听觉小波包的毫米波生物雷达语音增强方法
CN111428307B (zh) * 2020-04-21 2021-01-08 广州高新工程顾问有限公司 一种基于bim的室内优化设计方法及系统
CN114091983B (zh) * 2022-01-21 2022-05-10 网思科技股份有限公司 一种工程车辆智能管理系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103901474A (zh) * 2014-04-18 2014-07-02 成都新核中创信息科技有限公司 一种基于折中小波阈值分析的微地震弱信号提取方法
CN104299620A (zh) * 2014-09-22 2015-01-21 河海大学 一种基于emd算法的语音增强方法
CN104615877A (zh) * 2015-01-28 2015-05-13 辽宁工程技术大学 一种基于小波包进行信号去噪的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103901474A (zh) * 2014-04-18 2014-07-02 成都新核中创信息科技有限公司 一种基于折中小波阈值分析的微地震弱信号提取方法
CN104299620A (zh) * 2014-09-22 2015-01-21 河海大学 一种基于emd算法的语音增强方法
CN104615877A (zh) * 2015-01-28 2015-05-13 辽宁工程技术大学 一种基于小波包进行信号去噪的方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
SELECTIVE DISCRETE WAVELET PACKET TRNASFORM-BASED ENERGY DETECTOR FOR COGNITIVE RADIOS;Sunghyun Kim et al.;《2008 IEEE》;20081130;第1-6页 *
Speech Enhancement Based on Student t Modeling of Teager Energy Operated Perceptual Wavelet Packet Coefficients and a Custom Thresholding Function;Md Tauhidul Islam et al.;《IEEE/ACM TRANSACTIONS ON AUDIO,SPEECH,AND LANGUAGE PROCESSING》;20151130;第23卷(第11期);第1800-1811页 *
用后验信噪比修正小波包自适应阈值的语音增强算法;张雪英等;《中南大学学报(自然科学版)》;20131130;第4566-4570页 *
语音增强算法的研究及改进;孙晋松;《中国优秀硕士学位论文全文数据库 信息科学辑》;20100415(第4期);第36-42页 *

Also Published As

Publication number Publication date
CN105719658A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
CN110619885B (zh) 基于深度完全卷积神经网络的生成对抗网络语音增强方法
CN103871421B (zh) 一种基于子带噪声分析的自适应降噪方法与系统
CN105741849B (zh) 数字助听器中融合相位估计与人耳听觉特性的语音增强方法
CN109643554A (zh) 自适应语音增强方法和电子设备
CN106570843A (zh) 一种自适应小波阈值函数图像噪声抑制方法
CN105719658B (zh) 基于新阈值函数和自适应阈值的小波包语音降噪方法
CN105280193B (zh) 基于mmse误差准则的先验信噪比估计方法
CN105489226A (zh) 一种用于拾音器的多窗谱估计的维纳滤波语音增强方法
CN112786064B (zh) 一种端到端的骨气导语音联合增强方法
CN106067164B (zh) 基于自适应小波域处理的彩色图像对比度增强算法
CN112530451A (zh) 基于去噪自编码器的语音增强方法
CN110808057A (zh) 一种基于约束朴素生成对抗网络的语音增强方法
CN108805845A (zh) 小波包与偏微分方程相结合的图像去噪方法
CN113411456B (zh) 一种基于语音识别的话音质量评估方法及装置
CN110310658B (zh) 一种基于语音信号处理的语音分离办法
CN107045874A (zh) 一种基于相关性的非线性语音增强方法
CN1805011A (zh) 一种提高移动通信设备语音质量的自适应滤波方法及装置
CN111681649A (zh) 语音识别方法、交互系统及包括该系统的成绩管理系统
Ji et al. Simple and efficient soft morphological filter in periodic noise reduction
CN113808608B (zh) 一种基于时频掩蔽平滑策略的单声道噪声抑制方法和装置
CN115440240A (zh) 语音降噪的训练方法、语音降噪系统及语音降噪方法
CN113066483B (zh) 一种基于稀疏连续约束的生成对抗网络语音增强方法
CN111145768B (zh) 基于wshrrpca算法的语音增强方法
CN110933235B (zh) 一种基于机器学习的智能呼叫系统中的噪声识别方法
CN103854258A (zh) 一种基于Contourlet变换自适应方向阈值的图像去噪方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210119

Address after: 519000 no.d515, area D, Taifeng cross border e-commerce Industrial Park, Taifeng trade logistics center, 33 Huawei Road, Xiangzhou District, Zhuhai City, Guangdong Province

Patentee after: ZHUHAI ZAO AN TECHNOLOGY Co.,Ltd.

Address before: 241000 Wuhu Road, Yijiang District, Anhui,

Patentee before: ANHUI NORMAL University