CN108428456A - 语音降噪算法 - Google Patents

语音降噪算法 Download PDF

Info

Publication number
CN108428456A
CN108428456A CN201810274913.0A CN201810274913A CN108428456A CN 108428456 A CN108428456 A CN 108428456A CN 201810274913 A CN201810274913 A CN 201810274913A CN 108428456 A CN108428456 A CN 108428456A
Authority
CN
China
Prior art keywords
frame data
current frame
energy
signal
energy spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810274913.0A
Other languages
English (en)
Inventor
禹深义
娄进凯
张勤磊
胥杨
李万顺
高峻峰
丁辉
付琰
于江菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Kaichi Electronic Technology Co Ltd
Original Assignee
Zhejiang Kaichi Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Kaichi Electronic Technology Co Ltd filed Critical Zhejiang Kaichi Electronic Technology Co Ltd
Priority to CN201810274913.0A priority Critical patent/CN108428456A/zh
Publication of CN108428456A publication Critical patent/CN108428456A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种语音降噪算法:使用仿真软件采集声音样本,并进行A/D转换;将经过AD采样后的带噪语音进行短时傅里叶变换,并对每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,利用先验信噪比结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,根据纯净语音能量谱与当前帧数据的相位谱,进行短时傅里叶反变换并合成,形成连续的纯净语音信号。本发明利用多种端点监测算法结合噪声进行估计,进而提高噪声估计的准确度。

Description

语音降噪算法
技术领域:
本发明涉及一种算法,特别是涉及一种语音降噪算法。
背景技术:
无论身处何处,我们都被噪声所包围,噪声可以是平稳的,即不随时间而改变,如电脑风扇噪声;噪声也可以是非平稳的,比如餐馆里面的北京噪声,很多人说话的同时还夹杂着厨房里传出来的声音,这种餐馆噪声的频域以及时域特征随着周围餐桌上人们的对话以及服务员与顾客交流内容的改变而改变。
发明内容:
本发明所要解决的技术问题是:克服现有技术的不足,提供一种能够提高噪声估计的准确度的语音降噪算法。
本发明为解决技术问题所采取的技术方案是:
一种语音降噪算法,包括以下步骤:
(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;
(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;
(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;
(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi 2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;
(1)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;
(2)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
其中ξi(k)为当前帧数据频率分量k的先验信噪比,为当前帧数据后验信噪比的维纳估计,Yi(k)为当前帧数据频率分量k的带噪语音的能量谱,Xk为当前帧数据频率分量k的纯净语音的能量谱;
(3)根据计算出的纯净语音能量谱与计算出的当前帧数据的相位谱,进行短时傅里叶反变换,将信号从频域转换到时域,再对每一帧数据进行合成,形成连续的纯净语音信号。
步骤(3)中的VAD检测,使用能熵比进行检测,具体能熵比计算过程如下所示:
(1)计算当前帧数据的每个频率分量的归一化谱概率密度函数,如下式所示:
其中Yi(k)为第k条谱线频率分量fk的能量谱,为所有频率分量的能量和,pi(k)为第i帧第k个频率分量fk对应的概率密度,N为短时傅里叶变换的分辨率,这里取N=128;
(2)计算当前帧数据的短时谱熵,如下式所示:
其中Hi为当前帧数据的短时谱熵;
(3)计算当前帧数据的能量,如下式所示:
LEi=log10(1+AMRi/a)
其中Yi 2(k)是当前帧数据的能量,AMPi为当前帧数据的能量,LEi是改进的能量关系,a是一个常数,这里取1.5:
(4)计算当前帧数据的能熵比,如下式所示:
其中EEFi就是当前帧数据的能熵比,根据EEFi的值,判断是否为有效语音,如果是,则不更新噪声估计的能量谱,如果不是,这里取EEFi<1.6为无效语音,则更新噪声能量谱λd(k):
λd(k)=0.9*λd-1(k)+0.1*Yi 2(k)
在进行语音降噪算法的过程中,选择使用数字信号处理器TMS320VC5509A作为主处理芯片,使用音频编解码器TLV320AIC23B作为AD/DA芯片。
本发明的积极有益效果是:
噪声估计是所有降噪算法中的重中之重,提高噪声估计的准确度能明显提高处理后的语音的信噪比与可懂性,本发明使用多种端点检测算法结合对噪声进行估计,进而提高噪声估计的准确度,提高了语音降噪的效果。
附图说明:
图1为本发明语音降噪算法的算法过程框图。
具体实施方式:
下面结合附图1和具体实施例对本发明作进一步的解释和说明:
实施例:一种语音降噪算法,包括以下步骤:
(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;
(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;
(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;
(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi 2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;
(4)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;
(5)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
其中ξi(k)为当前帧数据频率分量k的先验信噪比,为当前帧数据后验信噪比的维纳估计,Yi(k)为当前帧数据频率分量k的带噪语音的能量谱,Xk为当前帧数据频率分量k的纯净语音的能量谱;
(6)根据计算出的纯净语音能量谱与计算出的当前帧数据的相位谱,进行短时傅里叶反变换,将信号从频域转换到时域,再对每一帧数据进行合成,形成连续的纯净语音信号。
步骤(3)中的VAD检测,使用能熵比进行检测,具体能熵比计算过程如下所示:
(1)计算当前帧数据的每个频率分量的归一化谱概率密度函数,如下式所示:
其中Yi(k)为第k条谱线频率分量fk的能量谱,为所有频率分量的能量和,pi(k)为第i帧第k个频率分量fk对应的概率密度,N为短时傅里叶变换的分辨率,这里取N=128;
(2)计算当前帧数据的短时谱熵,如下式所示:
其中Hi为当前帧数据的短时谱熵;
(3)计算当前帧数据的能量,如下式所示:
LEi=log10(1+AMPi/a)
其中Yi 2(k)是当前帧数据的能量,AMPi为当前帧数据的能量,LEi是改进的能量关系,a是一个常数,这里取1.5:
(4)计算当前帧数据的能熵比,如下式所示:
其中EEFi就是当前帧数据的能熵比,根据EEFi的值,判断是否为有效语音,如果是,则不更新噪声估计的能量谱,如果不是,这里取EEFi<1.6为无效语音,则更新噪声能量谱λd(k):
λd(k)=0.9*λd-1(k)+0.1*Yi 2(k)
在进行语音降噪算法的过程中,选择使用数字信号处理器TMS320VC5509A作为主处理芯片,使用音频编解码器TLV320AIC23B作为AD/DA芯片。
语音降噪过程中,先使用仿真软件采集声音样本,并进行A/D转换;随后进行短时傅里叶变换,并对每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,然后根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,利用先验信噪比结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,根据纯净语音能量谱与当前帧数据的相位谱,进行短时傅里叶反变换并合成,形成连续的纯净语音信号。
以上所述,仅是本发明的优先实施例而已,并未对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的保护范围内。

Claims (3)

1.一种语音降噪算法,包括以下步骤:
(1)使用仿真软件对声音样本进行前期的采集与处理,并进行A/D转换;
(2)将前级经过AD采样后的一段带噪语音,经过分帧(20ms)加窗后进行短时傅里叶变换,由信号的时域处理转换为信号的频时处理,计算出每一帧信号的短时能量谱和相位谱;
其中x(m)为输入信号,w(m)是分析窗,此处取汉明窗,它在时间上反转并且有n个样本的偏移量,ω为频率变量,N为短时傅里叶变换的分辨率,这里取N=128,Yi(k)为第帧数据,第k条谱线频率分量fk的能量谱;
(3)对经过傅里叶分析处理的每一帧信号进行VAD检测,根据VAD门限,得出每一帧信号时有效帧还是无效帧,如果是无效帧,即不含有效语音的帧,更新噪声估计的能量谱,如果是有效帧,则不动作;
(4)根据当前帧的带噪语音的能量谱和噪声估计的能量谱,计算当前帧数据每一频率分量的后验信噪比,如下式所示:
其中Yi 2(k)为当前帧数据的频率分量k的能量值,λd(k)为噪声估计能量谱中频率分量k的能量值,γi(k)为当前帧数据的k频率分量的后验信噪比;
(5)利用当前帧的后验信噪比结合前一帧数据的谱估计器,计算当前帧的先验信噪比,如下式所示:
ξi(k)≈αξi-1(k)+(1-α)(γi(k)-1)
其中α为平滑因子,一般取0.9-1.0,这里取0.95,ξi-1(k)为上一帧数据频率分量k的先验信噪比,γi(k)为当前帧数据频率分量k的后验信噪比,ξi(k)为当前帧数据频率分量k的先验信噪比;
(6)根据计算出的当前帧的先验信噪比,结合logMMSE算法模型,计算出当前帧数据的谱估计器,并计算出纯净信号的能量谱,如下式所示:
其中ξi(k)为当前帧数据频率分量k的先验信噪比,为当前帧数据后验信噪比的维纳估计,Yi(k)为当前帧数据频率分量k的带噪语音的能量谱,Xk为当前帧数据频率分量k的纯净语音的能量谱;
(7)根据计算出的纯净语音能量谱与计算出的当前帧数据的相位谱,进行短时傅里叶反变换,将信号从频域转换到时域,再对每一帧数据进行合成,形成连续的纯净语音信号。
2.根据权利要求1所述的语音降噪算法,其特征是:步骤(3)中的VAD检测,使用能熵比进行检测,具体能熵比计算过程如下所示:
(1)计算当前帧数据的每个频率分量的归一化谱概率密度函数,如下式所示:
其中Yi(k)为第k条谱线频率分量fk的能量谱,为所有频率分量的能量和,pi(k)为第i帧第k个频率分量fk对应的概率密度,N为短时傅里叶变换的分辨率,这里取N=128;
(2)计算当前帧数据的短时谱熵,如下式所示:
其中Hi为当前帧数据的短时谱熵;
(3)计算当前帧数据的能量,如下式所示:
LEi=log10(1+AMPi/a)
其中Yi 2(k)是当前帧数据的能量,AMPi为当前帧数据的能量,LEi是改进的能量关系,a是一个常数,这里取1.5:
(4)计算当前帧数据的能熵比,如下式所示:
其中EEFi就是当前帧数据的能熵比,根据EEFi的值,判断是否为有效语音,如果是,则不更新噪声估计的能量谱,如果不是,这里取EEFi<1.6为无效语音,则更新噪声能量谱λd(k),λd(k)=0.9*λd-1(k)+0.1*Yi 2(k)
3.根据权利要求1所述的语音降噪算法,其特征是:在进行语音降噪算法的过程中,选择使用数字信号处理器TMS320VC5509A作为主处理芯片,使用音频编解码器TLV320AIC23B作为AD/DA芯片。
CN201810274913.0A 2018-03-29 2018-03-29 语音降噪算法 Pending CN108428456A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810274913.0A CN108428456A (zh) 2018-03-29 2018-03-29 语音降噪算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810274913.0A CN108428456A (zh) 2018-03-29 2018-03-29 语音降噪算法

Publications (1)

Publication Number Publication Date
CN108428456A true CN108428456A (zh) 2018-08-21

Family

ID=63160070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810274913.0A Pending CN108428456A (zh) 2018-03-29 2018-03-29 语音降噪算法

Country Status (1)

Country Link
CN (1) CN108428456A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109378002A (zh) * 2018-10-11 2019-02-22 平安科技(深圳)有限公司 声纹验证的方法、装置、计算机设备和存储介质
CN109611703A (zh) * 2018-10-19 2019-04-12 宁波市鄞州利帆灯饰有限公司 一种便于安装的led灯
CN110101407A (zh) * 2019-04-16 2019-08-09 华南师范大学 一种胎心音去噪方法、系统、装置及存储介质
CN110164467A (zh) * 2018-12-18 2019-08-23 腾讯科技(深圳)有限公司 语音降噪的方法和装置、计算设备和计算机可读存储介质
CN111477243A (zh) * 2020-04-16 2020-07-31 维沃移动通信有限公司 音频信号处理方法及电子设备
CN112053702A (zh) * 2020-09-30 2020-12-08 北京大米科技有限公司 一种语音处理的方法、装置及电子设备
CN112669877A (zh) * 2020-09-09 2021-04-16 珠海市杰理科技股份有限公司 噪声检测及压制方法、装置、终端设备和系统、芯片
CN112955951A (zh) * 2018-11-15 2021-06-11 深圳市欢太科技有限公司 语音端点检测方法、装置、存储介质及电子设备
CN113611319A (zh) * 2021-04-07 2021-11-05 珠海市杰理科技股份有限公司 基于语音成分实现的风噪抑制方法、装置、设备及系统
WO2022105570A1 (zh) * 2020-11-17 2022-05-27 深圳壹账通智能科技有限公司 语音端点检测方法、装置、设备及计算机可读存储介质
CN116929449A (zh) * 2023-07-21 2023-10-24 大地(宁夏)数字科技有限公司 基于鸡绿色健康养殖技术的环境监测系统
WO2024017110A1 (zh) * 2022-07-21 2024-01-25 广州市百果园信息技术有限公司 语音降噪方法、模型训练方法、装置、设备、介质及产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853666A (zh) * 2009-03-30 2010-10-06 华为技术有限公司 一种语音增强的方法和装置
CN103295582A (zh) * 2012-03-02 2013-09-11 联芯科技有限公司 噪声抑制方法及其系统
CN103632676A (zh) * 2013-11-12 2014-03-12 广州海格通信集团股份有限公司 一种低信噪比语音降噪方法
CN105702262A (zh) * 2014-11-28 2016-06-22 上海航空电器有限公司 一种头戴式双麦克风语音增强方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853666A (zh) * 2009-03-30 2010-10-06 华为技术有限公司 一种语音增强的方法和装置
CN103295582A (zh) * 2012-03-02 2013-09-11 联芯科技有限公司 噪声抑制方法及其系统
CN103632676A (zh) * 2013-11-12 2014-03-12 广州海格通信集团股份有限公司 一种低信噪比语音降噪方法
CN105702262A (zh) * 2014-11-28 2016-06-22 上海航空电器有限公司 一种头戴式双麦克风语音增强方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
宋知用: "《MATLAB语音信号分析与合成 第2版》", 31 January 2018 *
李战明等: "一种基于语音端点检测的维纳滤波语音增强算法", 《电子设计工程》 *
高毅等: "《语音增强 理论与实践》", 31 December 2012 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020073518A1 (zh) * 2018-10-11 2020-04-16 平安科技(深圳)有限公司 声纹验证的方法、装置、计算机设备和存储介质
CN109378002B (zh) * 2018-10-11 2024-05-07 平安科技(深圳)有限公司 声纹验证的方法、装置、计算机设备和存储介质
CN109378002A (zh) * 2018-10-11 2019-02-22 平安科技(深圳)有限公司 声纹验证的方法、装置、计算机设备和存储介质
CN109611703A (zh) * 2018-10-19 2019-04-12 宁波市鄞州利帆灯饰有限公司 一种便于安装的led灯
CN112955951A (zh) * 2018-11-15 2021-06-11 深圳市欢太科技有限公司 语音端点检测方法、装置、存储介质及电子设备
CN110164467A (zh) * 2018-12-18 2019-08-23 腾讯科技(深圳)有限公司 语音降噪的方法和装置、计算设备和计算机可读存储介质
CN110101407B (zh) * 2019-04-16 2021-09-07 华南师范大学 一种胎心音去噪方法、系统、装置及存储介质
CN110101407A (zh) * 2019-04-16 2019-08-09 华南师范大学 一种胎心音去噪方法、系统、装置及存储介质
CN111477243A (zh) * 2020-04-16 2020-07-31 维沃移动通信有限公司 音频信号处理方法及电子设备
CN112669877B (zh) * 2020-09-09 2023-09-29 珠海市杰理科技股份有限公司 噪声检测及压制方法、装置、终端设备和系统、芯片
CN112669877A (zh) * 2020-09-09 2021-04-16 珠海市杰理科技股份有限公司 噪声检测及压制方法、装置、终端设备和系统、芯片
CN112053702A (zh) * 2020-09-30 2020-12-08 北京大米科技有限公司 一种语音处理的方法、装置及电子设备
CN112053702B (zh) * 2020-09-30 2024-03-19 北京大米科技有限公司 一种语音处理的方法、装置及电子设备
WO2022105570A1 (zh) * 2020-11-17 2022-05-27 深圳壹账通智能科技有限公司 语音端点检测方法、装置、设备及计算机可读存储介质
CN113611319B (zh) * 2021-04-07 2023-09-12 珠海市杰理科技股份有限公司 基于语音成分实现的风噪抑制方法、装置、设备及系统
CN113611319A (zh) * 2021-04-07 2021-11-05 珠海市杰理科技股份有限公司 基于语音成分实现的风噪抑制方法、装置、设备及系统
WO2024017110A1 (zh) * 2022-07-21 2024-01-25 广州市百果园信息技术有限公司 语音降噪方法、模型训练方法、装置、设备、介质及产品
CN116929449A (zh) * 2023-07-21 2023-10-24 大地(宁夏)数字科技有限公司 基于鸡绿色健康养殖技术的环境监测系统

Similar Documents

Publication Publication Date Title
CN108428456A (zh) 语音降噪算法
CN106486131B (zh) 一种语音去噪的方法及装置
CN106340292B (zh) 一种基于连续噪声估计的语音增强方法
CN108831499A (zh) 利用语音存在概率的语音增强方法
CN109410977B (zh) 一种基于EMD-Wavelet的MFCC相似度的语音段检测方法
WO2021114733A1 (zh) 一种分频段进行处理的噪声抑制方法及其系统
Shao et al. A generalized time–frequency subtraction method for robust speech enhancement based on wavelet filter banks modeling of human auditory system
CN105489226A (zh) 一种用于拾音器的多窗谱估计的维纳滤波语音增强方法
CN105575405A (zh) 一种双麦克风语音激活检测方法及语音采集设备
Gerkmann et al. Speech presence probability estimation based on temporal cepstrum smoothing
Sørensen et al. Speech enhancement with natural sounding residual noise based on connected time-frequency speech presence regions
Gupta et al. Speech enhancement using MMSE estimation and spectral subtraction methods
CN109102823A (zh) 一种基于子带谱熵的语音增强方法
Bahadur et al. Performance measurement of a hybrid speech enhancement technique
Zhang et al. Spectral subtraction on real and imaginary modulation spectra
CN103971697A (zh) 基于非局部均值滤波的语音增强方法
Jie et al. Suitability of speech quality evaluation measures in speech enhancement
Meher et al. Dynamic spectral subtraction on AWGN speech
Zheng et al. SURE-MSE speech enhancement for robust speech recognition
Zengyuan et al. A speech denoising algorithm based on harmonic regeneration
Löllmann et al. Efficient ML-estimator for blind reverberation time estimation
Lee et al. On using multivariate polynomial regression model with spectral difference for statistical model-based speech enhancement
Liu A new wavelet threshold denoising algorithm in speech recognition
Wan et al. Robust speech recognition based on multi-band spectral subtraction
Liu et al. Multiresolution cochleagram speech enhancement algorithm using improved deep neural networks with skip connections

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180821

RJ01 Rejection of invention patent application after publication