CN114242095A - 基于采用谐波结构的omlsa框架的神经网络降噪系统和方法 - Google Patents

基于采用谐波结构的omlsa框架的神经网络降噪系统和方法 Download PDF

Info

Publication number
CN114242095A
CN114242095A CN202111508223.5A CN202111508223A CN114242095A CN 114242095 A CN114242095 A CN 114242095A CN 202111508223 A CN202111508223 A CN 202111508223A CN 114242095 A CN114242095 A CN 114242095A
Authority
CN
China
Prior art keywords
noise reduction
neural network
lsa
omlsa
harmonic structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111508223.5A
Other languages
English (en)
Other versions
CN114242095B (zh
Inventor
许云峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Li Ke Semiconductor Technology Co ltd
Original Assignee
Shanghai Li Ke Semiconductor Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Li Ke Semiconductor Technology Co ltd filed Critical Shanghai Li Ke Semiconductor Technology Co ltd
Priority to CN202111508223.5A priority Critical patent/CN114242095B/zh
Publication of CN114242095A publication Critical patent/CN114242095A/zh
Application granted granted Critical
Publication of CN114242095B publication Critical patent/CN114242095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明提供一种基于采用谐波结构的OMLSA框架的神经网络降噪系统和方法,保留了神经网络的降噪性能,而且对一般神经网络在语音中间噪声残留大的问题有很大的改善。基于采用谐波结构的OMLSA框架的神经网络降噪系统和方法包括离线模型训练部分和在线实时降噪部分;离线模型训练部分包括语音数据集、噪声数据集、神经元网络和基于对数谱幅度损失函数;在线实时降噪部分包括短时傅里叶变化(STFT)分析和综合、基于NN‑LAS的模型增益估计模块、基于谐波结构条件的语音存在概率估计模块、基于OM‑LSA框架的增益估计模块。

Description

基于采用谐波结构的OMLSA框架的神经网络降噪系统和方法
技术领域
本发明涉及声学信号降噪技术领域,具体涉及一种基于采用谐波结构的OMLSA框架的神经网络降噪系统和方法。
背景技术
现有的业界采用的主流传统降噪的技术主要是基于MMSE-LSA(Minimum Mean-Square Error Log-Spectral Amplitude Estimator)技术以及其变种的降噪算法。该算法相比于其他增益算法,在有效抑制噪声的同时能够改善了音乐噪声(Music Tone)。
LSA(Log-Spectral Amplitude Estimator)算法其核心,在于其采用了基于对数谱的最小均方作为代价函数,使其最小化来获得最优参数估计:
Figure BDA0003404150310000011
根据代价函数,获得其增益最优衰减增益,如下
Figure BDA0003404150310000012
由于MMSE-LSA是基于语音存在的假设的条件获得的,事实上,语音是否存在是不确定的。
因此在LSA的基础上又有人提出MM-LSA(multiplicatively modified LSA)的算法:
该算法在LSA基础上又乘以条件语音存在概率
GMM-LSA(k,l)=P(H1(k,l)|Y(k,l))GLSA(k,l)
其中:
语音不存在假设表示为:
H0(k,l):Y(k,l)=D(k,l)
语音存在假设表示为:
H1(k,l):Y(k,l)=X(k,l)+D(k,l)
由于MM-LSA不是最优的,且其在只有噪声情况下会造成不自然的残留噪声,所以在其基础上,又有提出基于OM-LSA(Optimize Modified LSA)的算法,其主要思想采用基于假设增益的几何加权平均方式获得估计增益:
Figure BDA0003404150310000021
其中,条件语音存在概率,如下:
Figure BDA0003404150310000022
P(H0(k,l)|Y(k,l))=1-p(k,l)
先验信噪比
Figure BDA0003404150310000023
后验信噪比
Figure BDA0003404150310000024
v(k,l)为
Figure BDA0003404150310000025
附图1是OM-LSA的降噪算法流程框图。
基于神经网络的噪声抑制及其变种
随着深度学习的发展,基于深度学习的神经网络降噪现在越来成为主流技术,通过深度学习采用数据驱动监督训练的方式,可以有效的对抗传统降噪算法无法有效处理的非稳态噪声,如:餐馆、地铁、会展等噪声;基于深度学习的降噪方案不仅降噪效果好并且能语音失真也相对较小。
附图2为一般基于深度学习的降噪方案,上半部分图为离线训练阶段流程,下半部分图为实时降噪流程。
在训练阶段:
使用干净的语音数据和噪声数据进行混音作为网络输入,把干净语音亦或者理想比值掩码IRM等作为训练的目标,根据选取特定的损失函数对网络进行训练。
在降噪阶段:
把带噪语音作为网络输入,输入到训练过的网络进行前向推理,网络获得噪声的衰减增益G(k,l)该增益最后与带噪语谱相乘最后得到降噪后语音。
发明内容
本发明提供一种基于采用谐波结构的OMLSA框架的神经网络降噪系统和方法,保留了神经网络的降噪性能,而且对一般神经网络在语音中间噪声残留大的问题有很大的改善。
本发明所要解决的技术问题是通过如下技术方案实现的:
本发明提供一种基于采用谐波结构的OMLSA框架的神经网络降噪系统,包括离线模型训练部分和在线实时降噪部分;离线模型训练部分包括语音数据集、噪声数据集、神经元网络和基于对数谱幅度损失函数;在线实时降噪部分包括短时傅里叶变化(STFT)分析和综合、基于NN-LSA的模型增益估计模块、基于谐波结构条件的语音存在概率估计模块、基于OM-LSA框架的增益估计模块。
优选的,所述基于NN-LSA的模型增益估计模块采用基于对数谱最小均方误差为代价函数来进行参数估计,即
Figure BDA0003404150310000031
优选的,所述基于NN-LSA是基于语谱图的结构化特征作为输入通过监督学习的方式获得最优参数,根据监督学习获得最优的模型来进行前向推理,获得噪声衰减增益GnnLSA(k,l)。
优选的,所述基于谐波结构条件的语音存在概率估计模块采用局部归一化的NN-LSA噪声衰减增益作为语音存在概率,即:
Figure BDA0003404150310000032
优选的,所述基于谐波结构条件的语音存在概率估计模块利用GnnLSA(k,l)在谐振点要比其临近的非谐振点要大的特点,对GnnLSA(k,l)做局部归一化处理,来估计语音存在概率。
优选的,所述基于OM-LSA框架的增益估计模块根据基于OM-LSA的增益计算框架,使用GnnLSA(k,l)替换GLSA(k,l),同时使用pharm(k,l)来替换p(k,l)最终得到如下增益计算公式
Figure BDA0003404150310000033
一种基于采用谐波结构的OMLSA框架的神经网络降噪方法,整个处理流程如下:
首先由通过短时傅里叶变化模块获得带噪语音的语谱Y(k,l)=stft(y(n));
然后通过NN-LSA模型增益估计模块估计出噪声衰减增益GnnLSA(k,l)=CRNN(abs(Y(k,l)));
估计出来的GnnLSA(k,l)经过基于谐波条件语音存在概率估计模块估计出语音存在概率p(k,l);
由OM-LSA框架增益估计模块,根据输入的Gmin(k,l),GnnLSA(k,l)和Gmin(k,l)估计出最终噪声衰减增益GomLSA(k,l);
最后通过对原始语谱做乘性衰减以后,进行STFT的综合恢复为降噪后的时域信号。
本发明的有益效果在于,在保留神经网络的降噪性能条件下对一般神经网络在语音中间噪声残留大的问题有很大的改善。
附图说明
图1是现有技术的OM-LSA流程图;
图2是现有技术的一般神经网络流程图;
图3是现有技术的OM-LSA噪声抑制语谱对照图;
图4是现有技术的基于深度学习噪声抑制语谱对照图;
图5是本发明的基于采用谐波结构的OMLSA框架的神经网络降噪系统和方法;
图6是本发明的NN-LSA推理示意图;
图7是不同降噪算法的语谱图对比(Public噪声)。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图5是本实施例的基于采用谐波结构的OMLSA框架的神经网络降噪系统和方法。本发明对基于OMLSA的基本降噪框架进行了改进,采用了基于NN-LSA的深度学习网络模型来替换基于LSA的基于信噪比的增益计算函数,并采用基于谐波结构的语音存在概率来替换基于似然比的语音存在概率的方案。
基于采用谐波结构的OMLSA框架的神经网络降噪系统方案主要分成离线模型训练部分和在线实时降噪两个部分。
离线模型训练:
训练部分本发明采用CRNN网络(也可以通过其他网络来替换),通过对干净语音和噪声信号进行混音得到人工合成的带噪语音,对该语音进行特征抽取(一般采用幅度谱或者对数谱)输入到网络对降噪的衰减增益GnnLSA(k,l)进行预测,根据OM-LSA框架的特点本网络采用对数谱均方误差作为损失函数(LSA loss function)使其最小化来使模型凸优化获得最优模型参数:
Figure BDA0003404150310000051
在线实时降噪部分:
该部分除了短时傅里叶变化(STFT)分析和综合以外,有三个重要的模块组成,分别为:基于NN-LAS的模型增益估计模块;基于谐波结构条件的语音存在概率估计模块;以及基于OM-LSA框架的增益估计模块。
整个基于采用谐波结构的OMLSA框架的神经网络降噪处理方法流程如下:
首先由通过STFT模块获得带噪语音的语谱Y(k,l)=stft(y(n));
然后通过NN-LSA增益估计模块估计出噪声衰减增益GnnLSA(k,l)=CRNN(abs(Y(k,l)));
估计出来的GnnLSA(k,l)经过基于谐波条件语音存在概率估计模块估计出语音存在概率p(k,l);
由OM-LSA增益估计模块,根据输入的Gmin(k,l),GnnLSA(k,l)和Gmin(k,l)估计出最终噪声衰减增益GomLSA(k,l);
最后通过对原始语谱做乘性衰减以后,进行STFT的综合恢复为降噪后的时域信号。
基于谐波结构条件的语音存在概率估计模块
该模块用来计算语音的存在概率,由于NN-LSA以及其他NN降噪在信噪比低的情况下语音中间噪声容易有残留特别是语音谐波之间的噪声,这会给人在听感上造成底噪不连续的感觉,本发明在OM-LSA的基础上替换了语音存在概率的计算方式,采用基于谐波结构特征的语音存在概率计算方式。
本发明采用局部归一化的NN-LSA噪声衰减增益作为语音存在概率,即:
Figure BDA0003404150310000061
该语音存在概率利用了,GnnLSA(k,l)在谐振点要比其临近的非谐振点要大的特点,对GnnLSA(k,l)做局部归一化处理,来估计语音存在概率。
NN-LSA框架的增益估计模块单元
该模块根据基于OM-LSA的增益计算框架,使用GnnLSA(k,l)替换GLSA(k,l),同时使用pharm(k,l)来替换p(k,l)最终得到如下增益计算公式:
Figure BDA0003404150310000062
NN-LSA的模型增益估计单元
附图6是本实施例的基于LSA的NN增益估计单元。根据OM-LSA的基本框架原理需要采用基于对数谱最小均方误差为代价函数来进行参数估计,即:
Figure BDA0003404150310000063
不同的是,MMSE-LSA算法是假定语音和噪声都是高斯分布的模型,根据信噪比信息来求取最优的模型降噪参数获得最优衰减增益。而基于NN-LSA是基于语谱图的结构化特征作为输入通过监督学习的方式获得最优参数,根据监督学习获得最优的模型来进行前向推理,获得噪声衰减增益GnnLSA(k,l)。
附图7是不同降噪算法的语谱图对比(Public噪声)。本发明对基于OM-LSA的基本降噪框架进行了改进,采用基于NN-LSA的深度学习网络模型作为噪声衰减增益估计器,同时结合语谱图特征以基于局部归一化的降噪增益对基于似然比的语音存在概率进行替换,作为本发明核心降噪架构。
通过实验对比,本发明不仅很好的保留了神经网络的降噪性能而且对一般神经网络在语音中间噪声残留大的问题有很大的改善。如附图7所示,从上到下分别为:原始带噪语音语谱图(Public噪声),基于OM-LSA噪声抑制效果图、基于NN-LSA噪声抑制效果图和基于NN-OM-LSA噪声抑制的效果图。
NN-OM-LSA噪声抑制算法的效果相比基于NN-LSA的噪声抑制算法效果残留回声明显变小,特别是谐波中间的噪声残留显著降低。

Claims (7)

1.一种基于采用谐波结构的OMLSA框架的神经网络降噪系统,其特征在于:包括离线模型训练部分和在线实时降噪部分;离线模型训练部分包括语音数据集、噪声数据集、神经元网络和基于对数谱幅度损失函数;在线实时降噪部分包括短时傅里叶变化分析和综合、基于NN-LSA的模型增益估计模块、基于谐波结构条件的语音存在概率估计模块、基于OM-LSA框架的增益估计模块。
2.根据权利要求1所述的基于采用谐波结构的OMLSA框架的神经网络降噪系统,其特征在于:所述基于NN-LSA的模型增益估计模块采用基于对数谱最小均方误差为代价函数来进行参数估计,即
Figure FDA0003404150300000011
3.根据权利要求1所述的基于采用谐波结构的OMLSA框架的神经网络降噪系统,其特征在于:所述基于NN-LSA是基于语谱图的结构化特征作为输入通过监督学习的方式获得最优参数,根据监督学习获得最优的模型来进行前向推理,获得噪声衰减增益GnnLSA(k,l)。
4.根据权利要求1所述的基于采用谐波结构的OMLSA框架的神经网络降噪系统,其特征在于:所述基于谐波结构条件的语音存在概率估计模块采用局部归一化的NN-LSA噪声衰减增益作为语音存在概率,即:
Figure FDA0003404150300000012
5.根据权利要求1所述的基于采用谐波结构的OMLSA框架的神经网络降噪系统,其特征在于:所述基于谐波结构条件的语音存在概率估计模块利用GnnLSA(k,l)在谐振点要比其临近的非谐振点要大的特点,对GnnLSA(k,l)做局部归一化处理,来估计语音存在概率。
6.根据权利要求1所述的基于采用谐波结构的OMLSA框架的神经网络降噪系统,其特征在于:所述基于OM-LSA框架的增益估计模块根据基于OM-LSA的增益计算框架,使用GnnLSA(k,l)替换GLSA(k,l),同时使用pharm(k,l)来替换p(k,l)最终得到如下增益计算公式
Figure FDA0003404150300000013
7.一种建立在如权利要求1所述的基于采用谐波结构的OMLSA框架的神经网络降噪系统基础上的基于采用谐波结构的OMLSA框架的神经网络降噪方法,其特征在于,整个处理流程如下:
首先由通过短时傅里叶变化模块获得带噪语音的语谱Y(k,l)=stft(y(n));
然后通过NN-LSA模型增益估计模块估计出噪声衰减增益GnnLSA(k,l)=CRNN(abs(Y(k,l)));
估计出来的GnnLSA(k,l)经过基于谐波条件语音存在概率估计模块估计出语音存在概率p(k,l);
由OM-LSA框架增益估计模块,根据输入的Gmin(k,l),GnnLSA(k,l)和Gmin(k,l)估计出最终噪声衰减增益GomLSA(k,l);
最后通过对原始语谱做乘性衰减以后,进行STFT的综合恢复为降噪后的时域信号。
CN202111508223.5A 2021-12-10 2021-12-10 基于采用谐波结构的omlsa框架的神经网络降噪系统和方法 Active CN114242095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111508223.5A CN114242095B (zh) 2021-12-10 2021-12-10 基于采用谐波结构的omlsa框架的神经网络降噪系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111508223.5A CN114242095B (zh) 2021-12-10 2021-12-10 基于采用谐波结构的omlsa框架的神经网络降噪系统和方法

Publications (2)

Publication Number Publication Date
CN114242095A true CN114242095A (zh) 2022-03-25
CN114242095B CN114242095B (zh) 2024-07-09

Family

ID=80754679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111508223.5A Active CN114242095B (zh) 2021-12-10 2021-12-10 基于采用谐波结构的omlsa框架的神经网络降噪系统和方法

Country Status (1)

Country Link
CN (1) CN114242095B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115440240A (zh) * 2022-08-31 2022-12-06 恒玄科技(上海)股份有限公司 语音降噪的训练方法、语音降噪系统及语音降噪方法
EP4258263A1 (en) * 2022-04-06 2023-10-11 Nokia Technologies Oy Apparatus and method for noise suppression

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150227A (ja) * 2011-01-18 2012-08-09 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置とその方法とプログラム
CN109065067A (zh) * 2018-08-16 2018-12-21 福建星网智慧科技股份有限公司 一种基于神经网络模型的会议终端语音降噪方法
CN110739005A (zh) * 2019-10-28 2020-01-31 南京工程学院 一种面向瞬态噪声抑制的实时语音增强方法
CN112700786A (zh) * 2020-12-29 2021-04-23 西安讯飞超脑信息科技有限公司 语音增强方法、装置、电子设备和存储介质
CN113593590A (zh) * 2021-07-23 2021-11-02 哈尔滨理工大学 一种语音中瞬态噪声的抑制方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150227A (ja) * 2011-01-18 2012-08-09 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置とその方法とプログラム
CN109065067A (zh) * 2018-08-16 2018-12-21 福建星网智慧科技股份有限公司 一种基于神经网络模型的会议终端语音降噪方法
CN110739005A (zh) * 2019-10-28 2020-01-31 南京工程学院 一种面向瞬态噪声抑制的实时语音增强方法
CN112700786A (zh) * 2020-12-29 2021-04-23 西安讯飞超脑信息科技有限公司 语音增强方法、装置、电子设备和存储介质
CN113593590A (zh) * 2021-07-23 2021-11-02 哈尔滨理工大学 一种语音中瞬态噪声的抑制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
倪峰;周翊;刘宏清;: "利用信号功率谱密度的麦克风阵列噪声消除方法", 信号处理, no. 03, 25 March 2020 (2020-03-25) *
刘凤增;李国辉;李博;: "OM-LSA和小波阈值去噪结合的语音增强", 计算机科学与探索, no. 06, 15 June 2011 (2011-06-15) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4258263A1 (en) * 2022-04-06 2023-10-11 Nokia Technologies Oy Apparatus and method for noise suppression
CN115440240A (zh) * 2022-08-31 2022-12-06 恒玄科技(上海)股份有限公司 语音降噪的训练方法、语音降噪系统及语音降噪方法

Also Published As

Publication number Publication date
CN114242095B (zh) 2024-07-09

Similar Documents

Publication Publication Date Title
CN107393550B (zh) 语音处理方法及装置
CN112735456B (zh) 一种基于dnn-clstm网络的语音增强方法
JP5102365B2 (ja) 複数マイクロホン音声アクティビティ検出器
US20210256988A1 (en) Method for Enhancing Telephone Speech Signals Based on Convolutional Neural Networks
CN114242095B (zh) 基于采用谐波结构的omlsa框架的神经网络降噪系统和方法
Saleem et al. Deepresgru: residual gated recurrent neural network-augmented kalman filtering for speech enhancement and recognition
JPH1115491A (ja) 環境的に補償されたスピーチ処理方法
KR102152197B1 (ko) 음성 검출기를 구비한 보청기 및 그 방법
Tu et al. A hybrid approach to combining conventional and deep learning techniques for single-channel speech enhancement and recognition
CN112530451A (zh) 基于去噪自编码器的语音增强方法
CN107360497B (zh) 估算混响分量的计算方法及装置
CN111341332A (zh) 基于深度神经网络的语音特征增强后置滤波方法
Zezario et al. Deep denoising autoencoder based post filtering for speech enhancement
Gao et al. A unified speaker-dependent speech separation and enhancement system based on deep neural networks
Chen Noise reduction of bird calls based on a combination of spectral subtraction, Wiener filtering, and Kalman filtering
Nie et al. Deep Noise Tracking Network: A Hybrid Signal Processing/Deep Learning Approach to Speech Enhancement.
CN107346658B (zh) 混响抑制方法及装置
CN111225317A (zh) 一种回声消除方法
CN107393553B (zh) 用于语音活动检测的听觉特征提取方法
CN108573698B (zh) 一种基于性别融合信息的语音降噪方法
Park et al. A novel approach to a robust a priori SNR estimator in speech enhancement
Tashev et al. Unified framework for single channel speech enhancement
Kothapally et al. Monaural Speech Dereverberation Using Deformable Convolutional Networks
CN103187068A (zh) 基于Kalman的先验信噪比估计方法、装置及噪声抑制方法
Prasad et al. Two microphone technique to improve the speech intelligibility under noisy environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant