CN104157295B - 用于检测及抑制瞬态噪声的方法 - Google Patents

用于检测及抑制瞬态噪声的方法 Download PDF

Info

Publication number
CN104157295B
CN104157295B CN201410418126.0A CN201410418126A CN104157295B CN 104157295 B CN104157295 B CN 104157295B CN 201410418126 A CN201410418126 A CN 201410418126A CN 104157295 B CN104157295 B CN 104157295B
Authority
CN
China
Prior art keywords
mrow
msub
noise
transient noise
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410418126.0A
Other languages
English (en)
Other versions
CN104157295A (zh
Inventor
郑成诗
厉剑
彭仁华
李晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Shanghai Advanced Research Institute of CAS
Original Assignee
Institute of Acoustics CAS
Shanghai Advanced Research Institute of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS, Shanghai Advanced Research Institute of CAS filed Critical Institute of Acoustics CAS
Priority to CN201410418126.0A priority Critical patent/CN104157295B/zh
Publication of CN104157295A publication Critical patent/CN104157295A/zh
Application granted granted Critical
Publication of CN104157295B publication Critical patent/CN104157295B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种用于检测及抑制瞬态噪声的方法,涉及声信号处理技术领域,所解决的是现有方法实时性差,及对瞬态噪声的抑制效果差的技术问题。该方法先利用传声器拾取声信号,再对声信号进行预处理,并忽略平稳态噪声残留,得到预处理后的声信号,再通过快速傅里叶变换计算每一帧的短时谱,再采用基于高采样或基于自谱相干的瞬态噪声检测方法对进行瞬态噪声检测,再采用基于语音谐波及基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,然后再计算各个帧的最终瞬态噪声抑制增益,最后再通过时域重叠相加重构各个帧。本发明提供的方法,适用于语音和音频信号,既可应用于实时语音和音频通信系统,也可以应用非实时的语音和音频信号增强中。

Description

用于检测及抑制瞬态噪声的方法
技术领域
本发明涉及声信号处理技术,特别是涉及一种用于检测及抑制瞬态噪声的方法的技术。
背景技术
当前,绝大多数的单通道语音增强方法都假定噪声的平稳特性,即噪声相对于语音信号更加平稳,可以通过噪声估计方法对平稳态噪声进行估计,最后进行平稳态噪声的抑制。多通道语音增强方法都利用目标语音和干扰噪声的空间分离度,通过波束形成等手段进行空域滤波,实现平稳态和非平稳态噪声抑制。
现有方法都采用基于监督学习的瞬态噪声抑制方法,需要通过在线或者离线监督学习瞬态噪声特性,以实现瞬态噪声的检测,最终实现瞬态噪声抑制,因此无法做到实时性,也无法适用于所有类型的瞬态噪声,对瞬态噪声的抑制效果较差,导致声信号失真严重,无法应用于实时语音通信系统中,同时该方法也不具普遍适用性。
发明内容
针对上述现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种实时性好,且对瞬态噪声的抑制效果好,能有效减少声信号失真的用于检测及抑制瞬态噪声的方法。
为了解决上述技术问题,本发明所提供的一种用于检测及抑制瞬态噪声的方法,其特征在于,具体步骤如下:
1)利用单传声器或多传声器拾取声信号;
2)对传声器所拾取的声信号进行预处理,并忽略平稳态噪声残留,得到预处理后的声信号为:
x(n)=s(n)+dt(n);
其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;
如果声信号是采用单传声器拾取的,其预处理方式为采用谱减法来抑制声信号的平稳态噪声;
如果声信号是采用多传声器拾取的,其预处理方式为先采用波束形成法来抑制方向性干扰噪声,再采用多通道后滤波法来抑制环境噪声;
3)通过快速傅里叶变换计算x(n)每一帧的短时谱,具体计算公式为:
X(k,l)=S(k,l)+Dt(k,l);
其中,X(k,l)为x(n)中的第l帧的第k个频带短时谱,S(k,l)为s(n)中的第l帧的第k个频带短时谱,Dt(k,l)为dt(n)中的第l帧的第k个频带短时谱;
4)采用基于高采样的瞬态噪声检测方法对x(n)进行瞬态噪声检测,或采用基于自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测,从而得到各个帧的初步瞬态噪声抑制增益;
5)采用基于语音谐波的保护方法进行瞬态噪声的鲁棒抑制,得出各个帧的基频及谐频对应频带的第一种增益保护函数,并采用基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,得出语音和音频时频连续性对应频带的第二种增益保护函数;
6)计算各个帧的最终瞬态噪声抑制增益,具体计算公式为:
G(k,l)=max{G1(k,l),Gp,1(k,l),Gp,2(k,l),Gmin};
其中,G(k,l)为第l帧第k个频带的最终瞬态噪声抑制增益,G1(k,l)为第l帧第k个频带的初步瞬态噪声抑制增益,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,Gmin为最大瞬态噪声抑制量,Gmin的取值在-30dB到-20dB之间,对G(k,l)进行进一步约束如下:
G(k,l)=min{G(k,l),1};
7)通过时域重叠相加重构各个帧,重构公式为:
其中,为各帧重构后得到的声信号,IFFT为逆快速傅里叶变换。
进一步的,所述步骤4)中,基于高采样的瞬态噪声检测方法的检测步骤如下:
4.1.1)对x(n)采用高采样率进行采样,设x(n)中,目标语音的频率范围为[0,fU],所采用的高采样率为fs1,则有fs1>>2fU,fs1>>2fU是指fs1在2fU的1.5倍以上;
4.1.2)利用子带分析滤波器或快速傅里叶变换,将采样样本按一帧一个子带的方式分成多个子带,并计算各个子带的能量,具体计算公式为:
其中,Enersub,p为采样样本中的第p个子带的能量,nl为计算子带能量的采样点下限,nu为计算子带能量的采样点上限,xsub,p(n)为采样样本中的第p个子带,q为指数,q取值为1为幅度求和,q取值为2为平方求和;
4.1.3)在x(n)的频率域对每个子带进行噪声能量粗略分带估算,并根据各个子带的噪声能量粗略分带估算值设定当前子带的瞬态噪声标志;
对于每一个子带,如果存在Enersub,p≥R×Noise_Enersub,p,则将该子带的瞬态噪声标志设置为1,表征当前子带具有瞬态噪声,反之则将该子带的瞬态噪声标志设置为0,表征当前子带没有瞬态噪声;
其中,R为门限,R的取值范围为5~10,Noise_Enersub,p为采样样本中的第p个子带的噪声能量粗略分带估算值;
4.1.4)降低采样率对步骤4.1.3)处理后的每个子带进行重采样后重构,设重采样的采样率为fs2,则有fs2=2fU
4.1.5)根据步骤4.1.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-F1(k,l)};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F1(k,l)为第l帧的瞬态噪声标志。
进一步的,所述步骤4)中,基于自谱相干的瞬态噪声检测方法的检测步骤如下:
4.2.1)计算每个频带的自谱相干,具体计算公式为:
其中,Cxx(k,l)为第l帧的第k个频带的自谱相干,k0和K0均为正整数,k0的取值为2或3或4,K0的典型值为8,K=[k-K0 … k+K0];
4.2.2)将每个频带的自谱相干与门限对比,检测每个频带的瞬态噪声;
对于每一个频带,如果存在Cxx(k,l)≥Cth1,则将该频带的瞬态噪声标志设置为1,表征当前帧的当前频带具有瞬态噪声,反之则将该频带的瞬态噪声标志设置为0,表征当前帧的当前频带没有瞬态噪声;
其中,Cth1是检测门限,取值范围为[0.5,1];
4.2.3)计算帧自谱相干,具体计算公式为:
其中,Cxx(l)为第l帧的自谱相干,k0是正整数,其取值为2或3或4,Kl=[klow …kup],klow的取值为11,kup是一常数;
4.2.4)将帧自谱相干与门限对比,检测每个帧的瞬态噪声:
对于每一个帧,如果存在Cxx(l)≥Cth2,则将该帧的瞬态噪声标志设置为1,表征当前帧具有瞬态噪声,反之则将该帧的瞬态噪声标志设置为0,表征当前帧没有瞬态噪声;
其中,Cth2是检测门限,其取值范围为[0.1,1];
4.2.5)根据步骤4.2.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-Fj(k,l),j=2,3};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F2(k,l)为第l帧的瞬态噪声标志,F3(k,l)为第l帧的第k个频带的瞬态噪声标志设置。
进一步的,所述步骤4.2.3)中,传声器拾取声信号的采样频率为8000Hz时,kup的取值为129,传声器拾取声信号的采样频率为16000Hz时,kup的取值为257,传声器拾取声信号的采样频率大于等于32000Hz时,kup的取值为513。
进一步的,所述步骤5)中,基于语音谐波的保护方法的计算步骤如下:
5.1.1)采用基频估计方法提取各个帧的基频,并计算基频频带,具体计算公式为:
其中,为第l帧的基频频带,f0,l为第l帧的基频,fs为传声器拾取声信号的采样频率,N为传声器拾取声信号的数据分帧帧长;
5.1.2)对各个帧的基频及谐频对应的频带进行保护,保护策略为:
对于每一个帧,如果存在则令Gp,1(k,l)=1;
其中,k为第l帧的第k个频带,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,其初始值为0;
其中,j为小于等于6的正整数。
进一步的,所述步骤5)中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的实时保护方法,该方法的计算步骤如下:
5.2.1.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,l0为帧偏移。
进一步的,所述步骤5)中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的非实时保护方法,该方法的计算步骤如下:
5.2.2.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,l0为帧偏移。
本发明提供的用于检测及抑制瞬态噪声的方法,考虑瞬态噪声的时频特性,采用高采样和自谱相干两个手段实现高瞬态噪声检测率和低虚警率的目标,不需要监督学习瞬态噪声特性,具有实时性较好的特点,还保护了清音信号及辅助保护了浊音信号,而且还利用语音和音频的时间相关性和频域相关性,同时考虑瞬态噪声的短时特性,对瞬态噪声的抑制效果好,在瞬态噪声抑制过程中还通过基于语音谐波特性的保护策略,避免语音尤其是浊音的谐波失真,通过基于信号连续性的保护策略,减少语音和音频信号的失真。
附图说明
图1是本发明实施例的用于检测及抑制瞬态噪声的方法处理单传声器所拾取的声信号的原理图;
图2是本发明实施例的用于检测及抑制瞬态噪声的方法处理多传声器所拾取的声信号的原理图;
图3是本发明实施例的用于检测及抑制瞬态噪声的方法中,基于高采样的瞬态噪声检测方法的原理图;
图4是本发明实施例的用于检测及抑制瞬态噪声的方法中,基于自谱相干的瞬态噪声检测方法的原理图;
图5是本发明实施例的用于检测及抑制瞬态噪声的方法中,进行瞬态噪声鲁棒抑制的原理图。
具体实施方式
以下结合附图说明对本发明的实施例作进一步详细描述,但本实施例并不用于限制本发明,凡是采用本发明的相似结构及其相似变化,均应列入本发明的保护范围。
如图1-图5所示,本发明实施例所提供的一种用于检测及抑制瞬态噪声的方法,其特征在于,具体步骤如下:
1)利用单传声器或多传声器拾取声信号,声信号模型公式为:
xi(n)=si(n)+ds,i(n)+dt,i(n);
其中,1≤i≤M,M为传声器的数量,xi(n)为第i个传声器拾取到的声信号,si(n)为第i个传声器拾取到的声信号中的目标语音信号(如人说话的声音),ds,i(n)为第i个传声器拾取到的声信号中的平稳态噪声(如汽车噪声),dt,i(n)为第i个传声器拾取到的声信号中的瞬态噪声(如敲击键盘、鼠标的声音);
2)对传声器所拾取的声信号进行预处理,并忽略平稳态噪声残留;
如果声信号是采用单传声器拾取的(即M=1),其预处理方式为采用谱减法来抑制声信号的平稳态噪声;
如果声信号是采用多传声器拾取的(即M>1),其预处理方式为先采用波束形成法来抑制方向性干扰噪声,再采用多通道后滤波法来抑制环境噪声;
其中,谱减法、波束形成法、后滤波法均为现有技术;
其中,波束形成法主要有固定波束形成法及自适应波束形成法,固定波束形成法主要有延迟相加(DSB:Delay-and-Sum Beamforming)、延迟滤波(DFB:Delay-and-Filtering Beaforming)及鲁棒超指向性波束形成(RSB:Robust SuperdirectiveBeamforming)等,自适应波束形成法主要有广义旁瓣抑制法(GSC:Generalized SidelobeCanceller)、最小方差无失真响应法(MVDR:Minimum Variance DistortionlessResponse)、多通道维纳滤波方法(MWF:Multi-channel Wiener Filtering);
其中,多通道后滤波法可以采用基于相位的方法、基于相干的方法或基于能量的方法等;
得到预处理后的声信号为:
x(n)=s(n)+dt(n);
其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;
3)通过快速傅里叶变换计算x(n)每一帧的短时谱,具体计算公式为:
X(k,l)=S(k,l)+Dt(k,l);
其中,X(k,l)为x(n)中的第l帧的第k个频带短时谱,S(k,l)为s(n)中的第l帧的第k个频带短时谱,Dt(k,l)为dt(n)中的第l帧的第k个频带短时谱;
4)采用基于高采样的瞬态噪声检测方法对x(n)进行瞬态噪声检测,或采用基于自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测;
4.1)基于高采样的瞬态噪声检测方法的检测步骤如下:
4.1.1)对x(n)采用高采样率进行采样,设x(n)中,目标语音的频率范围为[0,fU],所采用的高采样率为fs1,则有fs1>>2fU,fs1>>2fU是指fs1在2fU的1.5倍以上;
其中,fU常用的频率有4000Hz、5512.5Hz、8000Hz,则fs1的取值可以是22050Hz、32000Hz、44100Hz甚至48000Hz等常用的音频采样率;
4.1.2)利用子带分析滤波器或快速傅里叶变换,将采样样本按一帧一个子带的方式分成多个子带,并计算各个子带的能量,具体计算公式为:
其中,Enersub,p为采样样本中的第p个子带的能量,nl为计算子带能量的采样点下限,nu为计算子带能量的采样点上限,xsub,p(n)为采样样本中的第p个子带,q为指数,q取值为1为幅度求和,q取值为2为平方求和;
其中,利用子带分析滤波器或快速傅里叶变换将采样样本方式分成多个子带的方法为现有技术;
4.1.3)在x(n)的频率域对每个子带进行噪声能量粗略分带估算,并根据各个子带的噪声能量粗略分带估算值设定当前子带的瞬态噪声标志;
对于每一个子带,如果存在Enersub,p≥R×Noise_Enersub,p,则将该子带的瞬态噪声标志设置为1,表征当前子带具有瞬态噪声,反之则将该子带的瞬态噪声标志设置为0,表征当前子带没有瞬态噪声;
其中,R为门限,R的取值范围为5~10,Noise_Enersub,p为采样样本中的第p个子带的噪声能量粗略分带估算值;
其中,对子带进行噪声能量粗略分带估算的方法为现有技术;
4.1.4)降低采样率对步骤4.1.3)处理后的每个子带进行重采样后重构,设重采样的采样率为fs2,则有fs2=2fU
其中,fs2的取值可以是8000Hz、11025Hz、16000Hz;
4.1.5)根据步骤4.1.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-F1(k,l)};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F1(k,l)为第l帧的瞬态噪声标志;
4.2)基于自谱相干的瞬态噪声检测方法的检测步骤如下:
4.2.1)计算每个频带的自谱相干,具体计算公式为:
其中,Cxx(k,l)为第l帧的第k个频带的自谱相干,k0和K0均为正整数,k0的取值为2或3或4,K0的典型值为8,K0决定了用于计算自谱相干的频带个数,K0越大,方差越小,频率分辨率越低,K=[k-K0 … k+K0],即(k-K0)≤K≤(k+K0);
4.2.2)将每个频带的自谱相干与门限对比,检测每个频带的瞬态噪声;
对于每一个频带,如果存在Cxx(k,l)≥Cth1,则将该频带的瞬态噪声标志设置为1,表征当前帧的当前频带具有瞬态噪声,反之则将该频带的瞬态噪声标志设置为0,表征当前帧的当前频带没有瞬态噪声;
其中,Cth1是检测门限,取值范围为[0.5,1],Cth1取值越大,瞬态噪声检测概率越低,语音和音频失真越小;
4.2.3)计算帧自谱相干,具体计算公式为:
其中,Cxx(l)为第l帧的自谱相干,k0是正整数,其取值为2或3或4,Kl=[klow …kup],即klow≤K≤kup,klow的取值为11,使得频率低于300Hz的帧不用于计算自谱相干,以减少低频噪声对自谱相干的影响,kup是一常数,kup的取值由传声器拾取声信号的采样频率决定,传声器拾取声信号的采样频率越大,kup的取值也越大,传声器拾取声信号的采样频率为8000Hz时,kup的典型值为129,传声器拾取声信号的采样频率为16000Hz时,kup的典型值为257,传声器拾取声信号的采样频率大于等于32000Hz时,kup的典型值为513;
4.2.4)将帧自谱相干与门限对比,检测每个帧的瞬态噪声:
对于每一个帧,如果存在Cxx(l)≥Cth2,则将该帧的瞬态噪声标志设置为1,表征当前帧具有瞬态噪声,反之则将该帧的瞬态噪声标志设置为0,表征当前帧没有瞬态噪声;
其中,Cth2是检测门限,其取值范围为[0.1,1],Cth2取值越大,瞬态噪声检测概率越低,同时语音和音频失真越小;
4.2.5)根据步骤4.2.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-Fj(k,l),j=2,3};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F2(k,l)为第l帧的瞬态噪声标志,F3(k,l)为第l帧的第k个频带的瞬态噪声标志设置;
5)采用基于语音谐波的保护方法进行瞬态噪声的鲁棒抑制,得出各个帧的基频及谐频对应频带的第一种增益保护函数,并采用基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,得出语音和音频时频连续性对应频带的第二种增益保护函数;
瞬态噪声的鲁棒抑制方法还可以采用现有的中值滤波等其他方法;
5.1)基于语音谐波的保护方法的计算步骤如下:
5.1.1)采用基频估计方法提取各个帧的基频,并计算基频频带,具体计算公式为:
其中,为第l帧的基频频带,f0,l为第l帧的基频,fs为传声器拾取声信号的采样频率,N为传声器拾取声信号的数据分帧帧长,即计算一次快速傅里叶变换的点数;
5.1.2)对各个帧的基频及谐频对应的频带进行保护,保护策略为:
对于每一个帧,如果存在则令Gp,1(k,l)=1;
其中,k为第l帧的第k个频带,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,其初始值为0;
其中,j为小于等于6的正整数,表征基频及其谐频对应的频带,j=1时对应于基频,当j大于2时对应于第j次谐频,表征基频和谐频对应频带的临近频带,保护基频及临近频带可以减少语音失真;
5.2)基于语音和音频时频连续性的保护方法有两种,一种是基于语音和音频连续性的实时保护方法,另一种是基于语音和音频连续性的非实时保护方法;
5.2.1)基于语音和音频连续性的实时保护方法的计算步骤如下:
5.2.1.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,q的取值越大瞬态噪声抑制量也越大,语音失真也随之增大,l0为帧偏移,l0的取值与瞬态噪声持续时间、分帧长度、帧重叠等参数直接相关;
5.2.2)基于语音和音频连续性的非实时保护方法的计算步骤如下:
5.2.2.1)在频域内对谱进行平滑处理,具体处理公式为:
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,q的取值越大瞬态噪声抑制量也越大,语音失真也随之增大,l0为帧偏移,l0的取值与瞬态噪声持续时间、分帧长度、帧重叠等参数直接相关,相比基于语音和音频连续性的实时保护方法,基于语音和音频连续性的非实时保护方法利用了当前帧之后的数据帧信息进行相关的保护;
6)计算各个帧的最终瞬态噪声抑制增益,具体计算公式为:
G(k,l)=max{G1(k,l),Gp,1(k,l),Gp,2(k,l),Gmin};
其中,G(k,l)为第l帧第k个频带的最终瞬态噪声抑制增益,Gmin为最大瞬态噪声抑制量,Gmin的取值在-30dB到-20dB之间,Gmin取值越小,残留噪声愈大,语音失真越小,为了确保G(k,l)取值小于1,对G(k,l)进行进一步约束如下:
G(k,l)=min{G(k,l),1};
7)通过时域重叠相加重构各个帧,重构公式为:
其中,为各帧重构后得到的声信号,IFFT为逆快速傅里叶变换。
本发明实施例的方法对声信号的检测延迟在8ms以内,且检测瞬态噪声的概率在99%的情况下,清音误判断成瞬态噪声的概率仅不到1%,具有实时性、检测率高的特点,瞬态噪声抑制量可以达到30dB以上,而且语音失真小于3dB,有效解决了瞬态噪声(如鼠标声、键盘声、敲击声、鼓掌声等)对语音和音频信号的影响,提高了语音识别率和语音通信质量,适用于语音和音频信号,既可应用于实时语音和音频通信系统,也可以应用非实时的语音和音频信号增强中。

Claims (7)

1.一种用于检测及抑制瞬态噪声的方法,其特征在于,具体步骤如下:
1)利用单传声器或多传声器拾取声信号;
2)对传声器所拾取的声信号进行预处理,并忽略平稳态噪声残留,得到预处理后的声信号为:
x(n)=s(n)+dt(n);
其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(n)为预处理后的声信号中的瞬态噪声成分;
如果声信号是采用单传声器拾取的,其预处理方式为采用谱减法来抑制声信号的平稳态噪声;
如果声信号是采用多传声器拾取的,其预处理方式为先采用波束形成法来抑制方向性干扰噪声,再采用多通道后滤波法来抑制环境噪声;
3)通过快速傅里叶变换计算x(n)每一帧的短时谱,具体计算公式为:
X(k,l)=S(k,l)+Dt(k,l);
其中,X(k,l)为x(n)中的第l帧的第k个频带短时谱,S(k,l)为s(n)中的第l帧的第k个频带短时谱,Dt(k,l)为dt(n)中的第l帧的第k个频带短时谱;
4)采用基于高采样的瞬态噪声检测方法对x(n)进行瞬态噪声检测,或采用基于自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测,从而得到各个帧的初步瞬态噪声抑制增益;
5)采用基于语音谐波的保护方法进行瞬态噪声的鲁棒抑制,得出各个帧的基频及谐频对应频带的第一种增益保护函数,并采用基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,得出语音和音频时频连续性对应频带的第二种增益保护函数;
6)计算各个帧的最终瞬态噪声抑制增益,具体计算公式为:
G(k,l)=max{G1(k,l),Gp,1(k,l),Gp,2(k,l),Gmin};
其中,G(k,l)为第l帧第k个频带的最终瞬态噪声抑制增益,G1(k,l)为第l帧第k个频带的初步瞬态噪声抑制增益,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,Gmin为最大瞬态噪声抑制量,Gmin的取值在-30dB到-20dB之间,对G(k,l)进行进一步约束如下:
G(k,l)=min{G(k,l),1};
7)通过时域重叠相加重构各个帧,重构公式为:
<mrow> <mover> <mi>s</mi> <mo>~</mo> </mover> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>IFFT</mi> <mo>{</mo> <mi>G</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>.</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>}</mo> <mo>;</mo> </mrow>
其中,为各帧重构后得到的声信号,IFFT为逆快速傅里叶变换。
2.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤4)中,基于高采样的瞬态噪声检测方法的检测步骤如下:
4.1.1)对x(n)采用高采样率进行采样,设x(n)中,目标语音的频率范围为[0,fU],所采用的高采样率为fs1,则有fs1>>2fU,fs1>>2fU是指fs1在2fU的1.5倍以上;
4.1.2)利用子带分析滤波器或快速傅里叶变换,将采样样本按一帧一个子带的方式分成多个子带,并计算各个子带的能量,具体计算公式为:
<mrow> <msub> <mi>Ener</mi> <mrow> <mi>sub</mi> <mo>,</mo> <mi>p</mi> </mrow> </msub> <mo>=</mo> <munderover> <mi>&amp;Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <msub> <mi>n</mi> <mi>l</mi> </msub> </mrow> <msub> <mi>n</mi> <mi>u</mi> </msub> </munderover> <msup> <mrow> <mo>|</mo> <msub> <mi>x</mi> <mrow> <mi>sub</mi> <mo>,</mo> <mi>p</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mi>q</mi> </msup> <mo>;</mo> </mrow>
其中,Enersub,p为采样样本中的第p个子带的能量,nl为计算子带能量的采样点下限,nu为计算子带能量的采样点上限,xsub,p(n)为采样样本中的第p个子带,q为指数,q取值为1为幅度求和,q取值为2为平方求和;
4.1.3)在x(n)的频率域对每个子带进行噪声能量粗略分带估算,并根据各个子带的噪声能量粗略分带估算值设定当前子带的瞬态噪声标志;
对于每一个子带,如果存在Enersub,p≥R×Noise_Enersub,p,则将该子带的瞬态噪声标志设置为1,表征当前子带具有瞬态噪声,反之则将该子带的瞬态噪声标志设置为0,表征当前子带没有瞬态噪声;
其中,R为门限,R的取值范围为5~10,Noise_Enersub,p为采样样本中的第p个子带的噪声能量粗略分带估算值;
4.1.4)降低采样率对步骤4.1.3)处理后的每个子带进行重采样后重构,设重采样的采样率为fs2,则有fs2=2fU
4.1.5)根据步骤4.1.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-F1(k,l)};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F1(k,l)为第l帧的瞬态噪声标志。
3.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤4)中,基于自谱相干的瞬态噪声检测方法的检测步骤如下:
4.2.1)计算每个频带的自谱相干,具体计算公式为:
<mrow> <msub> <mi>C</mi> <mi>xx</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msup> <mrow> <mo>|</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <mi>K</mi> </mrow> </msub> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <msup> <mi>X</mi> <mo>*</mo> </msup> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <msub> <mi>k</mi> <mn>0</mn> </msub> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mrow> <msup> <mrow> <mo>|</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <mi>K</mi> </mrow> </msub> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>.</mo> <mi>l</mi> <mo>)</mo> </mrow> <msup> <mi>X</mi> <mo>*</mo> </msup> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> <msup> <mrow> <mo>|</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <mi>K</mi> </mrow> </msub> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <msub> <mi>k</mi> <mn>0</mn> </msub> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <msup> <mi>X</mi> <mo>*</mo> </msup> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <msub> <mi>K</mi> <mn>0</mn> </msub> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> </mrow> </mfrac> <mo>;</mo> </mrow>
其中,Cxx(k,l)为第l帧的第k个频带的自谱相干,k0和K0均为正整数,k0的取值为2或3或4,K0的典型值为8,K=[k-K0 … k+K0];
4.2.2)将每个频带的自谱相干与门限对比,检测每个频带的瞬态噪声;
对于每一个频带,如果存在Cxx(k,l)≥Cth1,则将该频带的瞬态噪声标志设置为1,表征当前帧的当前频带具有瞬态噪声,反之则将该频带的瞬态噪声标志设置为0,表征当前帧的当前频带没有瞬态噪声;
其中,Cth1是检测门限,取值范围为[0.5,1];
4.2.3)计算帧自谱相干,具体计算公式为:
<mrow> <msub> <mi>C</mi> <mi>xx</mi> </msub> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msup> <mrow> <mo>|</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <msub> <mi>K</mi> <mi>l</mi> </msub> </mrow> </msub> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <msup> <mi>X</mi> <mo>*</mo> </msup> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <msub> <mi>k</mi> <mn>0</mn> </msub> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mrow> <msup> <mrow> <mo>|</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <msub> <mi>K</mi> <mi>l</mi> </msub> </mrow> </msub> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>.</mo> <mi>l</mi> <mo>)</mo> </mrow> <msup> <mi>X</mi> <mo>*</mo> </msup> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> <msup> <mrow> <mo>|</mo> <msub> <mi>&amp;Sigma;</mi> <mrow> <mi>k</mi> <mo>&amp;Element;</mo> <msub> <mi>K</mi> <mi>l</mi> </msub> </mrow> </msub> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <msub> <mi>k</mi> <mn>0</mn> </msub> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <msup> <mi>X</mi> <mo>*</mo> </msup> <mrow> <mo>(</mo> <mi>k</mi> <mo>+</mo> <msub> <mi>K</mi> <mn>0</mn> </msub> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> </mrow> </mfrac> <mo>;</mo> </mrow>
其中,Cxx(l)为第l帧的自谱相干,k0是正整数,其取值为2或3或4,Kl=[klow … kup],klow的取值为11,kup是一常数;
4.2.4)将帧自谱相干与门限对比,检测每个帧的瞬态噪声:
对于每一个帧,如果存在Cxx(l)≥Cth2,则将该帧的瞬态噪声标志设置为1,表征当前帧具有瞬态噪声,反之则将该帧的瞬态噪声标志设置为0,表征当前帧没有瞬态噪声;
其中,Cth2是检测门限,其取值范围为[0.1,1];
4.2.5)根据步骤4.2.4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益为:
G1(k,l)=min{1-Fj(k,l),j=2,3};
其中,G1(k,l)为第l帧的初步瞬态噪声抑制增益,F2(k,l)为第l帧的瞬态噪声标志,F3(k,l)为第l帧的第k个频带的瞬态噪声标志设置。
4.根据权利要求3所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤4.2.3)中,传声器拾取声信号的采样频率为8000Hz时,kup的取值为129,传声器拾取声信号的采样频率为16000Hz时,kup的取值为257,传声器拾取声信号的采样频率大于等于32000Hz时,kup的取值为513。
5.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5)中,基于语音谐波的保护方法的计算步骤如下:
5.1.1)采用基频估计方法提取各个帧的基频,并计算基频频带,具体计算公式为:
<mrow> <msub> <mi>k</mi> <mrow> <msub> <mi>f</mi> <mn>0</mn> </msub> <mo>,</mo> <mi>l</mi> </mrow> </msub> <mo>=</mo> <mo>[</mo> <mfrac> <msub> <mi>f</mi> <mrow> <mn>0</mn> <mo>,</mo> <mi>l</mi> </mrow> </msub> <mrow> <msub> <mi>f</mi> <mi>s</mi> </msub> <mo>/</mo> <mi>N</mi> </mrow> </mfrac> <mo>]</mo> <mo>;</mo> </mrow>
其中,为第l帧的基频频带,f0,l为第l帧的基频,fs为传声器拾取声信号的采样频率,N为传声器拾取声信号的数据分帧帧长;
5.1.2)对各个帧的基频及谐频对应的频带进行保护,保护策略为:
对于每一个帧,如果存在则令Gp,1(k,l)=1;
其中,k为第l帧的第k个频带,Gp,1(k,l)为第l帧第k个频带的第一种增益保护函数,其初始值为0;
其中,j为小于等于6的正整数。
6.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5)中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的实时保护方法,该方法的计算步骤如下:
5.2.1.1)在频域内对谱进行平滑处理,具体处理公式为:
<mrow> <mo>|</mo> <mover> <mi>X</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>=</mo> <mi>w</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;CircleTimes;</mo> <mo>|</mo> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>;</mo> </mrow>
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
<mrow> <msub> <mi>G</mi> <mrow> <mi>p</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>min</mi> <mo>{</mo> <msup> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>|</mo> <mover> <mi>X</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>-</mo> <msub> <mi>l</mi> <mn>0</mn> </msub> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mover> <mi>X</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mi>q</mi> </msup> <msub> <mo>|</mo> <mrow> <msub> <mi>l</mi> <mn>0</mn> </msub> <mo>=</mo> <mn>3,4</mn> </mrow> </msub> <mo>}</mo> <mo>;</mo> </mrow>
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,l0为帧偏移。
7.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5)中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的非实时保护方法,该方法的计算步骤如下:
5.2.2.1)在频域内对谱进行平滑处理,具体处理公式为:
<mrow> <mo>|</mo> <mover> <mi>X</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>=</mo> <mi>w</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&amp;CircleTimes;</mo> <mo>|</mo> <mi>X</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>;</mo> </mrow>
其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗;
5.2.1.2)计算各个帧的增益保护函数,具体计算公式为:
<mrow> <msub> <mi>G</mi> <mrow> <mi>p</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>min</mi> <mo>{</mo> <msup> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>|</mo> <mover> <mi>X</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>-</mo> <msub> <mi>l</mi> <mn>0</mn> </msub> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mover> <mi>X</mi> <mo>&amp;OverBar;</mo> </mover> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mo>|</mo> </mrow> </mfrac> <mo>)</mo> </mrow> <mi>q</mi> </msup> <msub> <mo>|</mo> <mrow> <msub> <mi>l</mi> <mn>0</mn> </msub> <mo>=</mo> <mo>&amp;PlusMinus;</mo> <mn>3,</mn> <mo>&amp;PlusMinus;</mo> <mn>4</mn> </mrow> </msub> <mo>}</mo> <mo>;</mo> </mrow>
其中,Gp,2(k,l)为第l帧第k个频带的第二种增益保护函数,q为指数,q的典型取值为0.5或1或2,l0为帧偏移。
CN201410418126.0A 2014-08-22 2014-08-22 用于检测及抑制瞬态噪声的方法 Expired - Fee Related CN104157295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410418126.0A CN104157295B (zh) 2014-08-22 2014-08-22 用于检测及抑制瞬态噪声的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410418126.0A CN104157295B (zh) 2014-08-22 2014-08-22 用于检测及抑制瞬态噪声的方法

Publications (2)

Publication Number Publication Date
CN104157295A CN104157295A (zh) 2014-11-19
CN104157295B true CN104157295B (zh) 2018-03-09

Family

ID=51882777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410418126.0A Expired - Fee Related CN104157295B (zh) 2014-08-22 2014-08-22 用于检测及抑制瞬态噪声的方法

Country Status (1)

Country Link
CN (1) CN104157295B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104599677B (zh) * 2014-12-29 2018-03-09 中国科学院上海高等研究院 基于语音重建的瞬态噪声抑制方法
US9881630B2 (en) * 2015-12-30 2018-01-30 Google Llc Acoustic keystroke transient canceler for speech communication terminals using a semi-blind adaptive filter model
CN105788607B (zh) * 2016-05-20 2020-01-03 中国科学技术大学 应用于双麦克风阵列的语音增强方法
CN106052852B (zh) * 2016-06-01 2019-03-08 中国电子科技集团公司第三研究所 一种脉冲声信号的检测方法及装置
CN108597527B (zh) * 2018-04-19 2020-01-24 北京微播视界科技有限公司 多声道音频处理方法、装置、计算机可读存储介质和终端
CN108447500B (zh) * 2018-04-27 2020-08-18 深圳市沃特沃德股份有限公司 语音增强的方法与装置
CN108899043A (zh) * 2018-06-15 2018-11-27 深圳市康健助力科技有限公司 数字助听器瞬时噪声抑制算法的研究及实现
CN109215677B (zh) * 2018-08-16 2020-09-29 北京声加科技有限公司 一种适用于语音和音频的风噪检测和抑制方法和装置
CN111081269B (zh) * 2018-10-19 2022-06-14 中国移动通信集团浙江有限公司 通话过程中的噪声检测方法及系统
CN110503973B (zh) * 2019-08-28 2022-03-22 浙江大华技术股份有限公司 音频信号瞬态噪音抑制方法、系统以及存储介质
CN110689905B (zh) * 2019-09-06 2021-12-21 西安合谱声学科技有限公司 一种用于视频会议系统的语音活动检测系统
CN110838299B (zh) * 2019-11-13 2022-03-25 腾讯音乐娱乐科技(深圳)有限公司 一种瞬态噪声的检测方法、装置及设备
CN111341347B (zh) * 2020-03-11 2023-07-18 腾讯音乐娱乐科技(深圳)有限公司 一种噪声检测方法及相关设备
CN111192569B (zh) * 2020-03-30 2020-07-28 深圳市友杰智新科技有限公司 双麦语音特征提取方法、装置、计算机设备和存储介质
CN111986694B (zh) * 2020-09-01 2023-12-22 平安科技(深圳)有限公司 基于瞬态噪声抑制的音频处理方法、装置、设备及介质
CN113205826B (zh) * 2021-05-12 2022-06-07 北京百瑞互联技术有限公司 一种lc3音频噪声消除方法、装置及存储介质
CN113380266B (zh) * 2021-05-28 2022-06-28 中国电子科技集团公司第三研究所 一种微型双麦克风语音增强方法及微型双麦克风
CN113312797B (zh) * 2021-06-25 2022-11-25 西北工业大学 一种熔体超声空化强度计算方法及系统
CN115954012B (zh) * 2023-03-03 2023-05-09 成都启英泰伦科技有限公司 一种周期性瞬态干扰事件检测方法
CN115985337B (zh) * 2023-03-20 2023-09-22 全时云商务服务股份有限公司 一种基于单麦克风的瞬态噪声检测与抑制的方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102549659A (zh) * 2009-10-01 2012-07-04 高通股份有限公司 抑制音频信号中的噪声
CN103440872A (zh) * 2013-08-15 2013-12-11 大连理工大学 瞬态噪声的去噪方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9311927B2 (en) * 2011-02-03 2016-04-12 Sony Corporation Device and method for audible transient noise detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102549659A (zh) * 2009-10-01 2012-07-04 高通股份有限公司 抑制音频信号中的噪声
CN103440872A (zh) * 2013-08-15 2013-12-11 大连理工大学 瞬态噪声的去噪方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
双通道能量差后滤波语音增强算法统计分析和改进;王世伟,胡笑浒,郑成诗,李晓东;《信号处理》;20140731;第30卷(第7期);766-776 *
基于噪声谱结构特性的谱减法;郑成诗,胡笑浒等;《声学学报》;20100330;第35卷(第2期);215-222 *

Also Published As

Publication number Publication date
CN104157295A (zh) 2014-11-19

Similar Documents

Publication Publication Date Title
CN104157295B (zh) 用于检测及抑制瞬态噪声的方法
CN109215677B (zh) 一种适用于语音和音频的风噪检测和抑制方法和装置
CN105513605B (zh) 手机麦克风的语音增强系统和语音增强方法
Parchami et al. Recent developments in speech enhancement in the short-time Fourier transform domain
EP2633519B1 (en) Method and apparatus for voice activity detection
EP2372700A1 (en) A speech intelligibility predictor and applications thereof
Ganapathy et al. Robust feature extraction using modulation filtering of autoregressive models
CN105869651A (zh) 基于噪声混合相干性的双通道波束形成语音增强方法
CN103440869A (zh) 一种音频混响的抑制装置及其抑制方法
CN106782590A (zh) 基于混响环境下麦克风阵列波束形成方法
Lu Enhancement of single channel speech using perceptual-decision-directed approach
Roman et al. Pitch-based monaural segregation of reverberant speech
Yousefian et al. Using power level difference for near field dual-microphone speech enhancement
Alam et al. Perceptual improvement of Wiener filtering employing a post-filter
Nabi et al. A dual-channel noise reduction algorithm based on the coherence function and the bionic wavelet
May et al. Generalization of supervised learning for binary mask estimation
Hsu et al. Spectro-temporal subband wiener filter for speech enhancement
CN112233657A (zh) 一种基于低频音节识别的语音增强方法
Rao et al. Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration
Karimian-Azari et al. Modulation spectrum based beamforming for speech enhancement
Xu et al. Adaptive speech enhancement algorithm based on first-order differential microphone array
Chougule et al. Channel robust MFCCs for continuous speech speaker recognition
Maganti et al. A perceptual masking approach for noise robust speech recognition
Salvati et al. Improvement of acoustic localization using a short time spectral attenuation with a novel suppression rule
Mutawa Single Channel Speech Enhancement using a Complex Spectrum Method

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180309