CN110310656A - 一种语音增强方法 - Google Patents
一种语音增强方法 Download PDFInfo
- Publication number
- CN110310656A CN110310656A CN201910444187.7A CN201910444187A CN110310656A CN 110310656 A CN110310656 A CN 110310656A CN 201910444187 A CN201910444187 A CN 201910444187A CN 110310656 A CN110310656 A CN 110310656A
- Authority
- CN
- China
- Prior art keywords
- spectrum
- subband
- noise
- speech signal
- power spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Abstract
本发明提供一种语音增强方法包括如下方法步骤:采集带噪语音信号,通过加权平滑法进行噪声估计,获取噪声功率谱的估计值;在多频带谱减法中引入获取的所述噪声功率谱的估计值,对所述带噪语音信号进行处理;经过处理后的带噪语音信号,计算掩蔽阈值,并通过所述掩蔽阈值确定谱减参数;利用所述噪声功率谱的估计值,以及所确定的谱减参数对纯净语音信号进行增强。本发明提供的一种语音信号增强方法,能够提高信号的信噪比,有效抑制背景噪声,减少语音失真。
Description
技术领域
本发明涉及语音识别技术领域,特别涉及一种语音增强方法。
背景技术
语音信号作为信息最普遍的表达方式,在众多领域都有广泛的应用前景。然而,现实生活中的语音不可避免的要受到周遭环境的影响,例如通信设备内部的电噪声,各种传输媒介引入的噪声及其他说话者的影响等。
噪声降低了语音的信噪比和可懂度,严重时会使语音系统几乎无法正常工作。因此,就需要使用语音增强技术来抑制噪声的影响。语音增强的目标在于,从带噪语音中去除掉噪声,以便尽可能地提取出纯净的原始语音。近年来,语音增强技术得到了很大的发展,已经成为了语音信号数字处理的一个重要分支。
谱减法以原理简单和易于实现的优点,广泛的应用于语音增强。传统的谱减法去除背景噪声和抑制残余噪声的能力有限,影响了增强后语音信号的清晰度和可懂度。为了减小残余噪声的影响,提出了多频带谱减法。但是,单纯的采用多频谱减法,其信噪比的提高受限,其背景噪声抑制、语音失真等方面效果欠佳。
因此,为了解决现有技术中出现的上述问题,需要一种语音增强方法,提高信噪比,有效抑制背景噪声,减少语音失真。
发明内容
本发明的目的在于提供一种语音增强方法,所述方法包括如下方法步骤:
采集带噪语音信号,通过加权平滑法进行噪声估计,获取噪声功率谱的估计值;
在多频带谱减法中引入获取的所述噪声功率谱的估计值,对所述带噪语音信号进行处理;
经过处理后的带噪语音信号,计算掩蔽阈值,并通过所述掩蔽阈值确定谱减参数;
利用所述噪声功率谱的估计值,以及所确定的谱减参数对纯净语音信号进行增强。
优选地,通过加权平滑法进行噪声估计,包括如下方法步骤:
计算投影平滑后的带噪语音功率谱,平滑后的带噪语音信号功率谱通过如下方法计算:
其中,|Y(i,k)|2为带噪语音信号功率谱,i为帧号,k为采样点序号,为投影平滑因子;
通过所述带噪语音信号功率谱计算信噪比:
其中,为噪声功率谱估计值,Sp(i,k)为平滑后的带噪语音信号功率谱,i为帧号,k为采样点序号;
计算加权因子W(i,k):
其中,θ2为加权因子参数,为信噪比;
对带噪语音信号加权后,通过时域平滑计算噪声噪声功率谱的估计值:
其中,αd为平滑参数,|Y(i,k)|2为音信号功率谱。
优选地,在多频带谱减法中引入获取的所述噪声功率谱的估计值,对所述带噪语音信号进行如下处理:
将带噪语音的每一帧频谱划分为N个互不重叠的子带,对每个子带进行处理,包括:
对每一个子带的纯净语音信号功率谱进行估计:
其中,为离散频率,为第i个子带的估计的噪声功率谱,为第i个子带的带噪语音的功率谱,bi和ei为第i个子带上频点的起始点和结束点,αi为第i个子带的过减因子,δi为第i个子带的减法因子。
优选地,对每一个子带的纯净语音信号功率谱估计过程中,当估计的纯净语音信号功率谱出现负值时,将带噪语音信号功率谱乘以频谱基,作为估计的纯净语音信号功率谱。
优选地,子带的过减因子为频率子带的信噪比函数,通过如下方法计算:
其中,αi为第i个子带的过减因子,SNRi为第i个子带的信噪,满足:
其中,为离散频率,为第i个子带的估计的噪声功率谱,为第i个子带的带噪语音的功率谱,bi和ei为第i个子带上频点的起始点和结束点。
优选地,第i个子带的减法因子δi满足:
其中,fi为第i个子带的频率上界,Fs为采样频率,k为采样点序号。
优选地,对经过处理后的带噪语音信号进行噪声特性判断:
其中,SFM(i)dB为谱平坦度,和分别为功率谱的几何平均值和算术平均值,i为临界带宽号,取值与采样频率有关,
定义
当α为0时,则判该子带的信号具有噪声特性,其掩蔽阈值偏移量为5.5dB当α为1时,则判定该子带的信号具有纯净语音特性,其掩蔽阈值的偏移量为(14.5+i)dB。
优选地,通过带噪语音信号的噪声特性判断结果,计算掩蔽阈值,包括:
计算相对掩蔽阈值的偏移量:
Oi=α(14.5+i)+(1-α)5.5 i=1,2,...,imax,其中,i为临界带宽号,取值与采样频率有关,
对扩展掩蔽阈值进行估计:
其中,T′i为扩展掩蔽阈值的估计值,Ci为第i个临界带的扩展功率谱,Oi为第i个临界带的相对掩蔽阈值的偏移量;
计算绝对听阈:
其中,f为带噪信号频率;
计算掩蔽阈值:Ti=max(T′i,Ta)。
优选地,按照如下方法确定谱减参数:
其中,为谱减参数,Tmax和Tmin分别表示掩蔽阈值的最大值和最小值,和分别表示谱减参数的最大值和最小值。
优选地,通过如下方法计算纯净语音信号增强后的功率谱:
其中,S(m,k)为增强后纯净语音信号的功率谱,Y(m,k)和分别表示带噪语音信号的功率谱和估计的噪声信号功率谱,m为信号帧数,k为采样点序号,和ξ为谱减参数。
本发明提供的一种语音信号增强方法,能够提高信号的信噪比,有效抑制背景噪声,减少语音失真。
应当理解,前述大体的描述和后续详尽的描述均为示例性说明和解释,并不应当用作对本发明所要求保护内容的限制。
附图说明
参考随附的附图,本发明更多的目的、功能和优点将通过本发明实施方式的如下描述得以阐明,其中:
图1示意性示了本发明语音信号增强的流程框图。
具体实施方式
通过参考示范性实施例,本发明的目的和功能以及用于实现这些目的和功能的方法将得以阐明。然而,本发明并不受限于以下所公开的示范性实施例;可以通过不同形式来对其加以实现。说明书的实质仅仅是帮助相关领域技术人员综合理解本发明的具体细节。
在下文中,将参考附图描述本发明的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。
下面通过具体的实施例对本发明提供的一种语音增强方法进行说明。如图1所示本发明语音信号增强的流程框图,根据本发明的实施例,一种语音增强方法如下方法步骤:
采集带噪语音信号,进行预处理。
在一些实施例中,计算设备(例如降噪芯片),由数字麦克风采集带噪语音信号。带噪语音信号是指,带有背景噪声的语音信号,是一种混合由讲话者语音信号与噪声的混合语音信号。本发明的语音增强目的是就是增强带噪语音信号中的讲话者的语音信号。
语音信号是非平稳信号,采集的带噪语音信号进行加窗处理和快速傅里叶变换(FFT)。在一些实施例中,采用汉明窗做分帧处理。
噪声功率谱估计。
根据本发明的实施例,经过预处理,采集带噪语音信号,通过加权平滑法进行噪声估计,获取噪声功率谱的估计值。
在一个实施例中,通过加权平滑法进行噪声估计,包括如下方法步骤:
计算投影平滑后的带噪语音功率谱,平滑后的带噪语音信号功率谱通过如下方法计算:
其中,|Y(i,k)|2为带噪语音信号功率谱,i为帧号,k为采样点序号,为投影平滑因子;
通过带噪语音信号功率谱计算信噪比:
其中,为噪声功率谱估计值,Sp(i,k)为平滑后的带噪语音信号功率谱,i为帧号,k为采样点序号。
计算加权因子W(i,k):
其中,θ2为加权因子参数,为信噪比。
当时,认为是强语音,此时不用更新噪声。而当时,出现的可能是噪声或者是弱语音成分,此时需要更新噪声。
对带噪语音信号加权后,通过时域平滑计算噪声噪声功率谱的估计值:
其中,αd为平滑参数,|Y(i,k)|2为音信号功率谱。
多频谱减法处理。
根据本发明的实施例,在多频带谱减法中引入获取的所述噪声功率谱的估计值,对带噪语音信号进行处理。
具体地,在一些实施例中,在多频带谱减法中引入获取的噪声功率谱的估计值,对带噪语音信号进行如下处理:
将带噪语音的每一帧频谱划分为N个互不重叠的子带,对每个子带进行处理,包括:
对每一个子带的纯净语音信号功率谱进行估计:
其中,为离散频率,为第i个子带的估计的噪声功率谱,为第i个子带的带噪语音的功率谱,bi和ei为第i个子带上频点的起始点和结束点,αi为第i个子带的过减因子,δi为第i个子带的减法因子。
在一些实施例中,对每一个子带的纯净语音信号功率谱估计过程中,当估计的纯净语音信号功率谱出现负值时,将带噪语音信号功率谱乘以频谱基,作为估计的纯净语音信号功率谱。具体地,通过如下方式表述:
β为频谱基,在优选的实施例中,频谱基取值为0.002。
在一些实施例中,子带的过减因子为频率子带的信噪比函数,通过如下方法计算:
其中,αi为第i个子带的过减因子,SNRi为第i个子带的信噪比,满足:
其中,为离散频率,为第i个子带的估计的噪声功率谱,为第i个子带的带噪语音的功率谱,bi和ei为第i个子带上频点的起始点和结束点。第i个子带的减法因子δi满足:
其中,fi为第i个子带的频率上界,Fs为采样频率,k为采样点序号。
由于采集的语音信号中,绝大部分语音能量都处于低频部分,为了最小化语音失真,优选的实施例中,在低频带时减法因子取较小值。
计算掩蔽阈值,确定谱减参数。
根据本发明的实施例,经过处理后的带噪语音信号,计算掩蔽阈值,并通过掩蔽阈值确定谱减参数。
实施例中,采用bark刻度来实现将线性频率映射到人的听觉感知域,在这种映射中,频率f和线性bark刻度z的函数关系为:
z=13arctan(0.76×10-3f)+3.5arctan(f/7500)。
根据上式对频率划分,求得每个bark带在一帧信号中的能量分布,得到临界能量:
其中,n表示语音信号的帧号,bli和bhi分别表示临界带宽i的下限和上限。
bli和bhi通过频率划分和采样率求出:
N表示傅里叶变换的点数,i表示临界带宽号,取值与采样频率有关。
掩蔽音的中心频率在某个临界带内,对其他相近临界带内的被掩蔽音的掩蔽阈值有一定的影响。扩展函数就是临界带之间Bark谱对扩展谱定量的描述,扩展函数的定义:
Δ=i-j表示两个临界带频带号的差值,且Δ≤imax。
扩展Bark域的能量表述为:
Cj表示第j个临界带的扩展功率谱。
根据本发明的实施例,由于噪声和纯音的掩蔽特性的不同,需要对经过处理后的带噪语音信号进行噪声特性判断:
其中,SFM(i)dB为谱平坦度,和分别为功率谱的几何平均值和算术平均值,i为临界带宽号,取值与采样频率有关,
定义
当α为0时,则判该子带的信号具有噪声特性,其掩蔽阈值偏移量为5.5dB当α为1时,则判定该子带的信号具有纯净语音特性,其掩蔽阈值的偏移量为(14.5+i)dB。
通过带噪语音信号的噪声特性判断结果,计算掩蔽阈值,包括:
计算相对掩蔽阈值的偏移量:
Oi=α(14.5+i)+(1-α)5.5 i=1,2,...,imax,其中,i为临界带宽号,取值与采样频率有关,
在确定了相对掩蔽阈值的偏移量之后,对扩展掩蔽阈值进行估计:
其中,T′i为扩展掩蔽阈值的估计值,Ci为第i个临界带的扩展功率谱,Oi为第i个临界带的相对掩蔽阈值的偏移量。
计算绝对听阈:
其中,f为带噪语音信号频率。
计算掩蔽阈值:Ti=max(T′i,Ta)。
计算得到掩蔽阈值后,并通过掩蔽阈值确定谱减参数。根据本发明的实施例,通过掩蔽阈值自使用对谱减系数进行调整。在一些实施例中,按照如下方法确定谱减参数:
其中,为谱减参数,Tmax和Tmin分别表示掩蔽阈值的最大值和最小值,和分别表示谱减参数的最大值和最小值。在一些优选的实施例中,
纯净语音信号增强。
根据本发明的实施例,利用所噪声功率谱的估计值,以及所确定的谱减参数对纯净语音信号进行增强。
在一些实施例中,通过如下方法计算纯净语音信号增强后的功率谱:
其中,S(m,k)为增强后纯净语音信号的功率谱,Y(m,k)和分别表示带噪语音信号的功率谱和估计的噪声信号功率谱,m为信号帧数,k为采样点序号,和ξ为谱减参数。
对于谱减参数ξ采用与上述实施中谱减参数相同的方法进行确定,将不再赘述。在优选地的实施例中,在确定谱减参数ξ时,ξmax=0.02,ξmin=0。
上述对纯净语音信号进行增强过程中,增加谱减参数可以增大背景噪声的消除,同时也加大了增强后语音失真的程度。谱减参数ξ的作用是为了掩蔽残余的噪声而加的背景噪声。增加ξ会起到减少噪声的目的,但同时也加大了增强语音信号中的背景噪声水平。
随着噪声强度的增加,在不增加语音失真的前提下,掩蔽阈值不能完全掩蔽残留噪声,影响了增强语音的清晰度。
本实施例进行如下处理:当掩蔽阈值较高时,残留噪声被掩蔽而变得不可闻,因此不需要去除残留噪声,为了使语音失真度尽可能小,这种情况下减小谱减参数。
当掩蔽阈值较低时,残余噪声干扰人耳的收听,这种情况下要增大谱减参数来消除残留噪声。
纯净语音信号增强后,对信号进行快速傅里叶逆变换(IFFT),将各帧信号按序叠加后输出。
本发明提供的一种语音信号增强方法,能够提高信号的信噪比,有效抑制背景噪声,减少语音失真。
结合这里披露的本发明的说明和实践,本发明的其他实施例对于本领域技术人员都是易于想到和理解的。说明和实施例仅被认为是示例性的,本发明的真正范围和主旨均由权利要求所限定。
Claims (10)
1.一种语音增强方法,其特征在于,所述方法包括如下方法步骤:
采集带噪语音信号,通过加权平滑法进行噪声估计,获取噪声功率谱的估计值;
在多频带谱减法中引入获取的所述噪声功率谱的估计值,对所述带噪语音信号进行处理;
经过处理后的带噪语音信号,计算掩蔽阈值,并通过所述掩蔽阈值确定谱减参数;
利用所述噪声功率谱的估计值,以及所确定的谱减参数对纯净语音信号进行增强。
2.根据权利要求1所述的方法,其特征在于,通过加权平滑法进行噪声估计,包括如下方法步骤:
计算投影平滑后的带噪语音功率谱,平滑后的带噪语音信号功率谱通过如下方法计算:
其中,|Y(i,k)|2为带噪语音信号功率谱,i为帧号,k为采样点序号,为投影平滑因子;
通过所述带噪语音信号功率谱计算信噪比:
其中,为噪声功率谱估计值,Sp(i,k)为平滑后的带噪语音信号功率谱,i为帧号,k为采样点序号;
计算加权因子W(i,k):
其中,θ2为加权因子参数,为信噪比;
对带噪语音信号加权后,通过时域平滑计算噪声噪声功率谱的估计值:
其中,αd为平滑参数,|Y(i,k)|2为音信号功率谱。
3.根据权利要求1所述的方法,其特征在于,在多频带谱减法中引入获取的所述噪声功率谱的估计值,对所述带噪语音信号进行如下处理:
将带噪语音的每一帧频谱划分为N个互不重叠的子带,对每个子带进行处理,包括:
对每一个子带的纯净语音信号功率谱进行估计:
其中,为离散频率,为第i个子带的估计的噪声功率谱,为第i个子带的带噪语音的功率谱,bi和ei为第i个子带上频点的起始点和结束点,αi为第i个子带的过减因子,δi为第i个子带的减法因子。
4.根据权利要求3所述的方法,其特征在于,对每一个子带的纯净语音信号功率谱估计过程中,当估计的纯净语音信号功率谱出现负值时,将带噪语音信号功率谱乘以频谱基,作为估计的纯净语音信号功率谱。
5.根据权利要求3所述的方法,其特征在于,子带的过减因子为频率子带的信噪比函数,通过如下方法计算:
其中,αi为第i个子带的过减因子,SNRi为第i个子带的信噪,满足:
其中,为离散频率,为第i个子带的估计的噪声功率谱,为第i个子带的带噪语音的功率谱,bi和ei为第i个子带上频点的起始点和结束点。
6.根据权利要求3所述的方法,其特征在于,第i个子带的减法因子δi满足:
其中,fi为第i个子带的频率上界,Fs为采样频率,k为采样点序号。
7.根据权利要求1所述的方法,其特征在于,对经过处理后的带噪语音信号进行噪声特性判断:
其中,SFM(i)dB为谱平坦度,和分别为功率谱的几何平均值和算术平均值,i为临界带宽号,取值与采样频率有关,
定义α∈[0,1],
当α为0时,则判该子带的信号具有噪声特性,其掩蔽阈值偏移量为5.5dB当α为1时,则判定该子带的信号具有纯净语音特性,其掩蔽阈值的偏移量为(14.5+i)dB。
8.根据权利要求7所述的方法,其特征在于,通过带噪语音信号的噪声特性判断结果,计算掩蔽阈值,包括:
计算相对掩蔽阈值的偏移量:
Oi=α(14.5+i)+(1-α)5.5 i=1,2,...,imax,其中,i为临界带宽号,取值与采样频率有关,α∈[0,1];
对扩展掩蔽阈值进行估计:
其中,T′i为扩展掩蔽阈值的估计值,Ci为第i个临界带的扩展功率谱,Oi为第i个临界带的相对掩蔽阈值的偏移量;
计算绝对听阈:
其中,f为带噪信号频率;
计算掩蔽阈值:Ti=max(Ti′,Ta)。
9.根据权利8所述的方法,其特征在于,按照如下方法确定谱减参数:
其中,为谱减参数,Tmax和Tmin分别表示掩蔽阈值的最大值和最小值,和分别表示谱减参数的最大值和最小值。
10.根据权利要求1所述的方法,其特征在于,通过如下方法计算纯净语音信号增强后的功率谱:
其中,S(m,k)为增强后纯净语音信号的功率谱,Y(m,k)和分别表示带噪语音信号的功率谱和估计的噪声信号功率谱,m为信号帧数,k为采样点序号,和ξ为谱减参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910444187.7A CN110310656A (zh) | 2019-05-27 | 2019-05-27 | 一种语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910444187.7A CN110310656A (zh) | 2019-05-27 | 2019-05-27 | 一种语音增强方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110310656A true CN110310656A (zh) | 2019-10-08 |
Family
ID=68075664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910444187.7A Pending CN110310656A (zh) | 2019-05-27 | 2019-05-27 | 一种语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110310656A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827847A (zh) * | 2019-11-27 | 2020-02-21 | 高小翎 | 低信噪比见长的麦克风阵列语音去噪增强方法 |
CN111986660A (zh) * | 2020-08-26 | 2020-11-24 | 深圳信息职业技术学院 | 一种神经网络子带建模的单通道语音增强方法、系统及存储介质 |
CN112000047A (zh) * | 2020-09-07 | 2020-11-27 | 广东众科智能科技股份有限公司 | 一种远程智能化监控系统 |
CN112634929A (zh) * | 2020-12-16 | 2021-04-09 | 普联国际有限公司 | 一种语音增强方法、装置及存储介质 |
CN112652322A (zh) * | 2020-12-23 | 2021-04-13 | 江苏集萃智能集成电路设计技术研究所有限公司 | 一种语音信号增强方法 |
CN112750451A (zh) * | 2020-12-17 | 2021-05-04 | 云知声智能科技股份有限公司 | 一种提升语音听感的降噪方法 |
CN113012711A (zh) * | 2019-12-19 | 2021-06-22 | 中国移动通信有限公司研究院 | 一种语音处理方法、装置及设备 |
CN113160845A (zh) * | 2021-03-29 | 2021-07-23 | 南京理工大学 | 基于语音存在概率和听觉掩蔽效应的语音增强算法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316380A (ja) * | 2002-04-19 | 2003-11-07 | Sony Corp | 会話を含む音の信号処理を行う前の段階の処理におけるノイズリダクションシステム |
CN104464728A (zh) * | 2014-11-26 | 2015-03-25 | 河海大学 | 基于gmm噪声估计的语音增强方法 |
CN105427859A (zh) * | 2016-01-07 | 2016-03-23 | 深圳市音加密科技有限公司 | 一种用于对说话人识别的前端语音增强方法 |
CN106098077A (zh) * | 2016-07-28 | 2016-11-09 | 浙江诺尔康神经电子科技股份有限公司 | 一种带降噪的人工耳蜗言语处理系统及方法 |
CN108899052A (zh) * | 2018-07-10 | 2018-11-27 | 南京邮电大学 | 一种基于多带谱减法的帕金森语音增强方法 |
-
2019
- 2019-05-27 CN CN201910444187.7A patent/CN110310656A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003316380A (ja) * | 2002-04-19 | 2003-11-07 | Sony Corp | 会話を含む音の信号処理を行う前の段階の処理におけるノイズリダクションシステム |
CN104464728A (zh) * | 2014-11-26 | 2015-03-25 | 河海大学 | 基于gmm噪声估计的语音增强方法 |
CN105427859A (zh) * | 2016-01-07 | 2016-03-23 | 深圳市音加密科技有限公司 | 一种用于对说话人识别的前端语音增强方法 |
CN106098077A (zh) * | 2016-07-28 | 2016-11-09 | 浙江诺尔康神经电子科技股份有限公司 | 一种带降噪的人工耳蜗言语处理系统及方法 |
CN108899052A (zh) * | 2018-07-10 | 2018-11-27 | 南京邮电大学 | 一种基于多带谱减法的帕金森语音增强方法 |
Non-Patent Citations (4)
Title |
---|
冯炎: "基于加权噪声的递归平滑噪声功率谱估计", 《太赫兹科学与电子信息学报》 * |
杨榆等: "《音频信息隐藏与数字水印》", 31 December 2015 * |
罗艾洲等: "《语音增强 理论与实践》", 31 December 2012, 电子科技大学出版社 * |
阚仁根: "基于听觉掩蔽效应和噪声估计的语音增强算法", 《语音技术》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110827847A (zh) * | 2019-11-27 | 2020-02-21 | 高小翎 | 低信噪比见长的麦克风阵列语音去噪增强方法 |
CN110827847B (zh) * | 2019-11-27 | 2022-10-18 | 添津人工智能通用应用系统(天津)有限公司 | 低信噪比见长的麦克风阵列语音去噪增强方法 |
CN113012711A (zh) * | 2019-12-19 | 2021-06-22 | 中国移动通信有限公司研究院 | 一种语音处理方法、装置及设备 |
CN113012711B (zh) * | 2019-12-19 | 2024-03-22 | 中国移动通信有限公司研究院 | 一种语音处理方法、装置及设备 |
CN111986660A (zh) * | 2020-08-26 | 2020-11-24 | 深圳信息职业技术学院 | 一种神经网络子带建模的单通道语音增强方法、系统及存储介质 |
CN112000047A (zh) * | 2020-09-07 | 2020-11-27 | 广东众科智能科技股份有限公司 | 一种远程智能化监控系统 |
CN112634929A (zh) * | 2020-12-16 | 2021-04-09 | 普联国际有限公司 | 一种语音增强方法、装置及存储介质 |
CN112750451A (zh) * | 2020-12-17 | 2021-05-04 | 云知声智能科技股份有限公司 | 一种提升语音听感的降噪方法 |
CN112652322A (zh) * | 2020-12-23 | 2021-04-13 | 江苏集萃智能集成电路设计技术研究所有限公司 | 一种语音信号增强方法 |
CN113160845A (zh) * | 2021-03-29 | 2021-07-23 | 南京理工大学 | 基于语音存在概率和听觉掩蔽效应的语音增强算法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110310656A (zh) | 一种语音增强方法 | |
CN108831499B (zh) | 利用语音存在概率的语音增强方法 | |
US8010355B2 (en) | Low complexity noise reduction method | |
AU771444B2 (en) | Noise reduction apparatus and method | |
US20160066087A1 (en) | Joint noise suppression and acoustic echo cancellation | |
Kim et al. | Nonlinear enhancement of onset for robust speech recognition. | |
CN105679330B (zh) | 基于改进子带信噪比估计的数字助听器降噪方法 | |
CN105427859A (zh) | 一种用于对说话人识别的前端语音增强方法 | |
CN101901602A (zh) | 一种利用受损听力的听阈进行降噪的方法 | |
Lin et al. | Subband noise estimation for speech enhancement using a perceptual Wiener filter | |
US8509450B2 (en) | Dynamic audibility enhancement | |
CN105869652A (zh) | 心理声学模型计算方法和装置 | |
Lezzoum et al. | Noise reduction of speech signals using time-varying and multi-band adaptive gain control for smart digital hearing protectors | |
Rao et al. | Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration | |
Xu et al. | Adaptive speech enhancement algorithm based on first-order differential microphone array | |
Arehart et al. | Relationship between distortion and working memory for digital noise-reduction processing in hearing aids | |
Naik et al. | Modified magnitude spectral subtraction methods for speech enhancement | |
Rao et al. | Speech enhancement using perceptual Wiener filter combined with unvoiced speech—A new Scheme | |
Udrea et al. | A time-recursive adaptive algorithm for colored noise reduction in speech enhancement | |
Butarbutar et al. | Adaptive Wiener Filtering Method for Noise Reduction in Speech Recognition System | |
Defraene et al. | A psychoacoustically motivated speech distortion weighted multi-channel Wiener filter for noise reduction | |
Zhang et al. | A robust speech enhancement method based on microphone array | |
Zhang et al. | Post-secondary filtering improvement of GSC beamforming algorithm | |
Rao et al. | Noise reduction using Mel-SCALE spectral subtraction with perceptually defined subtraction parameters-a new scheme | |
Verteletskaya et al. | Spectral subtractive type speech enhancement methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191008 |