CN107731242A - 一种广义最大后验的谱幅度估计的增益函数语音增强方法 - Google Patents
一种广义最大后验的谱幅度估计的增益函数语音增强方法 Download PDFInfo
- Publication number
- CN107731242A CN107731242A CN201710880953.5A CN201710880953A CN107731242A CN 107731242 A CN107731242 A CN 107731242A CN 201710880953 A CN201710880953 A CN 201710880953A CN 107731242 A CN107731242 A CN 107731242A
- Authority
- CN
- China
- Prior art keywords
- noisy speech
- posteriori
- power spectrum
- gain function
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000001228 spectrum Methods 0.000 claims abstract description 146
- 230000006870 function Effects 0.000 claims description 134
- 102000003712 Complement factor B Human genes 0.000 claims description 7
- 108090000056 Complement factor B Proteins 0.000 claims description 7
- 238000007476 Maximum Likelihood Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000009795 derivation Methods 0.000 claims description 7
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 7
- 230000000750 progressive effect Effects 0.000 claims description 7
- 230000007812 deficiency Effects 0.000 abstract description 7
- 230000009286 beneficial effect Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种广义最大后验的谱幅度估计的增益函数语音增强方法,该方法通过建立含噪语音模型,短时傅里叶变换;获得含噪语音的功率谱;以及最小功率谱;计算无偏修正因子,到的结果没有说;获得噪声功率谱估计值;通过后验信噪比获得先验信噪比;计算增益函数值;得出纯净语音的估计值;动态根据含噪语音的先验信噪比计算出最佳的增益函数功能,对含噪语音采用最小跟踪估计噪声功率谱,然后动态的根据含噪语音的先验信噪比计算出最佳的增益函数,信噪比高时,广义最大后验的谱幅度估计的增益函数采用较小值防止语音失真;信噪比低时,广义最大后验的谱幅度估计的增益函数使用较大值避免抑制噪声能力不足。
Description
技术领域
本发明涉及语音信号处理领域,一种广义最大后验的谱幅度估计的增益函数语音增强方法。
背景技术
在非平稳和多种噪声并存的实际环境中,噪声的干扰往往会严重影响目标语音的获取,致使获取的语音信号不是纯净的语音信号,为了抑制噪声的影响提高语音可懂度,噪声消除技术在现代语音通信系统中是至关重要的一个功能,单通道语音增强算法以其简单的模型和廉价的成本已取得广泛的应用和成熟的发展。
从含噪语音中获取纯净语音频域的幅度谱方法,是利用频域中幅度谱的增益函数抑制含噪语音信号中的噪声成分,如何设计增益函数是提高语音质量的重要环节之一,在大多数研究中,增益函数是根据噪声和语音分布的一些假设,例如最小均方误差、维纳滤波和最大后验准则来优化的。然而,有研究表明,尽管最大后验估计量在信噪比较低时有效地降低了噪声成分,但当信噪比较高时,会带来较大的语音失真。
发明内容
针对现有技术的不足,本发明一种广义最大后验的谱幅度估计的增益函数的语音增强方法,该方法动态根据含噪语音的先验信噪比计算出最佳的增益函数功能,对含噪语音采用最小跟踪估计噪声功率谱,然后动态的根据含噪语音的先验信噪比计算出最佳的增益函数,
信噪比高时,广义最大后验的谱幅度估计的增益函数采用较小值防止语音失真;
信噪比低时,广义最大后验的谱幅度估计的增益函数使用较大值避免抑制噪声能力不足。
实现本发明目的的技术方案是:
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,包括如下步骤:
1)建立含噪语音模型;
2)对步骤1)中建立的含噪语音模型进行短时傅里叶变换;
3)利用步骤2)的含噪语音的频域获得含噪语音的功率谱;
4)利用步骤3)的含噪语音的功率谱得到含噪语音的最小功率谱;
5)利用步骤3)的含噪语音的功率谱计算无偏修正因子,到的结果没有说;
6)利用步骤4)的最小功率谱与步骤5)的结果获得噪声功率谱估计值;
7)利用步骤6)的噪声功率谱估计值及步骤3)的含噪语音的功率谱获得后验信噪比,通过后验信噪比获得先验信噪比。
8)通过最大后验的谱估计推导增益函数,利用步骤7)获得的先验信噪比计算增益函数值;
9)利用步骤8)得到的增益函数和步骤7)得到的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值;
通过上述步骤就能得到基于广义最大后验的谱幅度估计的增益函数的增强语音。
步骤1)中,麦克风接受到的含噪语音信号表示为:
y(n)=s(n)+v(n) (1)
y(n)表示含噪语音;s(n)表示纯净语音;v(n)表示噪声。
步骤2)中:由步骤1)对麦克风接收到的含噪语音进行短时傅里叶变换,获得含噪语音的频域。
Y(u,w)=S(u,w)+V(u,w) (2)
u表示帧数;w表示频率。
步骤3)中:由步骤2)利用含噪语音的频域估计含噪语音的功率谱。采用一阶递归的功率谱估计。
P(u,w)=αP(u-1,w)+(1-α)|Y(u,w)|2 (3)
步骤4)中:利用步骤3)得到的含噪语音的功率谱,计算一段含噪语音帧的含噪语音最小功率谱,即在局部搜索窗长内搜索含噪语音功率谱来计算最小功率谱,得到:
Pmin(u,w)=min{P(u,w),P(u-1,w),…P(u-D+1,w)} (4)
式中Pmin(u,w)含噪语音最小功率谱,Pmin(u,w)的计算是基于P(u,w)在 {u,u-1,…u-D+1}上计算,其中D为过去帧的帧数;
步骤5)中:由于步骤4)得到的Pmin(u,w)总会小于噪声平均值,利用无偏修正因子Bmin(u,w)进行修正噪声功率谱,而无偏修正因子与步骤 4)中过去帧数D有关,Bmin(u,w)的值会随着D的变化而变化。Martin 通过渐进求取的方法计算无偏修正因子Bmin(u,w)的近似值,Bmin(u,w)表示为:
步骤6)中:利用步骤4)与步骤5)得到的含噪语音最小功率谱及无偏因子估计噪声功率谱。噪声功率谱估计值由含噪语音的最小功率谱与无偏因子的乘积获得,因此噪声功率谱估计值为:
PV(u,w)=Pmin(u,w)Bmin(u,w) (6)
步骤7)中:通过步骤3)得到的含噪语音的功率谱与步骤6)得到的噪声功率谱获得后验信噪比以及通过后验信噪比获得先验信噪比。
γ(u,w)为后验信噪比;ξ(u,w)为先验信噪比;PS(u,w)为纯净语音功率谱估计值。
引入平滑因子λ,通过前一帧的先验信噪比及当前帧的后验信噪比获得当前帧的先验信噪比。
ξ(u,w)=λξ(u-1,w)+(1-λ)(γ(u,w)-1) (9)
步骤8)中:由广义最大后验的谱幅度估计推导增益函数
Sk=|S(u,w)|为纯净语音的幅度;JGMAPA(Sk)是最大后验的代价函数,定义为:
JGMAPA(Sk)=ln{p(Y|Sk)[p(Sk)]η} (11)
p(Y|Sk)表示最大似然;p(Sk)是由瑞利分布建模的表示先验概率;
假设含噪语音与纯净语音的的幅度谱不相关,p(Y|Sk)表示为
Yk=|Y(u,w)|表示含噪语音的幅度;σV 2=PV(u,w)表示噪声幅度。
因此代价函数表示为:
上式中σS 2表示PS(u,w)。
对代价函数求导,使其得出:
一种广义最大后验的谱幅度估计的增益函数语音增强方法
技术领域
本发明涉及语音信号处理领域,一种广义最大后验的谱幅度估计的增益函数语音增强方法。
背景技术
在非平稳和多种噪声并存的实际环境中,噪声的干扰往往会严重影响目标语音的获取,致使获取的语音信号不是纯净的语音信号,为了抑制噪声的影响提高语音可懂度,噪声消除技术在现代语音通信系统中是至关重要的一个功能,单通道语音增强算法以其简单的模型和廉价的成本已取得广泛的应用和成熟的发展。
从含噪语音中获取纯净语音频域的幅度谱方法,是利用频域中幅度谱的增益函数抑制含噪语音信号中的噪声成分,如何设计增益函数是提高语音质量的重要环节之一,在大多数研究中,增益函数是根据噪声和语音分布的一些假设,例如最小均方误差、维纳滤波和最大后验准则来优化的。然而,有研究表明,尽管最大后验估计量在信噪比较低时有效地降低了噪声成分,但当信噪比较高时,会带来较大的语音失真。
发明内容
针对现有技术的不足,本发明一种广义最大后验的谱幅度估计的增益函数的语音增强方法,该方法动态根据含噪语音的先验信噪比计算出最佳的增益函数功能,对含噪语音采用最小跟踪估计噪声功率谱,然后动态的根据含噪语音的先验信噪比计算出最佳的增益函数,
信噪比高时,广义最大后验的谱幅度估计的增益函数采用较小值防止语音失真;
信噪比低时,广义最大后验的谱幅度估计的增益函数使用较大值避免抑制噪声能力不足。
实现本发明目的的技术方案是:
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,包括如下步骤:
4)建立含噪语音模型;
5)对步骤1)中建立的含噪语音模型进行短时傅里叶变换;
6)利用步骤2)的含噪语音的频域获得含噪语音的功率谱;
4)利用步骤3)的含噪语音的功率谱得到含噪语音的最小功率谱;
10)利用步骤3)的含噪语音的功率谱计算无偏修正因子,到的结果没有说;
11)利用步骤4)的最小功率谱与步骤5)的结果获得噪声功率谱估计值;
12)利用步骤6)的噪声功率谱估计值及步骤3)的含噪语音的功率谱获得后验信噪比,通过后验信噪比获得先验信噪比。
13)通过最大后验的谱估计推导增益函数,利用步骤7)获得的先验信噪比计算增益函数值;
14)利用步骤8)得到的增益函数和步骤7)得到的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值;
通过上述步骤就能得到基于广义最大后验的谱幅度估计的增益函数的增强语音。
步骤1)中,麦克风接受到的含噪语音信号表示为:
y(n)=s(n)+v(n) (1)
y(n)表示含噪语音;s(n)表示纯净语音;v(n)表示噪声。
步骤2)中:由步骤1)对麦克风接收到的含噪语音进行短时傅里叶变换,获得含噪语音的频域。
Y(u,w)=S(u,w)+V(u,w) (2)
u表示帧数;w表示频率。
步骤3)中:由步骤2)利用含噪语音的频域估计含噪语音的功率谱。采用一阶递归的功率谱估计。
P(u,w)=αP(u-1,w)+(1-α)|Y(u,w)|2 (3)
步骤4)中:利用步骤3)得到的含噪语音的功率谱,计算一段含噪语音帧的含噪语音最小功率谱,即在局部搜索窗长内搜索含噪语音功率谱来计算最小功率谱,得到:
Pmin(u,w)=min{P(u,w),P(u-1,w),…P(u-D+1,w)} (4)
式中Pmin(u,w)含噪语音最小功率谱,Pmin(u,w)的计算是基于P(u,w)在 {u,u-1,…u-D+1}上计算,其中D为过去帧的帧数;
步骤5)中:由于步骤4)得到的Pmin(u,w)总会小于噪声平均值,利用无偏修正因子Bmin(u,w)进行修正噪声功率谱,而无偏修正因子与步骤 4)中过去帧数D有关,Bmin(u,w)的值会随着D的变化而变化。Martin 通过渐进求取的方法计算无偏修正因子Bmin(u,w)的近似值,Bmin(u,w)表示为:
步骤6)中:利用步骤4)与步骤5)得到的含噪语音最小功率谱及无偏因子估计噪声功率谱。噪声功率谱估计值由含噪语音的最小功率谱与无偏因子的乘积获得,因此噪声功率谱估计值为:
PV(u,w)=Pmin(u,w)Bmin(u,w) (6)
步骤7)中:通过步骤3)得到的含噪语音的功率谱与步骤6)得到的噪声功率谱获得后验信噪比以及通过后验信噪比获得先验信噪比。
γ(u,w)为后验信噪比;ξ(u,w)为先验信噪比;PS(u,w)为纯净语音功率谱估计值。
引入平滑因子λ,通过前一帧的先验信噪比及当前帧的后验信噪比获得当前帧的先验信噪比。
ξ(u,w)=λξ(u-1,w)+(1-λ)(γ(u,w)-1) (9)
步骤8)中:由广义最大后验的谱幅度估计推导增益函数
Sk=|S(u,w)|为纯净语音的幅度;JGMAPA(Sk)是最大后验的代价函数,定义为:
JGMAPA(Sk)=ln{p(Y|Sk)[p(Sk)]η} (11)
p(Y|Sk)表示最大似然;p(Sk)是由瑞利分布建模的表示先验概率;
假设含噪语音与纯净语音的的幅度谱不相关,p(Y|Sk)表示为
Yk=|Y(u,w)|表示含噪语音的幅度;σV 2=PV(u,w)表示噪声幅度。
因此代价函数表示为:
上式中σS 2表示PS(u,w)。
对代价函数求导,使其得出:
ξ表示ξ(u,w);γ表示γ(u,w)。
因此增益函数为:
步骤9)中:利用步骤8)得到的增益函数、步骤7)的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值:
S(u,w)=G(u,w)Y(u,w) (16)
有益效果
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,该方法动态根据含噪语音的先验信噪比计算出最佳的增益函数功能,对含噪语音采用最小跟踪估计噪声功率谱,然后动态的根据含噪语音的先验信噪比计算出最佳的增益函数,
信噪比高时,广义最大后验的谱幅度估计的增益函数采用较小值防止语音失真;
信噪比低时,广义最大后验的谱幅度估计的增益函数使用较大值避免抑制噪声能力不足。
具体实施方式
下列结合对本发明内容作进一步的阐述,但不是对本发明的限定。
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,包括如下步骤:
1)建立含噪语音模型;
2)对步骤1)中建立的含噪语音模型进行短时傅里叶变换;
3)利用步骤2)的含噪语音的频域获得含噪语音的功率谱;
4)利用步骤3)的含噪语音的功率谱得到含噪语音的最小功率谱;
5)利用步骤3)的含噪语音的功率谱计算无偏修正因子,到的结果没有说;
6)利用步骤4)的最小功率谱与步骤5)的结果获得噪声功率谱估计值;
7)利用步骤6)的噪声功率谱估计值及步骤3)的含噪语音的功率谱获得后验信噪比,通过后验信噪比获得先验信噪比。
8)通过最大后验的谱估计推导增益函数,利用步骤7)获得的先验信噪比计算增益函数值;
9)利用步骤8)得到的增益函数和步骤7)得到的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值;
通过上述步骤就能得到基于广义最大后验的谱幅度估计的增益函数的增强语音。(需要点题)
步骤1)中,麦克风接受到的含噪语音信号表示为:
y(n)=s(n)+v(n) (1)
y(n)表示含噪语音;s(n)表示纯净语音;v(n)表示噪声。
步骤2)中:由步骤1)对麦克风接收到的含噪语音进行短时傅里叶变换,获得含噪语音的频域。
Y(u,w)=S(u,w)+V(u,w) (2)
u表示帧数;w表示频率。
步骤3)中:由步骤2)利用含噪语音的频域估计含噪语音的功率谱。采用一阶递归的功率谱估计。
P(u,w)=αP(u-1,w)+(1-α)|Y(u,w)|2 (3)
步骤4)中:利用步骤3)得到的含噪语音的功率谱,计算一段含噪语音帧的含噪语音最小功率谱,即在局部搜索窗长内搜索含噪语音功率谱来计算最小功率谱,得到:
Pmin(u,w)=min{P(u,w),P(u-1,w),…P(u-D+1,w)} (4)
式中Pmin(u,w)含噪语音最小功率谱,Pmin(u,w)的计算是基于P(u,w)在 {u,u-1,…u-D+1}上计算,其中D为过去帧的帧数;
步骤5)中:由于步骤4)得到的Pmin(u,w)总会小于噪声平均值,利用无偏修正因子Bmin(u,w)进行修正噪声功率谱,而无偏修正因子与步骤4) 中过去帧数D有关,Bmin(u,w)的值会随着D的变化而变化。Martin通过渐进求取的方法计算无偏修正因子Bmin(u,w)的近似值,Bmin(u,w)表示为:
步骤6)中:利用步骤4)与步骤5)得到的含噪语音最小功率谱及无偏因子估计噪声功率谱。噪声功率谱估计值由含噪语音的最小功率谱与无偏因子的乘积获得,因此噪声功率谱估计值为:
PV(u,w)=Pmin(u,w)Bmin(u,w) (6)
步骤7)中:通过步骤3)得到的含噪语音的功率谱与步骤6)得到的噪声功率谱获得后验信噪比以及通过后验信噪比获得先验信噪比。
γ(u,w)为后验信噪比;ξ(u,w)为先验信噪比;PS(u,w)为纯净语音功率谱估计值。
引入平滑因子λ,通过前一帧的先验信噪比及当前帧的后验信噪比获得当前帧的先验信噪比。
ξ(u,w)=λξ(u-1,w)+(1-λ)(γ(u,w)-1) (9)
步骤8)中:由广义最大后验的谱幅度估计推导增益函数
Sk=|S(u,w)|为纯净语音的幅度;JGMAPA(Sk)是最大后验的代价函数,定义为:
JGMAPA(Sk)=ln{p(Y|Sk)[p(Sk)]η} (11)
p(Y|Sk)表示最大似然;p(Sk)是由瑞利分布建模的表示先验概率;
假设含噪语音与纯净语音的的幅度谱不相关,p(Y|Sk)表示为
一种广义最大后验的谱幅度估计的增益函数语音增强方法
技术领域
本发明涉及语音信号处理领域,一种广义最大后验的谱幅度估计的增益函数语音增强方法。
背景技术
在非平稳和多种噪声并存的实际环境中,噪声的干扰往往会严重影响目标语音的获取,致使获取的语音信号不是纯净的语音信号,为了抑制噪声的影响提高语音可懂度,噪声消除技术在现代语音通信系统中是至关重要的一个功能,单通道语音增强算法以其简单的模型和廉价的成本已取得广泛的应用和成熟的发展。
从含噪语音中获取纯净语音频域的幅度谱方法,是利用频域中幅度谱的增益函数抑制含噪语音信号中的噪声成分,如何设计增益函数是提高语音质量的重要环节之一,在大多数研究中,增益函数是根据噪声和语音分布的一些假设,例如最小均方误差、维纳滤波和最大后验准则来优化的。然而,有研究表明,尽管最大后验估计量在信噪比较低时有效地降低了噪声成分,但当信噪比较高时,会带来较大的语音失真。
发明内容
针对现有技术的不足,本发明一种广义最大后验的谱幅度估计的增益函数的语音增强方法,该方法动态根据含噪语音的先验信噪比计算出最佳的增益函数功能,对含噪语音采用最小跟踪估计噪声功率谱,然后动态的根据含噪语音的先验信噪比计算出最佳的增益函数,
信噪比高时,广义最大后验的谱幅度估计的增益函数采用较小值防止语音失真;
信噪比低时,广义最大后验的谱幅度估计的增益函数使用较大值避免抑制噪声能力不足。
实现本发明目的的技术方案是:
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,包括如下步骤:
7)建立含噪语音模型;
8)对步骤1)中建立的含噪语音模型进行短时傅里叶变换;
9)利用步骤2)的含噪语音的频域获得含噪语音的功率谱;
4)利用步骤3)的含噪语音的功率谱得到含噪语音的最小功率谱;
15)利用步骤3)的含噪语音的功率谱计算无偏修正因子,到的结果没有说;
16)利用步骤4)的最小功率谱与步骤5)的结果获得噪声功率谱估计值;
17)利用步骤6)的噪声功率谱估计值及步骤3)的含噪语音的功率谱获得后验信噪比,通过后验信噪比获得先验信噪比。
18)通过最大后验的谱估计推导增益函数,利用步骤7)获得的先验信噪比计算增益函数值;
19)利用步骤8)得到的增益函数和步骤7)得到的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值;
通过上述步骤就能得到基于广义最大后验的谱幅度估计的增益函数的增强语音。
步骤1)中,麦克风接受到的含噪语音信号表示为:
y(n)=s(n)+v(n) (1)
y(n)表示含噪语音;s(n)表示纯净语音;v(n)表示噪声。
步骤2)中:由步骤1)对麦克风接收到的含噪语音进行短时傅里叶变换,获得含噪语音的频域。
Y(u,w)=S(u,w)+V(u,w) (2)
u表示帧数;w表示频率。
步骤3)中:由步骤2)利用含噪语音的频域估计含噪语音的功率谱。采用一阶递归的功率谱估计。
P(u,w)=αP(u-1,w)+(1-α)|Y(u,w)|2 (3)
步骤4)中:利用步骤3)得到的含噪语音的功率谱,计算一段含噪语音帧的含噪语音最小功率谱,即在局部搜索窗长内搜索含噪语音功率谱来计算最小功率谱,得到:
Pmin(u,w)=min{P(u,w),P(u-1,w),…P(u-D+1,w)} (4)
式中Pmin(u,w)含噪语音最小功率谱,Pmin(u,w)的计算是基于P(u,w)在 {u,u-1,…u-D+1}上计算,其中D为过去帧的帧数;
步骤5)中:由于步骤4)得到的Pmin(u,w)总会小于噪声平均值,利用无偏修正因子Bmin(u,w)进行修正噪声功率谱,而无偏修正因子与步骤 4)中过去帧数D有关,Bmin(u,w)的值会随着D的变化而变化。Martin 通过渐进求取的方法计算无偏修正因子Bmin(u,w)的近似值,Bmin(u,w)表示为:
步骤6)中:利用步骤4)与步骤5)得到的含噪语音最小功率谱及无偏因子估计噪声功率谱。噪声功率谱估计值由含噪语音的最小功率谱与无偏因子的乘积获得,因此噪声功率谱估计值为:
PV(u,w)=Pmin(u,w)Bmin(u,w) (6)
步骤7)中:通过步骤3)得到的含噪语音的功率谱与步骤6)得到的噪声功率谱获得后验信噪比以及通过后验信噪比获得先验信噪比。
γ(u,w)为后验信噪比;ξ(u,w)为先验信噪比;PS(u,w)为纯净语音功率谱估计值。
引入平滑因子λ,通过前一帧的先验信噪比及当前帧的后验信噪比获得当前帧的先验信噪比。
ξ(u,w)=λξ(u-1,w)+(1-λ)(γ(u,w)-1) (9)
步骤8)中:由广义最大后验的谱幅度估计推导增益函数
Sk=|S(u,w)|为纯净语音的幅度;JGMAPA(Sk)是最大后验的代价函数,定义为:
JGMAPA(Sk)=ln{p(Y|Sk)[p(Sk)]η} (11)
p(Y|Sk)表示最大似然;p(Sk)是由瑞利分布建模的表示先验概率;
假设含噪语音与纯净语音的的幅度谱不相关,p(Y|Sk)表示为
Yk=|Y(u,w)|表示含噪语音的幅度;σV 2=PV(u,w)表示噪声幅度。
因此代价函数表示为:
上式中σS 2表示PS(u,w)。
对代价函数求导,使其得出:
ξ表示ξ(u,w);γ表示γ(u,w)。
因此增益函数为:
步骤9)中:利用步骤8)得到的增益函数、步骤7)的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值:
S(u,w)=G(u,w)Y(u,w) (16)
有益效果
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,该方法动态根据含噪语音的先验信噪比计算出最佳的增益函数功能,对含噪语音采用最小跟踪估计噪声功率谱,然后动态的根据含噪语音的先验信噪比计算出最佳的增益函数,
信噪比高时,广义最大后验的谱幅度估计的增益函数采用较小值防止语音失真;
信噪比低时,广义最大后验的谱幅度估计的增益函数使用较大值避免抑制噪声能力不足。
具体实施方式
下列结合对本发明内容作进一步的阐述,但不是对本发明的限定。
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,包括如下步骤:
4)建立含噪语音模型;
5)对步骤1)中建立的含噪语音模型进行短时傅里叶变换;
6)利用步骤2)的含噪语音的频域获得含噪语音的功率谱;
4)利用步骤3)的含噪语音的功率谱得到含噪语音的最小功率谱;
5)利用步骤3)的含噪语音的功率谱计算无偏修正因子,到的结果没有说;
6)利用步骤4)的最小功率谱与步骤5)的结果获得噪声功率谱估计值;
7)利用步骤6)的噪声功率谱估计值及步骤3)的含噪语音的功率谱获得后验信噪比,通过后验信噪比获得先验信噪比。
8)通过最大后验的谱估计推导增益函数,利用步骤7)获得的先验信噪比计算增益函数值;
9)利用步骤8)得到的增益函数和步骤7)得到的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值;
通过上述步骤就能得到基于广义最大后验的谱幅度估计的增益函数的增强语音。(需要点题)
步骤1)中,麦克风接受到的含噪语音信号表示为:
y(n)=s(n)+v(n) (1)
y(n)表示含噪语音;s(n)表示纯净语音;v(n)表示噪声。
步骤2)中:由步骤1)对麦克风接收到的含噪语音进行短时傅里叶变换,获得含噪语音的频域。
Y(u,w)=S(u,w)+V(u,w) (2)
u表示帧数;w表示频率。
步骤3)中:由步骤2)利用含噪语音的频域估计含噪语音的功率谱。采用一阶递归的功率谱估计。
P(u,w)=αP(u-1,w)+(1-α)|Y(u,w)|2 (3)
步骤4)中:利用步骤3)得到的含噪语音的功率谱,计算一段含噪语音帧的含噪语音最小功率谱,即在局部搜索窗长内搜索含噪语音功率谱来计算最小功率谱,得到:
Pmin(u,w)=min{P(u,w),P(u-1,w),…P(u-D+1,w)} (4)
式中Pmin(u,w)含噪语音最小功率谱,Pmin(u,w)的计算是基于P(u,w)在{u,u-1,…u-D+1}上计算,其中D为过去帧的帧数;
步骤5)中:由于步骤4)得到的Pmin(u,w)总会小于噪声平均值,利用无偏修正因子Bmin(u,w)进行修正噪声功率谱,而无偏修正因子与步骤4) 中过去帧数D有关,Bmin(u,w)的值会随着D的变化而变化。Martin通过渐进求取的方法计算无偏修正因子Bmin(u,w)的近似值,Bmin(u,w)表示为:
步骤6)中:利用步骤4)与步骤5)得到的含噪语音最小功率谱及无偏因子估计噪声功率谱。噪声功率谱估计值由含噪语音的最小功率谱与无偏因子的乘积获得,因此噪声功率谱估计值为:
PV(u,w)=Pmin(u,w)Bmin(u,w) (6)
步骤7)中:通过步骤3)得到的含噪语音的功率谱与步骤6)得到的噪声功率谱获得后验信噪比以及通过后验信噪比获得先验信噪比。
γ(u,w)为后验信噪比;ξ(u,w)为先验信噪比;PS(u,w)为纯净语音功率谱估计值。
引入平滑因子λ,通过前一帧的先验信噪比及当前帧的后验信噪比获得当前帧的先验信噪比。
ξ(u,w)=λξ(u-1,w)+(1-λ)(γ(u,w)-1) (9)
步骤8)中:由广义最大后验的谱幅度估计推导增益函数
Sk=|S(u,w)|为纯净语音的幅度;JGMAPA(Sk)是最大后验的代价函数,定义为:
JGMAPA(Sk)=ln{p(Y|Sk)[p(Sk)]η} (11)
p(Y|Sk)表示最大似然;p(Sk)是由瑞利分布建模的表示先验概率;
假设含噪语音与纯净语音的的幅度谱不相关,p(Y|Sk)表示为
Yk=|Y(u,w)|表示含噪语音的幅度;σV 2=PV(u,w)表示噪声幅度。
因此代价函数表示为:
上式中σS 2表示PS(u,w)。
对代价函数求导,使其得出:
ξ表示ξ(u,w);γ表示γ(u,w)。
因此增益函数为:
步骤9)中:利用步骤8)得到的增益函数、步骤7)的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值:
S(u,w)=G(u,w)Y(u,w) (16)
Yk=|Y(u,w)|表示含噪语音的幅度;σV 2=PV(u,w)表示噪声幅度。
因此代价函数表示为:
上式中σS 2表示PS(u,w)。
对代价函数求导,使其得出:
ξ表示ξ(u,w);γ表示γ(u,w)。
因此增益函数为:
步骤9)中:利用步骤8)得到的增益函数、步骤7)的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值:
S(u,w)=G(u,w)Y(u,w) (16)
ξ表示ξ(u,w);γ表示γ(u,w)。
因此增益函数为:
步骤9)中:利用步骤8)得到的增益函数、步骤7)的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值:
S(u,w)=G(u,w)Y(u,w) (16)
有益效果
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,该方法动态根据含噪语音的先验信噪比计算出最佳的增益函数功能,对含噪语音采用最小跟踪估计噪声功率谱,然后动态的根据含噪语音的先验信噪比计算出最佳的增益函数,
信噪比高时,广义最大后验的谱幅度估计的增益函数采用较小值防止语音失真;
信噪比低时,广义最大后验的谱幅度估计的增益函数使用较大值避免抑制噪声能力不足。
具体实施方式
下列结合对本发明内容作进一步的阐述,但不是对本发明的限定。
一种广义最大后验的谱幅度估计的增益函数的语音增强方法,包括如下步骤:
1)建立含噪语音模型;
2)对步骤1)中建立的含噪语音模型进行短时傅里叶变换;
3)利用步骤2)的含噪语音的频域获得含噪语音的功率谱;
4)利用步骤3)的含噪语音的功率谱得到含噪语音的最小功率谱;
5)利用步骤3)的含噪语音的功率谱计算无偏修正因子,到的结果没有说;
6)利用步骤4)的最小功率谱与步骤5)的结果获得噪声功率谱估计值;
7)利用步骤6)的噪声功率谱估计值及步骤3)的含噪语音的功率谱获得后验信噪比,通过后验信噪比获得先验信噪比。
8)通过最大后验的谱估计推导增益函数,利用步骤7)获得的先验信噪比计算增益函数值;
9)利用步骤8)得到的增益函数和步骤7)得到的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值;
通过上述步骤就能得到基于广义最大后验的谱幅度估计的增益函数的增强语音。
步骤1)中,麦克风接受到的含噪语音信号表示为:
y(n)=s(n)+v(n) (1)
y(n)表示含噪语音;s(n)表示纯净语音;v(n)表示噪声。
步骤2)中:由步骤1)对麦克风接收到的含噪语音进行短时傅里叶变换,获得含噪语音的频域。
Y(u,w)=S(u,w)+V(u,w) (2)
u表示帧数;w表示频率。
步骤3)中:由步骤2)利用含噪语音的频域估计含噪语音的功率谱。采用一阶递归的功率谱估计。
P(u,w)=αP(u-1,w)+(1-α)|Y(u,w)|2 (3)
步骤4)中:利用步骤3)得到的含噪语音的功率谱,计算一段含噪语音帧的含噪语音最小功率谱,即在局部搜索窗长内搜索含噪语音功率谱来计算最小功率谱,得到:
Pmin(u,w)=min{P(u,w),P(u-1,w),…P(u-D+1,w)} (4)
式中Pmin(u,w)含噪语音最小功率谱,Pmin(u,w)的计算是基于P(u,w)在 {u,u-1,…u-D+1}上计算,其中D为过去帧的帧数;
步骤5)中:由于步骤4)得到的Pmin(u,w)总会小于噪声平均值,利用无偏修正因子Bmin(u,w)进行修正噪声功率谱,而无偏修正因子与步骤4) 中过去帧数D有关,Bmin(u,w)的值会随着D的变化而变化。Martin通过渐进求取的方法计算无偏修正因子Bmin(u,w)的近似值,Bmin(u,w)表示为:
步骤6)中:利用步骤4)与步骤5)得到的含噪语音最小功率谱及无偏因子估计噪声功率谱。噪声功率谱估计值由含噪语音的最小功率谱与无偏因子的乘积获得,因此噪声功率谱估计值为:
PV(u,w)=Pmin(u,w)Bmin(u,w) (6)
步骤7)中:通过步骤3)得到的含噪语音的功率谱与步骤6)得到的噪声功率谱获得后验信噪比以及通过后验信噪比获得先验信噪比。
γ(u,w)为后验信噪比;ξ(u,w)为先验信噪比;PS(u,w)为纯净语音功率谱估计值。
引入平滑因子λ,通过前一帧的先验信噪比及当前帧的后验信噪比获得当前帧的先验信噪比。
ξ(u,w)=λξ(u-1,w)+(1-λ)(γ(u,w)-1) (9)
步骤8)中:由广义最大后验的谱幅度估计推导增益函数
Sk=|S(u,w)|为纯净语音的幅度;JGMAPA(Sk)是最大后验的代价函数,定义为:
JGMAPA(Sk)=ln{p(Y|Sk)[p(Sk)]η} (11)
p(Y|Sk)表示最大似然;p(Sk)是由瑞利分布建模的表示先验概率;
假设含噪语音与纯净语音的的幅度谱不相关,p(Y|Sk)表示为
Yk=|Y(u,w)|表示含噪语音的幅度;σV 2=PV(u,w)表示噪声幅度。
因此代价函数表示为:
上式中σS 2表示PS(u,w)。
对代价函数求导,使其得出:
ξ表示ξ(u,w);γ表示γ(u,w)。
因此增益函数为:
步骤9)中:利用步骤8)得到的增益函数、步骤7)的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值:
S(u,w)=G(u,w)Y(u,w) (16)。
Claims (10)
1.一种广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,包括如下步骤:
1)建立含噪语音模型;
2)对步骤1)中建立的含噪语音模型进行短时傅里叶变换;
3)利用步骤2)的含噪语音的频域获得含噪语音的功率谱;
4)利用步骤3)的含噪语音的功率谱得到含噪语音的最小功率谱;
5)利用步骤3)的含噪语音的功率谱计算无偏修正因子,到的结果没有说;
6)利用步骤4)的最小功率谱与步骤5)的结果获得噪声功率谱估计值;
7)利用步骤6)的噪声功率谱估计值及步骤3)的含噪语音的功率谱获得后验信噪比,通过后验信噪比获得先验信噪比;
8)通过最大后验的谱估计推导增益函数,利用步骤7)获得的先验信噪比计算增益函数值;
9)利用步骤8)得到的增益函数和步骤7)得到的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值;
通过上述步骤就能得到基于广义最大后验的谱幅度估计的增益函数的增强语音。
2.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤1)中:麦克风接受到的含噪语音信号表示为:
y(n)=s(n)+v(n) (1)
y(n)表示含噪语音;s(n)表示纯净语音;v(n)表示噪声。
3.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤2)中:由步骤1)对麦克风接收到的含噪语音进行短时傅里叶变换,获得含噪语音的频域,
Y(u,w)=S(u,w)+V(u,w) (2)
式中,u表示帧数;w表示频率。
4.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤3)中:步骤3)中:由步骤2)利用含噪语音的频域估计含噪语音的功率谱,采用一阶递归的功率谱估计,
P(u,w)=αP(u-1,w)+(1-α)|Y(u,w)|2。 (3)
5.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤4)中:利用步骤3)得到的含噪语音的功率谱,计算一段含噪语音帧的含噪语音最小功率谱,即在局部搜索窗长内搜索含噪语音功率谱来计算最小功率谱,得到:
Pmin(u,w)=min{P(u,w),P(u-1,w),…P(u-D+1,w)} (4)
式中Pmin(u,w)含噪语音最小功率谱,Pmin(u,w)的计算是基于P(u,w)在{u,u-1,…u-D+1}上计算,其中D为过去帧的帧数。
6.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤5)中:由于步骤4)得到的Pmin(u,w)总会小于噪声平均值,利用无偏修正因子Bmin(u,w)进行修正噪声功率谱,而无偏修正因子与步骤4)中过去帧数D有关,Bmin(u,w)的值会随着D的变化而变化,Martin通过渐进求取的方法计算无偏修正因子Bmin(u,w)的近似值,Bmin(u,w)表示为:
7.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤6)中:利用步骤4)与步骤5)得到的含噪语音最小功率谱及无偏因子估计噪声功率谱,噪声功率谱估计值由含噪语音的最小功率谱与无偏因子的乘积获得,因此噪声功率谱估计值为:
PV(u,w)=Pmin(u,w)Bmin(u,w)。 (6)
8.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤7)中:通过步骤3)得到的含噪语音的功率谱与步骤6)得到的噪声功率谱获得后验信噪比以及通过后验信噪比获得先验信噪比,
式中:γ(u,w)为后验信噪比;ξ(u,w)为先验信噪比;PS(u,w)为纯净语音功率谱估计值,引入平滑因子λ,通过前一帧的先验信噪比及当前帧的后验信噪比获得当前帧的先验信噪比,
ξ(u,w)=λξ(u-1,w)+(1-λ)(γ(u,w)-1)。 (9)
9.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤8)中:由广义最大后验的谱幅度估计推导增益函数
式中:Sk=|S(u,w)|为纯净语音的幅度;JGMAPA(Sk)是最大后验的代价函数,定义为:
JGMAPA(Sk)=ln{p(Y|Sk)[p(Sk)]η} (11)
式中:p(Y|Sk)表示最大似然;p(Sk)是由瑞利分布建模的表示先验概率;
假设含噪语音与纯净语音的的幅度谱不相关,p(Y|Sk)表示为
式中:Yk=|Y(u,w)|表示含噪语音的幅度;σV 2=PV(u,w)表示噪声幅度,
因此代价函数表示为:
上式中σS 2表示PS(u,w),
对代价函数求导,使其得出:
式中:ξ表示ξ(u,w);γ表示γ(u,w),
因此增益函数为:
10.根据权利要求1所述的广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,步骤9)中:利用步骤8)得到的增益函数、步骤7)的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值:
S(u,w)=G(u,w)Y(u,w)。 (16)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710880953.5A CN107731242B (zh) | 2017-09-26 | 2017-09-26 | 一种广义最大后验的谱幅度估计的增益函数语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710880953.5A CN107731242B (zh) | 2017-09-26 | 2017-09-26 | 一种广义最大后验的谱幅度估计的增益函数语音增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107731242A true CN107731242A (zh) | 2018-02-23 |
CN107731242B CN107731242B (zh) | 2020-09-04 |
Family
ID=61206920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710880953.5A Active CN107731242B (zh) | 2017-09-26 | 2017-09-26 | 一种广义最大后验的谱幅度估计的增益函数语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107731242B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020078400A1 (zh) * | 2018-10-17 | 2020-04-23 | 成都天奥信息科技有限公司 | 一种应用于超短波电台的语音增强方法 |
WO2020177372A1 (zh) * | 2019-03-06 | 2020-09-10 | 哈尔滨工业大学(深圳) | 基于超高斯先验语音模型与深度学习的语音分离方法、系统及存储介质 |
CN111933169A (zh) * | 2020-08-20 | 2020-11-13 | 成都启英泰伦科技有限公司 | 一种二次利用语音存在概率的语音降噪方法 |
WO2022141714A1 (zh) * | 2020-12-30 | 2022-07-07 | 科大讯飞股份有限公司 | 信息合成方法、装置、电子设备和计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050131689A1 (en) * | 2003-12-16 | 2005-06-16 | Cannon Kakbushiki Kaisha | Apparatus and method for detecting signal |
US20080082328A1 (en) * | 2006-09-29 | 2008-04-03 | Electronics And Telecommunications Research Institute | Method for estimating priori SAP based on statistical model |
CN103456310A (zh) * | 2013-08-28 | 2013-12-18 | 大连理工大学 | 一种基于谱估计的瞬态噪声抑制方法 |
TWI517144B (zh) * | 2013-06-11 | 2016-01-11 | Academia Sinica | Speech Enhancement of Generalized Maximal Event Spectrum Amplitude Predictor law |
CN105280193A (zh) * | 2015-07-20 | 2016-01-27 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于mmse误差准则的先验信噪比估计方法 |
-
2017
- 2017-09-26 CN CN201710880953.5A patent/CN107731242B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050131689A1 (en) * | 2003-12-16 | 2005-06-16 | Cannon Kakbushiki Kaisha | Apparatus and method for detecting signal |
US20080082328A1 (en) * | 2006-09-29 | 2008-04-03 | Electronics And Telecommunications Research Institute | Method for estimating priori SAP based on statistical model |
TWI517144B (zh) * | 2013-06-11 | 2016-01-11 | Academia Sinica | Speech Enhancement of Generalized Maximal Event Spectrum Amplitude Predictor law |
CN103456310A (zh) * | 2013-08-28 | 2013-12-18 | 大连理工大学 | 一种基于谱估计的瞬态噪声抑制方法 |
CN105280193A (zh) * | 2015-07-20 | 2016-01-27 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于mmse误差准则的先验信噪比估计方法 |
Non-Patent Citations (4)
Title |
---|
PHILIPOS C.LOIZOU: "《语音增强 理论与实践》", 31 December 2012 * |
RAINER MARTIN: "Noise power spectral density estimation based on optimal smoothing and minimum statistics", 《IEEE》 * |
陈紫强等: "基于先验信噪比参数自适应的频域联合语音增强方法", 《电子与信息学报》 * |
韩勇: "耦合MMSE和WEDM幅度谱估计的语音增强方法", 《国外电子测量技术》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020078400A1 (zh) * | 2018-10-17 | 2020-04-23 | 成都天奥信息科技有限公司 | 一种应用于超短波电台的语音增强方法 |
WO2020177372A1 (zh) * | 2019-03-06 | 2020-09-10 | 哈尔滨工业大学(深圳) | 基于超高斯先验语音模型与深度学习的语音分离方法、系统及存储介质 |
CN111933169A (zh) * | 2020-08-20 | 2020-11-13 | 成都启英泰伦科技有限公司 | 一种二次利用语音存在概率的语音降噪方法 |
CN111933169B (zh) * | 2020-08-20 | 2022-08-02 | 成都启英泰伦科技有限公司 | 一种二次利用语音存在概率的语音降噪方法 |
WO2022141714A1 (zh) * | 2020-12-30 | 2022-07-07 | 科大讯飞股份有限公司 | 信息合成方法、装置、电子设备和计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN107731242B (zh) | 2020-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108831499B (zh) | 利用语音存在概率的语音增强方法 | |
CN111899752B (zh) | 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端 | |
CN108735213B (zh) | 一种基于相位补偿的语音增强方法及系统 | |
Esch et al. | Efficient musical noise suppression for speech enhancement system | |
CN107731242A (zh) | 一种广义最大后验的谱幅度估计的增益函数语音增强方法 | |
CN110634500B (zh) | 一种先验信噪比的计算方法、电子设备及存储介质 | |
CN108831495A (zh) | 一种应用于噪声环境下语音识别的语音增强方法 | |
CN108735225A (zh) | 一种基于人耳掩蔽效应与贝叶斯估计的改进谱减方法 | |
CN105280193B (zh) | 基于mmse误差准则的先验信噪比估计方法 | |
JP5153886B2 (ja) | 雑音抑圧装置および音声復号化装置 | |
CN105390142B (zh) | 一种数字助听器语音噪声消除方法 | |
US8296135B2 (en) | Noise cancellation system and method | |
CN105489226A (zh) | 一种用于拾音器的多窗谱估计的维纳滤波语音增强方法 | |
CN102969000A (zh) | 一种多通道语音增强方法 | |
CN111933165A (zh) | 突变噪声快速估计方法 | |
CN110808057A (zh) | 一种基于约束朴素生成对抗网络的语音增强方法 | |
CN107045874B (zh) | 一种基于相关性的非线性语音增强方法 | |
CN105869649A (zh) | 感知滤波方法和感知滤波器 | |
CN111933169B (zh) | 一种二次利用语音存在概率的语音降噪方法 | |
CN103971697A (zh) | 基于非局部均值滤波的语音增强方法 | |
CN107393547A (zh) | 子带谱减与广义旁瓣抵消的双微阵列语音增强方法 | |
CN105788606A (zh) | 一种用于拾音器的基于递归最小追踪的噪声估计方法 | |
CN113838475B (zh) | 一种基于对数mmse估计器的语音信号增强方法及系统 | |
Esch et al. | Combined reduction of time varying harmonic and stationary noise using frequency warping | |
Sandoval-Ibarra et al. | Speech enhancement with adaptive spectral estimators |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |