CN102402987A - 噪声抑制装置、噪声抑制方法和程序 - Google Patents
噪声抑制装置、噪声抑制方法和程序 Download PDFInfo
- Publication number
- CN102402987A CN102402987A CN2011102632271A CN201110263227A CN102402987A CN 102402987 A CN102402987 A CN 102402987A CN 2011102632271 A CN2011102632271 A CN 2011102632271A CN 201110263227 A CN201110263227 A CN 201110263227A CN 102402987 A CN102402987 A CN 102402987A
- Authority
- CN
- China
- Prior art keywords
- noise
- band
- unit
- frame
- frequency band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 340
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000009499 grossing Methods 0.000 claims abstract description 20
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 5
- 230000011218 segmentation Effects 0.000 claims description 146
- 230000015572 biosynthetic process Effects 0.000 claims description 22
- 238000003786 synthesis reaction Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 8
- 230000001915 proofreading effect Effects 0.000 claims description 4
- 238000009432 framing Methods 0.000 abstract 3
- 238000012545 processing Methods 0.000 description 35
- 238000001228 spectrum Methods 0.000 description 26
- 230000009466 transformation Effects 0.000 description 25
- 238000012937 correction Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 230000006866 deterioration Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 11
- 230000009467 reduction Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 238000009434 installation Methods 0.000 description 7
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 3
- 230000006641 stabilisation Effects 0.000 description 3
- 238000011105 stabilization Methods 0.000 description 3
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000005534 acoustic noise Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本公开涉及噪声抑制装置、噪声抑制方法和程序。该噪声抑制装置包括:帧化单元、频带分割单元、频带功率计算单元、确定每个频带是否是噪声的噪声确定单元、噪声频带功率估计单元、噪声抑制增益确定单元、应用噪声抑制增益并且获得噪声已被抑制的频带分割信号的噪声抑制单元、频带合成单元、以及合成帧化信号的帧的帧化合成单元;噪声抑制增益确定单元具有:计算每个频带的SNR的SNR计算单元、以及使针对每个频带计算的SNR平滑的SNR平滑单元;其中基于由SNR平滑单元使其平滑的每个频带的SNR来确定每个频带的噪声抑制增益;并且其中SNR平滑单元改变平滑系数。
Description
技术领域
本公开涉及噪声抑制装置、噪声抑制方法和程序,更具体地,涉及根据输入信号执行噪声信号的估计并且获得作为已被有选择地减少的噪声信号的输出信号的噪声抑制装置等。
背景技术
迄今为止,诸如通信装置(诸如使用VoIP(互联网协议语音)的通信装置和蜂窝电话)以及IC录音机的电子装置已被广泛使用,其中这些电子装置使通过麦克风记录的人的语音经历AD(模数)转换,并且将其传送/记录作为数字信号,随后播放。在使用这些电子装置时,从周围环境发射的声音可能混合到麦克风中,阻碍了语音被听见。
现在,在相关技术中,对于蜂窝电话等,已使用了噪声抑制技术,其中根据输入信号执行噪声信号的估计,并且有选择地减少噪声信号。在例如Yariv Ephraim和David Malarah的″Speech Enhancement Using aMinimum Mean Square Error Short-Time Spectral AmplitudeEstimator″,IEEE Transactions on Acoustics,Speech,And SignalProcessing,Vol.ASSP-32,No.6,December 1994pp 1109-1121中公开了该类型的噪声抑制技术。
发明内容
通过上述噪声抑制技术,输入信号被分割为多个频带,并且对于每个频带,根据信号频带功率和估计的噪声频带功率来计算SNR(信噪比),使该计算的SNR平滑,并且基于平滑的SNR确定噪声抑制增益。在该情况下,推荐固定值0.98的平滑系数α,但是这不能跟随快速信号改变。因此,对于噪声抑制增益,可能出现误差,并且可能导致声音质量劣化,诸如音频的起点失真等。另一方面,如果小的值被用于平滑系数α以便于加速跟随速度,则可能出现被称为音乐噪声的副作用,其中声音听起来刺耳,并且声音质量劣化。
本公开的目的在于,在根据输入信号执行噪声信号的估计并且有选择地减少噪声信号的情况下改进声音质量。
根据本公开的一个实施例,一种噪声抑制装置包括:帧化单元,被配置为将输入信号分割为具有预定帧长度的帧来帧化输入信号;频带分割单元,被配置为将通过帧化单元获得的帧化信号分割为多个频带并且获得频带分割信号;频带功率计算单元,被配置为根据通过频带分割单元获得的每个频带分割信号来获得频带功率;噪声确定单元,被配置为基于帧化信号的特征确定每个频带是否是噪声;噪声频带功率估计单元,被配置为根据噪声确定单元的确定结果以及通过频带功率计算单元获得的每个频带分割信号的频带功率,来估计各频带的噪声频带功率;噪声抑制增益确定单元,被配置为基于通过噪声频带功率估计单元估计的每个频带的噪声频带功率以及通过频带功率计算单元获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;噪声抑制单元,被配置为将通过噪声抑制增益确定单元确定的每个频带的噪声抑制增益应用于通过频带分割单元获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;频带合成单元,被配置为合成通过噪声抑制单元获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及帧化合成单元,被配置为合成通过频带合成单元获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;噪声抑制增益确定单元具有:SNR计算单元,对于每个频带,根据通过频带功率计算单元获得的每个频带分割信号的频带功率以及通过噪声频带功率估计单元估计的每个频带的噪声频带功率来计算SNR,以及SNR平滑单元,被配置为对于每个频带,使通过SNR计算单元计算的SNR平滑;其中基于SNR平滑单元使其平滑的每个频带的SNR,确定每个频带的噪声抑制增益;以及其中SNR平滑单元基于噪声确定单元的确定结果和频带,改变平滑系数。
根据本公开,帧化单元将输入信号分割为预定长度的帧。频带分割单元随后将帧化信号分割为多个频带并且获得频带分割信号。例如,通过这里的频带分割单元,使帧化信号经历快速傅立叶变换并且使其成为频域信号,并且被分割为多个频带。
通过频带功率计算单元,根据通过频带分割单元获得的每个频带分割信号来获得频带功率。在该情况下,例如,根据通过傅立叶变换获得的复式谱来计算功率谱,并且功率谱的频带的最大值或平均值等变为代表值,即频带功率。
通过噪声确定单元,基于帧化信号的特征确定每个频带的频带分割信号是否是噪声。例如,各频带被依次设定为确定频带,比较这里的确定频带的频带分割信号的当前帧和过去帧的频带功率,并且在该频带功率的变化在阈值内的情况下,将这里的频带确定为噪声。该确定基于如下假设:噪声功率在帧之间是恒定的,并且相反,具有宽的功率变化的信号不是噪声。
再者,例如,基于帧化信号的过零宽度的直方图来确定每个频带是否是噪声。例如,当不是噪声时,重复相似的波形,从而预定的过零宽度频率增加。因此,可以基于过零宽度的直方图来确定每个频带是否是噪声。
再者,例如,基于帧化信号的过零宽度的直方图执行每个频带是否是噪声的第一确定。通过该第一确定,当每个频带被确定为噪声时,执行下一确定。在下一确定中,当每个频带依次是确定频带时,比较这里的确定频带的频带分割信号的当前帧和前一帧,并且频带功率的变化在阈值内,该确定频带被确定为噪声。通过这种两级确定,可以改进噪声确定的精度。
存在如下情况,其中仅通过监控频带分割信号的状态来进行确定以便于确定每个频带是否是噪声是不足的。例如,在检测频带功率的平稳性并且将其确定为噪声的情况下,特别是在频带分割的带宽是宽的情况下,音调信号和噪声是不可区分的。现在,通过执行关于整个帧是否是噪声的确定,并且通过使该确定与整个频带的确定组合,可以改进最终噪声确定精度。
通过噪声频带功率估计单元,根据通过频带功率计算单元获得的各频带分割信号的频带功率以及噪声确定单元的确定结果,来估计每个频带的噪声频带功率。例如,通过前一帧的噪声的频带功率的估计值和频带分割信号的频带功率的加权加法,并且对其进行更新,来执行被确定为噪声的频带的噪声频带功率的估计。
通过噪声抑制增益确定单元,基于通过噪声频带功率估计单元估计的每个频带的噪声的频带功率以及通过频带功率计算单元获得的各频带分割信号的频带功率,来确定每个频带的噪声抑制增益。在该情况下,噪声抑制增益确定单元由SNR计算单元和SNR平滑单元构成,该SNR计算单元对于每个频带,根据通过频带功率计算单元获得的各频带分割信号的频带功率以及通过噪声频带功率估计单元估计的每个频带的噪声频带功率来计算SNR,而该SNR平滑单元对于每个频带,使通过SNR计算单元计算的SNR平滑。
通过噪声抑制增益确定单元,基于通过SNR平滑单元使其平滑的每个频带的SNR,来确定每个频带的噪声抑制增益。在该情况下,基于噪声确定单元的确定结果和频带来修改平滑系数。
例如,通过噪声抑制增益确定单元,将当前帧信号的频带功率同估计的噪声频带功率的比设定为第一SNR,将前一帧信号的频带功率和噪声抑制增益相乘的量同前一帧的估计的噪声频带功率的比设定为第二SNR,并且对于每个帧,使用第一SNR和第二SNR确定噪声抑制增益。
注意,通过噪声抑制增益确定单元,基于通过SNR计算单元计算的SNR,连同通过SNR平滑单元使其平滑的每个频带的SNR一起,确定每个频带的噪声抑制增益。
通过噪声抑制单元,将通过噪声抑制增益确定单元确定的每个频带的噪声抑制增益应用于通过频带分割单元获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号。再者,通过频带合成单元,通过噪声抑制单元获得的各频带分割信号经历频带合成,并且获得噪声已被抑制的帧化信号,并且通过帧化合成单元,通过频带合成单元获得的每个帧的帧化信号经历帧合成,并且获得噪声已被抑制的输出信号。
因而,根据本公开,对于每个频带,基于平滑SNR确定噪声抑制增益,但是其平滑系数基于噪声确定单元的确定结果和频带进行修改。例如,在每个帧和每个频带中确定为非噪声的情况下,平滑系数(α)朝向较小的值改变,并且在确定为噪声的情况下,平滑系数(α)朝向较大的值改变。因而,可以改进具有宽的信号时间变化的位置中的平滑SNR的跟随,并且可以避免具有小的信号时间变化的位置中的平滑SNR的不必要的改变。因此,可以改进每个频带的噪声抑制增益的精度,并且可以将声音质量的劣化抑制到小的量。
根据本公开,例如,当通过噪声抑制增益确定单元确定的噪声抑制增益变为小于预先设定的下限值时,进一步提供将噪声抑制值校正为这里的下限值的噪声抑制增益校正单元,并且使用通过噪声抑制增益校正单元校正的噪声抑制增益。
在该情况下,对于每个频带分立地设定下限值。例如,在非噪声信号是语音声音的情况下,对于具有包括语音声音信号的高概率的频带,噪声抑制增益的下限值被设定为较高的值。在通过噪声抑制增益确定单元确定的噪声抑制增益小于该下限值的情况下,该噪声抑制增益被替换为该下限值。因而,即使在通过噪声抑制增益确定单元确定的噪声抑制增益中存在某种误差,仍减少听见的声音质量劣化。
根据本公开的一个实施例,一种噪声抑制装置包括:多个帧化单元,被配置为分别将多个通道的输入信号分割为具有预定帧长度的帧来帧化输入信号;多个频带分割单元,被配置为分别将通过多个帧化单元获得的帧化信号分割为多个频带并且获得频带分割信号;多个频带功率计算单元,被配置为分别根据通过多个频带分割单元获得的每个频带分割信号来获得频带功率;噪声确定单元,被配置为基于多个通道的帧化信号的特征确定每个频带是否是噪声;多个噪声频带功率估计单元,被配置为根据噪声确定单元的确定结果以及通过多个频带功率计算单元获得的每个频带分割信号的频带功率,来估计各频带的噪声频带功率;多个噪声抑制增益确定单元,被配置为基于通过多个噪声频带功率估计单元估计的每个频带的噪声频带功率以及通过多个频带功率计算单元获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;多个噪声抑制单元,被配置为分别将通过多个噪声抑制增益确定单元确定的每个频带的噪声抑制增益应用于通过多个频带分割单元获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;多个频带合成单元,被配置为分别合成通过多个噪声抑制单元获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及多个帧化合成单元,被配置为分别合成通过多个频带合成单元获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;噪声抑制增益确定单元具有:SNR计算单元,被配置为对于每个频带,根据通过频带功率计算单元获得的每个频带分割信号的频带功率以及通过噪声频带功率估计单元估计的每个频带的噪声频带功率来计算SNR,以及SNR平滑单元,被配置为对于每个频带,使通过SNR计算单元计算的SNR平滑;其中基于SNR平滑单元使其平滑的每个频带的SNR,确定每个频带的噪声抑制增益;以及其中SNR平滑单元基于噪声确定单元的确定结果和频带,改变平滑系数。
根据本公开,通过噪声确定单元确定每个通道的噪声抑制增益,并且执行噪声抑制处理。基于多个通道中的帧化信号的特征,确定每个频带是否是噪声。例如,各频带依次是确定频带,并且对于确定频带对于每个通道进行是否是噪声的确定,并且当所有通道被确定为噪声时,确定频带被确定为噪声。在每个通道中,在针对每个帧确定每个频带的噪声抑制增益的情况下,共同使用噪声确定单元的确定结果。
因而,根据本公开,根据多个通道(例如,立体声信号的情况下的左和右通道)中的噪声频带功率估计误差,对于多个通道的噪声抑制增益抑制非预期的幅度差的出现,并且可以避免左和右通道中的由于不一致引起的定位劣化。
根据本公开,根据输入信号估计噪声信号并且有选择地减少噪声信号的情况下的声音质量的劣化可以被抑制到小的量。
附图说明
图1是图示根据本公开的第一实施例的噪声抑制装置的配置示例的框图;
图2是描述语音声音检测单元的过零宽度计算单元的计算操作的示图;
图3A和3B是图示帧化信号是音频(非噪声)的情况下的信号波形(各样本的幅度)和过零宽度直方图的示例的示图;
图4A和4B是图示帧化信号是音频(噪声)的情况下的信号波形(各样本的幅度)和过零宽度直方图的示例的示图;
图5是描述噪声/非噪声确定单元的确定处理的过程的流程图;
图6是图示通过α计算单元计算的加权系数α(k,b)的转变示例的示图;
图7是图示根据本公开的第二实施例的噪声抑制装置的配置示例的框图;
图8是图示配置噪声抑制装置的噪声抑制增益生成单元的配置示例的框图;
图9是描述噪声/非噪声确定单元的确定处理的过程的流程图;以及
图10是图示使用软件执行噪声抑制处理的计算机装置的配置示例的示图。
具体实施方式
根据本公开的一个实施例,提供了一种噪声抑制装置,其包括:帧化单元,被配置为将输入信号分割为具有预定帧长度的帧来帧化输入信号;频带分割单元,被配置为将通过帧化单元获得的帧化信号分割为多个频带并且获得频带分割信号;频带功率计算单元,被配置为根据通过频带分割单元获得的每个频带分割信号来获得频带功率;噪声确定单元,被配置为基于帧化信号的特征确定每个频带是否是噪声;噪声频带功率估计单元,被配置为根据噪声确定单元的确定结果以及通过频带功率计算单元获得的每个频带分割信号的频带功率,来估计各频带的噪声频带功率;噪声抑制增益确定单元,被配置为基于通过噪声频带功率估计单元估计的每个频带的噪声频带功率以及通过频带功率计算单元获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;噪声抑制单元,被配置为将通过噪声抑制增益确定单元确定的每个频带的噪声抑制增益应用于通过频带分割单元获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;频带合成单元,被配置为合成通过噪声抑制单元获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及帧化合成单元,被配置为合成通过频带合成单元获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;噪声抑制增益确定单元具有:SNR计算单元,对于每个频带,根据通过频带功率计算单元获得的每个频带分割信号的频带功率以及通过噪声频带功率估计单元估计的每个频带的噪声频带功率来计算SNR,以及SNR平滑单元,被配置为对于每个频带,使通过SNR计算单元计算的SNR平滑;其中基于SNR平滑单元使其平滑的每个频带的SNR,确定每个频带的噪声抑制增益;以及其中SNR平滑单元基于噪声确定单元的确定结果和频带,改变平滑系数。
根据本公开的另一实施例,提供了一种噪声抑制装置,其包括:多个帧化单元,被配置为分别将多个通道的输入信号分割为具有预定帧长度的帧来帧化输入信号;多个频带分割单元,被配置为分别将通过多个帧化单元获得的帧化信号分割为多个频带并且获得频带分割信号;多个频带功率计算单元,被配置为分别根据通过多个频带分割单元获得的每个频带分割信号来获得频带功率;噪声确定单元,被配置为基于多个通道的帧化信号的特征确定每个频带是否是噪声;多个噪声频带功率估计单元,被配置为根据噪声确定单元的确定结果以及通过多个频带功率计算单元获得的每个频带分割信号的频带功率,来估计各频带的噪声频带功率;多个噪声抑制增益确定单元,被配置为基于通过多个噪声频带功率估计单元估计的每个频带的噪声频带功率以及通过多个频带功率计算单元获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;多个噪声抑制单元,被配置为分别将通过多个噪声抑制增益确定单元确定的每个频带的噪声抑制增益应用于通过多个频带分割单元获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;多个频带合成单元,被配置为分别合成通过多个噪声抑制单元获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及多个帧化合成单元,被配置为分别合成通过多个频带合成单元获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;噪声抑制增益确定单元具有:SNR计算单元,被配置为对于每个频带,根据通过频带功率计算单元获得的每个频带分割信号的频带功率以及通过噪声频带功率估计单元估计的每个频带的噪声频带功率来计算SNR,以及SNR平滑单元,被配置为对于每个频带,使通过SNR计算单元计算的SNR平滑;其中基于SNR平滑单元使其平滑的每个频带的SNR,确定每个频带的噪声抑制增益;以及其中SNR平滑单元基于噪声确定单元的确定结果和频带,改变平滑系数。
根据本公开的又一实施例,提供了一种噪声抑制方法,包括:帧化,用于将输入信号分割为具有预定帧长度的帧来帧化输入信号;频带分割,用于将通过帧化而获得的帧化信号分割为多个频带并且获得频带分割信号;频带功率计算,用于根据通过频带分割而获得的每个频带分割信号来获得频带功率;噪声确定,用于基于帧化信号的特征确定每个频带是否是噪声;噪声频带功率估计,用于根据噪声确定的确定结果以及通过频带功率计算而获得的每个频带分割信号的频带功率,来估计每个频带的噪声频带功率;噪声抑制增益确定,用于基于通过噪声频带功率估计而估计的每个频带的噪声频带功率以及通过频带功率计算而获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;噪声抑制,用于将通过噪声抑制增益确定而确定的每个频带的噪声抑制增益应用于通过频带分割而获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;频带合成,用于合成通过噪声抑制而获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及帧化合成,用于合成通过频带合成而获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;其中通过噪声抑制增益确定,对于每个频带,根据通过频带功率计算而获得的频带分割信号的频带功率以及通过噪声频带功率估计而估计的频带的噪声频带功率来计算SNR,使计算的SNR平滑,基于该平滑的SNR确定噪声抑制增益,以及基于噪声确定的确定结果和频带来改变平滑系数。
下文将描述本公开的实施例(以下称为“实施例”)。注意,该描述将以如下顺序进行。
1.第一实施例
2.第二实施例
3.修改
1.第一实施例
噪声抑制装置
图1示出了根据第一实施例的噪声抑制装置10的配置示例。噪声抑制装置10具有信号输入端11、帧化单元12、窗口化单元13、快速傅立叶变换单元14和噪声抑制增益生成单元15。再者,噪声抑制装置10具有傅立叶系数校正单元16、快速傅立叶逆变换单元17、窗口化单元18、重叠添加单元19和信号输出端20。
信号输入端11是用于提供输入信号y(n)的端子。输入信号y(n)是标准化频率为fs的数字信号。帧化单元12将提供给信号输入端11的输入信号y(n)分割为预定帧长度,例如Nf个样本帧的帧长度,并且对它们进行帧化,以便于执行每个帧的处理。例如,第k个帧的信号的第n个样本被表示为yf(k,n)。帧化单元12的帧化处理可以允许相邻帧的重叠。
窗口化单元13以分析窗口wana(n)对帧化信号yf(k,n)执行窗口化。窗口化单元13使用例如下式(1)定义的分析窗口wana(n)。Nw是窗口长度。
快速傅立叶变换单元14对在窗口化单元13处经历窗口化的帧化信号yf(k,n)执行快速傅立叶变换(FFT:快速傅立叶变换)处理,并且将时域信号变换为频域信号。噪声抑制增益生成单元15基于通过帧化处理获得的帧化信号yf(k,n)和通过快速傅立叶变换处理获得的各傅立叶系数(各频谱),生成与各傅立叶系数对应的噪声抑制增益。与各傅立叶系数对应的噪声抑制增益构成了频率轴上的滤波器。这里的噪声抑制增益生成单元15的细节将在后面描述。
傅立叶系数校正单元16通过获取通过快速傅立叶变换处理获得的各傅立叶系数和通过噪声抑制增益生成单元15生成的与各傅立叶系数对应的噪声抑制增益的积来执行系数校正。就是说,傅立叶系数校正单元16执行用于抑制频率轴上的噪声的滤波器计算。
快速傅立叶逆变换单元17对经历系数校正的各傅立叶系数执行快速傅立叶逆变换(IFFT:快速傅立叶逆变换)处理。快速傅立叶逆变换单元17执行与上述快速傅立叶变换单元14相反的处理,并且将频域信号变换为时域信号。
窗口化单元18以合成窗口wsyn(n)对通过快速傅立叶逆变换单元17获得的经历噪声抑制的帧化信号执行窗口化。窗口化单元18使用例如下式(2)定义的合成窗口wsyn(n)。
注意,窗口化单元13的分析窗口wana(n)和窗口化单元18的合成窗口wsyn(n)的形式可以是任意的。然而,对于分析/合成系列系统,期望使用满足完全重新配置条件的窗口。
重叠添加单元19执行经历窗口化单元18的窗口化的每个帧的帧化信号的帧边界部分的层叠,并且获得噪声已被抑制的输出信号。信号输出端20输出通过重叠添加单元19获得的输出信号。
将简要描述噪声抑制装置10的操作。将输入信号y(n)提供给信号输入端11,并且这里的输入信号y(n)被提供给帧化单元12。通过该帧化单元12,输入信号y(n)经历帧化以便于执行每个帧的处理。就是说,通过帧化单元12,输入信号y(n)被分割为预定的帧长度,例如具有Nf个样本的帧长度的帧。每个帧的帧化信号yf(k,n)被依次提供给窗口化单元13。
通过窗口化单元13,以分析窗口wana(n)对帧化信号yf(k,n)执行窗口化以便于获得通过后面描述的快速傅立叶变换单元14稳定化的傅立叶系数。如此窗口化的帧化信号yf(k,n)被提供给快速傅立叶变换单元14。通过这里的快速傅立叶变换单元14,对窗口化的帧化信号yf(k,n)执行快速傅立叶变换处理,并且使时域信号变换为频域信号。通过快速傅立叶变换处理获得的各傅立叶系数(各频谱)被提供给傅立叶系数校正单元16。
通过帧化单元12获得的每个帧的帧化信号yf(k,n)被提供给噪声抑制增益生成单元15。通过快速傅立叶变换单元14获得的每个帧的各傅立叶系数也被提供给噪声抑制增益生成单元15。通过噪声抑制增益生成单元15,基于帧化信号yf(k,n)和每个傅立叶系数,对于每个帧生成与每个傅立叶系数对应的噪声抑制增益。与各傅立叶系数对应的噪声抑制增益被提供给傅立叶系数校正单元16。
通过傅立叶系数校正单元16,对于每个帧,获取通过快速傅立叶变换单元14的快速傅立叶变换处理获得的各傅立叶系数和通过噪声抑制增益生成单元15生成的与各傅立叶系数对应的噪声抑制增益的积,并且执行系数校正。就是说,通过傅立叶系数校正单元16,在频率轴上执行滤波器计算用于抑制噪声。经历系数校正的各傅立叶系数被提供给快速傅立叶逆变换单元17。
通过快速傅立叶逆变换单元17,对于每个帧,对经历系数校正的各傅立叶系数执行快速傅立叶逆变换处理,并且使频域信号变换为时域信号。通过快速傅立叶逆变换单元17获得的帧化信号被提供给窗口化单元18。通过窗口化单元18,对于每个帧,以合成窗口wsyn(n)对通过快速傅立叶逆变换单元17获得的经历噪声抑制的帧化信号执行窗口化。
通过窗口化单元18窗口化的每个帧的帧化信号被提供给重叠添加单元19。通过重叠添加单元19,执行每个帧的帧化信号的帧边界部分的层叠,并且获得噪声已被抑制的输出信号。这里的输出信号被输出到信号输出端20。
噪声抑制增益生成单元
将描述噪声抑制增益生成单元15的细节。噪声抑制增益生成单元15基本上使用上述非专利文献1等中公开的噪声抑制技术以生成噪声抑制增益。首先,下文将描述该噪声抑制技术的概述。
通过这里的噪声抑制技术,当第k个帧的第b个频带的输入频带信号是Y(k,b)时,如下式(3)中所示,使用噪声抑制增益G(k,b),并且获得噪声已被抑制的频带信号X(k,b)。根据先验SNR“ξ(k,b)”和后验SNR“γ(k,b)”计算噪声抑制增益G(k,b)。
X(k,b)=G(k,b)Y(k,b)...(3)
当输入信号的频带功率是B(k,b)并且估计的噪声频带功率是D(k,b)时,通过下式(4)计算后验SNR“γ(k,b)”。
γ(k,b)=B(k,b)/D(k,b)...(4)
先验SNR“ξ(k,b)”使用加权系数(平滑系数)α并且通过下式(5)计算。
ξ(k,b)=αG2(k-1,b)γ(k-1,b)+(1-α)P[γ(k,b)-1]...(5)
现在,P[·]是在下式(6)中定义的算子。
如下式(7)中使用先验SNR“ξ(k,b)”和后验SNR“γ(k,b)”计算噪声抑制增益G(k,b)。In(x)是第一类变形贝塞尔(Bessel)函数。
由于根据先验SNR和后验SNR的估计值来计算噪声抑制增益,因此估计精度直接影响噪声抑制的适当性。其中,噪声频带功率估计值D(k,b)影响所有SNR估计值,从而改进估计精度变为旨在改进整个装置的功能的重要问题。
即使在其中假设对于噪声频带功率没有估计误差的情况下,通过上述SNR的计算方法(参见式(5)),非专利文献1推荐处置固定值α=0.98,并且该估计不跟随快速信号改变。因此,噪声抑制增益G(k,b)的估计误差出现,并且变为诸如音频的起点失真的声音质量劣化的起因。另一方面,如果将小的值用于α以便于使跟随速度更快,则存在如下问题,这次出现听见被称为音乐噪声的刺耳声音的副作用,并且声音质量劣化。
噪声抑制增益生成单元15基本上使用例如上述非专利文献1中公开的噪声抑制技术。然而,通过以良好的精度估计噪声频带功率,同时根据信号的状态执行适当的系数修改,可以执行最优的噪声抑制增益G(k,b)的生成。
噪声抑制增益生成单元15具有频带分割单元21、频带功率计算单元22、语音声音检测单元23、噪声/非噪声确定单元27、和噪声频带功率估计单元28。噪声抑制增益生成单元15还具有后验SNR计算单元29、α计算单元30、先验SNR计算单元31、噪声抑制增益计算单元32、噪声抑制增益校正单元33、和滤波器配置单元34。
频带分割单元21将通过快速傅立叶变换单元14的快速傅立叶变换处理获得的各频谱(各傅立叶系数)分割为例如25个频带。表1示出了频带分割的示例。频带编号是所附用于识别每个频带的编号。各频带基于通过听觉心理研究获得的知识,其指示对于人类听觉系统,频带越高,感知分辨率劣化得越多。
表1
频带功率计算单元22根据频带分割单元21分割的每个频带的频谱来计算频带功率B(k,b)。现在,(k,b)示出了第k个帧和第b个频带。作为用于计算频带功率B(k,b)的方法,频带功率计算单元22可以使用如下方法:根据各频谱计算功率谱,获得频率范围内的最大值,并且使用该最大值作为代表值B(k,b)。注意,对于用于计算频带功率B(k,b)的方法,频带功率计算单元22可以使用如下方法:根据各频谱计算功率谱,获得频率范围内的平均值,并且使用该平均值作为代表值B(k,b)。
语音声音检测单元23基于通过帧化单元12获得的帧化信号yf(k,n),对于每个帧,输出指示是否包括语音声音的语音声音标志Fv(k)。语音声音检测单元23具有过零宽度计算单元24、直方图计算单元25和语音声音标志计算单元26。
过零宽度计算单元24检测其中帧化连续样本之间的符号例如从正反转到负或者从负反转到正的位置,或者其中存在具有在符号相反的样本之间的0值的样本的位置,作为过零点。如图2中所示,过零宽度计算单元24还计算相邻的过零点之间的样本数目并且记录为过零宽度以示出为Lz(0),Lz(1),...,Lz(m)。
直方图计算单元25从过零宽度计算单元24接收过零宽度Lz(p),并且研究帧中的分布。例如,在获取每10个样本的20个区域的统计数据的情况下,直方图计算单元25将初始值设定为Hz(q)=0(0≤q<20)。直方图计算单元25随后如下式(8)中的那样获得直方图Hz(q)。
语音声音标志计算单元26获得其中通过直方图计算单元25获得的频率Hz(q)是最大值的索引(等级)qpeak。语音声音标志计算单元26随后将索引qpeak的频率Hz(q)与索引qpeak的阈值Th(q)比较,并且如下式(9)中所示设定语音声音标志Fv(k)。现在,各索引示出了各过零宽度范围。
图3A和3B示出了帧化信号yf(k,n)是语音声音(非噪声)的情况下的信号波形(各样本的幅度)和过零宽度的直方图的示例。在语音声音(非噪声)的情况下,重复相似的波形,并且预定过零宽度范围的频率增加。因此,Hz(q)>Th(q)成立,并且语音声音标志Fv(k)被设定为Fv(k)=1。现在,对于每个过零宽度范围(索引)设定阈值Th(q),使得过零范围的过零宽度越小,则相应的Th(q)的值就越大。
另一方面,图4A和4B示出了帧化信号yf(k,n)是噪声的情况下的信号波形(各样本的幅度)和过零宽度的直方图的示例。在噪声的情况下,具有小过零宽度的过零宽度范围的频率增加。因此,Hz(q)≤Th(q)成立,并且语音声音标志Fv(k)被设定为Fv(k)=0。
噪声/非噪声确定单元27使用通过语音声音检测单元23获得的语音声音标志Fv(k)以及通过频带功率计算单元22计算的每个频带的频带功率B(k,b),并且对于每个帧,设定每个频带的噪声频带标志Fnz(k,b)。噪声/非噪声确定单元27对于每个帧执行每个频带的图5中的流程图中示出的确定处理。
噪声/非噪声确定单元27开始于步骤ST1中的确定处理,并且执行系统初始化。通过该初始化,噪声/非噪声确定单元27将噪声候选帧连续计数器Cn(b)初始化为Cn(b)=0。
接着,噪声/非噪声确定单元27移动到步骤ST2中的处理。在这里的步骤ST2中,噪声/非噪声确定单元27确定语音声音标志Fv(k)是否大于0,即是否Fv(k)=1。当Fv(k)=1时,即在当前帧k是语音声音时,噪声/非噪声确定单元27在步骤ST3中使噪声候选帧连续计数器Cn(b)清零并且将其设定为Cn(b)=0。噪声/非噪声确定单元27随后确定当前频带b不是噪声,并且在步骤ST4中将噪声频带标志Fnz(k,b)设定为Fnz(k,b)=0,并且随后在步骤ST5中结束确定处理。
当在步骤ST2中Fv(k)=0时,即在当前帧k不是语音声音时,噪声/非噪声确定单元27移动到步骤ST6中的处理。在步骤ST6中,噪声/非噪声确定单元27获得当前帧k的频带功率B(k,b)和前一帧k-1的频带功率B(k-1,b)的功率比。噪声/非噪声确定单元27随后在步骤ST6中确定该功率比是否包含在低水平侧阈值TpL(b)和高水平侧阈值TpH(b)之间。
当功率比包含在这两个阈值内时,噪声/非噪声确定单元27将当前频带b设定为噪声候选者,并且当功率比未包含在这两个阈值内时,确定当前频带b不是噪声。该确定基于如下假设:噪声信号功率是固定的,并且相反地,具有宽的功率变化的信号不是噪声。
当功率比未包含在这两个阈值内时,即当确定当前频带b不是噪声时,噪声/非噪声确定单元27在步骤ST3中使噪声候选帧连续计数器Cn(b)清零,并且将其设定为Cn(b)=0。噪声/非噪声确定单元27随后在步骤ST4中设定Fnz(k,b)=0,并且随后在步骤ST5中结束确定处理。
另一方面,当功率比包含在这两个阈值内时,即在当前频带b被设定为噪声候选者时,噪声/非噪声确定单元27移动到步骤ST7中的处理。在步骤ST7中,噪声/非噪声确定单元27使噪声候选帧连续计数器Cn(b)的计数增加1。
噪声/非噪声确定单元27随后在步骤ST8中确定噪声候选帧连续计数器Cn(b)是否超过阈值Tc。当Cn(b)>Tc不成立时,噪声/非噪声确定单元27确定当前频带b不是噪声,并且在步骤ST4中设定Fnz(k,b)=0,并且随后在步骤ST5中结束确定处理。
另一方面,当Cn(b)>Tc时,噪声/非噪声确定单元27移动到步骤ST9中的处理。在步骤ST9中,噪声/非噪声确定单元27确定当前频带b是噪声,并且将噪声频带标志Fnz(k,b)设定为Fnz(k,b)=1,并且随后在步骤ST5中结束确定处理。
通过图5中的上述流程图中的确定处理,使用通过语音声音检测单元23获得的语音声音标志Fv(k),对于整个帧执行一次噪声/非噪声确定,其通过将此与每个频带的确定组合而变为最终确定结果。这是因为,可能存在如下情况:其中仅通过监控每个频带的信号状态来执行确定是不足的。例如,在检测频带功率的平稳性并且将其确定为噪声的情况下,特别是对于其中频带分割的带宽的宽度是宽的情况,不能区分音调信号和噪声。因此,通过执行图5中的流程图中的确定处理,可以改进每个频带的噪声确定精度。
返回图1,噪声频带功率估计单元28对于每个帧,估计每个频带的噪声频带功率估计值D(k,b)。噪声频带功率估计单元28仅针对其中Fnz(k,b)=1的频带,即针对噪声频带,基于通过噪声/非噪声确定单元27设定的噪声频带标志Fnz(k,b)来执行对噪声频带功率估计值D(k,b)的更新。
作为噪声频带功率估计单元28的噪声频带功率估计值D(k,b)的更新方法的示例,例如,可以考虑如下式(10)中所示的如下方法:使用频带功率B(k,b)并且使用指数加权μnz进行更新。有利的是,μnz的值设定在约0.9和1.0之间,噪声频带功率估计值D(k,b)跟随实际噪声改变,并且将不存在声学不适。
D(k,b)=μnzD(k-1,b)+(1-μnz)B(k,b)如果Fnz(k,b)==1
...(10)
后验SNR计算单元29使用输入信号频带功率B(k,b)和噪声频带功率的估计值D(k,b),并且对于每个帧,基于下式(11)计算每个频带的后验SNR“γ(k,b)”。该式(11)与上述式(4)相同。后验SNR计算单元29构成了SNR计算单元。
γ(k,b)=B(k,b)/D(k,b)...(11)
先验SNR计算单元31对于每个帧,基于下式(12)计算每个频带的先验SNR“ξ(k,b)”。在该情况下,先验SNR计算单元31使用当前帧和前一帧的后验SNR“γ(k-1,b),γ(k,b)”、前一帧的噪声抑制增益G′(k-1,b)、和加权系数α。注意,式(12)与上述式(5)相同,不同之处在于在通过限制器处理的校正之后噪声抑制增益G(k-1,b)变为噪声抑制增益G′(k-1,b)。
ξ(k,b)=αG′2(k-1,b)γ(k-1,b)+(1-α)P[γ(k,b)-1]...(12)
α计算单元30基于式(13)计算上述式(12)中的加权系数α,其并非作为固定值,而是作为随帧和频带变化的加权系数α(k,b)。αMAX(b)和αMIN(b)分别是每个频带的加权系数α(k,b)集合的最大值和最小值。在基于式(13)计算加权系数α(k,b)的情况下,在被确定为噪声的频带b处,加权系数α(k,b)在最大值αMAX(b)附近,并且在被确定为非噪声的频带b处,加权系数α(k,b)在最小值αMIN(b)附近。图6示出了加权系数α(k,b)的转变示例。
如果以使用上述α(k,b)的形式重写上述式(12)中的α,则这变为下式(14)中的那样。
ξ(k,b)=α(k-1,b)G′2(k-1,b)γ(k-1,b)+(1-α(k,b))P[γ(k,b)-1]...(14)
先验SNR计算单元31基于上述式(14),执行先验SNR“ξ(k,b)”的计算。通过上述加权系数α(k,b)的计算的结构,计算先验SNR“ξ(k,b)”,从而对于通常宽地改变的诸如音频的非噪声,跟随是快的,并且对于假设平稳性的噪声,跟随是慢的。先验SNR计算单元31构成了SNR平滑单元。
噪声抑制增益计算单元32对于每个帧,基于下式(15),根据通过后验SNR计算单元29计算的后验SNR“γ(k,b)”和通过先验SNR计算单元31计算的先验SNR“ξ(k,b)”,计算每个频带的噪声抑制增益G(k,b)。注意,这里的式(15)与上述式(7)相同。
噪声抑制增益校正单元33基于每个频带的预先设定的噪声抑制增益的下限值GMIN(b),对通过噪声抑制增益计算单元32计算的噪声抑制增益G(k,b)加上限制器,并且计算校正的噪声抑制增益G′(k,b)。下式(16)示出了噪声抑制增益校正单元33处的限制器处理。
噪声抑制增益校正单元33被设置为使得在使声学噪声减少量最大的同时,防止噪声抑制增益因噪声估计的过度估计而变得过小。现在,基于相应的声源性质和声学心理,按频带设定下限值GMIN(b)。例如,在非噪声信号是音频的情况下,具有包括音频的高概率的频带被设定,其中噪声抑制增益的下限值是较高的值。在噪声抑制增益G(k,b)低于下限值GMIN(b)的情况下,其被替换为下限值GMIN(b)。因而,即使在噪声抑制增益G(k,b)中存在误差,仍减小了声学声音质量劣化。
滤波器配置单元34对于每个帧,根据通过噪声抑制增益校正单元33校正的关于每个帧的每个频带的噪声抑制增益G′(k,b),计算与各傅立叶系数对应的噪声抑制增益,并且配置频率轴上的滤波器。计算方法可以是如下简单方法:其中傅立叶系数的频带分割经历关于频带分割单元21的逆映射并且不变地使用所获得的结果,或者可以是如下方法:其中使通过上述方法获得的结果在频率轴上进一步平滑,因此增益不会在频率轴上变为不连续的。
将简要描述噪声抑制增益生成单元15的操作。关于每个帧的通过快速傅立叶变换单元14的快速傅立叶变换处理获得的各频谱(各傅立叶系数)被提供给频带分割单元21。通过频带分割单元21,对于每个帧,各频谱被分割为例如25个频带(参见表1)。
对于每个帧,通过频带分割单元21的频带分割获得的每个频带的频谱被提供给频带功率计算单元22。通过频带功率计算单元22,对于每个帧,计算每个频带的频带功率B(k,b)。例如,计算与频带b中的各频谱对应的功率谱,并且其最大值或平均值变为频带功率B(k,b)。
再者,通过帧化单元12获得的帧化信号yf(k,n)被提供给语音声音检测单元23。通过语音声音检测单元23,基于帧化信号yf(k,n),获得示出每个帧中是否包括语音声音的语音声音标志Fv(k)。通过语音声音检测单元23,执行整个帧的噪声/非噪声确定,并且当确定为非噪声时,Fv(k)=1成立,并且当确定为噪声时,Fv(k)=0成立。现在,通过基于帧化信号yf(k,n)检测的过零宽度以及所计算的该过零宽度的直方图来执行语音声音检测单元23的噪声/非噪声的确定。
关于每个帧的通过语音声音检测单元23获得的语音声音标志Fv(k)被提供给噪声/非噪声确定单元27。通过频带功率计算单元22计算的关于每个帧的每个频带的频带功率B(k,b)也被提供给噪声/非噪声确定单元27。通过噪声/非噪声确定单元27,使用语音声音标志Fv(k)和每个频带的频带功率B(k,b),对于每个帧设定每个频带的噪声频带标志Fnz(k,b)(参见图5)。在该情况下,当语音声音标志Fv(k)是1并且整个帧被确定为非噪声时,所有频带被确定为不是噪声,并且对于所有频带,Fnz(k,b)=0成立。
再者,当语音声音标志Fv(k)是0并且整个帧被确定为噪声时,通过每个频带的频带功率的平稳性检测来执行噪声或非噪声的确定。当频带功率具有平稳性并且其频带被确定为噪声候选者时,其频带的噪声候选帧连续计数器Cn(b)的计数增加1。再者,当其计数值超过阈值Tc时,其频带被确定为噪声,并且Fnz(k,b)=1成立。
另一方面,当频带功率不具有平稳性并且其频带被确定为非噪声时,Fnz(k,b)=0成立。再者,即使其频带被确定为噪声候选者,对于频带中的平稳性,当噪声候选帧连续计数器Cn(b)的计数值处于阈值Tc处或在其以下时,其频带被确定为非噪声,并且Fnz(k,b)=0成立。
关于每个帧的通过噪声/非噪声确定单元27设定的每个频带的噪声频带标志Fnz(k,b)被提供给噪声频带功率估计单元28。关于每个帧的通过频带功率计算单元22计算的每个频带的频带功率B(k,b)也被提供给噪声频带功率估计单元28。通过噪声频带功率估计单元28,对于每个帧估计每个频带的噪声频带功率估计值D(k,b)。
通过噪声频带功率估计单元28,基于噪声频带标志Fnz(k,b),对于频带执行噪声频带功率估计值D(k,b)的更新,其中Fnz(k,b)=1成立,即仅有噪声频带。例如,使用频带功率B(k,b),并且使用指数加权μnz进行更新(参见式(10))。μnz的值被设定在约0.9和1.0之间,从而噪声频带功率估计值D(k,b)跟随实际噪声改变,并且因此不存在声学不适。
关于每个帧的通过噪声频带功率估计单元28估计的每个频带的噪声频带功率估计值D(k,b)被提供给后验SNR计算单元29。关于每个帧的通过频带功率计算单元22计算的每个频带的频带功率B(k,b)也被提供给后验SNR计算单元29。通过后验SNR计算单元29,对于每个帧,使用频带功率B(k,b)和噪声频带功率的估计值D(k,b)计算每个频带的后验SNR“γ(k,b)”(参见式(11))。
通过噪声/非噪声确定单元27设定的每个频带的噪声频带标志Fnz(k,b)被提供给α计算单元30。通过α计算单元30,对于每个帧计算用于计算每个频带的先验SNR“ξ(k,b)”的加权系数α(k,b)(参见式(14))。加权系数α(k,b)被更新以便对于被确定为噪声的频带b,接近最大值αMAX(b),并且对于被确定为非噪声的频带b,立即被当作最小值αMIN(b)(参见式(13)和图6)。
关于每个帧的通过后验SNR计算单元29计算的每个频带的后验SNR“γ(k,b)”被提供给先验SNR计算单元31。关于每个帧的通过α计算单元30计算的每个频带的加权系数α(k,b)也被提供给先验SNR计算单元31。此外,通过噪声抑制增益校正单元33校正的前一帧的每个频带的噪声抑制增益G′(k,b)被提供给先验SNR计算单元31。通过先验SNR计算单元31,对于每个帧计算每个频带的先验SNR“ξ(k,b)”(参见式(14))。在该情况下,使用前一帧和当前帧的后验SNR“γ(k-1,b),γ(k,b)”,前一帧的噪声抑制增益G′(k-1,b)、和加权系数α(k,b)。
如上文所述,通过α计算单元30计算的每个频带的加权系数α(k,b)被更新以便对于被确定为噪声的频带b,接近最大值αMAX(b),并且对于被确定为非噪声的频带b,立即被当作最小值αMIN(b)。因此,计算先验SNR“ξ(k,b)”,从而对于通常具有宽的变化的诸如音频的非噪声,跟随是快的,并且相反地,对于假设平稳性的噪声,跟随是慢的。
关于每个帧的通过后验SNR计算单元29计算的每个频带的后验SNR“γ(k,b)”被提供给噪声抑制增益计算单元32。关于每个帧的通过先验SNR计算单元31计算的先验SNR“ξ(k,b)”也被提供给噪声抑制增益计算单元32。通过噪声抑制增益计算单元32,根据后验SNR“γ(k,b)”和先验SNR“ξ(k,b)”对于每个帧计算每个频带的噪声抑制增益G(k,b)(参见式(15))。
关于每个帧的通过噪声抑制增益计算单元32计算的每个频带的噪声抑制增益G(k,b)被提供给噪声抑制增益校正单元33。对于每个帧,噪声抑制增益校正单元33基于每个频带的预先设定的噪声抑制增益的下限值GMIN(b),对每个频带的噪声抑制增益G(k,b)加上限制器,并且计算校正的噪声抑制增益G′(k,b)。
关于每个帧的通过噪声抑制增益校正单元33校正的每个频带的噪声抑制增益G′(k,b)被提供给滤波器配置单元34。通过滤波器配置单元34,对于每个帧,根据每个频带的噪声抑制增益G′(k,b)计算与每个傅立叶系数对应的噪声抑制增益。关于每个帧的通过滤波器配置单元34如此计算的与各傅立叶系数对应的噪声抑制增益被提供给傅立叶系数校正单元16作为噪声抑制增益生成单元15的输出。
如上文所述,在图1中示出的噪声抑制装置10中,通过噪声抑制增益生成单元15的噪声抑制增益计算单元32,根据后验SNR“γ(k,b)”和先验SNR“ξ(k,b)”计算每个频带的噪声抑制增益G(k,b)。再者,通过先验SNR计算单元31计算每个频带的先验SNR“ξ(k,b)”。在该情况下,使用前一帧和当前帧的后验SNR“γ(k-1,b),γ(k,b)”,前一帧的噪声抑制增益G′(k-1,b)、和加权系数α(k,b)。
根据信号状态适当地改变通过α计算单元30计算的每个频带的加权系数α(k,b)。就是说,更新加权系数α(k,b)以便对于被确定为噪声的频带b(Fnz(k,b)=1),接近最大值αMAX(b),并且对于被确定为非噪声的频带b(Fnz(k,b)=0),立即被当作最小值αMIN(b)。因此,计算先验SNR“ξ(k,b)”,从而对于通常具有宽的变化的诸如音频的非噪声,跟随是快的,并且相反地,对于假设平稳性的噪声,跟随是慢的。
因此,可以增加通过噪声抑制增益生成单元15计算的每个频带的噪声抑制增益G(k,b)的精度(跟随)。因此,例如,在诸如音频信号的起点的具有宽的信号变化的位置出现的声音质量劣化可以被抑制,在诸如其中信号变化平缓的平稳噪声区间的位置中可以抑制音乐噪声,并且可以改进声音质量。
再者,如上文所述,在图1中示出的噪声抑制装置10中,使用语音声音标志Fv(k)和每个频带的频带功率B(k,b),通过噪声抑制增益生成单元15的噪声/非噪声确定单元27设定每个频带的噪声频带标志Fnz(k,b)。就是说,即使在其中噪声和非噪声混合的信号中,可以进行关于不与非噪声重叠的频带的噪声的检测。再者,通过噪声频带功率估计单元28,可以基于噪声频带标志Fnz(k,b),执行仅其中Fnz(k,b)=1成立的频带,即噪声频带的噪声频带功率估计值D(k,b)的更新。因此,可以改进噪声频带功率估计值D(k,b)的估计的时间跟随能力,同时可以改进估计精度。因此,作为结果可以改进噪声抑制增益的精度,并且可以改进声音质量。
再者,如上文所述,在图1中示出的噪声抑制装置10中,使用语音声音标志Fv(k)和每个频带的频带功率B(k,b),通过噪声抑制增益生成单元15的噪声/非噪声确定单元27设定每个频带的噪声频带标志Fnz(k,b)。就是说,通过噪声/非噪声确定单元27,在整个帧上执行借助语音声音标志Fv(k)的噪声/非噪声确定,并且通过将其与借助频带功率平稳性检测的每个频带的确定组合,可以获得最终确定结果。因此,可以增加每个频带的噪声/非噪声的确定精度。
再者,如上文所述,在图1中示出的噪声抑制装置10中,通过噪声抑制增益生成单元15的噪声抑制增益校正单元33计算校正的噪声抑制增益G′(k,b)。在该情况下,基于每个频带的预先设定的噪声抑制增益的下限值GMIN(b),将限制器加入到每个频带的噪声抑制增益G(k,b),并且执行校正。因此,在使声学噪声减少量最大的同时,防止声音质量劣化因估计误差等而变得过小。
注意,在图1中示出的噪声抑制装置10中,使用语音声音标志Fv(k)和每个频带的频带功率B(k,b),通过噪声抑制增益生成单元15的噪声/非噪声确定单元27设定每个频带的噪声频带标志Fnz(k,b)。然而,可以考虑,通过噪声/非噪声确定单元27,对于每个帧,使用语音声音标志Fv(k)或者每个频带的频带功率B(k,b)中的仅一个来设定每个频带的噪声频带标志Fnz(k,b)。
在仅使用语音声音标志Fv(k)设定每个频带的噪声频带标志Fnz(k,b)的情况下,通过噪声/非噪声确定单元27执行例如图5中的流程图中的除了步骤ST6中的处理之外的确定处理。另一方面,在使用每个频带的频带功率B(k,b)中的仅一个设定每个频带的噪声频带标志Fnz(k,b)的情况下,通过噪声/非噪声确定单元27执行例如图5中的流程图中的除了步骤ST2中的处理之外的确定处理。
2.第二实施例
噪声抑制装置
图7示出了根据第二实施例的噪声抑制装置10S的配置示例。较之作为适用于单耳信号的噪声抑制的情况下的配置示例的图1中示出的噪声抑制装置10,噪声抑制装置10S是适用于立体声信号的噪声抑制的情况下的配置示例。在图7中,与图1对应的部分附有相同的附图标记,或者将字母“L(左)”或“R(右)”附于相同的附图标记并且将其示出,并且将适当地省略其详细描述。在适用于立体声信号的情况下,基本上应针对每个通道执行单耳信号的处理。然而,在立体声信号的情况下,可能出现由估计误差等导致的不利影响,诸如处理结果定位的劣化。因此,实现了用于应对立体声信号的对策。
噪声抑制装置10S由左通道(Lch)处理系统100L、右通道(Rch)处理系统100R和噪声抑制增益生成单元15S构成。左通道处理系统100L和右通道处理系统100R均被配置为与图1中示出的噪声抑制装置10的处理系统相似(从信号输入端11到信号输出端20)。
就是说,左通道处理系统100L具有信号输入端11L、帧化单元12L、窗口化单元13L和快速傅立叶变换单元14L。左通道处理系统100L还具有傅立叶系数校正单元16L、快速傅立叶逆变换单元17L、窗口化单元18L、重叠添加单元19L和信号输出端20L。
再者,右通道处理系统100R具有信号输入端11R、帧化单元12R、窗口化单元13R和快速傅立叶变换单元14R。右通道处理系统100R还具有傅立叶系数校正单元16R、快速傅立叶逆变换单元17R、窗口化单元18R、重叠添加单元19R和信号输出端20R。
对于每个帧,噪声抑制增益生成单元15S生成与左通道处理系统100L的各傅立叶系数对应的噪声抑制增益和与右通道处理系统100R的各傅立叶系数对应的噪声抑制增益。噪声抑制增益生成单元15S生成与左通道处理系统100L和右通道处理系统100R的各傅立叶系数对应的噪声抑制增益GfL(k,f)和GfR(k,f)。在该情况下,噪声抑制增益生成单元15S基于帧化信号和各傅立叶系数(各频谱),生成每个通道的噪声抑制增益GfL(k,f)和GfR(k,f)。后面将描述噪声抑制增益生成单元15S的细节。
将简要描述噪声抑制装置10S的操作。通过左通道处理系统100L,将左通道输入信号yL(n)提供给信号输入端11L,并且输入信号yL(n)被提供给帧化单元12L。通过帧化单元12L,输入信号yL(n)被帧化以便于执行每个帧的处理。就是说,通过帧化单元12L,输入信号yL(n)被分割为预定的帧长度,例如帧长度为Nf个样本的的帧。每个帧的帧化信号yfL(k,n)被依次提供给窗口化单元13L。
通过窗口化单元13L,通过分析窗口wana(n)执行帧化信号yfL(k,n)的窗口化以便于获得通过后面描述的快速傅立叶变换单元14L稳定化的傅立叶系数。如此窗口化的帧化信号yfL(k,n)被提供给快速傅立叶变换单元14L。通过快速傅立叶变换单元14L,窗口化的帧化信号yfL(k,n)经历快速傅立叶变换处理,并且从时域信号变换为频域信号。通过快速傅立叶变换处理获得的各傅立叶系数(各频谱)YfL(k,f)被提供给傅立叶系数校正单元16L。注意,(k,f)示出了第k个帧的第f个频率。
再者,通过右通道处理系统100R,将右通道输入信号yR(n)提供给信号输入端11R,并且输入信号yR(n)被提供给帧化单元12R。通过帧化单元12R,输入信号yR(n)被帧化以便于执行每个帧的处理。就是说,通过帧化单元12R,输入信号yR(n)被分割为预定的帧长度,例如帧长度为Nf个样本的的帧。每个帧的帧化信号yfR(k,n)被依次提供给窗口化单元13R。
通过窗口化单元13R,通过分析窗口wana(n)执行帧化信号yfR(k,n)的窗口化以便于获得通过后面描述的快速傅立叶变换单元14R稳定化的傅立叶系数。如此窗口化的帧化信号yfR(k,n)被提供给快速傅立叶变换单元14R。通过快速傅立叶变换单元14R,窗口化的帧化信号yfR(k,n)经历快速傅立叶变换处理,并且从时域信号变换为频域信号。通过快速傅立叶变换处理获得的各傅立叶系数(各频谱)YfR(k,f)被提供给傅立叶系数校正单元16R。注意,(k,f)示出了第k个帧的第f个频率。
通过帧化单元12L和12R获得的每个帧的帧化信号yfL(k,n)和yfR(k,n)被提供给噪声抑制增益生成单元15S。通过快速傅立叶变换单元14L和14R获得的每个帧的傅立叶系数YfL(k,n)和YfR(k,n)也被提供给噪声抑制增益生成单元15S。基于帧化信号yfL(k,n)和yfR(k,n)以及傅立叶系数YfL(k,n)和YfR(k,n),对于每个帧,通过噪声抑制增益生成单元15S,生成左和右通道公共的与各傅立叶系数对应的噪声抑制增益。
再者,在左通道处理系统100L中,通过傅立叶系数校正单元16L,对于每个帧,执行对通过快速傅立叶变换单元14L的快速傅里叶变换处理获得的各傅立叶系数YfL(k,n)的校正。在该情况下,获取各傅立叶系数YfL(k,n)和通过噪声抑制增益生成单元15S生成的与各傅立叶系数对应的噪声抑制增益GfL(k,f)的积并且执行系数校正。就是说,通过傅立叶系数校正单元16L执行在频率轴上的用于抑制噪声的滤波器计算。经历系数校正的各傅立叶系数被提供给快速傅立叶逆变换单元17L。
通过快速傅立叶逆变换单元17L,对于每个帧,对经历系数校正的各傅立叶系数执行快速傅立叶逆变换处理,并且使频域信号变换为时域信号。通过快速傅立叶逆变换单元17L获得的帧化信号被提供给窗口化单元18L。通过窗口化单元18L,对于每个帧,以合成窗口wsyn(n)对通过快速傅立叶逆变换单元17L获得的帧化信号执行窗口化。
通过窗口化单元18L窗口化的每个帧的帧化信号被提供给重叠添加单元19L。通过重叠添加单元19L,使每个帧的帧化信号的帧边界部分层叠,并且获得噪声已被抑制的输出信号。该输出信号随后被输出到左通道处理系统100L的信号输出端20L。
再者,在右通道处理系统100R中,通过傅立叶系数校正单元16R,对于每个帧,执行对通过快速傅立叶变换单元14R的快速傅里叶变换处理获得的各傅立叶系数YfR(k,n)的校正。在该情况下,获取各傅立叶系数YfR(k,n)和通过噪声抑制增益生成单元15S生成的与各傅立叶系数对应的噪声抑制增益GfR(k,f)的积并且执行系数校正。就是说,通过傅立叶系数校正单元16R执行在频率轴上的用于抑制噪声的滤波器计算。经历系数校正的各傅立叶系数被提供给快速傅立叶逆变换单元17R。
通过快速傅立叶逆变换单元17R,对于每个帧,对经历系数校正的各傅立叶系数执行快速傅立叶逆变换处理,并且使频域信号变换为时域信号。通过快速傅立叶逆变换单元17R获得的帧化信号被提供给窗口化单元18R。通过窗口化单元18R,对于每个帧,以合成窗口wsyn(n)对通过快速傅立叶逆变换单元17R获得的帧化信号执行窗口化。
通过窗口化单元18R窗口化的每个帧的帧化信号被提供给重叠添加单元19R。通过重叠添加单元19R,使每个帧的帧化信号的帧边界部分层叠,并且获得噪声已被抑制的输出信号。该输出信号随后被输出到右通道处理系统100R的信号输出端20R。
噪声抑制增益生成单元
将描述噪声抑制增益生成单元15S的细节。图8示出了噪声抑制增益生成单元15S的配置示例。在图8中,与图1对应的部分附有相同的附图标记,或者将字母“L”、“R”或“S”附于相同的附图标记并且将其示出,并且将适当地省略其详细描述。现在,“L”指示左通道侧的处理部分,“R”指示右通道侧的处理部分,并且“S”指示左和右通道的公共处理部分。
噪声抑制增益生成单元15S具有频带分割单元21L和21R、频带功率计算单元22L和22R、语音声音检测单元23L和33R、噪声/非噪声确定单元27S、和噪声频带功率估计单元28L和28R。噪声抑制增益生成单元15S还具有后验SNR计算单元29L和29R、α计算单元30S、先验SNR计算单元31L和31R、噪声抑制增益计算单元32L和32R、噪声抑制增益校正单元33L和33R、以及滤波器配置单元34L和34R。
频带分割单元21L和21R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的频带分割单元21相似。频带分割单元21L和21R将通过快速傅立叶变换单元14L和14R获得的各频谱(各傅立叶系数)YfL(k,f)、YfR(k,f)分割为例如25个频带(参见表1)。频带功率计算单元22L和22R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的频带功率计算单元22相似。频带功率计算单元22L和22R根据通过频带分割单元21L和21R分割的每个频带的频谱来计算频带功率BL(k,b)和BR(k,b)。
语音声音检测单元23L和23R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的语音声音检测单元23相似。语音声音检测单元23L和23R基于通过帧化单元12L和12R获得的帧化信号yfL(k,n)和yfR(k,n),输出指示每个帧中是否包括语音声音的语音声音标志FvL(k)和FvR(k)。
噪声/非噪声确定单元27S被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的噪声/非噪声确定单元27相似。噪声/非噪声确定单元27S被设定为处置立体声,并且对于每个帧设定左和右通道公共的每个频带的噪声频带标志Fnz(k,b)。
噪声/非噪声确定单元27S设定每个频带的噪声频带标志Fnz(k,b)。在该情况下,噪声/非噪声确定单元27S使用通过语音声音检测单元23L和23R获得的语音声音标志FvL(k)和FvR(k),以及通过频带功率计算单元22L和22R计算的每个频带的频带功率BL(k,b)和BR(k,b)。噪声/非噪声确定单元27S对于每个帧执行每个频带的图9中的流程图中示出的确定处理。
噪声/非噪声确定单元27S开始于步骤ST11中的确定处理,并且执行系统初始化。通过该初始化,噪声/非噪声确定单元27S将噪声候选帧连续计数器Cn(b)初始化为Cn(b)=0。
接着,噪声/非噪声确定单元27S移动到步骤ST12中的处理。在步骤ST12中,噪声/非噪声确定单元27S确定语音声音标志FvL(k)是否大于0,即是否FvL(k)=1。在步骤ST12中,噪声/非噪声确定单元27S还确定语音声音标志FvR(k)是否大于0,即是否FvR(k)=1。
当FvL(k)=1并且FvR(k)=1时,即在左和右通道两者上当前帧k是语音声音时,噪声/非噪声确定单元27S在步骤ST13中使噪声候选帧连续计数器Cn(b)清零并且将其设定为Cn(b)=0。噪声/非噪声确定单元27S随后确定当前频带b不是噪声,并且在步骤ST14中将噪声频带标志Fnz(k,b)设定为Fnz(k,b)=0,并且随后在步骤ST15中结束确定处理。
当在步骤ST12中FvL(k)=1成立并且FvR(k)=1不成立时,即在当前帧k的至少左和右通道中的一个或另一个不是语音声音时,噪声/非噪声确定单元27S移动到步骤ST16中的处理。在步骤ST16中,噪声/非噪声确定单元27S获得左通道侧的当前帧k的频带功率BL(k,b)和前一帧k-1的频带功率BL(k-1,b)的功率比。在步骤ST16中,噪声/非噪声确定单元27S还获得右通道侧的当前帧k的频带功率BR(k,b)和前一帧k-1的频带功率BR(k-1,b)的功率比。
在这里的步骤ST16中,噪声/非噪声确定单元27S确定左和右通道的功率比两者是否包含在低水平侧阈值TpL(b)和高水平侧阈值TpH(b)之间。就是说,进行关于TpL(b)<BL(k,b)/BL(k-1,b)<TpH(b)是否成立以及TpL(b)<BR(k,b)/BR(k-1,b)<TpH(b)是否成立的确定。
当左和右通道的功率比两者包含在这两个阈值之间时,噪声/非噪声确定单元27S将当前频带b设定为噪声候选者,并且当左和右通道的功率比两者未包含在这两个阈值之间时,确定当前频带b不是噪声。这里的确定基于如下假设:噪声信号功率是固定的,并且相反地,具有宽的功率变化的信号不是噪声。
当左和右通道的功率比两者未包含在这两个阈值之间时,噪声/非噪声确定单元27S在步骤ST13中使噪声候选帧连续计数器Cn(b)清零,并且将其设定为Cn(b)=0。噪声/非噪声确定单元27S随后确定当前频带b不是噪声,并且在步骤ST14中设定Fnz(k,b)=0,并且随后在步骤ST15中结束确定处理。
另一方面,当左和右通道的功率比两者包含在这两个阈值之间时,即在当前频带b被设定为噪声候选者时,噪声/非噪声确定单元27S移动到步骤ST17中的处理。在步骤ST17中,噪声/非噪声确定单元27S使噪声候选帧连续计数器Cn(b)的计数增加1。
噪声/非噪声确定单元27S随后在步骤ST18中确定噪声候选帧连续计数器Cn(b)是否超过阈值Tc。当Cn(b)>Tc不成立时,噪声/非噪声确定单元27S确定当前频带b不是噪声,并且在步骤ST14中设定Fnz(k,b)=0,并且随后在步骤ST15中结束确定处理。
另一方面,当Cn(b)>Tc成立时,噪声/非噪声确定单元27S移动到步骤ST19中的处理。在步骤ST19中,噪声/非噪声确定单元27S确定当前频带b是噪声,并且将噪声频带标志Fnz(k,b)设定为Fnz(k,b)=1,并且随后在步骤ST15中结束确定处理。
返回图8,噪声频带功率估计单元28L和28R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的噪声频带功率估计单元28相似。噪声频带功率估计单元28L和28R对于每个帧估计每个频带的噪声频带功率估计值DL(k,b)和DR(k,b)。噪声频带功率估计单元28L和28R仅针对其中Fnz(k,b)=1成立的频带,即仅针对噪声频带,执行对频带的噪声频带功率估计值DL(k,b)和DR(k,b)的更新(参见式(10))。在该情况下,噪声频带功率估计单元28L和28R基于通过噪声/非噪声确定单元27S设定的左和右通道公共的噪声频带标志Fnz(k,b)来执行处理。
后验SNR计算单元29L和29R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的后验SNR计算单元29相似。后验SNR计算单元29L和29R对于每个帧计算每个频带的后验SNR“γL(k,b),γR(k,b)”(参见式(11))。在该情况下,后验SNR计算单元29L和29R使用输入信号频带功率BL(k,b)和BR(k,b)以及噪声频带功率估计值DL(k,b)和DR(k,b)。
先验SNR计算单元31L和31R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的先验SNR计算单元31相似。先验SNR计算单元31L和31R对于每个帧计算每个频带的先验SNR“ξL(k,b),ξR(k,b)”(参见式(14))。
现在,先验SNR计算单元31L计算每个频带的先验SNR“ξL(k,b)”。在该情况下,先验SNR计算单元31L使用当前帧和前一帧的后验SNR“γL(k-1,b),γL(k,b)”、前一帧的噪声抑制增益G′L(k-1,b)、以及左和右通道公共的加权系数α(k,b)。再者,先验SNR计算单元31R计算每个频带的先验SNR“ξR(k,b)”。在该情况下,先验SNR计算单元31R使用当前帧和前一帧的后验SNR“γR(k-1,b),γR(k,b)”、前一帧的噪声抑制增益G′R(k-1,b)、以及左和右通道公共的加权系数α(k,b)。
α计算单元30S被配置为与图1中示出的噪声抑制装置10的α计算单元30相似,并且计算先验SNR计算单元31L和31R使用的左和右通道公共的加权系数α(k,b)。α计算单元30S不是固定值,而是被计算为随帧和频带变化的加权系数α(k,b)(参见式(13))。对于被确定为噪声的频带b(Fnz(k,b)=1),加权系数α(k,b)在最大值αMAX(b)附近,并且对于被确定为非噪声的频带b(Fnz(k,b)=0),加权系数α(k,b)变为最小值αMIN(b)。
噪声抑制增益计算单元32L和32R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的噪声抑制增益计算单元32相似。噪声抑制增益计算单元32L和32R对于每个帧计算每个频带的噪声抑制增益GL(k,b)和GR(k,b)(参见式(15))。在该情况下,噪声抑制增益计算单元32L和32R根据后验SNR“γL(k,b),γR(k,b)”和先验SNR“ξL(k,b),ξR(k,b)”计算每个频带的噪声抑制增益GL(k,b)和GR(k,b)。
噪声抑制增益校正单元33L和33R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的噪声抑制增益校正单元33相似。噪声抑制增益校正单元33L和33R对于每个帧对通过噪声抑制增益计算单元32L和32R计算的噪声抑制增益GL(k,b)和GR(k,b)执行校正。就是说,噪声抑制增益校正单元33L和33R计算校正的噪声抑制增益G′L(k,b)和G′R(k,b)(参见式(16))。在该情况下,噪声抑制增益校正单元33L和33R基于每个频带的预先设定的噪声抑制增益的下限值GMIN(b),对噪声抑制增益GL(k,b)和GR(k,b)加上限制器。
滤波器配置单元34L和34R被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15的滤波器配置单元34相似。滤波器配置单元34L和34R对于每个帧,根据通过噪声抑制增益校正单元33L和33R校正的每个频带的噪声抑制增益G′L(k,b)和G′R(k,b),计算与各傅立叶系数对应的噪声抑制增益GfL(k,f)和GfR(k,f)。在该情况下,滤波器配置单元34L和34R构成了频率轴上的滤波器。
将简要描述噪声抑制增益生成单元15S的操作。关于每个帧的通过快速傅立叶变换单元14L和14R的快速傅立叶变换处理获得的各频谱(各傅立叶系数)YfL(k,f)和YfR(k,f)被提供给频带分割单元21L和21R。通过频带分割单元21L和21R,对于每个帧,各频谱YfL(k,f)和YfR(k,f)被分割为例如25个频带(参见表1)。
对于每个帧,通过频带分割单元21L和21R的频带分割获得的每个频带的频谱被提供给频带功率计算单元22L和22R。通过频带功率计算单元22L和22R,对于每个帧,计算每个频带的频带功率BL(k,b)和BR(k,b)。例如,计算与频带b中的各频谱对应的功率谱,并且其最大值或平均值被设定为频带功率BL(k,b)和BR(k,b)。
再者,通过帧化单元12L和12R获得的帧化信号yfL(k,n)和yfR(k,n)被提供给语音声音检测单元23L和23R。通过语音声音检测单元23L和23R,基于帧化信号yfL(k,n)和yfR(k,n),获得指示对于每个帧是否包括语音声音的语音声音标志FvL(k)和FvR(k)。通过语音声音检测单元23L和23R,执行整个帧的噪声/非噪声确定,并且当确定为非噪声时,设定FvL(k),FvR(k)=1,并且当确定为噪声时,设定FvL(k),FvR(k)=0。现在,通过基于帧化信号yfL(k,n)和yfR(k,n)检测的过零宽度以及所计算的该过零宽度的直方图来执行语音声音检测单元23L和23R的噪声/非噪声的确定。
关于每个帧的通过语音声音检测单元23L和23R获得的语音声音标志FvL(k)和FvR(k)被提供给噪声/非噪声确定单元27S。关于每个帧的通过频带功率计算单元22L和22R计算的每个频带的频带功率BL(k,b)和BR(k,b)也被提供给噪声/非噪声确定单元27S。使用语音声音标志FvL(k)和FvR(k)和每个频带的频带功率BL(k,b)和BR(k,b),对于每个帧通过噪声/非噪声确定单元27S设定左和右通道公共的每个频带的噪声频带标志Fnz(k,b)(参见图9)。
在该情况下,当FvL(k)=1并且FvR(k)=1成立时,并且对于左和右通道两者整个帧被确定为非噪声时,所有频带被确定为不是噪声,并且对于所有频带,Fnz(k,b)=0成立。
再者,当FvL(k)=1并且FvR(k)=1不成立时,并且对于左和右通道两者整个帧未被确定为非噪声时,通过每个频带的频带功率的平稳性检测来执行噪声或非噪声的确定。当对于左和右通道两者频带功率具有平稳性,并且其频带被确定为噪声候选者时,其频带的噪声候选帧连续计数器Cn(b)的计数增加1。当其计数值超过阈值Tc时,其频带被确定为噪声,并且Fnz(k,b)=1成立。
另一方面,当在左和右通道两者或之一中频带功率不具有平稳性,并且频带被确定为非噪声时,Fnz(k,b)=0成立。再者,即使在左和右通道两者中频带功率具有平稳性,并且其频带被确定为噪声候选者,当噪声候选帧连续计数器Cn(b)的计数值处于阈值Tc处或在其以下时,其频带被确定为非噪声,并且Fnz(k,b)=0成立。
关于每个帧的通过噪声/非噪声确定单元27S设定的左和右通道公共的每个频带的噪声频带标志Fnz(k,b)被提供给α计算单元30S。通过α计算单元30S,对于每个帧计算用于计算每个频带的先验SNR“ξL(k,b),ξR(k,b)”的左和右通道公共的加权系数α(k,b)(参见式(14))。对于被确定为噪声的频带b,更新加权系数α(k,b)(参见式(13))。在该情况下,加权系数α(k,b)被更新,以便对于被确定为噪声的频带b(Fnz(k,b)=1),接近最大值αMAX(b),并且对于被确定为非噪声的频带b(Fnz(k,b)=0),立即被当作最小值αMIN(b)。
关于每个帧的通过噪声/非噪声确定单元27S设定的左和右通道公共的每个频带的噪声频带标志Fnz(k,b)被提供给噪声频带功率估计单元28L和28R。关于每个帧的通过频带功率计算单元22L和22R计算的每个频带的频带功率BL(k,b)和BR(k,b)也被提供给噪声频带功率估计单元28L和28R。通过噪声频带功率估计单元28L和28R,对于每个帧估计每个频带的噪声频带功率估计值DL(k,b)和DR(k,b)。
通过噪声频带功率估计单元28L和28R,基于噪声频带标志Fnz(k,b),对于频带执行噪声频带功率估计值DL(k,b)和DR(k,b)的更新,其中Fnz(k,b)=1成立,即仅有噪声频带。例如,使用频带功率BL(k,b)和BR(k,b),并且使用指数加权μnz进行更新(参见式(10))。μnz的值被设定在约0.9和1.0之间,从而噪声频带功率估计值DL(k,b)和DR(k,b)跟随实际噪声改变,并且因此不存在声学不适。
关于每个帧的通过噪声频带功率估计单元28L和28R估计的每个频带的噪声频带功率估计值DL(k,b)和DR(k,b)被提供给后验SNR计算单元29L和29R。关于每个帧的通过频带功率计算单元22L和22R计算的每个频带的频带功率BL(k,b)和BR(k,b)也被提供给后验SNR计算单元29L和29R。通过后验SNR计算单元29L和29R,对于每个帧,使用频带功率BL(k,b)和BR(k,b)和噪声频带功率的估计值DL(k,b)和DR(k,b)计算每个频带的后验SNR“γL(k,b),γR(k,b)”(参见式(11))。在该情况下,使用频带功率BL(k,b)和BR(k,b)和噪声频带功率的估计值DL(k,b)和DR(k,b)。
关于每个帧的通过后验SNR计算单元29L和29R计算的每个频带的后验SNR“γL(k,b),γR(k,b)”被提供给先验SNR计算单元31L和31R。关于每个帧的通过α计算单元30S计算的左和右通道公共的每个频带的加权系数α(k,b)也被提供给先验SNR计算单元31L和31R。此外,通过噪声抑制增益校正单元33L和33R校正的前一帧的每个频带的噪声抑制增益G′L(k,b)和G′R(k,b)被提供给先验SNR计算单元31L和31R。
通过先验SNR计算单元31L和31R,计算每个频带的先验SNR“ξL(k,b),ξR(k,b)”(参见式(14))。通过先验SNR计算单元31L,对于每个帧计算每个频带的先验SNR“ξL(k,b)”。在该情况下,使用前一帧和当前帧的后验SNR“γL(k-1,b),γL(k,b)”,前一帧的噪声抑制增益G′L(k-1,b)和加权系数α(k,b)。再者,通过先验SNR计算单元31R,计算每个频带的先验SNR“ξR(k,b)”。在该情况下,对于每个帧,使用前一帧和当前帧的后验SNR“γR(k-1,b),γR(k,b)”,前一帧的噪声抑制增益G′R(k-1,b)和加权系数α(k,b)。
如上文所述,左和右通道公共的每个频带的加权系数α(k,b)被更新以便对于被确定为噪声的频带b,接近最大值αMAX(b),并且对于被确定为非噪声的频带b,立即被当作最小值αMIN(b)。因此,计算先验SNR“ξL(k,b),ξR(k,b)”,从而对于通常具有宽的变化的诸如音频的非噪声,跟随是快的,并且相反地,对于假设平稳性的噪声,跟随是慢的。
关于每个帧的通过后验SNR计算单元29L和29R计算的每个频带的后验SNR“γL(k,b),γR(k,b)”被提供给噪声抑制增益计算单元32L和32R。关于每个帧的通过先验SNR计算单元31L和31R计算的先验SNR“ξL(k,b),ξR(k,b)”也被提供给噪声抑制增益计算单元32L和32R。通过噪声抑制增益计算单元32L和32R,根据后验SNR“γL(k,b),γR(k,b)”和先验SNR“ξL(k,b),ξR(k,b)”对于每个帧计算每个频带的噪声抑制增益GL(k,b)和GR(k,b)(参见式(15))。
关于每个帧的通过噪声抑制增益计算单元32L和32R计算的每个频带的噪声抑制增益GL(k,b)和GR(k,b)被提供给噪声抑制增益校正单元33L和33R。对于每个帧,通过噪声抑制增益校正单元33L和33R计算校正的噪声抑制增益G′L(k,b)和G′R(k,b)。在该情况下,基于每个频带的预先设定的噪声抑制增益的下限值GMIN(b),对每个频带的噪声抑制增益GL(k,b)和GR(k,b)加上限制器。
关于每个帧的通过噪声抑制增益校正单元33L和33R校正的每个频带的噪声抑制增益G′L(k,b)和G′R(k,b)被提供给滤波器配置单元34L和34R。通过滤波器配置单元34L和34R,对于每个帧,根据每个频带的噪声抑制增益G′L(k,b)和G′R(k,b)计算与每个傅立叶系数对应的噪声抑制增益GfL(k,f)和GfR(k,f)。关于每个帧的通过滤波器配置单元34L和34R如此计算的与各傅立叶系数对应的噪声抑制增益被提供给傅立叶系数校正单元16L和16R作为噪声抑制增益生成单元15S的输出。
如上文所述,图7中示出的噪声抑制装置10S是应用于立体声信号的情况下的配置示例,但是噪声抑制增益生成单元15S基本上被配置为与图1中示出的噪声抑制装置10的噪声抑制增益生成单元15相似。因此,通过图7中示出的噪声抑制装置10S,也可以获得与通过图1中示出的噪声抑制装置10获得的优点相似的优点。
再者,在图7中示出的噪声抑制装置10S中,对于每个帧,通过噪声抑制增益生成单元15S的噪声/非噪声确定单元27S设定左和右通道公共的每个频带的噪声频带标志Fnz(k,b)。在该情况下,使用语音声音标志FvL(k)和FvR(k)以及每个频带的频带功率BL(k,b)和BR(k,b)。通过噪声频带功率估计单元28L和28R,对于每个帧,使用通过噪声/非噪声确定单元27S设定的左和右通道公共的每个频带的噪声频带标志Fnz(k,b),并且估计每个频带的噪声频带功率估计值DL(k,b)和DR(k,b)。
因而,使噪声/非噪声确定对于左和右通道是公共的,并且通过噪声频带功率估计单元28L和28R使用公共的确定结果。因此,通过图7中示出的噪声抑制装置10S,可以根据左和右通道的噪声频带功率估计值DL(k,b)和DR(k,b)的估计误差,抑制噪声抑制增益GL(k,b)和GR(k,b)防止出现非预期的幅度差。因而,可以避免左和右通道中的由于不一致引起的定位劣化。
注意,图7中示出的噪声抑制装置10S是应用于立体声信号的噪声抑制的情况下的配置示例。尽管将省略详细描述,但是毋庸赘言,可以相似地配置应用于三个或更多个通道的多通道信号的噪声抑制的噪声抑制装置,对于每个通道具有公共的噪声/非噪声确定。
3.修改
注意,根据上述实施例的噪声抑制装置10和10S可以通过硬件配置,但是相似的处理也可以通过软件执行。图10示出了用于通过软件执行处理的计算机装置50的配置示例。计算机装置50由CPU(中央处理单元)181、ROM(只读存储器)182、RAM(随机存取存储器)183和数据输入/输出单元(数据I/O)184构成。
CPU 181的处理程序和其他数据被存储在ROM 182中。RAM 183用作CPU 181的工作区域。CPU 181适当地读出ROM 182中存储的处理程序,将读出的处理程序传输并且加载到RAM 13,读出加载的处理程序,并且执行噪声抑制处理。
通过计算机装置50,输入信号(单耳信号、立体声信号)经由数据I/O 184输入,并且在RAM 183中累积。对于RAM 183中累积的输入信号,通过CPU 181执行与上述实施例相似的噪声抑制处理。作为处理结果的噪声被抑制的输出信号经由数据I/0184输出到外部。
本公开包含与在2010年9月7日提交日本专利局的日本在先专利申请JP 2010-1199512中公开的主题内容相关的主题内容,其整体内容通过引用合并于此。
本领域的技术人员应当理解,在所附权利要求或其等同物的范围内,可以根据设计需要和其他因素进行各种修改、组合、子组合和变更。
Claims (11)
1.一种噪声抑制装置包括:
帧化单元,被配置为将输入信号分割为具有预定帧长度的帧来帧化所述输入信号;
频带分割单元,被配置为将通过所述帧化单元获得的帧化信号分割为多个频带并且获得频带分割信号;
频带功率计算单元,被配置为根据通过所述频带分割单元获得的每个频带分割信号来获得频带功率;
噪声确定单元,被配置为基于所述帧化信号的特征确定每个频带是否是噪声;
噪声频带功率估计单元,被配置为根据所述噪声确定单元的确定结果以及通过所述频带功率计算单元获得的每个频带分割信号的频带功率,来估计各频带的噪声频带功率;
噪声抑制增益确定单元,被配置为基于通过所述噪声频带功率估计单元估计的每个频带的噪声频带功率以及通过所述频带功率计算单元获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;
噪声抑制单元,被配置为将通过所述噪声抑制增益确定单元确定的每个频带的噪声抑制增益应用于通过所述频带分割单元获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;
频带合成单元,被配置为合成通过所述噪声抑制单元获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及
帧化合成单元,被配置为合成通过所述频带合成单元获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;
所述噪声抑制增益确定单元具有
信噪比SNR计算单元,被配置为对于每个频带,根据通过所述频带功率计算单元获得的每个频带分割信号的频带功率以及通过所述噪声频带功率估计单元估计的每个频带的噪声频带功率来计算SNR,以及
SNR平滑单元,被配置为对于每个频带,使通过所述SNR计算单元计算的SNR平滑;
其中基于所述SNR平滑单元使其平滑的每个频带的SNR,确定每个频带的噪声抑制增益;
以及其中所述SNR平滑单元基于所述噪声确定单元的确定结果和频带,改变平滑系数。
2.根据权利要求1所述的噪声抑制装置,其中所述噪声抑制增益确定单元基于通过所述SNR平滑单元使其平滑的每个频带的SNR以及通过所述SNR计算单元计算的SNR,确定每个频带的噪声抑制增益。
3.根据权利要求1所述的噪声抑制装置,其中所述噪声抑制增益确定单元对于每个频带,将当前帧信号的频带功率同所述估计的噪声频带功率的比设定为第一SNR,将前一帧信号的频带功率和噪声抑制增益相乘的量同前一帧的估计的噪声频带功率的比设定为第二SNR,并且使用所述第一SNR和所述第二SNR确定噪声抑制增益。
4.根据权利要求1所述的噪声抑制装置,其中所述噪声确定单元将每个频带设定为确定频带,比较该确定频带的频带分割信号的当前帧和过去帧的频带功率,并且当该频带功率中的变化在阈值内时,将该确定频带确定为噪声。
5.根据权利要求1所述的噪声抑制装置,进一步包括:
直方图计算单元,被配置为计算通过所述帧化单元获得的帧化信号中的过零宽度的直方图;
其中所述噪声确定单元基于通过所述直方图计算单元计算的直方图,确定每个频带是否是噪声。
6.根据权利要求1所述的噪声抑制装置,进一步包括:
直方图计算单元,被配置为计算通过所述帧化单元获得的帧化信号中的过零宽度的直方图;
其中所述噪声确定单元,将每个频带当作依次确定频带,在基于通过所述直方图计算单元计算的直方图来确定噪声的情况下,以及当该确定频带的频带分割信号的当前帧和过去帧之间的变化在阈值内时,将该确定频带确定为噪声。
7.根据权利要求1所述的噪声抑制装置,进一步包括:
噪声抑制增益校正单元,当通过所述噪声抑制增益确定单元确定的噪声抑制增益小于预先设定的下限值时,被配置为将噪声抑制增益的值校正为该下限值;其中
所述噪声抑制单元使用通过所述噪声抑制增益校正单元校正的噪声抑制增益。
8.一种噪声抑制装置包括:
多个帧化单元,被配置为分别将多个通道的输入信号分割为具有预定帧长度的帧来帧化所述输入信号;
多个频带分割单元,被配置为分别将通过所述多个帧化单元获得的帧化信号分割为多个频带并且获得频带分割信号;
多个频带功率计算单元,被配置为分别根据通过所述多个频带分割单元获得的每个频带分割信号来获得频带功率;
噪声确定单元,被配置为基于所述多个通道的所述帧化信号的特征确定每个频带是否是噪声;
多个噪声频带功率估计单元,被配置为根据所述噪声确定单元的确定结果以及通过所述多个频带功率计算单元获得的每个频带分割信号的频带功率,来估计各频带的噪声频带功率;
多个噪声抑制增益确定单元,被配置为基于通过所述多个噪声频带功率估计单元估计的每个频带的噪声频带功率以及通过所述多个频带功率计算单元获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;
多个噪声抑制单元,被配置为分别将通过所述多个噪声抑制增益确定单元确定的每个频带的噪声抑制增益应用于通过所述多个频带分割单元获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;
多个频带合成单元,被配置为分别合成通过所述多个噪声抑制单元获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及
多个帧化合成单元,被配置为分别合成通过所述多个频带合成单元获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;
所述噪声抑制增益确定单元具有
信噪比SNR计算单元,被配置为对于每个频带,根据通过所述频带功率计算单元获得的每个频带分割信号的频带功率以及通过所述噪声频带功率估计单元估计的每个频带的噪声频带功率来计算SNR,以及
SNR平滑单元,被配置为对于每个频带,使通过所述SNR计算单元计算的SNR平滑;
其中基于所述SNR平滑单元使其平滑的每个频带的SNR,确定每个频带的噪声抑制增益;
以及其中所述SNR平滑单元基于所述噪声确定单元的确定结果和频带,改变平滑系数。
9.根据权利要求8所述的噪声抑制装置,其中所述噪声确定单元将每个频带设定为依次确定频带,对于每个确定频带确定每个通道是否是噪声,并且当对于所有通道确定为噪声时,确定该确定频带是噪声。
10.一种噪声抑制方法,包括:
帧化,用于将输入信号分割为具有预定帧长度的帧来帧化所述输入信号;
频带分割,用于将通过所述帧化而获得的帧化信号分割为多个频带并且获得频带分割信号;
频带功率计算,用于根据通过所述频带分割而获得的每个频带分割信号来获得频带功率;
噪声确定,用于基于所述帧化信号的特征确定每个频带是否是噪声;
噪声频带功率估计,用于根据所述噪声确定的确定结果以及通过所述频带功率计算而获得的每个频带分割信号的频带功率,来估计每个频带的噪声频带功率;
噪声抑制增益确定,用于基于通过所述噪声频带功率估计而估计的每个频带的噪声频带功率以及通过所述频带功率计算而获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;
噪声抑制,用于将通过所述噪声抑制增益确定而确定的每个频带的噪声抑制增益应用于通过所述频带分割而获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;
频带合成,用于合成通过所述噪声抑制而获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及
帧化合成,用于合成通过所述频带合成而获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;
其中通过所述噪声抑制增益确定,对于每个频带,根据通过所述频带功率计算而获得的频带分割信号的频带功率以及通过所述噪声频带功率估计而估计的频带的噪声频带功率来计算SNR,使所述计算的SNR平滑,基于该平滑的SNR确定噪声抑制增益,以及基于所述噪声确定的确定结果和频带来改变平滑系数。
11.一种程序,使计算机用作:
帧化单元,被配置为将输入信号分割为具有预定帧长度的帧来帧化所述输入信号;
频带分割单元,被配置为将通过所述帧化单元获得的帧化信号分割为多个频带并且获得频带分割信号;
频带功率计算单元,被配置为根据通过所述频带分割单元获得的每个频带分割信号来获得频带功率;
噪声确定单元,被配置为基于所述帧化信号的特征确定每个频带是否是噪声;
噪声频带功率估计单元,被配置为根据所述噪声确定单元的确定结果以及通过所述频带功率计算单元获得的每个频带分割信号的频带功率,来估计每个频带的噪声频带功率;
噪声抑制增益确定单元,被配置为基于通过所述噪声频带功率估计单元估计的每个频带的噪声频带功率以及通过所述频带功率计算单元获得的每个频带分割信号的频带功率,来确定每个频带的噪声抑制增益;
噪声抑制单元,被配置为将通过所述噪声抑制增益确定单元确定的每个频带的噪声抑制增益应用于通过所述频带分割单元获得的每个频带分割信号,并且获得噪声已被抑制的频带分割信号;
频带合成单元,被配置为合成通过所述噪声抑制单元获得的每个频带分割信号的频带,并且获得噪声已被抑制的帧化信号;以及
帧化合成单元,被配置为合成通过所述频带合成单元获得的每个帧的帧化信号的帧并且获得噪声已被抑制的输出信号;
所述噪声抑制增益确定单元具有
信噪比SNR计算单元,被配置为对于每个频带,根据通过所述频带功率计算单元获得的每个频带分割信号的频带功率以及通过所述噪声频带功率估计单元估计的每个频带的噪声频带功率来计算SNR,以及
SNR平滑单元,被配置为对于每个频带,使通过所述SNR计算单元计算的SNR平滑;
其中基于所述SNR平滑单元使其平滑的每个频带的SNR,确定每个频带的噪声抑制增益;
以及其中所述SNR平滑单元基于所述噪声确定单元的确定结果和频带,改变平滑系数。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010-199512 | 2010-09-07 | ||
JP2010199512A JP2012058358A (ja) | 2010-09-07 | 2010-09-07 | 雑音抑圧装置、雑音抑圧方法およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102402987A true CN102402987A (zh) | 2012-04-04 |
Family
ID=45770735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011102632271A Pending CN102402987A (zh) | 2010-09-07 | 2011-08-31 | 噪声抑制装置、噪声抑制方法和程序 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120057711A1 (zh) |
JP (1) | JP2012058358A (zh) |
CN (1) | CN102402987A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106303838A (zh) * | 2015-06-25 | 2017-01-04 | 宏达国际电子股份有限公司 | 声音处理装置及方法 |
CN106796802A (zh) * | 2014-09-03 | 2017-05-31 | 马维尔国际贸易有限公司 | 用于经由非线性衰减/增益函数来消除音乐噪声的方法和装置 |
CN107484080A (zh) * | 2016-05-30 | 2017-12-15 | 奥迪康有限公司 | 音频处理装置及用于估计声音信号的信噪比的方法 |
CN107948869A (zh) * | 2017-12-12 | 2018-04-20 | 深圳Tcl新技术有限公司 | 音频处理方法、装置、音响系统及存储介质 |
CN108986839A (zh) * | 2017-06-01 | 2018-12-11 | 瑟恩森知识产权控股有限公司 | 减少音频信号中的噪声 |
CN111223486A (zh) * | 2019-12-30 | 2020-06-02 | 上海联影医疗科技有限公司 | 一种报警装置及方法 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP6011536B2 (ja) * | 2011-08-29 | 2016-10-19 | 日本電気株式会社 | 信号処理装置、信号処理方法、およびコンピュータ・プログラム |
JP2013148724A (ja) * | 2012-01-19 | 2013-08-01 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
US9130643B2 (en) * | 2012-01-31 | 2015-09-08 | Broadcom Corporation | Systems and methods for enhancing audio quality of FM receivers |
US9178553B2 (en) * | 2012-01-31 | 2015-11-03 | Broadcom Corporation | Systems and methods for enhancing audio quality of FM receivers |
JP6051701B2 (ja) * | 2012-09-05 | 2016-12-27 | ヤマハ株式会社 | エンジン音加工装置 |
JP6019955B2 (ja) * | 2012-09-05 | 2016-11-02 | ヤマハ株式会社 | エンジン音加工装置 |
JP6135106B2 (ja) * | 2012-11-29 | 2017-05-31 | 富士通株式会社 | 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム |
JP6162254B2 (ja) * | 2013-01-08 | 2017-07-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 背景ノイズにおけるスピーチ了解度を増幅及び圧縮により向上させる装置と方法 |
US9349383B2 (en) * | 2013-01-29 | 2016-05-24 | 2236008 Ontario Inc. | Audio bandwidth dependent noise suppression |
FR3002679B1 (fr) * | 2013-02-28 | 2016-07-22 | Parrot | Procede de debruitage d'un signal audio par un algorithme a gain spectral variable a durete modulable dynamiquement |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
CN105849801B (zh) | 2013-12-27 | 2020-02-14 | 索尼公司 | 解码设备和方法以及程序 |
CN105845150B (zh) * | 2016-03-21 | 2019-09-27 | 福州瑞芯微电子股份有限公司 | 一种采用倒谱进行修正的语音增强方法及系统 |
US10540983B2 (en) * | 2017-06-01 | 2020-01-21 | Sorenson Ip Holdings, Llc | Detecting and reducing feedback |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040049383A1 (en) * | 2000-12-28 | 2004-03-11 | Masanori Kato | Noise removing method and device |
US7158932B1 (en) * | 1999-11-10 | 2007-01-02 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression apparatus |
CN101091209A (zh) * | 2005-09-02 | 2007-12-19 | 日本电气株式会社 | 抑制噪声的方法、装置和计算机程序 |
CN101727912A (zh) * | 2008-10-24 | 2010-06-09 | 雅马哈株式会社 | 噪声抑制装置及噪声抑制方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4811404A (en) * | 1987-10-01 | 1989-03-07 | Motorola, Inc. | Noise suppression system |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
JP3680374B2 (ja) * | 1995-09-28 | 2005-08-10 | ソニー株式会社 | 音声合成方法 |
US6480823B1 (en) * | 1998-03-24 | 2002-11-12 | Matsushita Electric Industrial Co., Ltd. | Speech detection for noisy conditions |
JP3566197B2 (ja) * | 2000-08-31 | 2004-09-15 | 松下電器産業株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US7454332B2 (en) * | 2004-06-15 | 2008-11-18 | Microsoft Corporation | Gain constrained noise suppression |
US8280730B2 (en) * | 2005-05-25 | 2012-10-02 | Motorola Mobility Llc | Method and apparatus of increasing speech intelligibility in noisy environments |
-
2010
- 2010-09-07 JP JP2010199512A patent/JP2012058358A/ja not_active Withdrawn
-
2011
- 2011-08-31 US US13/223,131 patent/US20120057711A1/en not_active Abandoned
- 2011-08-31 CN CN2011102632271A patent/CN102402987A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7158932B1 (en) * | 1999-11-10 | 2007-01-02 | Mitsubishi Denki Kabushiki Kaisha | Noise suppression apparatus |
US20040049383A1 (en) * | 2000-12-28 | 2004-03-11 | Masanori Kato | Noise removing method and device |
CN101091209A (zh) * | 2005-09-02 | 2007-12-19 | 日本电气株式会社 | 抑制噪声的方法、装置和计算机程序 |
CN101727912A (zh) * | 2008-10-24 | 2010-06-09 | 雅马哈株式会社 | 噪声抑制装置及噪声抑制方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106796802A (zh) * | 2014-09-03 | 2017-05-31 | 马维尔国际贸易有限公司 | 用于经由非线性衰减/增益函数来消除音乐噪声的方法和装置 |
CN106796802B (zh) * | 2014-09-03 | 2021-06-18 | 马维尔亚洲私人有限公司 | 用于经由非线性衰减/增益函数来消除音乐噪声的方法和装置 |
CN106303838A (zh) * | 2015-06-25 | 2017-01-04 | 宏达国际电子股份有限公司 | 声音处理装置及方法 |
CN106303838B (zh) * | 2015-06-25 | 2019-08-02 | 宏达国际电子股份有限公司 | 声音处理装置及方法 |
CN107484080A (zh) * | 2016-05-30 | 2017-12-15 | 奥迪康有限公司 | 音频处理装置及用于估计声音信号的信噪比的方法 |
CN107484080B (zh) * | 2016-05-30 | 2021-07-16 | 奥迪康有限公司 | 音频处理装置及用于估计声音信号的信噪比的方法 |
CN108986839A (zh) * | 2017-06-01 | 2018-12-11 | 瑟恩森知识产权控股有限公司 | 减少音频信号中的噪声 |
CN107948869A (zh) * | 2017-12-12 | 2018-04-20 | 深圳Tcl新技术有限公司 | 音频处理方法、装置、音响系统及存储介质 |
CN107948869B (zh) * | 2017-12-12 | 2021-03-12 | 深圳Tcl新技术有限公司 | 音频处理方法、装置、音响系统及存储介质 |
CN111223486A (zh) * | 2019-12-30 | 2020-06-02 | 上海联影医疗科技有限公司 | 一种报警装置及方法 |
CN111223486B (zh) * | 2019-12-30 | 2023-02-24 | 上海联影医疗科技股份有限公司 | 一种报警装置及方法 |
Also Published As
Publication number | Publication date |
---|---|
US20120057711A1 (en) | 2012-03-08 |
JP2012058358A (ja) | 2012-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102402987A (zh) | 噪声抑制装置、噪声抑制方法和程序 | |
US10891931B2 (en) | Single-channel, binaural and multi-channel dereverberation | |
US8010355B2 (en) | Low complexity noise reduction method | |
US7039204B2 (en) | Equalization for audio mixing | |
EP2283484B1 (en) | System and method for dynamic sound delivery | |
US8891778B2 (en) | Speech enhancement | |
KR100304666B1 (ko) | 음성 향상 방법 | |
US10043533B2 (en) | Method and device for boosting formants from speech and noise spectral estimation | |
EP2665292A2 (en) | Hearing assistance apparatus | |
JP2003517624A (ja) | 低ビットレート・スピーチ・コーダのためのノイズ抑圧 | |
US20110077939A1 (en) | Model-based distortion compensating noise reduction apparatus and method for speech recognition | |
US9743215B2 (en) | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio | |
EP2974084B1 (en) | A noise reduction method and system | |
US9396717B2 (en) | Systems and methods for reducing unwanted sounds in signals received from an arrangement of microphones | |
EP4115413A1 (en) | Voice optimization in noisy environments | |
US20060184361A1 (en) | Method and apparatus for reducing an interference noise signal fraction in a microphone signal | |
EP3566229B1 (en) | An apparatus and method for enhancing a wanted component in a signal | |
Defraene et al. | A psychoacoustically motivated speech distortion weighted multi-channel Wiener filter for noise reduction | |
Tomita et al. | Quantitative evaluation of segregated signal with frequency domain binaural model | |
Lee et al. | Dual-channel speech intelligibility enhancement based on the psychoacoustics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20120404 |