CN110136740A - 使用最小最大值跟随器估计噪声的方法和音频噪声抑制器 - Google Patents
使用最小最大值跟随器估计噪声的方法和音频噪声抑制器 Download PDFInfo
- Publication number
- CN110136740A CN110136740A CN201910062727.5A CN201910062727A CN110136740A CN 110136740 A CN110136740 A CN 110136740A CN 201910062727 A CN201910062727 A CN 201910062727A CN 110136740 A CN110136740 A CN 110136740A
- Authority
- CN
- China
- Prior art keywords
- noise
- output
- smoother
- register
- follower
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000009499 grossing Methods 0.000 claims abstract description 8
- 201000007201 aphasia Diseases 0.000 claims description 11
- 230000001629 suppression Effects 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 abstract description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Noise Elimination (AREA)
Abstract
用于噪声抑制器的噪声电平估计器包括:提供时间片中的平滑功率估计的功率平滑器滤波器,表示最低的平滑输入功率的最小值跟随器,和表示最高的平滑输入功率的最大值跟随器,跟随器服从泄露因子。估计器具有接收功率平滑器和最小值跟随器的输出的语音概率检测器;接收两个跟随器的输出的非静态噪声检测器;以及接收非静态噪声检测器、功率平滑器和语音概率检测器的输出并提供噪声估计的估计器。方法包括:平滑频带的强度;跟踪平滑强度的最小值和最大值;从最小值和强度确定语音缺失概率;从跟踪的最小值和最大值确定非静态噪声测量;确定非静态噪声的存在;以及从语音缺失概率、非静态噪声测量和强度估计噪声。
Description
技术领域
本发明涉及音频处理技术领域,并特别地涉及使用最小最大值跟随器估计噪声的方法和音频噪声抑制器。
背景技术
许多通信信道是有噪声的;此信道噪声被添加至期望信号并被发送至接收器。此外,包括手机的许多通信设备用于有噪声的环境中,例如人群、车辆、商店或存在背景音乐或噪声的其他场所;背景噪声通常被麦克风拾取并被有效地添加至期望声音信号,并且除非在发送设备处被抑制,其被发送至接收器。
当信道噪声或背景噪声或两者到达接收器时,此噪声可以损害期望声音信号的清晰度,除非使用噪声抑制器。
其中可以使用音频噪声抑制器的典型的通信系统200示于图2。来自人类说话者202和背景噪声源204的音频被麦克风206拾取,来自麦克风206的音频可以在被发送器210发送至信道212之前被噪声抑制器208处理。信道噪声可以被信道噪声源214注入至信道212中,其中信道噪声可以被添加至发送的信号并由接收器216接收以提供可以在驱动扬声器220并被呈现给收听者222之前由噪声抑制器218处理的有噪信号。
可用作信道212的发送器端的噪声抑制器208或用作信道212的接收器端的噪声抑制器218的常规的噪声抑制器100(图1)接收音频输入102进入频域转换单元104。频域信号被带提取器106划分为分离信号108,每个分离信号108表示多个频带的一个频带;这些分离频带信号被提供至语音检测器110,语音检测器110从分离频带信号确定进入的音频中是否存在语音。每个频带信号还被具有噪声估计器114和信噪比估计器116的分离的每带单元112处理,信噪比估计器116将估计的信噪比118提供给增益计算器120。增益计算器120将带特定增益122提供至可变增益单元124,可变增益单元124对表示该频带的分离信号108应用带特定增益122以提供带特定增益调整的信号126。带特定增益调整的信号126被重新组合器128收集并被模拟域或时域转换器130转换为模拟域或数字时域音频输出信号132。
从图1的基础抑制器得出抑制器的许多变体。这些变体噪声抑制器通常在SNR估计器116和增益计算器120子系统中不同。例如,可以在增益计算器120输出处添加滤波或平滑以通过稳定可变增益单元124的增益来减少伪象。
使用根据图1的噪声抑制器和根据图2的系统中的相关噪声抑制器的噪声抑制的质量取决于噪声估计器114中噪声电平估计的质量,原因是噪声的不正确估计损坏SNR估计器116中的SNR,并因此损坏该频带的确定的增益122。
有噪音频中通常发现两种类型的噪声。第一类型的噪声是“静态”噪声,如连续的信道噪声或来自位于恒定距离的不断运行的风扇、流水或车辆引擎的背景噪声,其中噪声倾向于具有相当恒定的频率和振幅分布。第二类型的噪声是“非静态”、可变的噪声,例如由交通中多个移动的汽车产生的、几个人在人群中移动时讲话产生的、吠叫的狗产生的、电视机和无线广播产生的、急躁的司机按压喇叭按钮产生的和其他非恒定源产生的背景噪声。来自音频噪声源204的由麦克风206拾取的这样的背景噪声是非静态的。
典型的噪声抑制器对静态噪声比对非静态噪声的表现好得多,部分原因是噪声估计器114中噪声电平的估计对非静态噪声更难。
发明内容
在第一方面,提供用于噪声抑制器的噪声电平估计器,包括:功率平滑器,用作低通滤波器并提供时间片中的平滑输入功率估计;最小值跟随器,服从于泄露因子,提供最近的时间片中的最低平滑输入功率的表示;最大值跟随器,服从于泄露因子,提供最近的时间片中的最高平滑输入功率的表示;语音概率检测器,耦合以接收功率平滑器的输出和最小值跟随器的输出;非静态噪声检测器,耦合以接收最小值跟随器的输出和最大值跟随器的输出;以及总噪声估计器,耦合以接收非静态噪声检测器、功率平滑器和语音概率检测器的输出。
在第二方面,提供噪声抑制器,包括:带提取器,适用于以频带分离频域输入;至少一个每带单元,进一步包括:第一方面所述的噪声电平估计器,耦合以从所述带提取器接收表示频带的输入;增益计算器,耦合以接收噪声电平估计器的输出;以及可变增益单元,由增益计算器的输出控制;以及组合器,耦合以接收每个每带单元的可变增益单元的输出。
在第三方面,提供频域信号的频带中的噪声估计的方法,包括:平滑频带的强度以提供更平滑输出;跟踪更平滑输出的最小值;跟踪更平滑输出的最大值;从更平滑输出的最小值和频带的强度确定语音缺失概率;从跟踪的更平滑输出的最小值和跟踪的更平滑输出的最大值确定非静态噪声测量;确定非静态噪声的存在;以及从语音缺失概率、非静态噪声测量和频带的强度估计总噪声。
在第四方面,提供噪声抑制的方法,包括:以频带将频域输入分离成频带信号;对于每个频带信号,使用根据第三方面的方法估计频带信号的噪声,从估计的噪声和频带信号得出信噪比(SNR)以提供当前SNR,使用SNR以准备原始增益,滤波原始增益以提供滤波后的增益,以及将滤波后的增益应用至频带信号以提供带特定增益调整的信号;以及将带特定增益调整的信号组合成噪声减小的频域信号。
附图说明
图1是现有技术音频噪声抑制器的框图。
图2是可以实施一个或多个音频噪声抑制器的系统的框图。
图3是用于音频噪声抑制器的噪声估计器的实施例的框图。
图4是在噪声估计器内使用的最小值和最大值跟踪器的实施例中的滤波的输入信号功率对跟踪的最小值和最大值的示例。
图5表示提出的从最小最大比至非静态测量γ的非线性映射。
图6是表示用于噪声抑制器的噪声估计的方法的部分的流程图。
具体实施方式
用于改进的噪声抑制器的每个频带k的改进的噪声估计器400跟踪信号的最小值和最大值统计。接收频带的频域输入402并在功率计算器404中计算信号功率,此信号功率在功率平滑器406中被平滑。最小值跟随器408和最大值跟随器410分别跟踪在过去的预定义时间段上的最小信号功率和最大信号功率,并使用跟踪值的差进一步计算噪声估计的速度。在实施例中,基于跟踪的最小信号功率值和当前信号功率值在语音概率检测器412中计算语音存在概率。非静态噪声检测器414估计非静态噪声的概率和振幅,总噪声估计器416使用平滑因子估计最后总估计的噪声功率,其由估计的语音和语音概率和非静态噪声估计的乘积确定。
以yk(n)表示帧n的第k个频带的值,在功率平滑器406中,使用第一阶递归滤波器对来自功率计算器404的信号功率进行滤波:
其中,表示平滑信号功率且αy是常数,αy在一些实施例中位于0.3至0.5的范围内。
然后,平滑信号功率或更平滑输出被馈入最小值跟随器408和最大值跟随器410,用于跟踪平滑信号的最小值和最大值。跟随器和输出分别被计算为:
以及
其中,和分别表示信号历史的最小值和最大值;且βmin和βmax是两个预定义常数,βmin和βmax分别大于1和小于1。这相比于“Noise power spectral densityestimation based on optimal smoothing and minimum statistics”,R.Martin,Speechand Audio Processing,IEEE Transaction,2001(Martin)中用于跟踪信号极小值的常规方法需要更少的内存;注意Martin不跟踪信号最大值。此外,Martin使用历史缓冲区存储的过去值,且该历史缓冲区中的最小值被每帧搜索。
代替在历史缓冲区中存储过去信号功率若功率小于存储在最小功率寄存器中的功率我们将当前功率存储在最小功率寄存器中,且其中当前功率不小于寄存器中存储的功率时,使用“泄露”因子增加相似地,若功率大于存储在最大功率寄存器中的功率,我们将当前功率存储在最大功率寄存器中作为且其中当前功率不大于寄存器中存储的功率时,使用“泄露”因子以逐帧地降低以便和确实跟随信号功率的峰值和谷值。在此,βmin和βmax是设置为分别大于1和小于1的值的预定义的恒定泄露因子。在特定实施例中,其被设置为:
以及
其中,fz、Tmin和Tmax分别是帧持续时间(秒)、用于最小值跟随器的泄露或松弛时间(秒)和用于最大值跟随器的泄露或松弛时间。在此,我们分别将Tmin和Tmax设置为1和0.2秒。并且,帧持续时间取决于真实系统实施且在实施例中位于0.01至0.032秒的范围内。
图4示出如由提出的最小最大值跟随器跟踪真实非静态噪声的示例跟踪的最小和最大电平。可以看出,随着最小值和最大值跟随器寄存器分别缓慢地增加和降低,寄存器值如何相对于帧(或时间)数进化。这是因为提供泄露因子βmin和βmax以保证,若当前平滑信号功率大于或小于寄存器值,和增加或降低。最终,随着变得越来越大,其越来越可能超过并由其替代。相同的规则适用于提出的最小最大值跟随器不需要用于存储历史值的附加存储器并在实践中工作良好。
非静态测量
一旦和被更新,其用于计算非静态测量,定义为:
最小值和最大值跟随器电平的比给出信号功率的概率密度函数多宽的度量。对于静态噪声,例如,高斯白噪声,和是自由度为2的卡方分布的最小值和最大值。对于非静态噪声,我们预期γ(n)是大的,原因是噪声平均随时间变化并因此导致更高的最大值、更低的最小值或两者。这告知在当前时间段期间背景噪声变化多迅速,且我们将预期以与其非静态成比例的方式跟踪噪声。我们将γ(n)映射至0至1之间的范围以反映我们必须多快地跟踪噪声,
其中,Cγ是预定义常数,在特定实施例中,Cγ是6。ξ(n)在0至1之间且相对于γ(n)的增加是单调的。图5示出γ(n)和ξ(n)之间的关系,其中Cγ为6且10log10(γ(n))在0至20dB的范围内。如图5所示,一旦γ(n)超过10dB,我们预期随着ξ(n)接近1,噪声电平将非常快速地被更新。应当指出,不同的频带可以使用不同的Cγ。因此,我们应使Cγ,k是频率相依的,其中k是频带索引。
语音缺失概率
若当前帧存在语音,噪声功率不被更新,若我们如此做,我们可能将噪声功率错误地适用到语音的功率。因此,语音概率检测器412使用函数将语音缺失概率ρn(n)计算为:
其中,在特定实施例中,Cmin是常数4。等式(8)和语音概率检测器412以这样的方式计算语音缺失概率:若当前信号功率不高于最小值跟随器的Cmin倍,这断言不存在语音。随着信号功率增加,ρn(n)以连续的温和方式迅速降低至0。我们发现此映射函数在实践中有效。
估计总噪声功率
等式(7)中的非静态测量和等式(8)中的语音缺失概率在总噪声估计器416中被相乘以给出用于噪声估计的平滑因子,为:
αn(n)=ξ(n)ρn(n) (9)
总噪声功率被估计为:
一旦噪声功率被估计,其用于计算当前帧的抑制增益以得到噪声抑制的语音。提出的噪声估计方案可应用于任何种类的抑制增益等式,例如维纳滤波、谱减法等。
在图1的维纳噪声抑制器中,通过调整可变增益电路124的增益应用抑制增益,且来自每个频带的增益调整的输出在重新组合器128中被组合以提供全频域音频输出。全频域音频输出然后被转换单元130重新转换至模拟拟或时域。
方法重申
以上描述的硬件执行可以被总结为如下的方法:
在来自带提取器的频域输入的每个频带内,平滑610频带的强度以提供更平滑输出。
跟踪612更平滑输出的最小值,在特定实施例中,通过若寄存器内容大于更平滑输出,在时间片中将最小值寄存器加载至更平滑输出,以及若寄存器内容小于更平滑输出,以泄露因子增加,参见上面的等式(2)。
实施例中的时间片表示约二十分之一至1毫秒。在特定实施例中,时间片是十分之一毫秒。在实施例中,最近的时间片是在最近的1至10秒内的那些时间片。在特定实施例中,最近的时间片是具有在最后约两秒内接收和处理的样本的那些时间片。
跟踪614更平滑输出的最大值,在特定实施例中,通过若寄存器内容小于更平滑输出,在时间片中将寄存器加载至更平滑输出,以及若寄存器内容大于更平滑输出,以泄露因子降低,参见上面的等式(3)。
从跟踪的更平滑输出的最小值和跟踪的更平滑输出的最大值确定618非静态噪声测量,参见上面的等式(6)和(7)。
使用如上面给出的等式(8),从更平滑输出的最小值和频带的强度确定616语音缺失概率。
从语音缺失概率、非静态噪声测量和频带的强度确定620总噪声,参见上面的等式(9)和(10)。
在类似于图1的噪声抑制器中,方法继续从估计的噪声和频带信号得出信噪比以提供当前SNR,SNR用于准备可以被滤波为当前增益的原始增益。滤波后的增益被应用至频带的音频以提供带特定增益调整的信号。来自所有频带的这些带特定的增益调整的信号被组合为噪声减少的频域信号。
特征组合
在此公开的特征可以以各种方式组合。预期的特定组合包括:
用于噪声抑制器的噪声电平估计器,A指定的噪声电平估计器包括:提供每个时间片中的平滑输入功率估计的功率平滑器低通滤波器,提供最低平滑输入功率的表示的最小值跟随器,和提供最高平滑输入功率的表示的最大值跟随器,跟随器服从于泄露因子;耦合以接收功率平滑器和最小值跟随器的输出的语音概率检测器;耦合以接收最小值跟随器和最大值跟随器的输出的非静态噪声检测器;以及耦合以接收非静态噪声检测器、功率平滑器和语音概率检测器的输出的总噪声估计器。
AA指定的噪声电平估计器包括A指定的噪声电平估计器,其中最小值跟随器使用寄存器,若寄存器内容大于平滑输入功率估计,在时间片中将寄存器设置为平滑输入功率估计,以及若寄存器内容小于平滑输入功率估计,以泄露因子增加寄存器。
AB指定的噪声电平估计器包括A或AA指定的噪声电平估计器,其中最大值跟随器包括寄存器,若寄存器内容小于平滑输入功率估计,在时间片中将寄存器设置为平滑输入功率估计,以及若寄存器内容大于平滑输入功率估计,以泄露因子降低寄存器。
AC指定的噪声抑制器包括A、AA或AB指定的噪声电平估计器,包括适用于以频带分离频域输入的带提取器;进一步包括从带提取器接收表示频带的输入的噪声电平估计器,耦合以接收噪声电平估计器的输出的增益计算器和由增益计算器的输出控制的可变增益单元的至少一个每带单元。噪声抑制器还包括耦合以接收每个每带单元的可变增益单元的输出的组合器。
AD指定的噪声抑制器包括AC指定的噪声抑制器并还包括耦合以向带提取器提供输入的时间或模拟域至频域转换器;和耦合以接收组合器的输出的频域至时间或模拟域转换器。
B指定的用于噪声抑制的噪声估计的方法包括:平滑频带的强度以提供更平滑输出;跟踪更平滑输出的最小值;跟踪更平滑输出的最大值;从更平滑输出的最小值和频带的强度确定语音缺失概率;从跟踪的更平滑输出的最小值和跟踪的更平滑输出的最大值确定非静态噪声测量;确定非静态噪声的存在;以及从语音缺失概率、非静态噪声测量和频带的强度估计总噪声。
BA指定的噪声估计的方法包括B指定的噪声估计的方法,其中,通过若寄存器内容大于更平滑输出,在时间片中将最小值寄存器加载至更平滑输出,以及若寄存器内容小于更平滑输出,以泄露因子增加寄存器,来执行跟踪更平滑输出的最小值。
BB指定的噪声估计的方法包括B或BA指定的噪声估计的方法,其中通过若寄存器内容小于更平滑输出,在时间片中将寄存器加载至更平滑输出,以及若寄存器内容大于更平滑输出,以泄露因子降低寄存器,来执行跟踪更平滑输出的最大值。
BC指定的噪声抑制的方法包括:以频带将频域输入分离成频带信号,以及对于每个频带信号,使用B、BA或BC指定的方法估计频带信号的噪声,然后从估计的噪声和频带信号得出信噪比以提供当前SNR,使用SNR准备原始增益,滤波原始增益以提供滤波后的增益,以及将滤波后的增益应用至频带信号以提供带特定增益调整的信号。噪声抑制的方法还包括将带特定增益调整的信号组合成噪声减少的频域信号。
BD指定的方法包括BC指定的噪声抑制方法,还包括执行快速傅里叶变换(FFT),离散傅里叶变换(DFT)或离散余弦变换(DCT)以将输入转化为频域输入。
在不脱离其范围的情况下,可以对上述方法和系统做出改变。因此,应该注意的是,在上述描述中包含的或在附图中示出的方式应该被理解为说明性的且不具有限制意义。所附权利要求旨在覆盖在此描述的所有通用和特定特征,以及本方法和系统的范围的所有声明,作为一种语言现象,应被认为落入其间。
Claims (10)
1.一种用于噪声抑制器的噪声电平估计器,包括:
功率平滑器,用作低通滤波器并提供时间片中的平滑输入功率估计;
最小值跟随器,服从于泄露因子,提供最近的时间片中的最低平滑输入功率的表示;
最大值跟随器,服从于泄露因子,提供最近的时间片中的最高平滑输入功率的表示;
语音概率检测器,耦合以接收所述功率平滑器的输出和所述最小值跟随器的输出;
非静态噪声检测器,耦合以接收所述最小值跟随器的输出和所述最大值跟随器的输出;以及
总噪声估计器,耦合以接收所述非静态噪声检测器、所述功率平滑器和所述语音概率检测器的输出。
2.根据权利要求1所述的噪声电平估计器,其中,所述最小值跟随器包括寄存器,若寄存器内容大于所述平滑输入功率估计,在时间片中将所述寄存器设置为所述平滑输入功率估计,以及若所述寄存器内容小于所述平滑输入功率估计,以所述泄露因子增加所述寄存器。
3.根据权利要求1所述的噪声电平估计器,其中,所述最大值跟随器包括寄存器,若寄存器内容小于所述平滑输入功率估计,在时间片中将所述寄存器设置为所述平滑输入功率功率,以及若所述寄存器内容大于所述平滑输入功率估计,以所述泄露因子降低所述寄存器。
4.一种噪声抑制器,包括:
带提取器,适用于以频带分离频域输入;
至少一个每带单元,进一步包括:
根据权利要求1所述的噪声电平估计器,耦合以从所述带提取器接收表示频带的输入;
增益计算器,耦合以接收所述噪声电平估计器的输出;以及
可变增益单元,由所述增益计算器的输出控制;以及
组合器,耦合以接收每个每带单元的所述可变增益单元的输出。
5.根据权利要求4所述的噪声抑制器,还包括:
时间或模拟域至频域转换器,耦合以为所述带提取器提供输入;以及
频域至时间或模拟域转换器,耦合以接收所述组合器的输出。
6.一种频域信号的频带中的噪声估计的方法,包括:
平滑频带的强度以提供更平滑输出;
跟踪所述更平滑输出的最小值;
跟踪所述更平滑输出的最大值;
从所述更平滑输出的最小值和所述频带的强度确定语音缺失概率;
从跟踪的更平滑输出的最小值和跟踪的更平滑输出的最大值确定非静态噪声测量;
确定非静态噪声的存在;以及
从所述语音缺失概率、所述非静态噪声测量和所述频带的强度估计总噪声。
7.根据权利要求6所述的噪声估计的方法,其中,通过若寄存器内容大于所述更平滑输出,在时间片中将最小值寄存器加载至所述更平滑输出,以及若所述寄存器内容小于所述更平滑输出,以泄露因子增加所述寄存器,来执行跟踪所述更平滑输出的最小值。
8.根据权利要求7所述的噪声估计的方法,其中,通过若寄存器内容小于所述更平滑输出,在时间片中将寄存器加载至所述更平滑输出,以及若所述寄存器内容大于所述更平滑输出,以泄露因子降低所述寄存器,来执行跟踪所述更平滑输出的最大值。
9.一种噪声抑制的方法,包括:
以频带将频域输入分离成频带信号;
对于每个频带信号,
使用根据权利要求6所述的方法估计所述频带信号的噪声,
从估计的噪声和所述频带信号得出信噪比(SNR)以提供当前SNR,
使用SNR以准备原始增益,
滤波所述原始增益以提供滤波后的增益,以及
将所述滤波后的增益应用至所述频带信号以提供带特定增益调整的信号;以及
将所述带特定增益调整的信号组合成噪声减小的频域信号。
10.根据权利要求9所述的方法,还包括执行快速傅里叶变换(FFT)、离散傅里叶变换(DFT)或离散余弦变换(DCT),以将输入转化为所述频域输入。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/892,219 US10043531B1 (en) | 2018-02-08 | 2018-02-08 | Method and audio noise suppressor using MinMax follower to estimate noise |
US15/892,219 | 2018-02-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110136740A true CN110136740A (zh) | 2019-08-16 |
CN110136740B CN110136740B (zh) | 2020-09-04 |
Family
ID=63014106
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910062727.5A Active CN110136740B (zh) | 2018-02-08 | 2019-01-23 | 使用最小最大值跟随器估计噪声的方法、噪声电平估计器、噪声抑制器及噪声抑制方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10043531B1 (zh) |
CN (1) | CN110136740B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114747233A (zh) * | 2019-12-09 | 2022-07-12 | 杜比实验室特许公司 | 内容和环境感知的环境噪声补偿 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111933165A (zh) * | 2020-07-30 | 2020-11-13 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 突变噪声快速估计方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102075465A (zh) * | 2011-02-14 | 2011-05-25 | 电信科学技术研究院 | 一种噪声功率的估计方法及设备 |
US20140316775A1 (en) * | 2012-02-10 | 2014-10-23 | Mitsubishi Electric Corporation | Noise suppression device |
CN105225673A (zh) * | 2014-06-09 | 2016-01-06 | 杜比实验室特许公司 | 噪声水平估计 |
US9280982B1 (en) * | 2011-03-29 | 2016-03-08 | Google Technology Holdings LLC | Nonstationary noise estimator (NNSE) |
CN108831499A (zh) * | 2018-05-25 | 2018-11-16 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 利用语音存在概率的语音增强方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160066087A1 (en) | 2006-01-30 | 2016-03-03 | Ludger Solbach | Joint noise suppression and acoustic echo cancellation |
WO2009038136A1 (ja) | 2007-09-19 | 2009-03-26 | Nec Corporation | 雑音抑圧装置、その方法及びプログラム |
GB0725111D0 (en) * | 2007-12-21 | 2008-01-30 | Wolfson Microelectronics Plc | Lower rate emulation |
US9336785B2 (en) * | 2008-05-12 | 2016-05-10 | Broadcom Corporation | Compression for speech intelligibility enhancement |
EP2169837B1 (en) | 2008-09-29 | 2013-01-30 | Telefonaktiebolaget LM Ericsson (publ) | Technique for suppressing noise in a transmitter device |
JP5071346B2 (ja) | 2008-10-24 | 2012-11-14 | ヤマハ株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US8571231B2 (en) | 2009-10-01 | 2013-10-29 | Qualcomm Incorporated | Suppressing noise in an audio signal |
US9711162B2 (en) * | 2011-07-05 | 2017-07-18 | Texas Instruments Incorporated | Method and apparatus for environmental noise compensation by determining a presence or an absence of an audio event |
CN105324982B (zh) | 2013-05-06 | 2018-10-12 | 波音频有限公司 | 用于抑制不需要的音频信号的方法和设备 |
US9449610B2 (en) * | 2013-11-07 | 2016-09-20 | Continental Automotive Systems, Inc. | Speech probability presence modifier improving log-MMSE based noise suppression performance |
CN106068535B (zh) * | 2014-03-17 | 2019-11-05 | 皇家飞利浦有限公司 | 噪声抑制 |
WO2016024853A1 (ko) * | 2014-08-15 | 2016-02-18 | 삼성전자 주식회사 | 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기 |
US9450623B2 (en) | 2014-09-19 | 2016-09-20 | Qualcomm Incorporated | Noise canceler for use in a transceiver |
WO2016117793A1 (ko) | 2015-01-23 | 2016-07-28 | 삼성전자 주식회사 | 음성 향상 방법 및 시스템 |
US20170337932A1 (en) | 2016-05-19 | 2017-11-23 | Apple Inc. | Beam selection for noise suppression based on separation |
US10242696B2 (en) * | 2016-10-11 | 2019-03-26 | Cirrus Logic, Inc. | Detection of acoustic impulse events in voice applications |
-
2018
- 2018-02-08 US US15/892,219 patent/US10043531B1/en active Active
-
2019
- 2019-01-23 CN CN201910062727.5A patent/CN110136740B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102075465A (zh) * | 2011-02-14 | 2011-05-25 | 电信科学技术研究院 | 一种噪声功率的估计方法及设备 |
US9280982B1 (en) * | 2011-03-29 | 2016-03-08 | Google Technology Holdings LLC | Nonstationary noise estimator (NNSE) |
US20140316775A1 (en) * | 2012-02-10 | 2014-10-23 | Mitsubishi Electric Corporation | Noise suppression device |
CN105225673A (zh) * | 2014-06-09 | 2016-01-06 | 杜比实验室特许公司 | 噪声水平估计 |
CN108831499A (zh) * | 2018-05-25 | 2018-11-16 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 利用语音存在概率的语音增强方法 |
Non-Patent Citations (1)
Title |
---|
R. MARTIN: "Noise power spectral density estimation based on optimal smoothing and minimum statistics", 《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114747233A (zh) * | 2019-12-09 | 2022-07-12 | 杜比实验室特许公司 | 内容和环境感知的环境噪声补偿 |
Also Published As
Publication number | Publication date |
---|---|
US10043531B1 (en) | 2018-08-07 |
CN110136740B (zh) | 2020-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8571231B2 (en) | Suppressing noise in an audio signal | |
US8644496B2 (en) | Echo suppressor, echo suppressing method, and computer readable storage medium | |
EP2416315B1 (en) | Noise suppression device | |
US7555075B2 (en) | Adjustable noise suppression system | |
TWI463817B (zh) | 可適性智慧雜訊抑制系統及方法 | |
KR100860805B1 (ko) | 음성 강화 시스템 | |
EP2244254B1 (en) | Ambient noise compensation system robust to high excitation noise | |
CN104067339B (zh) | 噪音抑制装置 | |
JP4660578B2 (ja) | 信号補正装置 | |
EP2362389B1 (en) | Noise suppressor | |
JP2002508891A (ja) | 特に補聴器における雑音を低減する装置および方法 | |
KR20080002990A (ko) | 오디오 잡음을 감소시키는 시스템 및 방법 | |
US9626987B2 (en) | Speech enhancement apparatus and speech enhancement method | |
CN111554315A (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
KR20100045933A (ko) | 잡음 억압 장치 및 잡음 억압 방법 | |
CN110136740B (zh) | 使用最小最大值跟随器估计噪声的方法、噪声电平估计器、噪声抑制器及噪声抑制方法 | |
CN112272848A (zh) | 使用间隙置信度的背景噪声估计 | |
KR101088558B1 (ko) | 잡음 억압 장치 및 잡음 억압 방법 | |
JP2004341339A (ja) | 雑音抑圧装置 | |
CN110136734B (zh) | 使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器 | |
JP2006243644A (ja) | 雑音低減方法、装置、プログラム及び記録媒体 | |
US20180062597A1 (en) | Gain adjustment apparatus and gain adjustment method | |
CN109102823A (zh) | 一种基于子带谱熵的语音增强方法 | |
US20030033139A1 (en) | Method and circuit arrangement for reducing noise during voice communication in communications systems | |
Ngo et al. | A flexible speech distortion weighted multi-channel Wiener filter for noise reduction in hearing aids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |