CN105225673B - 用于噪声水平估计的方法、系统和介质 - Google Patents
用于噪声水平估计的方法、系统和介质 Download PDFInfo
- Publication number
- CN105225673B CN105225673B CN201410275429.1A CN201410275429A CN105225673B CN 105225673 B CN105225673 B CN 105225673B CN 201410275429 A CN201410275429 A CN 201410275429A CN 105225673 B CN105225673 B CN 105225673B
- Authority
- CN
- China
- Prior art keywords
- noise
- signal
- probability
- noise signal
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Noise Elimination (AREA)
Abstract
本发明的实施例涉及噪声水平估计。公开了一种用于噪声水平估计的方法。该方法包括响应于噪声信号的信号水平的增长,计算噪声信号的脉冲噪声概率,其中脉冲噪声概率指示噪声信号是脉冲噪声的可能性。该方法还包括基于脉冲噪声概率,确定用于噪声水平估计的可变平滑因数,该可变平滑因数与噪声信号的先前估计水平相关联。该方法进一步包括利用可变平滑因数来平滑噪声信号,以确定噪声信号的当前估计水平。还公开了对应的系统和计算程序产品。
Description
技术领域
本发明的实施例一般性地涉及音频处理,并且更具体地,涉及用于噪声水平估计的方法和系统。
背景技术
现实生活的噪声可以包括不同类型的噪声:平稳噪声和非平稳噪声。非平稳噪声可以包括两个分类:本底噪声的突增以及脉冲噪声,它们对于考虑噪声信号的音频处理非常具有挑战。如本文中所使用的,本底噪声的突增指的是本底噪声从一个水平突然增长到另一个水平并且在相对长的一段时间内基本维持平稳,并且脉冲噪声指的是其水平突然增长并且然后在短时间段内下降的非平稳噪声。通常,在音频处理中,诸如在语音增强、音频播放或者噪声补偿中,需要追踪噪声水平。例如,在耳机噪声补偿中,噪声信号的估计水平可以直接影响要被应用至音频信号的增益。噪声信号的实际信号水平通常不能够被应用,因为它随着时间快速变化,特别是当出现本底噪声的突增或者脉冲噪声时。因此,应当处理噪声信号输入以获得在音频处理中能够被使用的估计噪声水平,如图1所示。
主要在语音处理的架构中,特别是在语音增强中,已经开发了噪声估计技术。这些技术例如可以被划分为:最小值追踪、时间递归平均、基于直方图的噪声估计、以及基于分位数的噪声估计等等。考虑到两类非平稳噪声,所期望的是,估计的噪声信号跟随本底噪声的突增并且在短期脉冲噪声期间抵抗噪声估计的移动。然而,现有的噪声估计方法不是对本底噪声的突增过于敏感或者就是对脉冲噪声过于敏感,不能够在这两种噪声场景中估计鲁棒的噪声水平。
鉴于以上,在本领域中需要一种解决方案用于针对脉冲噪声和本底噪声的突增两者适当地估计噪声水平。
发明内容
为了解决前述以及其他潜在问题中的至少一个问题,本发明的实施例提出了用于噪声水平估计的方法和系统。
在一个方面,本发明的实施例提供了一种用于噪声水平估计的方法。该方法包括:响应于噪声信号的信号水平的增长,计算所述噪声信号的脉冲噪声概率,其中所述脉冲噪声概率指示所述噪声信号是脉冲噪声的可能性;基于所述脉冲噪声概率,确定用于噪声水平估计的可变平滑因数,该可变平滑因数与所述噪声信号的先前估计水平相关联;以及利用所述可变平滑因数平滑所述噪声信号,以确定所述噪声信号的当前估计水平。在这个方面的实施例进一步包括对应的计算机程序产品。
在另一个方面,本发明的实施例提供了一种用于噪声水平估计的系统。该系统包括:脉冲噪声概率计算单元,被配置为响应于噪声信号的信号水平的增长,计算所述噪声信号的脉冲噪声概率,其中所述脉冲噪声概率指示所述噪声信号是脉冲噪声的可能性;平滑因数确定单元,被配置为基于所述脉冲噪声概率,确定用于噪声水平估计的可变平滑因数,该可变平滑因数与所述噪声信号的先前估计水平相关联;以及噪声水平估计单元,被配置为利用所述可变平滑因数,平滑所述噪声信号以确定所述噪声信号的当前估计水平。
通过以下描述,将认识到,根据本发明的实施例,所估计的噪声水平能够在脉冲噪声的场景中基于从脉冲噪声概率确定的可变平滑因数来抵抗移动。本发明的实施例所带来的其他益处将通过下文描述而清楚。
附图说明
通过参考附图阅读下文的详细描述,本发明实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例而非限制性的方式示出了本发明的若干实施例,其中:
图1图示了噪声水平估计的一般性的图;
图2图示了根据本发明的实施例的用于噪声水平估计的方法的流程图;
图3图示了根据本发明的一个示例实施例的噪声水平估计的示意图;
图4图示了根据本发明的另一个示例实施例的噪声水平估计的示意图;
图5(a)图示了根据现有的方法和根据本发明的示例实施例的估计噪声水平的比较;
图5(b)-(d)图示了在图5(a)的示例实施例中使用的参数的图;
图6图示了根据本发明的示例实施例的用于噪声水平估计的系统的框图;以及
图7图示了适合用于实施本发明的实施例的示例计算机系统的框图。
在各个附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考附图中示出的若干示例实施例来描述本发明的原理。应当理解,描述这些实施例仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。
如以上所提及的,本底噪声的突增和脉冲噪声对于考虑噪声信号的音频处理特别具有挑战,并且在噪声估计中,期望所估计的噪声信号跟随本底噪声的突增并且抵抗在短期脉冲噪声期间噪声估计的移动。就此而言,应当从噪声信号输入中区分出本底噪声的增长和脉冲噪声,并且然后不同的平滑因数能够被应用于平滑噪声信号输入。然而,在增长开始时,本底噪声的突增和脉冲噪声没有区分。一种简单的解决方法是向前看并且缓冲足够长的信号,以构建对于信号类型的足够置信度,并且稍后据此处理信号,然后,这可能造成大的延迟。
本发明的实施例提出了用于鲁棒的噪声水平估计的方法和系统,其能够紧密并且平滑地追踪噪声水平,快速地跟随本底噪声的增长并且抵抗短期脉冲噪声。本发明的方法和系统引入了脉冲噪声概率和自适应平滑因数,以便于实现低延迟且正确的信号类型分类以及鲁棒的噪声水平估计。
首先参照图2,其示出了根据本发明的示例实施例的用于噪声水平估计的方法200的流程图。
在步骤S201,响应于噪声信号的信号水平的增长,计算噪声信号的脉冲噪声概率。脉冲噪声概率指示该噪声信号是脉冲噪声的可能性
在本发明的一些实施例中,噪声信号可以例如从麦克风输入或者经处理的麦克风信号来获得。因为噪声的水平是频率和时间的函数,噪声水平估计可以一个频带接一个频带地执行,或者在全频带上执行。在不同频带处的噪声水平估计可以同时执行或者按顺序执行。因此,要被估计的噪声信号可以是噪声输入信号的多个频带中的一个频带中的信号,或者是噪声输入信号的宽带信号。
本发明的一个目的是快速并且准确地区分本底噪声的增长和脉冲噪声,两者在早期阶段均具有增长的信号水平。增长的信号水平可以用于触发脉冲噪声概率的计算。在本发明的示例实施例中,起始检测器可以用于追踪噪声信号的起始(onset),并且噪声信号增长的概率可以被表示为起始概率。因此,在计算脉冲噪声概率之前,可以确定噪声信号的起始概率,并且该起始概率指示信号水平的增长的可能性。起始概率的确定将在以下参照图3更详细地讨论。
响应于检测到信号水平正在增长,执行操作以计算指示该噪声信号是脉冲噪声的可能性的脉冲噪声概率。脉冲噪声概率在0和1之间。当计算脉冲噪声概率时,本底噪声增长的概率还可以通过1减去脉冲噪声概率来确定。
如本文中所指代的,本底噪声的突增指的是本底噪声从一个水平突然增长到另一个水平并且在相对长的一段时间内基本维持平稳,并且脉冲噪声指的是其水平突然增长并且在短时间段内下降的非平稳噪声。例如,在现实生活的场景中,在街角小店的人处于相对安静的室内环境。当他打开门的时候,他突然进入到高水平的外界交通噪声的环境,并且可能随后听到在交通噪声之上的很大的关门声。在这种场景中,交通噪声可以导致本底噪声的增长,并且关门声的噪声(其水平非常快地下降)可以被分类成脉冲噪声。
脉冲噪声概率的计算将在以下参照图3更详细地讨论。
方法200然后行进至步骤S202,其中基于步骤S201的脉冲噪声概率,确定用于噪声水平估计的可变平滑因数。
如本文中所使用的,可变平滑因数与所述噪声信号的先前估计水平相关联。可变平滑因数用于平滑噪声信号,以便于使得噪声信号的估计水平快速跟随本底噪声的增长并且抵抗短时期的脉冲噪声。由于较小的平滑因数可以导致所估计的噪声水平更快速地跟随噪声信号的实际水平并且反之亦然,如果所计算的脉冲噪声概率较小,其意味着该噪声信号可能是本底噪声的增长,则可变平滑因数被确定为较小,并且反之亦然。
通常,即使没有本底噪声的增长和脉冲噪声,噪声信号输入也可以利用恒定平滑因数来平滑以产生具有更平滑的水平的平滑噪声信号以用于后续处理,该恒定平滑因数在本文中被称为基准平滑因数。因此,在步骤S202所确定的可变平滑因数可以在该恒定平滑因数和1之间。可变平滑因数的确定将在以下参照图3更详细地讨论。
方法200然后行进至步骤S203,其中利用可变平滑因数来平滑噪声信号,以确定该噪声信号的当前估计水平。该估计水平可以在后续音频处理中被使用,诸如在噪声补偿、语音增强等处理中。该步骤也将在以下参照图3更详细地讨论。
图3图示了根据本发明的一个示例实施例的噪声水平估计的系统300的示意图。参照图3,将更详细描述噪声水平估计的过程。应当注意,在实践中,图3中示出的一个或多个框可以是可选的并且因此能够在一些实施例中被省略,并且一些框可以被组合为一个框或者一个框可以被划分为多个框。本发明的实施例在这方面不受限制。
在以下描述所图示的框的操作。
频时分析框301
因为噪声信号输入随时间和频率而变化,噪声水平估计的处理可以针对多个频带的每个频带来执行,并且参数在频带与频带之间是被调整的。那么,要被估计的噪声信号可以是噪声输入信号的多个频带中的一个频带中的信号,或者是噪声输入信号的宽带信号。例如,噪声信号输入的频率可以被划分成五个频带,B1(f≤700Hz)、B2(700Hz<f≤1000Hz)、B3(1000Hz<f≤2000Hz)、B4(2000Hz<f≤6000Hz)和B5(f>6000Hz),并且要被估计的噪声信号可以在五个频带之一。
在这种情况下,在一个示例实施例中,框301的输出可以是X(f,t),其中X(f,t)可以表示噪声信号在一个频带和时间点的实际信号水平。
应当注意到,如果在处理中使用宽带噪声信号,在其他实施例中,框301可以是可选的。在这种情况下,噪声信号例如可以被表示为X(t)。
在一些实施例中,这个框还可以确定噪声信号估计的处理间隔Δt,也就是说,它可以每隔一个处理间隔Δt就输出噪声信号X(f,t)。处理间隔Δt可以由采样率来确定。例如,这个框可以每个一个样本或者每个十个样本等输出噪声信号X(f,t)。
快速平滑框302和缓慢平滑框303
两个平滑器可以用于在噪声信号被输出到起始概率、最大值追踪或者脉冲噪声概率之前平滑该噪声信号。由于噪声信号的实际水平变化太频繁,预先平滑操作可以产生更平滑的噪声信号用于后续的处理。
在一些实施例中,快速平滑框302可以利用小的平滑因数来平滑噪声信号以便于快速地追踪实际噪声信号。例如,快速平滑框302可以如以下在对数域(log domain)中操作:
Xsm1,dB(f,t)=α1Xsm1,dB(f,t-Δt)+(1-α1)XdB(f,t) (1)
其中,Xsm1,dB(f,t)表示对数域中在时间点t的快速平滑噪声信号;Xsm1,dB(f,t-Δt)表示对数域中在时间点t-Δt的快速平滑噪声信号;XdB(f,t)表示对数域中在时间点t的原始噪声信号;并且α1表示线性域的平滑因数并且在0和1之间。在一个示例中,α1的值可以对应于针对该信号用0.01秒衰减至它的最终值的50%。
在一些实施例中,缓慢平滑框303可以利用大的平滑因数来平滑噪声信号以便于缓慢地追踪实际噪声信号。例如,缓慢平滑框303可以如以下在对数域中操作:
Xsm2,dB(f,t)=α2Xsm2,dB(f,t-Δt)+(1-α2)XdB(f,t) (2)
其中,Xsm2,dB(f,t)表示对数域中在时间点t的快速平滑噪声信号;Xsm2,dB(f,t-Δt)表示对数域中在时间点t-Δt的快速平滑噪声信号;XdB(f,t)表示对数域中在时间点t的原始噪声信号;并且α2表示线性域的平滑因数并且在0和1之间。在一个示例中,α2的值可以对应于针对该信号用0.01秒衰减至它的最终值的90%。
应当注意到,在一些实施例中框302和303两者或者两者之一可以被省略。本发明的实施例在此方面不受影响。
起始概率框304
噪声信号的起始概率指示信号水平的增长的可能性,并且可以用于触发脉冲噪声概率的计算。在一个示例实施例中,起始概率框304的输入是缓慢平滑噪声信号Xsm2(f,t),如图3所示。应当注意到,在其他实施例中,该框可以具有快速平滑噪声信号Xsm1(f,t)或者原始噪声信号X(f,t)作为输入。
在一些示例实施例中,基于波峰因数确定起始概率,该波峰因数是峰值比上均方根(rms)比率。在一个示例中,如果波峰因数大于一个阈值,起始概率可以被确定为1,并且否则可以被确定为0。在其他示例中,起始概率可以被测量为0和1之间的连续值,并且可以从先前的起始概率平滑,以便于避免突然的改变。在这样的示例中,起始概率可以用时间常量(平滑因数)来平滑并且可以如下地计算:
Pon(f,t)=αpPon(f,t-Δt)+(1-αp)I(f,t) (3)
其中Pon(f,t)表示噪声信号在频率f和时间点t的起始概率;Pon(f,t-Δt)表示在先前的时间点t-Δt的起始概率;并且αp在0和1之间并且表示线性域的平滑因数,其由概率因数衰退到它的最终值的90%所花费的时间来表示。在一个示例中,这样的时间可以是4.3ms。I(f,t)表示波峰因数和阈值的比较。其可以在以下等式中被确定:
其中cdB(f,t)表示对数域中的波峰因数并且可以在以下等式(5)和(6)中计算;并且LdB(f)表示对数域中的波峰因数的阈值。
cdB(f,t)=Xsm2,dB(f,t)-Xsm3,dB(f,t) (5)
Xsm3,dB(f,t)=agXsm3,dB(f,t-Δt)+(1-ag)Xsm2,dB(f,t) (6)
其中Xsm2,dB(f,t)表示对数域中缓慢平滑框303的输出Xsm2(f,t);Xsm3,dB(f,t)表示对数域中近似于rms估计的进一步平滑噪声信号;并且ag表示针对Xsm3,dB(f,t)的平滑因数,并且在0和1之间,其在一个示例中可以对应于针对Xsm3,dB(f,t)用2秒衰退到它的最终值的90%。如以上所提及的,Xsm2,dB(f,t)还可以由快速平滑噪声信号Xsm1,dB(f,t)或者原始噪声信号X(f,t)来取代。
在噪声信号估计是一个频带接一个频带来完成的情况下,波峰因数的阈值LdB(f)可以针对不同频带而不同,并且否则该阈值可以对于宽带维持不变。例如,如果噪声信号的频率被划分为五个频带,并且对于每个频带,该阈值可以是不同的,诸如:
除了以上的方法之外,还存在许多其他方法来计算起始概率。例如,如果信号水平在预定时间段内增长至高于一个阈值,起始概率可以被确定为1。本发明的范围在这方面不受限制。
最大值追踪框305和脉冲噪声概率框306
如以上陈述的,起始概率被输入到脉冲噪声概率框并且被用于触发脉冲噪声概率的计算。根据本发明的一些实施例,利用起始概率的输入,脉冲噪声概率的计算可以包括以下步骤:(1)当起始概率高于第一预定概率阈值时,将脉冲噪声概率的初始值设置为起始概率;(2)确定噪声信号是否具有衰退趋势;以及(3)基于噪声信号是否具有衰退趋势来计算噪声信号的脉冲噪声概率。
根据以上能够看出,脉冲噪声概率的计算可以由起始概率触发。例如,如果起始概率高于0.5,脉冲噪声概率的计算开始并且脉冲噪声概率的初始值可以被设置为起始概率。应当注意到,第一预定概率阈值可以是0和1之间的其他值,并且脉冲噪声概率的初始值可以被这只为其他值,诸如低于或高于起始概率的值,或者固定值。
在本发明的其它实施例中,脉冲状态指示符可以用于指示该噪声信号当前是否被估计为脉冲噪声。在一个实施例中,这个脉冲状态指示符可以是布林(Boolean)变量。也就是说,如果噪声信号当前被估计为脉冲噪声,脉冲状态指示符可以被表示为真(True),并且否则它可以被表示为假(False)。注意到,脉冲状态指示符可以具有其他的值。例如,它可以具有0或1的值用于指示脉冲的状态。在这些实施例中,在开始计算脉冲噪声概率之前,可以首先确定脉冲状态指示符为假。然后,当起始概率高于第一预定概率阈值时,脉冲噪声概率的计算可以开始并且脉冲状态指示符可以被设置为真。
在由起始概率触发之后,脉冲信号概率的计算是基于衰退趋势,因为脉冲信号具有在短时期内的衰退性质,其可能不会出现在本底噪声的增长中。例如,在图5(a)中,其中示出了在1kHz处作为时间的函数的原始信号水平的激励模式,噪声包括在大约1.8秒处从0dB到30dB改变的突增水平并且持续大于5秒。该噪声在大约7.6秒还包括关门声,其具有40dB的起始并且持续仅1.6秒。尽管关门声部分包含随着时间的大量振幅变化,总体水平是在衰退的。
在确定噪声信号具有衰退趋势时,根据本发明的一个示例实施例,可以首先确定噪声信号在第一时间窗内的最大信号水平,并且然后基于最大信号水平与噪声信号的信号水平的距离来确定噪声信号是否具有衰退趋势。在这种情况下,最大值追踪框305用于追踪第一时间窗内的最大信号水平。最大值追踪框305可以在脉冲噪声概率框306开始计算的时候开始操作。换而言之,最大值追踪在一些实施例中也可以由起始概率来触发,并且还可以在其他实施例中由脉冲状态指示符是否是假来触发。在本发明的一些示例实施例中,最大信号水平的初始值可以被设置为噪声信号的信号水平。例如,最大信号水平的初始值可以被设置为原始信号水平X(f,t)、缓慢平滑信号水平Xsm2(f,t)或者快速平滑信号水平Xsm1(f,t)。
在一些实施例中,第一时间窗的长度可以是预定的,诸如2秒或3秒。因为脉冲噪声具有衰退性质,并且随着时间窗的移动最大信号水平在一个时间段内维持不变,所以最大信号水平与脉冲噪声的信号水平之间的距离在这个时间段内相对较大。脉冲噪声的信号水平可以如图3所示是快速平滑框302的输出,并且还可以是原始信号水平或者缓慢平滑框303的输出。因此,可以检测出噪声信号中的衰退趋势。为了判定噪声信号是否具有衰退趋势,可以用阈值来衡量该距离是否足够大以至于衰退趋势可能被包含在该噪声中。
存在许多其他方法来确定噪声信号是否具有衰退趋势。根据本发明的另一个实施例,基于噪声信号随着时间的斜率来确定噪声信号是否具有衰退趋势。例如,可以计算在两个时间点处的噪声信号的振幅的斜率,并且如果该斜率是负数,这意味着噪声水平在这两个时间点之间正在衰退。在其他实施例中,为了提高置信度,可以确定多个斜率。通过分析这些斜率,可以确定噪声信号中是否存在衰退趋势。
根据本发明的一些示例实施例,在计算脉冲噪声概率时,如果噪声信号被确定为具有衰退趋势,这意味着该噪声信号可能是脉冲噪声,并且反之亦然。因此,当噪声信号具有衰退趋势时,以第一速率增长脉冲噪声概率,并且当噪声信号不具有衰退趋势时,以第二速率减少脉冲噪声概率。例如,如果通过最大信号水平与噪声信号的信号水平之间的距离来确定衰退趋势,脉冲噪声概率可以如下地计算:
DdB(f,t)=Xmax,dB(f,t)-Xsm1,dB(f,t) (9)
其中Pimp(f,t)表示脉冲噪声概率;DdB(f,t)表示最大信号水平Xmax,dB(f,t)与快速平滑信号水平Xsm1,dB(f,t)之间的距离;Simp(f,t)表示脉冲状态指示符;D0表示用于确定噪声信号是否具有衰退趋势的阈值,其值可以在一个示例中可以是6dB;并且αi表示用于平滑脉冲噪声概率的线性域的平滑因数并且在0和1之间。
如果距离大于D0,这可以被视为脉冲噪声的积极迹象,并且否者是消极迹象。通过在公式(8)中的脉冲噪声概率的计算,如果没有衰退趋势,Pimp(f,t)下降,因为噪声信号看起来不像脉冲,并且如果具有衰退趋势,Pimp(f,t)上升。
如以上所陈述的,脉冲噪声概率的计算可以一个频带接一个频带地执行。考虑到噪声信号的衰退趋势对于不同频带可能在不同时间出现,如果在一个或多个频带中的噪声信号被确定为具有衰退趋势,这意味着其他频带或早或晚也可能衰退。因此,如果针对噪声信号的至少一个频带的所计算的脉冲噪声概率高于置信阈值,增加针对其余频带中的噪声信号的脉冲噪声概率。然后,可以在所有频带上加快脉冲噪声和本底噪声增长的区别的正确判决。例如,如果噪声信号在B1(f≤700Hz)的脉冲噪声概率首先被确定为0.6,其大于置信度阈值0.5,那么其他频带中的噪声信号的脉冲噪声概率可以被增长至0.6。
应当注意到,在以上情况中,针对其余频带的脉冲噪声概率的增长可以不必要相同,并且在一些示例实施例中,不是针对其余频带的所有脉冲噪声概率被增长。本发明的范围在这个方面不受影响。
因为增长的起始通常发生在早期阶段,起始概率在脉冲的结束时可能更小,并且然后脉冲噪声概率也可能从这个时间点开始减少。脉冲的结束的另一个迹象是噪声信号的当前估计的水平与噪声信号的信号水平之间的距离小于误差容忍度,因为估计的水平被设计为抵抗脉冲噪声。在一些示例中,这里所使用的噪声信号的信号水平可以是原始噪声水平,或者可以是从框302或303输出的快速或缓慢平滑噪声水平。
因此,最大值追踪框305可以维持追踪噪声水平的最大值直至起始概率低于第二预定概率阈值并且噪声信号的当前估计的水平与噪声信号的信号水平之间的距离低于预定距离阈值。在本发明的进一步的实施例中,在本发明的进一步实施例中,在这些条件下,最大信号水平被减少。在一些示例中,最大信号水平可以被减少至原始噪声水平、快速或缓慢平滑噪声水平、或者在以上条件被满足的时间处的估计信号水平。例如,当以下条件被满足时:
Pon(f,t)<0.2并且|Y(f,t)-Xsm2,dB(f,t)|<X0,dB (10)
最大信号水平Xmax,dB(f,t)可以被设置为:
Xmax,dB(f,t)=Y(f,t) (11)
其中X0,dB表示用于误差容忍度的常量,并且它的值在示例中可以被设置为1dB。公式(10)中的条件一般性地指示脉冲的结束,因为噪声信号的信号水平Xsm2,dB(f,t)可能下降到估计水平Y(f,t)。在这种情况下,最大信号水平也可以被设置为Y(f,t)。
如以上所陈述的,脉冲状态指示符可以用于指示噪声信号当前是否被估计为脉冲噪声。由于公式(10)中的调节指示脉冲的结束,脉冲状态指示符还可以被改变为假,其然后在一些实施例中可以停止最大值追踪。
应当注意到,如果以其他方式而不是距离DdB(f,t)来确定衰退趋势,以上公式(8)也可以被使用。在这种情况下,公式(8)中的条件DdB(f,t)>D0通常可以“该噪声信号具有衰退趋势”来覆盖。还应当注意到,脉冲噪声可以以其他方式来计算,只要在检测到衰退趋势时脉冲噪声概率增长并且在没有检测到衰退趋势时脉冲噪声概率减少即可。
参照图5(a),能够看出在即使是在脉冲出现期间也存在振幅随着时间的很大变化。例如,在如图5(a)所示出的原始噪声信号中,从16.1秒到17.1秒,存在四个快速连续的敲门声。四个脉冲如此接近以至于它们之间没有暂停。在这种情况下,起始概率框被频繁地触发。当刚检测到起始时,脉冲噪声概率还未被建立。在这个时候,如果立即跟随着另一个起始,利用所计算的脉冲噪声概率的平滑可能被打乱。如此,脉冲噪声概率框306还可以记下最新的脉冲已经持续的时间。根据本发明的一些实施例,当开始计算脉冲噪声概率时,记录脉冲建立时间。脉冲建立时间在一个示例中由图3中的框306来记录。在这些实施例中,当起始概率高于第一预定概率阈值时,将脉冲建立时间设置为零。如以上所陈述的,当起始概率高于第一预定概率阈值时,脉冲噪声概率的计算可以被触发,这意味着新的起始被检测到。在此时,脉冲建立时间可以被设置为零并且可以记录新检测的脉冲已经持续的时间。如图3中所图示的,脉冲建立时间Timp(f,t)被输出至自适应平滑框307以促使这个框的操作。
自适应平滑框307
图3中的自适应平滑框307可以用于执行方法200的步骤202处的可变平滑因数的确定以及方法200的步骤S203处的基于可变平滑因数的平滑。因此,在一个示例实施例中,框307可以具有来自框301的噪声信号、来自框304的起始概率以及来自框306的脉冲噪声概率和脉冲建立时间。
如以上所陈述的,可变平滑因数是基于脉冲噪声概率来确定的,并且在一些实施例中,脉冲建立时间可以用于避免被一系列起始所打乱。更具体地,当脉冲建立时间低于预定时间阈值时,基于基准平滑因数、以及脉冲噪声概率与起始概率中的最大值,确定可变平滑因数;并且当脉冲建立时间高于或等于预定时间阈值时,基于基准平滑因数以及脉冲噪声概率,确定可变平滑因数。在确定时,可变平滑因数可以是脉冲噪声概率在时间上的缩减。换而言之,随着脉冲噪声概率在时间上的增长,可变平滑因数增长,并且随着脉冲噪声概率在时间上的减小,可变平滑因数减小。例如,可变平滑因数α(f,t)可以如下地确定:
其中αd表示基准平滑因数并且在0和1之间;根据公式(12),α(f,t)被确定为在αd与1之间;并且T0表示时间常量。从公式(12)将理解到,当刚检测到起始时,脉冲噪声概率还未被建立,为了避免随后有其他起始,使用max[Pimp(f,t),Pon(f,t)]来计算α(f,t)。在T0之后,脉冲噪声概率已经被建立,并且仅Pimp(f,t)被使用。
如以上所陈述的,噪声信号的当前估计水平是基于可变平滑因数来确定的。根据本发明的一些实施例,利用可变平滑因数来平滑噪声信号,并且经平滑的噪声信号的平滑信号水平可以被确定为该噪声信号的当前估计水平。例如,估计水平可以如下地被确定:
YdB(f,t)=α(f,t)YdB(f,t-Δt)+(1-α(f,t))XdB(f,t) (13)
其中YdB(f,t)表示对数域的当前估计水平,其等于平滑的信号水平;YdB(f,t-Δt)表示对数域的先前估计水平;并且XdB(f,t)表示对数域的原始信号水平。在该等式中,可变平滑因数与先前估计水平相关联并且用于平滑噪声信号。
通过利用公式(12),可变平滑因数随着脉冲噪声概率的增长和减少而增长和减少。通过在公式(13)中进行平滑,能够看出,可变平滑因数越大,估计水平随着时间改变得越慢。因此,如果脉冲噪声概率被确定为较大,这意味着噪声信号可能是脉冲,那么估计水平可以抵抗噪声信号,这包括缓慢的反映估计。例如,如果脉冲噪声概率等于1,根据公式(12)和(13),估计水平将维持在的先前估计水平,并且将不会跟随脉冲水平的增长。因此,看起来脉冲噪声在后续音频处理中将被忽略。
如以上所讨论的并且如图3所图示的,噪声水平估计允许跟随本地噪声增长和抵抗短期脉冲噪声。对于本底噪声增长,如能够从例如公式(12)看到的,如果脉冲噪声概率指示噪声信号可能是本底噪声的增长,自适应平滑因数将等于或接近于基准平滑因数,其用于在没有突增的情况下平滑噪声信号,并且通常较小。那么当以该自适应平滑因数来确定估计水平时,估计水平将从起始之前的水平缓慢地增长至本底噪声的稍后的平稳水平。期望减少这个延迟。
现在参照图4,其图示了根据本发明的另一个示例实施例的噪声水平估计的示意图。出于解释说明的目的,有关图3的某些标号维持不变。在图4中,添加了另外的框以用于减少在本底噪声增长的情况中噪声水平估计的延迟。
最小值追踪框309
如以上所陈述的,当起始可能是由本底噪声的突增引起时,期望估计噪声水平立即被提高。为了实现这个目标,最小值追踪框309可以用于追踪噪声信号在第二时间窗内的最小信号水平。在本底噪声的突增时,如果本底噪声增长后的水平在第二时间窗内并且然后被确定为最小信号水平,根据本发明的一些实施例,估计信号水平可以直接被设置为这个最小信号水平,因为最小信号水平,如以上所讨论的,大于利用低的平滑因数平滑后的水平。因此,框307的操作可以包括:利用可变平滑因数来平滑噪声信号;以及选择平滑后的噪声信号的平滑信号水平与最小信号水平中的最大值,作为噪声信号的当前估计水平。在一些实施例中,公式(13)可以被修改为:
YdB(f,t)=max[α(f,t)YdB(f,t-Δt)+(1-α(f,t))XdB(f,t),Xmin,dB(f,t)] (14)
其中Xmin,dB(f,t)表示所确定的对数域中的最小信号水平。根据公式(14),如果最小信号水平Xmin,dB(f,t)被确定为是在本底噪声水平已经增长并且维持平稳的阶段的最低水平,当前所估计的噪声水平可以被提高。
第二时间窗的长度可以是预定的,例如,被预定为2秒,并且本发明的实施例在这个方面不受限制。
如从最小值追踪框309的工作机制所能够看出的,第二时间窗的长度可能影响最小信号水平被确定为在本底噪声的平稳阶段的最小水平所花费的时间。如果使用较小的时间窗,可以快速递追踪平稳阶段的最小水平。因此,根据本发明的一些实施例,随着本底噪声信号变得稳定,第二时间窗可以自适应地被缩短。
在这些实施例中,可以确定噪声信号的稳定程度;并且当稳定程度低于预定稳定阈值并且脉冲建立时间低于预定时间阈值时,缩短第二时间窗,以使得噪声信号在缩短后的第二时间窗内的最小信号水平大于平滑信号水平。
稳定程度可以用于衡量噪声信号有多稳定,因为本底噪声最终可以趋向于平稳。此外,仅稳定程度不足以判定第二时间窗应当被缩短,因为脉冲噪声也可以下降至平稳水平。因此,脉冲建立时间Timp(f,t)可以被用于限制噪声信号是否在早期阶段变得平稳。在这种条件下,期望第二时间窗被缩短以便于如公式(14)所示出的那样提高所估计的噪声水平。
例如,第二时间窗W(f,t)可以如下地被确定:
其中WS表示缩短后的时间窗,其具有例如1秒的值;WL表示在缩短之前的长时间窗,其可以具有例如2秒的值;并且Stab.表示稳定程度而St表示稳定阈值。
根据一些其他的实施例,稳定程度由噪声信号在预定测量时间窗内的方差或标准偏差来测量。附加地或备选地,许多其他参数可以用于测量稳定程度,例如,本底噪声增长的概率,其可以等于1减去脉冲噪声概率。本发明的范围在这个方面不受限制。
应当注意到,可以总是由最小值追踪框309使用较短的第二时间长来追踪最小信号水平。也就是说,第二时间窗可以不必要改变而使维持足够小以便于能够使得当需要的时候所估计的水平可以被提高。
标准差计算框308
根据本发明的一些实施例,噪声信号的标准差可以用于衡量噪声的稳定程度,并且该框308可以用于计算标准差。应当注意到,如果附加地或者备选地需要其他参数来衡量稳定程度,该框308可以被取代或者其他框可以被添加。
在一些实施例中,标准差可以如下地被计算:
Stdsmx,dB(f,t)=αSStdsmx,dB(f,t-Δt)+(1-αS)Stdx,dB(f,t) (17)
其中公式(16)计算在时间窗mΔt内缓慢平滑噪声信号Xsm2(f,t)的标准差,并且在其他示例中,可以计算快速平滑噪声信号Xsm1(f,t)或者原始噪声信号X(f,t)的标准差。公式(17)用于在对数域中平滑公式(16)的标准差,并且αS是0和1之间的平滑因数。公式(18)归一化平滑后的标准差以便于Std(f,t)总是在零以上并且与Xsm2(f,t)的振幅无关,这使得容易设置阈值来判定噪声信号有多平稳。换而言之,Std(f,t)是“在对数域中在时间窗nΔt内Xsm2(f,t)的平滑标准差”的标准差。在一些示例中,mΔt的值可以是0.5秒并且nΔt的值可以是0.8秒。本发明的范围在这个方面不受限制。
以上已经参照图2-4来描述噪声水平估计的过程。现在对图5(a)进行参照,其示出了根据现有的方法和根据本发明的示例实施例的估计噪声水平的比较。图5(b)-(d)图示了在图5(a)的示例实施例中使用的参数的图。
从图5(a)能够看出,噪声信号包括在大约1.8秒处从0dB到30dB改变的突增水平,在大约7.6秒处的关门声,以及从16.1秒到17.1秒的四个快速连续的敲门声。关门声和敲门声可以被视为脉冲噪声。在图5(a)中,示出了由现有方法追踪的估计噪声水平。该方法的思想是当检测到起始时,无论该起始是由本底噪声的增长或者是由脉冲噪声引起的(这两种类型的噪声信号在现有方法中不能够被区分),估计噪声水平将追踪噪声信号的实际信号水平。这导致估计噪声水平如图5(a)所图示的跟随脉冲信号的增长,这对于后续音频处理是不期望的。然而,如图5(a)所图示的,本发明的估计噪声水平跟随本底噪声的增长,并且抵抗短期脉冲噪声(关门声或快速敲门声),这更鲁棒。
图6示出了根据本发明的一个示例实施例的用于控制音频信号的响度的系统600的框图。如所示出的,系统600包括脉冲噪声概率计算单元601,被配置为响应于噪声信号的信号水平的增长,计算噪声信号的脉冲噪声概率,其中脉冲噪声概率指示噪声信号是脉冲噪声的可能性。系统600还包括平滑因数确定单元602,被配置为基于脉冲噪声概率,确定用于噪声水平估计的可变平滑因数,该可变平滑因数与所述噪声信号的先前估计水平相关联。系统600进一步包括噪声水平估计单元603,被配置为利用可变平滑因数来平滑噪声信号,以确定噪声信号的当前估计水平。
在一些实施例中,噪声信号可以是噪声输入信号的多个频带中的一个频带中的信号,或者是噪声输入信号的宽带信号。在这些实施例中,如果针对噪声输入信号的至少一个频带的所计算的脉冲噪声概率高于置信阈值,可以增加针对其余频带的脉冲噪声概率。
在一些实施例中,系统600可以进一步包括起始概率确定单元,被配置为确定噪声信号的起始概率,起始概率指示信号水平的增长的可能性。在这些实施例中,脉冲噪声概率计算单元601可以包括初始值设置单元,被配置为在起始概率高于第一预定概率阈值时,将脉冲噪声概率的初始值设置为起始概率;以及衰退确定单元,被配置为确定噪声信号是否具有衰退趋势,其中脉冲噪声概率计算单元601可以进一步被配置为基于噪声信号是否具有衰退趋势来计算噪声信号的脉冲噪声概率。
进一步地,在一些实施例中,衰退确定单元可以进一步被配置为执行以下至少一项:基于噪声信号的信号水平与噪声信号在第一时间窗内的最大信号水平之间的距离来确定噪声信号是否具有衰退趋势;或者基于噪声信号随着时间的斜率来确定噪声信号是否具有衰退趋势。
此外,在一些实施例中,脉冲噪声概率计算单元601可以进一步被配置为当噪声信号具有衰退趋势时,以第一速率增长脉冲噪声概率;以及当噪声信号不具有衰退趋势时,以第二速率减少脉冲噪声概率。
进一步地,在一些实施例中,系统600可以进一步包括最大值降低单元,被配置为在起始概率低于第二预定概率阈值并且噪声信号的当前估计水平与噪声信号的信号水平之间的距离低于预定距离阈值时,降低最大信号水平。
进一步地,在一些实施例中,系统600可以进一步脉冲建立时间记录单元,被配置为在开始计算脉冲噪声概率时,记录脉冲建立时间,其中脉冲建立时间记录单元进一步被配置为在起始概率高于第一预定概率阈值时将脉冲建立时间设置为零。
在一些实施例中,平滑因数确定单元602可以进一步被配置为当脉冲建立时间低于预定时间阈值时,基于基准平滑因数、以及脉冲噪声概率与起始概率中的最大值,确定可变平滑因数;以及当脉冲建立时间高于等于预定时间阈值时,基于基准平滑因数以及脉冲噪声概率,确定可变平滑因数。在这些实施例中,在确定可变平滑因数时,可变平滑因数是脉冲噪声概率在时间上的缩减函数。
在一些实施例中,噪声水平估计单元603可以进一步被配置为利用可变平滑因数来平滑噪声信号;以及将平滑后的噪声信号的平滑信号水平确定为噪声信号的当前估计水平。
进一步地,在一些实施例中,系统600可以进一步包括最小值确定单元,被配置为确定噪声信号在第二时间窗内的最小信号水平。在这些实施例中,噪声水平估计单元603可以进一步被配置为利用可变平滑因数来平滑噪声信号;以及选择平滑后的噪声信号的平滑信号水平与最小信号水平中的最大值,作为噪声信号的当前估计水平。
进一步地,在一些实施例中,系统600可以进一步包括稳定程度确定单元,被配置为确定噪声信号的稳定程度;以及时间窗缩短单元,被配置为在稳定程度低于预定稳定阈值并且脉冲建立时间低于预定时间阈值时,缩短第二时间窗,以使得噪声信号在缩短后的第二时间窗内的最小信号水平大于平滑信号水平。
在一些实施例中,稳定程度由噪声信号在预定测量时间窗内的方差或标准偏差来测量。
为清晰起见,在图6中没有示出系统600的某些可选部件。然而,应当理解,上文参考图2-图5所描述的各个特征同样适用于系统600。而且,系统600中的各部件可以是硬件模块,也可以是软件单元模块。例如,在某些实施例中,系统600可以部分或者全部利用软件和/或固件来实现,例如被实现为包含在计算机可读介质上的计算机程序产品。备选地或附加地,系统600可以部分或者全部基于硬件来实现,例如被实现为集成电路(IC)、专用集成电路(ASIC)、片上系统(SOC)、现场可编程门阵列(FPGA)等。本发明的范围在此方面不受限制。
参考图7示出了适于用来实现本发明实施例的计算机系统700的示意性框图。如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有设备700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明的实施例,上文参考图2-图6描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行方法200的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。
一般而言,本发明的各种示例实施例可以在硬件或专用电路、软件、逻辑,或其任何组合中实施。某些方面可以在硬件中实施,而其他方面可以在可以由控制器、微处理器或其他计算设备执行的固件或软件中实施。当本发明的实施例的各方面被图示或描述为框图、流程图或使用某些其他图形表示时,将理解此处描述的方框、装置、系统、技术或方法可以作为非限制性的示例在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备,或其某些组合中实施。
而且,流程图中的各框可以被看作是方法步骤,和/或计算机程序代码的操作生成的操作,和/或理解为执行相关功能的多个耦合的逻辑电路元件。例如,本发明的实施例包括计算机程序产品,该计算机程序产品包括有形地实现在机器可读介质上的计算机程序,该计算机程序包含被配置为实现上文描述方法的程序代码。
在公开的上下文内,机器可读介质可以是包含或存储用于或有关于指令执行系统、装置或设备的程序的任何有形介质。机器可读介质可以是机器可读信号介质或机器可读存储介质。机器可读介质可以包括但不限于电子的、磁的、光学的、电磁的、红外的或半导体系统、装置或设备,或其任意合适的组合。机器可读存储介质的更详细示例包括带有一根或多根导线的电气连接、便携式计算机磁盘、硬盘、随机存储存取器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光存储设备、磁存储设备,或其任意合适的组合。
用于实现本发明的方法的计算机程序代码可以用一种或多种编程语言编写。这些计算机程序代码可以提供给通用计算机、专用计算机或其他可编程的数据处理装置的处理器,使得程序代码在被计算机或其他可编程的数据处理装置执行的时候,引起在流程图和/或框图中规定的功能/操作被实施。程序代码可以完全在计算机上、部分在计算机上、作为独立的软件包、部分在计算机上且部分在远程计算机上或完全在远程计算机或服务器上执行。
另外,尽管操作以特定顺序被描绘,但这并不应该理解为要求此类操作以示出的特定顺序或以相继顺序完成,或者执行所有图示的操作以获取期望结果。在某些情况下,多任务或并行处理会是有益的。同样地,尽管上述讨论包含了某些特定的实施细节,但这并不应解释为限制任何发明或权利要求的范围,而应解释为对可以针对特定发明的特定实施例的描述。本说明书中在分开的实施例的上下文中描述的某些特征也可以整合实施在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以分离地在多个实施例或在任意合适的子组合中实施。
针对前述本发明的示例实施例的各种修改、改变将在连同附图查看前述描述时对相关技术领域的技术人员变得明显。任何及所有修改将仍落入非限制的和本发明的示例实施例范围。此外,前述说明书和附图存在启发的益处,涉及本发明的这些实施例的技术领域的技术人员将会想到此处阐明的本发明的其他实施例。
由此,本发明可以通过在此描述的任何形式来实现。例如,以下的枚举示例实施例(EEE)描述了本发明的某些方面的某些结构、特征和功能。
EEE 1.一种用于估计非平稳噪声水平的方法,其包括:
a.脉冲噪声概率估计器;
b.利用脉冲噪声概率控制时间常量的自适应平滑器;以及
c.用于在起始不是由脉冲而是由突增的本底噪声增长引起的时候加速追踪的方法。
EEE 2.根据EEE 1所述的估计器,其中脉冲噪声概率是使用如下来估计:
a.起始概率;以及
b.在快速起始之后脉冲噪声的衰退性质。
EEE 3.根据EEE 2所述的平滑,其中脉冲噪声的衰退性质由瞬时或平滑的噪声水平与从最大值追踪器输出的噪声水平之间的距离来衡量。
EEE 4.根据EEE 2所述的平滑,其中脉冲噪声的衰退性质是通过计算振幅随着时间的斜率(梯度)或平滑的斜率来计算。
EEE 5.根据EEE 1所述的方法,其中提取特征来判定本底噪声的突增的可能性。
EEE 6.根据EEE 4所述的方法,包括附图在时间上的方差或者标准差。
EEE 7.根据EEE 1所述的方法,其中通过使用最小值追踪器来加速追踪。
EEE 8.根据EEE 1所述的方法,其中通过记忆来自快速平滑器的一个或一些的先前估计水平来加速追踪。
EEE 9.根据EEE 7所述的方法,其中最小值追踪窗的长度通过判定本底噪声的突增的可能性来控制。
将会理解,本法明的实施例不限于公开的特定实施例,并且修改和其他实施例都应包含于所附的权利要求范围内。尽管此处使用了特定的术语,但是它们仅在通用和描述的意义上使用,而并不用于限制目的。
Claims (27)
1.一种用于噪声水平估计的方法,包括:
响应于噪声信号的信号水平的增长,计算所述噪声信号的脉冲噪声概率,所述脉冲噪声概率指示所述噪声信号是脉冲噪声的可能性;
在开始计算所述脉冲噪声概率时,记录脉冲建立时间;
基于所述脉冲噪声概率和所述脉冲建立时间,确定用于噪声水平估计的可变平滑因数,所述可变平滑因数与所述噪声信号的先前估计水平相关联;以及
利用所述可变平滑因数来平滑所述噪声信号,以确定所述噪声信号的当前估计水平。
2.根据权利要求1所述的方法,其中所述噪声信号是噪声输入信号的多个频带中的一个频带中的信号,或者是所述噪声输入信号的宽带信号;
其中计算所述噪声信号的脉冲噪声概率包括:
如果针对所述噪声输入信号的至少一个频带的所计算的脉冲噪声概率被确定为高于置信阈值,增加针对其余频带的脉冲噪声概率。
3.根据权利要求1或2所述的方法,进一步包括:
确定所述噪声信号的起始概率,所述起始概率指示所述信号水平的所述增长的可能性。
4.根据权利要求3所述的方法,其中计算所述噪声信号的所述脉冲噪声概率包括:
当所述起始概率高于第一预定概率阈值时,将所述脉冲噪声概率的初始值设置为所述起始概率;
确定所述噪声信号是否具有衰退趋势;以及
基于所述噪声信号是否具有所述衰退趋势来计算所述噪声信号的所述脉冲噪声概率。
5.根据权利要求4所述的方法,其中确定所述噪声信号是否具有所述衰退趋势包括以下至少一项:
基于所述噪声信号的信号水平与所述噪声信号在第一时间窗内的最大信号水平之间的距离来确定所述噪声信号是否具有所述衰退趋势;或者
基于所述噪声信号随着时间的斜率来确定所述噪声信号是否具有所述衰退趋势。
6.根据权利要求4或5所述的方法,其中基于所述噪声信号是否具有所述衰退趋势来计算所述噪声信号的所述脉冲噪声概率包括:
当所述噪声信号具有所述衰退趋势时,以第一速率增长所述脉冲噪声概率;以及
当所述噪声信号不具有所述衰退趋势时,以第二速率减少所述脉冲噪声概率。
7.根据权利要求5所述的方法,进一步包括:
当所述起始概率低于第二预定概率阈值并且所述噪声信号的所述当前估计水平与所述噪声信号的信号水平之间的距离低于预定距离阈值时,降低所述最大信号水平。
8.根据权利要求4所述的方法,其中当所述起始概率高于所述第一预定概率阈值时,将所述脉冲建立时间设置为零。
9.根据权利要求3所述的方法,其中基于所述脉冲噪声概率,确定用于噪声水平估计的所述可变平滑因数包括:
当所述脉冲建立时间低于预定时间阈值时,基于基准平滑因数、以及所述脉冲噪声概率与所述起始概率中的最大值,确定所述可变平滑因数;以及
当所述脉冲建立时间高于或等于所述预定时间阈值时,基于所述基准平滑因数以及所述脉冲噪声概率,确定所述可变平滑因数,
其中在确定所述可变平滑因数时,所述可变平滑因数是所述脉冲噪声概率在时间上的缩减函数。
10.根据权利要求1或2所述的方法,其中利用所述可变平滑因数来平滑所述噪声信号,以确定所述噪声信号的所述当前估计水平包括:
利用所述可变平滑因数来平滑所述噪声信号;以及
将平滑后的所述噪声信号的平滑信号水平确定为所述噪声信号的所述当前估计水平。
11.根据权利要求1或2所述的方法,进一步包括:
确定所述噪声信号在第二时间窗内的最小信号水平,
其中利用所述可变平滑因数来平滑所述噪声信号以确定所述噪声信号的所述当前估计水平包括:
利用所述可变平滑因数来平滑所述噪声信号;以及
选择平滑后的所述噪声信号的平滑信号水平与所述最小信号水平中的最大值,作为所述噪声信号的所述当前估计水平。
12.根据权利要求11所述的方法,进一步包括:
确定所述噪声信号的稳定程度;以及
当所述稳定程度低于预定稳定阈值并且所述脉冲建立时间低于预定时间阈值时,缩短所述第二时间窗,以使得所述噪声信号在缩短后的第二时间窗内的最小信号水平大于所述平滑信号水平。
13.根据权利要求12所述的方法,其中所述稳定程度由所述噪声信号在预定测量时间窗内的方差或标准偏差来测量。
14.一种用于噪声水平估计的系统,包括:
脉冲噪声概率计算单元,被配置为响应于噪声信号的信号水平的增长,计算所述噪声信号的脉冲噪声概率,所述脉冲噪声概率指示所述噪声信号是脉冲噪声的可能性;
脉冲建立时间记录单元,被配置为在开始计算所述脉冲噪声概率时,记录脉冲建立时间;
平滑因数确定单元,被配置为基于所述脉冲噪声概率和所述脉冲建立时间,确定用于噪声水平估计的可变平滑因数,所述可变平滑因数与所述噪声信号的先前估计水平相关联;以及
噪声水平估计单元,被配置为利用所述可变平滑因数来平滑所述噪声信号,以确定所述噪声信号的当前估计水平。
15.根据权利要求14所述的系统,其中所述噪声信号是噪声输入信号的多个频带中的一个频带中的信号,或者是所述噪声输入信号的宽带信号;
其中所述脉冲噪声概率计算单元被配置为:
如果针对所述噪声输入信号的至少一个频带的所计算的脉冲噪声概率被确定为高于置信阈值,增加针对其余频带的脉冲噪声概率。
16.根据权利要求14或15所述的系统,进一步包括:
起始概率确定单元,被配置为确定所述噪声信号的起始概率,所述起始概率指示所述信号水平的所述增长的可能性。
17.根据权利要求16所述的系统,其中所述脉冲噪声概率计算单元包括:
初始值设置单元,被配置为在所述起始概率高于第一预定概率阈值时,将所述脉冲噪声概率的初始值设置为所述起始概率;以及
衰退确定单元,被配置为确定所述噪声信号是否具有衰退趋势,
其中所述脉冲噪声概率计算单元进一步被配置为基于所述噪声信号是否具有所述衰退趋势来计算所述噪声信号的所述脉冲噪声概率。
18.根据权利要求17所述的系统,其中所述衰退确定单元进一步被配置为执行以下至少一项:
基于所述噪声信号的信号水平与所述噪声信号在第一时间窗内的最大信号水平之间的距离来确定所述噪声信号是否具有所述衰退趋势;或者
基于所述噪声信号随着时间的斜率来确定所述噪声信号是否具有所述衰退趋势。
19.根据权利要求17或18所述的系统,其中所述脉冲噪声概率计算单元进一步被配置为:
当所述噪声信号具有所述衰退趋势时,以第一速率增长所述脉冲噪声概率;以及
当所述噪声信号不具有所述衰退趋势时,以第二速率减少所述脉冲噪声概率。
20.根据权利要求18所述的系统,进一步包括:
最大值降低单元,被配置为在所述起始概率低于第二预定概率阈值并且所述噪声信号的所述当前估计水平与所述噪声信号的信号水平之间的距离低于预定距离阈值时,降低所述最大信号水平。
21.根据权利要求17所述的系统,进一步包括:
其中所述脉冲建立时间记录单元进一步被配置为在所述起始概率高于所述第一预定概率阈值时将所述脉冲建立时间设置为零。
22.根据权利要求16所述的系统,其中所述平滑因数确定单元进一步被配置为:
当所述脉冲建立时间低于预定时间阈值时,基于基准平滑因数、以及所述脉冲噪声概率与所述起始概率中的最大值,确定所述可变平滑因数;以及
当所述脉冲建立时间高于等于所述预定时间阈值时,基于所述基准平滑因数以及所述脉冲噪声概率,确定所述可变平滑因数,
其中在确定所述可变平滑因数时,所述可变平滑因数是所述脉冲噪声概率在时间上的缩减函数。
23.根据权利要求14或15所述的系统,其中所述噪声水平估计单元进一步被配置为:
利用所述可变平滑因数来平滑所述噪声信号;以及
将平滑后的所述噪声信号的平滑信号水平确定为所述噪声信号的所述当前估计水平。
24.根据权利要求14或15所述的系统,进一步包括:
最小值确定单元,被配置为确定所述噪声信号在第二时间窗内的最小信号水平,
其中所述噪声水平估计单元进一步被配置为:
利用所述可变平滑因数来平滑所述噪声信号;以及
选择平滑后的所述噪声信号的平滑信号水平与所述最小信号水平中的最大值,作为所述噪声信号的所述当前估计水平。
25.根据权利要求24所述的系统,进一步包括:
稳定程度确定单元,被配置为确定所述噪声信号的稳定程度;以及
时间窗缩短单元,被配置为在所述稳定程度低于预定稳定阈值并且所述脉冲建立时间低于预定时间阈值时,缩短所述第二时间窗,以使得所述噪声信号在缩短后的第二时间窗内的最小信号水平大于所述平滑信号水平。
26.根据权利要求25所述的系统,其中所述稳定程度由所述噪声信号在预定测量时间窗内的方差或标准偏差来测量。
27.一种非瞬态计算机可读介质,其上存储有机器可执行指令,所述机器可执行指令在被执行时使得所述机器执行根据权利要求1至13中任一项所述的方法的步骤。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410275429.1A CN105225673B (zh) | 2014-06-09 | 2014-06-09 | 用于噪声水平估计的方法、系统和介质 |
EP15729062.8A EP3152756B1 (en) | 2014-06-09 | 2015-06-08 | Noise level estimation |
PCT/US2015/034733 WO2015191470A1 (en) | 2014-06-09 | 2015-06-08 | Noise level estimation |
US15/316,092 US10141003B2 (en) | 2014-06-09 | 2015-06-08 | Noise level estimation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410275429.1A CN105225673B (zh) | 2014-06-09 | 2014-06-09 | 用于噪声水平估计的方法、系统和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105225673A CN105225673A (zh) | 2016-01-06 |
CN105225673B true CN105225673B (zh) | 2020-12-04 |
Family
ID=54994577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410275429.1A Active CN105225673B (zh) | 2014-06-09 | 2014-06-09 | 用于噪声水平估计的方法、系统和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105225673B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106788816B (zh) * | 2016-11-30 | 2020-11-13 | 全球能源互联网研究院有限公司 | 一种信道状态检测方法及装置 |
US10043531B1 (en) * | 2018-02-08 | 2018-08-07 | Omnivision Technologies, Inc. | Method and audio noise suppressor using MinMax follower to estimate noise |
CN109120379A (zh) * | 2018-08-30 | 2019-01-01 | 武汉虹信通信技术有限责任公司 | 一种适用于无线通信系统多场景的自适应调制编码方法 |
CN111341333B (zh) * | 2020-02-10 | 2023-01-17 | 腾讯科技(深圳)有限公司 | 噪声检测方法、噪声检测装置、介质及电子设备 |
CN112379617B (zh) * | 2020-11-05 | 2022-03-15 | 中国航空工业集团公司西安航空计算技术研究所 | 防止容错系统通道锁死的防互锁电路和多余度容错系统 |
CN113739907B (zh) * | 2021-09-04 | 2024-02-20 | 天津大学 | 一种脑力劳动工作状态下的声环境质量判定方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1450354A1 (en) * | 2003-02-21 | 2004-08-25 | Harman Becker Automotive Systems-Wavemakers, Inc. | System for suppressing wind noise |
US20070055508A1 (en) * | 2005-09-03 | 2007-03-08 | Gn Resound A/S | Method and apparatus for improved estimation of non-stationary noise for speech enhancement |
US20070250312A1 (en) * | 2006-04-25 | 2007-10-25 | Philip Garner | Signal processing apparatus and method thereof |
CN101743689A (zh) * | 2007-07-13 | 2010-06-16 | 杜比实验室特许公司 | 使用音频信号水平的随时间变化的估计概率密度的随时间变化的音频信号水平 |
EP2234105A1 (en) * | 2009-03-23 | 2010-09-29 | Harman Becker Automotive Systems GmbH | Background noise estimation |
CN101882442A (zh) * | 2009-05-04 | 2010-11-10 | 上海音乐学院 | 历史音频噪声检测与消除方法 |
CN101894563A (zh) * | 2010-07-15 | 2010-11-24 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
US20120134509A1 (en) * | 2010-11-25 | 2012-05-31 | Fujitsu Limited | Noise suppression apparatus, method, and a storage medium storing a noise suppression program |
CN103165137A (zh) * | 2011-12-19 | 2013-06-19 | 中国科学院声学研究所 | 一种非平稳噪声环境下传声器阵列的语音增强方法 |
CN103456310A (zh) * | 2013-08-28 | 2013-12-18 | 大连理工大学 | 一种基于谱估计的瞬态噪声抑制方法 |
CN103594094A (zh) * | 2012-08-15 | 2014-02-19 | 王景芳 | 自适应谱减法实时语音增强 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103646648B (zh) * | 2013-11-19 | 2016-03-23 | 清华大学 | 一种噪声功率估计方法 |
-
2014
- 2014-06-09 CN CN201410275429.1A patent/CN105225673B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1450354A1 (en) * | 2003-02-21 | 2004-08-25 | Harman Becker Automotive Systems-Wavemakers, Inc. | System for suppressing wind noise |
US20070055508A1 (en) * | 2005-09-03 | 2007-03-08 | Gn Resound A/S | Method and apparatus for improved estimation of non-stationary noise for speech enhancement |
US20070250312A1 (en) * | 2006-04-25 | 2007-10-25 | Philip Garner | Signal processing apparatus and method thereof |
CN101743689A (zh) * | 2007-07-13 | 2010-06-16 | 杜比实验室特许公司 | 使用音频信号水平的随时间变化的估计概率密度的随时间变化的音频信号水平 |
EP2234105A1 (en) * | 2009-03-23 | 2010-09-29 | Harman Becker Automotive Systems GmbH | Background noise estimation |
CN101882442A (zh) * | 2009-05-04 | 2010-11-10 | 上海音乐学院 | 历史音频噪声检测与消除方法 |
CN101894563A (zh) * | 2010-07-15 | 2010-11-24 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
US20120134509A1 (en) * | 2010-11-25 | 2012-05-31 | Fujitsu Limited | Noise suppression apparatus, method, and a storage medium storing a noise suppression program |
CN103165137A (zh) * | 2011-12-19 | 2013-06-19 | 中国科学院声学研究所 | 一种非平稳噪声环境下传声器阵列的语音增强方法 |
CN103594094A (zh) * | 2012-08-15 | 2014-02-19 | 王景芳 | 自适应谱减法实时语音增强 |
CN103456310A (zh) * | 2013-08-28 | 2013-12-18 | 大连理工大学 | 一种基于谱估计的瞬态噪声抑制方法 |
Non-Patent Citations (1)
Title |
---|
《Transient Noise Reduction Using Nonlocal Diffusion Filters》;Ronen Talmon et al.;《IEEE Transactions on Audio, Speech, and Language Processing》;20110831;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN105225673A (zh) | 2016-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105225673B (zh) | 用于噪声水平估计的方法、系统和介质 | |
US9373343B2 (en) | Method and system for signal transmission control | |
US9093077B2 (en) | Reverberation suppression device, reverberation suppression method, and computer-readable storage medium storing a reverberation suppression program | |
US11417353B2 (en) | Method for detecting audio signal and apparatus | |
JP2008534989A (ja) | 音声アクティビティ検出装置および方法 | |
EP2997741B1 (en) | Automated gain matching for multiple microphones | |
JP2009075536A (ja) | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 | |
US9922668B2 (en) | Estimating fractional chirp rate with multiple frequency representations | |
KR101986905B1 (ko) | 신호 분석 및 딥 러닝 기반의 오디오 음량 제어 방법 및 시스템 | |
US10141003B2 (en) | Noise level estimation | |
EP3149730B1 (en) | Enhancing intelligibility of speech content in an audio signal | |
US11183172B2 (en) | Detection of fricatives in speech signals | |
EP2980800A1 (en) | Noise level estimation | |
US20160314802A1 (en) | Volume controlling method and device | |
US9779762B2 (en) | Object sound period detection apparatus, noise estimating apparatus and SNR estimation apparatus | |
KR20200026587A (ko) | 음성 구간을 검출하는 방법 및 장치 | |
CN114981888A (zh) | 本底噪声估计和噪声降低 | |
US10600432B1 (en) | Methods for voice enhancement | |
US10607628B2 (en) | Audio processing method, audio processing device, and computer readable storage medium | |
US9570095B1 (en) | Systems and methods for instantaneous noise estimation | |
JP6716933B2 (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
US10109291B2 (en) | Noise suppression device, noise suppression method, and computer program product | |
JP2023542927A (ja) | 適応ノイズ推定 | |
KR20150086536A (ko) | 측정된 신호가 모델 신호에 매칭하는지의 여부를 결정하기 위한 방법 | |
EP3261089A1 (en) | Sibilance detection and mitigation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |