CN113707170A - 风噪声抑制方法、电子设备和存储介质 - Google Patents
风噪声抑制方法、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113707170A CN113707170A CN202111003337.4A CN202111003337A CN113707170A CN 113707170 A CN113707170 A CN 113707170A CN 202111003337 A CN202111003337 A CN 202111003337A CN 113707170 A CN113707170 A CN 113707170A
- Authority
- CN
- China
- Prior art keywords
- wind noise
- spectrum
- noise suppression
- input
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 188
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 238000001228 spectrum Methods 0.000 claims abstract description 224
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000009499 grossing Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 101150073130 ampR gene Proteins 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
本申请提出了一种风噪声抑制方法、电子设备和存储介质,涉及语音处理技术领域。其中,上述风噪声抑制方法包括:首先,可对输入频谱进行平稳噪声估计,得到输入频谱的平稳噪声谱。然后,可根据平稳噪声谱与输入频谱的比值关系,确定输入频谱在各个频点的平稳噪声抑制因子。其次,可根据平稳噪声抑制因子,确定输入频谱中风噪频段各个频点的风噪声抑制因子。最后,可基于风噪声抑制因子,对输入频谱进行风噪声抑制。从而可在保护语音信号的基础上,实现对风噪声的有效抑制。
Description
【技术领域】
本申请涉及语音处理技术领域,尤其涉及一种风噪声抑制方法、电子设备和存储介质。
【背景技术】
各种语音处理设备,如手机、蓝牙耳机和录音设备等,在户外使用时不可避免地会受到风噪声的干扰。风噪声来源于气流对于麦克风振膜的直接推动,主要分布在中低频段,且属于非平稳噪声,相邻帧间的风噪声变化较大。
由于风噪声的不稳定性,在进行风噪声估计时,噪声估计的更新速度很难跟上风噪声的变化速度。并且,即使估计出风噪声,在对风噪声进行抑制时,也极易损失中低频段的语音信号。因此,如何在保护语音信号的基础上,对风噪声进行有效抑制,是当前待解决的问题。
【发明内容】
本申请实施例提供了一种风噪声抑制方法、电子设备和存储介质,用于在保护语音信号的基础上,实现对风噪声的有效抑制。
第一方面,本申请实施例提供一种风噪声抑制方法,所述方法包括:对输入频谱进行平稳噪声估计,得到所述输入频谱的平稳噪声谱;根据所述平稳噪声谱与所述输入频谱的比值关系,确定所述输入频谱在各个频点的平稳噪声抑制因子;根据所述平稳噪声抑制因子,确定所述输入频谱中风噪频段各个频点的风噪声抑制因子;基于所述风噪声抑制因子,对所述输入频谱进行风噪声抑制。
其中一种可能的实现方式中,根据所述平稳噪声抑制因子,确定所述输入频谱中风噪频段各个频点的风噪声抑制因子之前,所述方法还包括:根据所述输入频谱的能量分布状态,确定所述输入频谱中的风噪频段。
其中一种可能的实现方式中,根据所述输入频谱的能量分布状态,确定所述输入频谱中的风噪频段,包括:根据所述输入频谱的高低频能量比,确定所述输入频谱中存在风噪声;将所述输入频谱中能量不均匀度小于设定阈值的频段确定为风噪频段。
其中一种可能的实现方式中,根据所述平稳噪声抑制因子,确定所述输入频谱中风噪频段各个频点的风噪声抑制因子,包括:将所述输入频谱中非风噪频段各个频点的平稳噪声抑制因子,依次确定为所述风噪频段各个频点的风噪声抑制因子。
其中一种可能的实现方式中,基于所述风噪声抑制因子,对所述输入频谱进行风噪声抑制,包括:根据所述风噪频段的频谱幅值,对所述输入频谱进行风噪声预处理,得到第一输出频谱;基于所述风噪声抑制因子,对所述第一输出频谱进行风噪声抑制,得到第二输出频谱。
其中一种可能的实现方式中,根据所述风噪频段的频谱幅值,对所述输入频谱进行风噪声预处理,得到第一输出频谱,包括:将所述风噪频段划分为若干个子频段;根据各个所述子频段中频谱幅值的最小值,确定各个所述子频段的预估风噪值;将所述预估风噪值从对应的各个子频段中去除,得到第一输出频谱。
其中一种可能的实现方式中,基于所述风噪声抑制因子,对所述第一输出频谱进行风噪声抑制,得到第二输出频谱之后,所述方法还包括:对所述第二输出频谱的风噪频段执行帧间平滑处理,得到目标输出频谱。
其中一种可能的实现方式中,基于所述风噪声抑制因子,对所述输入频谱进行风噪声抑制之前,所述方法还包括:基于所述平稳噪声抑制因子,对所述输入频谱进行平稳噪声抑制。
第二方面,本申请实施例提供一种风噪声抑制装置,所述装置包括:噪声估计模块,用于对输入频谱进行平稳噪声估计,得到所述输入频谱的平稳噪声谱;第一确定模块,用于根据所述平稳噪声谱与所述输入频谱的比值关系,确定所述输入频谱在各个频点的平稳噪声抑制因子;第二确定模块,用于根据所述平稳噪声抑制因子,确定所述输入频谱中风噪频段各个频点的风噪声抑制因子;噪声抑制模块,用于基于所述风噪声抑制因子,对所述输入频谱进行风噪声抑制。
其中一种可能的实现方式中,在根据所述平稳噪声抑制因子,确定所述输入频谱中风噪频段各个频点的风噪声抑制因子之前,所述第二确定模块还用于:根据所述输入频谱的能量分布状态,确定所述输入频谱中的风噪频段。
其中一种可能的实现方式中,所述第二确定模块具体用于,根据所述输入频谱的高低频能量比,确定所述输入频谱中存在风噪声;将所述输入频谱中能量不均匀度小于设定阈值的频段确定为风噪频段。
其中一种可能的实现方式中,所述第二确定模块具体用于,将所述输入频谱中非风噪频段各个频点的平稳噪声抑制因子,依次确定为所述风噪频段各个频点的风噪声抑制因子。
其中一种可能的实现方式中,所述噪声抑制模块具体用于,根据所述风噪频段的频谱幅值,对所述输入频谱进行风噪声预处理,得到第一输出频谱;基于所述风噪声抑制因子,对所述第一输出频谱进行风噪声抑制,得到第二输出频谱。
其中一种可能的实现方式中,所述噪声抑制模块具体用于,将所述风噪频段划分为若干个子频段;根据各个所述子频段中频谱幅值的最小值,确定各个所述子频段的预估风噪值;将所述预估风噪值从对应的各个子频段中去除,得到第一输出频谱。
其中一种可能的实现方式中,所述装置还包括处理模块,用于在所述噪声抑制模块对所述第一输出频谱进行风噪声抑制,得到第二输出频谱之后,对所述第二输出频谱的风噪频段执行帧间平滑处理,得到目标输出频谱。
其中一种可能的实现方式中,基于所述风噪声抑制因子,对所述输入频谱进行风噪声抑制之前,所述噪声抑制模块还用于:基于所述平稳噪声抑制因子,对所述输入频谱进行平稳噪声抑制。
第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第一方面所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如第一方面所述的方法。
以上技术方案中,首先,可对输入频谱进行平稳噪声估计,得到输入频谱的平稳噪声谱。然后,可根据平稳噪声谱与输入频谱的比值关系,确定输入频谱在各个频点的平稳噪声抑制因子。其次,可根据平稳噪声抑制因子,确定输入频谱中风噪频段各个频点的风噪声抑制因子。最后,可基于风噪声抑制因子,对输入频谱进行风噪声抑制。从而可在保护语音信号的基础上,实现对风噪声的有效抑制。
【附图说明】
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种风噪声抑制方法的流程图;
图2为本申请实施例提供的一种风噪声抑制方法的结构示意图;
图3为本申请实施例提供的另一种风噪声抑制方法的流程图;
图4为本申请实施例提供的另一种风噪声抑制方法的流程图;
图5为本申请实施例提供的一种风噪声抑制装置的结构示意图;
图6为本申请实施例提供的一种电子设备的示意图。
【具体实施方式】
为了更好的理解本申请的技术方案,下面结合附图对本申请实施例进行详细描述。
应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
本申请实施例可提供一种风噪声抑制系统,该风噪声抑制系统可位于具备语音处理功能的终端设备内,如手机、蓝牙耳机、录音设备等。本申请实施例提供的风噪声抑制系统可用于执行本申请实施例提供的风噪声抑制方法。
图1为本申请实施例提供的一种风噪声抑制方法的流程图。如图1所示,上述风噪声抑制方法可以包括:
步骤101,对输入频谱进行平稳噪声估计,得到输入频谱的平稳噪声谱。
本申请实施例中,待处理的信号可以有多帧,每帧信号的处理方法均相同。为方便表述,本申请将以其中任意一帧信号为例,对本申请提供的风噪声抑制方法的实现方式进行说明。
本申请实施例中,可先对输入频谱进行平稳噪声估计,从而得到平稳噪声谱。此处的输入频谱为任意一帧待处理信号对应的输入频谱。平稳噪声谱可包含输入频谱在各个频点的平稳噪声值。
由于平稳噪声的统计特性不随时间变化,因此平稳噪声估计较为容易实现。其具体的估计方法可参考现有技术,例如可以为最小值控制的递归平均(Minimum ControlledRegressive Averaging,MCRA)算法、Doblinger算法、Hirsch算法、Martin算法等噪声估计方法。本申请对此不做限制。
步骤102,根据平稳噪声谱与输入频谱的比值关系,确定输入频谱在各个频点的平稳噪声抑制因子。
在一种具体的实现过程中,可根据下述公式计算输入频谱在各个频点的平稳噪声抑制因子:
G(k,l)=(|s(k,l)|α-|N(k,l)|α)/|s(k,l)|α
其中,||表示取模运算,G表示平稳噪声抑制因子,S表示输入频谱,N表示平稳噪声谱,k表示频点,l表示帧,α可取大于1的整数。
步骤103,根据平稳噪声抑制因子,确定输入频谱中风噪频段各个频点的风噪声抑制因子。
本申请实施例中,首先,可根据输入频谱的能量分布状态,确定输入频谱的风噪频段。可以理解的,风噪频段指的是,受到风噪声影响的频段。根据风噪声的特性,风噪频段通常位于输入频谱的中低频段。
在确定了风噪频段的基础上,可进一步确定风噪频段各个频点的风噪声抑制因子。
需要说明的是,在语音信号处理相关领域,噪声抑制因子有以下特点:
特点一
对于存在风噪声以及平稳噪声影响的语音频段,在进行噪声估计时,噪声估计的更新速度难以跟上风噪声的变化速度。因此,此时得到的噪声估计谱接近于平稳噪声的幅值,得到的噪声抑制因子接近于1。即,对风噪声无抑制效果。
特点二
对于无风噪声但存在平稳噪声影响的频段,在有语音信号的频段,由于语音信号具有稀疏的特性,因此得到的噪声抑制因子会具有梳状特性。即,在谐波的地方噪声抑制因子的值接近于1,在非谐波的地方噪声抑制因子的值会稍接近于0。在无语音信号的频段,噪声抑制因子的值会稍接近于0。
基于噪声抑制因子的上述特点,本申请在确定风噪频段的风噪声抑制因子时,可基于以下思路实现。
即,如图2所示,将非风噪频段各个频点平稳噪声抑制因子,依次延拓到风噪频段,作为风噪频段各个频点的风噪声抑制因子。
或者,将非风噪频段各个频点的平稳噪声抑制因子延拓至风噪频段之后,可将非风噪频段各个频点的平稳噪声抑制因子分别与风噪频段各个频点的平稳噪声抑制因子相乘。然后,可将得到的乘积依次作为风噪频段各个频点的风噪声抑制因子。
通过上述方法确定风噪声抑制因子,可实现如下技术效果,如果非风噪频段无语音信号,那么,平稳噪声抑制因子接近于0,延拓到风噪频段之后,将对风噪声产生极大的抑制作用。相反的,如果非风噪频段存在语音信号,那么,平稳噪声抑制因子具有梳状特性,延拓到风噪频段之后,在谐波的地方对风噪声无明显抑制效果,在非谐波的地方可以对风噪声产生极大的抑制作用,从而可以实现对语音信号的保护。
步骤104,基于风噪声抑制因子,对输入频谱进行风噪声抑制。
本申请实施例中,在对输入频谱进行风噪声抑制时,可分两个步骤进行,分别是风噪声预处理和风噪声抑制。
首先,在进行风噪声预处理时,可将风噪频段划分为若干个子频段。其中,每个子频段所包含的频点个数需大于一个最低阈值。最低阈值的取值例如可以为3。然后,可根据各个子频段中频谱幅值的最小值,确定各个子频段的预估风噪值。例如,可直接将各个子频段中频谱幅值的最小值,作为对应子频段的预估风噪值。最后,可利用谱减法或广义维纳滤波等,将预估风噪值从对应的各个子频段中去除,得到第一输出频谱。
在上述风噪声预处理步骤中,由于语音信号具有谐波特性,因此,在一个小的频谱区间取一个最小频谱幅值时,必然会取到非谐波频点。那么,由此得到的预估风噪值会很小,进行风噪抑制后对语音信号的损失也很小。从而,风噪声预处理步骤可以粗略去除输入频谱中的部分风噪声,且对语音信号的损失很小。
通过风噪声预处理得到第一输出频谱之后,本申请实施例可进一步对第一输出频谱进行风噪声抑制。
具体的,可通过以下公式对第一输出频谱进行风噪声抑制,从而得到第二输出频谱:S_out2(k,l)=S_out1(k,l)*G(k,l)|k∈BW。
其中,S_out1表示第一输出频谱,S_out2表示第二输出频谱,G(k,l)|k∈BW表示风噪声抑制因子,BW表示风噪频段,k表示频点,l表示帧标记。
进一步的,由于风噪声极不平稳,帧与帧之间的风噪差别很大,因此,在得到第二输出频谱之后,还可以对第二输出频谱的风噪频段进行帧间平滑处理,从而得到目标输出频谱。
具体的,参考下述公式,可以将第二输出频谱的风噪频段与前一帧的同一频段做比较。然后,可根据其中的最小幅值确定平滑增益。最后,可基于平滑增益重新计算输出信号,作为平滑处理后的目标输出频谱。
gain(k,l)=min(|S_out2(k,l-1)|,|S_out2(k,l)|)/|S_out2(k,l)|
S_out3(k,l)|k∈BW=S_out2(k,l)|k∈BW*gain(k,l)|k∈BW
其中||表示取模操作,min表示选取两个向量相同下标的最小值,S_out3表示目标输出频谱,gain(k,l)表示平滑增益,BW表示风噪频段,即只对风噪频段做平滑处理。
通过帧间平滑处理,可将风噪保持在一个比较低的水平,且由于语音信号的短时平稳性,对谐波也不会有很大的影响。
以上技术方案中,首先,可对输入频谱进行平稳噪声估计,得到输入频谱的平稳噪声谱。然后,可根据平稳噪声谱与输入频谱的比值关系,确定输入频谱在各个频点的平稳噪声抑制因子。其次,可根据平稳噪声抑制因子,确定输入频谱中风噪频段各个频点的风噪声抑制因子。最后,可基于风噪声抑制因子,对输入频谱进行风噪声抑制。从而可在保护语音信号的基础上,实现对风噪声的有效抑制。
本申请另一实施例中,对风噪频段的确定方法作进一步说明。
图3为本申请实施例提供的另一种风噪声抑制方法的流程图。如图3所示,在确定风噪频段时,可包括如下步骤:
步骤201,根据输入频谱的高低频能量比,确定输入频谱中存在风噪声。
本申请实施例中,可根据高低频能量比,检测输入频谱中的风噪声。具体的,可根据下述公式计算输入频谱的高低频能量比。
ampR(l)=SAhigh(l)/SAlow(l)
其中,||表示取模操作,l1和l2分别表示低频段选取的边界,h1和h2分别表示高频段选取的边界。SAlow(l)表示低频段能量均值,SAhigh(l)表示高频段能量均值。ampR(l)表示高低频能量比。
如果得到的高低频能量比小于阈值thr1,则认为当前输入频谱中存在风噪声。阈值thr1的取值可根据实际经验进行确定。
步骤202,根据输入频谱的能量不均匀度,确定风噪声所在的频段。
在确定输入频谱中存在风噪声的基础上,可进一步确定风噪声所在的频段。
具体的,可将输入频谱分为若干个频谱区间。然后,可根据下述公式,分别计算各个频谱区间内的能量不均匀度。
其中,nonFlat表示不均匀度,i1表示各个频谱区间的上边界,i2表示各个频谱区间的下边界。
如果能量不均匀度小于阈值thr2,可认为该频谱区间为风噪频段。通过对各个频谱区间的能量不均匀度进行计算,可得到整个输入频谱包含的风噪频段。其中,阈值thr2的取值可根据实际经验进行确定。
需要说明的是,本申请实施例中,不均匀度计算还可以用平坦度计算替代。平坦度计算方法为,以各频点几何平均值除以各频点算术平均值。
上述技术方案中,通过高低频能量比和不均匀度的计算结果,可以确定出输入频谱中是否包含风噪声,以及风噪声所在的频段范围。
图4为本申请实施例提供的另一种风噪声抑制方法的流程图。如图4所示,上述风噪声抑制方法可以包括:
步骤301,对输入频谱进行平稳噪声估计,得到输入频谱的平稳噪声谱。
步骤302,根据平稳噪声谱与输入频谱的比值关系,确定输入频谱在各个频点的平稳噪声抑制因子。
步骤303,基于平稳噪声抑制因子,对输入频谱进行平稳噪声抑制。
步骤304,根据输入频谱的高低频能量比,确定输入频谱中存在风噪声。
步骤305,根据输入频谱的能量不均匀度,确定风噪声所在的频段。
步骤306,根据平稳噪声抑制因子,确定输入频谱中风噪频段各个频点的风噪声抑制因子。
步骤307,基于风噪声抑制因子,对经过平稳噪声抑制后的输入频谱进行风噪声抑制。
上述技术方案中,得到平稳噪声抑制因子之后,可先对输入频谱进行平稳噪声抑制。然后,再基于得到的风噪声抑制因子,对经过平稳噪声抑制后的输入频谱进行风噪声抑制。从而,可最大程度减少输入频谱中的噪声干扰,有利于得到听觉效果更好的语音信号。
图5为本申请实施例提供的一种风噪声抑制装置的结构示意图。如图5所示,本申请实施例提供的风噪声抑制装置可以包括:噪声估计模块51、第一确定模块52、第二确定模块53、噪声抑制模块54以及处理模块55。
噪声估计模块51,用于对输入频谱进行平稳噪声估计,得到输入频谱的平稳噪声谱。
第一确定模块52,用于根据平稳噪声谱与输入频谱的比值关系,确定输入频谱在各个频点的平稳噪声抑制因子。
第二确定模块53,用于根据平稳噪声抑制因子,确定输入频谱中风噪频段各个频点的风噪声抑制因子。
噪声抑制模块54,用于基于风噪声抑制因子,对输入频谱进行风噪声抑制。
在一个具体的实现过程中,在根据平稳噪声抑制因子,确定输入频谱中风噪频段各个频点的风噪声抑制因子之前,第二确定模块53还用于:根据输入频谱的能量分布状态,确定输入频谱中的风噪频段。
在一个具体的实现过程中,第二确定模块53具体用于,根据输入频谱的高低频能量比,确定输入频谱中存在风噪声;将输入频谱中能量不均匀度小于设定阈值的频段确定为风噪频段。
在一个具体的实现过程中,第二确定模块53具体用于,将输入频谱中非风噪频段各个频点的平稳噪声抑制因子,依次确定为风噪频段各个频点的风噪声抑制因子。
在一个具体的实现过程中,噪声抑制模块54具体用于,根据风噪频段的频谱幅值,对输入频谱进行风噪声预处理,得到第一输出频谱;基于风噪声抑制因子,对第一输出频谱进行风噪声抑制,得到第二输出频谱。
在一个具体的实现过程中,噪声抑制模块54具体用于,将风噪频段划分为若干个子频段;根据各个子频段中频谱幅值的最小值,确定各个子频段的预估风噪值;将预估风噪值从对应的各个子频段中去除,得到第一输出频谱。
在一个具体的实现过程中,上述装置还包括处理模块55,用于在噪声抑制模块54对第一输出频谱进行风噪声抑制,得到第二输出频谱之后,对第二输出频谱的风噪频段执行帧间平滑处理,得到目标输出频谱。
在一个具体的实现过程中,基于风噪声抑制因子,对输入频谱进行风噪声抑制之前,噪声抑制模块54还用于:基于平稳噪声抑制因子,对输入频谱进行平稳噪声抑制。
本申请实施例中,首先,首先,噪声估计模块51可对输入频谱进行平稳噪声估计,得到输入频谱的平稳噪声谱。然后,第一确定模块52可根据平稳噪声谱与输入频谱的比值关系,确定输入频谱在各个频点的平稳噪声抑制因子。其次,第二确定模块53可根据平稳噪声抑制因子,确定输入频谱中风噪频段各个频点的风噪声抑制因子。最后,噪声抑制模块54可基于风噪声抑制因子,对输入频谱进行风噪声抑制。从而可在保护语音信号的基础上,实现对风噪声的有效抑制。
图6为本申请实施例提供的一种电子设备的示意图,如图6所示,上述电子设备可以包括至少一个处理器;以及与上述处理器通信连接的至少一个存储器,其中:存储器存储有可被处理器执行的程序指令,上述处理器调用上述程序指令能够执行本申请实施例提供的风噪声抑制方法。
其中,上述电子设备可以为风噪声抑制设备,本实施例对上述电子设备的具体形态不作限定。
图6示出了适于用来实现本申请实施方式的示例性电子设备的框图。图6显示的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于:一个或者多个处理器410,存储器430,通信接口420,连接不同系统组件(包括存储器430和处理器410)的通信总线440。
通信总线440表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器430可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)和/或高速缓存存储器。电子设备可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read Only Memory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read Only Memory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与通信总线440相连。存储器430可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块的程序/实用工具,可以存储在存储器430中,这样的程序模块包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块通常执行本申请所描述的实施例中的功能和/或方法。
电子设备也可以与一个或多个外部设备(例如键盘、指向设备、显示器等)通信,还可与一个或者多个使得用户能与该电子设备交互的设备通信,和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过通信接口420进行。并且,电子设备还可以通过网络适配器(图6中未示出)与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide AreaNetwork;以下简称:WAN)和/或公共网络,例如因特网)通信,上述网络适配器可以通过通信总线440与电子设备的其它模块通信。应当明白,尽管图6中未示出,可以结合电子设备使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Drives;以下简称:RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器410通过运行存储在存储器430中的程序,从而执行各种功能应用以及数据处理,例如实现本申请实施例提供的风噪声抑制方法。
本申请实施例还提供一种计算机可读存储介质,上述计算机可读存储介质存储计算机指令,上述计算机指令使上述计算机执行本申请实施例提供的风噪声抑制方法。
上述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory;以下简称:ROM)、可擦式可编程只读存储器(Erasable Programmable ReadOnly Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LocalArea Network;以下简称:LAN)或广域网(Wide Area Network;以下简称:WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
需要说明的是,本申请实施例中所涉及的终端可以包括但不限于个人计算机(Personal Computer;以下简称:PC)、个人数字助理(Personal Digital Assistant;以下简称:PDA)、无线手持设备、平板电脑(Tablet Computer)、手机、MP3播放器、MP4播放器等。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。
Claims (10)
1.一种风噪声抑制方法,其特征在于,包括:
对输入频谱进行平稳噪声估计,得到所述输入频谱的平稳噪声谱;
根据所述平稳噪声谱与所述输入频谱的比值关系,确定所述输入频谱在各个频点的平稳噪声抑制因子;
根据所述平稳噪声抑制因子,确定所述输入频谱中风噪频段各个频点的风噪声抑制因子;
基于所述风噪声抑制因子,对所述输入频谱进行风噪声抑制。
2.根据权利要求1所述的方法,其特征在于,根据所述平稳噪声抑制因子,确定所述输入频谱中风噪频段各个频点的风噪声抑制因子之前,所述方法还包括:
根据所述输入频谱的能量分布状态,确定所述输入频谱中的风噪频段。
3.根据权利要求2所述的方法,其特征在于,根据所述输入频谱的能量分布状态,确定所述输入频谱中的风噪频段,包括:
根据所述输入频谱的高低频能量比,确定所述输入频谱中存在风噪声;
将所述输入频谱中能量不均匀度小于设定阈值的频段确定为风噪频段。
4.根据权利要求1所述的方法,其特征在于,根据所述平稳噪声抑制因子,确定所述输入频谱中风噪频段各个频点的风噪声抑制因子,包括:
将所述输入频谱中非风噪频段各个频点的平稳噪声抑制因子,依次确定为所述风噪频段各个频点的风噪声抑制因子。
5.根据权利要求1所述的方法,其特征在于,基于所述风噪声抑制因子,对所述输入频谱进行风噪声抑制,包括:
根据所述风噪频段的频谱幅值,对所述输入频谱进行风噪声预处理,得到第一输出频谱;
基于所述风噪声抑制因子,对所述第一输出频谱进行风噪声抑制,得到第二输出频谱。
6.根据权利要求5所述的方法,其特征在于,根据所述风噪频段的频谱幅值,对所述输入频谱进行风噪声预处理,得到第一输出频谱,包括:
将所述风噪频段划分为若干个子频段;
根据各个所述子频段中频谱幅值的最小值,确定各个所述子频段的预估风噪值;
将所述预估风噪值从对应的各个子频段中去除,得到第一输出频谱。
7.根据权利要求5所述的方法,其特征在于,基于所述风噪声抑制因子,对所述第一输出频谱进行风噪声抑制,得到第二输出频谱之后,所述方法还包括:
对所述第二输出频谱的风噪频段执行帧间平滑处理,得到目标输出频谱。
8.根据权利要求1所述的方法,其特征在于,基于所述风噪声抑制因子,对所述输入频谱进行风噪声抑制之前,所述方法还包括:
基于所述平稳噪声抑制因子,对所述输入频谱进行平稳噪声抑制。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至8任一所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至8任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111003337.4A CN113707170A (zh) | 2021-08-30 | 2021-08-30 | 风噪声抑制方法、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111003337.4A CN113707170A (zh) | 2021-08-30 | 2021-08-30 | 风噪声抑制方法、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113707170A true CN113707170A (zh) | 2021-11-26 |
Family
ID=78656713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111003337.4A Pending CN113707170A (zh) | 2021-08-30 | 2021-08-30 | 风噪声抑制方法、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113707170A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114615586A (zh) * | 2022-03-25 | 2022-06-10 | 歌尔股份有限公司 | 耳机降噪方法、装置、电子设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040167777A1 (en) * | 2003-02-21 | 2004-08-26 | Hetherington Phillip A. | System for suppressing wind noise |
US20050278172A1 (en) * | 2004-06-15 | 2005-12-15 | Microsoft Corporation | Gain constrained noise suppression |
CN106910511A (zh) * | 2016-06-28 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 一种语音去噪方法和装置 |
CN109215677A (zh) * | 2018-08-16 | 2019-01-15 | 北京声加科技有限公司 | 一种适用于语音和音频的风噪检测和抑制方法和装置 |
CN111917926A (zh) * | 2019-05-09 | 2020-11-10 | 上海触乐信息科技有限公司 | 一种通信终端中的回声消除方法、装置及终端设备 |
CN112309418A (zh) * | 2020-10-30 | 2021-02-02 | 出门问问(苏州)信息科技有限公司 | 一种抑制风噪声的方法及装置 |
-
2021
- 2021-08-30 CN CN202111003337.4A patent/CN113707170A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040167777A1 (en) * | 2003-02-21 | 2004-08-26 | Hetherington Phillip A. | System for suppressing wind noise |
US20050278172A1 (en) * | 2004-06-15 | 2005-12-15 | Microsoft Corporation | Gain constrained noise suppression |
CN106910511A (zh) * | 2016-06-28 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 一种语音去噪方法和装置 |
CN109215677A (zh) * | 2018-08-16 | 2019-01-15 | 北京声加科技有限公司 | 一种适用于语音和音频的风噪检测和抑制方法和装置 |
CN111917926A (zh) * | 2019-05-09 | 2020-11-10 | 上海触乐信息科技有限公司 | 一种通信终端中的回声消除方法、装置及终端设备 |
CN112309418A (zh) * | 2020-10-30 | 2021-02-02 | 出门问问(苏州)信息科技有限公司 | 一种抑制风噪声的方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114615586A (zh) * | 2022-03-25 | 2022-06-10 | 歌尔股份有限公司 | 耳机降噪方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210327448A1 (en) | Speech noise reduction method and apparatus, computing device, and computer-readable storage medium | |
JP6636937B2 (ja) | 状況に応じた過渡抑制 | |
JP6290429B2 (ja) | 音声処理システム | |
KR102190833B1 (ko) | 에코 억제 | |
CN110556125B (zh) | 基于语音信号的特征提取方法、设备及计算机存储介质 | |
US11462225B2 (en) | Method for processing speech/audio signal and apparatus | |
CN110931035B (zh) | 音频处理方法、装置、设备及存储介质 | |
CN109756818B (zh) | 双麦克风降噪方法、装置、存储介质及电子设备 | |
WO2021007841A1 (zh) | 噪声估计方法、噪声估计装置、语音处理芯片以及电子设备 | |
CN105027540A (zh) | 回波抑制 | |
CN113707170A (zh) | 风噪声抑制方法、电子设备和存储介质 | |
CN111226277B (zh) | 语音增强方法及装置 | |
CN112669878B (zh) | 声音增益值的计算方法、装置和电子设备 | |
KR102607120B1 (ko) | 소리 데이터 노이즈 캔슬링 방법, 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체 및 컴퓨터 프로그램 | |
CN112309418B (zh) | 一种抑制风噪声的方法及装置 | |
CN113205824B (zh) | 声音信号处理方法、装置、存储介质、芯片及相关设备 | |
CN114360563A (zh) | 语音降噪方法、装置、设备及存储介质 | |
CN111145776B (zh) | 音频处理方法和装置 | |
CN112558916B (zh) | 音频调节的方法、装置、电子设备及存储介质 | |
US20230262390A1 (en) | Audio denoising method and system | |
CN115376537A (zh) | 信号处理方法、装置、电子设备及介质 | |
CN116013331A (zh) | 一种低音增强方法、装置、电子设备及存储介质 | |
CN114360566A (zh) | 一种语音信号的降噪处理方法、装置以及存储介质 | |
CN116453538A (zh) | 语音降噪方法和装置 | |
CN114664319A (zh) | 频带扩展方法、装置、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |