CN112309418B - 一种抑制风噪声的方法及装置 - Google Patents

一种抑制风噪声的方法及装置 Download PDF

Info

Publication number
CN112309418B
CN112309418B CN202011189059.1A CN202011189059A CN112309418B CN 112309418 B CN112309418 B CN 112309418B CN 202011189059 A CN202011189059 A CN 202011189059A CN 112309418 B CN112309418 B CN 112309418B
Authority
CN
China
Prior art keywords
time
frequency domain
domain signal
power spectrum
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011189059.1A
Other languages
English (en)
Other versions
CN112309418A (zh
Inventor
付聪
雷欣
李志飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Go Out And Ask Suzhou Information Technology Co ltd
Original Assignee
Go Out And Ask Suzhou Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Go Out And Ask Suzhou Information Technology Co ltd filed Critical Go Out And Ask Suzhou Information Technology Co ltd
Priority to CN202011189059.1A priority Critical patent/CN112309418B/zh
Publication of CN112309418A publication Critical patent/CN112309418A/zh
Application granted granted Critical
Publication of CN112309418B publication Critical patent/CN112309418B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Abstract

本发明公开了一种抑制风噪声的方法及装置,涉及人工智能技术领域。该方法的一实施例包括:分别获取多个声音采集设备采集的时频域信号,每个所述时频域信号具有相同的频带范围;从多个所述时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号;本发明实施例通过从多个时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号,由此能够降低风燥声的同时降低语音失真;通过对每个频带对应的准时频域信号施加相应的增益因子,并在确定施加增益因子的准时频域信号的平稳噪声受到破坏后,对该频带对应的准时频域信号进行平稳噪声修复,从而能够对平稳噪声进行补偿,去除听感上的噪声“呼吸”现象,提高了用户的体验性。

Description

一种抑制风噪声的方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种抑制风噪声的方法及装置。
背景技术
现有抑制风噪声的方法有两种,分别是单通道抑制风噪和基于传声器阵列的多通道抑制风噪。单通道抑制风噪通常是先对信号进行高通滤波,再进行平稳噪声降噪;多通道抑制风噪通常是利用多通道的语音高度相关以及风噪基本不相关的原理进行风噪估计,并使用自适应滤波或维纳滤波进行降噪。
然而,对于单通道风噪抑制来说,由于风噪能量极强且极不平稳的问题,因此单通道风噪抑制的效果不是很理想。对于多通道风噪抑制来说,由于利用相干系数来统计风噪量进行风噪抑制,总是无法准确给出某一时刻的最佳抑制增益量,因此多通道风噪抑制经常会出现降噪量不够或者语音失真等情形。而且风噪抑制会破坏平稳噪声,因此不管是单通道风噪抑制还是多通道风噪抑制,均会在听感上出现噪声“呼吸”效应,为此会给使用者带来很多的不适感。
发明内容
有鉴于此,本发明实施例提供一种抑制风噪声的方法及装置,能够降低风燥声的同时降低语音失真。
为实现上述目的,根据本发明实施例第一方面,提供一种抑制风噪声的方法,该方法包括:分别获取多个声音采集设备采集的时频域信号,每个所述时频域信号具有相同的频带范围;从多个所述时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号;针对所述频带范围内任一频带:对所述频带对应的准时频域信号施加相应的增益因子;确定施加增益因子的准时频域信号的平稳噪声受到破坏;对所述频带对应的准时频域信号进行平稳噪声修复。
可选的,所述从多个所述时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号,包括:针对多个所述时频域信号,分别估计每个所述时频域信号受风噪影响最高的频带;从多个估计频带选取受风噪影响最小的频带,并将所选取的频带对应的时频域信号作为准时频域信号。
可选的,所述分别估计每个所述时频域信号受风噪影响最高的频带,包括:针对任一时频域信号,比较该时频域信号对应的功率谱与预设功率谱大小,若所述功率谱大于等于预设功率谱,则基于预设功率谱计算该时频域信号受风噪影响最大的频带;若该时频域信号对应的功率谱小于预设功率谱,则基于该时频域信号对应的功率谱计算该时频域信号受风噪影响最大的频带。
可选的,每个频带均具有对应的增益因子,所述增益因子通过如下方法获得:针对任一频带,分别计算该频带对应的准时频域信号与剩下每个所述时频域信号之间的相干系数,得到多个相干系数;从所述多个相干系数中选取最大的相干系数;对所述最大的相干系数进行线性变换,得到该频带对应的增益因子。
可选的,所述确定施加增益因子的准时频域信号的平稳噪声受到破坏,包括:对所述准时频域信号进行平稳噪声功率谱估计;计算施加增益因子的准时频域信号对应的功率谱;比较所述功率谱和所述平稳噪声功率谱的大小,若所述功率谱小于所述平稳噪声功率谱,则确定施加增益因子的准时频域信号的平稳噪声受到破坏。
可选的,所述对所述频带对应的准时频域信号进行平稳噪声修复,包括:通过对所述频带对应的准时频域信号进行高斯白噪声填充,以实现对所述准时频域信号进行平稳噪声修复。
为实现上述目的,根据本发明实施例第二方面,还提供一种抑制风噪声的装置,该装置包括:获取模块,用于分别获取多个声音采集设备采集的时频域信号,每个所述时频域信号具有相同的频带范围;选取模块,用于从多个所述时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号;平稳噪声修复模块,用于针对所述频带范围内任一频带:对所述频带对应的准时频域信号施加相应的增益因子;确定施加增益因子的准时频域信号的平稳噪声受到破坏;对所述频带对应的准时频域信号进行平稳噪声修复。
可选的,所述选取模块包括:频带估计单元,用于针对多个所述时频域信号,分别估计每个所述时频域信号受风噪影响最高的频带;选取单元,用于从多个估计频带中选取受风噪影响最小的频带,并将所选取的频带对应的时频域信号作为准时频域信号。
可选的,所述频带估计单元包括:频带估计子单元,用于针对任一时频域信号,比较该时频域信号对应的功率谱与预设功率谱大小,若所述功率谱大于等于预设功率谱,则基于预设功率谱计算该时频域信号受风噪影响最大的频带;若该时频域信号对应的功率谱小于预设功率谱,则基于该时频域信号对应的功率谱计算该时频域信号受风噪影响最大的频带。
可选的,所述平稳噪声修复模块包括:平稳噪声估计单元,用于对所述准时频域信号进行平稳噪声功率谱估计;计算单元,用于计算施加增益因子的准时频域信号对应的功率谱;确定单元,用于比较所述功率谱和所述平稳噪声功率谱的大小,若所述功率谱小于所述平稳噪声功率谱,则确定施加增益因子的准时频域信号的平稳噪声受到破坏。
为实现上述目的,根据本发明实施例第三方面,还提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述抑制风噪声的方法。
本发明实施例通过获取多个声音采集设备采集的时频域信号,每个时频域信号具有相同的频带范围;从多个时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号,由此能够在降低风噪声和降低语音失真。之后针对频带范围内任一频带:对该频带对应的准时频域信号施加相应的增益因子,并在确定施加增益因子的准时频域信号的平稳噪声受到破坏后对该频带对应的准时频域信号进行平稳噪声修复,由此能够对平稳噪声进行补偿,去除听感上的噪声“呼吸”现象,提高了用户的体验性。
上述的非惯用的可选方式所具有的进一步的效果将在下文结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中在附图中,相同或对应的标号表示相同或对应的部分。
图1为本发明一实施例抑制风噪声的方法的流程图;
图2为本发明又一实施例抑制风噪声的方法的流程图;
图3本发明一实施例针对任一频带对应的准时频域信号进行平稳噪声修复的方法的流程图;
图4为本发明一实施例抑制风噪声的装置的示意图;
图5为本发明实施例可以应用于其中的示例性系统架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
如图1所示,为本发明一实施例抑制风噪声的方法的流程图,该方法至少包括如下操作流程:
S101,分别获取多个声音采集设备采集的时频域信号,每个时频域信号具有相同的频带范围。
声音采集设备可以是传声器,也可以是其他声音采集装置。
具体地,先分别获取多个传声器采集的时域信号,之后对多个时域信号进行短时傅里叶变换,得到多个时频域信号,由此,经过短时傅里叶变换能够将传声器采集的时域信号转换成时频域信号。针对每个时频域信号,分别选取1至L个频带,L是一个常数,由此每个时频域对应的频带范围为1-L。
S102,从多个时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号。
在这里,针对准时频域信号的选取方法不作任何限定,只要能够实现从多个时频域信号中选取受风噪影响最小的时频域信号即可。
S103,针对频带范围内任一频带:对该频带对应的准时频域信号施加相应的增益因子;确定施加增益因子的准时频域信号的平稳噪声受到破坏;对该频带对应的准时频域信号进行平稳噪声修复。
具体地,每个频带均具有对应的增益因子。每个频带对应的增益因子可以是预设的经验值,也可以是由相干系数经过线性变换得到的。准时频域信号具有L个频带,针对每个频带对应的准时频域信号均需要进行平稳噪声检测;例如,针对任一频带,计算该频带对应的准时频域信号的平稳噪声,检测准时频域信号的平稳噪声是否受到破坏,若检测结果表征准时频域信号的平稳噪声受到了破坏,则对该频带对应的准时频域信号进行高斯白噪声填充,以实现对准时频域信号进行平稳噪声修复。
本发明实施例通过从多个时频域信号中选取受风燥影响最小的时频域信号作为准时频域信号,从而实现了在增加降噪量的同时降低语音失真;通过对准时频域信号中每个频带对应的信号施加相应的增益因子,能够对每个频带对应的准时频域信号实现风噪抑制;通过在确定施加增益因子的准时频域信号的平稳噪声受到破坏后对该频带对应的准时频域信号进行平稳噪声修复,从而能够对由于降风噪声而导致的平稳噪声损伤进行补偿,去除听感上的噪声“呼吸”现象,提高了用户的体验性。
如图2所示,为本发明又一实施例抑制风噪声的方法的流程图。本实施例是在前述实施例的基础上进一步优化得到的,该方法至少包括如下操作流程:
S201,分别获取多个声音采集设备采集的时频域信号,每个时频域信号具有相同的频带范围。
具体地,获取N个传声器采集的时频域信号,得到N个时频域信号,传声器采集的时频域信号是由传声器采集的时域信号经过短时傅立叶变换得到的;例如,N个时频域信号为X1(f,t),...,XN(f,t),其中f表示频带,t表示时间,时频域信号是时间和频带的函数。
S202,针对多个时频域信号,分别估计每个时频域信号受风噪影响最高的频带。
针对任一时频域信号,比较该时频域信号对应的功率谱与预设功率谱大小,若该功率谱大于等于预设功率谱,则基于预设功率谱计算该时频域信号受风噪影响最大的频带;若该时频域信号对应的功率谱小于预设功率谱,则基于该时频域信号对应的功率谱计算该时频域信号受风噪影响最大的频带。
由于风噪功率谱是从低频带到高频带逐渐下降的,因此基于风噪功率谱的该特性估计时频域信号包含风噪的最高频带。例如,假设第i个时频域信号对应的功率谱可表示为Pi(f,t),该时频域信号包含风噪的最高频带为li(t),则认为二者满足下条件,如式(1)所述:
Pi(f,t)≥Pthres 1≤f≤li(t)
Pi(f,t)<Pthres li(t)<f≤L 式(1);
其中Pthres是预设功率谱,是一个经验值,用于表示风吹到的频带的功率谱的最小值;li(t)在1和L之间,是一个常数。
当该时频域信号对应的功率谱Pi(f,t)小于预设功率谱Pthres,基于该时频域信号对应的功率谱Pi(f,t)计算该时频域信号受风噪影响最大的频带li(t);当功率谱Pi(f,t)大于等于预设功率谱Pthres,则基于预设功率谱Pthres计算该时频域信号受风噪影响最大的频带li(t)。在每一个时间t,计算每个时频域信号对应的li(t),N个时频域信号对应的li(t)的集合组成N维向量
Figure BDA0002752212470000061
S203,从多个估计频带选取受风噪影响最小的频带,并将所选取的频带对应的时频域信号作为准时频域信号。
例如,将
Figure BDA0002752212470000062
中最小值对应的时频域信号确定为准时频域信号。
S204,针对频带范围内任一频带:对该频带对应的准时频域信号施加相应的增益因子;确定施加增益因子的准时频域信号的平稳噪声受到破坏;对该频带对应的准时频域信号进行平稳噪声修复。
如图3所示,为本发明一实施例针对任一频带对应的准时频域信号进行平稳噪声修复的方法的流程图。本实施例是在前述实施例的基础上进一步优化得到的。针对频带范围内任一频带,平稳噪声修复的方法如下:
S301,对该频带对应的准时频域信号施加相应的增益因子。
每个频带对应一个增益因子。例如,增益因子能够通过如下方法获得:计算Xi分别和X1,...,Xi-1,Xi+1,...,XN的相干系数共N-1组,最终得到N-1组L维相干系数Cohi,j(t),1≤i≤N,1≤j≤L。对每个频带j,分别求取N-1个相干系数的最大值,得到一个L维向量
Figure BDA0002752212470000071
如式(2)所示:
Figure BDA0002752212470000072
将L维向量
Figure BDA0002752212470000073
进行变换,转换成L维向量/>
Figure BDA0002752212470000074
变换可以是但不限于如下式(3)形式:
Figure BDA0002752212470000075
Figure BDA0002752212470000076
其中,a和b是预设的参数值,比如a=1.5;b=-0.2。Gainmin是预设的常量参数值,表示增益最小值,比如Gainmin=0.1。可通过调节这三个参数来平衡降噪量和语音保真程度。
Figure BDA0002752212470000077
中的第1~li(t)个值,对应作用到第i个通道的第1~li(t)个频带,如式(4)所示:
Figure BDA0002752212470000078
S302,对准时频域信号进行平稳噪声功率谱估计。
S303,计算施加增益因子的准时频域信号对应的功率谱。
例如,对准时频域信号进行平稳噪声功率谱估计,得到平稳噪声功率谱Si(f,t)。施加增益因子的准时频域信号为Xnr(j,t),计算Xnr(j,t)对应的的功率谱为Pnr(f,t)。
S304,比较功率谱和平稳噪声功率谱的大小。
S305,若功率谱小于平稳噪声功率谱,则确定施加增益因子的准时频域信号的平稳噪声受到破坏,并对频带对应的准时频域信号进行平稳噪声修复。
利用高斯白噪声填充受损的准时频域信号平稳噪声,输出信号Xout(f,t),如式(5)所示:
Figure BDA0002752212470000081
其中,G(f,t)为期望为0,方差为1的高斯白噪声,可以用高斯随机信号生成器构造。
S306,若功率谱不小于平稳噪声功率谱,则确定施加增益因子的准时频域信号的平稳噪声没有受到破坏,并结束操作。
应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在的逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
如图4所示,为本发明一实施例的抑制风噪声的装置的示意图;该装置400包括:获取模块401,用于分别获取多个声音采集设备采集的时频域信号,每个时频域信号具有相同的频带范围;选取模块402,用于从多个时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号;平稳噪声修复模块403,用于针对频带范围内任一频带:对频带对应的准时频域信号施加相应的增益因子;确定施加增益因子的准时频域信号的平稳噪声受到破坏;对频带对应的准时频域信号进行平稳噪声修复。
在可选的实施例中,选取模块402包括:频带估计单元,用于针对多个时频域信号,分别估计每个时频域信号受风噪影响最高的频带;选取单元,用于从多个估计频带中选取受风噪影响最小的频带,并将所选取的频带对应的时频域信号作为准时频域信号。
在可选的实施例中,频带估计单元包括:频带估计子单元,用于针对任一时频域信号,比较该时频域信号对应的功率谱与预设功率谱大小,若功率谱大于等于预设功率谱,则基于预设功率谱计算该时频域信号受风噪影响最大的频带;若该时频域信号对应的功率谱小于预设功率谱,则基于该时频域信号对应的功率谱计算该时频域信号受风噪影响最大的频带。
在可选的实施例中,平稳噪声修复模块403包括:平稳噪声估计单元,用于对准时频域信号进行平稳噪声功率谱估计;计算单元,用于计算施加增益因子的准时频域信号对应的功率谱;确定单元,用于比较功率谱和平稳噪声功率谱的大小,若功率谱小于平稳噪声功率谱,则确定施加增益因子的准时频域信号的平稳噪声受到破坏。
在可选的实施例中,平稳噪声修复模块403包括:平稳噪声修复单元,用于通过对频带对应的准时频域信号进行高斯白噪声填充,以实现对准时频域信号的平稳噪声进行修复。
上述装置可执行本发明实施例所提供的抑制风噪声的方法,具备执行抑制风噪声的方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的抑制风噪声的方法。
如图5所示,为本发明实施例可以应用于其中的示例性系统架构图,该系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所产生的点击事件提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的点击数据、文本内容等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本申请实施例所提供的抑制风噪声的方法一般由服务器505执行,相应地,抑制风噪的装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现实施例的终端设备或服务器的计算机系统的结构示意图。图6示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LA多卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、系统或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括发送模块、获取模块、确定模块和第一处理模块。其中,这些模块的名称在某种情况下并不构成对该单元本身的限定,例如,发送模块还可以被描述为“向所连接的服务端发送图片获取请求的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:S101,分别获取多个声音采集设备采集的时频域信号,每个所述时频域信号具有相同的频带范围。S102,从多个所述时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号。S103,针对所述频带范围内任一频带:对所述频带对应的准时频域信号施加相应的增益因子;确定施加增益因子的准时频域信号的平稳噪声受到破坏;对所述频带对应的准时频域信号进行平稳噪声修复。
本发明实施例通过从多个时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号,由此能够降低风燥声的同时降低语音失真;通过对每个频带对应的准时频域信号施加相应的增益因子,并在确定施加增益因子的准时频域信号的平稳噪声受到破坏后,对该频带对应的准时频域信号进行平稳噪声修复,从而能够对平稳噪声进行补偿,去除听感上的噪声“呼吸”现象,提高了用户的体验性。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种抑制风噪声的方法,其特征在于,所述方法包括:
分别获取多个声音采集设备采集的时频域信号,每个所述时频域信号具有相同的频带范围;
从多个所述时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号;
针对所述频带范围内任一频带进行以下操作:对所述频带对应的准时频域信号施加相应的增益因子;确定施加增益因子的准时频域信号的平稳噪声受到破坏;对所述频带对应的准时频域信号进行平稳噪声修复。
2.根据权利要求1所述的方法,其特征在于,所述从多个所述时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号,包括:
针对多个所述时频域信号,分别估计每个所述时频域信号受风噪影响最高的频带;
从多个估计频带选取受风噪影响最小的频带,并将所选取的频带对应的时频域信号作为准时频域信号。
3.根据权利要求2所述的方法,其特征在于,所述分别估计每个所述时频域信号受风噪影响最高的频带,包括:
针对任一时频域信号,比较该时频域信号对应的功率谱与预设功率谱大小,若所述功率谱大于等于预设功率谱,则基于预设功率谱计算该时频域信号受风噪影响最大的频带;若该时频域信号对应的功率谱小于预设功率谱,则基于该时频域信号对应的功率谱计算该时频域信号受风噪影响最大的频带。
4.根据权利要求1所述的方法,其特征在于,每个频带均具有对应的增益因子,所述增益因子通过如下方法获得:
针对任一频带,分别计算该频带对应的准时频域信号与剩下每个所述时频域信号之间的相干系数,得到多个相干系数;
从所述多个相干系数中选取最大的相干系数;
对所述最大的相干系数进行线性变换,得到该频带对应的增益因子。
5.根据权利要求1所述的方法,其特征在于,所述确定施加增益因子的准时频域信号的平稳噪声受到破坏,包括:
对所述准时频域信号进行平稳噪声功率谱估计;
计算施加增益因子的准时频域信号对应的功率谱;
比较所述功率谱和所述平稳噪声功率谱的大小,若所述功率谱小于所述平稳噪声功率谱,则确定施加增益因子的准时频域信号的平稳噪声受到破坏。
6.根据权利要求1所述的方法,其特征在于,所述对所述频带对应的准时频域信号进行平稳噪声修复,包括:
通过对所述频带对应的准时频域信号进行高斯白噪声填充,以实现对所述准时频域信号进行平稳噪声修复。
7.一种抑制风噪声的装置,其特征在于,所述装置包括:
获取模块,用于分别获取多个声音采集设备采集的时频域信号,每个所述时频域信号具有相同的频带范围;
选取模块,用于从多个所述时频域信号中选取受风噪影响最小的时频域信号作为准时频域信号;
平稳噪声修复模块,用于针对所述频带范围内任一频带:对所述频带对应的准时频域信号施加相应的增益因子;确定施加增益因子的准时频域信号的平稳噪声受到破坏;对所述频带对应的准时频域信号进行平稳噪声修复。
8.根据权利要求7所述的装置,其特征在于,所述选取模块包括:
频带估计单元,用于针对多个所述时频域信号,分别估计每个所述时频域信号受风噪影响最高的频带;
选取单元,用于从多个估计频带中选取受风噪影响最小的频带,并将所选取的频带对应的时频域信号作为准时频域信号。
9.根据权利要求8所述的装置,其特征在于,所述频带估计单元包括:
频带估计子单元,用于针对任一时频域信号,比较该时频域信号对应的功率谱与预设功率谱大小,若所述功率谱大于等于预设功率谱,则基于预设功率谱计算该时频域信号受风噪影响最大的频带;若该时频域信号对应的功率谱小于预设功率谱,则基于该时频域信号对应的功率谱计算该时频域信号受风噪影响最大的频带。
10.根据权利要求7所述的装置,其特征在于,所述平稳噪声修复模块包括:
平稳噪声估计单元,用于对所述准时频域信号进行平稳噪声功率谱估计;
计算单元,用于计算施加增益因子的准时频域信号对应的功率谱;
确定单元,用于比较所述功率谱和所述平稳噪声功率谱的大小,若所述功率谱小于所述平稳噪声功率谱,则确定施加增益因子的准时频域信号的平稳噪声受到破坏。
CN202011189059.1A 2020-10-30 2020-10-30 一种抑制风噪声的方法及装置 Active CN112309418B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011189059.1A CN112309418B (zh) 2020-10-30 2020-10-30 一种抑制风噪声的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011189059.1A CN112309418B (zh) 2020-10-30 2020-10-30 一种抑制风噪声的方法及装置

Publications (2)

Publication Number Publication Date
CN112309418A CN112309418A (zh) 2021-02-02
CN112309418B true CN112309418B (zh) 2023-06-27

Family

ID=74332608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011189059.1A Active CN112309418B (zh) 2020-10-30 2020-10-30 一种抑制风噪声的方法及装置

Country Status (1)

Country Link
CN (1) CN112309418B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707170A (zh) * 2021-08-30 2021-11-26 展讯通信(上海)有限公司 风噪声抑制方法、电子设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106558315A (zh) * 2016-12-02 2017-04-05 深圳撒哈拉数据科技有限公司 异质麦克风自动增益校准方法及系统
CN108766454A (zh) * 2018-06-28 2018-11-06 浙江飞歌电子科技有限公司 一种语音噪声抑制方法及装置
CN109215677A (zh) * 2018-08-16 2019-01-15 北京声加科技有限公司 一种适用于语音和音频的风噪检测和抑制方法和装置
CN109256144A (zh) * 2018-11-20 2019-01-22 中国科学技术大学 基于集成学习与噪声感知训练的语音增强方法
CN109785853A (zh) * 2019-03-11 2019-05-21 出门问问信息科技有限公司 一种回声消除方法、装置、系统及存储介质
CN110447069A (zh) * 2017-03-22 2019-11-12 三星电子株式会社 自适应噪声环境的语音信号处理的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009044562A1 (ja) * 2007-10-04 2009-04-09 Panasonic Corporation マイクロホンを用いた雑音抽出装置
JP5528538B2 (ja) * 2010-03-09 2014-06-25 三菱電機株式会社 雑音抑圧装置
JP5875609B2 (ja) * 2012-02-10 2016-03-02 三菱電機株式会社 雑音抑圧装置
EP2765787B1 (en) * 2013-02-07 2019-12-11 Sennheiser Communications A/S A method of reducing un-correlated noise in an audio processing device
US20180293995A1 (en) * 2017-04-05 2018-10-11 Microsoft Technology Licensing, Llc Ambient noise suppression

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106558315A (zh) * 2016-12-02 2017-04-05 深圳撒哈拉数据科技有限公司 异质麦克风自动增益校准方法及系统
CN110447069A (zh) * 2017-03-22 2019-11-12 三星电子株式会社 自适应噪声环境的语音信号处理的方法和装置
CN108766454A (zh) * 2018-06-28 2018-11-06 浙江飞歌电子科技有限公司 一种语音噪声抑制方法及装置
CN109215677A (zh) * 2018-08-16 2019-01-15 北京声加科技有限公司 一种适用于语音和音频的风噪检测和抑制方法和装置
CN109256144A (zh) * 2018-11-20 2019-01-22 中国科学技术大学 基于集成学习与噪声感知训练的语音增强方法
CN109785853A (zh) * 2019-03-11 2019-05-21 出门问问信息科技有限公司 一种回声消除方法、装置、系统及存储介质

Also Published As

Publication number Publication date
CN112309418A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
EP3127114B1 (en) Situation dependent transient suppression
JP6290429B2 (ja) 音声処理システム
WO2022174727A1 (zh) 啸叫抑制方法、装置、助听器及存储介质
JP4738213B2 (ja) 利得調整方法及び利得調整装置
CN112309418B (zh) 一种抑制风噪声的方法及装置
CN112669878B (zh) 声音增益值的计算方法、装置和电子设备
CN112992190B (zh) 音频信号的处理方法、装置、电子设备和存储介质
US11699440B2 (en) System and method for data augmentation for multi-microphone signal processing
CN111986694B (zh) 基于瞬态噪声抑制的音频处理方法、装置、设备及介质
CN112307161B (zh) 用于播放音频的方法和装置
CN111370017B (zh) 一种语音增强方法、装置、系统
CN111147655B (zh) 模型生成方法和装置
CN113362839A (zh) 音频数据处理方法、装置、计算机设备及存储介质
CN111145776B (zh) 音频处理方法和装置
CN111145792B (zh) 音频处理方法和装置
CN112309420B (zh) 一种检测风噪声的方法及装置
CN111048107B (zh) 音频处理方法和装置
EP3896999A1 (en) Systems and methods for a hearing assistive device
CN111048108B (zh) 音频处理方法和装置
CN111210837B (zh) 音频处理方法和装置
CN110138991B (zh) 回音消除方法和装置
CN114267369A (zh) 一种基于均衡器的语音数据增强方法、装置及可读介质
CN106796802B (zh) 用于经由非线性衰减/增益函数来消除音乐噪声的方法和装置
CN114758671A (zh) 语音的等响度补偿方法、装置、设备及介质
CN112312258A (zh) 一种具有听力防护及听力补偿的智能耳机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant