CN109741760A - 噪声估计方法及系统 - Google Patents
噪声估计方法及系统 Download PDFInfo
- Publication number
- CN109741760A CN109741760A CN201811554601.1A CN201811554601A CN109741760A CN 109741760 A CN109741760 A CN 109741760A CN 201811554601 A CN201811554601 A CN 201811554601A CN 109741760 A CN109741760 A CN 109741760A
- Authority
- CN
- China
- Prior art keywords
- noise
- frequency
- signal
- original
- noise signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000007906 compression Methods 0.000 claims description 12
- 230000006835 compression Effects 0.000 claims description 11
- 238000013145 classification model Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 2
- 230000035772 mutation Effects 0.000 abstract 1
- 238000005192 partition Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 11
- 230000009467 reduction Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000004378 air conditioning Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000001605 fetal effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种噪声估计方法及系统,其中所述方法包括:接收带噪语音数据;提取所述带噪语音数据中的原噪声信号;根据频率划分标准,对所述原噪声信号进行压缩,得到目标噪声信号。本发明基于有限的硬件资源,能够在有效减小后续运算量的同时不会造成性能损失。进一步地,本发明可以基于经由大量数据训练的分类器,能够得到准确的噪声数据,为后续降低运算量的相关操作提供可靠的噪声预测基础。更进一步地,本发明可以根据场景噪声特性的先验知识以及准确提取的噪声信号,还能够有效地追踪到不稳定的突变噪声。
Description
技术领域
本发明涉及信号处理领域,尤其涉及一种噪声估计方法及系统。
背景技术
语音识别技术应用广泛,例如车载语音交互系统等,为了确保识别准确率,需要对音频输入的质量进行可靠的预估,并对可能干扰到后续识别处理过程的音频进行处理。例如在行驶中的汽车内采集到的语音数据会包含大量的背景噪声,容易导致相关的语音识别、动作执行以及通信质量等受到干扰,因此通常需要对接收到的音频输入信号进行降噪处理。
对于语音信号的估计,一般采用基于对数幅度谱的估计器,在高斯信号的模型假设下,对数幅度谱的均方误差最小化,从而进行针对语音信号的估计。主流的降噪处理手段包括维纳滤波方法,即假设噪声与语音信号不相关,在最小化均方误差的准则下,得到跟信噪比相关的增益,并对原始信号的各个频点乘以该增益。这样,噪声对应的频点会被消除,而语音对应的频点会保留下来。其中,求取上述增益主要通过以下三个步骤实现:噪声估计、信噪比估计以及增益估计。并且,信噪比正确与否很大程度取决于对于噪声的估计是否可靠、准确。
传统的噪声估计方法多是利用语音活性检测作为分辨基础,并在噪声段通过统计信息来进行噪声预测,但对于突变的噪声跟踪能力较差,且在低信噪比的情况下,噪声段与语音段区分不明显,无法进行有效的噪声估计。尤其是,出于整个行业对于成本的考虑,在对硬件数量和规格进行限制的前提下(使用单麦克风进行降噪运算,且使用较小的ROM和RAM芯片),为了得到良好的降噪处理结果,对降噪过程中运算的复杂度的要求较高,而前期的噪声估计过程对降噪处理运算量具有直接影响。
发明内容
本发明旨在提供一种能够降低后续处理运算量,且相比现有噪声估计手段更为可靠的噪声估计方法及系统。
本发明采用的技术方案如下:
一种噪声估计方法,包括:
接收带噪语音数据;
提取所述带噪语音数据中的原噪声信号;
根据频率划分标准,对所述原噪声信号进行压缩,得到目标噪声信号。
可选地,所述根据频率划分标准,对所述原噪声信号进行压缩包括:
根据噪声特性,确定截断频率阈值以及相应的频率分辨率;
根据所述截断频率阈值将所述原噪声信号划分为至少两个子频段;
在所述子频段按照相应的所述频率分辨率进行划分,以压缩所述原噪声信号的频点数量。
可选地,所述在所述子频段按照相应的所述频率分辨率进行划分包括:
对基于同一个所述截断频率阈值划分的子频段,高于该截断频率阈值的所述子频段采用较低的所述频率分辨率进行划分,低于该截断频率阈值的所述子频段采用较高的所述频率分辨率进行划分。
可选地,所述提取所述带噪语音数据中的原噪声信号包括:
利用预先训练的音频分类模型,从所述带噪语音数据中剔除语音信号,得到所述原噪声信号。
可选地,所述方法还包括:
利用先验知识对所述原噪声信号中的平稳噪声进行估算;
根据对平稳噪声的估算结果,求取所述原噪声信号中的突变噪声。
一种噪声估计系统,包括:
拾音模块,用于接收带噪语音数据;
噪声提取模块,用于提取所述带噪语音数据中的原噪声信号;
噪声压缩模块,用于根据频率划分标准,对所述原噪声信号进行压缩,得到目标噪声信号。
可选地,所述噪声压缩模块具体包括:
划分标准确定单元,用于根据噪声特性,确定截断频率阈值以及相应的频率分辨率;
频段划分单元,用于根据所述截断频率阈值将所述原噪声信号划分为至少两个子频段;
频率划分单元,用于在所述子频段按照相应的所述频率分辨率进行划分,以压缩所述原噪声信号的频点数量。
可选地,所述频率划分单元具体用于:
对基于同一个所述截断频率阈值划分的子频段,高于该截断频率阈值的所述子频段采用较低的所述频率分辨率进行划分,低于该截断频率阈值的所述子频段采用较高的所述频率分辨率进行划分。
可选地,所述噪声提取模块,具体用于利用预先训练的音频分类模型,从所述带噪语音数据中剔除语音信号,得到所述原噪声信号。
可选地,所述系统还包括:
平稳噪声估算模块,用于利用先验知识对所述原噪声信号中的平稳噪声进行估算;
突变噪声计算模块,用于根据对平稳噪声的估算结果,求取所述原噪声信号中的突变噪声。
本发明提出一种降低运算复杂度的噪声估计方法,通过接收带噪语音数据,从中提取到原噪声信号,再根据频率划分标准,对该原噪声信号进行压缩,从而得到目标噪声信号。本发明基于有限的硬件资源,在有效减小后续运算量的同时不会造成性能损失。
进一步地,本发明基于经由大量数据训练的分类器,能够得到准确的噪声数据,为后续降低运算量的相关操作提供可靠的噪声预测基础。
进一步地,本发明根据场景噪声特性的先验知识以及准确提取的噪声信号,还能够有效地追踪到不稳定的突变噪声。
附图说明
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步描述,其中:
图1为本发明提供的噪声估计方法的实施例的流程图;
图2为本发明提供的对原噪声信号进行频点压缩的实施例的流程图;
图3为本发明提供的噪声估计系统的方框示意图;
附图标记说明:
1拾音模块 2噪声提取模块3噪声压缩模块
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本发明提供了一种噪声估计方法的实施例,如图1所示,可以包括如下步骤:
步骤S1、接收带噪语音数据;
在实际操作中,带噪语音数据的拾取可以来自前文提及的单麦克风,并且为了下文说明方便,本发明以车载语音应用场景为例。那么此处所称带噪语音数据即是指由车载麦克风获取到车辆使用中的语音数据,其背景混杂着诸如发动机、风、路面、空调鼓风机、转向灯、车载影音设备等发出的噪声信号。本发明的目的即是针对其中的噪声进行“预处理”,得到能够减小后续降噪等操作运算量的目标噪声信号。
步骤S2、提取带噪语音数据中的原噪声信号;
作为最终获取的目标噪声的基础,该原噪声信号应保证准确性和可靠性。首先可以通过短时傅里叶变换,计算出噪声功率:
X(l,f)=S(l,f)+N(l,f)
其中,X(l,f)为带噪信号功率,S(l,f)为纯净的语音信号功率,N(l,f)为噪声信号功率,(l,f)分别是帧数和频点。并以N(l,f)作为提取目标(可以理解为理论计算值),这里所称提取也即是对输入语音数据中的噪声进行预测,因而此处所称原噪声信号是指基于前述理论目标的噪声估计。具体的预测方式将在下文中说明。
步骤S3、根据频率划分标准,对原噪声信号进行压缩,得到目标噪声信号。
基于前述得到的原噪声信号,本实施例提出采用预设的频率划分方式,对原噪声信号进行压缩处理,得到能够减少运算量的目标噪声信号,这其中所称频率划分标准可以通过模型自适应确定,也可以采用针对场景特点的映射关系获得。此外,本领域技术人员可知,减少运算量方式可以是多样的,本发明将在下文中提供一种由频率重新划分减少参与运算的频点数量的具体实施方法。
本实施例提出了一种降低运算复杂度的噪声估计方法,通过接收带噪语音数据,从中提取到原噪声信号,再根据频率划分标准,对该原噪声信号进行压缩,从而得到目标噪声信号。本实施例能够基于有限的硬件资源,在有效减小后续运算量的同时不会造成性能损失。
在一个较佳的实施示例中,本发明提供了一种根据频率划分标准,对原噪声信号进行频点压缩的具体方案,如图2所示,可以包括如下步骤:
步骤S31、根据噪声特性,确定截断频率阈值以及相应的频率分辨率;
步骤S32、根据截断频率阈值将原噪声信号划分为至少两个子频段;
步骤S33、在子频段按照相应的频率分辨率进行划分,以压缩原噪声信号的频点数量。
该较佳实施例的思路是结合语音处理应用场景,由该场景下的噪声分布特点和频率特性,确定能够划分出不同子频段的截断频率阈值,并对该频率截断阈值所划分的频段,采用不同的频率分辨率进行划分。本领域技术人员可以理解的是利用截断频率阈值对噪声信号进行划分,一般而言一个截断频率阈值会将噪声信号分成截断频率以上的子频段和截断频率以下的子频段,据此,如果采用不同的截断频率对噪声信号进行分割,则可以得到多个子频段,因此这里所称的相应的频率分辨率,是指针对分割后不同的子频段,因此应至少包括针对两个子频段(被一个截断频率阈值划分)的频率分辨率;以汽车应用场景为例,发动机所产生的噪声频率通常分布在低频,且按照均等的频率间隔分布,为了精确地消除每一频点的噪声,需要至少提供和频率分辨率相当的傅里叶变换频点个数,而如风噪、轮胎噪声等其余噪声在不同频带分布较为均匀,高频的不同频点的噪声差异不大,故可以降低高频的频率分辨率,仅仅使用较低的傅里叶变换频点个数就可以描述噪声的分布。因此,在该场景下,可以采用发动机噪声截断频率作为所述截断频率阈值,并且可以定义在该截断频率阈值以下为该场景中的低频噪声,在该截断频率阈值以上则为该场景中的高频噪声,具体关于汽车场景下的噪声分析和选择截断频率阈值的依据将在下文中具体说明,但需要在此指出的是本步骤中所称“相应的”频率分辨率是指针对不同场景下的噪声特性而言,并且所确定的该频率分辨率,基于的准则是能够使压缩后的噪声与原始噪声的误差尽量最小。
综上,对基于同一个截断频率阈值划分的子频段(也即是被划分的两个子频段),高于该截断频率阈值的子频段可以采用较低的所述频率分辨率进行划分,低于该截断频率阈值的子频段则可以采用较高的所述频率分辨率进行划分。本较佳实施例以汽车场景为例进行如下具体说明:根据车内噪声的分布特点,可以考虑将原噪声信号的频率划分为两个子频段,其中截断频率阈值fcut为前述发动机噪声截断频率,需说明,在确定该截断频率之前可以先针对发动机进行噪声预测,下文将提供相应的说明,此处不予赘述;针对大于发动机噪声截断频率阈值fcut的子频段,将傅里叶变换的精度设置为fl,针对小于发动机噪声截断频率阈值fcut的子频段,将傅里叶变换的精度设置为fh。也即是,该场景下,低频噪声优选使用较高的频率分辨率,高频噪声优选使用较低的频率分辨率,这是考虑到场景中高频噪声具有较为均匀的特性,因而可以采用“粗分”的方式,反之,截断频率下的低频噪声则可以采用“细分”的方式。当然,如前文所述,如果采用多个截断频率阈值对噪声信号进行划分,则有可能出现多于两个的子频段,那么此处所称“高频”、“低频”、“较高的频率分辨率”、“较低的频率分辨率”其中涉及的高或低,实质是根据实际划分结果的相对概念,例如利用两个截断频率阈值将一个完整噪声信号划分为三个子频段,位于中间的频段相对于三段中的高频段即为较低的频段,而其相对于三段中的低频段即为较高的频段;而对于频率分辨率的高低程度,于此同理,不再赘述。
对于上述压缩过程举例来说:本领域技术人员可以理解,常规的傅里叶变换,可以是将时域信号分段加窗,并对每一个窗内的信号进行FFT变换。假设信号采样率为8000Hz,并按512个频点执行FFT,则傅里叶变换的精度为8000/512Hz。导致在后续降噪处理中,无论是计算先验、后验信噪比,还是得到语音存在概率以及最终的增益等,始终是按512个频点进行运算。
而按照本较佳实施例,若fcut定为500Hz,那么在500Hz的子频段以下可以按照,fh为20Hz的精度分布;而在500Hz以上的子频段则可以按照,fl为2000Hz的精度分布。这样,对于前例仅需要500/20+7500/2000=29个频点的FFT,并使后续运算量减至512个频点的5.7%。如该例,按照截止频率阈值以及两个频率分辨率划分的噪声(这里相当于将原噪声信号经过一个F=f(fcut,fe_h,fe_l)映射成频点数量被压缩的“新”噪声)即为本发明所称目标噪声信号。
对于本实施例,还可以补充说明如下三点:
其一、示例中相关数据仅为示意性说明,在实际应用中根据不同的预设标准和目标,数值和结果会有所不同。
其二、本发明所提供的上述重新划分方法,对于较为平稳的噪声信号效果更为显著(如汽车场景中风噪、胎噪、发动机噪声以及持续运转的空调噪声等),且可以针对不同场景下的平稳噪声分别依据不同的截止频率阈值以及不同的频率分辨率得到各自压缩后的预测结果;但是需指出,对于突变的不平稳噪声,本发明依然适用,只是降低运算量的程度上相对平稳噪声而言略低。具体可以先对突变噪声进行更为细致的划分,原理是将一段不平稳的噪声分割为多段相对较为平稳的噪声子段,根据划分后的多个频段再确定针对其中各频段的截止频率阈值以及频率分辨率,即相对而言,在对不平稳噪声进行压缩处理时可能需要设定更多的截止频率阈值及相应的频率分辨率,但通过本方法依然能够适度地压缩频点。
其三、由上述说明可知,不同的应用场景会存在不同的噪声特性,而不同的噪声特性决定了前述截止频率阈值和相应的频率分辨率的选取,甚而,同一场景下的不同情况下的噪声也各有特点,因此为了更为有效、可靠地压缩特定场景下的原噪声信号,本实施例提出对于前述截止频率阈值以及相应的频率分辨率,并由截止频率阈值以及频率分辨率对原噪声信号进行频率划分的结果,更优选利用通过预先训练的频率划分模型实现,其中,以噪声信号作为输入,通过该频率划分模型自适应得到基于场景噪声特性的压缩结果以及所涉及的频率划分参数,这里的频率划分参数包括前述截止频率阈值以及相应的频率分辨率。在具体实施中,该模型结构可选择但不限于DNN,并且设置相应的目标函数使得经过压缩的噪声与未压缩的噪声的均方误差最小,以前述示例为基础,目标函数可以如下:
其中J为均方误差,是指提取到的原噪声信号,N(l,f)可以理解为理论计算值,fdis是与发动机噪声相关的谐波间距,需指出该目标函数是以前述发动机示例列出,其中8000和512分别指的是信号采样频率以及其对应的在整个频带上均匀分布的傅里叶变换频点个数,因此以上数据可以在针对不同场景处理时作出适应性调整。还需指出的是,该模型既适用于前述稳定的噪声,也适用于原噪声信号中的不平稳噪声,二者的处理思路相同,不再赘述。
接续前文,作为最终获取的目标噪声的基础,该原噪声信号应保证准确性和可靠性。为了实时预估噪声,1994年Martin提出可以通过最小值追踪的噪声估计方法。该方法对信号加窗,在窗内追踪信号频谱的最小值,用带噪信号的最小值来估计噪声。该通常是有偏估计,方差较大。2002年Cohen提出基于最小值控制递归平均的方法进行噪声估计,该方法利用最小值信息进行噪声谱的更新,具有快速跟踪噪声谱变化的能力。但是该方法无法避免在噪声上升区的噪声过估计和语音区的噪声过估计。由于传统的噪声估计方法均利用噪声段的统计信息来进行噪声预测,难以获得准确且细分的噪声信号,尤其在低信噪比的情况下,无法进行有效的噪声估计。因此,在另一个较佳的实施示例中,本发明提供了一种提取带噪语音数据中的原噪声信号的具体方案,即可以利用预先训练的音频分类模型,从带噪语音数据中剔除掉纯净的语音信号,得到所称原噪声信号。
同样地,可以基于DNN结构并设置目标函数为
该模型的训练目标同样可以是最小化噪声功率的均方误差,得到准确的噪声预测值。
在该模型在训练阶段,输入为带噪语音数据的功率和纯净的语音信号的功率(这里功率指的是作为特征的每个频点的功率,假如有512个频点,则输入可以是2个512维的向量,包括一个带噪语音数据功率向量和一个干净的语音信号功率向量)。测试阶段相类似并可借鉴现有技术,此处不与赘述。
在实际操作中,即可以将该分类模型作为针对带噪语音数据中每个频点的分类器M(二分类为0=语音,1=噪声)。当然,对于特例,如某个频点既包含语音又包含噪声,则根据预设权重判定该频点是0或是1。据此,将分类器M作用于带噪语音数据,得到前述原噪声信号通过该实施例,在进行后续的降噪处理中,所有相关参数(例如先验信噪比,后验信噪比,语音存在概率)都可以相应减小,从而达到减小运算量的目的。由于本发明的重点并不针对后续的处理,因此如何利用减少运算量的噪声信号进行降噪,可以结合现有技术予以实现,本发明不对此进行限定。
关于前文中提及的在某些场景中可能出现平稳噪声和突变噪声(非平稳噪声),本发明基于前述获得准确预测的原噪声信号,对如何确定准确预测的各平稳噪声,以及由该平稳噪声求取突变噪声的过程具体说明如下:
以汽车场景为例,利用车内噪声的先验知识,先对车内噪声成分进行分析。汽车相关的平稳噪声此处以发动机噪声、风噪、胎噪和空调噪声为例,而突变噪声可以是指从本车旁驶过的其他车辆噪声或者间断的下雨声、急刹车声、转向灯声等其他干扰噪声,据此,其他前述原噪声信号可表达如下:
但由于突变噪声较难直接预测,因此可以通过平稳噪声推算。具体地,估计的平稳噪声可由发动机噪声、风噪、胎噪和空调噪声加权组成:
其中,为估计的发动机噪声,为估计的风噪,为估计的胎噪,为估计的空调噪声。
1)如前所述,发动机噪声普遍存在于低频如500Hz以下,并且按照均等的频率间隔分布,谐波较为明显,谐波间距fdis与发动机转速ro相关。
故可以通过读取转速表等求取精确的谐波间距信息。最终得到的发动机噪声为各个峰值的和:
fpeak=N*fdis
其中fcut即为发动机噪声的截断频率,是估计的发动机噪声的峰值功率。经分析,基于发动机噪声的特点,为了精确的消除噪声,应至少提供相对较多的FFT个数,故而可以通过提升频率分辨率,以获得足以匹配的频点数。
2)风噪取决于车体的设计,汽车厂商为了减小耗油量,会尽量减小空气阻力,使得风噪仅在高速行驶时才出现。风噪受到车速的影响较大,故可以将车速划分为几个级别,并对不同级别的风噪进行实验记录,对于不同的发动机转速v,对应某一级别的风噪可如下:
经分析,风躁在不同频带分布较为均匀,高频(如大于500Hz)的不同频点的噪声差异不大,故可以降低高频的频率分辨率,仅仅使用较低个数的FFT就足以描述风噪的分布。
3)当轮胎与路面接触时会发生胎噪,胎噪的大小取决于路面和轮胎表面结构及相对速度。当路面变化时,在胎噪的频谱变化较小(一般仅十几分贝);并且已知型号的汽车在不同路面的参数,可以通过车速计算出胎噪:
其中K为路面参数,v0为初始速度。经分析,胎躁在不同频带分布同样较为均匀,且高频的噪声衰减较大,故可以通过降低高频的频率分辨率,仅仅使用较低个数的FFT就足以描述胎噪的分布。
4)车内还存在空调噪声,由于空调的出风口可能离麦克风等拾音设备较近,因此相对于其他噪声源,该空调噪声占麦克风接收到的噪声大部分。特别是空调的风速为较高档的时候,该噪声明显高于其余噪声。因此,空调噪声可根据不同的风速档位得到:
其中g为对应的风速档位。
综上所述,对于不同来源的平稳噪声,可以通过先验知识通过相应的表达式求取,并融合为整体的平稳噪声
这里需补充的是,本发明的设计思路是为了对原噪声信号进行压缩提供可靠依据,在特定场景下可以利用前述分类模型提取到准确的原噪声信号,并对其中便于追踪的平稳噪声进行分析,从而掌握场景中的噪声分布以及变化规律,也即是分析出用于对原噪声信号进行划分的频率划分标准(前述关于平稳噪声的分析以及相应的划分规则同样适用于非平稳噪声),这也是为前述频率划分模型构建训练数据、测试数据的基础;与此同时,由于存在准确预测的原噪声信号,因而当面对随机的、突变的不平稳噪声处理时,还可以再次结合前述对平稳噪声的分析,获取到关于平稳噪声的先验知识,再将所述平稳噪声从分类后获得的准确的原噪声信号中排除,即可以追踪到难以预测的突变噪声
其中,M*X(l,f)即是结合了前文中提及的分类模型M,从带噪语音数据将原噪声信号提取出来:
综上所述,本发明提出了一种降低运算复杂度的噪声估计方法,通过接收带噪语音数据,从中提取到原噪声信号,再根据频率划分标准,对该原噪声信号进行压缩,从而得到目标噪声信号。本发明基于有限的硬件资源,在有效减小后续运算量的同时不会造成性能损失。
进一步地,本发明基于经由大量数据训练的分类模型,能够得到准确的原噪声数据,为后续降低运算量的相关操作提供可靠的噪声预测基础。
进一步地,本发明根据场景噪声特性的先验知识以及准确提取的原噪声数据,还能够有效地追踪到不稳定的突发噪声。相应于前述各实施例及优选方案,本发明还提供了一种噪声估计系统,如图3所示,该系统可以包括至少一个用于存储相关指令的存储器以及至少一个与所述存储器连接并用于执行下述各模块的处理器(在其他实施例中一个或多个处理器也可以直接执行相应的步骤动作,而无需通过下述模块执行,例如处理器直接执行接收语音、噪声提取、噪声压缩等操作):
拾音模块1,用于接收带噪语音数据;
噪声提取模块2,用于提取所述带噪语音数据中的原噪声信号;
噪声压缩模块3,用于根据频率划分标准,对所述原噪声信号进行压缩,得到目标噪声信号。
进一步地,所述噪声压缩模块具体包括:
划分标准确定单元,用于根据噪声特性,确定截断频率阈值以及相应的频率分辨率;
频段划分单元,用于根据所述截断频率阈值将所述原噪声信号划分为至少两个子频段;
频率划分单元,用于在所述子频段按照相应的所述频率分辨率进行划分,以压缩所述原噪声信号的频点数量。
进一步地,所述频率划分单元具体用于:
对基于同一个所述截断频率阈值划分的子频段,高于该截断频率阈值的所述子频段采用较低的所述频率分辨率进行划分,低于该截断频率阈值的所述子频段采用较高的所述频率分辨率进行划分。进一步地,所述噪声提取模块,具体用于利用预先训练的音频分类模型,从所述带噪语音数据中剔除语音信号,得到所述原噪声信号。
进一步地,所述系统还包括:
平稳噪声估算模块,用于利用先验知识对所述原噪声信号中的平稳噪声进行估算;
突变噪声计算模块,用于根据对平稳噪声的估算结果,求取所述原噪声信号中的突变噪声。
虽然上述系统实施例及优选方案的工作方式以及技术原理皆记载于前文,但仍需指出的是,本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,也可以把它们分成多个子模块或子单元或子组件予以实施。
以及,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上依据图式所示的实施例详细说明了本发明的构造、特征及作用效果,但以上仅为本发明的较佳实施例,需要言明的是,上述实施例及其优选方式所涉及的技术特征,本领域技术人员可以在不脱离、不改变本发明的设计思路以及技术效果的前提下,合理地组合搭配成多种等效方案;因此,本发明不以图面所示限定实施范围,凡是依照本发明的构想所作的改变,或修改为等同变化的等效实施例,仍未超出说明书与图示所涵盖的精神时,均应在本发明的保护范围内。
Claims (10)
1.一种噪声估计方法,其特征在于,包括:
接收带噪语音数据;
提取所述带噪语音数据中的原噪声信号;
根据频率划分标准,对所述原噪声信号进行压缩,得到目标噪声信号。
2.根据权利要求1所述的噪声估计方法,其特征在于,所述根据频率划分标准,对所述原噪声信号进行压缩包括:
根据噪声特性,确定截断频率阈值以及相应的频率分辨率;
根据所述截断频率阈值将所述原噪声信号划分为至少两个子频段;
在所述子频段按照相应的所述频率分辨率进行划分,以压缩所述原噪声信号的频点数量。
3.根据权利要求2所述的噪声估计方法,其特征在于,所述在所述子频段按照相应的所述频率分辨率进行划分包括:
对基于同一个所述截断频率阈值划分的子频段,高于该截断频率阈值的所述子频段采用较低的所述频率分辨率进行划分,低于该截断频率阈值的所述子频段采用较高的所述频率分辨率进行划分。
4.根据权利要求1所述的噪声估计方法,其特征在于,所述提取所述带噪语音数据中的原噪声信号包括:
利用预先训练的音频分类模型,从所述带噪语音数据中剔除语音信号,得到所述原噪声信号。
5.根据权利要求4所述的噪声估计方法,其特征在于,所述方法还包括:
利用先验知识对所述原噪声信号中的平稳噪声进行估算;
根据对平稳噪声的估算结果,求取所述原噪声信号中的突变噪声。
6.一种噪声估计系统,其特征在于,包括:
拾音模块,用于接收带噪语音数据;
噪声提取模块,用于提取所述带噪语音数据中的原噪声信号;
噪声压缩模块,用于根据频率划分标准,对所述原噪声信号进行压缩,得到目标噪声信号。
7.根据权利要求6所述的噪声估计系统,其特征在于,所述噪声压缩模块具体包括:
划分标准确定单元,用于根据噪声特性,确定截断频率阈值以及相应的频率分辨率;
频段划分单元,用于根据所述截断频率阈值将所述原噪声信号划分为至少两个子频段;
频率划分单元,用于在所述子频段按照相应的所述频率分辨率进行划分,以压缩所述原噪声信号的频点数量。
8.根据权利要求7所述的噪声估计系统,其特征在于,所述频率划分单元具体用于:
对基于同一个所述截断频率阈值划分的子频段,高于该截断频率阈值的所述子频段采用较低的所述频率分辨率进行划分,低于该截断频率阈值的所述子频段采用较高的所述频率分辨率进行划分。
9.根据权利要求6所述的噪声估计系统,其特征在于,所述噪声提取模块,具体用于利用预先训练的音频分类模型,从所述带噪语音数据中剔除语音信号,得到所述原噪声信号。
10.根据权利要求9所述的噪声估计系统,其特征在于,所述系统还包括:
平稳噪声估算模块,用于利用先验知识对所述原噪声信号中的平稳噪声进行估算;
突变噪声计算模块,用于根据对平稳噪声的估算结果,求取所述原噪声信号中的突变噪声。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811554601.1A CN109741760B (zh) | 2018-12-18 | 2018-12-18 | 噪声估计方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811554601.1A CN109741760B (zh) | 2018-12-18 | 2018-12-18 | 噪声估计方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109741760A true CN109741760A (zh) | 2019-05-10 |
CN109741760B CN109741760B (zh) | 2020-12-22 |
Family
ID=66360565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811554601.1A Active CN109741760B (zh) | 2018-12-18 | 2018-12-18 | 噪声估计方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109741760B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111105810A (zh) * | 2019-12-27 | 2020-05-05 | 西安讯飞超脑信息科技有限公司 | 一种噪声估计方法、装置、设备及可读存储介质 |
CN111883164A (zh) * | 2020-06-22 | 2020-11-03 | 北京达佳互联信息技术有限公司 | 模型训练方法、装置、电子设备及存储介质 |
CN112413859A (zh) * | 2020-11-24 | 2021-02-26 | 珠海格力电器股份有限公司 | 空调器控制方法、装置、空调器及存储介质 |
US20220352997A1 (en) * | 2019-09-18 | 2022-11-03 | Zte Corporation | Interference simulation system, method and apparatus, interference test system, method and apparatus, and computer readable storage medium |
CN118471246A (zh) * | 2024-07-09 | 2024-08-09 | 杭州知聊信息技术有限公司 | 基于人工智能的音频分析降噪方法、系统及存储介质 |
CN118609535A (zh) * | 2024-08-08 | 2024-09-06 | 宁波方太厨具有限公司 | 主动降噪系统及其异音检测方法、装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1971711A (zh) * | 2005-06-28 | 2007-05-30 | 哈曼贝克自动系统-威美科公司 | 语音信号自适应增强系统 |
CN101071567A (zh) * | 2006-05-12 | 2007-11-14 | Qnx软件操作系统(威美科)有限公司 | 鲁棒噪声估计 |
CN103871418A (zh) * | 2014-03-06 | 2014-06-18 | 北京飞利信电子技术有限公司 | 一种扩声系统啸叫频点的检测方法及装置 |
US20170358314A1 (en) * | 2016-06-10 | 2017-12-14 | Apple Inc. | Noise detection and removal systems, and related methods |
CN108831497A (zh) * | 2018-05-22 | 2018-11-16 | 出门问问信息科技有限公司 | 一种回声压缩方法及装置、存储介质、电子设备 |
-
2018
- 2018-12-18 CN CN201811554601.1A patent/CN109741760B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1971711A (zh) * | 2005-06-28 | 2007-05-30 | 哈曼贝克自动系统-威美科公司 | 语音信号自适应增强系统 |
CN101071567A (zh) * | 2006-05-12 | 2007-11-14 | Qnx软件操作系统(威美科)有限公司 | 鲁棒噪声估计 |
CN103871418A (zh) * | 2014-03-06 | 2014-06-18 | 北京飞利信电子技术有限公司 | 一种扩声系统啸叫频点的检测方法及装置 |
US20170358314A1 (en) * | 2016-06-10 | 2017-12-14 | Apple Inc. | Noise detection and removal systems, and related methods |
CN108831497A (zh) * | 2018-05-22 | 2018-11-16 | 出门问问信息科技有限公司 | 一种回声压缩方法及装置、存储介质、电子设备 |
Non-Patent Citations (2)
Title |
---|
D.V. ANDERSON等: ""Audio signal noise reduction using multi-resolution sinusoidal modeling"", 《1999 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING》 * |
范树凯: ""非线性调频信号的时频分析及其应用"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220352997A1 (en) * | 2019-09-18 | 2022-11-03 | Zte Corporation | Interference simulation system, method and apparatus, interference test system, method and apparatus, and computer readable storage medium |
CN111105810A (zh) * | 2019-12-27 | 2020-05-05 | 西安讯飞超脑信息科技有限公司 | 一种噪声估计方法、装置、设备及可读存储介质 |
CN111105810B (zh) * | 2019-12-27 | 2022-09-06 | 西安讯飞超脑信息科技有限公司 | 一种噪声估计方法、装置、设备及可读存储介质 |
CN111883164A (zh) * | 2020-06-22 | 2020-11-03 | 北京达佳互联信息技术有限公司 | 模型训练方法、装置、电子设备及存储介质 |
CN111883164B (zh) * | 2020-06-22 | 2023-11-03 | 北京达佳互联信息技术有限公司 | 模型训练方法、装置、电子设备及存储介质 |
CN112413859A (zh) * | 2020-11-24 | 2021-02-26 | 珠海格力电器股份有限公司 | 空调器控制方法、装置、空调器及存储介质 |
CN112413859B (zh) * | 2020-11-24 | 2021-11-16 | 珠海格力电器股份有限公司 | 空调器控制方法、装置、空调器及存储介质 |
CN118471246A (zh) * | 2024-07-09 | 2024-08-09 | 杭州知聊信息技术有限公司 | 基于人工智能的音频分析降噪方法、系统及存储介质 |
CN118609535A (zh) * | 2024-08-08 | 2024-09-06 | 宁波方太厨具有限公司 | 主动降噪系统及其异音检测方法、装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109741760B (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109741760B (zh) | 噪声估计方法及系统 | |
CN110197670B (zh) | 音频降噪方法、装置及电子设备 | |
KR102487160B1 (ko) | 정량적 신호 대 노이즈비 분석 및 적응형 위너 필터링에 기초한 오디오 신호 품질 향상 방법 | |
US7492814B1 (en) | Method of removing noise and interference from signal using peak picking | |
CN108831499A (zh) | 利用语音存在概率的语音增强方法 | |
US7676046B1 (en) | Method of removing noise and interference from signal | |
US20060031067A1 (en) | Sound input device | |
CN110706693B (zh) | 语音端点的确定方法及装置、存储介质、电子装置 | |
Gerkmann et al. | Empirical distributions of DFT-domain speech coefficients based on estimated speech variances | |
CN106504760B (zh) | 宽频带背景噪声与语音分离检测系统及方法 | |
CN103544961A (zh) | 语音信号处理方法及装置 | |
JP3459363B2 (ja) | 雑音低減処理方法、その装置及びプログラム記憶媒体 | |
CN107045874A (zh) | 一种基于相关性的非线性语音增强方法 | |
Liang et al. | A rattle signal denoising and enhancing method based on wavelet packet decomposition and mathematical morphology filter for vehicle | |
US10043531B1 (en) | Method and audio noise suppressor using MinMax follower to estimate noise | |
KR20160116440A (ko) | 음성인식 시스템의 신호대잡음비 추정 장치 및 방법 | |
JP2003271166A (ja) | 入力信号処理方法および入力信号処理装置 | |
KR101811635B1 (ko) | 스테레오 채널 잡음 제거 장치 및 방법 | |
CN114724573A (zh) | 一种啸叫抑制方法、装置、计算机可读存储介质以及系统 | |
CN115064182A (zh) | 自适应梅尔滤波器在强噪声环境下风机故障特征识别方法 | |
Bai et al. | Two-pass quantile based noise spectrum estimation | |
CN107910016A (zh) | 一种带噪语音的噪声可容度判断方法 | |
Upadhyay et al. | Single channel speech enhancement utilizing iterative processing of multi-band spectral subtraction algorithm | |
Lim et al. | Acoustic blur kernel with sliding window for blind estimation of reverberation time | |
CN109599118A (zh) | 一种鲁棒性的回放语音检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |