CN110503973A

CN110503973A - 音频信号瞬态噪音抑制方法、系统以及存储介质

Info

Publication number: CN110503973A
Application number: CN201910804629.4A
Authority: CN
Inventors: 陈烈; 黄景标
Original assignee: Zhejiang Dahua Technology Co Ltd
Current assignee: Zhejiang Dahua Technology Co Ltd
Priority date: 2019-08-28
Filing date: 2019-08-28
Publication date: 2019-11-26
Anticipated expiration: 2039-08-28
Also published as: CN110503973B

Abstract

本申请提供了一种音频信号瞬态噪音抑制方法、系统以及存储介质，通过对音频信号的预处理，然后利用预处理过的音频信号在时域上计算音频信号的能量差异数据，在频域上计算音频信号的频谱差异数据；利用能量差异数据和频谱差异数据判断音频信号中是否存在瞬态噪音并对瞬态噪音进行抑制。能够有效地抑制音频信号中的嘈杂的瞬态噪音，提升语音系统的通话质量。

Description

音频信号瞬态噪音抑制方法、系统以及存储介质

技术领域

本发明涉及音频信号处理技术领域，具体是涉及一种音频信号瞬态噪音抑制方法、系统以及存储介质。

背景技术

语音是人类信息交换的主要方式，然而我们生存的环境中存在着各种各样的噪声，当我们在使用通讯设备进行语音通信时，这些噪声将严重影响语音质量。在车载系统、电话会议与多媒体会议等语音处理系统中，由于受到混响、背景噪声及干扰等因素的影响，麦克风拾取的信号通常为带噪的语音信号。这样，不仅影响语音的可懂度，而且影响语音处理系统的整体性能。因此，需要进行有效的噪声抑制，以增强语音信号的质量。

为了保证信息传递的准确性，语音系统对噪声的抑制效果将是影响该设备性能的关键因素。目前，对于类似高斯白噪声这种平稳的噪声处理已经有很多种方法能够进行成功的抑制，但是对于生活中常见的一些瞬态噪声也会严重影响语音系统性能，比如敲门声、敲桌子声、鼓掌拍击声、瓷杯碰撞声、电磁波干扰的滋滋声等等，这类噪声有个共同的特点就是突发性极强，在时域上呈振荡衰减的形式出现，持续时间在十几毫秒到上百毫秒不等，在频域上分布又很宽，所以在频域上瞬态噪声的频谱基本上都是和正常的语音的频谱混叠在一起的很难进行抑制。

发明内容

本申请为了解决音频信号中瞬态噪音影响语音系统的通话质量的技术问题，提供了一种音频信号瞬态噪音抑制方法，包括：

对音频信号进行预处理；

利用预处理后的音频信号在时域上计算音频信号的能量差异数据；

利用预处理后的音频信号在频域上计算音频信号的频谱差异数据；

利用能量差异数据和频谱差异数据判断音频信号中是否存在瞬态噪音；

若存在瞬态噪音，则对瞬态噪音进行抑制。

其中，对音频信号进行预处理的步骤包括：

对音频数据进行分帧，以获得多个音频帧；

对多个音频帧分别进行傅里叶变换，以获得音频帧所对应的频谱数据。

其中，利用预处理后的所述音频信号在时域上计算所述音频信号的能量差异数据的步骤包括：

计算每个音频帧的平均能量，并对平均能量进行均值运算，以获得音频信号的能量均值；

对平均能量和能量均值进行方差运算，进而获得能量差异数据。

其中，对平均能量和能量均值进行方差运算的步骤包括：

通过如下公式对平均能量和能量均值进行方差运算：

其中，I为能量差异数据，y_i为第i个音频帧的平均能量，为音频信号的能量均值，m为音频帧的数量。

其中，利用预处理后的音频信号在频域上计算音频信号的频谱差异数据的步骤包括：

对音频帧所对应的频谱数据进行均值估计，以获得音频信号的频谱均值；

对频谱数据和频谱均值进行方差运算，进而获得频谱差异数据。

其中，对频谱数据和频谱均值进行方差运算的步骤包括：

通过以下公式对频谱数据和频谱均值进行方差运算：

其中，J为频谱差异数据，Y_j为第j个音频帧所对应的频谱数据，为频谱均值，m为述音频帧的数量。

其中，利用能量差异数据和频谱差异数据判断音频信号中是否存在瞬态噪音的步骤包括：

分别将能量差异数据和频谱差异数据与第一能量阈值和第一频谱阈值进行比较；

若能量差异数据大于第一能量阈值且频谱差异数据大于第一频谱阈值，则判定为存在瞬态噪音。

其中，对瞬态噪音进行抑制的步骤包括：

判定瞬态噪音为强噪音还是弱噪音；

若为弱噪音，则通过音频信号进行限幅处理来抑制瞬态噪音；

若为强噪音，则通过前后帧插值方式来抑制瞬态噪音。

其中，判定瞬态噪音为强噪音还是弱噪音的步骤包括：

分别将能量差异数据和频谱差异数据与第二能量阈值和第二频谱阈值进行比较，其中第二能量阈值大于第一能量阈值，第二频谱阈值大于第一频谱阈值；

若能量差异数据大于第二能量阈值且频谱差异数据大于第二频谱阈值，则判定为强噪音。

还提供了一种音频信号瞬态噪音抑制系统，包括：

预处理模块，预处理模块接收音频信号并进行预处理；

噪音检测模块，噪音检测模块对已经预处理的音频信号在时域和频域进行处理，判断音频信号的噪音强弱；

噪音处理模块，噪音处理模块根据噪音检测模块对音频信号的噪音检测的结果进行处理；

噪音强，噪音处理模块对音频信号进行修复处理；

噪音弱，噪音处理模块对音频信号进行限幅处理；

输出模块，输出模块接收噪音处理模块处理过的音频信号进行输出。

其中，预处理包括对音频信号进行：

分帧处理，所述分帧处理所述音频信号以获得多个音频帧；

傅里叶变换处理，所述傅里叶变换处理所述音频信号以获得所述音频帧所对应的频谱数据。

还提供了一种音频信号瞬态噪音抑制系统，包括相互连接的存储器和处理器，其中，

存储器用于存储实现如上的音频信号的瞬态噪音抑制方法的程序指令；

处理器用于执行存储器存储的程序指令。

还提供了一种存储介质，存储有程序文件，程序文件能够被执行以实现如上的音频信号的瞬态噪音抑制方法。

本发明通过对音频信号的预处理，然后利用预处理过的音频信号在时域上计算音频信号的能量差异数据，在频域上计算音频信号的频谱差异数据；利用能量差异数据和频谱差异数据判断音频信号中是否存在瞬态噪音并对瞬态噪音进行抑制，能够有效地抑制音频信号中的嘈杂的瞬态噪音，提升语音系统的通话质量。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明音频信号瞬态噪音抑制方法第一实施例流程图；

图2是本发明音频信号瞬态噪音抑制方法第二实施例流程图；

图3是本发明音频信号瞬态噪音抑制系统的第一实施例的结构示意图；

图4是本发明音频信号瞬态噪音抑制系统的第二实施例的结构示意图；

图5是本发明存储介质的结构示意图。

具体实施方式

下面结合附图和实施例，对本发明作进一步的详细描述。特别指出的是，以下实施例仅用于说明本发明，但不对本发明的范围进行限定。同样的，以下实施例仅为本发明的部分实施例而非全部实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1，是本发明音频信号瞬态噪音抑制方法第一实施例流程图。

音频信号瞬态噪音抑制方法，包括：

步骤S01，对音频信号进行预处理；

在用户接收到语音信息时，很多情况下这样的音频信号会夹杂很多噪音，噪音又分为稳态噪音、瞬态噪音、起伏噪音、间歇噪声以及脉冲噪音，其中瞬态噪音对音频信号质量影响较大。在本实施例中，当用户接收到音频信号，会对该音频信号的某一时间段S内的音频信号进行预处理，通过预处理音频信号得到稳定间隔的音频帧方便在时域对该音频信号的能量数据进行计算；还能将该时间段内的每一帧的音频信号的能量数据通过变换转化成频谱数据方便在频域对该音频信号数据进行计算估计。

步骤S02，利用预处理后的音频信号在时域上计算音频信号的能量差异数据；

在音频信号经过预处理后，得到稳定间隔的音频信号，计算该时间段S内的每个音频帧的平均能量，然后利用数学方法计算出该时间段S内的能量差异数据。

步骤S03，利用预处理后的音频信号在频域上计算音频信号的频谱差异数据；

该时间段S的音频信号经过预处理将音频信号的能量数据转化成频谱数据，对该时间段S内的每一音频帧所对应的频谱数据进行均值估计，利用数学方法计算出该时间段S内的频谱差异数据。

步骤S04，利用能量差异数据和频谱差异数据判断音频信号中是否存在瞬态噪音；

将步骤S02计算获得的能量差异数据和步骤S03计算获得的频谱差异数据同预先设定好的第一能量阈值和第二频谱阈值相比较，如果能量差异数据大于第一能量阈值且频谱差异数据大于第一频谱阈值，则判定该时间段S内存在瞬态噪音。

步骤S05，若存在瞬态噪音，则对瞬态噪音进行抑制；

经步骤S04判断后，如果该时间段S内存在瞬态噪音，则利用降幅处理或者前后帧插值方式对该时间段S内的瞬态噪音进行抑制。

请参阅图2，是本发明音频信号瞬态噪音抑制方法第二实施例流程图。

音频信号瞬态噪音抑制方法，包括：

步骤S11，对音频信号进行预处理；

在用户使用手机通话过程中，或者在用户收到应用的语音信息，很多情况下这样的音频信号会夹杂很多噪音，其中，瞬态噪音对音频信号质量影响较大。在本实施例中，当用户接收到音频信号，会对该音频信号的某一时间段S内的音频信号进行预处理，其中包括分帧处理、傅里叶变换处理。分帧处理音频信号得到稳定间隔的音频帧方便在时域对该音频信号的能量数据进行计算；傅里叶变换处理将该时间段内的每一帧的音频信号的能量数据通过傅里叶变换转化成频谱数据方便在频域对该音频信号数据进行计算估计。

步骤S12，利用预处理后的音频信号在时域上计算音频信号的能量差异数据；

在音频信号经过分帧处理后、傅里叶变换处理后，得到稳定间隔的音频信号，计算每个音频帧的平均能量，并对平均能量进行均值运算，以获得音频信号的能量均值然后利用方差公式计算出该时间段S内的能量差异数据，方差公式具体为：

步骤S13，利用预处理后的音频信号在频域上计算音频信号的频谱差异数据；

该时间段S的音频信号经过傅里叶变换将音频信号的能量数据转化成频谱数据，对音频帧所对应的频谱数据进行均值估计，以获得音频信号的频谱均值对频谱数据和频谱均值进行方差运算，进而获得频谱差异数据，其中计算公式具体为：

步骤S14，能量差异数据是否大于第一能量阈值且频谱差异数据是否大于第一频谱阈值；

预先设定了第一能量阈值、第二能量阈值、第一频谱阈值和第二频谱阈值，其中第二能量阈值大于第一能量阈值，第二频谱阈值大于第一频谱阈值。

如果能量差异数据不大于第一能量阈值而且频谱差异数据不大于第一频谱阈值，或者能量差异数据大于第一能量阈值但是频谱差异数据不大于第一频谱阈值，或者能量差异数据不大于第一能量阈值但是频谱差异数据大于第一频谱阈值，则执行

步骤S141，判断该时间段内的音频信号不存在瞬态噪音。则不对音频信号进行抑制处理。

如果能量差异数据大于第一能量阈值而且频谱差异数据大于第一频谱阈值，则执行

步骤S15，能量差异数据是否大于第二能量阈值且频谱差异数据是否大于第二频谱阈值；

如果能量差异数据不大于第二能量阈值而且频谱差异数据不大于第二频谱阈值，或者能量差异数据大于第二能量阈值但是频谱差异数据不大于第二频谱阈值，或者能量差异数据不大于第二能量阈值但是频谱差异数据大于第二频谱阈值，则执行

步骤S151，通过音频信号进行限幅处理来抑制瞬态噪音；

限幅处理是动态范围控制音频信号的一种方式。音频信号有很广阔的峰值-平均值信号电平比。噪音的峰值信号会导致语音系统或者扩声系统中的设备过载，导致信号失真，音频信号质量受损。

限幅处理是设定一个幅度阈值，峰值信号大于该阈值峰值信号会自动被衰减。对于音频信号的动态范围控制非常有用，避免在音频信号中出现失真或者杂音。

如果能量差异数据大于第二能量阈值而且频谱差异数据大于第二频谱阈值，则执行

步骤S16，通过前后帧插值方式来抑制瞬态噪音；

前后帧插值方式是指在受瞬态噪音干扰音频信号帧处用与其相似的某一帧的波形进行填充修复，利用音频信号的时变特性，通过对含噪帧相邻的前后帧进行插值估计，对含噪音频帧进行修复。

请参阅图3，为本发明音频信号瞬态噪音抑制系统的第一实施例的结构示意图。音频信号瞬态噪音抑制系统1，包括：

预处理模块2，预处理模块2接收音频信号并进行预处理，其中，预处理为对音频信号进行：分帧处理音频信号以获得多个音频帧方便在时域对该音频信号的能量数据进行计算；

傅里叶变换处理，傅里叶变换处理音频信号以获得音频帧所对应的频谱数据方便在频域对该音频信号数据进行计算估计。

噪音检测模块3，噪音检测模块3对已经预处理的音频信号在时域和频域进行处理，判断音频信号的噪音强弱；

噪音处理模块4，噪音处理模块4根据噪音检测模块3对音频信号的噪音检测的结果进行处理；

噪音强，噪音处理模块对音频信号进行修复处理；

噪音弱，噪音处理模块对音频信号进行限幅处理；

输出模块5，输出模块5接收噪音处理模块4处理过的音频信号进行输出。

请参阅图4，为本发明音频信号瞬态噪音抑制系统的第二实施例的结构示意图。音频信号瞬态噪音抑制系统包括相互连接的存储器7和处理器6。

存储器7用于存储实现上述音频信号瞬态噪音抑制方法的程序指令。

处理器6用于执行存储器7存储的程序指令。

其中，处理器6还可以称为CPU(Central Processing Unit，中央处理单元)。处理器6可能是一种集成电路芯片，具有信号的处理能力。处理器6还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器7可以为内存条、TF卡等，可以存储音频信号瞬态噪音抑制系统中全部信息，包括输入的原始数据、计算机程序、中间运行结果和最终运行结果都保存在存储器7中。它根据控制器指定的位置存入和取出信息。有了存储器7，音频信号瞬态噪音抑制系统中的存储器7按用途存储器可分为主存储器(内存)和辅助存储器(外存),也有分为外部存储器和内部存储器的分类方法。外存通常是磁性介质或光盘等，能长期保存信息。内存指主板上的存储部件，用来存放当前正在执行的数据和程序，但仅用于暂时存放程序和数据，关闭电源或断电，数据会丢失。

请参阅图5，为本发明存储介质的结构示意图。本申请的存储介质存储有能够实现上述音频信号瞬态噪音抑制方法的程序文件8，其中，该程序文件8可以以软件产品的形式存储在上述存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储装置包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质，或者是计算机、服务器、手机、平板等终端设备。

本申请通过对音频信号的预处理，然后利用预处理过的音频信号在时域上计算音频信号的能量差异数据，在频域上计算音频信号的频谱差异数据；利用能量差异数据和频谱差异数据判断音频信号中是否存在瞬态噪音并对瞬态噪音进行抑制。能够有效地抑制音频信号中的嘈杂的瞬态噪音，提升语音系统的通话质量。

本发明中的术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等，如果该特定姿态发生改变时，则该方向性指示也相应地随之改变。本申请实施例中的术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或组件。

以上仅为本发明的部分实施例，并非因此限制本发明的保护范围，凡是利用本发明说明书及附图内容所作的等效装置或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种音频信号瞬态噪音抑制方法，其特征在于，包括：

对音频信号进行预处理；

利用预处理后的所述音频信号在时域上计算所述音频信号的能量差异数据；

利用预处理后的所述音频信号在频域上计算所述音频信号的频谱差异数据；

利用所述能量差异数据和所述频谱差异数据判断所述音频信号中是否存在瞬态噪音；

若存在所述瞬态噪音，则对所述瞬态噪音进行抑制。

2.根据权利要求1所述的方法，其特征在于，所述对音频信号进行预处理的步骤包括：

对所述音频数据进行分帧，以获得多个音频帧；

对所述多个音频帧分别进行傅里叶变换，以获得所述音频帧所对应的频谱数据。

3.根据权利要求2所述的方法，其特征在于，所述利用预处理后的所述音频信号在时域上计算所述音频信号的能量差异数据的步骤包括：

计算每个所述音频帧的平均能量，并对所述平均能量进行均值运算，以获得所述音频信号的能量均值；

对所述平均能量和所述能量均值进行方差运算，进而获得所述能量差异数据。

4.根据权利要求3所述的方法，其特征在于，所述对所述平均能量和所述能量均值进行方差运算的步骤包括：

通过如下公式对所述平均能量和所述能量均值进行方差运算：

其中，I为所述能量差异数据，y_i为第i个所述音频帧的平均能量，为所述音频信号的能量均值，m为所述音频帧的数量。

5.根据权利要求1所述的方法，其特征在于，所述利用预处理后的所述音频信号在频域上计算所述音频信号的频谱差异数据的步骤包括：

对所述音频帧所对应的频谱数据进行均值估计，以获得所述音频信号的频谱均值；

对所述频谱数据和所述频谱均值进行方差运算，进而获得所述频谱差异数据。

6.根据权利要求1所述的方法，其特征在于，所述对所述频谱数据和所述频谱均值进行方差运算的步骤包括：

通过以下公式对所述频谱数据和所述频谱均值进行方差运算：

其中，J为所述频谱差异数据，Y_j为第j个所述音频帧所对应的频谱数据，为所述频谱均值，m为所述述音频帧的数量。

7.根据权利要求1-6任一项所述的方法，其特征在于，所述利用所述能量差异数据和所述频谱差异数据判断所述音频信号中是否存在瞬态噪音的步骤包括：

分别将所述能量差异数据和所述频谱差异数据与第一能量阈值和第一频谱阈值进行比较；

若所述能量差异数据大于所述第一能量阈值且所述频谱差异数据大于所述第一频谱阈值，则判定为存在所述瞬态噪音。

8.根据权利要求7所述的方法，其特征在于，所述对所述瞬态噪音进行抑制的步骤包括：

判定所述瞬态噪音为强噪音还是弱噪音；

若为弱噪音，则通过所述音频信号进行限幅处理来抑制所述瞬态噪音；

若为强噪音，则通过前后帧插值方式来来抑制所述瞬态噪音。

9.根据权利要求8所述的方法，其特征在于，所述判定所述瞬态噪音为强噪音还是弱噪音的步骤包括：

分别将所述能量差异数据和所述频谱差异数据与第二能量阈值和第二频谱阈值进行比较，其中所述第二能量阈值大于所述第一能量阈值，所述第二频谱阈值大于所述第一频谱阈值；

若所述能量差异数据大于所述第二能量阈值且所述频谱差异数据大于所述第二频谱阈值，则判定为强噪音。

10.一种音频信号瞬态噪音抑制系统，其特征在于，包括：

预处理模块，所述预处理模块接收所述音频信号并进行预处理；

噪音检测模块，所述噪音检测模块对已经预处理的音频信号在时域和频域进行处理，判断所述音频信号的噪音强弱；

噪音处理模块，所述噪音处理模块根据所述噪音检测模块对所述音频信号的噪音检测的结果进行处理；

噪音强，所述噪音处理模块对所述音频信号进行修复处理；

噪音弱，所述噪音处理模块对所述音频信号进行限幅处理；

输出模块，所述输出模块接收所述噪音处理模块处理过的所述音频信号进行输出。

11.根据权利要求10所述的音频信号瞬态噪音抑制系统，其特征在于，所述预处理包括对所述音频信号进行：

分帧处理，所述分帧处理所述音频信号以获得多个音频帧；

12.一种音频信号瞬态噪音抑制系统，其特征在于，包括相互连接的存储器和处理器，其中，

所述存储器用于存储实现如权利要求1-9任意一项所述的音频信号的瞬态噪音抑制方法的程序指令；

所述处理器用于执行所述存储器存储的所述程序指令。

13.一种存储介质，其特征在于，存储有程序文件，所述程序文件能够被执行以实现如权利要求1-9任意一项所述的音频信号的瞬态噪音抑制方法。