CN108062959B

CN108062959B - 一种声音降噪方法及装置

Info

Publication number: CN108062959B
Application number: CN201610979542.7A
Authority: CN
Inventors: 陈展; 杨茜; 任烨
Original assignee: Hangzhou Hikvision Digital Technology Co Ltd
Current assignee: Hangzhou Hikvision Digital Technology Co Ltd
Priority date: 2016-11-08
Filing date: 2016-11-08
Publication date: 2021-04-02
Anticipated expiration: 2036-11-08
Also published as: CN108062959A

Abstract

本申请实施例提供了一种声音降噪方法及装置，涉及音频处理技术领域。所述方法包括：获取当前采样点的第一声音数据；获取第二声音数据，其中，第二声音数据为第二采样时刻采集的数据，第二采样时刻为第一采样时刻之前、与第一采样时刻最接近的预设数量个采样时刻，第一采样时刻为第一声音数据对应的采样时刻；根据第二声音数据，对第一声音数据进行滑动平滑处理；将处理后的采样数据，确定为所述第一声音数据降噪后的数据。应用本实施例的技术方案，能够从声音信号中去除突变型噪声，提高声音的品质。

Description

一种声音降噪方法及装置

技术领域

本申请涉及音频处理技术领域，特别涉及一种声音降噪方法及装置。

背景技术

当音频采集设备采集声音信号时，容易受到周围环境因素的影响，使采集的声音信号包含噪声，影响声音的品质。这些噪声的来源很多，包括设备干扰和电磁干扰等，例如，电机转动产生的噪声和电磁信号干扰产生的噪声。所产生的噪声也可以分为很多种类型，其中可以包括声音的能量峰值不大、能量变化比较缓慢、持续时间较长的平稳型噪声，也可以包括能量峰值很大、能量变化很大、持续时间很短的突变型噪声。图1为携带噪声的语音数据的一种时域图，其中既包含突变型噪声，又包含平稳型噪声。

现有技术中，常常采用谱减法降低声音信号中的噪声，其具体过程为：采集原始声音信号，默认该原始声音信号是目标声音信号与噪声信号的叠加，获取原始声音信号的原始频谱，从该原始频谱中减去预设噪声频谱，然后根据减去预设噪声频谱的原始频谱获得降噪后的声音信号。由于噪声通常是长期存在于环境中的，因此可以在无目标声音信号的情况下采集噪声样本，根据采集到的样本获取预设噪声频谱。

通常，噪声可以划分为平稳性噪声和突变型噪声两种。

其中，平稳型噪声具有比较明显的频谱特征，而突变型噪声不具有明显的频谱特征，所以当采集的噪声样本中即包含平稳型噪声又包含突变型噪声时，很难从噪声样本中获取到突变型噪声的频谱，例如，图2为主要携带突变型噪声的语音数据的一种频域图，从图中可以看出突变型噪声分布很密集，没有明显的频率特性，无法估计出突变型噪声的频谱。

综合以上，平稳型噪声的频谱特征比较突出，应用上述方式对声音信号降噪时，能够较好地去除平稳型噪声，但是难以去除突变型噪声，进而易导致降噪后声音品质低。

发明内容

本申请实施例的目的在于提供了一种声音降噪方法及装置，能够从声音信号中去除突变型噪声，提高声音的品质。

为了达到上述目的，本申请公开了一种声音降噪方法，所述方法包括：

获取当前采样点的第一声音数据；

获取第二声音数据，其中，所述第二声音数据为：第二采样时刻采集的数据，所述第二采样时刻为：第一采样时刻之前、与所述第一采样时刻最接近的预设数量个采样时刻；所述第一采样时刻为所述第一声音数据对应的采样时刻；

根据所述第二声音数据，对所述第一声音数据进行滑动平滑处理；

将处理后的采样数据，确定为所述第一声音数据降噪后的数据。

可选的，所述根据所述第二声音数据，对所述第一声音数据进行滑动平滑处理的步骤，包括：

按照以下公式，对所述第一声音数据进行处理：

其中，所述pcm(i)′为处理后的第一声音数据，所述N为所述预设数量，所述pcm(i-j)为：第(i-j)采样时刻采集的声音数据，所述i为所述第一采样时刻，所述j为采样时刻偏移量，所述a(j)为预设的第j个滑动平滑系数。

可选的，所述a(j)为：

可选的，所述预设数量采用以下方式确定：

获得声音采集设备的采样率，将所述采样率与预设值的乘积确定为预设数量。

可选的，所述将处理后的采样数据，确定为所述第一声音数据降噪后的数据的步骤，包括：

根据谱减法，对处理后的采样数据进行二次降噪处理，得到所述第一声音数据降噪后的数据。

为了达到上述目的，本申请公开了一种声音降噪装置，所述装置包括：

第一获取模块，用于获取当前采样点的第一声音数据；

第二获取模块，用于获取第二声音数据，其中，所述第二声音数据为：第二采样时刻采集的数据，所述第二采样时刻为：第一采样时刻之前、与所述第一采样时刻最接近的预设数量个采样时刻；所述第一采样时刻为所述第一声音数据对应的采样时刻；

平滑处理模块，用于根据所述第二声音数据，对所述第一声音数据进行滑动平滑处理；

数据确定模块，用于将处理后的采样数据，确定为所述第一声音数据降噪后的数据。

可选的，所述平滑处理模块，具体用于：

按照以下公式，对所述第一声音数据进行处理：

可选的，所述a(j)为：

可选的，所述装置还包括数量确定模块，用于采用以下方式确定所述预设数量：

可选的，所述数据确定模块，具体用于：

由上述技术方案可见，本申请实施例中，作为执行主体的电子设备在获取当前采样点的第一声音数据之后，对该第一声音数据进行降噪处理。具体的，获取第二声音数据，根据第二声音数据对第一声音数据进行滑动平滑处理，得到第一声音数据降噪后的数据，其中，第二声音数据为第二采样时刻采集的数据，第二采样时刻为第一采样时刻之前、与第一采样时刻最接近的预设数量个采样时刻，第一采样时刻为第一声音数据对应的采用时刻。

也就是说，本申请实施例中，根据当前采样点之前、与当前采样点最接近的预设数量个采样点的声音数据，对当前采样点的声音数据进行滑动平滑处理，实现对当前采样点的声音数据的降噪处理。由于针对获取到的一系列声音数据，在预设数量个声音数据所表示的区间上，声音数据的变化是平稳的，这个区间的数据的平均值是常量，将该区间的均值作为该区间端点的声音数据，能够消除突变数据的成分，因此应用本申请实施例的技术方案，能够从声音信号中去除突变型噪声，提高声音的品质。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为携带噪声的语音数据的一种时域图；

图2为主要携带突变型噪声的语音数据的一种频域图；

图3为本申请实施例提供的声音降噪方法的一种流程示意图；

图4a为包含突变型噪声的声音信号的一种波形图；

图4b为图4a中的声音信号的另一种波形图；

图4c为采用本申请实施例提供的声音降噪方法处理之前和之后的声音波形的一种对比图；

图4d为图4c中所示的声音波形的另一种对比图；

图5为本申请实施例提供的声音降噪装置的一种结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整的描述。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供了一种声音降噪方法及装置，能够从声音信号中去除突变型噪声，提高声音的品质。本申请实施例可以应用于电子设备，该电子设备可以包括移动通信类设备、个人计算机类设备、便携娱乐类设备或服务器等，例如，移动通信类设备中的智能手机、多媒体手机等，个人计算机类设备中的笔记本电脑、平板电脑等，便携娱乐类设备中的游戏机、智能玩具等。

下面通过具体实施例，对本申请进行详细说明。

图3为本申请实施例提供的声音降噪方法的一种流程示意图，应用于电子设备。

需要说明的是，根据噪声的特征，可以将噪声分为平稳型噪声和突变型噪声两种。平稳型噪声的能量峰值不大，能量变化比较缓慢，持续时间较长，具有比较明显的频谱特征。突变型噪声的能量峰值很大、能量变化很大、持续时间很短，不具有比较明显的频谱特征。

图4a为包含突变噪声的声音信号波形图，其横轴为时间，纵轴为能量。图4a中能量峰值突变的部分即为突变型噪声出现的位置，从图中可以看出，其中的突变噪声是一个非常短促的脉冲信号。图4b为图4a中的波形图横轴缩小后的波形图，其中白色部分为突变噪声出现时的声音信号，可以看出这部分声音信号的波形变化剧烈，其他部分声音信号的波形变化平稳。目前，现有的降噪算法无法处理这种突变型噪声。

本实施例中的声音降噪方法具体包括如下步骤：

步骤S301：获取当前采样点的第一声音数据。

其中，作为执行主体的电子设备内部可以包含声音采集设备，也可以不包含声音采集设备。

具体的，当作为执行主体的电子设备内部包含声音采集设备时，电子设备在获取当前采样点的第一声音数据时，可以包括：接收声音采集设备采集的当前采样点的第一声音数据。

当作为执行主体的电子设备内部不包含声音采集设备时，该电子设备可以与外部的声音采集设备相连，电子设备在获取当前采样点的第一声音数据时，可以包括：获取声音采集设备采集的当前采样点的第一声音数据。

获取的第一声音数据可以是声音采集设备实时采集的，也可以不是实时采集的，而是声音采集设备预先采集好之后存储起来的。

步骤S302：获取第二声音数据。其中，第二声音数据为：第二采样时刻采集的数据，第二采样时刻为：第一采样时刻之前、与第一采样时刻最接近的预设数量个采样时刻；第一采样时刻为第一声音数据对应的采样时刻。

例如，第一采样时刻为t1＝100，第一声音数据为pcm(100)，预设数量为100，采样间隔时间为1，则第二采样时刻包括以下时刻：t2＝99，98，97，96，……，2，1，0。各个第二采样时刻对应的第二声音数据包括：pcm(99)pcm(98)pcm(97)pcm(96)，……，pcm(2)，pcm(1)，pcm(0)。

其中，由第一采样时刻和所有第二采样时刻组成的时长可以称为帧长。例如，上例中，第一采样时刻为t1＝100，第二采样时刻包括t2＝99，98，97，96，……，2，1，0，因此，对应的帧长为t1+t2，即100。

因此，本实施例的平滑处理过程可以理解为，以一个帧长为平滑处理的时间单位，对声音数据逐渐做平滑处理。

预设数量可以是预先获得后保存起来的。

作为一种具体的实施方式，上述预设数量可以采用以下方式确定：获得声音采集设备的采样率，将所述采样率与预设值的乘积确定为预设数量。

其中，声音采集设备的采样率为音频采样率，表示每秒从连续信号中提取并组成离散信号的采样点的个数，常常用单位赫兹(Hz)来表示，一般常用的采样率值包括：8000Hz，16000Hz，32000Hz，44100Hz，48000Hz。

预设值即为上述帧长，通常可以取为0.04s或0.02s等值。当预设值取为0.04s时，采样率为8000Hz时，对应的预设数量为0.04s*8000Hz＝320；采样率为16000Hz时，对应的预设数量为0.04s*16000Hz＝640。

预设值的取值可以根据实际情况来确定，例如根据突变程度来实际调整。当预设数量越大时，做滑动平滑处理时需要的相邻数据越多，尽管平滑作用较大，有利于消除突变数据成分，但是也会使声音失真过多。当预设数量较小时，无法消除突变数据成分，降噪效果差。因此，合适的预设数量能够平衡降噪效果和声音品质这两个指标达到最优。

需要说明的是，上述各个第二声音数据是经过了本实施例中声音降噪方法处理后的数据。

步骤S303：根据第二声音数据，对第一声音数据进行滑动平滑处理。

需要说明的是，在对声音数据进行滑动平滑处理时，若当前采样点变为下一个采样点，则对应的第二声音数据也随之改变，即增加当前采样点的第一声音数据，减少采样时刻距离第一采样时刻最远的一个采样点的声音数据。

具体的，根据第二声音数据，对第一声音数据进行滑动平滑处理，可以包括多种实施方式：可以采用算术平均规则，计算第一声音数据和第二声音数据的算术平均值，将该算术平均值确定为第一声音数据处理后的声音数据。

也可以是，采用加权算术平均规则，计算第一声音数据和第二声音数据的算术平均值，将该算术平均值确定为第一声音数据处理后的声音数据。其中，每个声音数据的权重值可以根据预设规则确定，例如，可以按照每个声音数据与第一声音数据的采样时刻的偏移量确定权重值。

步骤S304：将处理后的采样数据，确定为第一声音数据降噪后的数据。

需要说明的是，本实施例的声音降噪方法主要针对突变型噪声进行降噪。经过步骤S303的滑动平滑处理后，第一声音数据中的突变噪声的成分能够被处理掉。但是，第一声音数据中可能还包含平稳型噪声成分。

因此，为了进一步提高声音品质，还可以对经过滑动平滑处理后的采样数据进行谱减法处理，以降低声音信号中的平稳型噪声。

作为另一种实施方式，步骤S304还可以包括：根据谱减法，对处理后的采样数据进行二次降噪处理，得到第一声音数据降噪后的数据。

需要指出的是，根据谱减法对声音信号进行处理属于现有技术，其具体过程不再赘述。

由上述内容可知，本实施例中，作为执行主体的电子设备在获取当前采样点的第一声音数据之后，对该第一声音数据进行降噪处理。具体的，获取第二声音数据，根据第二声音数据对第一声音数据进行滑动平滑处理，得到第一声音数据降噪后的数据，其中，第二声音数据为第二采样时刻采集的数据，第二采样时刻为第一采样时刻之前、与第一采样时刻最接近的预设数量个采样时刻，第一采样时刻为第一声音数据对应的采用时刻。

也就是说，本实施例中，根据当前采样点之前、与当前采样点最接近的预设数量个采样点的声音数据，对当前采样点的声音数据进行滑动平滑处理，实现对当前采样点的声音数据的降噪处理。由于针对获取到的一系列声音数据，在预设数量个声音数据所表示的区间上，声音数据的变化是平稳的，这个区间的数据的平均值是常量，将该区间的均值作为该区间端点的声音数据，能够消除突变数据的成分，该突变数据就是突变噪声对应的数据，因此应用本实施例的技术方案，能够从声音信号中去除突变型噪声，提高声音的品质。

另外，需要说明的是，不包含噪声的声音信号的波形一般是平稳上升或平稳下降的，对于其中的一个声音数据来说，该声音数据前方、距离该声音数据越近的声音数据与该声音数据的相关性越大，因此，利用该特征，在对该声音数据做滑动平滑处理时，可以对用来做滑动平滑处理的各个声音数据赋以不同的权重值，从而减少滑动平滑处理对该声音数据的影响，提高声音的品质。

因此，基于图3所示实施例的另一中实施方式中，步骤S303，根据第二声音数据，对第一声音数据进行滑动平滑处理的步骤，具体可以包括：

按照以下公式，对第一声音数据进行处理：

其中，所述pcm(i)′为处理后的第一声音数据，所述N为所述预设数量，所述pcm(i-j)为：第(i-j)采样时刻采集的声音数据，所述i为所述第一采样时刻，所述j为采样时刻偏移量，当j取0时，所述pcm(i-j)为所述第一声音数据，当j不取0时，所述pcm(i-j)为所述第一声音数据之前的第j个第二声音数据，所述a(j)为预设的第j个滑动平滑系数。a(j)即为每个声音数据的权重值。

作为一种具体的实施方式，所述权重值a(j)可以为：线性平滑系数

可见，当j取值越小时，表示pcm(i-j)约接近pcm(i)，对应的，pcm(i-j)的权重值a(j)越大，即表示采样时刻与第一采样时刻越接近的第二采样数据，其权重值越大。而且在本实施方式中a(j)是线性变化的。

当然，滑动平滑系数a(j)也可以取指数平滑系数。

下面通过一个具体实例对本申请的技术效果再做详细说明。

图4c为采用本申请实施例提供的声音降噪方法之前和之后的声音波形对比图。图4c中的上图为原始的声音数据，即降噪处理之前的波形图，可以看出，其中既包含突变型噪声，也包含平稳型噪声。对该原始的声音数据进行降噪过程时，滑动平滑系数采用线性平滑系数，预设值采用0.04s。经过滑动平滑处理之后，又采用谱减法对平滑处理后的声音数据进行二次降噪处理，最终得到了图4c下图中的降噪结果。

图4c的下图为降噪处理之后的波形图，上下两幅图经过对比可以发现，经过降噪处理后，声音信号变得非常干净、清晰。

为了使结果更易于看出降噪效果，本申请对图4c中的横轴进行了缩小处理，得到图4d所示的上下两幅图，图4d的上图与图4c中的上图对应，图4d中的下图与图4c中的下图对应。可以明显看出，降噪处理后突变噪声基本都消失了，突变噪声对声音信号的影响也大幅度减少，声音品质得到了提高。

图5为本实施例提供的声音降噪装置的一种结构示意图，应用于电子设备，与图3所示方法实施例相对应，所述装置包括：

第一获取模块501，用于获取当前采样点的第一声音数据；

第二获取模块502，用于获取第二声音数据，其中，所述第二声音数据为：第二采样时刻采集的数据，所述第二采样时刻为：第一采样时刻之前、与所述第一采样时刻最接近的预设数量个采样时刻；所述第一采样时刻为所述第一声音数据对应的采样时刻；

平滑处理模块503，用于根据所述第二声音数据，对所述第一声音数据进行滑动平滑处理；

数据确定模块504，用于将处理后的采样数据，确定为所述第一声音数据降噪后的数据。

基于图5所示实施例的一种实施方式中，所述平滑处理模块503，具体可以用于：

按照以下公式，对第一声音数据进行处理：

所述a(j)可以为：

基于图5所示实施例的一种实施方式中，所述装置还可以包括数量确定模块(图中未示出)，用于采用以下方式确定所述预设数量：

基于图5所示实施例的一种实施方式中，所述数据确定模块504，具体可以用于：

由于上述装置实施例是基于方法实施例得到的，与该方法具有相同的技术效果，因此装置实施例的技术效果在此不再赘述。

对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域普通技术人员可以理解，上述实施方式中的全部或部分步骤是能够通过程序指令相关的硬件来完成的，所述的程序可以存储于计算机可读取存储介质中。这里所称存储介质，是指ROM/RAM、磁碟、光盘等。

以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本申请的保护范围内。