CN104200815B

CN104200815B - 一种基于相关分析的音频噪声实时检测方法

Info

Publication number: CN104200815B
Application number: CN201410338912.XA
Authority: CN
Inventors: 甘涛; 何艳敏; 黄晓革; 兰刚; 周南
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2014-07-16
Filing date: 2014-07-16
Publication date: 2017-06-16
Anticipated expiration: 2034-07-16
Also published as: CN104200815A

Abstract

本发明提供一种基于相关分析的音频噪声实时检测方法，用于对音频流进行实时噪声检测，首先接收音频帧，并采用帧计数器对接收到的音频帧进行循环计数；每当帧计数器计数到达N_f后，进行削弱信号成分、相关性分析和噪声判定，同时将帧计数器置零。本发明适用于检测音频中各种类型的噪声，如白噪声、粉红噪声、高频信道噪声等，当信号和噪声同时存在时，也能够检测出信号被噪声所覆盖而导致音频内容模糊不清，无法正常收听的情况；同时，该检测方法算法简单、处理快速，能够广泛应用于音频信号的实时监测，如广播、电视信号监测。

Description

一种基于相关分析的音频噪声实时检测方法

技术领域

本发明属于数字音频处理技术领域，具体地说是一种基于相关分析的音频噪声检测方法，该方法可应用于对音频信号进行自动实时监测。

背景技术

当前，音频广播已成为最为普及的大众宣传和娱乐媒体。由于广播系统本身的复杂性，以及在发射、传输和接收各环节会受到外界因素的影响，广播中时常会出现播出异常或故障。因此，正常安全的播出一直以来都是广播电台业务的一个基本目标，而达到该目标的一个重要手段就是对播出音频的质量进行有效的监控。目前国内电台广播监控已由传统的人工方式过渡到了计算机辅助完成，并初步实现了一些简单异常事件的监测自动化。

在音频质量监测中，噪声检测是一个重要内容，即检测当前播出的音频是否被噪声覆盖或已完全是噪声。与其他电平、相位等信号参数的检测相比，噪声检测更为直接地指示出当前音频是否有异常。一旦检测出是噪声，可以进行及时的报警和排查故障，避免重大播出事故的发生。

目前，在音频噪声相关的报道中，以音频去噪或增强的研究居多。音频去噪或增强以提高信号-噪声比为目标，往往着眼于尽可能地提取信号而抑制噪声，故这类方法一般不能直接用于噪声检测。另外，文献中也报道了对音频及噪声分类识别的研究。分类识别方法一般先提取音频特征，如过零率、音高、梅尔频率倒谱系数(MFCC)，线性预测编码(LPC)等，用音频特征去训练一定的数学模型，如高斯混合模型(GMM)、隐马尔科夫(HMM)模型、神经网络(NN)模型等，最后用分类器，如K最邻近结点算法(KNN)和支持向量机(SVM)等进行分类。这些方法一般只针对白噪声，且复杂度比较高。事实上，广播音频噪声涉及的种类很广，除了白噪声外，还有受环境因素影响而出现的各类噪声，如粉红噪声、高频信道噪声等；噪声也不一定单独存在，它可能与信号混合在一起且将信号覆盖，导致音频内容模糊不清，无法正常收听。另外，广播监测应用还有实时性的要求。基于这些考虑，至今文献中尚未见适合于广播电台应用的音频噪声实时检测方法的报道。

发明内容

本发明的目的在于针对背景技术存在的问题，提供一种对音频流的噪声检测方法，本发明的技术方案是：一种基于相关分析的音频噪声实时检测方法，包括如下步骤：

S1.接收音频帧：

S11.接收一帧音频帧，将其样本数据排列成一列矢量；设定初始值为0的帧计数器，每接收一音频帧，帧计数器加1；

S12.计算当前音频帧的帧能量，即计算帧内各音频样本值的平方和。若帧能量小于设定的静音门限，则将该帧各样本值设置为0；否则将各样本值减去样本均值，并对减去均值后的数据作归一化处理；

S13.将处理后的帧数据保存在数据矩阵A中，设A＝[a₁,a₂,a₃,…]，其中A的每一列a_i表示第i帧的数据；

S2.若帧计数器的当前计数值小于N_f(N_f为1秒内音频帧总帧数)，则转到步骤S1，接收处理下一音频帧；否则转到步骤S3，同时将帧计数器置零；

S3.削弱信号成分：

S31.对A进行奇异值分解如下：

A＝UΣV^T (1)

其中U和V分别为左、右奇异向量矩阵，Σ＝diag(λ₁,λ₂,λ₃,…，λ_n)为对角矩阵，其对角元素λ_i为的A奇异值，设奇异值从上到下按大小降序排列，即λ₁≥λ₂≥λ₃≥…≥λ_n；

S32.对矩阵Σ，扫描其从λ_n到λ₂的n-1个对角元素，计算每个对角元素与其前一个元素的递减量，若递减量大于1，则提前结束扫描；

S33.扫描结束后，将Σ的对角元素中没有被扫描到的所有元素设置为0；

S34.将Σ带入公式(1)对A进行更新；

S4.相关性分析：

S41.对A中的每个列向量作归一化处理；

S42.从A的第1列到第N_f-1列，计算每一列与其后一列矢量的内积p_i(i＝1,2,3,…N_f-1)；

S43.计算p_i的绝对值扫描每个若则设置为的最大值；将最终的作为音频帧的相关量保存下来为后续的噪声判定使用；

S5.噪声判定：

设进行判定的音频帧数目为M，M≥N_f，计算当前音频帧及其前M-1帧所对应的相关量的均值和方差；若相关量的均值小于设定的阈值T_mean(0.12≤T_mean≤0.15)且方差小于T_mean的平方，则判定当前信号为噪声，否则为非噪声；

本发明的有益效果：本发明提供一种音频噪声实时检测方法，适用于检测音频中各种类型的噪声，如白噪声、粉红噪声、高频信道噪声等，当信号和噪声同时存在时，也能够检测出信号被噪声所覆盖而导致音频内容模糊不清，无法正常收听的情况；同时，该检测方法算法简单、处理快速，能够广泛应用于音频信号的实时监测，如广播、电视信号监测。

附图说明

图1为本发明方法的流程示意图。

图2为本发明实施例测试音频时域波形图。

图3为本发明实施例中第11～12秒内音频帧相关量分布图。

图4为本发明实施例中各次噪声判定的音频帧相关量均值和方差分布图。

具体实施方式

本实施例以一段实际广播的“天气预报”音频作为输入。该音频段的采样率为48KHz，时间长度为20秒，该段音频包含正常音频和3种不同的噪声，其中前5秒为无广播信号时的白噪声，从第6秒开始为人声加背景音乐的正常音频，持续5秒后，在第11秒受到环境干扰，音频中产生很强的干扰噪声，使得人声内容变得模糊不清，无法正常收听。干扰噪声一直持续到音频段结束，并在第17秒时发生了变化。整个测试音频的时域波形图如图2所示。将音频数据按512个采样点的长度等分为各音频帧，其总帧数为1875帧，下面以第1125帧为例进行说明，在第1124帧处理结束时，帧计数器的计数值为93；对该音频帧进行噪声检测的具体步骤如下：

S1.接收音频帧：

S11.接收第1125帧音频，将其每个样本值转化为0～1间的浮点数(即除以32768)后排列成一列矢量y＝(0.1552,0.2177,-0.1027,…,-0.1453)^T；帧计数器加1，即计数值由93增至94；

S12.计算y各元素的平方和，得到当前音频帧的能量为16.1403。由于帧能量大于设定的静音门限0.25，将各样本值减去样本均值0.0083，并对减去均值后的数据作归一化处理，得到a₉₄＝(0.0366,0.0522,-0.0277,…,-0.0383)^T；

S13.将a₉₄加入到数据矩阵A中；

S2.判断累计帧数：由于帧计数器的当前计数值94等于1秒时间内的总帧数，则转到步骤S3，同时将帧计数器置零；

S3.削弱信号成分：

S31.对A进行奇异值分解如下：

A＝UΣV^T (1)

其中U和V分别为左、右奇异向量矩阵，Σ＝diag(1.7917,1.6269,1.5953,…,0.4298)为对角矩阵，其对角元素为的A奇异值；

S32.对矩阵Σ，扫描其从最后一个元素0.4298到第二个元素1.6269的93个对角元素，计算每个对角元素相对于其前一个元素的递减量，由于递减量都不大于1，则扫描到第二个元素结束；

S33.将Σ的对角元素中没有被扫描到的第一个元素设置为0；

S34.将改变后的Σ带入公式(1)对A进行更新。

S4.相关性分析：

S41.对A中的每个列向量作归一化处理；

S42.从A的第1列到第93列，计算每一列与其后一列矢量的内积，得到内积p＝(0.0552,0.0574,-0.0497,…,0.0076)；

S43.计算p的绝对值p^a＝(0.0552,0.0574,0.0497,…,0.0076)，由于p^a元素都不为0，则直接将其作为音频帧的相关量保存下来为后续的噪声判定使用；

S5.噪声判定：

S51.设定参与噪声判定的音频帧数目M为2秒时间内的音频总帧数188；图3显示了参与噪声判定的188帧音频帧(从第938帧到当前第1125帧)所对应的相关量分布图，计算得到这188帧音频帧所对应的相关量的均值为0.06和方差为0.0024；

S52.阈值T_mean设定为0.14，由于相关量的均值小于T_mean且方差小于T_mean的平方，则判定当前信号为噪声；

图4显示了整个检测过程中，各次噪声判定计算出的相关量的均值和方差分布图，图中用虚线标出了相应的阈值。表1给出了对实施例音频的检测结果。可见，检测结果是符合实际情况的。

表1 实施例音频的检测结果

时间段	检测结果
		1至5秒	噪声
6至10秒	非噪声
		11至20秒	噪声

下面对本发明方法的运行速度进行评估。测试的仿真程序是由MATLAB编写的，测试机器为Intel(R)i3处理器，主频为2.53GHz，内存为3GB。对1秒的音频数据，仿真程序平均用0.08秒完成检测，其处理的实时速度比(音频总时间/处理时间)达12.5倍，因而程序能够对不断输入的音频流实时地进行检测；另外本次测试仿真程序采用MATLAB编写，如将程序改用C语言编写，其处理速度还能进一步提高，综上，本发明方法完全能够满足实时应用的需求。

Claims

1.一种基于相关分析的音频噪声实时检测方法，包括以下步骤：

S1.接收音频帧：

S12.计算当前音频帧的帧能量，若帧能量小于设定的静音门限，则将该帧各样本值设置为0；否则将各样本值减去样本均值，并对减去均值后的数据作归一化处理；

S2.若帧计数器的当前计数值小于N_f，N_f为1秒内音频帧总帧数，则转到步骤S1，接收处理下一音频帧；否则转到步骤S3，同时将帧计数器置零；

S3.削弱信号成分：

S31.对A进行奇异值分解如下：

A＝UΣV^T (1)

其中U和V分别为左、右奇异向量矩阵，Σ＝diag(λ₁,λ₂,λ₃,…,λ_n)为对角矩阵，其对角元素λ_i为的A奇异值，设奇异值从上到下按大小降序排列，即λ₁≥λ₂≥λ₃≥…≥λ_n；

S34.将Σ带入公式(1)对A进行更新；

S4.相关性分析：

S41.对A中的每个列向量作归一化处理；

S5.噪声判定：

设进行判定的音频帧数目为M，M≥N_f，计算当前音频帧及其前M-1帧所对应的相关量的均值和方差；若相关量的均值小于设定的阈值T_mean且方差小于T_mean的平方，则判定当前信号为噪声，否则为非噪声。

2.按权利要求1所述一种基于相关分析的音频噪声实时检测方法，其特征在于，所述步骤S5噪声判定的阈值T_mean的设定范围为0.12≤T_mean≤0.15。