CN109102818A

CN109102818A - 一种基于信号频率概率密度函数分布的去噪音频采样算法

Info

Publication number: CN109102818A
Application number: CN201810996355.9A
Authority: CN
Inventors: 龙华; 杨明亮; 邵玉斌; 杜庆治
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2018-08-29
Filing date: 2018-08-29
Publication date: 2018-12-28
Anticipated expiration: 2038-08-29
Also published as: CN109102818B

Abstract

本发明涉及一种基于信号频率概率密度函数的去噪音频重采样算法，属于音频信号处理技术领域。本发明利用卡尔曼滤波器优良的去噪能力和前向预测功能对采集的音频信号进行处理以获得带有短时预测功能的去噪音频。对处理后的音频信号进行傅里叶变换获得音频信号的频谱函数，在概率密度函数p(f)的控制条件下对音频信号进行重采样。本发明减少了冗余采样点。卡尔曼滤波处理采对集到的音频信号进行滤波处理得到的重采样数据相对其他算法处理结果更为平滑，复原出的音频信号质量更高，提高了音频信号处理的实时性。本算法理论简单，编程也易于实现，实际工程应用也具有强大的稳定性和鲁棒性。

Description

一种基于信号频率概率密度函数分布的去噪音频采样算法

技术领域

本发明涉及一种基于信号频率概率密度函数分布的去噪音频采样算法，属于音频特征信号处理技术领域。

背景技术

目前对于音频信号的采样大多使用均匀采样，所设置的采样频率过低，信息传输后所复原出的信号有很大程度的失真，若设置的采样频率高来满足精度要求，但大量的数据处理对信息处理系统又造成了极大的挑战，很难选择一个折中恰当的采样频率满足无失真采样并能剔除多余的冗余信息。本发明提出的重采样算法首先是利用卡尔曼滤波器对信号进行去噪处理以获得具有一定短时预测功能的去噪信号，然后对处理后信号进行傅里叶变换获得音频信号的频谱函数，最后基于频谱的概率密度函数对信号进行重采样以获得最优采样序列，剔除不必要的冗余采样数据，从而提高整个系统的数据处理速率和实时性。

发明内容

本发明是利用卡尔曼滤波器优良的去噪能力和短时预测功能，对采集到的音频数据进行处理以获得具有短时预测的去噪信号，其目的是提高音频信息系统的实时性。对处理后的音频信号进行傅里叶变换获得其频谱函数，然后利用音频信号频谱的概率密度函数作为重采样的控制量进行重采样，剔除了原始采样序中的噪声和冗余数据量，使得后续所提取的音频特征更能表征原始音频信号，提高整个系统的实时处理能力。本算理论也相对简单，编程易于实现，大部分编程软件中也有相应的卡尔曼滤波器的包函数为仿真等研究提高极大便利，本算法针对当今的大数据音频信号处理更具有明显的实时、高效优势。其算法可用于音频特征提取、音频信号信息传输、音频识别等领域。

本发明的技术方案如是：一种基于信号频率概率密度函数分布的去噪音频采样算法。该方法具体包括以下步骤：

(1)音频信号采集：采集音频信号，获得音频样本。

(2)音频信号的去噪处理：将上述获取的音频样本送入搭建好的卡尔曼滤波器模型中，获得去噪并带有前向预测的音频信号。

(3)音频信号的时频变换：将处理好的音频信号进行傅里叶变换以获得频谱函数。

(4)重采样模型搭建：依据音频信号频谱的概率密度函数搭建重采样模型。

(5)重采样结果对比：用不同的采样算法对同一音频信号进行采样，根据采样信号复原出的原始音频信号失真率与采用序列大小作为指标进行对标检验。

上述的一种基于信号频率概率密度函数分布的去噪音频采样算法，步骤(1)所述音频采集是通过音频采集装置采集音频样本，音频采集器对音频信号采集时设置好采样频率(采样频率满足奈奎斯特采样定理)、采样声道数、量化精度，采样环境为带噪环境。

上述的一种基于信号频率概率密度函数分布的去噪音频采样算法，步骤(2)中音频信号的去噪处理在卡尔曼滤波器强大的去噪能力以及前向预测功能的基础上做进一步扩展，对音频信号去噪的同时进行的音频信号短时前向预测。

上述的一种基于信号频率概率密度函数分布的去噪音频采样算法，步骤(3)音频信号的时频变换是将经过卡尔曼滤波器处理后的去噪信号进行傅里叶变换，获得音频信号的频谱函数以供后续基于频谱概率密度函数实现重采样。

上述的一种基于信号频率概率密度函数分布的去噪音频采样算法，步骤(4)重采样模型搭建包括以下步骤：

(1)重采样模型搭建中使用重要性采样实现重采样，即计算音频信号频谱函数f(x)在概率密度分布p(x)上的积分，即

E[f(x)]＝∫f(x)p(x)dx (1)

音频信号频谱函数的概率密度函数p(x)难以求解，这里用易抽样的分布q(x)代替，并令即有

E[f(x)]＝∫f(x)w(x)q(x)dx (2)

w(x)为采样权重。音频信号的采样是离散的，先针对q(x)分布采N个样本点，然后根据样本点对应的w(x)权重进行重采样，即

(2)用易于计算的和代替难以求解的分布p(x)，q(x)，并有

Z_p，Z_q为标准化项(常数)，使得等比例变化为一个概率分布。即有对于上述的积分式变为

通过求倒数表达式求上述积分式。假设很方便从进行采样，即有

这里采样点表示为m。最终上述问题成为

其中至此获得了基于音频信号频谱概率密度函数的的重采样模型。

上述的一种基于信号频率概率密度函数分布的去噪音频采样算法，步骤(5)采样序列对比即利用不用的采样算法对同一段音频信号进行重采样根据复原音频信号的失真率和采样序列大小作为指标比较，检验本算法重采样序列的有效性。

本发明与现有的采样算法相比其优点有：

(1)本发明用卡尔曼滤波器对采集音频信号处理，不仅可以去噪，重点是卡尔曼滤波器具有短时预测能力，可以提高整个系统的数据处理实时性。

(2)传统的音频信号采样是采用均匀采样或是基于频率的自适应采样，本发明是基于频谱的概率密度函数进行控制采样，极大的剔除了冗余采样点，更便于后续的音频特征提取和音频信号传输。

(3)本发明针对大数据音频信号表现更强的优势，即音频数据量越大，剔除的冗余数据量越多，在信息处理方面表现更强的鲁棒性，满足当前大数据信息发展的趋势需求。

附图说明

图1本发明基于信号频率概率密度函数分布的去噪音频采样算法流程图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

如图1所示：一种基于信号频率概率密度函数分布的去噪音频采样算法。所述方法的具体步骤如下：

(1)音频信号采集：音频信号采集，获得音频样本。

(2)卡尔曼滤波器的模型搭建与音频处理：因为音频信号易受外界干扰存在过程噪声，而测量时候由于各方面因素又存在测量噪声，故利用卡尔曼滤波器进行去噪处理，由于音频信号处理要求实时性，故利用其卡尔曼滤波器的前向预测功能可以提高后续音频信号处理的实时性，进而以获得去噪并带有一定前向预测的音频信号。

(3)音频信号的时频变换：将处理好的音频信号进行傅里叶变换以获得音频信号的频谱函数用于后续信号处理使用。

(4)重要性采样模型搭建：依据音频频谱的概率密度函数搭建重采样模型，其中分为代替概率密度函数易求解和不易求解进行讨论。

(5)采样序列对比：用不同的采样算法对同一音频信号进行采样并且复原原始音频信号，对比其采用序列大小、复原信号失真度等。

所述音频采集是通过麦克风收录样音频信号，设置的采样频率为44.1KHz，采样模式为单声道语音信号采集，量化级为16bit，因本发明研究的是对音频信号的去噪以及重采样故采样环境为带噪环境。

所述音频信号的去噪处理在卡尔曼滤波器强大的去噪能力以及前向预测功能的基础上做进一步扩展，对音频信号去噪的同时进行的音频信号短时前向预测。

所述音频信号的时频变换是将经过卡尔曼滤波器处理后的去噪数字信号进行傅里叶变换，获得频域信号以供后续基于音频频谱的概率密度函数实现重采样。

所述重采样模型搭建包括以下步骤：

E[f(x)]＝∫f(x)p(x)dx (1)

E[f(x)]＝∫f(x)w(x)q(x)dx (2)

(2)用易于计算的和代替难以求解的分布p(x)，q(x)，并有

这里采样点表示为m。最终上述问题成为

其中至此获得便是基于音频信号频谱概率密度函数的的重采样模型。

所述重采样结果对比即用不用的重采样算法对同一段音频信号进行采样处理所获得的采样序列进行量的对比，以重采样序列恢复出的原始音频信号的失真率与重采样序列大小作为检验指标，验证本算法所得到的重采样音频信号具有更好的有效性。

上面结合附图对本发明的具体实施方式作了详细说明，但本发明并不限于上述实施方式，在本领域科技研究人员所具备的知识范围内，不脱离或背离本发明宗旨的前提下可以应用于其他相关领域，如音频特征提取、音频信号信息传输、音频识别等。

Claims

1.一种基于信号频率概率密度函数分布的去噪音频采样算法，所述音频采样算法步骤具体如下：

(1)音频信号采集：采集音频信号，获得音频样本；

(2)音频信号的去噪处理：将上述获取的音频样本送入卡尔曼滤波器模型中，获得去噪并带有前向预测的音频信号；

(3)音频信号的时频变换：将处理好的音频信号进行傅里叶变换以获得音频信号的频谱函数；

(4)重采样模型搭建：依据音频信号的频谱的概率密度函数搭建重采样模型；

(5)重采样结果对比：用不同的采样算法对同一音频信号进行重采样，根据重采样序列大小、信号复原失真度指标进行对比。

2.根据权利要求1所述的基于信号频率概率密度函数分布的去噪音频采样算法，其特征在于：所述音频采集是通过音频采集装置进行采样，音频采集器对音频信号采集时设置好采样频率、采样声道数和量化精度，采样环境为带噪环境。

3.根据权利要求1所述的基于信号频率概率密度函数分布的去噪音频采样算法，其特征在于：所述重采样模型搭建包括以下步骤：

(1)重采样模型搭建中使用重要性采样实现重采样，即计算音频信号频谱函数f(x)在概率密度分布p(x)上的积分为：

E[f(x)]＝∫f(x)p(x)dx

E[f(x)]＝∫f(x)w(x)q(x)dx

w(x)为采样权重，音频信号的采样是离散的，先针对q(x)分布采N个样本点，然后根据样本点对应的w(x)权重进行重采样，即

(2)用易于计算的和代替难以求解的分布p(x)，q(x)，并有

Z_p，Z_q为标准化项，使得等比例变化为一个概率分布，即有音频信号频谱函数f(x)在概率密度分布p(x)上的积分变为

通过求倒数表达式求上述积分式，假设很方便从进行采样，即有

其中x_i～q

这里采样点表示为m，最终上述问题成为

其中至此获得的便是基于音频信号频谱概率密度函数的的重采样模型。

4.根据权利要求1所述的基于信号频率概率密度函数分布的去噪音频采样算法，其特征在于：所述重采样结果对比即采用不用的重采样算法对同一段音频信号进行重采样处理，根据对重采样信号复原原始信号失真率和重采样序列大小进行对比，检验本算法所获得重采样信号的有效性。