CN101458950A

CN101458950A - 一种消除模数转换器噪声对数字录音干扰的方法

Info

Publication number: CN101458950A
Application number: CNA2007100324405A
Authority: CN
Inventors: 罗发龙; 李小明; 李敏; 胡胜发
Original assignee: ANKAI (GUANGZHOU) SOFTWARE TECHN Co Ltd
Current assignee: ANKAI (GUANGZHOU) SOFTWARE TECHN Co Ltd
Priority date: 2007-12-14
Filing date: 2007-12-14
Publication date: 2009-06-17
Anticipated expiration: 2027-12-14
Also published as: CN101458950B

Abstract

本发明公开了一种消除模数转换器噪声对数字录音干扰的方法，将模数转换器输出的数字录音数据依次经噪声定位，数字录音数据加窗处理，特征域定位，特征功率密度计算，特征域逆变换和时域混迭处理后输出。本发明采用数字处理的过程，能有效的去除ADC产生的噪声对数字录音的干扰，同时避免在原有数字录音系统硬件电路上的修改，节约成本。易于维护和移植，灵活性高，适用所有嵌入式数字录音系统。

Description

一种消除模数转换器噪声对数字录音干扰的方法

技术领域

本发明涉及一种消除噪音干扰的方法，尤其是涉及一种消除模数转换器噪声对数字录音干扰的方法，适用于所有嵌入式数字录音系统。

背景技术

在嵌入式数字录音系统中，噪音干扰会严重影响录音效果。不同于录音中的外部背景噪声，作为录音系统中关键器件的模数转换器(ADC)，其电路本身产生的噪声对录音引起的干扰则很难有效地消除。因此，如何有效、便捷地消除ADC的毛刺干扰成为数字录音中噪声消除技术的一个难点。

实际的ADC由于电路本身的局限在许多方面与理想的ADC有偏差，因此，在采集声音数据过程中，这些偏差不可避免地会产生噪声干扰。一般将这些噪声分为择算到输入端的噪声和量化噪声，前者是一种有效输入噪声，后者是在采集数据中数据精度的一种必然损失。如图1所示，描述了对于“理想的”ADC和实际的ADC，上述噪声及对ADC总传递函数的影响。

理想的ADC具有零编码跃迁噪声，并且跃迁区域的宽度为零。实际的ADC有一定数量的编码跃迁噪声，因而具有有限的跃迁区域宽度。图1(b)示出编码跃迁噪声宽度约为一个最低有效位(LSB)峰峰值(P-P)噪声的情况。

这些噪音在整个录音过程中一直存在，为抑制这些噪声干扰，传统的方法有：对输出采样进行多次测量平均以减少噪声影响，这种方法缺点是需要增加数字硬件和降低总输出采样率；另外一种方法是适当地使用抖动(有意施加到模拟输入信号的外部噪声)来抑制噪声，图2给出了产生小幅度和大幅度抖动的示意图。

这种方法的缺点是它高度依赖于ADC本身的特性，局限性较强。还有其他一些方法如修改PCB布线，修改输入驱动或输出电容等等，总之现有的抑制ADC噪声的方法都是从硬件电路本身出发，使得这些方法成本高，灵活性差，且增加了系统成本。

发明内容

本发明的目的在于提供一种消除模数转换器噪声对数字录音干扰的方法，既能有效消除ADC的噪声对数字录音的干扰，又能避免修改或增加原系统硬件电路，节约成本。

本发明的目的可通过以下的技术措施来实现，一种消除模数转换器噪声对数字录音干扰的方法，将模数转换器输出的数字录音数据依次经噪声定位，数字录音数据加窗处理，特征域定位，特征功率密度计算，特征域逆变换和时域混迭处理后输出。

本发明的具体处理过程，包括以下步骤：

(1)采集模数转换器输出的数字录音数据，对模数转换器引起的非语音信号进行时间定位，判断出非语音信号及其持续时间；

(2)对步骤(1)中的数字录音数据进行时域加窗处理；

(3)利用离散余弦变换对步骤(2)中得出的数据进行特征域变换，从时间域转换到特征域，获得特征频谱系数；

(4)通过获得的特征频谱系数，得出录音信号总的特征功率密度和其中非语音的特征功率密度，用总的录音信号的特征功率密度减去非语音的特征功率密度；

(5)再将所得差值数据做逆离散余弦变换，从特征域转换到时间域；

(6)对步骤(5)中的输出数据进行时域混迭处理。

本发明步骤(2)中时间定位具体过程为：从步骤(1)得到数字信号数据，取帧长10～30ms的一帧信号计算数据的包络，并计算这些包络峰值的变化的统计量En，结合典型语音信号的统计值，设统计量的最大值为门限值Et，如果En大于Et判断该帧为含噪声的信号，再对连续10帧的信号进行语音判断，从而对整个语音信号进行噪声时间定位。

本发明步骤(6)中混迭过程具体如下：第一次从步骤(5)输出256个实数点，然后将前64个点作为语音信号输出，下次再从步骤(5)输出得到256个实数点，这256个同上次输出的后(256-64)个混叠，依次进行。

本发明采用数字处理的过程，能有效的去除ADC产生的噪声对数字录音的干扰，同时避免在原有数字录音系统硬件电路上的修改，节约成本。易于维护和移植，灵活性高，适用所有嵌入式数字录音系统。

附图说明

图1ADC噪声及对ADC传递函数的影响

图2使用抖动抑制ADC噪声

图3本发明的流程框图；

图4为本发明具体实施方式的流程框图；

图5为本发明中时间定位具体过程的流程框图；

图6为本发明中时域混迭示意图。

具体实施方式

如图3、图4所示，本发明方法具体处理步骤如下：

步骤1，数字录音系统通过麦克风进行一段时间的录音，原始模拟语音信号经模数转换器ADC转换后则变成数字信号。

步骤2，经步骤(1)得到数字信号数据，取帧长10～30ms的一帧信号，计算在短时条件下(10～30ms)数据的包络，并计算这些包络峰值的变化的统计量En，计算定义如下：

E(n)＝∑|x(n+m)*w₁(m)-x(n+m+τ)*w₂(m+τ)|

其中x(n)为录音数据，w₁(m)，w2(m)为窗函数，τ为时长。取En的上限为门限值Et，当该统计量En大于Et时判断该段为含噪声的信号，考虑到说话时语音的持续性，同时也为了求得含噪声信号的持续时间(作为去除噪声的一个判断条件)，必须对持续帧进行判断，通常经验为当连续10帧信号为噪声时判断该时间段语音含有噪声，该步骤流程图如图5所示。

步骤3，对步骤(2)中的数据进行时域加窗处理，加窗处理降低由于采样时矩形窗截断造成的频谱扩散和干扰。

时域加窗处理采用256个数据点进行运算，加窗函数定义如下：

win＝0.5*hamming(256+1)/1.08

其中，hamming()表示翰明函数。hamming(256+1)函数返回的是含有257个点的hamming窗，hamming窗函数定义如下：

hamming(k)＝0.54-0.46cos(2*pi*k/256.0)，k＝0，1，2….256.

步骤4，利用离散余弦变换(DCT)对时域步骤(3)得出的数据进行特征域变换，将数据从时间域转换到特征域，获得特征频谱系数；对时域信号特征的提取关键是需要将时域信号中相关特征实现在特征域能量集中，而离散余弦变换不仅能有效提起信号的特征，且实现算法快速。

步骤5，经步骤4处理录音数据中噪声特征能较好的集中，通过获得的特征频谱系数，可以计算噪声特征功率密度。定义特征功率密度W如下：

W (c_{k}) = - Σ_{k = 1}^{N} C_{k} \log C_{k}

其中

C_{k} = | ci | / Σ_{i = 1}^{N} | c_{i} |,

ci，i＝1，2，...，N是N个数据的DCT变换系数。当c₁大于3/4W时给点为噪声，统计这些噪声点可以得出噪声特征功率。

步骤6根据步骤(5)中计算得出的W，将录音数据减去那些超过3/4W的噪声点，可以得到语音信号的特征功率密度。

步骤7，对步骤6的输出的特征域数据进行特征域的反变换，使变为时间域数据。由于语音信号的非平稳，时变的特征步骤(7)对部分的低频噪声容易“错检”，此时结合步骤(2)的噪声持续时间可弥补此问题。

步骤8，对步骤7中的时间域数据进行混迭以得出语音信号，如图6所示，混迭具体如下：第一次从步骤(7)输出256个实数点，然后将前64个点作为语音信号输出，下次再从步骤(7)输出得到256个实数点，这256个同上次输出的后(256-64)个混叠，依次进行。时域内的混迭处理后得出消除了模数转换器引起噪声的语音信号。

Claims

1、一种消除模数转换器噪声对数字录音干扰的方法，其特征在于将模数转换器输出的数字录音数据依次经噪声时间定位，数字录音数据加窗处理，特征域定位，特征功率密度计算，特征域逆变换和时域混迭处理后输出。

2、根据权利要求1所述的消除模数转换器噪声对数字录音干扰的方法，其特征在于包括以下步骤：

(2)对步骤(1)的数字录音数据进行时域加窗处理；

(6)对步骤(5)中的输出数据进行时域混迭处理。

3、根据权利要求1或2所述的消除模数转换器噪声对数字录音干扰的方法，其特征在于步骤(2)中时间定位具体过程为：从步骤(1)得到数字信号数据，取帧长10～30ms的一帧信号计算数据的包络，并计算这些包络峰值的变化的统计量En，结合典型语音信号的统计值，设统计量的最大值为门限值Et，如果En大于Et判断该帧为含噪声的信号，再对连续10帧的信号进行语音判断，从而对整个语音信号进行噪声时间定位。

4、根据权利要求1或2所述的消除模数转换器噪声对数字录音干扰的方法，其特征在于混迭过程具体如下：第一次从步骤(5)输出256个实数点，然后将前64个点作为语音信号输出，下次再从步骤(5)输出得到256个实数点，这256个同上次输出的后(256-64)个混叠，依次进行。