CN1776808A - 统一速率音频处理方法及装置 - Google Patents

统一速率音频处理方法及装置 Download PDF

Info

Publication number
CN1776808A
CN1776808A CNA2005100618518A CN200510061851A CN1776808A CN 1776808 A CN1776808 A CN 1776808A CN A2005100618518 A CNA2005100618518 A CN A2005100618518A CN 200510061851 A CN200510061851 A CN 200510061851A CN 1776808 A CN1776808 A CN 1776808A
Authority
CN
China
Prior art keywords
audio
frequency
filter
data rate
interpolation filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005100618518A
Other languages
English (en)
Inventor
郁发新
郎晓黎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CNA2005100618518A priority Critical patent/CN1776808A/zh
Publication of CN1776808A publication Critical patent/CN1776808A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种统一速率音频处理方法及装置,是将输入音频数据速率通过插值器的N倍频部件,使其增加N倍;再通过插值滤波器,滤除N-1个频谱镜像;然后经抽取滤波器进行低通滤波;最后经M分频部件将音频数据速率降到1/M。装置是由N倍频部件和插值滤波器连接组成的插值器,与由抽取滤波器和M分频部件连接组成的抽取器相连接。本发明由于采用了插值器和抽取器相结合的处理方法,使任意音频数据速率转化成符合AC97规范的,能被所有音频处理器处理的48kHz的音频数据速率。基于多相子插值滤波器和抽取滤波器的统一速率音频处理算法从频谱结构角度保证了最小失真,最大限度保持原有声音听感,而且显著简化了后续音效处理。同时具有结构简单,成本低。

Description

统一速率音频处理方法及装置
技术领域
本发明涉及一种音频处理方法及装置
背景技术
不同速率的音频数据给后续的声音信号处理和播放带来很多问题。随着计算机技术的普及,出现了许多不同标准的音频数据格式,一般来说,不同格式音频数据的速率存在差异,即使相同格式的音频数据,也可能存在不同速率的音频数据。一方面随着人们生活水平的提高,对声音效果的追求越来越苛刻。基于数字信号处理的降噪、混响、回声、声场旋转、动态均衡、掐波、变调、变速不变调等后继音效处理成了音频处理系统必备功能。这些音效处理算法绝大多数与音频数据速率密切相关,能自适应处理不同速率音频数据的音效处理算法会复杂化音效处理器结构,大大提高音效处理器成本。另一方面符合AC97(Audio Codec 97)规范的音频处理芯片占据了绝大部分市场份额,AC97音频处理芯片存在众所周知的采样速率转换SRC(Sampling Rate Convert)问题。制定AC97规范时,为节约音频处理器生产成本,AC97音频处理芯片只支持48kHz音频数据。有些芯片厂商为了提高芯片的兼容性,采取简单的插值和抽取算法,SRC输出后的音频采样率为原始信号速率的非整数倍,产生较大的谐波和噪声,影响听感。
发明内容
本发明的目的是提供一种将任意速率的音频数据变换到恒定速率的音频数据的统一速率音频处理方法及装置。它既保留原有音频的频谱结构,又解决了AC97音频控制的采样速率转换SRC问题。
本发明的目的是通过下述处理方法及装置实现的:
统一速率音频处理方法(步骤):
将输入音频数据速率通过插值器的N倍频部件,使输入音频数据速率增加N倍;增加N倍的音频数据速率再通过插值滤波器进行低通滤波,滤除N-1个频谱镜像;把经过插值滤波器的音频数据速率通过抽取器的抽取滤波器进行低通滤波;然后利用抽取器的M分频部件将音频数据速率降到1/M。
为实施上述方法而专门设计的统一速率音频处理装置:
由N倍频部件和插值滤波器连接组成的插值器,与由抽取滤波器和M分频部件连接组成的抽取器,插值滤波器和抽取滤波器连接。
所述插值滤波器是多相子插值滤波器并联组成。
本发明由于采用了插值器和抽取器相结合的处理方法,能使任意音频数据速率转化成符合AC97规范的,能被所有音频处理器处理的48kHz的音频数据速率。基于多相子插值滤波器和抽取滤波器的统一速率音频处理算法从频谱结构角度保证了最小失真,最大限度保持原有声音听感,而且显著简化了后续音效处理算法。同时结构简单,成本低。
附图说明
图1是本发明装置的结构示意图;
图2是音频数据输入插值器前的频谱结构示意图;
图3是音频数据输出插值器后的频谱结构示意图;
图4是音频数据输入抽取器前的频谱结构示意图(fo≥fi);
图5是音频数据输出抽取器后的频谱结构示意图(fo≥fi);
图6是音频数据输入抽取器前的频谱结构示意图(fo<fi);
图7是音频数据输出抽取器后的频谱结构示意图(fo<fi);
图8是插值器的工作过程中与音频速率变化相对应的示意图;
图9是多相子插值滤波器的工作原理与音频速率变化相对应的示意图。
具体实施方式
参照图1,本发明由插值器1和抽取器4连接构成。插值器1由N倍增部件2和插值滤波器3连接组成,插值滤波器3是由多相子滤波器11并联而成。抽取器4由抽取滤波器5和M分频部件6连接组成。它是采用芯片FPGA(Field Programmable Gate Array)开发音频速率转换信号处理机,采用多相插值滤波器和抽取滤波器结合的方法,将任意速率的音频数据转化成符合AC97规范的能被,所有音频处理器处理的48kHz的音频数据。
统一速率音频处理算法:
先给出统一速率音频处理算法结构。现代计算机音频数据速率既有低于48kHz,也有高于48kHz。从常用音频数据速率来看,WAV(Wave)是脉冲编码调制PCM(Pulse Code Modulation)编码,有11.025kHz、22.05kHz、44.1kHz,MP3是MPEG1 Layer3编码,解码后得到PCM编码数据,音频数据速率也有22.05kHz、32kHz、44.1kHz、48kHz、96kHz等。简单的插值和抽取只能改变音频数据速率的整数倍。通用的采样音频数据速率变更算法能以任意有理因子比例改变音频数据速率,其输入与输出的音频数据速率满足:
f o = N M f i - - - ( 1 )
式中fi为输入音频数据速率,fo为输出音频数据速率,N、M为自然数比例因子。采样速率的转化分两步完成:首先通过插值器的N倍频部件2将输入音频数据速率增加到工作频率速率fm=Nfi,然后利用抽取器的M分频部件6将数据速率降到fo=fm/M。
对于输入数据速率为fo=32kHz,如果输出音频数据速率符合AC97要求,则输出音频数据速率fo要求为fo=48kHz。显然要求N=3,M=2,fm=96kHz。当然存在N=1的情况,这时统一速率音频处理算法简化为抽取器4;当M=1,统一速率处理算法简化为插值器1。
统一速率音频处理算法的设计准则就是保持输入/输出音频数据的速率频谱结构。音频数据频谱集中在20Hz~20kHz范围内,无论增加,还是减小音频数据速率,保持该频段内频谱结构不变,如图2、图3所示,图中有有用频谱8。
插值滤波器3扮演低通滤波器功能,滤除N-1个频谱镜像7,其工作频率速率为fm,带宽为fi/2=fm/(2N)。
与插值器1相比较,抽取器4要满足的频谱变换功能略为复杂。插值器1音频数据速率增加,只要滤除N-1个频谱镜像7,不存在频谱混叠现象。抽取器4功能刚好与插值器1功能相反,需要创建出M-1个频谱镜像7。分为两种情况:
当fo≥fi
这种情况比较简单,不存在频谱混叠现象,如图4、图5所示。
此时抽取滤波器5设计非常简单,起到低通滤波器的作用,其工作频率速率为fm,带宽为fo/2=fm/(2M)≥fi/2,不会损失原有频谱。
当fo<fi
这种情况比较复杂,抽取滤波器5会滤除部分频谱,如图6、图7所示。
事实上,音频数据速率频谱集中在20Hz~20kHz范围内,AC97规范规定的音频数据速率fo为48kHz,带宽为24kHz的低通抽取滤波器5足以保留音频数据速率fi的频谱,不会对音质产生影响。
多相子插值滤波器9
先来考虑N倍频部件2插值,它首先会在输入音频数据速率为fi的低速输入序列x(n)的相邻样本间插入N-1个零值,然后对工作频率速率为fm=Nfi的高速中间序列xup(n)进行FIR(Finite Impulse Responce)低通滤波获得N-1个插值数据,最后获得插值器1输出序列y(n),频谱变换满足图2、图3所示要求,处理过程如图8所示:
从图8可以看出,
由图2、图3分析可知,插值滤波器3是带宽为fi/2=fm/(2N)的低通滤波器,其数字截止频率为
ω c = 2 π f i / 2 f m = π N - - - ( 3 )
通带内增益以N取代1,理想的插值低通滤波器系数可以通过逆Fourier变换得到
d ( k ) = 1 2 π ∫ - π π D ( ω ) e jωπ dω = 1 2 π ∫ - π / N π / N Ne jωπ dω = sin ( πk / N ) πk / N - - - ( 4 )
采用Hamming窗进行FIR低通滤波器设计,取窗口长度L=2NK+1,窗口经过因果移位得到低通滤波器
h(n)=w(n)d(n-KM) n=0,1,...,L-1                     (5)
其中:
w ( n ) = 0.54 - 0.46 cos ( 2 πn L - 1 ) - - n = 0,1 , · · · , L - 1 - - - ( 6 )
最后插值器4输出序列y(n)可以通过中间序列xup(n)与h(n)卷积获得
y ( n ) = Σ k = 0 L - 1 h ( k ) x up ( n - k ) - - - ( 7 )
在实际算法实现中,序列插零涉及内存分配和释放等繁琐操作,而且样本个数的增加也会显著增加运算量。仔细分析式(7),采用多相子插值滤波器9可以解决式(7)的计算。由于序列xup(n)是序列x(n)的相邻样本间插入N-1个零值获得,式(7)中n以nN+i(i=0,1,2,...,N-1)代替,k以kN+j(j=0,1,2,...,N-1,k=0,1,2,...,2K-1)代替,则式(7)为
y ( nN + i ) = Σ k = 0 2 k - 1 Σ j = 0 N - 1 h ( kN + j ) x up ( nN + i - kN - j ) - - - ( 8 )
定义第i个多相子滤波器9系数和输出分别为
hi(k)=h(kN+i)    i=0,1,...,N-1 k=0,1,...,2K-1            (9)
yi(n)=y(nN+i)    i=0,1,...,N-1 n=0,1,...,2K-1            (10)
而且
x up ( nN + i - kN - j ) = x ( n - k ) i = j 0 i ≠ j - - - ( 11 )
式(9)、(10)、(11)代入式(8)得多相子插值滤波器9卷积公式为
y i ( n ) Σ k = 0 2 K - 1 h i ( k ) x ( n - k ) - - i = 0,1 , · · · , N - 1 - - - ( 12 )
如果采用一般插值滤波器3,由式(7)可以看出,每计算一个插值点需要2L=2NK次乘法,N个插值点共需2N2K次乘法;如果采用多相子插值滤波器9,由式(12)可以看出,每计算一个插值点需要2K次乘法,N个插值点共需2NK次乘法。多相子插值滤波器9实现节约了N倍计算量。多相子插值滤波器9每输入一个低速样本,输出N个滤波值,如图9所示。
抽取器4
抽取器4比较简单,经低通抽取滤波器5滤波后,每M个样本保留1个样本即可。由插值器1分析可知存在fo≥fi和fo<fi两种情况,低通滤波器截止频率不一样,因此抽取低通滤波器分别为
d ( k ) = sin ( &pi;k / M ) &pi;k / M f o &GreaterEqual; f i sin ( &pi;k / N ) &pi;k / N f o < f i - - - ( 13 )
为了降低旁瓣,对低通滤波器采用汉宁Hanning加窗,同时为了保证因果性,还需要进行移位操作。

Claims (3)

1、一种统一速率音频处理方法
1)将输入音频数据速率通过插值器的N倍频部件,使输入音频数据速率增加N倍;
2)增加N倍的音频数据速率再通过插值滤波器进行低通滤波,滤除N-1个频谱镜像;
3)把经过插值滤波器的音频数据速率通过抽取器的抽取滤波器进行低通滤波;
4)然后利用抽取器的M分频部件将音频数据速率降到1/M。
2、为实施权利要求1而专门设计的装置,其特征在于:由N倍频部件(2)和插值滤波器(3)连接组成的插值器(1),与由抽取滤波器(5)和M分频部件(6)连接组成的抽取器(4),插值滤波器(3)和抽取滤波器(5)连接。
3、根据权利要求2所述的装置,其特征在于:所述插值滤波器(3)是多相子插值滤波器(11)并联组成。
CNA2005100618518A 2005-12-06 2005-12-06 统一速率音频处理方法及装置 Pending CN1776808A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2005100618518A CN1776808A (zh) 2005-12-06 2005-12-06 统一速率音频处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2005100618518A CN1776808A (zh) 2005-12-06 2005-12-06 统一速率音频处理方法及装置

Publications (1)

Publication Number Publication Date
CN1776808A true CN1776808A (zh) 2006-05-24

Family

ID=36766249

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005100618518A Pending CN1776808A (zh) 2005-12-06 2005-12-06 统一速率音频处理方法及装置

Country Status (1)

Country Link
CN (1) CN1776808A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106656105A (zh) * 2016-09-30 2017-05-10 歌尔科技有限公司 一种正弦插值方法、装置和高速数据采集设备
CN109801641A (zh) * 2019-03-19 2019-05-24 深圳锐越微技术有限公司 音频速率变换系统及电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106656105A (zh) * 2016-09-30 2017-05-10 歌尔科技有限公司 一种正弦插值方法、装置和高速数据采集设备
CN109801641A (zh) * 2019-03-19 2019-05-24 深圳锐越微技术有限公司 音频速率变换系统及电子设备
WO2020187280A1 (zh) * 2019-03-19 2020-09-24 深圳锐越微技术有限公司 音频速率变换系统及电子设备
CN109801641B (zh) * 2019-03-19 2021-06-08 深圳锐越微技术有限公司 音频速率变换系统及电子设备

Similar Documents

Publication Publication Date Title
US9640187B2 (en) Method and an apparatus for processing an audio signal using noise suppression or echo suppression
US6847313B2 (en) Rational sample rate conversion
JP5666021B2 (ja) 復号後オーディオ信号をスペクトル領域で処理する装置及び方法
RU2004138291A (ru) Способ и устройство для частотно-избирательного выделения основного тона синтезированной речи
CN1819457A (zh) 采样率转换器
SG183967A1 (en) Apparatus and method for processing an input audio signal using cascaded filterbanks
JP2013084018A (ja) 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置
JPS5823100A (ja) 音声信号のコ−ド化装置
CN111900953B (zh) 数字麦克风的采样转换及滤波实现系统、方法
US7492848B2 (en) Method and apparatus for efficient multi-stage FIR filters
EP2157695A3 (en) Sample rate converter with rational numerator or denominator
WO2011027215A1 (en) Method and apparatus for processing audio signals
US20090003497A1 (en) Digital signal processing device, digital signal processing method, and digital signal processing program
JPH01261909A (ja) Pcmにおけるアナログ信号合成装置
CN1776808A (zh) 统一速率音频处理方法及装置
EP1879292B1 (en) Partitioned fast convolution
CN1138254C (zh) 一种基于小波变换的音频信号压缩编/解码方法
CN1822092B (zh) 一种消除语音输入中背景噪声的方法及其装置
CN101221767A (zh) 语音加强装置与应用于其上的方法
Mottaghi-Kashtiban et al. Optimum structures for sample rate conversion from CD to DAT and DAT to CD using multistage interpolation and decimation
JPWO2006025332A1 (ja) サンプリングレート変換演算装置
EP2038881B1 (en) Sound frame length adaptation
TW202103146A (zh) 語音編碼方法與電子裝置
CN1201491C (zh) 可变取样频率的过取样数字类比转换器
CN212907067U (zh) 一种语音信号降噪装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication