CN101894564A - 一种采样率差异估计与校正方法 - Google Patents

一种采样率差异估计与校正方法 Download PDF

Info

Publication number
CN101894564A
CN101894564A CN2010102287686A CN201010228768A CN101894564A CN 101894564 A CN101894564 A CN 101894564A CN 2010102287686 A CN2010102287686 A CN 2010102287686A CN 201010228768 A CN201010228768 A CN 201010228768A CN 101894564 A CN101894564 A CN 101894564A
Authority
CN
China
Prior art keywords
sampling rate
sigma
signal
lambda
rate difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102287686A
Other languages
English (en)
Inventor
付强
颜永红
覃波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN2010102287686A priority Critical patent/CN101894564A/zh
Publication of CN101894564A publication Critical patent/CN101894564A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种采样率差异估计方法,包括下列步骤:1)分别用两个不同的设备录制同一音源获得两个相关信号x(n)和y(n);其中n是整数;2)设定采样率差异范围;3)以一定步长,在所述采样率差异范围内进行遍历;4)假定当前采样率为x(n)的实际采样率,求出x(n)与y(n)的互相关函数R12(n),并记录对应于该当前采样率的互相关函数R12(n);5)遍历结束后得出对应于最大互相关函数R12(n)的x(n)的采样率,进而得出x(n)与y(n)的采样率差异。本发明能够准确地进行采样率差异估计和校正,从而保证多通道信号处理中不同通道的音频信号流严格同步。

Description

一种采样率差异估计与校正方法 
技术领域
本发明涉及多通道信号处理技术领域。更具体地说,本发明涉及一种用于多通道信号处理中的采样率差异估计与校正方法。 
背景技术
当音频流从一个设备传输到另一个设备,在播放或者录制的过程中,总会存在一个问题:在两个设备的数模转换模块中,缺乏一个共同的时钟信号。这可能会导致信号的采样率出现不一致的情况。导致采样率出现不一致现象的原因包括:首先、产生时钟信号的晶振存在一定频率范围内的容忍度,在一些商用的数字信号处理设备中,这个容忍度可以从几十个PPM(parts per million)到上万个PPM;其次,晶振的频率可能受到温度的影响,最后,在一些便携设备中,其所需要的频率可能是从一个更高的频率通过分频得到的。由于诸如以上的这些原因,一个标称为8000Hz采样的信号,其实际采样率可能为8002Hz,或者其它频率(可参见EnriqueRobledo-Arnuncio,Ted S.Wada & Biing-Hwang(Fred)Juang,“On dealing withsampling rate mismatches in blind source separation and acoustic echo cancellation”,2007IEEE Workshop on Application of Signal Processing to Audio and Acoustics,pp.34-37)。 
在现有技术中,比如说VOIP中,可以在那些不为人耳感知的语音段插入一些零值样点或者删除一些样点,从而克服采样率差异的影响,进而保证音频信号流的同步。 
另外,在一些更为复杂的应用中,比如涉及到多路信号处理的应用中,如盲源信号分离,自适应噪声消除等应用,仅仅保证信号的同步并不能满足算法的需要。当音频信号来自多个不同的采样设备时,在经过算法处理之前,必须保证多路信号的采样率是一致的,而现有的信号分离或者自适应噪声消除系统,并没有考虑采样率差异的影响。因此,迫切需要一种能够进行采样率差异估计和校正的方法。 
发明内容
本发明的目的是提供一种能够进行采样率差异估计和校正的方法,进而保证多通道信号处理中不同通道的音频信号流严格同步。 
为实现上述发明目的,本发明提供了一种采样率差异估计方法,包括下列步骤: 
2、采样率差异估计方法,包括下列步骤: 
1)分别用两个不同的设备录制同一音源获得两个相关信号x(n)和y(n);其中n是整数,表示相关信号x(n)和y(n)的采样点编号; 
2)设定采样率差异范围; 
3)以一定步长,在所述采样率差异范围内进行遍历; 
4)假定当前采样率为x(n)的实际采样率,求出x(n)与y(n)的互相关函数R12(n),并记录对应于该当前采样率的互相关函数R12(n); 
5)遍历结束后得出对应于最大互相关函数R12(n)的x(n)的采样率,进而得出x(n)与y(n)的采样率差异。 
其中,所述步骤4)中,计算出x(n)与y(n)的互相关函数R12(n)的方法如下: 
X1(w)=FFT(x(n)) 
X2(w)=FFT(y(n)) 
G 2 ( w ) = X 1 ( w ) X 2 * ( w )
R 12 ( n ) = 1 2 π ∫ - ∞ + ∞ G 12 ( w ) | G 12 ( w ) | λ e jwn dw
&lambda; = &lambda; 0 &sigma; < &sigma; 0 &lambda; 1 - &lambda; 0 &sigma; 1 - &sigma; 0 ( &sigma; - &sigma; 1 ) + &lambda; 1 &sigma; 0 < &sigma; < &sigma; 1 &lambda; 1 &sigma; > &sigma; 1
其中,σ代表相关信号x(n)和y(n)的信噪比。 
与现有技术相比,本发明能够准确地进行采样率差异估计和校正,从而保证多通道信号处理中不同通道的音频信号流严格同步。 
附图说明
图1是采样率差异估计和校正应用于BSS(盲源信号分离)/ANC(自适应噪声消除)系统的示意图; 
图2是无采样率差异时,噪声信号在自适应噪声消除前后的对比示意图; 
图3是采样率差异为1HZ时,噪声信号在自适应噪声消除前后的对比示意图; 
图4是采样率差异为2HZ时,噪声信号在自适应噪声消除前后的对比示意图; 
图5是采样率差异为5HZ时,噪声信号在自适应噪声消除前后的对比示意图; 
图6是本发明一个实施例中的采样率差异估计与校正方法的流程图; 
图7是用以进行采样率差异估计时的两段信号的波形图,下面一段信号被噪声干扰,信噪比为-10dB; 
图8是采样率差异估计结果图,结果等于虚线坐标与实线坐标之差。 
具体实施方式
本发明提供了一种采样率差异估计与校正方法,图1是采样率差异估计和校正应用于BSS(盲源信号分离)/ANC(自适应噪声消除)系统的示意图,图中两路信号的标称采样率相同,均为fs,但实际上,两者的真实采样率却不是fs,在这种情况下,进行多通道信号处理的时,多通道信号处理算法的性能会受到影响。图2、3、4、5中给出了当采样率存在各种差异和不存在差异时,自适应噪声消除算法的性能表现,可以发现,当存在采样率差异时,自适应噪声消除存在非常大的噪声残差,并且,采样率差异越大,残余的噪声越多。 
本发明进行采样率差异估计的原理如下:同样长度的两相关信号,当它们之间的采样率差异越大时,它们的相关性就越小,表现为R12(n)的值就越小;反之,它们的相关性就越大,R12(n)的值越大(R12(n)在下文中的公式2中有详细说明)。所以当两路相关信号的采样率一致时,其互相关函数的最大值取得最大值。为此,选取两路信号中的其中一路,将它从标称的采样率向某个范围的采样率重新采样,每次重采样之后,与另一路信号求互相关函数,记录每次互相关函数的最大值。在这些最大值构成的序列中,最大值对应的目标采样率作为信号的真实采样率。 
下面结合附图和具体实施例对本发明做进一步地描述。 
如图6所示,x(n)和y(n)是由两个不同的设备录制同一音源获得的用于多通道信号处理的两个相关信号,二者标称的的采样率均为fs,而实际的采样率可能并不一致,而且,x(n)和y(n)中还可能混入了干扰噪声,表达式如下式(1)所示。 
x(n)=s1(n)+n1(n)  (1) 
y(n)=s2(n)+n2     (n) 
其中,s1(n),s2(n)是同一音源到达不同设备被录制的信号,n1(n),n2(n)是到达录音设备的干扰信号。 
由于噪声的影响,直接计算x(n)和y(n)时域的互相关函数,其最大值往往不能准确反映s1(n),s2(n)的相关性,尤其在噪声n1(n),n2(n)也具有较强的相关性时,时域相关函数的最大值可能反应的是噪声之间的相关性。 
本实施例中提出了一种改进的相位变换算法(IPHAT),用于计算两段相关信号 的互相关函数的最大值及其对应坐标。IPHAT算法的完整描述如下: 
X1(w)=FFT(x(n)) 
X2(w)=FFT(y(n)) 
G 12 ( w ) = X 1 ( w ) X 2 * ( w )
R 12 ( n ) = 1 2 &pi; &Integral; - &infin; + &infin; G 12 ( w ) | G 12 ( w ) | &lambda; e jwn dw - - - ( 2 )
&lambda; = &lambda; 0 &sigma; < &sigma; 0 &lambda; 1 - &lambda; 0 &sigma; 1 - &sigma; 0 ( &sigma; - &sigma; 1 ) + &lambda; 1 &sigma; 0 < &sigma; < &sigma; 1 &lambda; 1 &sigma; > &sigma; 1
这里σ代表信噪比。 
也就是互相关信号x(n)和y(n)的信噪比。 
λ是计算两相关信号互相关函数公式的一个参数,它与信号的信噪比有关。λ0表示λ的下限值,λ1表示λ的上限值;σ0表示σ的下限值,σ1表示σ的上限值。λ0、λ1、σ0、σ1是根据经验得出的。 
在一个优选实施例中,λ0=0.35;λ1=0.85;σ0=0dB;σ0=20dB。 
利用IPHAT算法计算出x(n)与y(n)的互相关函数R12(n)以后,由下面的方法计算x(n)与y(n)之间的整数点采样率差异。 
for Δf=-20∶1∶20          //采样率差异范围定义为±20Hz以内 
f=fs+Δf; 
x1=resample(x,f,fs);     //将x从采样率fs重采样到f 
Rxy=xcorr(x1,y);          //计算x1和y的互相关函数 
d(Δf+21)=max(Rxy);        //求Rxy的最大值 
end 
[max,index]=max(d); 
采样率差异为 
Δfs=index-21; 
其中,Index对应序列d中,最大值对应的时间序数,即序列d中第几个值是序列的最大值。 
上述伪代码的含义是:在标称采样率的±20Hz范围内,即从fs-20Hz到fs+20Hz的范围内,以1Hz为步长,对每一个频率,将信号x从采样率fs重采样到该频率,然后计算信号y与重采样之后的信号之间的互相关函数的最大值d(i),i对应于坐标值,i=1,2,3…,对于这41个频率,会产生41个最大值d(i)构成的序列,找出d(i) 中的最大值对应的坐标,该坐标减去21,即得到两信号的整数点的采样率差异值。 
在求出整数点的采样率差异以后,如果需要更精确地确定两段信号之间的采样率差异,本实施例中还进一步地提出了一种基于sinc函数内插的方法,对IPHAT算法求出的一系列R12(n)的最大值进行连续时间域的重构,得出由最大值序列重构的连续时间信号,通过找出重构连续信号的最大值,从而确定更精确的最大值坐标,来找到分数阶的采样率差异。计算公式如下: 
设上述利用IPHAT算法求出的各个采样率下,两信号相关函数的最大值组成的序列为d(n),则重构连续时间信号的公式为
d ~ ( t ) = &Sigma; n = n 0 - M n 0 + M d ( n ) sin c ( t - n ) - - - ( 4 )
[ index , max _ value ] = max ( d ~ ( t ) )
通过(4)式,求出重构的连续时间信号d(t)的最大值的坐标之后,该坐标与无采样率差异时最大值应在的坐标作差,即可确定采样率差异。使用两段采样率差异为1Hz的测试信号,采用本实施例的方法进行采样率差异估计的结果如图8所示。 
在计算出两路信号之间的采样率差异以后,以fs为基准,对其中一路信号进行重采样校正,重采样步骤可以利用polyphase滤波器组实现,(该技术可参见A.V.奥本海姆,R.W.谢弗,J.R.巴克,“离散时间信号处理”,第二版,P146~P150)。之前说过,两路信号的采样率可能都不是fs,这里假设两个采样率分别为:f1,f2,两者之间的采样率差异为Δf=f2-f1,以fs为基准,根据估计出的采样率差异(这里默认估计准确),把信号x(n)进行采样率转换,转换后的采样率为: 
f 1 &prime; = f 1 * ( f s + &Delta;f ) / f s
此时,重采样之后的x(n)与y(n)之间的采样率差异为: 
&Delta;f &prime; = f 2 - f 1 &prime; = f 2 - f 1 * ( f s + &Delta;f ) / f s
= ( f 2 - f 1 ) ( f s - f 1 ) / f s
< < f 2 - f 1
式中“<<”表示远远小于。 
以下是本实施例的采样率差异估计与校正方法的应用说明 
1、该方法默认不同设备的采样率差异在20Hz以内,或者说该方法仅对采样率差异在20Hz以内的情况适用; 
2、采样率差异估计必须是针对相关信号的应用,比如说我们提出的BSS/ANC, 进行IPHAT的两路信号中,必须含有来自同一源的信号,而且,信号之间的延时差,不应超过进行分析的信号长度的1/3。 
3、为考察该方法的性能,在没有cross-talk的情况下,定义一个变量ENR(errorto noise ratio) 
ENR = 10 * log 10 ( E ( e 2 ) E ( n 2 ) )
其中,e为残余噪声,n为初始噪声 
这里给出针对语音信号,采样率从0Hz变为10Hz时,ENR的变化, 
表1 
          0Hz     1Hz     2Hz     3Hz     4Hz     5Hz     6Hz     7Hz     8Hz     9Hz 
ENR1(dB)  -37.28  -16.08  -11.18  -8.11   -6.18   -3.39   -2.57   -2.29   -1.91   -1.47 
ENR2(dB)  -37.28  -37.34  -37.09  -37.26  -37.26  -37.16  -37.03  -37.14  -37.03  -37.15 
其中,ENR1代表未进行采样率差异调整时的值,ENR2代表进行采样率差异调整以后的值。 
4、在实际环境中,带有cross-talk的情况下,考查ANC算法的性能,两路采用两种设备录制,一个为电脑声卡,一个为爱国者录音笔,结果如下: 
校正之前:ENR=-12.516dB 
校正之后,ENR=-16.338dB 。

Claims (2)

1.一种采样率差异估计方法,包括下列步骤:
1)分别用两个不同的设备录制同一音源获得两个相关信号x(n)和y(n);其中n是整数;
2)设定采样率差异范围;
3)以一定步长,在所述采样率差异范围内进行遍历;
4)假定当前采样率为x(n)的实际采样率,求出x(n)与y(n)的互相关函数R12(n),并记录对应于该当前采样率的互相关函数R12(n);
5)遍历结束后得出对应于最大互相关函数R12(n)的x(n)的采样率,进而得出x(n)与y(n)的采样率差异。
2.根据权利要求1所述的采样率差异估计方法,其特征在于,所述步骤4)中,计算出x(n)与y(n)的互相关函数R12(n)的方法如下:
X1(w)=FFTx((n))
X2(w)=FFT(y(n))
G 12 ( w ) = X 1 ( w ) X 2 * ( w )
R 12 ( n ) = 1 2 &pi; &Integral; - &infin; + &infin; G 12 ( w ) | G 12 ( w ) | &lambda; e jwn dw
&lambda; = &lambda; 0 &sigma; < &sigma; 0 &lambda; 1 - &lambda; 0 &sigma; 1 - &sigma; 0 ( &sigma; - &sigma; 1 ) + &lambda; 1 &sigma; 0 < &sigma; < &sigma; 1 &lambda; 1 &sigma; > &sigma; 1
其中,σ代表相关信号x(n)和y(n)的信噪比。
CN2010102287686A 2010-07-09 2010-07-09 一种采样率差异估计与校正方法 Pending CN101894564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102287686A CN101894564A (zh) 2010-07-09 2010-07-09 一种采样率差异估计与校正方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102287686A CN101894564A (zh) 2010-07-09 2010-07-09 一种采样率差异估计与校正方法

Publications (1)

Publication Number Publication Date
CN101894564A true CN101894564A (zh) 2010-11-24

Family

ID=43103735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102287686A Pending CN101894564A (zh) 2010-07-09 2010-07-09 一种采样率差异估计与校正方法

Country Status (1)

Country Link
CN (1) CN101894564A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104125534A (zh) * 2013-07-18 2014-10-29 中国传媒大学 一种多声道音频同步录制及播出方法以及相应的系统
CN104364844A (zh) * 2012-06-08 2015-02-18 英特尔公司 针对长延迟回声的回声消除算法
CN106888021A (zh) * 2017-03-06 2017-06-23 江苏正赫通信息科技有限公司 一种自适应调整高速采样速率的方法
CN111341302A (zh) * 2020-03-02 2020-06-26 苏宁云计算有限公司 一种语音流采样率确定方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645273A (zh) * 2009-07-10 2010-02-10 中国科学院声学研究所 一种采样率差异估计与校正系统及其处理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101645273A (zh) * 2009-07-10 2010-02-10 中国科学院声学研究所 一种采样率差异估计与校正系统及其处理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104364844A (zh) * 2012-06-08 2015-02-18 英特尔公司 针对长延迟回声的回声消除算法
CN104125534A (zh) * 2013-07-18 2014-10-29 中国传媒大学 一种多声道音频同步录制及播出方法以及相应的系统
CN106888021A (zh) * 2017-03-06 2017-06-23 江苏正赫通信息科技有限公司 一种自适应调整高速采样速率的方法
CN111341302A (zh) * 2020-03-02 2020-06-26 苏宁云计算有限公司 一种语音流采样率确定方法及装置
CN111341302B (zh) * 2020-03-02 2023-10-31 苏宁云计算有限公司 一种语音流采样率确定方法及装置

Similar Documents

Publication Publication Date Title
CN101645273B (zh) 一种采样率差异估计与校正系统及其处理方法
KR101434200B1 (ko) 혼합 사운드로부터의 음원 판별 방법 및 장치
KR101831078B1 (ko) 보이스 활성화 탐지 방법 및 장치
CN101957443B (zh) 声源定位方法
WO2007015818A3 (en) Voice over ip analysis system and method
JP6591477B2 (ja) 信号処理システム、信号処理方法及び信号処理プログラム
CN101894564A (zh) 一种采样率差异估计与校正方法
JP2007235646A (ja) 音源分離装置、方法及びプログラム
US10206034B2 (en) Sound field collecting apparatus and method, sound field reproducing apparatus and method
JP6646677B2 (ja) 音声信号処理方法および装置
WO2015183390A1 (en) Positioning in indoor locations and other gps-denied environments
da Silva et al. Design Considerations When Accelerating an FPGA‐Based Digital Microphone Array for Sound‐Source Localization
JP2009515196A (ja) スペクトル・トレースを発生するデータ圧縮
JP2007141227A5 (zh)
CN107728104A (zh) 一种改进的卫星导航干扰测向方法
JP4462063B2 (ja) 音声処理装置
Huang et al. Resolution doubled co-prime spectral analyzers for removing spurious peaks
Liang et al. Doppler chirplet transform for the velocity estimation of a fast moving acoustic source of discrete tones
CN114726727A (zh) 一种时延调整方法、装置、存储介质及电子装置
CN114035157B (zh) 一种基于期望最大化算法的分频带时延估计方法及其系统
CN105917244B (zh) 将脉冲源定位在色散介质中的方法
CN109874084A (zh) 声音成分提取方法及系统
JP5253026B2 (ja) 信号分離装置及び信号分離方法
CN111899749A (zh) 一种监听混凝土泵送管道作业声音的降噪方法
CN108833320B (zh) 一种基于Keystone变换的宽带DS/FH信号参数估计方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101124