CN1188547A - 一种功率谱密度估计方法及设备 - Google Patents

一种功率谱密度估计方法及设备 Download PDF

Info

Publication number
CN1188547A
CN1188547A CN 96194920 CN96194920A CN1188547A CN 1188547 A CN1188547 A CN 1188547A CN 96194920 CN96194920 CN 96194920 CN 96194920 A CN96194920 A CN 96194920A CN 1188547 A CN1188547 A CN 1188547A
Authority
CN
China
Prior art keywords
mentioned
lpc
group
signal vector
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 96194920
Other languages
English (en)
Inventor
P·黑德尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Priority to CN 96194920 priority Critical patent/CN1188547A/zh
Publication of CN1188547A publication Critical patent/CN1188547A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Filters That Use Time-Delay Elements (AREA)

Abstract

本文提出了一种基于残余误差的补偿器,它对自回归谱估计器的频域偏差进行补偿。对残余信号进行LPC分析(16),并由所获得的LPC参数产生参数PSD估计(18)。该残余信号的PSD估计与输入信号的PSD估计相乘(20)。

Description

一种功率谱密度估计方法及设备
技术领域
该发明涉及一种建立在参数自回归模型基础上的带偏差补偿的谱估计方法及设备。
发明背景
该发明可应用于例如常规及蜂窝式电话系统的噪声抑制[1,2],其中根据单话筒测量采用自适应算法建立模型并增强带噪语音。
用谱减法的语音增强或明或暗地依赖于由带噪语音计算出的精确的功率谱密度估计。用于获得这种谱估计的传统方法是用基于快速傅里叶变换(FFT)的周期曲线图。然而,近来,提出了另一种称为参数功率谱密度估计的逼近方法,它给出了失真更小的语音输出,更好地降低噪声电平,而且残余噪声也没有令人恼火的人为噪声(音乐噪声)。对于参数功率谱密度估计的详细论述,参见文献[3,4]。
一般说来,由于模型误差的存在,在参数谱密度估计的谱图凹部会有偏差。在基于噪声消除器的谱减法的输出中,这个偏差将在背景噪声中导致一种并不希望的“级升”(level pumping)。
发明概述
该发明的一个目的就是提出一种复杂度相对较低且无数值稳定性问题的方法和设备,用来消除或降低背景噪声中的这种“级升”。通过采用根据所附权利要求的方法和设备来实施这一目的。
该发明的关键思想是:用根据参数谱模型的动态范围扩展的(或自适应的)数据来提高在基于噪音消除器的谱减法中的声频语音质量。
附图简述
通过参照以下根据附图所作的描述,可以更好地理解该发明及其另外的目的与优点;其中:
图1根据本发明的一种设备的实施例的原理图。
图2是根据本发明的另一种设备的实施例的原理图。
图3显示的是实际的功率谱密度曲线,实际功率谱密度的参数估计曲线和实际功率谱密度的偏差补偿估计曲线。
图4是另一组曲线,显示的是实际的功率谱密度曲线,实际功率谱密度的参数估计曲线和实际功率谱密度的偏差补偿估计曲线。
图5是图1所示实施例所使用的方法的流程图;
图6是图2所示实施例所使用的方法的流程图。
优选实施例详述
在所有附图中,对相应的或类似的单元使用相同的参考标号。
此外,为了简化该发明的描述,已将本发明的数学背景移到附录中。在以下描述中,正文中所提到的数字将参照附录中的相应公式。
图1显示出了根据本发明的一种设备的实施例的原理图。一帧语音数据{x(k)}送入一个LPC分析器(例如,在[5]中描述了LPC分析)。LPC分析器10确定出一组滤波器系数(LPC系数),将此系数送至PSD估计器12及逆滤波器14。PSD估计器12由LPC参数(见附录中式(11))确定输入帧{x(k)}的参数功率谱密度估计。图1中输入信号的方差不作为PSD估计器12的输入,而把一个单位信号“1”送入PSD估计器12。这样做的原因很简单。该方差只是用来改变PSD估计的比例,而且由于在最后的结果中将消去这个比例因子(见附录中式(9)),因此在PSD运算中消去此方差会使运算更简化。由PSD估计器12得到的估计将包含上述“级升”偏差。
为了补偿这种“级升”偏差,也将输入帧{x(k)}送到逆滤波器14,用于产生一个残余信号(见附录中式(7)),然后把该信号送到另一个LPC分析器16。LPC分析器16分析此残余信号,并将相应的LPC参数(方差和滤波器系数)送至一个残余PSD估计器18,它产生残余信号的参数功率谱密度估计(参见附录中式(8))。
最后输入信号与残余信号的这两种参数功率谱密度估计在一个乘法器20中分别相乘,以获得输入信号帧{x(k)}的一种偏差补偿参数功率谱密度估计(这和附录中式(9)相对应)。
实例:
考虑如下情况:帧长N=1024,AR(自回归)模型阶次p=10。下面的实际系统是采用ARMA(自回归-移动平均)过程作为模型: x ( k ) = 1 - z - 1 + 0.9 z - 2 1 - 3.0 z - 1 + 4.64 z - 2 - 4.44 z - 3 + 2.62 z - 4 - 0.77 z - b e ( k )
其中e(k)为自噪声。
图3显示的是按上式计算的实际功率谱密度(实线),PSD估计器12输出的有偏差的功率谱密度估计(点-划线)和根据本发明的偏差补偿功率谱密度估计(虚线)。从图3可清楚地看出偏差补偿功率谱密度估计总体上更接近于下面的实际功率谱密度,特别是在谷点(例如w/2λ=0.17处),偏差补偿估计(以5dB)更接近于实际功率谱密度。
在本发明的优选实施例中,还可用一个设计参数γ与偏差补偿估计相乘。图3中假定γ=1。γ一般是一个接近1的正数。在优选实施例中γ的值在附录中的算法部分给出。因而,在此情况中γ随输入帧不同而不同。图4和图3相似,只是通过γ值来改变偏差补偿估计的比例。
图1的上述实施例,其特征在于它是一种频域补偿,因为实际补偿是在频域内通过两种功率谱密度估计相乘而实现的。但是这种运算过程和时域内的卷积相对应。因此本发明有一个等同的时域实现,这一实施例如图2所示。
同图1一样,图2中输入信号送至LPC分析器10。但是,没有用获得的LPC参数进行功率谱密度估计。而将来自输入信号和残余信号的的LPC分析的滤波器参数送给卷积电路22,卷积电路22将卷积得到的参数送给PSD估计器12’,PSD估计器12’产生偏差补偿估计,可将此偏差补偿估计与γ相乘。此卷积步骤可被看作一个多项式乘法,其中,由输入信号的滤波器参数所确定的多项式与由残余信号的滤波器参数所确定的多项式相乘。所得到的多项式的系数代表了偏差补偿的LPC参数。此多项式乘积将产生一个更高阶的多项式,即产生更多的系数。但是,这没有问题,因为通常习惯于对送至PSD估计器的输入“补零”(zero pad)以获得足够数量的PSD估计的样本。现在,卷积所得的更高阶多项式的结果只是使零变少而已。
在图5和图6中给出了分别对应于图1和图2的实施例的流程图。此外,在附录中给出了相应的频域和时域算法。
数值复杂度的粗略估计可如下获得。残数滤波(7)约需Np次操作(sum+add)。e(k)的LPC分析约需Np次操作以得到协方差分量,约需p2次操作以求解相应的一组方程(3)。在两种算法(时域及频域)中,时域算法的效率是最高的,因为它只需约p2次操作以完成卷积。总地说来,偏差补偿可在2p(N+p)次操作帧中完成。例如,当n=256,p=10且有50%的帧重叠时,偏差补偿算法要求大约0.5×106指令/秒。
在这一详述中,已根据语音信号对本发明进行了描述。然而,相同的思想也可用于其它那些依赖于被测信号的参数谱估计的应用中。这些应用可用在,例如雷达、声纳、经济、光干涉仪、生物医学、振动分析、图象处理、射电天文学及海洋学等中。
熟悉本技术领域的人员将可理解,在不背离本发明的精神与范围的前题下,可对这项发明作各种修正和变更,它们将由附属权利要求所确定。
参考文献S.F.Boll,"Suppression of Acoustic Noise in SpeechUsing Spectrai subtraction",IEEE Transactions onAcoustics,Speech and Signai Processing,Vol.ASSP-27,April 1979,pp 113-120.J.S.Lim and A.V.Oppenheim,"Enhancement and BandwidthCompression of Noisy Speech",Proceedings of the IEEE,Vcl.67,No.12,December 1979,pp.1586-1604.S.M.Kay,Modern Spectral estimation:Theory and Appli-cation,Prentice Hall,Englewood Cliffs,NJ,1988,pp237-240.J.G.Proakis et al,Advanced Digital Signal Processing,Macmillam Publishing Company,1992,pp.498-510.J.G.Proakis,Digital Communications,MacGraw Hill,1989,pp.101-110.P.Handel et al,"Asymptotic variance of the AR spectralestimator for noisy sinusoidal data",Signal Processing,Vol.35,No.2,January 1994,pp.131-139.
附录
考虑一种实信号{x(k)},k=1……N,其均值为0,N表示帧长(例如N=160)。其自回归谱估计(ARSPE)如下,见文献[3,4] φ ^ x ( ω ) = σ ^ x 2 | A ^ ( e iω ) | 2 - - - ( 1 ) 其中ω为角频率,ωε(0,2π)。在(1)式中 为: A ^ ( z ) = 1 + a ^ 1 z + · · · + a ^ 2 z p - - - ( 2 ) 其中 θ ^ x = ( a ^ 1 · · · a ^ p ) T 是估计的AR系数(由LPC分析得到,参见[5]),
Figure A9619492000095
是残余误差方差。如下可由{x(k)}计算估计的参数矢量
Figure A9619492000096
θ ^ x = - R ^ - 1 r ^ - - - ( 3 ) σ ^ x 2 = r ^ 0 + r ^ T θ ^ x 其中
Figure A96194920000910
其中 r ^ k = 1 N Σ t = 1 N - k x ( t + k ) x ( t ) r ^ - k = r ^ k k = 0 . . . . , p - - - ( 5 )
线性方程组(3)可用LevinSen-Durbin算法求解,参见文献〔3〕。我们知道,(1)式的谱估计是平滑的,文献〔6〕分别地对宽带及带噪窄带信号分析了谱估计的统计特征。
通常,由于模型误差,在谱图凹部会有一些偏差。此偏差可粗略地表示为:
Figure A96194920000912
其中
Figure A9619492000101
是(1)式的估计,而
Figure A9619492000102
是x(k)的实际(也是未知的)功率谱密度。
为了减小出现在谱图凹部的偏差,可根据下式计算出残差: ϵ ( k ) = A ^ ( z - 1 ) x ( k ) k = 1 . . . . . N - - - ( 7 ) 对{ε(k)}进行另一个LPC分析,参照(1)式,残余功率谱密度可由下式得出: φ ^ ϵ ( ω ) = σ ^ ϵ 2 | B ^ ( e iω ) | 2 - - - ( 8 )
同(2)式类似, θ ^ ϵ = ( b ^ 1 · · · b ^ q ) T 表示估计的AR系数, 表示误差的方差。一般,模型阶次q≠p,但在这里让p=q是合理的。优选 p ≈ N , 例如N可选取在10左右。
在下面提出的频域算法中,频域算法如下,根据下式对(1)进行补偿: φ ^ x ( ω ) = γ σ ^ x 2 · φ ^ ϵ ( ω ) · φ ^ x ( ω ) - - - ( 9 )
其中γ(≈1)是一个设计变量。频域算法被总结到下面的算法部分和图1,图5的原理图中。
一种对应的时域算法也被总结在算法部分及附图2、6中。在此情况中,在卷积步骤中实现了补偿,其中对LPC滤波器系数 进行了补偿了。由于PSD估计被一个较不复杂的卷积代替,所以该实施例效率更高。该实施例中比例因子γ可简单地设定成一个接近或等于1的常数。但是,也可以对每一帧算出γ,如在频域算法中,通过计算由
Figure A96194920001010
确定的特征多项式的最靠近单位圆的特征根而得到。若这个根的角度表示为ω,则: max k φ ^ ϵ ( k ) = σ ^ ϵ 2 | B ^ ( e iω - ) | 2
             算法输入x输入数据x=(x(1)…x(N))Tp LPC模型阶次输出:
Figure A9619492000111
信号LPC参数 θ ^ x = ( a ^ 1 · · · a ^ p ) T
Figure A9619492000113
信号LPC残数方差
Figure A9619492000114
信号LPC谱 φ ^ x = ( φ ^ x ( 1 ) · · · φ ^ x ( N / 2 ) T
Figure A9619492000116
补偿的LPC谱 φ ^ x = ( φ ^ x ( 1 ) · · · φ ^ x ( N / 2 ) ) T ε残数ε=(ε(1)…ε(N))T
Figure A9619492000118
残余LPC参数 θ ^ ϵ = ( b ^ 1 · · · b ^ q ) T
Figure A96194920001110
残余LPC误差方差γ设计变量(在优选实施例中=
Figure A96194920001111
频域算法对每一帧执行如下步骤:(功率谱密度估计) | θ ^ x , σ ^ x 2 | : = LPCanaivze ( x , p ) 信号的LPC分析 φ ^ x : = SPEC ( θ ^ x , 1 , N ) 信号的谱估计, 设为1(偏差补偿) ϵ : = FILTER ( θ ^ x , x ) 残余滤波 | θ ^ ϵ , σ ^ ϵ 2 | : = LPCanalyze ( ϵ , p ) 残余LPC分析 φ ^ ϵ : = SPEC ( θ ^ ϵ , σ ^ ϵ 2 , N ) 残余谱估计FORk=1 TO N/2 DO    谱补偿 φ ^ x ( k ) : = γ · φ ^ x ( k ) · φ ^ ϵ ( k ) 1 / ( ma x k φ ^ ϵ ( k ) ) ≤ γ ≤ 1 END FOR
时域算法对每一帧执行如下步骤: | θ ^ x , σ ^ x 2 | : = LPCanalyze ( x , p ) 信号的LPC分析 ϵ : = FILTER ( θ ^ x , x ) 残余滤波 | θ ^ ϵ , σ ^ ϵ 2 | : = LPCanalyze ( ϵ , p ) 残余LPC分析 θ : ^ = CONV ( θ ^ x , θ ^ ϵ ) LPC补偿 φ ^ : = SPEC ( θ ^ , σ ^ ϵ 2 , N ) 谱估计FOR K=1 TO N/2 DO φ ‾ x ( k ) : = γ · φ ^ ( k ) 比例调整END FOR

Claims (10)

1.一种功率谱密度估计方法,包括步骤有:
对输入信号矢量进行LPC分析以确定第一组LPC滤波器参数;
根据所说第一组LPC滤波器参数确定上述输入信号的第一功率谱密度估计;
通过一种由上述第一组LPC滤波器参数所确定的逆滤波器对上述输入信号向量进行滤波,得到一残余信号向量,对上述残余信号向量进行LPC分析,以确定出第二组LPC滤波器参数;
根据上述第二组LPC滤波器参数,确定出上述残余信号向量的第二功率谱密度估计;
产生上述输入信号向量的带偏差补偿的功率谱估计,该估计和上述第一与第二功率谱估计的乘积成比例。
2.根据权利要求1的方法,其中上述乘积还要和一个小于或等于1的正比例因子相乘。
3.根据权利要求2的方法,其中上述比例因子是上述第二功率谱密度估计的最大值的倒数值。
4.根据权利要求1、2、3的方法,其中所说的输入信号向量包括语音样本。
5.一种功率谱密度估计方法,包括步骤有:
对输入信号向量进行LPC分析,以确定第一组LPC滤波器参数;
通过上述第一组LPC滤波器参数所确定的逆滤波器对上述输入信号向量进行滤波,得到一残余信号向量,
对该残余信号向量进行LPC分析,以确定第二组LPC滤波器参数;
对上述第一组LPC滤波器参数与上述第二组LPC滤波器参数进行卷积,可产生一组补偿的LPC滤波器参数;
根据上述一组补偿的LPC滤波器参数可得到上述输入信号向量的偏差补偿功率谱密度估计。
6.根据权利要求5的方法,其中所说偏差补偿功率谱密度估计还要和一个小于或等于1的正比例因子相乘。
7.根据权利要求6的方法,其中所说比例因子是上述残余信号向量的功率谱密度估计的最大值的倒数值。
8.根据权利要求5、6、7的方法,其中所说的输入信号向量包括语音样本。
9.一种功率谱密度估计设备,包括:
装置(10),用于对输入信号向量进行LPC分析以确定出第一组LPC参数;
装置(12),用于根据第一组LPC参数确定上述输入信号向量的第一功率谱密度估计;
装置(14),用于通过由上述第一组LPC参数所确定的逆滤波器对上述输入信号向量进行滤波,以获得残余信号向量;
装置(16),用于对上述残余信号向量进行LPC分析以确定出第二组LPC参数;
装置(18)用于根据第二组LPC参数确定上述残余信号向量的第二功率谱密度估计;
装置(20),用于产生上述输入信号向量的偏差补偿功率谱密度估计,该估计与第一种和第二种功率谱估计的乘积成比例。
10.一种功率谱密度估计设备,包括:
装置(10),用于对输入信号向量进行LPC分析,以确定出第一组LPC滤波器参数;
装置(14),用于通过由上述LPC滤波器参数所确定的逆滤波器对输入信号进行滤波,以获得一残余信号向量;
装置(16),用于对上述残余信号向量进行LPC分析,以确定出第二组LPC滤波器参数;
装置(22),用于对上述第一组及第二组LPC滤波器参数进行卷积以产生一组补偿的LPC滤波器参数;
装置(12’),用于根据上述一组补偿的LPC滤波器参数确定出上述输入信号向量的偏差补偿功率谱密度估计。
CN 96194920 1995-06-21 1996-06-07 一种功率谱密度估计方法及设备 Pending CN1188547A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 96194920 CN1188547A (zh) 1995-06-21 1996-06-07 一种功率谱密度估计方法及设备

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE9502261-2 1995-06-21
CN 96194920 CN1188547A (zh) 1995-06-21 1996-06-07 一种功率谱密度估计方法及设备

Publications (1)

Publication Number Publication Date
CN1188547A true CN1188547A (zh) 1998-07-22

Family

ID=5128900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 96194920 Pending CN1188547A (zh) 1995-06-21 1996-06-07 一种功率谱密度估计方法及设备

Country Status (1)

Country Link
CN (1) CN1188547A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106549652A (zh) * 2015-09-18 2017-03-29 杜比实验室特许公司 时域滤波中的滤波器系数更新
CN112201273A (zh) * 2019-07-08 2021-01-08 北京声智科技有限公司 一种噪声功率谱密度计算方法、系统、设备及介质
US11373670B2 (en) 2015-09-18 2022-06-28 Dolby Laboratories Licensing Corporation Filter coefficient updating in time domain filtering

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106549652A (zh) * 2015-09-18 2017-03-29 杜比实验室特许公司 时域滤波中的滤波器系数更新
US11373670B2 (en) 2015-09-18 2022-06-28 Dolby Laboratories Licensing Corporation Filter coefficient updating in time domain filtering
CN112201273A (zh) * 2019-07-08 2021-01-08 北京声智科技有限公司 一种噪声功率谱密度计算方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
Thi et al. Blind source separation for convolutive mixtures
EP1739657B1 (en) Speech signal enhancement
US7454332B2 (en) Gain constrained noise suppression
EP0809842B1 (en) Adaptive speech filter
US5400409A (en) Noise-reduction method for noise-affected voice channels
CN108172231B (zh) 一种基于卡尔曼滤波的去混响方法及系统
US6564184B1 (en) Digital filter design method and apparatus
CN1210608A (zh) 一种有噪语音参数增强的方法和装置
CN1286788A (zh) 关于低比特率语音编码器的噪声抑制
CN1193226A (zh) 回波消除法和实施这样一个过程的回波消除器
KR100347699B1 (ko) 전력스펙트럼밀도추정방법및장치
CN111243617B (zh) 一种基于深度学习降低mfcc特征失真的语音增强方法
CN103905656B (zh) 残留回声的检测方法及装置
US7917359B2 (en) Noise suppressor for removing irregular noise
JP3205560B2 (ja) オーディオ信号の調性を決定するための方法および装置
CN104729677A (zh) 一种非平稳噪声信号的时域数字计权方法
CN105869656A (zh) 一种语音信号清晰度的确定方法及装置
US9570088B2 (en) Signal processor and method therefor
EP3396670B1 (en) Speech signal processing
US20030033139A1 (en) Method and circuit arrangement for reducing noise during voice communication in communications systems
CN1188547A (zh) 一种功率谱密度估计方法及设备
Rajamani et al. A novel method for designing allpass digital filters
CN103971697B (zh) 基于非局部均值滤波的语音增强方法
CN111274534A (zh) 一种改进全泄漏抑制的短时dft插值算法
Puder Kalman‐filters in subbands for noise reduction with enhanced pitch‐adaptive speech model estimation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication