CN101908342B - 利用频域滤波后处理进行音频暂态信号预回声抑制的方法 - Google Patents

利用频域滤波后处理进行音频暂态信号预回声抑制的方法 Download PDF

Info

Publication number
CN101908342B
CN101908342B CN2010102348641A CN201010234864A CN101908342B CN 101908342 B CN101908342 B CN 101908342B CN 2010102348641 A CN2010102348641 A CN 2010102348641A CN 201010234864 A CN201010234864 A CN 201010234864A CN 101908342 B CN101908342 B CN 101908342B
Authority
CN
China
Prior art keywords
audio
filtering
frequency domain
signal
transient signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010102348641A
Other languages
English (en)
Other versions
CN101908342A (zh
Inventor
王晶
何海龙
匡镜明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN2010102348641A priority Critical patent/CN101908342B/zh
Publication of CN101908342A publication Critical patent/CN101908342A/zh
Application granted granted Critical
Publication of CN101908342B publication Critical patent/CN101908342B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种利用频域滤波后处理进行音频暂态信号预回声抑制的方法,属于音频信号处理领域,特别是在音频编码中对解码后的暂态信号进行噪声整形的后处理方法。该方法由输入的音频暂态信号的离散余弦变换系数获得频域线性预测系数,并由此得到短时后滤波器,对暂态信号的离散余弦变换系数依次进行短时后滤波和谱倾斜补偿滤波,将滤波后的频域变换系数进行离散余弦逆变换恢复得到时域信号,再进行增益调整得到经后处理的暂态信号。本发明通过对音频暂态信号频域上的滤波处理达到时域上的噪声整形效果,有效抑制暂态信号编码造成的预回声失真,增强暂态信号峰值能量,能在不需要消耗额外编码比特的情况下提高解码后音频暂态信号的听音质量。

Description

利用频域滤波后处理进行音频暂态信号预回声抑制的方法
技术领域
本发明涉及一种音频暂态信号的预回声抑制方法,尤其是一种适合于音频编码中对解码后的暂态信号进行噪声整形的后处理方法,属于音频编码技术领域。
背景技术
在感知音频编码技术中,预回声引起的失真是一个比较严重的问题,特别是当编码速率较低时,预回声失真对音质的影响将更加严重。一般地,我们可以根据时域波形上的瞬变与缓变从而将音频信号分为暂态和稳态信号。暂态信号多存在于有敲打乐器的音频序列中。在感知变换编码中,量化比特不够会带来量化失真,量化噪声会在整个时域内均匀扩散,由于人耳前向掩蔽的时间较短(一般认为0~2ms),对于暂态信号这种特殊的信号,会导致暂态之前的这段信号被量化噪声占据而无法被掩蔽,即产生所谓的预回声失真。人耳对这种失真非常敏感,它严重影响了音质。
现有的预回声抑制技术包括:(1)自适应窗切换技术。在编码端,对于稳态信号,一般采用长窗来提高频率分辨率,从而获得较高的编码效率,而当暂态信号出现的时候就切换到短窗,提高信号的时域分辨率,起到抑制预回声失真作用。该方法在很多音频编码标准中得以应用。(2)时域噪声整形技术(Temporal Noise Shaping,TNS),它是通过在编码端对信号频谱进行处理来在解码端实现时域噪声的整形。在编码端,对暂态信号的频谱系数进行线性预测分析,在解码输出端对频谱残差进行线性预测合成,可以调节误差的时域形状以适应输入信号的形状,如此便可有效地将量化噪声置于实际信号之下,起到了抑制预回声的作用。(3)比特池技术(Bit Pool)。比特池用于存储之前音频帧编码所节省下的比特,在当前音频帧的编码比特需求大于平均编码比特数时,可以使用比特池中存储的一部分或全部比特,以保证在所需编码比特数突发性增加时,编码器仍能够提供充足的比特数,实现比特的动态分配,能有效地降低预回声的影响。(4)增益调整(Gain Modification)方法。它根据暂态信号的时域采样点计算出某些增益和形状参数,利用这些参数修正时域采样点,达到对预回声的抑制作用。
Jurgen Herre和James D.Johnston在Enhancing the Performance of PerceptualAudio Coders by Using Temporal Noise Shaping(TNS)的文章中首次提出了在感知音频编码中使用TNS技术。2006年3GPP基于MPEG的AAC编码器(标准号:ISO/IEC 14496-3)提出增强的高级音频编码标准EAAC+(标准号:3GPP TS26.401),基于MDCT变换,进行暂态检测,采用长短窗切换的方法来实现稳态和暂态的可变分辨率分析,并利用TNS模块消除预回声。该模块是对暂态信号的频谱系数进行线性预测,并将预测系数编码,在解码端得到预测系数,通过对解码后的频谱残差进行合成滤波来达到时域噪声整形的目的。美国公开号为US 5781888(公开日:1998年7月14日)的专利介绍了通过频域的线性预测对时域的感知噪声整形的发明,频谱系数采用DPCM编码,滤波过程类似于TNS方法。我国公开号为CN 101388213A(公开日:2009年3月18日)的专利通过检测暂态信号中瞬变位置和瞬变强度对原始信号进行时域平坦化处理,直接对瞬变位置进行噪声抑制来控制预回声现象。
如上所述,现有的音频编码技术大多采用了时域上对音频信号帧之间进行长短窗切换的方法进行分析。而TNS技术需要在编码端将暂态信号频域的预测系数作为边信息进行编码传输,增加了编码比特数,通过对解码出的频谱残差和线性预测系数进行操作来恢复暂态信号。本发明是基于解码端的后处理,通过在解码端对音频暂态帧的频域变换系数进行后滤波处理,来达到抑制预回声的目的。
发明内容
为了解决音频暂态信号编码的预回声失真造成音频听音质量下降的问题,并且避免在编码端进行TNS噪声整形处理需要消耗额外编码比特的问题,本发明公开了一种只需要在解码端对音频暂态信号的频域变换系数进行滤波的后处理来进行预回声抑制的方法,以此改善现有音频编码对暂态信号的处理效果,相比现有的音频编码算法,能够在解码端进一步降低暂态信号的预回声失真,增强暂态峰值能量,并且相比在编码端进行TNS噪声整形的处理方法,本发明能够在不需要消耗额外编码比特的情况下提高解码后音频暂态信号的听音质量。
为了达到上述目的,本发明所述利用频域滤波后处理进行音频暂态信号预回声抑制的方法是通过下述技术方案实现的:
对输入的每帧音频暂态信号:
(1)对帧长为L的该帧音频暂态信号s1(n)进行离散余弦变换得到的离散余弦变换系数;
(2)对步骤(1)得到的离散余弦变换系数进行预设阶数p下的线性预测分析,得到频域线性预测系数ai,其中i=1,2,3,...,p;
(3)对步骤(2)得到的频域线性预测系数进行加权调整,得到如下式所示的短时后滤波器的传递函数:
H s ( z ) = A ( z / β ) A ( z / α ) = 1 - Σ i = 1 p β i a i z - i 1 - Σ i = 1 p α i a i z - i , 0<β<α<1;
其中,A(z)是线性预测多项式,α和β是预设的加权系数;
(4)用步骤(3)得到的短时后滤波器对步骤(1)得到的离散余弦变换系数进行短时后滤波操作;
(5)对步骤(4)得到的经短时后滤波的信号,按照传递函数为Ht(z)=1-μz-1,|μ|<1的滤波器进行谱倾斜补偿滤波操作,其中μ是滤波器的设计参数,μ与该帧音频暂态信号的暂态位置有关。
(6)对步骤(5)得到的进行了谱倾斜补偿滤波后的频域变换系数进行离散余弦逆变换,恢复得到时域信号s2(n);
(7)对步骤(6)恢复得到的时域信号进行增益调整,得到处理后的暂态信号帧s3(n),具体方法如下:
s3(n)=G×s2(n),n=0,1,...,L-1;
其中,G是增益调整因子,由下式获得:
G = Σ n = 0 L - 1 s 1 2 ( n ) Σ n = 0 L - 1 s 2 2 ( n ) .
对比现有技术,本发明的有益效果在于:采用本发明所述的利用频域滤波后处理进行音频暂态信号预回声抑制的方法,通过对暂态信号进行频域上的线性预测分析来构建短时后滤波器,其频率响应可以描述时域波形的起伏形状,引入谱倾斜补偿滤波用来补偿由于短时后滤波引起的谱倾斜现象,对暂态信号的频域变换系数依次进行短时后滤波和谱倾斜补偿滤波,最后经过逆变换和增益调整获得经后处理的时域信号,这个处理过程能够抑制暂态信号编码引起的预回声失真,且增强暂态信号的峰值能量,从而提高解码后暂态信号的听音质量;采用本发明所述方法不需要消耗额外的编码比特,只需要对解码后的暂态信号进行本发明技术方案所述的操作就可以提高解码后音频暂态信号的听音质量。本发明技术方案对音频暂态信号进行后滤波处理,通过频域上的滤波处理达到时域上的噪声整形效果,有效抑制暂态信号编码造成的预回声失真,增强暂态信号峰值能量,这种方法能够在不需要消耗额外编码比特的情况下提高解码后音频暂态信号的听音质量。
附图说明
图1本发明方法的系统组成框图;
图2本发明所述后处理前后的暂态信号帧时域对比图,其中(a)为原始暂态信号帧;(b)为编解码之后的暂态帧;(c)为利用本方法后处理之后的暂态帧。
具体实施方式
下面结合附图和实施例对本发明作进一步描述。
通过对典型的音频暂态信号(响板序列,单声道、44.1kHz采样率、16bit样本精度,编码速率32kbps)进行编解码之后的信号进行后处理的实验,观察本发明所述利用频域滤波后处理方法进行音频暂态信号预回声抑制的效果。
本发明的具体实施如下:
在解码端将编解码之后的音频暂态信号进行分帧处理,帧长为20ms,帧间交叠50%;
在解码端根据编码暂态标志位来判断数据帧是否为暂态,若是稳态帧,则不作处理;若是暂态帧,则按照如下所述步骤进行后处理;
第1步:对输入的每帧音频暂态信号作离散余弦变换得到离散余弦变换系数;
第2步:对上一步中得到的离散余弦变换系数进行10阶的线性预测分析得到频域的线性预测系数;利用线性预测分析得到频域的线性预测系数的方法可参考杨行峻等所著《语音信号数字处理》一书;预设的阶数应使得到的线性预测系数能够反应谱变化的特征;
第3步:对上一步中得到的频域线性预测系数进行加权调整得到短时后滤波器如下式所示:
H s ( z ) = A ( z / β ) A ( z / α ) = 1 - Σ i = 1 p β i a i z - i 1 - Σ i = 1 p α i a i z - i , 0<β<α<1;
其中,A(z)是线性预测多项式,ai为步骤(1)得到的频域线性预测系数,p为线性预测的阶数,本实施例中p=10,α和β是加权系数,α=0.95,β=0.2;
第4步:对第三步得到的离散余弦变换系数用上面的短时后滤波器进行短时后滤波操作;
第5步:对由上一步得到的经短时后滤波的信号按照Hl(z)=1-μz-1,μ=-0.3K1的滤波器形式进行谱倾斜补偿滤波操作,所述的谱倾斜补偿滤波类似操作可参考《信号处理》2007年10月第23卷第5期《自适应后滤波技术在波形内插编码算法中的应用》一文,μ根据每帧音频暂态信号的暂态位置自适应变化,第一反射系数K1的符号与暂态的位置相关,暂态在前K1为负,暂态在后K1为正;
其中μ是滤波器的参数,其自适应于第一反射系数K1,第一反射系数的一种获得方法如下式所示:
K 1 = - Σ n = 1 N - 1 S ( n + 1 ) S ( n ) Σ n = 1 N S 2 ( n ) ;
其中,S(n)是第三步求得的离散余弦变换系数;第一反射系数K1也可以通过线性预测系数递推得到;
第6步:对上一步得到的滤波后的频域变换系数进行离散余弦逆变换恢复得到时域信号;
第7步:对上一步恢复得到的时域信号进行增益调整得到经后处理的暂态信号。
s3(n)=G×s2(n),n=0,1,...,L-1;
其中,s2(n)是第6步恢复得到的时域信号,s3(n)是经后处理的暂态信号,L是暂态信号的长度,G是增益调整因子如下式所示:
G = Σ n = 0 L - 1 s 1 2 ( n ) Σ n = 0 L - 1 s 2 2 ( n ) ;
其中s1(n)是第1步中输入的每帧音频暂态信号;
第7步的目的在于使后滤波的信号能量与滤波前的信号能量大致相同;
最后,将后处理的音频暂态信号帧与其他信号帧按编码顺序依次叠接相加,得到进行噪声整形后的暂态信号。
实施例测试结果如下表所示:
表1主观A-B比较测试
Figure BSA00000202508400062
我们做了一个主观A-B比较测试,此测试邀请了20个听音人(10男10女),选取6段长约10s的暂态音频样本,来对本专利所提出的后处理方法进行验证。我们选择G.719编解码器在32kbps速率(低速率)下对这些暂态信号进行编解码,并将其与用本专利所提出的后处理方法处理之后的信号进行比较。向听音人展示的A、B信号是两类信号的随机排列,由听音人进行主观评价选择偏好A信号或是B信号。测试结果如表1所示,结果表明有平均55%的听音人偏好后处理之后的暂态信号,有平均19.2%的听音人偏好直接编解码之后未经处理的暂态信号。通过听音测试,可见本专利所提出的后处理方法能较好的抑制预回声,提高暂态音频信号的编码质量。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.利用频域滤波后处理进行音频暂态信号预回声抑制的方法,其特征在于,对输入的每帧音频暂态信号,包含如下步骤:
(1)对帧长为L的该帧音频暂态信号s1(n)进行离散余弦变换得到离散余弦变换系数;
(2)对步骤(1)得到的离散余弦变换系数进行预设阶数p下的线性预测分析,得到频域线性预测系数ai,其中i=1,2,3,...,p;
(3)对步骤(2)得到的频域线性预测系数进行加权调整,得到如下式所示的短时后滤波器的传递函数:
H s ( z ) = A ( z / β ) A ( z / α ) = 1 - Σ i = 1 p β i a i z - i 1 - Σ i = 1 p α i a i z - i , 0<β<α<1;
其中,A(z)是线性预测多项式,α和β是预设的加权系数;
(4)用步骤(3)得到的传递函数所构成的短时后滤波器对步骤(1)得到的离散余弦变换系数进行短时后滤波操作;
(5)对步骤(4)得到的经短时后滤波的信号,按照传递函数为Ht(z)=1-μz-1,|μ|<1的滤波器进行谱倾斜补偿滤波操作,其中μ是滤波器的设计参数,μ与该帧音频暂态信号的暂态位置有关;
(6)对步骤(5)得到的进行了谱倾斜补偿滤波后的频域变换系数进行离散余弦逆变换,恢复得到时域信号s2(n);
(7)对步骤(6)恢复得到的时域信号进行增益调整,得到处理后的暂态信号帧s3(n),具体方法如下:
s3(n)=G×s2(n),n=0,1,...,L-1;
其中,G是增益调整因子。
2.根据权利要求1所述的利用频域滤波后处理进行音频暂态信号预回声抑制的方法,其特征在于,步骤(7)中增益调整因子G由下式获得:
G = Σ n = 0 L - 1 s 1 2 ( n ) Σ n = 0 L - 1 s 2 2 ( n ) .
CN2010102348641A 2010-07-23 2010-07-23 利用频域滤波后处理进行音频暂态信号预回声抑制的方法 Expired - Fee Related CN101908342B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102348641A CN101908342B (zh) 2010-07-23 2010-07-23 利用频域滤波后处理进行音频暂态信号预回声抑制的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102348641A CN101908342B (zh) 2010-07-23 2010-07-23 利用频域滤波后处理进行音频暂态信号预回声抑制的方法

Publications (2)

Publication Number Publication Date
CN101908342A CN101908342A (zh) 2010-12-08
CN101908342B true CN101908342B (zh) 2012-09-26

Family

ID=43263782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102348641A Expired - Fee Related CN101908342B (zh) 2010-07-23 2010-07-23 利用频域滤波后处理进行音频暂态信号预回声抑制的方法

Country Status (1)

Country Link
CN (1) CN101908342B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
CN110169041B (zh) * 2016-12-30 2022-03-22 哈曼贝克自动系统股份有限公司 一种声回波消除的方法和系统
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
CN109584902B (zh) * 2018-11-30 2021-07-23 广州市百果园信息技术有限公司 一种音乐节奏确定方法、装置、设备及存储介质
CN109872723A (zh) * 2019-03-19 2019-06-11 深圳睿捷科技服务有限公司 基于人工智能的楼宇信息处理方法及装置
CN114564831B (zh) * 2022-02-28 2022-09-20 南方电网科学研究院有限责任公司 一种带通滤波器的电磁暂态建模方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136202A (zh) * 2006-08-29 2008-03-05 华为技术有限公司 音频信号处理系统、方法以及音频信号收发装置
EP1953739A2 (de) * 2005-04-28 2008-08-06 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Geräuschunterdrückung
CN101308655A (zh) * 2007-05-16 2008-11-19 展讯通信(上海)有限公司 一种音频编解码方法与装置
CN101388213A (zh) * 2008-07-03 2009-03-18 天津大学 一种预回声控制方法
EP2109098A2 (en) * 2006-10-25 2009-10-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
CN101694773A (zh) * 2009-10-29 2010-04-14 北京理工大学 一种基于tda域的自适应窗切换方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1953739A2 (de) * 2005-04-28 2008-08-06 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Geräuschunterdrückung
CN101136202A (zh) * 2006-08-29 2008-03-05 华为技术有限公司 音频信号处理系统、方法以及音频信号收发装置
EP2109098A2 (en) * 2006-10-25 2009-10-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
CN101308655A (zh) * 2007-05-16 2008-11-19 展讯通信(上海)有限公司 一种音频编解码方法与装置
CN101388213A (zh) * 2008-07-03 2009-03-18 天津大学 一种预回声控制方法
CN101694773A (zh) * 2009-10-29 2010-04-14 北京理工大学 一种基于tda域的自适应窗切换方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
.音频编码中瞬态信号的时域检测方法.《电子与信息学报 》.2006,
窦维蓓
董在望
阎建新
音频编码中瞬态信号的时域检测方法;阎建新; 窦维蓓; 董在望;;《电子与信息学报 》;20060228;全文 *

Also Published As

Publication number Publication date
CN101908342A (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
CN101908342B (zh) 利用频域滤波后处理进行音频暂态信号预回声抑制的方法
US8942988B2 (en) Efficient temporal envelope coding approach by prediction between low band signal and high band signal
EP0785631B1 (en) Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
JP3623449B2 (ja) 符号化されたオーディオ信号中のエラーを隠蔽する方法と装置および符号化されたオーディオ信号を復号化する方法と装置
EP2005419B1 (en) Speech post-processing using mdct coefficients
JP6271531B2 (ja) デジタル音声信号における効果的なプレエコー減衰
EP3401907A1 (en) Method and device for perceptual spectral decoding of an audio signal including filling of spectral holes
US20070219791A1 (en) Method and system for reducing effects of noise producing artifacts in a voice codec
CN110047500B (zh) 音频编码器、音频译码器及其方法
KR20130133848A (ko) 스펙트럼 도메인 잡음 형상화를 사용하는 선형 예측 기반 코딩 방식
CN102779527B (zh) 基于窗函数共振峰增强的语音增强方法
EP2395503A2 (en) Audio signal encoding and decoding method, and apparatus for same
WO2005034080A3 (en) A method of making a window type decision based on mdct data in audio encoding
US10170126B2 (en) Effective attenuation of pre-echoes in a digital audio signal
CN101727906A (zh) 高频带信号的编解码方法及装置
JP2020170187A (ja) デジタルオーディオ信号におけるプレエコーを識別し、減衰させる方法及び装置
JP6408125B2 (ja) オーディオ信号内の雑音を推定するための方法、雑音推定器、オーディオ符号化器、オーディオ復号器、およびオーディオ信号を送信するためのシステム
CN106030704B (zh) 用于对音频信号进行编码/解码的方法和设备
JP5295372B2 (ja) デジタルオーディオ信号におけるプリエコーの減衰
CN101587711B (zh) 基音后处理方法、滤波器以及基音后处理系统
EP3455854B1 (en) Adaptive audio codec method and apparatus
Najafzadeh-Azghandi et al. Perceptual coding of narrowband audio signals at 8 kbit/s
Wang et al. Quality enhancement of coded transient audio with a post-filter in frequency domain
CN102930872A (zh) 用于宽带语音解码中基音增强后处理的方法及装置
JP2008026372A (ja) 符号化データの符号化則変換方法および装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120926

Termination date: 20160723

CF01 Termination of patent right due to non-payment of annual fee