CN102893330A - 用于处理音频信号的方法和装置 - Google Patents

用于处理音频信号的方法和装置 Download PDF

Info

Publication number
CN102893330A
CN102893330A CN2011800233400A CN201180023340A CN102893330A CN 102893330 A CN102893330 A CN 102893330A CN 2011800233400 A CN2011800233400 A CN 2011800233400A CN 201180023340 A CN201180023340 A CN 201180023340A CN 102893330 A CN102893330 A CN 102893330A
Authority
CN
China
Prior art keywords
vector
transfer function
postfilter
processing
demoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800233400A
Other languages
English (en)
Other versions
CN102893330B (zh
Inventor
沃洛佳·格兰恰诺夫
西德格尔·思维里森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN102893330A publication Critical patent/CN102893330A/zh
Application granted granted Critical
Publication of CN102893330B publication Critical patent/CN102893330B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了用于处理音频信号的方法和解码器。所述方法和解码器涉及:通过直接对矢量d应用后置滤波器来导出处理后的矢量
Figure DDA00002379556400011
所述矢量d包括音频信号的时间片段的量化后的MDCT域系数。所述后置滤波器被配置为具有传递函数H,该传递函数H是矢量d的包络的压缩版本。通过对处理后的矢量
Figure DDA00002379556400012
执行逆MDCT变换来重构信号波形。

Description

用于处理音频信号的方法和装置
技术领域
本发明涉及音频信号的处理,具体涉及用于通过后置滤波来改进感知质量的方法和装置。
背景技术
低或中等比特率的音频编码被广泛用于降低网络负载。然而,由于量化噪声量的增加,比特率降低不可避免地导致质量下降。最小化量化噪声的感知影响的一种方式是使用后置滤波器。后置滤波器操作于解码器处,并且影响重构的信号参数或直接影响信号波形。使用后置滤波器的目的在于使最易听到量化噪声的频谱谷衰减,从而实现改进的感知质量。
在所谓的ACELP(代数码激励线性预测)语音编解码器中使用基音和共振峰后置滤波器来增强质量。这些滤波器操作于时域,且典型地基于在ACELP编解码器中使用的语音模型[1]。然而,该后置滤波器族不能很好地适于与变换音频编解码器(如,G.719[2])一起使用。
因此,需要提高已进行了变换音频编码的音频信号的感知质量。
发明内容
期望实现已进行了变换音频编码的音频信号的提高的感知质量。
本发明的目的是,提高已进行了变换音频编码的音频信号的感知质量。此外,本发明的目的是,提供用于对已进行了变换音频编码的音频信号进行后置滤波的方法和装置。这些目的可由根据所附独立权利要求的方法和设备来满足。从属权利要求中记载了实施例。
根据第一方面,在解码器中提供了一种方法。该方法涉及:获得矢量d,该矢量d包括音频信号的时间片段的量化后的MDCT域系数。此外,通过直接对矢量d应用后置滤波器来导出处理后的矢量
Figure BDA00002379556200011
所述后置滤波器被配置为具有传递函数H,该传递函数H是矢量d的包络的压缩版本。此外,通过对处理后的矢量
Figure BDA00002379556200021
执行逆MDCT变换来导出信号波形。
根据第二方面,提供了一种解码器。该解码器包括:适于获得矢量d的功能单元,该矢量d包括音频信号的时间片段的量化后的MDCT域系数。该解码器还包括:适于通过直接对矢量d应用后置滤波器来导出处理后的矢量的功能单元。所述后置滤波器被配置为具有传递函数H,该传递函数H是矢量d的包络的压缩版本。该解码器还包括:适于通过对处理后的矢量
Figure BDA00002379556200023
执行逆MDCT变换来导出信号波形的功能单元。
上述涉及MDCT后置滤波器的方法和装置可用于提高中等和低比特率音频编码系统的质量。当在MDCT编解码器中使用后置滤波器时,由于后置滤波器直接对MDCT矢量操作,附加复杂度极低。
可以以不同的实施例实现上述方法和装置。在一些实施例中,所述传递函数H的分母被配置为包括矢量|d|的最大值,该矢量|d|的最大值可以是通过对矢量|d|进行递归最大值跟踪而获得的估计。在一些实施例中,传递函数H被配置为包括:加强分量,被配置为控制后置滤波器对于MDCT频谱的作用强度(aggresiveness)。加强分量可以是例如频率相关的或恒定的。此外,处理后的矢量的能量可以相对于矢量d的能量而归一化。
在一些实施例中,仅在音频信号时间片段被确定为包括语音时导出处理后的矢量
Figure BDA00002379556200025
此外,可以在音频信号片段被确定为主要由例如清音(unvoiced speech)、背景噪声和音乐中的一项或多项组成时限制或抑制传递函数H。
主要就方法而言描述了上述实施例。然而,上述描述还意在涵盖适于使得能够执行上述特征的解码器的实施例。可以根据需要、要求或偏好,以不同方式组合上述示例实施例的不同特征。
附图说明
下面将通过示例实施例,参照附图来更详细地描述本发明,其中:
图1示出了根据示例实施例的随频率变高而减小(以限制后置滤波器的作用)的示例加强因子a(k)的图。
图2示出了示意根据示例实施例的后置滤波器对信号频谱的作用的图,其中,细虚线表示后置滤波前的信号频谱,实线表示后置滤波后的信号频谱。
图3示出了根据示例实施例的将带有和不带有后置滤波器的MDCT音频编解码器进行比较的MUSHRA收听测试的结果。
图4是示出了根据示例实施例的在解码器中执行的过程的动作的流程图。
图5-7是示出了根据示例实施例的解码器和音频处理实体中的相应装置的框图。
具体实施方式
简言之,提供了一种包括后置滤波器在内的解码器,所述后置滤波器被设计为与MDCT(修正离散余弦变换)型变换编解码器(如,G.719[2])一起工作。所提出的后置滤波器直接在MDCT域上操作,且无需将音频信号附加变换至DFT域或时域,从而保持了较低的计算复杂度。归功于后置滤波器的质量提高在收听测试中得到了确认。
变换编码的概念是:将要编码的音频信号转换或变换至频域;然后对频率系数进行量化,量化后的频率系数接着被存储或传输至解码器。解码器通过应用逆频率变换,使用接收到的(量化后的)频率系数来重构音频信号波形。该编码方案背后的动机在于:与时域系数相比,能够更高效地对频域系数进行量化。
在MDCT型变换编码器中,将块信号波形x(n)变换为MDCT矢量d*(k)。这样的矢量的长度“L”对应于20-40ms的语音片段。MDCT变换可以被定义为:
d * ( k ) = Σ n = 0 L - 1 sin [ ( n + 1 2 ) π 2 ] cos [ ( n + 1 2 ) ( k + 1 2 ) π L ] x ( n )
对MDCT进行量化,从而形成要由MDCT解码器解码的量化后的MDCT系数矢量d(k)=Q(d*(k))。
可以在解码器处直接对接收到的矢量d(k)应用后置滤波器,从而将后置滤波后的矢量
Figure BDA00002379556200032
导出为
d ^ ( k ) = H ( k ) d ( k )
传递函数或滤波函数H(k)是MDCT频谱的压缩版本:
H ( k ) = ( abs [ d ( k ) ] max [ abs ( d ) ] ) a ( k ) - - - ( 1 )
参数a(k)可以被设置为控制后置滤波器对于MDCT频谱的“作用强度(aggressiveness)”或“加强量(amount of emphasis)”。图1示出了a(k)如何可以被配置为频率相关矢量的示例的图。然而,a(k)在频谱上也可以是恒定。后置滤波器对信号频谱的作用示于图2。如图2中可见,在后置滤波后,频谱谷变深。
优选地,可以将后置滤波器输出的能量相对于后置滤波器输入的能量而归一化:
d ^ ( normalized ) ( k ) = std ( d ) std ( d ^ ) d ^ ( k )
此处,std(d)是后置滤波操作前的矢量d(包括量化后的MDCT系数)的标准差;并且
Figure BDA00002379556200044
是处理后的矢量
Figure BDA00002379556200045
(即,后置滤波操作后的矢量d)的标准差。
此外,与例如音乐相比,在浊音(voiced speech)中最容易听到因编码导致的可听量化噪声。因此,例如,对于减小语音信号而非音乐信号中的可听量化噪声,使用所提出的后置滤波器更为高效。因此,适当时,在后置滤波器被认为相对不太有效的帧或帧片段中,可以关闭或抑制后置滤波器。例如,可以在被确定为主要由清音、背景噪声和/或音乐组成的帧或帧片段中,关闭或抑制后置滤波器。可以将后置滤波器与用于确定帧的内容的例如语音-音乐鉴别器和/或背景噪声估计模块结合使用。然而,应注意:后置滤波器在例如清音片段中不引起任何退化。
在所谓的MUSHRA测试中测试了使用后置滤波器的感知效果,MUSHRA测试的结果示于图3。“MUSHRA”代表具有隐含参考和锚的多激励,是音频质量的主观评估方法,通常用于评估有损音频压缩算法的输出的感知质量。赋予信号的MUSHURA点越多,感知音频质量越好。在图1中,第一柱形(#1)表示在解码过程中未使用后置滤波器的MDCT解码信号。第二柱形(#2)表示在解码过程中使用了所提出的后置滤波器的MDCT解码信号。第三柱形(#3)表示未进行编码因此被给予最大点数/分数的原始语音信号。如图3中可见,后置滤波器的使用给出感知音频质量的显著增加。
示例过程图4
下面将参照图4描述对MDCT编码的音频信号进行解码的过程的示例实施例。该过程可以在音频处理实体(如,电话会议系统中的节点、和/或无线或有线通信系统中的节点或终端、音频广播所涉及的节点、或在音乐制作中使用的实体或设备)中执行。
在动作402中获得矢量d,矢量d包括音频信号的时间片段的量化后的MDCT系数。假设该系数矢量由MDCT编码器产生,并从另一节点或实体接收或者(例如从存储器)取得。
通过直接对矢量d应用后置滤波器,在动作406中导出处理后的矢量
Figure BDA00002379556200051
所述后置滤波器被配置为具有传递函数H,该传递函数H是矢量d的包络的压缩版本。此外,通过对处理后的矢量
Figure BDA00002379556200052
执行逆MDCT变换,在动作408中导出重构的信号波形。
传递函数H的分母被配置为包括:矢量d的最大值。所述最大值可以是|d|的最大系数(绝对值),或者是例如通过对矢量|d|进行递归最大值跟踪而获得的估计。
传递函数H还可以被配置为包括:加强分量,被配置为控制后置滤波器对于MDCT频谱的作用强度或加强量。该分量在图1和式1中表示为“a”。分量“a”可以例如是频率相关矢量或常数。
后置滤波器的输出(即,处理后的矢量
Figure BDA00002379556200053
)的能量可以相对于后置滤波器的输入的能量(即,矢量d的能量)而归一化。此外,可以确定音频信号片段的内容,并根据所述内容来应用后置滤波器。例如,可以例如仅在音频信号时间片段被确定为包括语音时导出处理后的矢量
Figure BDA00002379556200054
此外,可以在音频信号时间片段被确定为主要由例如清音、背景噪声和/或音乐组成时,限制或抑制后置滤波器的传递函数H。这些条件动作被示为图4中的动作404和410。可以基于矢量d来确定音频信号片段的内容,或者可以在编码器中基于音频信号波形对其进行确定,并且接着可以适当方式从编码器向解码器发信号通知与所述内容有关的信息。
示例装置,图5和6
以下,将参照图5来描述适于使得能够执行与信号解码有关的上述过程的示例解码器501。
解码器501包括:获得单元502,适于获得矢量d,该矢量d包括音频信号的时间片段的量化后的MDCT域系数。矢量d可以例如从另一节点接收或者例如从存储器取得。该解码器还包括:滤波器单元504,适于通过直接对所获得的矢量d应用后置滤波器来导出处理后的矢量
Figure BDA00002379556200061
所述后置滤波器应被配置为具有传递函数H,该传递函数H是矢量d的包络的压缩版本。此外,该解码器包括:转换单元506,被配置为通过对处理后的矢量
Figure BDA00002379556200062
执行逆MDCT变换来导出信号波形,即,在音频信号时间片段中包括的信号波形的估计或重构。
装置500适于在解码器中使用,并且可以例如通过以下一项或多项来实现:处理器或微处理器以及合适的软件、可编程逻辑器件(PLD)或其他电子组件。
解码器还可以包括其他常规功能单元508,如,一个或多个存储单元。
图6示出了与图5所示的501类似的解码器601.解码器601被示为位于或包括于通信系统中的音频处理实体602中。音频处理实体可以是例如:无线或有线通信系统中的节点或终端、电话会议系统中的节点或终端、和/或音频广播所涉及的节点。音频处理实体602和解码器601被进一步示为经由通信单元603与其他实体通信,通信单元603可以被视为包括用于无线和/或有线通信的传统装置。装置600以及单元604-610对应于图5中的装置500和单元502-508。音频处理实体602还可以包括:附加的常规功能单元614以及一个或多个存储单元612。
示例装置,图7
图7示出了适于在音频处理实体中使用的解码器或装置700的实现,其中,由连接至处理器706的计算机程序产品708承载计算机程序710。计算机程序产品708包括计算机可读介质,其上存储计算机程序710。计算机程序710可以被配置为以计算机程序模块构造的计算机程序代码。因此,在所描述的示例实施例中,计算机程序710中的代码装置包括:获得模块710a,用于获得矢量d,该矢量d包括音频信号的时间片段的量化后的MDCT域系数。计算机程序还包括:滤波器模块710b,用于导出处理后的矢量
Figure BDA00002379556200071
计算机程序710还包括:转换模块710c,用于导出音频信号时间片段的估计。计算机程序可以包括另外的模块,例如,用于提供其他解码器功能的710d。
模块710a-d可以实质上执行图4所示的流程的动作,以模拟图5所示的解码器。换言之,当在处理单元706中执行不同的模块710a-d时,它们对应于图5的单元502-508的相应功能。例如,计算机程序产品可以是闪存、RAM(随机存取存储器)、ROM(只读存储器)或EEPROM(电可擦除可编程ROM),并且在可替换实施例中,计算机程序模块710a-d可以分布在解码器601和/或音频处理实体602内存储器形式的不同计算机程序产品上。连接至存储器的单元702和704表示通信单元,例如,输入和输出。单元702和单元704可以被配置为集成实体。
虽然以上结合图7公开的实施例中的代码装置被实现为计算机程序模块,当在处理单元中被执行时,所述计算机程序模块使解码器和/或音频处理实体执行以上结合上述附图描述的动作,在可替换实施例中,所述代码装置的至少一个可以至少部分实现为硬件电路。
应注意的是,交互单元或模块的选择以及单元的命名仅仅用于示例目的,可以多种可替换方式配置适于执行上述任一方法的网络节点,以能够执行所提出的过程动作。
还应注意:本公开中描述的单元或模块应被看作逻辑实体,而不一定作为单独的物理实体。
缩略语
ACELP-代数码激励线性预测
MDCT-修正离散余弦变换
DFT-离散傅里叶变换
MUSHRA-具有隐含参考和锚的多激励
参考文献
[1]J.-H.Chen and A.Gersho,“Adaptive postfiltering for qualityenhancement of coded speech”IEEE Trans.Speech.AudioProcessing,vol.3,pp.59-71,1995
[2]ITU-T Rec.G.719,“Low-complexity full-band audio coding forhigh-quality conversational applications,”2008

Claims (16)

1.一种解码器中的方法,包括:
-获得(402)矢量d,该矢量d包括音频信号的时间片段的量化后的MDCT域系数,
-通过直接对矢量d应用后置滤波器来导出(404)处理后的矢量所述后置滤波器被配置为具有传递函数H,该传递函数H是矢量d的包络的压缩版本,
-通过对处理后的矢量
Figure FDA00002379556100012
执行逆MDCT变换来导出(406)信号波形。
2.根据权利要求1所述的方法,其中,所述传递函数H的分母被配置为包括矢量|d|的最大值。
3.根据权利要求1或2所述的方法,其中,所述传递函数H的分母被配置为包括矢量|d|的最大值的估计,所述估计是通过对矢量|d|进行递归最大值跟踪而获得的。
4.根据前述权利要求中任一项所述的方法,其中,所述传递函数H被配置为包括加强分量,所述加强分量被配置为控制后置滤波器对于MDCT频谱的作用强度。
5.根据权利要求4所述的方法,其中,所述加强分量是频率相关的。
6.根据前述权利要求中任一项所述的方法,其中,处理后的矢量的能量相对于矢量d的能量而归一化。
7.根据前述权利要求中任一项所述的方法,其中,仅在音频信号时间片段被确定为包括语音时导出处理后的矢量
Figure FDA00002379556100014
8.根据前述权利要求中任一项所述的方法,其中,在音频信号时间片段被确定为主要由以下一项或多项组成时,限制或抑制传递函数H:
-清音,
-背景噪声,
-音乐。
9.一种解码器,包括:
-获得单元(502),适于获得矢量d,该矢量d包括音频信号的时间片段的量化后的MDCT域系数,
-滤波器单元(504),适于通过直接对所获得的矢量d应用后置滤波器来导出处理后的矢量
Figure FDA00002379556100021
所述后置滤波器被配置为具有传递函数H,该传递函数H是所获得的矢量d的包络的压缩版本,以及
-转换单元(506),被配置为通过对处理后的矢量
Figure FDA00002379556100022
执行逆MDCT变换来导出信号波形。
10.根据权利要求9所述的解码器,其中,传递函数H被配置为:在分母中包括矢量|d|的最大值。
11.根据权利要求9或10所述的解码器,其中,传递函数H被配置为:在分母中包括矢量|d|的最大值的估计,所述估计是通过对矢量|d|进行递归最大值跟踪而获得的。
12.根据权利要求9-11中任一项所述的解码器,其中,所述传递函数H被配置为包括:频率相关的加强分量,被配置为控制后置滤波器对于MDCT频谱的作用强度。
13.根据权利要求9-12中任一项所述的解码器,还适于:将处理后的矢量
Figure FDA00002379556100023
的能量相对于矢量d的能量而归一化。
14.根据权利要求9-13中任一项所述的解码器,还适于:仅在音频信号时间片段被确定为包括语音时导出处理后的矢量
Figure FDA00002379556100024
15.根据权利要求9-14中任一项所述的解码器,还适于:在音频信号时间片段被确定为主要由以下一项或多项组成时,限制或抑制传递函数H:
-清音,
-背景噪声,
-音乐。
16.一种音频处理实体(601),包括根据权利要求9-15中任一项所述的解码器。
CN201180023340.0A 2010-05-11 2011-04-28 用于处理音频信号的方法和装置 Active CN102893330B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US33349810P 2010-05-11 2010-05-11
US61/333,498 2010-05-11
PCT/SE2011/050518 WO2011142709A2 (en) 2010-05-11 2011-04-28 Method and arrangement for processing of audio signals

Publications (2)

Publication Number Publication Date
CN102893330A true CN102893330A (zh) 2013-01-23
CN102893330B CN102893330B (zh) 2015-04-15

Family

ID=44914876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180023340.0A Active CN102893330B (zh) 2010-05-11 2011-04-28 用于处理音频信号的方法和装置

Country Status (5)

Country Link
US (1) US9858939B2 (zh)
EP (1) EP2569767B1 (zh)
CN (1) CN102893330B (zh)
ES (1) ES2501840T3 (zh)
WO (1) WO2011142709A2 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2569767B1 (en) * 2010-05-11 2014-06-11 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for processing of audio signals
EP3079153B1 (en) 2010-07-02 2018-08-01 Dolby International AB Audio decoding with selective post filtering
US8738385B2 (en) * 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
EP2887350B1 (en) 2013-12-19 2016-10-05 Dolby Laboratories Licensing Corporation Adaptive quantization noise filtering of decoded audio data
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP3763063B1 (en) * 2018-03-08 2021-12-15 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for handling antenna signals for transmission between a base unit and a remote unit of a base station system

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004302257A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 長期ポストフィルタ
US20070219785A1 (en) * 2006-03-20 2007-09-20 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US20090150143A1 (en) * 2007-12-11 2009-06-11 Electronics And Telecommunications Research Institute MDCT domain post-filtering apparatus and method for quality enhancement of speech
CN101501763A (zh) * 2005-05-31 2009-08-05 微软公司 音频编解码器后置滤波器
WO2010009098A1 (en) * 2008-07-18 2010-01-21 Dolby Laboratories Licensing Corporation Method and system for frequency domain postfiltering of encoded audio data in a decoder

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
FI980132A (fi) * 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7353169B1 (en) * 2003-06-24 2008-04-01 Creative Technology Ltd. Transient detection and modification in audio signals
US7526428B2 (en) * 2003-10-06 2009-04-28 Harris Corporation System and method for noise cancellation with noise ramp tracking
WO2005041170A1 (en) * 2003-10-24 2005-05-06 Nokia Corpration Noise-dependent postfiltering
EP2991075B1 (en) * 2004-05-14 2018-08-01 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US9037474B2 (en) * 2008-09-06 2015-05-19 Huawei Technologies Co., Ltd. Method for classifying audio signal into fast signal or slow signal
US8463603B2 (en) * 2008-09-06 2013-06-11 Huawei Technologies Co., Ltd. Spectral envelope coding of energy attack signal
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8718804B2 (en) * 2009-05-05 2014-05-06 Huawei Technologies Co., Ltd. System and method for correcting for lost data in a digital audio signal
US8391212B2 (en) * 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
EP2569767B1 (en) * 2010-05-11 2014-06-11 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for processing of audio signals

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004302257A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 長期ポストフィルタ
CN101501763A (zh) * 2005-05-31 2009-08-05 微软公司 音频编解码器后置滤波器
US20070219785A1 (en) * 2006-03-20 2007-09-20 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US20090150143A1 (en) * 2007-12-11 2009-06-11 Electronics And Telecommunications Research Institute MDCT domain post-filtering apparatus and method for quality enhancement of speech
WO2010009098A1 (en) * 2008-07-18 2010-01-21 Dolby Laboratories Licensing Corporation Method and system for frequency domain postfiltering of encoded audio data in a decoder

Also Published As

Publication number Publication date
US20110282656A1 (en) 2011-11-17
EP2569767B1 (en) 2014-06-11
EP2569767A2 (en) 2013-03-20
US9858939B2 (en) 2018-01-02
WO2011142709A3 (en) 2011-12-29
CN102893330B (zh) 2015-04-15
EP2569767A4 (en) 2013-10-02
WO2011142709A2 (en) 2011-11-17
ES2501840T3 (es) 2014-10-02

Similar Documents

Publication Publication Date Title
US10037766B2 (en) Apparatus and method for generating bandwith extension signal
CN102934163B (zh) 用于宽带语音编码的系统、方法、设备
CN101836252B (zh) 用于在音频代码化系统中生成增强层的方法和装置
CN102893330B (zh) 用于处理音频信号的方法和装置
US11011181B2 (en) Audio encoding/decoding based on an efficient representation of auto-regressive coefficients
US20070219785A1 (en) Speech post-processing using MDCT coefficients
CN101430880A (zh) 一种背景噪声的编解码方法和装置
CN104978970A (zh) 一种噪声信号的处理和生成方法、编解码器和编解码系统
US20110125507A1 (en) Method and System for Frequency Domain Postfiltering of Encoded Audio Data in a Decoder
WO2024051412A1 (zh) 语音编码、解码方法、装置、计算机设备和存储介质
US9390722B2 (en) Method and device for quantizing voice signals in a band-selective manner
WO2000051104A1 (en) Method of determining the voicing probability of speech signals
Vass et al. Adaptive forward-backward quantizer for low bit rate high-quality speech coding
Xiang et al. Improved Frame Error Concealment Algorithm Based on Transform-Domain Mobile Audio Codec
Ramirez Modeling the unvoiced component in the canonical representation of speech
Nascimento et al. New methods for improvement of sinusoidal transform vocoders

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant