CN102160114B - 用于对数字音频信号中的前回声进行衰减的方法和装置 - Google Patents

用于对数字音频信号中的前回声进行衰减的方法和装置 Download PDF

Info

Publication number
CN102160114B
CN102160114B CN2009801363279A CN200980136327A CN102160114B CN 102160114 B CN102160114 B CN 102160114B CN 2009801363279 A CN2009801363279 A CN 2009801363279A CN 200980136327 A CN200980136327 A CN 200980136327A CN 102160114 B CN102160114 B CN 102160114B
Authority
CN
China
Prior art keywords
sub
piece
signal
decay
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009801363279A
Other languages
English (en)
Other versions
CN102160114A (zh
Inventor
巴拉茨.科维西
斯蒂芬.拉戈特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN102160114A publication Critical patent/CN102160114A/zh
Application granted granted Critical
Publication of CN102160114B publication Critical patent/CN102160114B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种用于对根据变换编码产生的数字音频信号中的前回声进行衰减的方法,其中,在解码时,并且对于所述数字音频信号的当前帧,所述方法包括:至少根据当前帧的重构信号来定义(CONC)级联信号的步骤;将所述级联信号划分(DIV,301)为具有预定长度的采样的子单元的步骤;计算(ENV,302)级联信号的时间包络的步骤;检测(DETECT,304)时间包络朝向高能量区域的转变的步骤;确定(DETECT,304)在已经检测到转变的子单元之前的低能量子单元的步骤;以及在所述确定的子单元中的衰减步骤(ATT)。所述方法使得,根据对于确定的子单元的每一个计算的、基于级联信号的时间包络的衰减因子,来执行所述衰减。本发明还涉及一种用于实现所述方法的装置,并且涉及一种包括这样的装置的解码器。

Description

用于对数字音频信号中的前回声进行衰减的方法和装置
技术领域
本发明涉及一种用于在数字音频信号的解码期间、对前回声(pre-echo)进行衰减的方法和装置。 
背景技术
为了在传送网络上进行数字音频信号的传输(所述传送网络例如是固定或移动网络),或者为了存储信号,使用了用于实现基于变换的频率编码或时间编码类型的编码系统的压缩处理(或源编码)。 
因此,作为本发明主题的方法和装置具有声音信号(具体地,通过频率变换而编码的数字音频信号)的压缩,作为应用领域。 
图1通过图示表现了根据现有技术的通过包括添加/重叠分析-综合的变换来编码和解码数字音频信号的基本图。 
诸如打击乐器的某些音乐序列和诸如爆破音(/k/,/t/,...)的某些语音片段的特征在于非常突然的冲击(attack),所述冲击导致在几个采样的空间中信号的非常快的转变和动态摆动的非常强的变化。在图1中基于采样410来给出了示范转变。 
对于编码/解码处理,输入信号被切分为长度L的采样块(这里,用垂直虚线了表现所述采样块)。输入信号被表示为x(n)。到连续块的切分导致了定义块xN=[x(N.L)…x(N.L+L-1)]=[xN(0)…xN(L-1)],其中N是帧的索引,并且L是帧的长度。在图1中,我们具有L=160个采样。在修正的余弦调制变换MDCT(代表“修正的离散余弦变换”)的情况下,联合地分析两个块xN(n)和xN+1(n),以给出与索引为N的帧相关联的变换系数的块。 
通过变换编码进行的到块(也称为帧)的划分完全地独立于声音信号,并因此转变出现在分析窗口的任何点处。现在,在变换解码之后,所重构的信号被由量化(Q)-逆量化(Q-1)运算产生的“噪声”(或失真)所毁坏。这个编码噪声以相对均匀的方式而时间分布在所变换块的整个时间支持(temporal support)上,即在采样的长度为2L(其中L个采样重叠)的整个窗口长度上。编码噪声的能量一般与块的能量成比例,并且取决于解码速率。 
对于包括冲击的块(诸如,图1的块320-340),信号的能量高,因此噪声也为高电平。 
在变换编码中,编码噪声的电平低于用于紧随在转变之后的高能量采样的信号的电平,但是该电平高于用于(特别是在所述转变之前的部分(图1的采样160-410)上的)较低能量的采样的信号的电平。对于前述部分,信噪比为负,并且结果生成的劣化在侦听期间可能显得非常烦人。在转变之前的编码噪声被称为前回声,而在转变之后的噪声被称为后回声(post-echo)。 
在图1中可以观察到,前回声影响在所述转变之前的帧以及出现所述转变的帧。 
心理声学实验已经示出了人耳执行相当有限的、几个毫秒量级的声音的时间预掩蔽(pre-masking)。当前回声的持续时间大于预掩蔽的持续时间时,在所述冲击之前的噪声或者前回声是可听得到的。 
当从高能量序列切换到低能量序列时,人耳还执行从5到60毫秒的更长持续时间的后掩蔽(post-masking)。因此,后回声的可接受程度或者烦人的水平大于前回声。 
在采样数目方面的块的长度越大,则前回声的更严重现象就越烦人。现在,在变换编码中,必须具有最重要频区的可靠分辨率。在固定的采样频率上并且在固定的速率上,如果窗口的点数增加,则更多比特将可用于对被心理声学模型认为有用的频谱线进行编码,因此即为使用大长度的块的优点。MPEG AAC编码(高级音频编码)例如使用大长度的窗口,该窗口包含采样的固定数目2048,即以32kHz的采样频率在64ms的持续时间上。用于传统应用的变换编码器经常使用16kHz处的持续时间为40ms的窗口和20ms的帧换新持续时间。 
为了减少前回声现象的前述烦人影响,迄今已经提出了各种解决方案。 
第一解决方案在于应用自适应滤波。在由于所述冲击而导致的传送之前的区段中,所重构的信号事实上由原始信号和在所述信号上叠加的量化噪声组成。 
对应的滤波技术已经描述在由Y.Mahieux和J.P.Petit发表的、题目为High Quality Audio Transform Coding at 64 kbits,IEEE Trans.OnCommunications Vol 42,No.11,November 1994的文章中。 
这样的滤波的实现需要参数的知识,基于有噪声采样在解码器处估计所述参数中的一些参数。另一方面,诸如原始信号的能量的信息仅仅在编码器处可以获知,并因此必须被传送。当所接收的块包含动态摆动的突然变化时,向它应用过滤处理。 
前述过滤处理没有使得可能恢复原始信号,但是能提供前回声的大量减少。然而,它需要要向解码器传送附加的辅助参数。 
在法国专利申请FR 06 01466中描述了不需要辅助参数的传送的技术。所描述的方案使得可能辨别前回声的存在,并且对通过基于变换编码(生成前回声)、和时间编码(不生成任何前回声)的分级编码(生成多层二进制串)而产生的数字音频信号的前回声进行衰减。 
这个专利申请更精确地描述了在解码器处检测在到高能量区段的转变之前的低能量区段、在所检测的低能量区段中前回声的衰减、和在高能量区段中前回声衰减的禁止。使得可能对前回声进行衰减的处理是基于在源自于变换解码(生成前回声)的信号和源自于时间解码(不生成回声)的信号之间的比较。 
这种技术不需要来自编码器的特定辅助信息的任何传送,但是需要存在源自于时间解码的参考信号。 
源自于时间解码的参考信号不一定对于使用变换解码的所有解码器都可用。此外,在其中这样的参考信号可用于所述解码器的情况下,它不总是适合于计算前回声的衰减。 
例如规范UIT-T G.729.1的立体声扩展的立体声可缩放编码器可按照下文中描述的方式来操作。 
编码器计算立体声信号的左和右两个声道的均值,并然后利用G.729.1编码器对这个均值进行编码,并最后传送附加的立体声扩展参数。因此,传送到解码器的二进制串包括具有附加立体声扩展层的G.729.1层。例如,第一附加层包括用于反映(变换域中)每个子带的能量在立体声信号的两个声道之间的差异的参数。第二层包括例如残余信号的变换系数,该残余信号被定义为在原始信号与基于G.729.1二进制串并基于第一层进行解码的信号之间的差。 
扩展模式中的G.729.1解码器首先对单声道信号进行解码,并且作为所传送的参数的函数来恢复左和右两个声道的变换系数。 
G.729.1类型的解码器对单声道信号进行的解码产生了基于两个声道的均值的参考信号。在两个声道之间的电平差大的情况下,单声道信号的时间包络于是相对于较大电平的声道的逆变换的输出将为低,并且相对于较低电平的声道的逆变换的输出将为高。 
因此,使用诸如G.729.1解码器的输出的参考来对前回声进行衰减对于立体声解码将不是有效的:在较大电平的声道中,太多前回声将被错误地检测到,并因此有用信号将被去除,而在较低电平的声道中,并不是所有的前回声都将被检测到或去除。 
因此,在其中源自于时间解码的信号不可用或不灵验、并且其中编码器没有传送辅助信息的情况下,存在对于在解码时准确地衰减前回声的技术的需要。此外,这个技术必须能够操作用于单声道和立体声编码。 
发明内容
为此,本发明涉及一种用于对基于变换编码产生的数字音频信号中的前回声进行衰减的方法,其中,在解码时,对于这个数字音频信号的当前帧,所述方法包括: 
-至少基于当前帧的重构信号来定义级联信号的步骤; 
-将所述级联信号划分为确定长度的采样的子块的步骤; 
-计算级联信号的时间包络的步骤; 
-检测时间包络到高能量区段的转变的步骤; 
-确定在已经检测到转变的子块之前的低能量子块的步骤;以及 
-在确定的子块中进行衰减的步骤, 
所述方法的特征在于,根据对于确定的子块的每一个计算的、作为级联信号的时间包络的函数的衰减因子,来执行所述衰减。 
这样,关于已解码信号所专有的特性来定义衰减因子,这不需要来自编码器的任何信息传送,也不需要源自于不生成回声的解码的任何信号。 
适合于当前帧的每一个子块并且基于重构信号计算的因子使得可能改善前回声衰减处理的质量。 
可以基于当前帧的重构信号并且基于当前帧的第二部分来定义级联信号,诸如随后参考图2所定义的。在这个情况下,所述方案没有引入任何时间延迟。 
在其中允许时间延迟的情况下,级联信号被定义为当前帧的和随后帧的重构信号。 
级联信号可作为子块而物理存储在各个地方。 
可以将下文中提及的各个具体实施例独立地或彼此组合地添加到上面定义的方法的步骤。 
这样,在具体实施例中,对于作为先前帧的重构信号的时间包络的函数的衰减因子值,最小值是固定的。 
这使得可能具体地在背景噪声电平上避免从一个帧到另一帧的太大衰减差,并因此可能避免可听得到的假象(artifact)。 
先前帧的重构信号的时间包络例如可以通过计算每个子块的最小能量或另外地通过计算平均能量或者任何其它计算来确定。 
在本发明的具体实施例中,衰减因子被确定为所述子块的时间包络的、包括所述转变的子块的时间包络的最大值的、和先前帧的重构信号的时间包络的函数。 
在示范实施例中,通过子块能量计算来确定所述时间包络。 
有利地,所述方法还包括在所述在确定的子块中进行衰减的步骤之后的、计算和存储当前帧的时间包络的步骤。 
这个时间包络计算因此将用于处理随后帧。这个计算是准确的,这是因为信号不再受到前回声干扰。 
有利地,将值为1的衰减因子分配到包括转变的所述子块的采样、以及当前帧中的随后子块的采样。 
因此,在不包括任何前回声的这些子块中,这个衰减被禁止。 
在具体实施例中,根据如下步骤,针对确定的子块来确定衰减因子: 
-计算在包括转变的子块中确定的最大能量与当前子块的能量的比率; 
-将所述比率与第一阈值进行比较; 
-在其中所述比率小于或等于第一阈值的情况下,向所述衰减因子分配用于禁止所述衰减的值; 
-在其中所述比率大于第一阈值的情况下: 
●将所述比率与第二阈值进行比较; 
●在其中所述比率小于或等于第二阈值的情况下,向所述衰减因子分配低衰减值; 
●在其中所述比率大于第二阈值的情况下,向所述衰减因子分配高衰减值; 
这个具体实施例已经证明是特别有效的并且易于实现。 
有利地,所述方法规定了在逐采样计算的因子之间确定平滑化函数。 
这还使得可能避免在衰减值的太突然变化期间的可听得到的假象。 
在实现变体中,通过向被施加到在包括转变的子块之前的子块的预定数目采样的衰减因子施加用于禁止所述衰减的衰减值,来对在包括转变的子块之前的子块执行因子校正。 
这因此使得可能通过对衰减值定义的平滑化函数而不降低冲击的幅度。 
本发明还旨在一种用于对基于变换编码器产生的数字音频信号中的前回声进行衰减的装置,其中,与解码器相关联的装置包括如下模块来处理这个数字音频信号的当前帧: 
-用于至少基于当前帧的重构信号来定义级联信号的模块; 
-用于将所述级联信号划分为确定长度的采样的子块的模块; 
-用于计算级联信号的时间包络的模块; 
-用于检测时间包络到高能量区段的转变的模块; 
-用于确定在已经检测到转变的子块之前的低能量子块的模块;以及 
-用于在确定的子块中进行衰减的模块。 
所述装置使得,所述衰减模块根据对于确定的子块的每一个计算的、作为级联信号的时间包络的函数的衰减因子,来执行所述衰减。 
本发明旨在一种数字音频信号的解码器,包括诸如上述的装置。 
这样的解码器例如可以是在UIT-T委员会16的议题23(question 23 ofthe UIT-T,commission 16)中研究的G.729.1-SWB/立体声类型的解码器。 
本发明可以被集成到立体声模式或SWB(“超宽波段”)模式中的这样的解码器中。 
最后,本发明旨在一种包括代码指令的计算机程序,当由处理器执行这些指令时,所述代码指令用于实现诸如所描述的衰减方法的步骤。 
附图说明
在阅读了单独通过非限制性示例并参考附图给出的如下描述时,本发明的其它特性和优点将变得更清楚明显,在附图中: 
-所描述的图1先前图示了根据现有技术状态的变换编码-解码系统; 
-图2图示了关于信号当前帧的重构信号的配置; 
-图3图示了用于对数字音频信号解码器中的前回声进行衰减的装置; 
-图4a表现当转变处于当前帧的第二部分中时的级联信号; 
-图4b表现当转变处于当前帧的重构信号中时的级联信号; 
-图5图示了根据本发明的表现计算衰减因子的步骤的一般实施例的流程图; 
-图6图示了根据本发明实施例的实现衰减方法的详细流程图; 
-图7图示了根据本发明的计算衰减因子的具体实施例; 
-图8a图示了对其实现根据实施例的本发明的示范数字音频信号; 
-图8b图示了对其实现根据变化实施例的本发明的相同数字音频信号; 
-图9图示了当冲击位于当前帧的第二部分的第二子块中时的级联信号; 
-图10图示了当冲击位于当前帧的第二部分的第三子块中时的级联信号; 
-图11图示了当冲击位于当前帧的第二部分的第一子块中时的级联信号; 
-图12图示了当冲击位于当前帧的第二部分的第四子块中时的级联信号; 
-图13a和图13b分别图示了G.729.1 SWB/立体声类型的编码器和解码器,所述解码器包括根据本发明的衰减装置; 
-图14a和图14b分别图示了G.729.1 SWB类型的编码器和解码器,所述解码器包括根据本发明的衰减装置; 
-图15图示了根据本发明的衰减装置的示例。 
具体实施方式
图2表现了已解码信号的帧以及通过诸如参考图1描述的添加重叠而重构的信号的配置。下文中,参考图2和接下来的等式来使用如下符号: 
xrec,N(n)=h(n+L)xtr,N-1(n+L)+h(n)xtr,N(n),令n∈[0,L-1] 
其中N是帧的索引,L是帧的长度,xrec,N是帧N的重构信号,xtr,N源自于帧N的MDCT逆变换的长度为2L的信号。在不研讨MDCT和MDCT逆变换 的细节的情况下,用于帧N的长度2L的中间信号xtr,N被定义为: 
Figure BDA0000050680720000081
其中yr(n)和yi(n)是这里不详述的中间信号。然后,可示出帧N的重构信号xrec,N由下式给出: 
xrec,N(n)=h(n+L)xtr,N-1(n+L)+h(n)xtr,N(n),令n∈[0,L-1] 
所述重构因此通过添加-重叠来执行。 
注意,中间信号包括反对称部分和对称部分。在帧N的解码期间,接收到使得可能找到xtr,N的二进制串;因此可能重构xrec,N(n),n=0...L-1。另一方面,仅“一半”信息可用在索引N+1的未来帧上,也就是说,在索引为N+1的未来帧上,xtr,N,n=L...2L-1。重要的是要注意,对于MDCT(以及其逆)的所有变化实施例,总是可能定义上文中所定义的形式的中间信号xtr,N。然而,在某些实现中,信号xtr,N并不是这样明确的,仅中间信号yr(n)和yi(n)(其包括“时间混叠”)是可用的。 
这样,在变换解码器中,通过先前帧的MDCT系数的逆变换的输出的第二部分(xtr,N-1(n),n=L到2L-1)、与当前帧的MDCT系数的逆变换的输出的第一部分(xtr,N(n),n=0到L-1)的加权相加,来获得当前帧的重构信号(xrec,N(n),n=0到L-1)。当前帧的MDCT系数的逆变换的输出的第二部分(xtr,N(n),n=L到2L-1)将保留在存储器中,并且将变成xtr,N-1(n),n=L到2L-1,以便被利用以获得随后帧的重构信号。为了简化,下文中,将使用术语“当前帧的第一部分”、“当前帧的第二部分”、“当前帧的重构信号”。在随后帧中,当前帧的第二部分因此变成先前帧的第二部分。 
为了进一步简化附图,还引入如下符号用于按比例增加(也就是说,乘以MDCT变换综合窗口的最大值)的当前帧的第二部分: 
xcur2h,N(n)=h(L)·xtr,N(L+n),n=0到L-1 
具体地,对于位于当前帧中的冲击,在第一或第二部分中,根据本发明实施例的用于对前回声进行衰减的方法基于当前帧的重构信号xrec,N(n)和按比例增加的当前帧的第二部分的信号xcur2h,N(n),来生成级联信号[xrec,N(0)...xrec,N(L-1)xcur2h,N(0)...xcur2h,N(L-1)]。 
这个级联信号被划分为确定长度的采样的子块,这里为偶数个。 
所述方法确定需要衰减前回声的当前块的子块。 
所述衰减方法还包括计算要向所确定的子块施加的衰减因子的步骤。作为级联信号的时间包络的函数来对所述子块的每一个执行所述计算。 
此外,还可以作为先前帧的重构信号的时间包络的函数来执行这个计算。 
这样,参考图3,衰减装置100包括:模块101,用于定义级联信号;模块102,用于将级联信号划分为子块;模块103,用于计算级联信号的时间包络;模块104,用于检测时间包络到高能量区段的转变,并用于确定在已经检测到转变的子块之前的低能量子块;以及模块105,用于所确定的子块中的衰减。所述衰减模块能够将衰减因子应用到由模块104确定的子块,所述衰减模块作为级联信号的时间包络的函数来确定所述衰减因子。 
参考图3,所述衰减装置被包括在解码器中,所述解码器包括:模块110,用于进行逆量化(Q-1);模块120,用于进行逆变换(MDCT-1);模块130,用于通过如参考图1描述的添加/重叠(add/ovl)来重构信号,并且将所重构的信号传递到根据本发明的衰减装置。 
图4a和图4b图示了在信号中包括转变或冲击的信号的示例。当MDCT窗口中的信号部分的能量显著地大于(冲击)其它部分的能量时,存在前回声现象。然后在所述冲击之前的低能量部分中观察到前回声。因此,在这个部分中必须对前回声进行衰减。 
两种情况是可能的:信号的冲击或转变处于当前帧(首先的L个采样)中或者处于与当前帧的第二部分对应的随后帧(接下来的L个采样)中,如图2所表现的。 
图4a表现在当前帧的第二部分中与信号的冲击级联的信号。在这个图中可能看到,到长度为N2个采样的K2个子块k的切分,其中N2=L/K2、K2=4。首先的L个采样表现当前帧的重构信号xrec,N(n),n=0,...,L-1。接下来的L个采样(L到2L-1)表现当前帧的第二部分xcut2h,N(n),n=0,...,L-1。在随后帧中,这个第二部分变成先前帧的第一部分。 
要注意,当前帧的第二部分根据MDCT逆变换的属性而对称。实际上,根据本发明,对前回声进行衰减,而不向变换解码引入附加延迟。在当前帧的解码期间,解码器对采样xtr,N(n),n=0,...,2L-1进行综合,但是仅仅可以使用采样xtr,N(n),n=0,...,L-1来重构xrec,N(n),n=0,...,L-1。 
看到的是冲击或转变处于随后帧中(但是不能够进一步给出其位置), 因此需要对重构信号的当前帧的首先L个采样来衰减前回声。 
图4b表现稍后帧的相同信号,这次冲击位于重构信号的当前帧中,即第三子块(k=2)中。因此,必须衰减在首先两个子块中的前回声。 
根据本发明的用于对前回声进行衰减的方法传递用于帧的每个采样的前回声衰减因子。现在,将参考图5和图6来描述这个方法。 
在图5中表现的流程图图示了根据本发明的对于当前帧计算衰减因子的各个步骤。 
在步骤201中,计算当前帧的重构信号的时间包络,并且在步骤202中,计算按比例增加的当前帧的第二部分的时间包络。 
所述时间包络例如是通过如参考图6描述的基于子块计算能量而获得的。它还可以通过其它方案来获得,例如通过基于子块计算信号的绝对值的均值,或另外地计算每个子块的最大值或中值。例如,还可以作为跟随有低通滤波的Teager-Kaiser类型的算子来获得包络。在所有的情况下,这里假设,在没有损失一般性的情况下,利用每个子块的值的时间分辨率来定义时间包络,所述子块的尺寸是灵活的。 
在步骤203中,基于在步骤201和202中定义的当前帧的包络并且基于先前帧的重构信号的包络(Tenv(xrec,N-1(n))来定义衰减因子函数。 
可选的步骤204定义关于被获得用于衰减因子的值的平滑化函数,以便避免在所处理的信号中可能展现的不连续性。 
参考图6,现在将描述作为本发明细节的实施例中的衰减方法。 
这样,在步骤301中,如图4a或4b所图示的,信号被切分为长度为N2=L/K2的子块。我们因此获得2K2个子块。 
在步骤302中,计算重构信号xrec,N(n)的K2个子块的能量En(k)。 
在步骤303中,计算按比例增加的当前帧的第二部分xcur2h,N(n)的每个子块的能量。由于如图4a表现的信号该部分的对称性,所以仅K2/2个值不同。 
在步骤304中,在K2+K2/2=3K2/2个块上计算信号子块xrec,N(n)和xcur2h(n)的最大能量,并且在ind1中存储它的索引。 
还存储如此计算的最大能量的值maxen。 
在步骤305中,对循环计数器进行初始化。在步骤306到309的循环中,对于在索引ind1的子块之前的每个子块,在307中作为其能量En(k)、最大能量maxen和先前帧的重构信号xrec,N-1的平均能量的函数,来确定衰减因子 g(k),并且在308中,将这个因子分配到子块的所有采样。 
在步骤310中,计算最大能量上的子块的第一采样的索引。在步骤311中,进行检查,以验证它是否小于帧的长度。如果是这样,则最大能量的子块处于当前帧中,并且在步骤311-312-313的循环中,将因子1(即,用于禁止衰减的值)分配到从子块的开始直至帧的结束的所有采样。 
在步骤314中,计算并存储所重构的当前帧的平均能量,即重构信号xrec,N(n)的首先K2个子块的平均能量。它在随后帧中将用于计算新的因子。在变体中,这个步骤的等式可以利用也考虑前回声的衰减的另一等式(例如,通过如下等式)来替换: 
En ‾ prev = 1 K Σ k = 0 K 2 - 1 En ( k ) · g 2 ( k )
这样,考虑了不再受前回声干扰的已处理信号。 
在步骤315和316中,逐采样地确定并应用用于对因子进行平滑化的函数,以便避免因子的过度突然变化。 
这个平滑化函数例如通过接下来的等式来定义: 
gpre(0)=αgold+(1-α)gpre′(0) 
gpre(i)=αgpre(i-1)+(1-α)gpre′(i),i=1,...,L-1 
其中对于先前采样定义的因子和当前采样的因子被加权,以获得平滑化后的因子。 
在步骤315中,存储对于当前帧的要被衰减的最后子块获得的最后衰减因子,以在随后帧中使用。 
可能存在其它平滑化函数,例如在因子的两个值之间的线性转变,或者具有恒定斜率(例如,以0.05为增量)或具有固定的长度(例如,在16个采样上)。 
一旦已经如此计算了所述因子,则通过将每个采样乘以对应的因子来对当前帧的重构信号进行前回声衰减: 
xrecg,N(n)=g(n)xrec,N(n),n=0到L-1 
现在,参考图7来在本发明的具体实施例中详细描述计算用于子块的衰减因子的步骤307。 
在这个实施例中,在步骤401中首先计算在步骤304中确定的最大能量与所处理的子块的能量的比率maxen/En(k)。 
实践中,这个比率可以求逆,并且相应地对阈值进行适应。 
步骤402测试这个比率是否小于或等于第一阈值S1。在示例中,值S1被固定在16,这个值被在实验上优化。 
如果是,则能量相对于最大能量的变化低,从而产生烦人的前回声,于是不必须进行衰减。在步骤403中,所述因子被固定在用于禁止衰减的衰减值上,即在1上。 
否则,步骤404测试比率r是否小于或等于第二阈值S2。在示例中,值S2被固定在32,这个值被在实验上优化。 
如果是,则这意味着可能具有小的烦人前回声,其必须通过在步骤405中将该因子固定在低衰减值(例如,在0.5)来轻微地进行衰减。当所述比率大于这个第二阈值时,前回声的风险于是为最大,并且在步骤406中将高衰减值(例如0.1)施加到该因子。 
在大多数情况下,特别是当前回声烦人时,在前回声帧之前的帧此时具有与背景噪声的能量对应的同类能量。根据实验,在前回声处理之后,信号的能量变得小于先前帧的平均能量既无用、甚至也是不期望的。 
在步骤407中,因此计算因子的限制值limr,利用其来对于给定的子块获得恰好与先前帧的平均能量相同的能量。接下来在步骤408中,由于这里衰减值是所关心的,所以将这个值限制于最大为1。 
在步骤409中,如此获得的值limg用作在衰减因子的最后计算中的下限。 
在衰减因子的计算的变体实施例中,可考虑所传送的信号的速率特性。实际上,在低速率传送中,量化噪声通常是相当可观的,从而增加了烦人前回声的风险。相反地,在非常高的速率上,编码质量可能非常好,并于是不必须进行前回声衰减。 
在多速率编码/解码的情况下,因此可考虑速率信息以确定衰减因子。 
图8a和图8b图示了在典型示例上的本发明的衰减方法的实现。 
在这个示例中,以8kHz对信号进行采样,帧的长度是160个采样,并且每个帧被划分为40个采样的4个子块。 
在图8a的部分a.)中,表现了与以16kHz采样的立体声信号的左声道的窄带部分(0-4000Hz)对应的3帧原始信号。该信号中的冲击或转变位于以索引360开始的子块中。这个信号已经例如通过G.729.1编码器的立体声扩展来编码。 
在图8a的部分b.)中,图示了在没有前回声处理的情况下的解码结果(仅左声道)。可能观察到采样160(在具有冲击的帧之前的帧的开始)向前的前回声。 
部分c.)示出了通过实现根据本发明的方法而获得的前回声衰减因子(实线)的演进。虚线表现在平滑化之前的因子。 
部分d.)图示了在应用前回声处理(信号b.)和信号c.)的相乘)之后的解码结果。看出了实际上已经去除了前回声。 
图8b图示了对其执行根据本发明的衰减方法的变体实施例的实现的相同典型示例。 
如果接近地观察图8a,则理解的是,平滑化的因子在冲击的时刻上没有上升回到1,从而暗示了冲击幅度的降低。这个降低的可察觉影响非常低,但无论如何可以被避免。 
为此,例如可能在平滑化之前将因子值1分配到在冲击所位于的子块之前的子块的最后几个采样。图8b的部分c.)给出了这样的校正的示例。在这个示例中,已经基于索引344,来将因子值1分配到在具有冲击的子块之前的子块的最后16个采样。 
这样,所述平滑化函数逐步地增加因子,以便在冲击的时刻具有接近于1的值。然后,维持所述冲击的幅度。 
这个方案的难度在于,获知在包括所述冲击的帧之前的帧中、冲击是否位于第一子块中。 
如果冲击位于第一子块中,则必须将因子值1分配到帧的最后采样。所述问题在于,在级联信号上,因为实际上反映MDCT变换的“时间混叠”的已知属性的该部分级联信号的对称性,所以不可能确切地确定冲击的位置。 
图9和图10图示了与图8a和图8b的第二帧对应的级联信号。 
实际上可能看到冲击处于级联信号的子块k=5中。这个冲击因此将处于随后帧的重构信号的第二或第三子块中。因此,它将不处于随后帧的第一子块中。然后,必须将因子值1分配到当前帧的最后采样。不管信号实际上在随后帧的第二子块中(图9的情况)还是在第三子块中(图10的情况)具有冲击,这都是有效的。 
另一方面,如图11或图12所表现的,当冲击处于随后帧的第1或第4 子块中时,因为级联信号的这部分的对称性,所以在级联信号的子块k=4中检测到冲击。 
现在,如果冲击处于第一子块中,则因子值1必须被分配到该帧的最后采样,但是当冲击处于第4子块中时,并不一定如此。 
一种解决方案是:如果在级联信号的第4子块中检测到冲击,则一直将因子值1分配到帧的最后采样。如果在随后帧中,冲击处于第一子块中(图1的情况),则操作是最佳的。另一方面,当冲击处于第4子块中(图12的情况)时,从帧的结束周围以后,衰减是次佳的,前回声衰减对于几个采样朝向1增加,并然后在随后帧的开始处回落到正确的衰减电平。这个次佳的主观影响弱,这是由于当冲击处于随后帧的第四子块中时,其幅度被分析窗口降低很多。由这个冲击引起的前回声弱。 
已经在相同输入信号的情况下、通过将它移位子块的长度以便移动冲击在帧中的位置而获得了图9到图12。例如通过比较图11和图12,可能观察到作为冲击位置的函数的、前回声电平的差异:当冲击处于第4子块中时,前回声显著地较弱。 
作为本发明主题的方法使用用于计算冲击开始的具体示例(针对子块搜索最大能量),但是可以利用用于确定冲击开始的任何其它方案来操作。 
作为前述发明的主题的方法被应用到任何变换编码器中的前回声衰减,所述变换编码器使用MDCT滤波器组或者具有完美重构、实值或复值的任何滤波器组、或者具有近乎完美重构的滤波器组以及使用傅立叶变换或小波变换的滤波器组。 
应该注意到,在解码器中帧的延迟可容忍的情况下,可以避免将瞬变现象(冲击)定位在级联信号的第二部分中的问题。用于减少前回声的方法然后被直接应用到重构信号,并且不再应用到级联信号,所述级联信号是具有时间混叠的重构信号/中间信号之间的混合。应用先前描述的用于检测转变、计算衰减因子和减少前回声的部件。 
此外,在没有明确地定义级联信号的情况下,仍旧可能使用在当前帧处重构的信号和逆MDCT的中间信号,来执行先前描述的操作。 
下文中给出了应用本发明的示例。 
参考图13a来描述示范立体声信号编码器。参考图13b来描述根据本发明的包括衰减装置的合适解码器。 
图13a示出了示范编码器,其中立体声信息针对每个频带进行传送、并且在频域中进行解码。 
矩阵化部件500基于左L和右R路径的输入信号来计算单声道信号M。 
编码器还集成了时间-频率变换的部件502、503、和504,其能够执行变换,例如离散傅立叶变换或DFT、MDCT变换(“修正的离散余弦变换”)、MCLT变换(“调制复互搭变换”)。 
因此,基于与左和右、以及单声道时间信号对应的值L、R和M来获得左L和右R以及单声道M频率信号的值。为了描述图13和图14,将对频域中的信号使用斜体字符。 
部件501(例如,被标准化到UIT-T的G.729.1编码器)还对单声道信号M进行量化和编码。这个模块传递核心二进制串bst1,并且还传递被变换到频域中的已解码单声道信号 
Figure BDA0000050680720000151
模块505基于频率信号L、R和M并且基于解码的信号 
Figure BDA0000050680720000152
来执行立体声参数编码。它传递用于二进制串的第一可选扩展层bst2、以及通过对两个层bst1和bst2进行解码而获得的已解码立体声信号 
Figure BDA0000050680720000153
和 
Figure BDA0000050680720000154
的两个信道。 
频域中的立体声残余信号由部件506和507来计算,并且由编码部件508来编码,并获得了用于二进制串的第二可选扩展层bst3。 
向解码器传送编码的核心信号bst1和可选的扩展层bst2和bst3。 
图13b示出了能够接收编码的核心信号bst1和可选的扩展层bst2和bst3的示范解码器。 
解码部件600使得可能解码核心二进制串bst1并获得单声道解码信号 
Figure BDA0000050680720000155
如果第一可选扩展层bst2可用,则可通过参数立体声解码部件601来对它进行解码,以便基于单声道解码信号 
Figure BDA0000050680720000156
来重构解码的立体声信号 和 
Figure BDA0000050680720000158
否则, 
Figure BDA0000050680720000159
和 
Figure BDA00000506807200001510
将等于 
Figure BDA00000506807200001511
当第二可选扩展层bst3也可用时,它通过解码部件602来解码,以便获得频域中的立体声残余信号。这被添加到解码的立体声信号 
Figure BDA00000506807200001512
和 
Figure BDA00000506807200001513
以便增加信号的频率表现的准确度。否则,当这个第二扩展层不可用时, 
Figure BDA00000506807200001514
和 
Figure BDA00000506807200001515
保持不变。 
这两个信号通过模块605和606而经历频率-时间逆变换,通过相应模块607和608进行添加/重叠来经历重构。然后,由诸如参考图3所描述的衰减模块609和610来执行根据本发明的前回声的减少,以便获得解码的时间 立体声信号 
Figure BDA0000050680720000161
和 
Figure BDA0000050680720000162
的两个信道。 
现在,将参考图14a和图14b来描述包括根据本发明的装置的另一示范解码器。 
图14a示出了G.729.1类型的宽带编码器的超宽带扩展的示范编码器。所述超宽带输入信号S32由子采样部件700来进行子采样以获得宽带信号S16。这个信号通过部件701(例如,通过ITU G.729.1编码器)来量化和编码。这个模块传递核心二进制串bst1,并且还传递频域中的解码的宽带信号 
Figure BDA0000050680720000163
超宽带输入信号S32被变换部件704变换到频域中。将由编码部件704来编码在宽带部分中没有编码的高波段(波段7000-14000Hz)的频率。这个编码是基于解码的宽带信号 
Figure BDA0000050680720000164
的谱。编码的参数构成二进制串的第一可选扩展bst2。 
由编码部件705提供的二进制串的第二可选层bst3包含用于改善宽带(50-7000Hz)质量的参数。 
图14b的解码器表现与图14a的编码器对应的超宽带解码器(50-14000Hz)。由G.729.1类型的宽带编码器(模块800)对核心二进制串bst1进行解码。因此,获得宽带解码信号的谱。这个谱可选地在801处通过第二可选扩展层bst3的解码来改进。模块801还包括宽带信号的频率-时间变换。本发明没有介入这个频率-时间变换来减少前回声,这是因为这里可用的是回声少的时间信号(G.729.1编码器的CELP和TDBWE分量),并因此可以应用在法国专利申请FR 06 01466中描述的技术。此后,解码的宽带信号在过采样部件802中通过因子2来进行过采样。 
当第一可选扩展层bst2可用于解码器时,它通过解码部件803进行解码。这个解码是基于解码的宽带信号 
Figure BDA0000050680720000165
的谱。如此获得的谱包含单独在没有被宽带部分编码的频区7000-14000Hz中的非零值。在这个配置中,在7000和14000Hz之间,因此没有不具有前回声的参考信号可用。因此,实现了根据本发明的衰减装置。 
由模块504通过频率-时间逆变换来获得时间信号。所述添加/重叠重构模块提供重构信号。由诸如参考图3描述的衰减模块807来执行根据本发明的前回声的减少。 
对于这个申请要注意,在MDCT逆变换之后的信号仅包含7000Hz以上 的频率。这个信号的时间包络因此可以以非常高的准确度来确定,从而增加了由本发明的衰减方法进行的前回声衰减的有效性。 
现在,参考图15来描述根据本发明的衰减装置的示范实施例。 
在硬件方面,在本发明的意义内的这个装置100典型地包括与存储器块BM协作的处理器μP,该存储器块BM包括存储器和/或工作存储器、以及上面以部件的名义提及的缓冲存储器MEM,该缓冲存储器MEM例如用于存储当前帧的时间包络、对于当前帧的最后采样计算的衰减因子、当前帧的子块的能量、或者实现诸如参考图5到图7描述的衰减方法所需要的任何其它数据。这个装置接收数字信号Se作为输入连续帧,并且如果适当则传递所重构的具有前回声的衰减的信号Sa。 
存储器块BM可包括计算机程序,该计算机程序包括代码指令,所述代码指令用于当这些指令由该装置的处理器μP来执行时、实现根据本发明的方法步骤,并且特别是实现至少基于当前帧的重构信号来定义级联信号的步骤、将所述级联信号划分为确定长度的采样的子块的步骤、计算级联信号的时间包络的步骤、检测时间包络到高能量区段的转变的步骤、确定在已经检测到转变的子块之前的低能量子块的步骤、以及在所确定的子块中进行衰减的步骤。 
根据对于所确定的子块的每一个计算的、作为级联信号的时间包络的函数的衰减因子来执行所述衰减。 
图5到图7可图示这样的计算机程序的算法。 
根据本发明的这个衰减装置可以是独立的或者集成到数字信号解码器中。 

Claims (11)

1.一种用于对基于变换编码产生的数字音频信号中的前回声进行衰减的方法,其中,在解码时,对于这个数字音频信号的当前帧,所述方法包括:
-至少基于当前帧的重构信号来定义级联信号的步骤(CONC);
-将所述级联信号划分为确定长度的采样的子块的步骤(DIV,301);
-计算级联信号的时间包络的步骤(ENV,302);
-检测时间包络到高能量区段的转变的步骤(DETECT,304);
-确定在已经检测到转变的子块之前的低能量子块的步骤(DETECT,304);以及
-在确定的子块中进行衰减的步骤(ATT),所述方法的特征在于,根据对于确定的子块的每一个计算的、作为级联信号的时间包络的函数的衰减因子,来执行所述衰减。
2.根据权利要求1的方法,其特征在于,对于作为先前帧的重构信号的时间包络的函数的衰减因子值,最小值是固定的。
3.根据权利要求1的方法,其特征在于,衰减因子被确定为确定的子块的每一个的时间包络的、包括所述转变的子块的时间包络的最大值的、和先前帧的重构信号的时间包络的函数。
4.根据权利要求1到3之一的方法,其特征在于,通过子块能量计算来确定所述时间包络。
5.根据权利要求1的方法,其特征在于,所述方法还包括:在所述在确定的子块中进行衰减的步骤之后的、计算和存储当前帧的时间包络的步骤。
6.根据权利要求1的方法,其特征在于,将值为1的衰减因子分配到包括转变的所述子块的采样、以及当前帧中的随后子块的采样。
7.根据权利要求4的方法,其特征在于,根据如下步骤,针对确定的子块来确定衰减因子:
-计算在包括转变的子块中确定的最大能量与当前子块的能量的比率;
-将所述比率与第一阈值进行比较;
-在其中所述比率小于或等于第一阈值的情况下,向所述衰减因子分配用于禁止所述衰减的值;
-在其中所述比率大于第一阈值的情况下:
●将所述比率与第二阈值进行比较;
●在其中所述比率小于或等于第二阈值的情况下,向所述衰减因子分配低衰减值;
●在其中所述比率大于第二阈值的情况下,向所述衰减因子分配高衰减值。
8.根据权利要求1的方法,其特征在于,在逐采样地计算的因子之间确定平滑化函数。
9.根据权利要求1的方法,其特征在于,通过向被施加到在包括转变的子块之前的子块的预定数目采样的衰减因子施加用于禁止所述衰减的衰减值,来对在包括转变的子块之前的子块执行因子校正。
10.一种用于对基于变换编码器产生的数字音频信号中的前回声进行衰减的装置,其中,与解码器相关联的装置包括如下模块来处理这个数字音频信号的当前帧:
-用于至少基于当前帧的重构信号来定义级联信号的模块(101);
-用于将所述级联信号划分为确定长度的采样的子块的模块(102);
-用于计算级联信号的时间包络的模块(103);
-用于检测时间包络到高能量区段的转变的模块(104);
-用于确定在已经检测到转变的子块之前的低能量子块的模块(105);以及
-用于在确定的子块中进行衰减的模块(105),所述装置的特征在于,所述衰减模块根据对于确定的子块的每一个计算的、作为级联信号的时间包络的函数的衰减因子,来执行所述衰减。
11.一种数字音频信号的解码器,包括根据权利要求10的装置。
CN2009801363279A 2008-09-17 2009-09-15 用于对数字音频信号中的前回声进行衰减的方法和装置 Active CN102160114B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0856248 2008-09-17
FR0856248 2008-09-17
PCT/FR2009/051724 WO2010031951A1 (fr) 2008-09-17 2009-09-15 Attenuation de pre-echos dans un signal audionumerique

Publications (2)

Publication Number Publication Date
CN102160114A CN102160114A (zh) 2011-08-17
CN102160114B true CN102160114B (zh) 2012-08-29

Family

ID=40174728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801363279A Active CN102160114B (zh) 2008-09-17 2009-09-15 用于对数字音频信号中的前回声进行衰减的方法和装置

Country Status (8)

Country Link
US (1) US8676365B2 (zh)
EP (1) EP2347411B1 (zh)
JP (1) JP5295372B2 (zh)
KR (1) KR101655913B1 (zh)
CN (1) CN102160114B (zh)
ES (1) ES2400987T3 (zh)
RU (1) RU2481650C2 (zh)
WO (1) WO2010031951A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122020024236B1 (pt) * 2009-10-20 2021-09-14 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio e programa de computador para uso em aplicações de baixo retardamento
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
FR3000328A1 (fr) * 2012-12-21 2014-06-27 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
FR3025923A1 (fr) * 2014-09-12 2016-03-18 Orange Discrimination et attenuation de pre-echos dans un signal audionumerique
US10354669B2 (en) * 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
CN1993734A (zh) * 2005-04-28 2007-07-04 西门子公司 噪声抑止的方法和设备
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
CN101118747A (zh) * 2003-12-19 2008-02-06 艾利森电话股份有限公司 保真度优化的预回声抑制编码
CN101228574A (zh) * 2005-09-08 2008-07-23 北京阜国数字技术有限公司 一种控制前回声的编码和解码装置及方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2674710B1 (fr) * 1991-03-27 1994-11-04 France Telecom Procede et systeme de traitement des preechos d'un signal audio-numerique code par transformee frequentielle.
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
WO2003043003A2 (en) * 2001-11-16 2003-05-22 Koninklijke Philips Electronics N.V. Embedding supplementary data in an information signal
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
DE10324438A1 (de) * 2003-05-28 2004-12-16 Knorr-Bremse Systeme für Schienenfahrzeuge GmbH Bremsvorrichtung eines Schienenfahrzeugs
WO2006114368A1 (de) * 2005-04-28 2006-11-02 Siemens Aktiengesellschaft Verfahren und vorrichtung zur geräuschunterdrückung
RU2351024C2 (ru) * 2005-04-28 2009-03-27 Сименс Акциенгезелльшафт Способ и устройство для подавления шумов
KR100880995B1 (ko) * 2007-01-25 2009-02-03 후지쯔 가부시끼가이샤 오디오 부호화 장치 및 오디오 부호화 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
CN101118747A (zh) * 2003-12-19 2008-02-06 艾利森电话股份有限公司 保真度优化的预回声抑制编码
CN1993734A (zh) * 2005-04-28 2007-07-04 西门子公司 噪声抑止的方法和设备
CN101228574A (zh) * 2005-09-08 2008-07-23 北京阜国数字技术有限公司 一种控制前回声的编码和解码装置及方法
FR2897733A1 (fr) * 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant

Also Published As

Publication number Publication date
EP2347411A1 (fr) 2011-07-27
JP2012503214A (ja) 2012-02-02
US8676365B2 (en) 2014-03-18
JP5295372B2 (ja) 2013-09-18
CN102160114A (zh) 2011-08-17
RU2011115003A (ru) 2012-10-27
US20110178617A1 (en) 2011-07-21
KR20110076936A (ko) 2011-07-06
RU2481650C2 (ru) 2013-05-10
EP2347411B1 (fr) 2012-12-05
WO2010031951A1 (fr) 2010-03-25
ES2400987T3 (es) 2013-04-16
KR101655913B1 (ko) 2016-09-08

Similar Documents

Publication Publication Date Title
CN101390159B (zh) 识别和衰减变换编码生成的数字信号中回声的方法和设备
CN102160114B (zh) 用于对数字音频信号中的前回声进行衰减的方法和装置
CN1809872B (zh) 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
CN101425294B (zh) 声音编解码与发送接收设备及编码方法、通信终端和基站
KR100647336B1 (ko) 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
RU2449387C2 (ru) Способ и устройство для обработки сигнала
JP3224130B2 (ja) 高品質オーディオ用符号器・復号器
JP5140730B2 (ja) 切り換え可能な時間分解能を用いた低演算量のスペクトル分析/合成
US7181404B2 (en) Method and apparatus for audio compression
CN101842832B (zh) 编码装置和解码装置
US8744841B2 (en) Adaptive time and/or frequency-based encoding mode determination apparatus and method of determining encoding mode of the apparatus
CN105074818A (zh) 用于参数化多声道编码的方法
CN101809657A (zh) 用于噪声填充的方法和设备
CN101521010B (zh) 一种音频信号的编解码方法和装置
CN104395958A (zh) 数字音频信号中的有效前回声衰减
CN104718570A (zh) 帧丢失恢复方法,和音频解码方法以及使用其的设备
CN104103276A (zh) 一种声音编解码装置及其方法
CN104981981A (zh) 数字音频信号中的前回声的有效衰减
US9305556B2 (en) Apparatus and method for encoding and decoding multi-channel audio signal
KR101418227B1 (ko) 스피치 시그널 부호화 방법 및 복호화 방법
KR20030011912A (ko) 오디오 코딩
CN101673545A (zh) 一种编解码方法及装置
CN106030704A (zh) 用于对音频信号进行编码/解码的方法和设备
KR100686174B1 (ko) 오디오 에러 은닉 방법
CN101232354A (zh) 一种信号变换控制方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant