CN101790756B - 瞬态检测器以及用于支持音频信号的编码的方法 - Google Patents

瞬态检测器以及用于支持音频信号的编码的方法 Download PDF

Info

Publication number
CN101790756B
CN101790756B CN2008801048335A CN200880104833A CN101790756B CN 101790756 B CN101790756 B CN 101790756B CN 2008801048335 A CN2008801048335 A CN 2008801048335A CN 200880104833 A CN200880104833 A CN 200880104833A CN 101790756 B CN101790756 B CN 101790756B
Authority
CN
China
Prior art keywords
frame
transient state
transient
designator
hangover
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008801048335A
Other languages
English (en)
Other versions
CN101790756A (zh
Inventor
A·塔莱布
G·尤尔伯格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN101790756A publication Critical patent/CN101790756A/zh
Application granted granted Critical
Publication of CN101790756B publication Critical patent/CN101790756B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Abstract

瞬态检测器(100)分析(110)输入音频信号的给定帧n以基于给定帧n的音频信号特性来确定后一帧n+1的瞬态拖尾指示符,以及将所述确定的瞬态拖尾指示符用信号通知(120)给相关联的音频编码器(10)以实现后一帧n+1的适当编码。

Description

瞬态检测器以及用于支持音频信号的编码的方法
技术领域
本发明涉及对音频信号进行操作的瞬态检测器以及用于支持音频信号的编码的方法。
背景技术
编码器是一种能够分析诸如音频信号之类的信号并以编码的形式输出信号的设备、电路或计算机程序。所得到的信号通常用于传输、存储和/加密的目的。另一方面,解码器是一种能够反转编码器操作的设备、电路或计算机程序,因为其接收编码的信号并输出解码的信号。
在大多数现有技术的编码器(例如音频编码器)中,在频域中分析输入信号的每个帧。这一分析的结果被量化和编码,并且然后根据应用进行传输或存储。在接收侧(或者当使用所存储的编码信号时),后面是合成过程的相应解码过程使得有可能在时域中恢复信号。
编解码器通常用于压缩/解压缩信息(例如音频和视频数据)以便通过带宽受限的通信信道进行高效的传输。
特别地,市场高度需要以低比特率传输和存储音频信号,同时保持高的音频质量。例如,在传输资源或存储受限的情况下,低比特率操作是必要的成本因素。例如在移动通信系统中的流式传输和消息接发应用中通常是这种情况。
在图1中示意性地示出使用音频编码和解码的音频传输系统的一般实例。整个系统基本上包括在发射侧的音频编码器10和发射模块(TX)20以及在接收侧的接收模块(RX)30和音频解码器40。
音频信号可以被认为是准稳态的,即短时间段的稳态。例如,基于变换的音频编解码器将信号分成短时间段即帧,并且依赖于准稳态性来实现高效的压缩。
音频信号可以包含在频谱或振幅中的许多快速变化,即所谓的瞬态。期望检测这些瞬态,以使音频编解码器可以采取适当的动作来避免瞬态可能在例如基于变换的音频编解码器中引起的听得到的赝象(artifact)(例如前回声效应,即在时间上的量化噪声扩散)。
因为这个原因,所以结合音频编解码器来使用瞬态检测器。瞬态检测器分析音频信号,并且负责将所检测到的瞬态用信号通知给编码器。存在操作在时域中的瞬态检测器以及操作在频域中的瞬态检测器。
例如,瞬态检测器通常作为到窗切换模块的输入而被包括在音频编解码器中[1、2]。
发明内容
然而,通常需要更高效的音频编码以及用于支持包括瞬态检测器的音频编码的改进的机制和实现方式。
本发明的一般目的是提供一种对音频信号进行操作的改进的瞬态检测器。
还有一个目的是提供一种用于支持音频信号的编码的方法。
这些和其他目的由所附的专利权利要求所限定的本发明来满足。
本发明人已认识到,当在时域中执行瞬态检测并且编解码器基于重叠变换来操作时,给定帧中的瞬态也将影响后一帧的编码。因此,本发明的基本思想是提供一种瞬态检测器,所述瞬态检测器分析输入音频信号的给定帧n以基于给定帧n的音频信号特性来确定后一帧n+1的瞬态拖尾(hangover)指示符,以及将所确定的瞬态拖尾指示符用信号通知给相关联的音频编码器以实现后一帧n+1的适当编码。
优选地,当帧n的音频信号特性包括表示瞬态的特性时,瞬态检测器确定后一帧n+1的指示瞬态的瞬态拖尾指示符。
实际上,因此有可能以下面的这种方式来配置瞬态检测器:如果检测到瞬态并且用信号通知给当前帧的编解码器,则瞬态检测器还将用信号通知与后一帧有关的瞬态拖尾。
以这种方式可以确保,当编解码器基于重叠变换进行操作时还对后一帧采取适当的编码动作。
本发明覆盖瞬态检测器以及用于支持音频信号的编码的方法这二者。
当阅读下面对本发明的实施例的描述时将会认识到由本发明提供的其他优点。
附图说明
通过参考与附图一起得到的下面的描述,将会最好地理解本发明连同其更多的目的和优点,其中:
图1是示出使用了音频编码和解码的音频传输系统的一般实例的示意性框图。
图2是示出根据本发明一个示例性实施例的与音频编码器相关联的新颖的瞬态检测器的示意性框图。
图3A-B是示出在给定输入帧n中的瞬态可以如何影响后一帧的编码的示意图。
图4是根据本发明一个示例性实施例的用于支持音频信号的编码的方法的示意性流程图。
图5是示出可以如何将帧分成块以用于功率计算目的的实例的示意图。
图6是示出具有高通滤波的瞬态检测器的实例的示意图。
图7是示出根据本发明一个示例性实施例的具有瞬态拖尾检查的瞬态检测器的实例的示意图。
图8A-B是示出根据本发明一个示例性实施例的瞬态的第一实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。
图9A-B是示出根据本发明一个示例性实施例的瞬态的第二实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。
图10A-B是示出根据本发明一个示例性实施例的瞬态的第三实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。
图11是适合于全带扩展的示例性编码器的框图。
图12是适合于全带扩展的示例性解码器的框图。
具体实施方式
在全部附图中,相同的附图标记将被用于相应的或类似的元素。
如先前所提到的那样,期望检测音频信号中的瞬态,以使音频编解码器可以采取适当的动作来避免瞬态可能在例如基于变换的音频编解码器以及更一般的是基于重叠变换来进行操作的音频编码器中引起的听得到的赝象(例如前回声效应)。前回声通常在具有尖锐上升(attack)的信号开始在紧接在低能量区域后的变换块的末端附近时出现。一般来说,瞬态由音频信号特性(例如在时域和/或频域中测量的振幅和/或功率)中的突变来表征。优选地,音频编码器被配置成在针对输入帧检测到瞬态时执行尤其适于瞬态的基于变换的编码(瞬态编码模式)。存在许多用于编码瞬态的不同的常规策略。
然而,本发明人已认识到,当在时域中执行瞬态检测并且编解码器基于重叠变换来操作时,给定帧中的瞬态也将影响后一帧的编码。基于对重叠变换编解码器的操作的这一理解,引入新颖的瞬态检测器。
图2是示出根据本发明一个示例性实施例的与音频编码器相关联的新颖的瞬态检测器的示意性框图。图2的瞬态检测器100基本上包括分析器110和信令模块120。要被相关联的音频编码器10编码的音频信号还作为到瞬态检测器100的输入而被传送。一般地,瞬态检测器在操作中用来检测音频信号的当前输入帧中的瞬态,并且将所述瞬态用信号通知给音频编码器以用于当前帧的适当编码。在该实例中,音频编码器10优选地是使用了重叠变换的基于变换的编码器。
分析器110基于所接收的音频信号来执行合适的信号分析。优选地,瞬态检测器100分析音频信号的给定帧n以基于所述给定帧n的音频信号特性来在分析器110的新颖拖尾指示符模块中确定后一帧n+1的瞬态拖尾指示符。信令模块120在操作中用于将所确定的瞬态拖尾指示符用信号通知给相关联的音频编码器10以实现后一帧n+1的适当编码。可以使用任何合适的瞬态检测量度,例如短期与长期的能量比。
因此有可能的是,瞬态检测器100不仅用信号通知当前帧n的瞬态,而且还基于对当前帧n的分析来用信号通知后一帧n+1的瞬态拖尾指示符。
如在图3A-B中所示出的那样,当编码器基于重叠变换来操作时,给定输入帧中的瞬态可能影响后一帧的编码。
例如,基于变换的音频编码器通常围绕时域到频域的变换来建立,所述时域到频域的变换例如是DCT(离散余弦变换)、改进的离散余弦变换(MDCT)或不同于MDCT的重叠变换。基于变换的音频编码器的共同特性是,它们对重叠采样块(即重叠帧)进行操作。
图3A-B示出音频信号的输入帧,并且还示出被用作音频编码器的输入的所谓的重叠帧。
在图3A中,示出两个连续的音频输入帧:帧n-1和帧n。与输入帧n有关的基于变换的音频编码的输入由帧n和n-1来形成。在该实例中,输入帧n包括瞬态,并且基于变换的音频编码的输入将自然地包括该瞬态。
在图3B中,示出两个连续的音频输入帧:帧n和帧n+1。与输入帧n+1有关的基于变换的音频编码的输入由帧n和n+1来形成。如从图3B中可以看到的那样,帧n中的瞬态还将存在于用于与帧n+1有关的编码的变换的输入中。
应该注意,用于编码帧n的变换的输入以及用于编码帧n+1的变换的输入是重叠的。因此,这是将这些较大的变换输入块称作重叠帧的原因。
如果在时域中执行瞬态检测并且编解码器利用重叠变换(例如改进的离散余弦变换(MDCT))来操作,则输入帧中的瞬态还将在后一帧中出现。
因为瞬态不仅在检测到它的帧中被编码,而且还在后一帧中被编码,所以建议在瞬态检测器中引入拖尾。拖尾意味着,如果检测到瞬态并且用信号通知给当前帧的编解码器,则瞬态检测器还应该将在后一帧中检测到瞬态用信号通知给编解码器。
以这种方式可以确保也对后一帧采取适当的编码动作。当将指示瞬态的拖尾指示符从瞬态检测器100的信令模块120用信号通知给音频编码器10时,编码器10执行帧n+1的所谓的瞬态编码;即使用适于编码包括瞬态的重叠帧块的所谓的瞬态编码模式。
在所谓的瞬态编码模式中的适当的编码动作例如可以是,减小变换的长度以便以最差的频率分辨率为代价来改进时间分辨率。这例如可以通过下述操作来实现:基于重叠帧来执行时域混叠(TDA)以生成相应的时域混叠帧,并且基于所述时域混叠帧来在时间上执行分段以生成至少两个段,所述段还被称为子帧。基于这些段,然后可以执行基于变换的频谱分析以便为每个段获得表示该段的频率内容的系数。
应该理解,即使瞬态检测器100基于输入帧n+1的音频信号特性没有检测到瞬态(参见图3B),也可以无论如何基于源自从帧n中检测到的瞬态的拖尾而将瞬态拖尾指示用信号通知给音频编码器10。这违背了仅依赖于由瞬态检测器基于所考虑的最近的输入帧的音频信号特性的常规瞬态检测的现有技术中的主要趋势。利用根据现有技术的瞬态检测器,将检测不到帧n+1的瞬态(图3B),并且因此相关联的音频编码器将不使用瞬态编码模式,从而导致听得到的赝象(例如令人讨厌的前回声)。
参考图4的示例性示意性流程图,可以把对高效音频编码的改进的支持概括如下:
在步骤S1中,接收到音频信号。在步骤S2中,分析给定帧n以基于所述给定帧n的音频信号特性来确定后一帧n+1的瞬态拖尾指示符。在步骤S3中,将瞬态拖尾指示符用信号通知给相关联的音频编码器以便相对于音频信号的后一帧n+1实现适当的编码动作。
如上面所指示的那样,优选地,根据在正被分析的给定输入帧n内表示瞬态的音频信号特性的存在来确定瞬态拖尾指示符的值。拖尾指示符的值可以以许多不同的方式来表示,所述不同的方式包括True/False、1/0、+1/-1以及许多其他等同的表示。
为了更好地理解本发明,现在将描述信号分析和检测机制的更详细的实例。
按块的能量计算
作为一个实例,瞬态检测器可以基于音频信号中的功率的波动。例如,要被编码的音频帧可以被分成几个块,如在图5中示出的那样。在每个块i中,计算短期功率Pst(i)。
可以通过简单IIR滤波器来计算长期功率Plt(i),Plt(i)=αPlt(i-1)+(1-α)Pst(i),其中α是遗忘因子。
当商Pst(i)/Plt(i-1)超过某一阈值时,瞬态检测器就用信号通知在块i中发现瞬态。
按照能量来表示;对于每个块,执行短期能量E(n)与长期能量ELT(n)之间的比较。每当能量比超过某一阈值时就可以认为瞬态被检测到:
E(n)≥RATIO×ELT(n)
其中RATIO是可以被设置为某一合适的值(例如7.8dB)的能量比阈值。
这仅是检测量度的实例,并且本发明不限于此。
高通滤波器和零交叉
因为音频帧的块是短的,所以存在上述瞬态检测器触发稳态信号的风险,在这种情况下,低频正弦函数的波动看成是快速的功率变化。
这一问题可以通过在功率计算之前添加高通滤波器来避免,如图6的实例中所示出的那样。图6的瞬态检测器100包括高通滤波器113、块能量计算模块114、长期平均模块115以及阈值比较模块116,以提供用于帧n的IsTransient(是瞬态)指示。高通滤波器113除去低频,从而导致仅较高频率的功率计算。
上述问题的另一可能解决方案可以是,计算所分析的块中的零交叉的数目。如果零交叉的数目少,则认为信号仅包含低频并且瞬态检测器可以决定增加阈值或者将该块认为是无瞬态的。
图7是示出根据本发明一个示例性实施例的具有瞬态拖尾检查的瞬态检测器的实例的示意图。图7的瞬态检测器100包括高通滤波器113、块能量计算模块114、长期平均模块115、阈值比较模块116、以及用于检查瞬态拖尾的模块112,以提供用于后一帧n+1的IsTransient拖尾指示。
根据窗函数和/或位置的瞬态/拖尾检测
可选地,瞬态检测器的信号分析器可以被配置成不仅依赖于瞬态的存在而且依赖于预定的窗函数和/或所述瞬态在正被分析的帧内的位置来确定瞬态拖尾指示符的值。
在音频编码器中的变换之前,音频信号通常乘以窗函数。在基于改进的离散余弦变换(MDCT)的编解码器的情况下,窗函数常常是所谓的正弦窗,但是它也可以是Kaiser-Bessel窗或某一其他窗函数。
窗函数通常在当前帧的开始以及前一帧的末端处具有最大值,而在当前帧的末端和前一帧的开始处接近于零。
这意味着,在当前帧的末端附近的瞬态将被窗函数抑制并且因此用信号通知给编码器不大重要。如果瞬态被充分抑制,则不用信号通知编码器检测到瞬态甚至会是有益的。
然而,当下一帧要被编码时,瞬态将处于前一帧的末端,即位于窗函数的最大值附近,并且用信号通知编码器检测到瞬态是必要的。
所检测到的在帧的末端附近的瞬态应该因此导致拖尾被设置为1(或者等同的表示),而没有用信号通知编码器检测到的瞬态。这样,瞬态检测器用信号通知在后一帧中检测到瞬态。
类似地,如果在帧的开始处检测到瞬态,则瞬态检测器应该用信号通知检测到瞬态,但是将拖尾设置为0(或者等同的表示),因为当下一帧被编码时该瞬态将被窗函数抑制。
位于帧的中心的瞬态将出现在当前帧和后一帧二者中。因此应该用信号通知“检测到的瞬态”并且将拖尾设置为1。
  在以下处检测到的瞬态   信号瞬态   拖尾
  帧的开始   1   0
  帧的中心   1   1
  帧的末端   0   1
表1:依赖于瞬态的位置的瞬态检测器的判定
优选地关于窗函数来选择“帧的开始”、“帧的中心”以及“帧的末端”之间的精确边界。
还应该理解,表1的1/0表示仅被用作实例。实际上,包括True/False和+1/-1的任何合适的表示都可以被用来指示拖尾/不拖尾。甚至有可能使用非二进制表示,例如概率指示。
换句话说,瞬态检测器可以被配置成,如果在基于预定窗函数的加窗操作之后在帧n中表示瞬态的音频信号特性是能检测的,则确定后一帧n+1的指示瞬态的瞬态拖尾指示符。瞬态检测器还可以被配置成,如果在基于窗函数的加窗操作之后在帧n中表示瞬态的音频信号特性被抑制,则确定后一帧n+1的不指示瞬态的拖尾指示符。窗函数通常对应于被用于在相关联的音频编码器中对帧n进行变换编码、但是在时间上被向前移位了一个帧的窗函数(覆盖至少两个帧),如将在下面解释的那样。
本发明引入了判定逻辑,其改变初步瞬态检测以便调整判定来应付重叠帧。这基于依赖于时间发生的某些瞬态不需要以特殊方式来处理这一事实。对于这样的情况,本发明将不考虑初步判定,并且用信号通知不存在瞬态。一般来说,本发明将改变初步瞬态检测以基于特定应用来调整判定。
图8A-B是示出根据本发明一个示例性实施例的瞬态的第一实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。
图8A示出用作变换的输入的帧n-1和帧n以及在应用该变换之前所使用的一个示例性窗函数。在帧n(帧的中心)中存在瞬态,并且在使用所选择的窗函数的窗操作之后,在该特定实例中该瞬态仍是能检测的。因此,瞬态检测指示符TD被设置为值1。
为了拖尾指示的目的,帧n被用作分析帧,但是如在图8B中所示出的那样,窗函数被向前移位了一个帧。在该特定实例中,在通过移位的窗函数进行加窗之后帧n中的瞬态还是能检测的,并且因此拖尾指示HO被设置为值1。
图9A-B是示出根据本发明一个示例性实施例的瞬态的第二实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。
在使用所选择的窗函数的窗操作之后,在图9A的实例中,帧n(帧的开始)中的瞬态是能检测的。因此,瞬态检测指示符TD被设置为值1。
在图9B的实例中,帧n中的瞬态被移位的窗函数抑制,并且因此拖尾指示HO被设置为值0。
图10A-B是示出根据本发明一个示例性实施例的瞬态的第三实例以及该瞬态的位置和/或窗函数对于拖尾指示的影响的示意图。
在图10A的实例中,帧n(帧的末端)中的瞬态被变换窗函数抑制,并且因此瞬态检测指示符TD被设置为0。
如在图10B的实例中所示出的那样,在通过移位的窗函数进行加窗之后帧n中的瞬态是能检测的,并且因此拖尾指示HO被设置为1。
通过使瞬态检测更进一步适于所选择的窗函数可以改进上述构思。
在本发明的一个示例性实施例中,在短期能量除以长期能量并将商与阈值比较之前,可以在当前块处通过窗函数来定标短期能量。仍利用短期能量的未定标的版本来更新长期能量。如果由长期能量除的所定标的短期能量超过阈值,则瞬态检测器用信号通知检测到瞬态。
类似地,在移位了一个帧长度的块的位置(当编码下一帧时该块的位置)处通过窗函数来定标短期能量。如果由长期能量除的所定标的短期能量超过阈值,则瞬态检测器将拖尾设置为1,否则设置为0。
在本发明的一个优选示例性实施例中,瞬态检测器包括:用于通过所选择的窗函数来定标帧n以产生第一定标帧的装置;用于基于所述第一定标帧来确定帧n的瞬态指示符的装置;用于通过在时间上向前移位了一个帧的窗函数来定标帧n以产生第二定标帧的装置;以及用于基于所述第二定标帧来确定后一帧n+1的瞬态拖尾指示符的装置。
在下文中,将关于适合于“ITU-T G.722.1fullband codec extension”(现在被重新命名为ITU-T G.719标准)的特定示例性且非限制性编解码器实现来描述本发明。在该特定实例中,编解码器被呈现为低复杂性基于变换的音频编解码器,其优选地以48kHz的采样率操作,并且提供范围从20Hz一直到20kHz的全音频带宽。编码器以20ms的帧处理输入16比特线性PCM信号,并且编解码器具有40ms的总延迟。编码算法优选地是基于具有自适应时间分辨率、自适应比特分配以及低复杂性格型矢量量化的变换编码。另外,解码器可以通过信号自适应噪声填充或带宽扩展来代替非编码的频谱分量。
图11是适合于全带信号的示例性编码器的框图。通过瞬态检测器来处理以48kHz采样的输入信号。根据对瞬态的检测,对输入信号帧应用高频率分辨率或低频率分辨率(高时间分辨率)变换。在稳态帧的情况下,自适应变换优选地是基于改进的离散余弦变换(MDCT)。对于非稳态帧,使用(基于时域混叠和时间分段的)更高时间分辨率变换,而不需要附加延迟并且在复杂性方面具有非常小的开销。非稳态帧优选地具有等同于5ms帧的时间分辨率(尽管可以选择任一任意的分辨率)。
在某一个帧处检测到的瞬态也将触发在下一帧处的瞬态。瞬态检测器的输出是例如被表示为IsTransient的标志。如果检测到瞬态,则该标记被设置为值1或逻辑值TRUE或等同的表示,否则(如果没有检测到瞬态)该标志被设置为值0或逻辑值FALSE或等同的表示。
将所获得的频谱系数分组成不等长度的频带会是有益的。估计每个频带的范数(norm),并且所得到的包括所有频带的范数的频谱包络被量化和编码。然后通过量化的范数来归一化所述系数。量化的范数被进一步基于自适应频谱加权而调整并且被用作比特分配的输入。归一化的频谱系数是基于为每个频带分配的比特而量化和编码的格型矢量。非编码频谱系数的大小被估计、编码并且传输到解码器。优选地,对编码的频谱系数以及编码的范数二者的量化指数应用霍夫曼编码。
图12是适合于全带信号的示例性解码器的框图。用于指示帧配置(即稳态或瞬态)的瞬态标志被首先解码。频谱包络被解码,并且在解码器处使用相同的比特精确的范数调整和比特分配算法以便重新计算比特分配,这对解码归一化的变换系数的量化指数来说是必需的。
在解量化之后,优选地通过使用根据所接收的频谱系数(具有非零比特分配的频谱系数)而建立的频谱填充码本来重新生成低频非编码的频谱系数(分配的零比特)。
噪声级调整指数可以被用来调整重新生成的系数的大小。优选地使用带宽扩展来重新生成高频非编码的频谱系数。
解码的频谱系数和重新生成的频谱系数被混合并且产生归一化的频谱。应用解码的频谱包络,从而产生解码的全带频谱。
最后,应用逆变换以恢复时域解码信号。这优选地通过对于稳态模式应用改进的离散余弦逆变换(IMDCT)或者对于瞬态模式应用更高时间分辨率变换的逆变换来执行。
适于全带扩展的算法基于自适应变换编码技术。它对输入和输出音频的20ms帧进行操作。因为变换窗(基本函数长度)是40ms并且在连续输入帧和输出帧之间使用50%的重叠,所以有效先行缓冲器大小是20ms。因此,整个算法延迟是40ms,其是帧大小加上先行大小的和。在使用ITU-T G.719编解码器中经历的所有其他附加延迟归因于计算和/或网络传输延迟。
本发明的优点包括低复杂性、时域计算(没有所需的频谱计算)以及/或者与基于拖尾值的重叠变换的兼容性。
上述实施例仅作为实例而给出,并且应该理解本发明不限于此。保留此处所公开并且请求保护的基本潜在原理的进一步的修改、变化和改进都在本发明的范围内。
参考文献
[1]ISO/IEC JTC/SC29/WG 11,CD 11172-3,″CODING OF MOVINGPICTURES AND ASSOCIATED AUDIO FOR DIGITAL STORAGE MEDIAAT UP TO ABOUT 1.5MBIT/s,Part 3AUDIO″,1993.
[2]ISO/IEC 13818-7,“MPEG-2Advanced Audio Coding,AAC”,1997.

Claims (23)

1.一种对音频信号进行操作的瞬态检测器,其中所述瞬态检测器包括:
-用于分析所述音频信号的给定帧n以基于所述给定帧n的音频信号特性来确定后一帧n+1的瞬态拖尾指示符的装置;以及
-用于将所述确定的瞬态拖尾指示符用信号通知给相关联的音频编码器以实现所述后一帧n+1的适当编码的装置。
2.根据权利要求1所述的瞬态检测器,其中,所述用于分析的装置被配置成根据在所述给定帧n中表示瞬态的音频信号特性的存在来确定所述后一帧n+1的所述瞬态拖尾指示符的值。
3.根据权利要求2所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果所述给定帧n的所述音频信号特性包括表示瞬态的特性,则确定所述后一帧n+1的指示瞬态的瞬态拖尾指示符。
4.根据权利要求2所述的瞬态检测器,其中,所述用于分析的装置被配置成还根据预定的窗函数来确定所述后一帧n+1的所述瞬态拖尾指示符的值。
5.根据权利要求4所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果在基于所述窗函数的加窗操作之后在所述给定帧n中表示瞬态的音频信号特性是能检测的,则确定所述后一帧n+1的指示瞬态的瞬态拖尾指示符。
6.根据权利要求4所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果在基于所述窗函数的加窗操作之后在所述给定帧n中表示瞬态的音频信号特性被抑制,则确定所述后一帧n+1的不指示瞬态的拖尾指示符。
7.根据权利要求4所述的瞬态检测器,其中,所述窗函数对应于被用于在所述相关联的音频编码器中对所述音频信号的帧n进行变换编码、但是在时间上被向前移位了一个帧的窗函数。
8.根据权利要求7所述的瞬态检测器,其中,所述相关联的音频编码器基于重叠变换以及使用至少两个帧的相关联的窗函数来操作以便对帧进行编码。
9.根据权利要求4所述的瞬态检测器,其中,所述瞬态检测器包括:
-用于通过所述窗函数来定标所述给定帧n以产生第一定标帧的装置;
-用于基于所述第一定标帧来确定所述给定帧n的瞬态指示符的装置;
-用于通过在时间上向前移位一个帧的所述窗函数来定标所述给定帧n以产生第二定标帧的装置;以及
-用于基于所述第二定标帧来确定所述后一帧n+1的瞬态拖尾指示符的装置。
10.根据权利要求2所述的瞬态检测器,其中,所述用于分析的装置被配置成还根据所述瞬态在所述给定帧n中的位置来确定所述后一帧n+1的所述瞬态拖尾指示符的值。
11.根据权利要求10所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果所述瞬态位于所述给定帧n的中心或末端,则确定所述后一帧n+1的指示瞬态的瞬态拖尾指示符。
12.根据权利要求10所述的瞬态检测器,其中,所述用于分析的装置被配置成,如果所述瞬态位于所述给定帧n的开始,则确定所述后一帧n+1的不指示瞬态的瞬态拖尾指示符。
13.根据在前权利要求中的任何一项所述的瞬态检测器,其中,所述瞬态检测器用于与使用重叠变换的基于变换的音频编码器一起操作。
14.根据权利要求1所述的瞬态检测器,其中,如果指示瞬态的瞬态拖尾指示符被用信号通知,则所述后一帧n+1的所述适当编码包括瞬态编码。
15.一种支持音频信号的编码的方法,所述方法包括以下步骤:
-接收所述音频信号;
-分析所述音频信号的给定帧n以基于所述给定帧n的音频信号特性来确定后一帧n+1的瞬态拖尾指示符;以及
-将所述瞬态拖尾指示符用信号通知给相关联的音频编码器以便相对于所述音频信号的所述后一帧n+1实现适当的编码动作。
16.根据权利要求15所述的方法,其中,所述分析步骤包括根据在所述给定帧n中表示瞬态的音频信号特性的存在来确定所述后一帧n+1的所述瞬态拖尾指示符的值的步骤。
17.根据权利要求16所述的方法,其中,所述分析步骤包括如果所述给定帧n的所述音频信号特性包括表示瞬态的特性则确定所述后一帧n+1的指示瞬态的瞬态拖尾指示符的步骤。
18.根据权利要求16所述的方法,其中,所述分析步骤包括还根据预定的窗函数来确定所述后一帧n+1的所述瞬态拖尾指示符的值的步骤。
19.根据权利要求18所述的方法,其中,所述窗函数对应于被用于在所述相关联的音频编码器中对所述音频信号的帧n进行变换编码、但是在时间上被向前移位了一个帧的窗函数。
20.根据权利要求16所述的方法,其中,所述分析步骤包括还根据所述瞬态在所述给定帧n中的位置来确定所述后一帧n+1的所述瞬态拖尾指示符的值的步骤。
21.根据权利要求15所述的方法,其中,所述将所述瞬态拖尾指示符用信号通知给相关联的音频编码器的步骤使所述音频编码器能够在用信号通知指示瞬态的拖尾指示符时以适于编码包括瞬态的帧的编码模式来执行对所述后一帧n+1的编码。
22.根据权利要求21所述的方法,其中,所述编码动作包括在用信号通知指示瞬态的拖尾指示符时减小变换长度以改进所述变换的时间分辨率。
23.根据权利要求15所述的方法,其中,所述音频编码器是使用重叠变换的基于变换的编码器。
CN2008801048335A 2007-08-27 2008-08-25 瞬态检测器以及用于支持音频信号的编码的方法 Active CN101790756B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US96822907P 2007-08-27 2007-08-27
US60/968229 2007-08-27
PCT/SE2008/050960 WO2009029033A1 (en) 2007-08-27 2008-08-25 Transient detector and method for supporting encoding of an audio signal

Publications (2)

Publication Number Publication Date
CN101790756A CN101790756A (zh) 2010-07-28
CN101790756B true CN101790756B (zh) 2012-09-05

Family

ID=40387558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801048335A Active CN101790756B (zh) 2007-08-27 2008-08-25 瞬态检测器以及用于支持音频信号的编码的方法

Country Status (9)

Country Link
US (4) US9495971B2 (zh)
EP (1) EP2186090B1 (zh)
JP (3) JP5209722B2 (zh)
CN (1) CN101790756B (zh)
CA (1) CA2697920C (zh)
ES (1) ES2619277T3 (zh)
PL (1) PL2186090T3 (zh)
PT (1) PT2186090T (zh)
WO (1) WO2009029033A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101790756B (zh) * 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
MX2010001394A (es) 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda.
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102214464B (zh) * 2010-04-02 2015-02-18 飞思卡尔半导体公司 音频信号的瞬态检测方法以及基于该方法的时长调整方法
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN102971788B (zh) * 2010-04-13 2017-05-31 弗劳恩霍夫应用研究促进协会 音频信号的样本精确表示的方法及编码器和解码器
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
KR101709095B1 (ko) 2010-07-19 2017-03-08 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8489391B2 (en) * 2010-08-05 2013-07-16 Stmicroelectronics Asia Pacific Pte., Ltd. Scalable hybrid auto coder for transient detection in advanced audio coding with spectral band replication
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5807453B2 (ja) * 2011-08-30 2015-11-10 富士通株式会社 符号化方法、符号化装置および符号化プログラム
JP5898534B2 (ja) * 2012-03-12 2016-04-06 クラリオン株式会社 音響信号処理装置および音響信号処理方法
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
ES2790733T3 (es) * 2013-01-29 2020-10-29 Fraunhofer Ges Forschung Codificadores de audio, decodificadores de audio, sistemas, métodos y programas informáticos que utilizan una resolución temporal aumentada en la proximidad temporal de inicios o finales de fricativos o africados
CN110047498B (zh) 2013-02-20 2023-10-31 弗劳恩霍夫应用研究促进协会 用于对音频信号进行译码的译码器和方法
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
US9148520B2 (en) 2013-12-09 2015-09-29 Intel Corporation Low complexity tone/voice discrimination method using a rising edge of a frequency power envelope
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
WO2015126228A1 (ko) * 2014-02-24 2015-08-27 삼성전자 주식회사 신호 분류 방법 및 장치, 및 이를 이용한 오디오 부호화방법 및 장치
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
WO2018201112A1 (en) 2017-04-28 2018-11-01 Goodwin Michael M Audio coder window sizes and time-frequency transformations
US11303326B2 (en) * 2018-03-08 2022-04-12 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for handling antenna signals for transmission between a base unit and a remote unit of a base station system
CN110503973B (zh) * 2019-08-28 2022-03-22 浙江大华技术股份有限公司 音频信号瞬态噪音抑制方法、系统以及存储介质
KR102492252B1 (ko) 2019-11-19 2023-01-26 구글 엘엘씨 클록 변동들 하에서의 전압-변화 검출
CN112291676B (zh) * 2020-05-18 2021-10-15 珠海市杰理科技股份有限公司 抑制音频信号拖尾的方法及系统、芯片、电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
CN1774957A (zh) * 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 音频信号生成
CN1781338A (zh) * 2003-04-30 2006-05-31 编码技术股份公司 基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
JPH10341256A (ja) * 1997-06-10 1998-12-22 Logic Corp 音声から有音を抽出し、抽出有音から音声を再生する方法および装置
FR2768545B1 (fr) * 1997-09-18 2000-07-13 Matra Communication Procede de conditionnement d'un signal de parole numerique
US5991718A (en) * 1998-02-27 1999-11-23 At&T Corp. System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
CA2246532A1 (en) * 1998-09-04 2000-03-04 Northern Telecom Limited Perceptual audio coding
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
CA2358203A1 (en) * 1999-01-07 2000-07-13 Tellabs Operations, Inc. Method and apparatus for adaptively suppressing noise
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP3518737B2 (ja) * 1999-10-25 2004-04-12 日本ビクター株式会社 オーディオ符号化装置、オーディオ符号化方法、及びオーディオ符号化信号記録媒体
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US6889187B2 (en) * 2000-12-28 2005-05-03 Nortel Networks Limited Method and apparatus for improved voice activity detection in a packet voice network
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
ATE387000T1 (de) * 2001-05-10 2008-03-15 Dolby Lab Licensing Corp Verbesserung der transientenleistung bei kodierern mit niedriger bitrate durch unterdrückung des vorgeräusches
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
JP3815323B2 (ja) * 2001-12-28 2006-08-30 日本ビクター株式会社 周波数変換ブロック長適応変換装置及びプログラム
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7283968B2 (en) * 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
DE602005022641D1 (de) * 2004-03-01 2010-09-09 Dolby Lab Licensing Corp Mehrkanal-Audiodekodierung
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
KR20070068424A (ko) * 2004-10-26 2007-06-29 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
JP4550595B2 (ja) 2005-01-19 2010-09-22 株式会社東芝 オーディオ符号化装置
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7565289B2 (en) * 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
DE102006017280A1 (de) * 2006-04-12 2007-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals
US20080005920A1 (en) * 2006-07-05 2008-01-10 Deanda Jacqulyn L Majors Hair dryer hood adjuster
US7642424B2 (en) * 2006-07-10 2010-01-05 Barenbrug Usa, Inc. Tall fescue endophyte E34
US7459962B2 (en) * 2006-07-26 2008-12-02 The Boeing Company Transient signal detection algorithm using order statistic filters applied to the power spectral estimate
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
EP2186088B1 (en) * 2007-08-27 2017-11-15 Telefonaktiebolaget LM Ericsson (publ) Low-complexity spectral analysis/synthesis using selectable time resolution
JP5539203B2 (ja) * 2007-08-27 2014-07-02 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された音声及びオーディオ信号の変換符号化
CN101790756B (zh) * 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
US8704209B2 (en) * 2009-08-18 2014-04-22 The United States Of America As Represented By The Secretary Of The Army Photodetectors using resonance and method of making
WO2013075753A1 (en) * 2011-11-25 2013-05-30 Huawei Technologies Co., Ltd. An apparatus and a method for encoding an input signal
EP2874149B1 (en) * 2012-06-08 2023-08-23 Samsung Electronics Co., Ltd. Method and apparatus for concealing frame error and method and apparatus for audio decoding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
CN1774957A (zh) * 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 音频信号生成
CN1781338A (zh) * 2003-04-30 2006-05-31 编码技术股份公司 基于复指数调制的滤波器组的高级处理和自适应时间信号传送方法

Also Published As

Publication number Publication date
PT2186090T (pt) 2017-03-07
US20240119951A1 (en) 2024-04-11
WO2009029033A1 (en) 2009-03-05
JP6117269B2 (ja) 2017-04-19
US11830506B2 (en) 2023-11-28
US10311883B2 (en) 2019-06-04
EP2186090A1 (en) 2010-05-19
US20110046965A1 (en) 2011-02-24
US20170040024A1 (en) 2017-02-09
JP2013152470A (ja) 2013-08-08
JP5209722B2 (ja) 2013-06-12
US9495971B2 (en) 2016-11-15
CA2697920C (en) 2018-01-02
US20190244625A1 (en) 2019-08-08
JP2010538315A (ja) 2010-12-09
ES2619277T3 (es) 2017-06-26
PL2186090T3 (pl) 2017-06-30
CA2697920A1 (en) 2009-03-05
JP2015163974A (ja) 2015-09-10
CN101790756A (zh) 2010-07-28
EP2186090B1 (en) 2016-12-21
EP2186090A4 (en) 2013-12-25

Similar Documents

Publication Publication Date Title
CN101790756B (zh) 瞬态检测器以及用于支持音频信号的编码的方法
KR100962681B1 (ko) 오디오신호들의 분류
US7457743B2 (en) Method for improving the coding efficiency of an audio signal
KR101594480B1 (ko) 클립핑 아티팩트를 피하기 위한 장치, 방법 및 컴퓨터 프로그램
KR101429564B1 (ko) 디코딩된 다중채널 오디오 신호 또는 디코딩된 스테레오 신호를 포스트프로세싱하기 위한 장치 및 방법
EP2439737B1 (en) Compression coding and decoding method, coder, decoder and coding device
US20110035212A1 (en) Transform coding of speech and audio signals
US20140257824A1 (en) Apparatus and a method for encoding an input signal
CN1787383B (zh) 变换、编码、逆变换和解码音频信号的方法和设备
MXPA06011957A (es) Codificacion de senales.
JPH0856163A (ja) 適応的デジタルオーディオ符号化システム
CN101930737A (zh) 一种dra帧内误码检测及检测-隐蔽方法
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
KR20080075409A (ko) 오디오 부호화 및 복호화 장치와 그 방법
CN110998722B (zh) 低复杂性密集瞬态事件检测和译码
KR101455648B1 (ko) 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템
US20090063161A1 (en) Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal
CN101075436B (zh) 带补偿的音频编、解码方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant