CN1253418A - 用于音频变换编码的块尺寸确定和自适应方法 - Google Patents

用于音频变换编码的块尺寸确定和自适应方法 Download PDF

Info

Publication number
CN1253418A
CN1253418A CN99122303.9A CN99122303A CN1253418A CN 1253418 A CN1253418 A CN 1253418A CN 99122303 A CN99122303 A CN 99122303A CN 1253418 A CN1253418 A CN 1253418A
Authority
CN
China
Prior art keywords
frame
peak value
sub
difference
predetermined threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99122303.9A
Other languages
English (en)
Other versions
CN1132319C (zh
Inventor
申省梅
梁世丰
陈亚平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1253418A publication Critical patent/CN1253418A/zh
Application granted granted Critical
Publication of CN1132319C publication Critical patent/CN1132319C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Abstract

在此公开用于混合编码,特别用于ATRAC编码解码器系统的有效块尺寸确定方法。它是改进的子帧分割方法和峰值能量集中方法。为了明显消除或减小前回声噪声,冲击信号的精确检测在混合音频编码中非常重要。与现有技术相比,这些方法可以提供更加精确的块尺寸确定,并具有与现有技术相类似的复杂度。

Description

用于音频变换编码的块尺寸确定和自适应方法
本发明涉及用于发送或数字存储介质的数字音频信号的有效信息编码。
使用象分波段编码法这样的各种频率变换的音频压缩算法、自适应变换编码或它们之间的混合被开发并用于各种商业应用领域。自适应变换编码器的例子包括由K.Brandenburg等在“Aspec:高质量音乐信号的自适应频谱熵编码”第90届AES会议,1991年2月所作出的报告,以及由M.lwadare等在“基于具有自适应块尺寸的自适应变换编码MDCT的128千字节/秒高保真音频编码解码器”,关于通信中的选择区域的IEEE(电气和电子工程师协会)杂志,Vol.10,No.1,1992年2月作出的报告。使用混合分波段编码法和自适应变换编码的算法的例子包括ISO/IEC 11172-3第三层算法和用于微型光盘系统中的ATRAC压缩算法。这些算法的具体细节可以分别在“信息技术-用于数字存储介质的约高达1.5兆位/秒的运动图像和相关音频信号的编码,第三部分:音频(ISO/IEC 11172-3;1993)”文档和由索尼公司在1992年9月的微型光盘说明文档的第10章中得到。由这些算法所使用的变换滤波器组一般基于改进的离散余弦变换,该变换首先由Princen和Bradley在“使用基于时域消混叠设计的滤波器组的分波段/变换编码”,ICASSP 1997的会刊,第2161-2164页中提出。
在典型的变换编码器中,如图5中所示,输入音频样本首先由缓冲器51按帧进行缓冲,并且同时传给块尺寸选择器52以在由窗口和变换单元52进行开窗口和变换之前确定合适的音频样本的块尺寸或者窗口。在象ATRAC算法这样的混合分波段和变换编码器中,以44.1kHz(即,每秒钟产生44100个样本)的频率进行采样的输入音频样本受到混合分波段和变换编码。ATRAC算法的编码过程的混合分波段变换编码的前端在图6中示出。输入音频样本是利用正交镜面滤波器(quadrature mirrorfilter)61滤波为两个相等带宽的第一分波段,并且所得的较低频率波段被由其它组的正交镜面滤波器62进一步分为两个相等的带宽。在此,L、M、H分别表示低波段、中波段和高波段。时间延迟63被用于使高频波段中的信号与低频波段中的信号时间校准。然后分波段样本被分离地通过块尺寸选择器64,以确定用于开窗口的合适块尺寸,并且改进的离散余弦变换在块65、66和67进行。两个块尺寸或模式中的一个将被选择用于每个频段。然后,该变换样本被分组为单元,并且在每个单元中选择等于或刚好超过单元样本的最大幅度的比例因子。然后,该变换样本被用所确定的比例因子和从动态位分配单元68中推导的位分配信息进行量化。
已知,在变换编码中,在信号幅度突然增加或在冲击之前可能会在寂静时间中出现预回声或噪声/激振效应,特别是在用于包含冲击的音频帧的变换编码块尺寸较长的情况。具有自适应块尺寸的改进的离散余弦变换一般被用于减少预回声以及在块边界的噪声。必须首先选择可用于变换编码的块尺寸,使得可以检测是否存在信号冲击,短块变换可以用于处理该冲击信号,并且不会对相邻块产生激振或噪声信号。当短块的尺寸足够小时,预噪声将不能够被听见。一个重要的问题是冲击信号本身的精确检测。
在1992年9月的微型光盘系统说明书中简述的块尺寸确定方法在图7中示出。峰值检测步骤71在每32个样本块中确定峰值。然后在步骤72中比较相邻峰值。在确定步骤73中,如果该差值超过18分贝,则在步骤74选择模式1或短块模式。否则在步骤75对于不同的频段选择作为长块模式的模式3或模式4。
为了非常好地降低自适应变换或混合分波段变换编码过程中的预回声,需要一种高效的音频信号分类和块尺寸确定方法。这使得预回声完全不能听见。尽管用于该变换的实际块尺寸本身是一个重要因素,但是信号冲击的精确检测特别是临界检测是非常重要的。通常,由于所获得的相应更好的频率分辨率将导致更加准确地除去音频信号成分中的冗余和无关成分,最好使用长块进行音频信号的变换编码。这对于音频信号的特性缓慢变化的音频信号段来说特别正确。仅仅当绝对需要确定并且用于临界冲击信号时才使用短块。在现有技术中提供的块尺寸确定方法在瞬变或冲击信号检测精确性上不能给出良好的结果。这可能不能检测在前掩蔽过程的时间间隔中出现的冲击信号。前掩蔽是快速增加的高声或按时出现的冲击的存在对该冲击之前的声音具有掩蔽效应的情况。这种检测的失败有时可能导致所不希望的听觉效果。尽管单声掩蔽信号(masker)试验已经证明预掩蔽持续时间在5毫秒到20毫秒之间,但是从经验可知可以听见更短持续时间的预回声。有效预掩蔽持续时间应当在小于5毫秒的范围内。作为在掩蔽信号的出现后的延迟掩蔽效应的后掩蔽效应一般在20毫秒或更大的时间间隔内。对于长块帧尺寸一般小于20毫秒的情况,峰值信号的释放一般被认为具有不重要的影响。对于非常高精度的块尺寸确定,可以考虑到后掩蔽效应。
本发明基于对高精度块尺寸确定方案的需要,并且考虑到瞬时掩蔽,包括前掩蔽和后掩蔽效应。在本发明中,可以对全带宽音频信号或限制带宽信号进行操作,其中限制带宽信号例如在被滤波为频率波段之后的分波段的信号。本发明具有:考虑到经验上的前掩蔽持续时间,排除作为时间间隔一半的最后子帧,把当前考虑的帧中的音频样本分组为约3毫秒的相等时间间隔的子帧的方法;所述当前考虑帧和以前考虑的帧的最后子帧的整个或一半,以及可选的来自构成扩展帧的将来帧的一半子帧将被用于峰值的估计;在所述子帧中确定所述峰值的方法;计算所述相邻时间间隔的峰值之间的差值的方法;可选的计算由一子帧时间间隔所分离的所述峰值之间的差值的方法;所述差值与预定阈值之间的比较之后确定是否应当使用长块尺寸和短块尺寸的方法。另一种替换方法包括:把当前帧中的样本与以前考虑的帧的最后帧的整个或一半中的样本进行分组的方法,所述子帧间隔由人耳的瞬时听觉特性所决定;确定在所得分组中的所选数目的峰值的方法;把按照幅度次序选择的峰值指定为参考峰值的方法;从参考峰值之前的子帧间隔中确定峰值的方法;计算参考峰值与在参考峰值的所述子帧间隔中的峰值之间的差值的方法;把所述差值与预定阈值相比较的方法,其中当该差值超过预定阈值时,调用较小的块尺寸;否则采用新的参考峰值,并且重复该过程,直到找到超过该预定阈值的差值或者当所有可用峰值都被考虑过之后为止。
把当前考虑的帧中的音频样本分组为子帧的方法,首先涉及从以前的帧以及可选的将来的帧与所有在当前帧中的所有音频样本中选择指定数目的音频样本。根据经验确定的前掩蔽持续时间,对于每个子帧的时间间隔应当约跨越3毫秒的间隔。指定数目的音频样本应当构为一半子帧的持续时间。分组为子帧的构成可以按照图3中所示进行。在考虑到计算当前子帧的峰值与多达两个以前子帧的峰值之间的差值的情况将使得更大范围的信号被归类为冲击信号。然后所获得的峰值中的差值再次与正阈值相比较。这意味着信号释放的后掩蔽效应将被忽略。如果要考虑不太重要的后掩蔽的影响,则需要再次与负阈值相比较。因此把音频样本第一次分组为子帧的第一组方法提供一种获得峰值和用于确定块尺寸的差值计算的方便和较少计算量的方法。但是,该组方法不能够对所有可能信号冲击或跃变进行完全搜索。所选数目的峰值被第一次在所述扩展帧中确定的另一组方法将允许更加完全的搜索。受到计算负载的许可,首先确定峰值的最大数目。最大峰值首先被作为参考峰值。从来自该参考峰值的子帧的时间窗,建立峰值并且计算与该参考峰值的差值。如果该差值不大于预定阈值;则利用第二大的峰值作为参考峰值重复该过程,等等。该过程被重复进行直到找到超过预定阈值的差值,或者当所有可用峰值都被考虑过之后。
图1为改进的峰值分块尺寸确定方法的本发明的一个实施例的流程图。
图2为改进的峰值分块尺寸确定方法的本发明的第二实施例的流程图。
图3为子帧方法和差值计算的示意图。
图4为峰值能量中心块尺寸确定方法的示意图。
图5为自适应变换编码器的前端的方框图。
图6为ATRAC编码器的前端的方框图。
图7为块尺寸确定方法的现有技术的流程图。
称为改进的子帧分块尺寸确定方法的一个实施例的流程图在图1中示出。在总的范围内,在本质上采取混合分波段变换编码器。在单纯使用变换编码的情况下,分波段的数目被作为1。如图1的步骤14中所定义的每个分波段帧被分为子帧。为了说明的目的,在图3中示出使用大小为128样本的分波段帧一个实例。根据前掩蔽的考虑,具有大小为32样本的分波段子帧是恰当的,该样本约为3.0毫秒的时间间隔。
在本实施例中,与现有技术有两个主要的不同。一是大小为128样本的当前分波段帧的16个样本扩展被用于检测一冲击信号,而不是仅仅使用128个样本。该扩展来自MDCT的窗函数。另一个是如果相邻峰值之间的差值小于预定阈值,则除了检查相邻峰值之间的差值之外还检查由子帧段所分隔的峰值之间的差值。这两点都需要用于减少在冲击信号的检测中漏检的可能性。
在步骤11中对分波段数目和帧尺寸进行初始化之后,对每个分波段进行块尺寸确定。确定步骤12确定是否所有分波段都已经被分析。根据所执行的分波段滤波的类型,确定是否相等或不等的分波段带宽被用于所有分波段,在步骤13中的分波段帧尺寸的数值分配和适当的子帧尺寸将相应地变化。在步骤14中,考虑到所有MDCT的窗函数所覆盖的样本,每个分波段帧被扩展为NSF(=NSUBi+Mi)。在此,Mi是扩展样本的数目。例如,对于32样本的MDCT,扩展样本的数目是16。
在步骤15计算用于峰值确定的区段数目。在每个区段中的峰值在步骤16中确定。相邻峰值之间的差值以及由一子帧区段所分离的峰值之间的差值在步骤17中计算。只要有一个差值超过如确定步骤18中所确定的预定阈值,则将执行短块分配步骤110。否则,将提供一个长块分配步骤19。
如图3中所示,形成扩展分波段帧以用于峰值确定的目的。根据图3的实例,其中32是子帧的尺寸,根据用于32-样本的MDCT的窗函数,该扩展样本的数目将为16。128个样本的分波段帧尺寸与来自以前的帧的16个样本一同被考虑用于冲击信号的检测。因此,四个32-样本的子帧和一个16-样本的子帧将被用于每个确定迭代过程中。如图3中所示,由于在该时间段中的窗口数值骤减,并且该部分是扩展子帧的末端部分,所以在此来自将来的帧的16个样本可以被忽略。这样,要被计算的峰值数目是5个。在这些峰值中总共将执行最多7次的差值计算。为了有效地实施,只要一个所计算差值超过该预定阈值,则将启动短块模式。一般,当所有δi(i=1,2,3,或4)都小于该预定阈值时,还需要P3和P1、P4和P2、P5和P3之间的比较。只要有一个δi(i=1,2,3,4,5,6或7)大于该预定阈值,则结束该比较过程以节约计算时间。
一个称为峰值能量集中块尺寸确定方法的替代实施例在图2中示出。冲击信号可以被当作在一定的信号持续时间中能量突然上升的信号。近似地,如果在相同的持续时间中有一个冲击信号,则在信号中的峰值时刻可以被认为是突然上升的能量的中心,如图4中所示。通过经验观察可知这对于许多例子来说是正确的。
如图4中所示,P是在SD时间段中信号的峰值。C是P峰值的位置,并且它是在SD时间段中信号能量的焦点。点B与点C刚好相距32个样本。另一个峰值从点B开始到点A进行搜索,把它当作32-样本的子块。如果峰值P与第二峰值Ps的差值大于预定阈值,则判断在该当前块中出现一个冲击信号。然后将把短块MDCT应用于该当前块。否则,第二峰值Ps被作为新的P,并且上述步骤迭代进行,直到达到点S。如果没有大于第二峰值Ps的其它峰值,则采用长块MDCT。
图2为用于峰值集中块尺寸确定方法的流程图。P、Ps、C、B、A和S的含义如图4中所示。在图2中,步骤21对一个音频信号进行块尺寸确定的初始化。步骤22判断是否所有子块都已经为确定块尺寸而受到检查。如果为“是”,则该过程结束。则否将对下一个分波段进行块尺寸确定过程。
该步骤23中,为当前分波段帧查找峰值P,并且峰值能量集中点C被相应地定位。在步骤24,假设峰值能量P的上升包络时间段是从中点C开始的32-样本子块的BC段。在步骤25,在由点B和A所限定的子块的32-样本中查找第二峰值Ps。如果在步骤26中,第二峰值Ps与P的差值大于预定阈值,则在步骤27中指定短块模式。否则,从步骤28中,判断点A是否与分波段S的起点相一致。如果为“否”,则在步骤210中把Ps作为新的P,并且重复上述步骤24、25、26、27和28。如果为“是”,则为当前分波段帧指定长块模式。
图4对于SC的长度比32-样本的两倍更长的情况有效。当SC的长度比32-样本的两倍短时,BC的长度不固定为32,而是小于32-样本的SC/2。对于这种情况,SB的长度也小于32,并且将为SC/2。也就是说,B将为S和C之间的中点。
在SC的长度比16-样本(32-样本的一半)短的情况下,这对应于1.45毫秒,一个长块MDCT将被用于当前块。即使当在当前块的开始部分中存在冲击信号的情况下,前掩蔽作用也可以掩蔽周期小于29毫秒的短周期的预回声,该预回声是由冲击信号所引起的。
本发明对于音频信号冲击和信号的释放的检测非常有效。使用任何一种所述的块尺寸确定技术将得到临界跃变信号冲击的高度精确的检测,从而能够减小或消除可听见的预回声。这可以为所用的变换编码提供恰当的块尺寸。根据计算量和可支持的RAM和ROM,可以包含不同的技术选择。

Claims (13)

1.一种把音频信号确定和分类为子类以确定变换编码器的子帧块尺寸的方法,其特征在于,所述方法包括:
a)检测可用于变换编码器的块尺寸的数目;
b)在时间间隔对一输入音频信号进行采样,并且把所述样本分组为具有相等数目的样本的帧;
c)在时域分析所述帧以产生至少一个比较指数;
d)为变换编码器选择一个适当的块尺寸。
2.根据权利要求1所述的方法,其特征在于,所述音频信号是全带宽音频信号。
3.根据权利要求1所述的方法,其特征在于,所述音频信号是限制带宽的音频信号。
4.根据权利要求1所述的方法,其特征在于,所述分析步骤包括:
a)根据在所述变换编码器中所用的窗函数扩展每个所述帧;
b)把包含在该音频样本中的所述扩展帧细分为更小的子帧,该更小子帧的数目由人耳的瞬时听觉特性决定的时间间隔所确定;
c)根据在所述子帧中的样本幅度确定每个所述子帧中的峰值;
d)计算相邻子帧的峰值与被一子帧时间间隔所分离的两个子帧的峰值之间的差值,所述差值被作为所述比较指数;
e)比较所述指数与一预定阈值,使得当该指数大于预定阈值时调用较小的块尺寸,并且当该指数不大于该预定阈值时调用较大的块尺寸。
5.根据权利要求1所述的方法,其特征在于,所述分析步骤包括:
a)通过考虑在所述变换编码器中所用的窗函数扩展每个所述帧/分波段帧;
b根据在扩展帧中的样本的幅度,在每个所述扩展帧/扩展分波段帧内的指定数目的峰值,每个峰值是局部的最大幅值;
c)确定由人耳的瞬时听觉特性所确定的分波段间隔,取所述峰值中的最大值作为参考峰值,从该参考峰值之前的子帧间隔内确定该峰值;
d)计算该参考峰值与在它之前的所述子帧间隔内的峰值之间的差值;以及
e)比较所述差值与预定阈值,其中当该差值超过预定阈值时调用较小的块尺寸或子帧尺寸。
6.根据权利要求5所述的方法,其特征在于,所述比较步骤包括:
a)当在权利要求5的步骤e)中的差值不超过该预定阈值时,通过取在权利要求5的步骤c)中查找的峰值作为新的参考峰值,重复权利要求5中所述的步骤c)至e);以及
b)当在最后子帧间隔中穷尽所有局部最大值之后没有找到超过预定阈值的差值时,确定一个大的块尺寸或子帧尺寸。
7.根据权利要求6所述的方法,其特征在于,所述最后子帧间隔可以等于或小于在其之前的子帧间隔,该子帧间隔取决于每个扩展帧/分波段帧的实际情况。
8.根据权利要求5所述的方法,其特征在于,当权利要求5的步骤e)不产生超过预定阈值的差值时,从两个子帧间隔和在该参考峰值之前的一个子帧间隔确定峰值。
9.根据权利要求4所述的方法,其特征在于,在该前面的音频帧的最后所述子帧间隔内的所述音频样本被考虑用于计算峰值之间的所述差值。
10.根据权利要求5所述的方法,其特征在于,在该前面的音频帧的最后所述子帧间隔内的所述音频样本被考虑用于计算峰值之间的所述差值。
11.一种把音频信号确定和分类为子类以确定变换编码器的块尺寸(或子帧块尺寸)的方法,其特征在于,所述方法包括:
a)把该音频信号分为不同的频带;
b)把每个频带中的音频样本峰值分组为相等时间间隔的帧,在属于不同频带的帧中的所述音频样本的数目不必相等;
c)使相等间隔的每个所述帧经过一分析方法的处理,使得为不同频带确定不同的块尺寸或子帧尺寸。
12.根据权利要求11所述的方法,其特征在于,所述分析方法包括:
a)根据在所述变换编码器中所用的窗函数扩展每个所述帧;
b)把包含在该音频样本中的所述扩展帧细分为更小的子帧,该更小子帧的数目由人耳的瞬时听觉特性决定的时间间隔所确定;
c根据在所述子帧中的样本幅度确定每个所述子帧中的峰值;
d)计算相邻子帧的峰值与被一子帧时间间隔所分离的两个子帧的峰值之间的差值,所述差值被作为所述比较指数;
e)比较所述指数与一预定阈值,使得当该指数大于预定阈值时调用较小的块尺寸,并且当该指数不大于该预定阈值时调用较大的块尺寸。
13.根据权利要求11所述的方法,其特征在于,所述分析方法包括:
a)通过考虑在所述变换编码器中所用的窗函数扩展每个所述帧/分波段帧;
b)根据在扩展帧中的样本的幅度,在每个所述扩展帧/扩展分波段帧内的指定数目的峰值,每个峰值是局部的最大幅值;
c)确定由人耳的瞬时听觉特性所确定的分波段间隔,取所述峰值中的最大值作为参考峰值,从该参考峰值之前的子帧间隔内确定该峰值;
d)计算该参考峰值与在它之前的所述子帧间隔内的峰值之间的差值;以及
e)比较所述差值与预定阈值,其中当该差值超过预定阈值时调用较小的块尺寸或子帧尺寸。
CN99122303.9A 1998-10-29 1999-10-29 用于音频变换编码的块尺寸确定和自适应方法 Expired - Fee Related CN1132319C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10308312A JP2000134105A (ja) 1998-10-29 1998-10-29 オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法
JP308312/1998 1998-10-29
JP308312/98 1998-10-29

Publications (2)

Publication Number Publication Date
CN1253418A true CN1253418A (zh) 2000-05-17
CN1132319C CN1132319C (zh) 2003-12-24

Family

ID=17979545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN99122303.9A Expired - Fee Related CN1132319C (zh) 1998-10-29 1999-10-29 用于音频变换编码的块尺寸确定和自适应方法

Country Status (5)

Country Link
US (1) US6424936B1 (zh)
EP (1) EP0998051B1 (zh)
JP (1) JP2000134105A (zh)
CN (1) CN1132319C (zh)
DE (1) DE69917181T2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101027717B (zh) * 2004-03-25 2011-09-07 Dts(Bvi)有限公司 无损多通道音频编解码器
CN101388213B (zh) * 2008-07-03 2012-02-22 天津大学 一种预回声控制方法
CN106228991A (zh) * 2014-06-26 2016-12-14 华为技术有限公司 编解码方法、装置及系统
CN112562747A (zh) * 2015-06-22 2021-03-26 玛诗塔乐斯有限公司 一种确定起始及其在数码信号中的位置的方法、数码信号处理器以及声频系统

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6639878B1 (en) * 2000-03-21 2003-10-28 Microsoft Corporation Method and apparatus for characterizing and improving optical drive performance
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US7366661B2 (en) 2000-12-14 2008-04-29 Sony Corporation Information extracting device
JP2002196792A (ja) * 2000-12-25 2002-07-12 Matsushita Electric Ind Co Ltd 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
US7930170B2 (en) * 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
JP3888097B2 (ja) * 2001-08-02 2007-02-28 松下電器産業株式会社 ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
EP1398760B1 (en) * 2002-08-28 2005-04-13 Thomson Licensing S.A. Signaling of window switchings in a MPEG layer 3 audio data stream
US6965859B2 (en) * 2003-02-28 2005-11-15 Xvd Corporation Method and apparatus for audio compression
US7199954B2 (en) * 2003-07-15 2007-04-03 Hitachi Global Storage Technologies Netherlands, B.V. Method, apparatus and program storage device for determining sector block sizes using existing controller signals
DE602004025517D1 (de) * 2004-05-17 2010-03-25 Nokia Corp Audiocodierung mit verschiedenen codierungsrahmenlängen
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
JP4639966B2 (ja) * 2005-05-31 2011-02-23 ヤマハ株式会社 オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
JP4658853B2 (ja) * 2006-04-13 2011-03-23 日本電信電話株式会社 適応ブロック長符号化装置、その方法、プログラム及び記録媒体
JP4658852B2 (ja) * 2006-04-13 2011-03-23 日本電信電話株式会社 適応ブロック長符号化装置、その方法、プログラム及び記録媒体
US7953595B2 (en) 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
US7966175B2 (en) 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
KR20080053739A (ko) * 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
EP3550564B1 (en) * 2007-08-27 2020-07-22 Telefonaktiebolaget LM Ericsson (publ) Low-complexity spectral analysis/synthesis using selectable time resolution
US8630848B2 (en) 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
KR101301245B1 (ko) * 2008-12-22 2013-09-10 한국전자통신연구원 스펙트럼 계수의 서브대역 할당 방법 및 장치
US8700410B2 (en) * 2009-06-18 2014-04-15 Texas Instruments Incorporated Method and system for lossless value-location encoding
US9093120B2 (en) * 2011-02-10 2015-07-28 Yahoo! Inc. Audio fingerprint extraction by scaling in time and resampling
US9713035B2 (en) 2013-05-20 2017-07-18 Qualcomm Incorporated Beacon transmission over unlicensed spectrum
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
CN106126164B (zh) * 2016-06-16 2019-05-17 Oppo广东移动通信有限公司 一种音效处理方法及终端设备
US10354669B2 (en) 2017-03-22 2019-07-16 Immersion Networks, Inc. System and method for processing audio data

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297236A (en) 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
JP2913731B2 (ja) 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
US5502789A (en) 1990-03-07 1996-03-26 Sony Corporation Apparatus for encoding digital data with reduction of perceptible noise
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
JP3141450B2 (ja) 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
JP3088580B2 (ja) * 1993-02-19 2000-09-18 松下電器産業株式会社 変換符号化装置のブロックサイズ決定法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101027717B (zh) * 2004-03-25 2011-09-07 Dts(Bvi)有限公司 无损多通道音频编解码器
CN101388213B (zh) * 2008-07-03 2012-02-22 天津大学 一种预回声控制方法
CN106228991A (zh) * 2014-06-26 2016-12-14 华为技术有限公司 编解码方法、装置及系统
US10339945B2 (en) 2014-06-26 2019-07-02 Huawei Technologies Co., Ltd. Coding/decoding method, apparatus, and system for audio signal
CN106228991B (zh) * 2014-06-26 2019-08-20 华为技术有限公司 编解码方法、装置及系统
US10614822B2 (en) 2014-06-26 2020-04-07 Huawei Technologies Co., Ltd. Coding/decoding method, apparatus, and system for audio signal
CN112562747A (zh) * 2015-06-22 2021-03-26 玛诗塔乐斯有限公司 一种确定起始及其在数码信号中的位置的方法、数码信号处理器以及声频系统
CN112562747B (zh) * 2015-06-22 2022-08-02 玛诗塔乐斯有限公司 一种确定起始及其在数码信号中的位置的方法、数码信号处理器以及声频系统

Also Published As

Publication number Publication date
CN1132319C (zh) 2003-12-24
JP2000134105A (ja) 2000-05-12
EP0998051A2 (en) 2000-05-03
DE69917181D1 (de) 2004-06-17
EP0998051B1 (en) 2004-05-12
EP0998051A3 (en) 2002-04-10
DE69917181T2 (de) 2005-06-23
US6424936B1 (en) 2002-07-23

Similar Documents

Publication Publication Date Title
CN1132319C (zh) 用于音频变换编码的块尺寸确定和自适应方法
CA2524243C (en) Speech coding apparatus including enhancement layer performing long term prediction
CN101305423B (zh) 自适应的基于时间/频率的音频编码和解码设备和方法
AU739238B2 (en) Speech coding
KR100415356B1 (ko) 다중 채널 신호 인코딩 및 디코딩 방법 및 장치
CA2474067C (en) A method of qualitatively evaluating a digital audio signal
CN101933086A (zh) 处理音频信号的方法和设备
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
JP2005535920A (ja) バックエンドの音声検出装置を有する配信音声認識および方法
EP1564720A2 (en) Apparatus and method for detecting voiced sound and unvoiced sound
CN101467203A (zh) 先进音频编码装置
CN1240051C (zh) 语音增强设备
JPH0844394A (ja) 励起パラメータの評価
Gosse et al. Perfect reconstruction versus MMSE filter banks in source coding
CN1717718A (zh) 正弦波音频编码
CN1044293C (zh) 背景音的编码/译码方法和设备
KR19990007817A (ko) 복잡성이 감소된 합성 필터가 있는 씨이엘피 스피치 코더
JPH0590974A (ja) 前反響処理方法およびその装置
KR100361235B1 (ko) 신호소스특성화시스템
CN103310800B (zh) 一种抗噪声干扰的浊语音检测方法及系统
KR100743534B1 (ko) 디지털 정보를 전송하는 전송장치 및 전송방법
EP0612158B1 (en) A block size determination method of a transform coder
US5926553A (en) Method for measuring the conservation of stereophonic audio signals and method for identifying jointly coded stereophonic audio signals
CN1363923A (zh) 一种基于自适应阀值和典型样本预测的块长选择方法
Sugiura et al. Regularized Modified Covariance Method for Spectral Analysis of Bone-Conducted Speech

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20031224

Termination date: 20131029