CN1669075A - 音频编码 - Google Patents

音频编码 Download PDF

Info

Publication number
CN1669075A
CN1669075A CNA038166976A CN03816697A CN1669075A CN 1669075 A CN1669075 A CN 1669075A CN A038166976 A CNA038166976 A CN A038166976A CN 03816697 A CN03816697 A CN 03816697A CN 1669075 A CN1669075 A CN 1669075A
Authority
CN
China
Prior art keywords
time
frame
signal
coded signal
small part
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA038166976A
Other languages
English (en)
Other versions
CN100370517C (zh
Inventor
E·G·P·舒杰斯
A·J·里恩伯格
N·托帕洛维
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1669075A publication Critical patent/CN1669075A/zh
Application granted granted Critical
Publication of CN100370517C publication Critical patent/CN100370517C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

依照本发明第一方面,对至少部分音频信号进行编码以便获得编码的信号,所述编码包括对所述至少部分音频信号进行预测性地编码以便获得表示所述至少部分音频信号的诸如时间包络之类的时间属性的预测系数;把所述预测系数转变换为表示所述预测系数的时间集,和将该时间集包括在所述编码信号中。在编码这种预测系数中使用行谱表示的时域导数或等价物是尤其有益的,这是由于在该技术中严格地定义了时间或瞬时,这使它们更适于进一步编码。对于时间包络的重叠帧分析/合成,可以利用所述重叠在所述行谱表示中的冗余。本发明的实施例依照有益的方式利用这种冗余。

Description

音频编码
技术领域
本发明涉及编码至少部分音频信号。
背景技术
在音频编码的现有技术中,线性预测编码(LPC)是为大家所熟知用于表示谱容量的。此外,已经为这种线性预测系统建议了许多高效的量化方案,例如对数区域比[1],反射系数[2]和诸如行谱对或行谱频率[3,4,5]的行谱表示。
在不对怎样把所述滤波器系数变换为行谱表示进行详细描述(参考文献[6,7,8,9,10]有更详细的描述)的情况下,结果是把M阶全极LPC滤波器H(z)变换为M个频率,常常被称为行谱频率(LSF)。这些频率唯一地表示所述滤波器H(z)。举例来说参见图1。注意为了清楚起见已经在图1中已将行谱频率描绘成朝向所述滤波器的振幅响应的线条,不过它们只不过是频率,并且因而在它们自己中不包含任何振幅信息。
发明内容
本发明的目标是提供对至少部分音频信号进行有益编码。为此,本发明提供了如在独立权利要求中定义的一种编码方法、一种编码器、一种编码的音频信号、一种存储介质,一种解码方法、一种解码器、一种发送器、一种接收器和一种系统。在所述从属权利要求中定义了有益的实施例。
依照本发明第一方面,对至少部分音频信号进行编码以便获得编码信号,所述编码包括对所述至少部分音频信号进行预测性地编码以便获得表示所述至少部分音频信号的、诸如时间包络之类的时间属性的预测系数;把所述预测系数变换为表示所述预测系数的时间集,和把所述时间集包括在所述编码信号中。注意没有任何振幅信息的时间足以表示所述预测系数。
尽管还可以把其信号或其分量的时间形状以一组振幅或增益值的形式直接编码,但是发明人认识到通过使用用于获得预测系数的预测编码并且把这些预测系数变换为时间集可以获得更高的质量,所述预测系数表示诸如时间包封之类的时间属性。由于与固定时间轴技术相比可以获得局部(在需要处)更高的时间分辨率,因而可以获得更高质量。通过使用LPC滤波器的振幅响应可以实现所述预测编码以便表示所述时间包络。
发明人还进一步认识到使用所述行谱表示的时域导数或等价物对于编码这种表示时间包络的预测系数是尤其有益的,这是因为由于这一技术严格定义了时间或瞬时,这使它们更适于进一步编码。因此,依照本发明的这个方面,获得至少部分音频信号的时间属性的高效编码,这有助于对至少部分音频信号的更好压缩。
可以把本发明的实施例解释为使用LPC谱来描述时间包络而不是谱包络,并且在谱包络的情况下时间现在是频率,反之亦然,如图2底部所示。这意味着现在使用行谱表示得出时间或瞬时集而不是频率。注意,在本方法中时间不是在时轴上预定间隔上固定的,而是时间本身表示所述预测系数。
发明人认识到:当对时间包络使用重叠帧分析/合成时,可以利用所述重叠处的行谱表示中的冗余。本发明的实施例依照有益的方式利用这种冗余。
本发明和其实施例对于依照诸如在WO 01/69593-A1中所公开的参量音频编码方案中编码在所述音频信号中噪声分量的时间包封特别有益。在这种参量音频编码方案中,可以把音频信号分解成瞬时信号分量、正弦信号分量和噪声分量。表示所述正弦分量的所述参数可以是振幅、频率和相位。对于所述瞬时分量,具有包络描述的这种参数的扩展是高效的表示。
注意本发明和其实施例可以被用于所述音频信号或其分量的整个相关的频带上,但也可用于较小频带上。
附图说明
参考附图的阐述,本发明的这些及其他方面将是显而易见。
在附图中:
图1示出了依照现有技术的具有对应于8行谱频率的8极的LPC谱的例子;
图2示出了(上面)使用LPC以使H(z)表示频谱,(底部)使用LPC以使H(z)表示时间包络;
图3示出了示例性的分析/合成窗口的程式化视图;
图4示出了两个相继的帧的LSF时间的示例序列;
图5示出了通过相对于先前帧k-1移位在帧k中的LSF时间来匹配LSF时间;
图6示出了作为重叠函数的加权函数;和
图7示出了依照本发明实施例的系统。
所述附图只示出了那些为理解本发明实施例所必需的元素。
具体实施方式
尽管下面描述针对LPC滤波器的使用和LSF的时域导数或等价物的计算,但是本发明还适用于属于所述权利要求范围内的其它滤波器和表示。
图2示出了怎样使用诸如LPC滤波器之类的预测滤波器来描述音频信号或其分量的时间包封。为了能够使用传统的LPC滤波器,首先通过例如傅立叶变换把所述输入信号从时域变换到频率域。因此事实上,把所述时间形状变换到谱形状,通过通常用于编码谱形状的随后的传统LPC滤波器来编码所述频谱形状。所述LPC滤波器分析提供表示所述输入信号的时间形状的预测系数。在时间分辨率和频率分辨率之间存在平衡。比方说例如所述LPC谱往往由许多非常尖的峰(正弦曲线)组成。于是,所述听觉系统对时间分辨率变化就不怎么灵敏,从而需要较小的分辨率,并且在另一方面,例如在瞬变过程内所述频谱的分辨率不需要很准确。在这种意义上讲人们可以把这视为组合编码,所述时域的分辨率取决于所述频率域的分辨率,反之亦然。人们还可以使用多个LPC曲线用于时域估计,例如低和高频带,这里所述分辨率还可以取决于频率估计的分辨率等,因而它可以被利用。
LPC滤波器H(z)通常可以被描述为:
H ( z ) = 1 A ( z ) 1 1 + a 1 z - 1 + a 2 z - 2 + . . . + a m z - m
所述系数ai是由所述LPC分析产生的预测滤波器系数,i从1到m。所述系数ai决定了H(z)。
为了计算LSF的时域等价物,可以使用以下过程。该过程的大部分对通常的全极滤波器H(z)有效,因此也对频率域有效。已知的用于导出在频域中LSF的其它过程也可以被用来计算所述LSF的时域等价物。
把所述多项式A(z)分成m+1阶的两个多项式P(z)和Q(z)。通过向A(z)增加+1的反射系数(以网格滤波器形式)来形成多项式P(z),通过增加-1的反射系数来形成Q(z)。在以直接形式(上面的方程式)和格构形式的LPC滤波器之间存在递归关系:
Ai(z)=Ai-1(z)+kiz-iAi-1(z-1)
其中i=1,2,...,m,A0(z)=1并且ki为所述反射系数。
按照如下获得多项式P(z)和Q(z):
P(z)=Am(z)+z-(m+1)Am(z-1)
Q(z)=Am(z)-z-(m+1)Am(z-1)
用这种方法获得的所述多项式P(z)=1+p1z-1+p2z-2+...+pmz-m+z-(m+1)和Q(z)=1+q1z-1+q2z-2+...+qmz-m是相当对称的和反对称的:
p1=pm            q1=qm
p2=pm-1           q2=-qm-1
                     
这些多项式的一些重要属性为:
-P(z)和Q(z)的所有零在z平面的单位圆上。
-P(z)和Q(z)的零交织在所述单位圆上并且不相互重叠。
-在H(z)的量化保障稳定性之后保持A(z)的最小相位属性。
两个多项式P(z)和Q(z)都具有m+1个零。可以容易看出z=-1和z=1在P(z)或Q(z)中始终是零。因此通过除以1+z-1和1-z-1消除它们。
如果m是偶数这产生:
P ′ ( z ) = P ( z ) 1 + z - 1
Q ′ ( z ) = Q ( z ) 1 - z - 1
如果m是奇数:
P′(z)=P(z)
Q ′ ( z ) = Q ( z ) ( 1 - z - 1 ) ( 1 + z - 1 )
现在通过zi=ejt来描述所述多项式P′(z)和Q′(z)的零,这是由于所述LPC滤波器应用在所述时域中。从而所述多项式P′(z)和Q′(z)的零完全以它们的时间t为特征,所述t在一帧上从0到π,其中0对应于所述帧的开始并且π对应于该帧的结束,实际上所述帧可以具有任意的实际长度,例如10或20ms。可以把由该推导产生的时间t解释为所述行谱频的时域等价物,这里所述时间进一步被称作LSF时间。为了计算实际LSF时间,必须计算P′(z)和Q′(z)的根。还可以在本上下文内使用在[9],[10],[11]中提出的不同的技术。
图3示出了时间包络的分析与合成的示例性情况的程式化视图。在每个帧k,使用窗口(不必是矩形)来由LPC分析所述段。因此对于每个帧,在转换之后,获得具有N个LSF时间的集。注意原则上N不必是常量,不过多数情况下这会产生更高效的表示。在这个实施例中我们假定所述LSF时间被均匀地量化,不过在这里也可以应用像矢量量化之类的其它技术。
实验已经示出了在如图3所示的重叠区域中常常存在在帧k-1和帧k的LSF时间之间的冗余。同时参考图4和5。在如下所述的本发明实施例中,为了更有效地编码所述LSF时间,利用该冗余,这有助于更好地压缩所述至少部分音频信号。注意图4和5示出了在所述重叠区域中帧k的LSF时与在帧k-1中的LSF时间不相同但是却相当接近的通常情况。
使用重叠帧的第一实施例
在使用重叠帧的第一实施例中,假定在重叠区域的LSF时间之间的差可以被在感觉上忽略或产生在质量上可接受的损失。对于一对LSF时间-帧k-1中一个和帧k中一个,导出的LSF时间是从所述对中的LSF时间的加权平均值导出的。此应用中的加权平均值看作是包括其中只选择所述LSF时间对中一个的情况。可以把这种选择解释为这样的加权平均,其中所选择的LSF时间的权重为一并且未选择倍数的权重为零。还可能所述对的两个LSF时间具有相同的权重。
例如,如图4所示假定对于帧k-1,LSF时间为{l0,l1,l2,...,lN},并且对于帧k,LSF时间为{l0,l1,l2,...,lM}。把在帧k中的LSF时间移位以致一定的量化级1处于两个帧中每一个的相同的位置上。现在假定对于每个帧在所述重叠区域中存在三个LSF时间,如图4和图5中的情况。那么可以形成以下相应对:{lN-2k-1 l0k,lN-1, k-1 l1,k,lN,k-1 l2,k}。在此实施例中,根据两个具有三个LSF时间的原始集构造具有三个导出的LSF时间的新集。实际的方法是只取帧k-1(或k)的LSF时间,并且通过简单地移位帧k-1(或k)的LSF时间来计算帧k(或k-1)的LSF时间以便在时间上对准所述帧。在所述编码器和所述解码器中都执行这种移位。在所述编码器中把右帧k的LSF移位以便使之匹配在左帧k-1的LSF。这对寻找对并且最后确定所述加权平均值来说是必需的。
在优选实施例中,把所导出的时间或加权平均值编码为位流作为‘表示等级’,所述表示等级是表示0到π的从0到255(8位)的整数值。在实际实施例中也适用霍夫曼编码。对于第一帧绝对地编码第一LSF时间(没有基准点),相对其前一时间差分地编码所有随后的LSF时间(包括最后所加权的那个)。现在,使用帧k-1的最后3个LSF时间,所述帧k可以利用‘技巧(trick)’。对于解码,那么帧k取帧k-1的最后三个表示等级(其在区域0到255的末尾),并且把它们移位回到自己的时轴上(在区域0到255的开始)。从对应于在所述重叠区域中的最后LSF的表示等级(在帧k的轴上)开始,相对于其前一时间差分地编码在帧k中所有随后LSF时间。如果帧k不能利用所述‘技巧’,那么用绝对值编码帧k的第一LSF时间并且帧k的所有随后LSF时间相对于其前一时间差分地编码。
实际方法是取每对相应的LSF时间的平均值,例如(lN-2,k-1+l0,k)/2,(lN-1,k-1+l1,k)/2和(lN,k-1+l2,k)/2。
如图3所示,一种更有益的方法考虑了所述窗口典型地示出淡入/淡出状态。依照这种方法计算每对的加权平均值,所述加权平均值给出了感觉上更好的结果。为此所述过程如下。所述重叠区域对应于所述区域(π-r,π)。如在图6中所描述导出加权函数。对于每对分别如下计算左帧k-1的时间的权重:
w k - 1 = π - l mean r
其中lmean是对的平均值(平均),例如:lmean=(lN-2,k-1+l0,k)/2。
帧k的权重被计算为wk=1-wk-1。现在新的LSF时间被计算为:
lweighted=lk-1wk-1+lkwk.
其中lk-1和lk形成一对。最后均匀地量化所述加权LSF时间。
因为在位流中的第一帧没有历史,在没有利用如上述技术的情况下,始终需要编码LSF时间的第一帧。这可以通过使用霍夫曼编码来绝对地编码第一LSF时间来完成,并且使用固定霍夫曼表将帧内所有随后值相对于其前者差分地编码。实际上在第一帧之后的所有帧都可以有利地利用上述技术。当然这种技术并不总是有益的。设想这样的例子,其中在两个帧的所述重叠区域中存在相等数目的LSF时间,但是却存在非常糟糕的匹配。那么计算(加权)平均值可能导致感觉上变差。优选地是,上述技术并不定义这种情况,其中在帧k-1中LSP时间的数目与在帧k中LSF时间的数目不同。因此对于LSF时间的每一帧,把诸如单个位之类的指示包括在所述已编码信号中以便指示是否使用上述技术,即是否应当根据先前帧检索LSF时间的第一个或它们是否在所述位流中。例如,如果所述指示位是1:那么与在帧k-1中相对于它们的前者差分地编码所述加权LSF时间,对于帧k根据在帧k-1中的LSF导出在重叠区域中的第一个LSF时间。如果所述指示位是0,那么用绝对值编码帧k的第一LSF时间,相对于它们前面的时间差分地编码所有随后的LSF。
在实际实施例中,所述LSF时间帧相当长,例如以44.1kHz的1440采样;在这种情况下对这一额外的指示位大约每秒只需要30比特。实验示出了大部分帧可以有益地利用上述技术,产生每个帧的净比特节省。
使用重叠帧的进一步实施例
依照本发明的进一步实施例,无损失地编码所述LSF时间数据。因此代替把所述重叠对合并为单个LSF时间,相对于在另一帧中的LSF时间编码给定帧中所述LSF时间的差。因此在图3的例子中当检索出帧k-1的值l0到lN时,通过分别解码对帧k-1的ln-2、ln-1和ln的差(在位流中)来检索来自帧k的最初的三个值l0到l3。通过参照在一个其它帧中的一个LSF时间来编码LSF时间,所述时间在时间上比在其它帧中的任何其它LSF时间更接近,由于可以参照最接近的时间最好地编码所述时间,从而获得了不错的冗余的利用。由于它们的差通常相当小,因此通过使用独立的霍夫曼表可以相当有效地编码它们。因此除表示是否使用如在第一实施例中所描述的技术的位之外,对于本特定的例子,还把所述差l0,k-lN-2,k-1,l1,k-1n-1,k-1,l2,k-lN,k-1放入所述位流,在这种情况下,第一实施例并不用于所涉及的重叠。
尽管不是很有益,不过做为选择可以相对于在先前帧中的其它LSF时间来编码所述差。例如,可以只相对于所述先前帧的最后LSF时间编码随后帧的第一LSF时间的差,继而在随后帧中相对于在相同帧中前面的LSF时间编码每个随后LSF时间,例如如下:对于帧k-1:lN-1-lN-2,lN-lN-1并且随后对于帧k:l0,k-lN,k-1,l1,k-l0,k等。
系统描述
图7示出了依照本发明实施例的系统。所述系统包括用于发送或记录编码信号[S]的设备1。所述设备1包括用于接收至少部分音频信号S的输入单元10,优选地是,所述至少部分音频信号S为所述音频信号的噪声分量。所述输入单元10可以是天线、麦克风、网络连接等。所述设备1还包括编码器11,用于依照本发明上述实施例来编码所述信号S(特别是参见图4,5和6)以便获得编码信号。所述输入单元10可以接收完全音频信号并且向其它专用编码器提供其分量。把所述编码信号提供给输出单元12,所述输出单元12变换具有适合经由传输介质或存储介质2进行传输或存储的格式且采用位流的所述编码的音频信号[S]。所述系统还包括接收器或再现设备3,它在输入单元30中接收所述编码信号[S]。所述输入单元30把所述编码信号[S]供给到所述解码器31。所述解码器通过执行解码过程来解码所述编码信号,所述解码过程基本上是在所述编码器11中所述编码的逆运算,在其中获得解码信号S′,所述解码信号除在所述编码过程期间丢失的那些部分外均对应于所述原始信号S。所述解码器31把所述解码信号S′供给到提供所述解码信号S的输出单元32。所述输出单元32可以是诸如扬声器之类的再现单元,用于再现所述解码信号S′。所述输出单元32还可以是发送器,用于例如经由家庭网络等进一步发送所述解码信号S′。在这种情况下,所述信号S′是诸如噪声分量之类的音频信号分量的重构,所述输出单元32可以包括组合装置,用于把所述信号S′与其它已重构的分量组合起来以便提供完全的音频信号。
本发明实施例可以应用于因特网分发,固态音频,3G终端,GPRS和其商业后继设备,以及等等。
应指出,上述实施例示例而不是限制本发明,本领域内的技术人员在不脱离所附权利要求的范围内的情况下可以设计很多替换的实施例。在这些权利要求中,不应当将括号内的任何标记看作是对权利要求的限制。所述词“包括”并不排除那些没有列出在权利要求中的元件或步骤。本发明可以用包括一些不同的元件的硬件来实现,也可以依靠适当地编程的计算机来实现。在列举一些装置的设备权利要求中,若干这些装置可以体现为一个相同的硬件项。在彼此不同的从属权利要求中所提到的某些措施,实际上并不意味着把这些措施结合是无益的。
参考文献
[1]R.Viswana than和J.Makhoul,“Quantization propertiesof transmission parameters in linear predictive sytems”,IEEE Trans.Acoust.,Speech,Signal Processing,卷ASSP-23,第309-321页,1975年6月。
[2]A.H.Gray,Jr.和J.D.Markel,“Quantization andbit allocation in speech processing”,IEEE Trans,Acoust.,Speech,Signal Processing,卷ASSP-24,第459-473页,1976年12月。
[3]F.K.Soong和B.-H.Juang,“Line Spectrum Pair(LSP)and Speech Data Compression”,Proc.ICASSP-84,卷1,第1.10.1-4页,1984。
[4]K.K.Paliwal,“Efficient Vector Quantization of LPGParameters at 24 Bits/Frame”,IEEE Trans.on Speech and AudioProcessing,卷1,第3-14页,1993年1月。
[5]F.K.Soong和B.-H.Juang,“Optimal Quantization ofLSP Parameters”,IEEE Trans.on Speech and Audio Processing,卷1,第15-24页,1993年1月。
[6]F.Itakura,“Line Spectrum Representation of LinearPredictive Coefficients of Speech Signals”,J.Acoust.Soc.Am.,57,535(A),1975。
[7]N.Sagumura和F.Itakura,“Speech Data Compressionby LSP Speech Analysis-Synthesis Technique”,Trans.IECE′81/8,卷J 64-A,No.8,第599.606页。
[8]P.Kabal和R.P.Ramachandran,“Computation of linespectral frequencies using chebyshev polynomials”,IEEE Trans.on ASSP,卷34,no.6,第1419-1426页,1986年12月。
[9]J.Rothweiler,“A rootfinding algorithm for linespectral frequencies”,ICASSP-99。
[10]Engin Erzin和A.Enis Cetin,“Intel-frameDifferential Vector Coding of Line Spectrum Frequencies”,Proc.of the Int.Conf.on Acoustic,Speech and SignalProcessing 1993(ICASSP′93),卷II,第25-28页,1993年4月27日。

Claims (26)

1.一种编码至少部分音频信号以便获得编码信号的方法,所述方法包括步骤:
预测地编码所述至少部分音频信号以便获得预测系数,所述预测系数表示所述至少部分音频信号的诸如时间包络之类的时间属性;
把所述预测系数变换为表示所述预测系数的时间集;和
把所述时间集包括在所述编码信号中。
2.如权利要求1所述的方法,其中通过使用滤波器执行所述预测编码并且其中所述预测系数是滤波器系数。
3.如权利要求1或2所述的方法,其中所述预测编码是线性预测编码。
4.如先前权利要求中任何一个所述的方法,其中在所述预测编码步骤之前对至少部分音频信号执行从时域到频率域的变换,以便获得频率域信号,并且其中对所述频率域信号而不是对至少部分音频信号执行所述预测编码步骤。
5.如先前权利要求中任何一个所述的方法,其中所述时间是行谱频率的时域导数或等价物。
6.如先前权利要求中任何一个所述的方法,其中在至少第一帧和第二帧中把所述至少部分音频信号分段,并且其中第一帧和第二帧具有重叠,所述重叠包括每个帧的至少一个时间。
7.如权利要求6所述的方法,其中对由在所述重叠中的第一帧的一个时间和在所述重叠中第二帧的一个时间组成的一对时间,把导出时间包括在所述编码信号中,所述导出时间是第一帧的一个时间和第二帧的一个时间的加权平均值。
8.如权利要求7所述的方法,其中所述导出的时间等于所述时间对中所选择的一个时间。
9.如权利要求7所述的方法,其中较接近于帧边界的时间具有比远离于所述边界的时间较低的权重。
10.如权利要求6所述的方法,其中相对于在第一帧中的时间差分地编码第二帧的给定时间。
11.如权利要求10所述的方法,其中相对于在第一帧中的时间差分地编码第二帧的给定时间,所述第一帧中的时间在时间上与在第二帧中的给定时间比在第一帧中的任何其它时间要更近。
12.如权利要求7、8、9、10或11中任何一个所述的方法,其中还把诸如单个位的指示符包括在所述编码信号中,所述指示符指示所述编码信号在所述指示符与其相关的重叠中是否包括一个导出时间。
13.如权利要求7,8,9,10,11或12中任何一个所述的方法,其中还把诸如单个位的指示符包括在所述编码信号中,所述指示符指示编码类型,所述编码类型用来在所述指示符与其相关的重叠中编码时间或导出时间。
14.一种编码器,用于编码至少部分音频信号以便获得编码信号,所述编码器包括:
用于预测地编码所述至少部分音频信号以便获得预测系数的装置,所述预测系数表示所述至少部分音频信号的诸如时间包络之类的时间属性;
用于把所述预测系数变换为表示所述预测系数的时间集的装置;和
用于把所述时间集包括在所述编码信号中的装置。
15.一种表示至少部分音频信号的编码信号,所述编码信号包括表示预测系数的时间集,所述预测系数表示所述至少部分音频信号的诸如时间包络之类的时间属性。
16.如权利要求15所述的编码信号,其中所述时间与在所述至少部分音频信号中的至少第一帧和第二帧有关,并且其中第一帧和第二帧具有包括每个帧的至少一个时间的重叠,以及其中所述编码信号包括至少一个导出时间,所述导出时间是第一帧的一个时间和第二帧的一个时间的加权平均值。
17.如权利要求16所述的编码信号,所述编码信号还包括诸如单个位之类的指示符,所述指示符指示所述编码信号在所述指示符与其相关的重叠中是否包括一个导出时间。
18.一种其上存储有如权利要求15、16或17中任何一个所述的编码信号的存储介质。
19.一种对编码信号进行解码的方法,所述编码信号表示至少部分音频信号,所述编码信号包括表示预测系数的时间集,所述预测系数表示所述至少部分音频信号的诸如时间包络之类的时间属性,所述方法包括步骤:
从所述时间集导出诸如所述时间包络之类的时间属性,并且使用这些时间属性来获得解码信号,和
提供所述解码信号。
20.如权利要求19所述的解码方法,其中所述方法包括变换所述时间集以便获得所述预测系数的步骤,并且其中从所述预测系数而不是从所述时间集导出所述时间属性。
21.如权利要求19或20所述的解码方法,其中所述时间与在所述至少部分音频信号中的至少第一帧和第二帧有关,并且其中第一帧和第二帧具有包括每个帧的至少一个时间的重叠,以及其中所述编码信号包括至少一个导出时间,所述导出时间是由在所述重叠中第一帧的一个时间和在所述重叠中第二帧的一个时间组成的一对时间的加权平均值,所述重叠在原始的至少部分音频信号中,其中所述方法还包括在解码第一帧中以及在解码第二帧中使用至少一个导出时间的步骤。
22.如权利要求21所述的解码方法,其中所述编码信号还包括诸如单个位之类的指示符,所述指示符指示所述编码信号在所述指示符与其相关的重叠中是否包括一个导出时间,所述方法还包括步骤:
从所述编码信号中获得所述指示符,
只有在所述指示符指示所述指示符与其相关的重叠的确包含导出时间时,才执行使用至少一个导出时间来解码第一帧以及解码第二帧的步骤。
23.一种用于对编码信号进行解码的解码器,所述编码信号表示至少部分音频信号,所述编码信号包括表示预测系数的时间集,所述预测系数表示所述至少部分音频信号的诸如时间包络之类的时间属性,所述方法包括步骤:
从所述时间集导出诸如所述时间包络之类的时间属性,并且使用这些时间属性来获得解码信号,和
提供所述解码信号。
24.一种发送器,包括:
输入单元,用于接收至少部分音频信号,
如权利要求14所述的编码器,用于编码所述至少部分音频信号以便获得编码信号,和
输出单元,用于发送所述编码信号。
25.一种接收器,包括:
输入单元,用于接收表示至少部分音频信号的编码信号,
如权利要求23所述的解码器,用于对所述编码信号进行解码以便获得解码信号,和
输出单元,用于提供所述解码信号。
26.一种系统,包括如权利要求24所述的发送器和如权利要求25所述的接收器。
CNB038166976A 2002-07-16 2003-07-11 一种对编码信号进行解码的方法 Expired - Lifetime CN100370517C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02077870.0 2002-07-16
EP02077870 2002-07-16

Publications (2)

Publication Number Publication Date
CN1669075A true CN1669075A (zh) 2005-09-14
CN100370517C CN100370517C (zh) 2008-02-20

Family

ID=30011204

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038166976A Expired - Lifetime CN100370517C (zh) 2002-07-16 2003-07-11 一种对编码信号进行解码的方法

Country Status (9)

Country Link
US (1) US7516066B2 (zh)
EP (1) EP1527441B1 (zh)
JP (1) JP4649208B2 (zh)
KR (1) KR101001170B1 (zh)
CN (1) CN100370517C (zh)
AU (1) AU2003247040A1 (zh)
BR (1) BR0305556A (zh)
RU (1) RU2321901C2 (zh)
WO (1) WO2004008437A2 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008089705A1 (fr) * 2007-01-23 2008-07-31 Huawei Technologies Co., Ltd. Procédé et appareil de codage et de décodage
WO2008110116A1 (en) * 2007-03-12 2008-09-18 Huawei Technologies Co., Ltd. A implementing method and device for quantizing encoding and decoding a grid vector
CN101939781B (zh) * 2008-01-04 2013-01-23 杜比国际公司 音频编码器和解码器
CN104217726A (zh) * 2014-09-01 2014-12-17 东莞中山大学研究院 一种无损音频压缩编码方法及其解码方法
CN103840915B (zh) * 2008-11-13 2017-05-03 美高森美通信股份有限公司 对数据进行编码以供在通信媒体上发射的方法
CN107004422A (zh) * 2014-11-27 2017-08-01 日本电信电话株式会社 编码装置、解码装置、它们的方法及程序
CN107871492A (zh) * 2016-12-26 2018-04-03 珠海市杰理科技股份有限公司 音乐合成方法和系统
CN110491401A (zh) * 2014-05-01 2019-11-22 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
CN111179952A (zh) * 2014-03-07 2020-05-19 弗劳恩霍夫应用研究促进协会 用于信息编码的概念

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
ES2280592T3 (es) * 2001-11-30 2007-09-16 Koninklijke Philips Electronics N.V. Codificacion de señal.
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
TWI393120B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
JP5017121B2 (ja) * 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR20080101873A (ko) * 2006-01-18 2008-11-21 연세대학교 산학협력단 부호화/복호화 장치 및 방법
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
CA2972808C (en) 2008-07-10 2018-12-18 Voiceage Corporation Multi-reference lpc filter quantization and inverse quantization device and method
US8380498B2 (en) * 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
PL3998606T3 (pl) * 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
JP5674015B2 (ja) * 2010-10-27 2015-02-18 ソニー株式会社 復号装置および方法、並びにプログラム
US8615394B1 (en) * 2012-01-27 2013-12-24 Audience, Inc. Restoration of noise-reduced speech
US8725508B2 (en) * 2012-03-27 2014-05-13 Novospeech Method and apparatus for element identification in a signal
PT2951814T (pt) * 2013-01-29 2017-07-25 Fraunhofer Ges Forschung Ênfase de baixa frequência para codificação com base em lpc em domínio de frequência
DK2981958T3 (en) * 2013-04-05 2018-05-28 Dolby Int Ab AUDIO CODES AND DECODS
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
CN107210824A (zh) 2015-01-30 2017-09-26 美商楼氏电子有限公司 麦克风的环境切换
KR102125410B1 (ko) * 2015-02-26 2020-06-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 타깃 시간 도메인 포락선을 사용하여 처리된 오디오 신호를 얻도록 오디오 신호를 처리하기 위한 장치 및 방법
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0681730A4 (en) * 1993-11-30 1997-12-17 At & T Corp REDUCTION OF TRANSMISSION NOISE IN COMMUNICATION SYSTEMS.
US5781888A (en) * 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
US5749064A (en) * 1996-03-01 1998-05-05 Texas Instruments Incorporated Method and system for time scale modification utilizing feature vectors about zero crossing points
JP3472974B2 (ja) * 1996-10-28 2003-12-02 日本電信電話株式会社 音響信号符号化方法および音響信号復号化方法
KR20000064913A (ko) * 1997-02-10 2000-11-06 요트.게.아. 롤페즈 저ㄴ송 시스템, 수신기, 및 재구성된 음성 신호 유도 방법
EP0899720B1 (en) * 1997-08-28 2004-12-15 Texas Instruments Inc. Quantization of linear prediction coefficients
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
KR100780561B1 (ko) 2000-03-15 2007-11-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 라게르 함수를 이용한 오디오 코딩 장치 및 방법

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008089705A1 (fr) * 2007-01-23 2008-07-31 Huawei Technologies Co., Ltd. Procédé et appareil de codage et de décodage
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
WO2008110116A1 (en) * 2007-03-12 2008-09-18 Huawei Technologies Co., Ltd. A implementing method and device for quantizing encoding and decoding a grid vector
CN103065637B (zh) * 2008-01-04 2015-02-04 杜比国际公司 音频编码器和解码器
CN101939781B (zh) * 2008-01-04 2013-01-23 杜比国际公司 音频编码器和解码器
CN103065637A (zh) * 2008-01-04 2013-04-24 杜比国际公司 音频编码器和解码器
US8924201B2 (en) 2008-01-04 2014-12-30 Dolby International Ab Audio encoder and decoder
US8938387B2 (en) 2008-01-04 2015-01-20 Dolby Laboratories Licensing Corporation Audio encoder and decoder
CN103840915B (zh) * 2008-11-13 2017-05-03 美高森美通信股份有限公司 对数据进行编码以供在通信媒体上发射的方法
CN111179952B (zh) * 2014-03-07 2023-07-18 弗劳恩霍夫应用研究促进协会 用于信息编码的概念
CN111179952A (zh) * 2014-03-07 2020-05-19 弗劳恩霍夫应用研究促进协会 用于信息编码的概念
US11640827B2 (en) 2014-03-07 2023-05-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for encoding of information
CN110491402B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
CN110491401A (zh) * 2014-05-01 2019-11-22 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
CN110491402A (zh) * 2014-05-01 2019-11-22 日本电信电话株式会社 周期性综合包络序列生成装置、方法、程序、记录介质
CN110491401B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 周期性综合包络序列生成装置、方法、记录介质
CN104217726A (zh) * 2014-09-01 2014-12-17 东莞中山大学研究院 一种无损音频压缩编码方法及其解码方法
CN107004422A (zh) * 2014-11-27 2017-08-01 日本电信电话株式会社 编码装置、解码装置、它们的方法及程序
CN107004422B (zh) * 2014-11-27 2020-08-25 日本电信电话株式会社 编码装置、解码装置、它们的方法及程序
CN107871492A (zh) * 2016-12-26 2018-04-03 珠海市杰理科技股份有限公司 音乐合成方法和系统

Also Published As

Publication number Publication date
US20050261896A1 (en) 2005-11-24
WO2004008437A3 (en) 2004-05-13
WO2004008437A2 (en) 2004-01-22
US7516066B2 (en) 2009-04-07
RU2321901C2 (ru) 2008-04-10
CN100370517C (zh) 2008-02-20
EP1527441A2 (en) 2005-05-04
KR20050023426A (ko) 2005-03-09
AU2003247040A1 (en) 2004-02-02
EP1527441B1 (en) 2017-09-06
BR0305556A (pt) 2004-09-28
RU2005104122A (ru) 2005-08-10
JP4649208B2 (ja) 2011-03-09
JP2005533272A (ja) 2005-11-04
KR101001170B1 (ko) 2010-12-15

Similar Documents

Publication Publication Date Title
CN1669075A (zh) 音频编码
CN1143268C (zh) 声音编码方法、声音译码方法、声音编码装置和声音译码装置
US8862463B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
CN1272911C (zh) 音频信号解码装置及音频信号编码装置
EP0673014B1 (en) Acoustic signal transform coding method and decoding method
CN101925953B (zh) 编码装置、解码装置以及其方法
JPH08263099A (ja) 符号化装置
CN1305024C (zh) 预测编码/解码设备及其方法
US20080071550A1 (en) Method and apparatus to encode and decode audio signal by using bandwidth extension technique
JP3590071B2 (ja) 音声の効率的な符号化のためのスペクトルパラメータの予測分割マトリックス量子化
JP3344944B2 (ja) オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法
CN1234898A (zh) 具有改进语音编码器和解码器的发射机
CN1227646C (zh) 音频信号传输系统
CN101572092B (zh) 编解码端的固定码本激励的搜索方法及装置
EP2490216B1 (en) Layered speech coding
CN1227812C (zh) 为编码器中的预测滤波器生成系数
JP2000132194A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
CN1222996A (zh) 用于传输语音信号的传输系统
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
Khaldi et al. Audio encoding using Huang and Hilbert transforms
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
CN100498933C (zh) 代码转换机及代码转换方法
JPH0990989A (ja) 変換符号化方法および変換復号化方法
JPH08129400A (ja) 音声符号化方式
CN1729510A (zh) 音频编码中的正弦波选择

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20080220