CN1684371A

CN1684371A - 无损音频解码/编码方法和装置

Info

Publication number: CN1684371A
Application number: CNA2005100717814A
Authority: CN
Inventors: 金重会; 苗磊; 李时和; 金尚煜; 吴殷美; 金度亨
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2004-02-27
Filing date: 2005-02-28
Publication date: 2005-10-19
Anticipated expiration: 2025-02-28
Also published as: JP2005242363A; EP1569203A3; JP2012226375A; US20050192799A1; JP5384780B2; EP1569203A2; CN100588124C; KR20050087956A; US7617110B2

Abstract

本发明提供了一种无损音频编码/解码方法和装置。无损音频编码方法包括：将时域中的音频信号转换为频域中的具有整数的音频频谱信号；根据其频率，将频域中的音频频谱信号映射为位平面信号；和利用根据预定上下文确定的概率模型来无损编码位平面的二元样本。无损音频解码方法包括：通过多路分配音频位流，从误差数据中提取有损编码的预定有损位流和误差位流，该误差数据相应于在有损编码的音频数据和频域中具有整数的音频频谱信号之间的差别；有损解码所提取的编码有损位流；无损解码所提取的误差位流；利用所解码的有损位流和误差位流，恢复原始的音频频率频谱信号；和通过对音频频谱信号执行反向整数时间频率变换，恢复时域中的原始音频信号。

Description

无损音频解码/编码方法和装置

技术领域

本发明涉及音频信号编码/解码的领域，更特别地，涉及一种用于在调整位速率时的无损编码/解码音频信号的装置和方法。

背景技术

无损音频编码可以分类为子午线无损音频压缩(MLP：子午线无损压缩，Meridian Lossless Packing)、转环音频(Monkey’s Audio)和自由无损音频编码(FLAC：Free Lossless Audio Coding)。特别的，MLP(子午线无损压缩)可以应用于数字通用光盘音频(DVD-A)。互联网带宽的增长使得提供大量的多媒体内容成为可能。当提供音频服务时，需要进行无损音频编码。欧洲联盟(EU)已经通过数字音频广播(DAB)系统初始化了数字音频广播，并且广播站或内容提供商已经采用了用于数字音频广播的无损音频编码。在这种连接中，ISO/IEC 14496-3：2001/AMD 5、音频可伸缩无损编码(SLS)标准正在发展为用于通过运动图像专家组(MPEG)进行无损音频编码的标准。这个标准支持精细粒度可伸缩性(FGS)并使能无损音频压缩。

在无损音频压缩技术中作为最重要因素的压缩率可以通过从数据中去除冗余信息来改善。冗余信息可以从相邻数据中被评估和去除，或者利用相邻数据的上下文来去除。

假定整数改进型离散余弦变换(MDCT)系数表示拉普拉斯分布(Laplaciandistribution)。在这种情况中，Golomb编码产生编码的最佳结果，同时位平面进一步被要求提供FGS。Golomb编码和位平面编码的结合被称为位平面Golomb编码(BPGC)，它允许音频数据以最佳速率被压缩并提供FGS。然而，有一种情况不能应用以上的假定。由于BPGC是一种基于以上假定的算法，当整数MDCT系数不表示拉普拉斯分布时，不可能获得最佳的压缩率。相应地，用于开发可以保证最佳压缩率而不管整数MDCT系数是否表示拉普拉斯分布的无损音频编码/解码的需要日益增长。

发明内容

本发明提供了一种能够获得最佳压缩率而不管整数改进型离散余弦变换(MDCT)系数是否表示拉普拉斯分布的无损音频编码方法和装置。

本发明还提供了一种能够获得最佳压缩率而不管整数改进型离散余弦变换(MDCT)系数是否表示拉普拉斯分布的无损音频解码方法和装置。

根据本发明的一个方面，提供了一种无损音频编码方法，该方法包括：将时域中的音频信号转换为频域中的具有整数的音频频谱信号；根据这个频率，将频域中的音频频谱信号映射为位平面信号；以及利用根据预定的上下文确定的概率模型来无损地编码位平面的二元样本。二元样本的无损编码可以包括：根据其频率，将频域中的音频频谱信号映射为位平面的数据；获得最高有效位和用于每个位平面的golomb参数；以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择要被编码的二元样本；利用在包括所选二元样本的相同的位平面上存在的先前编码的样本，来计算所选二元样本的上下文；利用所获得的golomb参数和上下文来选择概率模型；以及利用概率模型来无损地编码二元样本。

根据本发明的另一方面，提供了一种无损音频编码方法，该方法包括：(a)将时域中的音频信号转换为频域中的具有整数的音频频谱信号；(b)对频域中的音频频谱信号进行定标，使得它可以被匹配来输入到有损编码单元；(c)有损编码已定标的信号来获得有损编码的数据；(d)计算为在有损编码的数据和频域中具有整数的音频频谱信号之间的差别的误差映射信号；(e)利用上下文来无损地编码误差映射信号；以及(f)多路复用该无损编码的信号和有损编码的信号，来产生位流。(e)可以包括：(e1)根据其频率，将在(d)中获得的误差映射信号映射为位平面的数据；(e2)获得最高有效位和位平面的golomb参数；(e3)以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择要被编码的二元样本；(e4)利用在包括所选二元样本的相同的位平面上存在的先前编码的样本，来计算所选的二元样本的上下文；(e5)利用golomb参数和上下文，选择概率模型；以及(e6)利用概率模型，无损编码所选的二元样本。

在(e4)中，可以获得在包括所选择的二元样本的同样的位平面上的先前编码的样本的标量值，并且可以利用该标量值来计算所选择的二元样本的上下文。在(e4)中，可以计算预定样本将会具有值为1的概率，该概率可以被乘以预定的整数来获得整数概率，并且可以利用该整数概率来计算所选择的二元样本的上下文，所述预定样本存在在包括所选择的二元样本的同样的位平面上。在(e4)中，可以利用其中所选择的二元样本所位于的以同样频率已经编码的上部位平面的值来计算所选择的二元样本的上下文。在(e4)中，利用关于已经以同样的频率编码的上部位平面值是否存在的信息，可以计算所选择的二元样本的上下文，以及当上部位平面值中的至少一个为1时，可以确定上下文具有值1，否则确定上下文具有值0。

根据本发明的另一个方面，提供了一种无损音频编码装置，该装置包括：整数时间频率转换器，用于将时域中的音频信号转换为频域中的具有整数的音频频谱信号；以及无损编码单元，用于根据其频率，将频域中的音频频谱信号映射为位平面的数据，并利用预定上下文来无损编码位平面的二元样本。所述无损编码单元包括：位平面映射器，用于根据其频率，将频域中的音频频谱信号映射为位平面的数据；参数获得单元，用于获得最高有效位和位平面的golomb参数；二元样本选择器，用于以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择二元样本；上下文计算器，用于利用在包括所选择的二元样本的同样的位平面上的先前编码的样本，来计算所选择的二元样本的上下文；概率模型选择器，用于利用golomb参数和所计算的上下文，来选择概率模型；以及二元样本编码器，用于利用概率模型，无损编码所选择的二元样本。整数时间频率转换器可以执行整数改进型离散余弦变换。

更根据本发明的另一方面，提供了一种无损音频编码装置，该装置包括：整数时间频率转换器，用于将时域中的音频信号转换为频域中的具有整数的音频频谱信号；定标单元(scaling unit)，用于定标音频频谱信号，使得音频频谱信号可以被匹配输入到有损编码单元；有损编码单元，用于有损编码已定标信号；误差映射器，用于计算为在有损编码的信号和通过整数时间频率转换器生成的音频频谱信号之间的差别的误差映射信号；无损编码单元，用于利用上下文，无损编码误差映射信号；以及多路复用器，用于多路复用有损编码的信号和无损编码的信号，来产生位流。所述无损编码单元包括：位平面映射器，用于根据其频率，将误差映射信号映射为位平面的数据；参数获得单元，用于获得最高有效位和位平面的golomb参数；二元样本选择器，用于以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择二元样本；上下文计算器，用于利用在包括所选择的二元样本的同样的位平面上存在的先前编码的样本，计算所选择的二元样本的上下文；概率模型选择器，用于利用golomb参数和所计算的上下文，选择概率模型；以及二元样本编码器，用于利用概率模型，无损编码所选择的二元样本。

更根据本发明的另一方面，提供了一种无损音频解码方法，该方法包括：从音频数据中获得golomb参数；以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择要被解码的二元样本；利用已经解码的样本来计算预定的上下文；利用golomb参数和上下文选择概率模型；利用概率模型来算术解码所选择的二元样本；以及重复执行二元样本的选择、预定上下文的计算、概率模型的选择和所选择的二元样本的算术解码(arithmetically decoding)，直到所有所选择的二元样本被解码为止。预定上下文的计算可以包括：利用在包括所选择的二元样本的同样的位平面上存在的已经解码的样本，来计算第一上下文；以及利用其中所选择的二元样本所位于的以同样的频率已经解码的上部位平面样本，来计算第二上下文。

更根据本发明的另一方面，提供了一种无损音频解码方法，该方法包括：(aa)通过多路分配(demultiplex)音频位流，来从误差数据中提取有损编码的预定有损位流和误差位流，该误差数据相应于在有损编码的音频数据和频域中具有整数的音频频谱信号之间的差别；(bb)有损解码所提取的已编码有损位流；(cc)无损解码所提取的误差位流；(dd)利用已解码的有损位流和误差位流，来恢复原始的音频频率频谱信号；以及(ee)通过在音频频谱信号上执行反向整数时间频率变换，恢复时域中的原始音频信号。(cc)可以包括：(cc1)从音频数据的位流中获得golomb参数；(cc2)以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，选择要被解码的二元样本；(cc3)利用已经解码的样本，计算预定的上下文；(cc4)利用golomb参数和上下文，选择概率模型；(cc5)利用概率模型，算术上解码所选择的二元样本；以及(cc6)重复进行(cc2)到(cc5)，直到所有位平面的样本被解码为止。(cc3)可以包括：利用在包括所选择的二元样本的同样的位平面上的已经解码的样本，来计算第一上下文；以及利用其中所选择的二元样本所位于的以同样频率已经解码的上部位平面样本，来计算第二上下文。

更根据本发明的另一方面，提供了一种无损音频解码装置，该装置包括：参数获得单元，用于从音频数据的位流中获得golomb参数；样本选择器，用于以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，选择要被解码的二元样本；上下文计算单元，用于利用已经解码的样本，来计算预定的上下文；概率模型选择器，用于利用golomb参数和上下文，选择概率模型；算术解码器，用于利用概率模型，算术上解码所选择的二元样本。所述上下文计算单元可以包括：第一上下文计算器，用于利用在包括所选择的二元样本的同样的位平面上存在的已经解码的样本，来计算第一上下文；以及第二上下文计算器，用于利用其中所选择的二元样本所位于的已经以同样频率解码的上部位平面样本，来计算第二上下文。

更根据本发明的另一方面，提供了一种无损音频解码装置，该装置包括：多路分配器，用于多路分配音频位流来从误差数据中提取有损编码的预定的有损位流和误差位流，该误差数据对应于在有损编码的音频数据和频域中具有整数的音频频谱信号之间的差别；有损解码单元，用于有损编码所提取的有损位流；无损解码单元，用于无损解码所提取的误差位流；音频信号合成单元，用于合成所解码的有损位流和误差位流来恢复音频频率频谱信号；以及反向整数时间频率转换器，用于对所恢复的音频频率频谱信号执行反向整数时间频率变换，以恢复时域中的原始音频信号。

有损解码单元可以是AAC(自动幅度控制)解码器。无损音频解码装置可以进一步包括用于将通过有损解码单元解码的有损位流恢复为时域中的音频信号的反向时间频率转换器。有损解码单元包括：参数获得单元，用于从音频数据的位流中获得golomb参数；样本选择器，用于以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，选择要被解码的二元样本；上下文计算单元，用于利用已经解码的样本，计算预定的上下文；概率模型选择器，用于利用golomb参数和上下文，选择概率模型；以及算术解码器，用于利用概率模型，在算术上解码所选择的二元样本。

上下文计算单元可以包括：第一上下文计算器，用于利用在包括所选择的二元样本的同样的位平面上存在的已经解码的样本，来计算第一上下文；以及第二上下文计算器，用于利用其中所选择的二元样本所位于的已经以同样频率解码的上部位平面样本，来计算第二上下文。

更根据本发明的另一方面，提供了一种计算机可读记录介质，用于存储利用计算机执行权利要求1到8和权利要求18到24的任意一种方法的程序。

附图说明

本发明的上述和其它方面和优点将通过参考附图来详细描述它的示范性实施例而变得更加明显，其中：

图1是根据本发明的一个实施例的无损音频编码装置的方框图；

图2是图1的无损编码单元的详细方框图；

图3是根据本发明的另一个实施例的无损音频编码装置的方框图。

图4是图3的无损编码单元的方框图；

图5是根据本发明的一个实施例的图1的无损音频编码装置的操作的流程图；

图6是根据本发明的一个实施例的图1的无损编码单元的操作的流程图；

图7是根据本发明的一个实施例的图3的无损音频编码装置的操作的流程图；

图8说明了根据其频率映射到位平面的数据的音频信号；

图9是根据本发明的一个实施例的无损音频解码单元的方框图；

图10是图9的上下文计算的详细方框图；

图11是根据本发明的另一个实施例的无损音频解码单元的方框图；

图12是图11的无损解码单元的详细方框图；

图13是根据本发明的一个实施例的图9的无损音频解码装置的操作的流程图；和

图14是根据本发明的一个实施例的图11的无损音频解码装置的操作的流程图。

具体实施方式

现在将参考附图来详细描述一种根据本发明的无损音频编码/解码方法和装置。通常，为音频编码提供精细粒度可伸缩性(FGS：Fine GrainScalability)，以及为无损音频编码执行整数改进型离散余弦变换(MDCT)。特别的，当音频信号的输入样本显示拉普拉斯分布时，位平面Golomb编码(BPGC)产生编码的最有利的结果。众所周知，BPGC的结果等价于Golomb编码的结果。Golomb参数L可以通过For(L＝0；(N＜＜L+1))＜＝A；L++)；来获得。根据Golomb编码，小于Golomb参数L的位平面将具有0或1的值的概率为1/2。然而，在这种情况中，仅仅当音频信号的输入样本显示出拉普拉斯分布时，有可能获得编码的最佳结果。相应地，本发明是即使数据的分布不同于拉普拉斯分布，也能通过利用数据的上下文和统计分析来提供最佳压缩率。

图1是根据本发明的一个实施例的无损音频编码装置的方框图。图1的无损音频编码装置包括整数时间频率转换器100和无损编码单元120。整数时间频率转换器100将时域中的音频信号转换为频域中具有整数的音频频谱信号，优选地使用整数MDCT。无损编码单元120根据其频率将频域中的音频信号映射为位平面的数据，并利用预定的上下文来无损编码构成位平面的二元样本。无损编码单元120包括：位平面映射器200、Golomb参数获得单元210、二元样本选择器220、上下文计算器230、概率模型选择器240和二元样本编码器250。

位平面映射器200根据其频率，将频域中的音频信号映射为位平面的数据。图8说明了根据其频率映射到位平面的数据的音频信号。

Golomb参数获得单元210获取最高有效位(MSB)和位平面的Golomb参数。二元样本选择器220以从MSB到最低有效位(LSB)和从最低频率分量到最高频率分量的顺序，从位平面中选择要编码的二元样本。

上下文计算器230利用位于包括所选择的二元样本的位平面上的先前编码的二元样本，来计算所选择的二元样本的上下文。概率模型选择器240利用所获得的Golomb参数和所计算的上下文，来选择概率模型。二元样本编码器250利用所选择的概率模型来无损编码所选择的二元样本。

图3是根据本发明的另一个实施例的无损音频编码装置的方框图。图3的无损音频编码装置包括：整数时间频率转换器300、定标单元310、有损编码单元320、误差映射器330、无损编码单元340和多路复用器350。

整数时间频率转换器300将时域中的音频信号转换为频域中的具有整数的音频频谱信号。在这个情况中，对于这个变换，整数MDCT被优选执行。定标单元310定标从整数时间频率转换器300输出的音频频率信号，使得其能够被匹配来输入到有损编码单元320。从整数时间频率转换器300输出的音频频率信号被表示为整数，因此，不能被直接输入到有损编码单元320。因此，音频频率信号必须通过定标单元310进行定标，使得其可以被输入到有损编码单元320。

有损编码单元320有损编码已定标的音频频率信号，优选利用ACC核心编码器(未示出)。误差映射器330获得为在有损编码的信号和从整数时间频率转换器300输出的音频频率信号之间的差别的误差映射信号。无损编码单元340利用上下文来无损编码该误差映射信号。多路复用器350多路复用无损编码的信号和有损编码的信号，以便产生位流。

图4是图3的无损编码单元340的方框图。无损编码单元340包括：位平面映射器400、参数获得单元410、二元样本选择器420、上下文计算器430、概率模型选择器440和二元样本编码器450。

位平面映射器400根据其频率，将通过误差映射器330生成的误差映射数据映射为位平面的数据。参数获得单元410获得MSB和位平面的Golomb参数。二元样本选择器420以从MSB到LSB和从最低频率分量到最高频率分量的顺序，从位平面中选择二元样本。上下文计算器430利用位于包括所选择的二元样本的位平面上的先前编码的二元样本，来计算所选择的二元样本的上下文。概率模型选择器440利用所获得的Golomb参数和所计算的上下文，来选择概率模型。二元样本编码器450利用概率模型来无损编码所选择的二元样本。

图2和4的上下文计算器230和430能够将位于包括所选择的二元样本的位平面上的先前编码的二元样本变化为标量值，并利用该标量值计算所选择的二元样本的上下文。可选地，上下文计算器230和430可以计算位于包括所选择的二元样本的位平面上的预定样本将会具有值为1的概率，以预定整数乘以该概率来获得整数，并利用该整数来计算所选择的二元样本的上下文。同样，上下文计算器230和430可以利用其中所选择的二元样本所位于的以同样频率已经编码的上部位平面的值，来计算上下文。同样，基于关于已经编码的上部位平面值是否存在的信息，当至少一个上部位平面值为‘1’时，可以确定上下文为1，否则确定上下文为0。

图5是根据本发明的一个实施例的图1的无损音频编码装置的操作的流程图。参考图5，当相应于时域中的音频信号的脉冲编码调制(PCM)信号被输入到整数时间频率转换器100中时，整数时间频率转换器100将这个信号转换为频域中具有整数的音频频谱信号(操作500)。对于这个变换，整数MDCT被优选执行。然后，正如在图8中示出的，根据其频率，频域中的音频频谱信号被映射为位平面信号(操作520)。然后，利用由预定上下文确定的概率模型，来无损编码位平面的二元样本(操作540)。

图6是根据本发明的一个实施例的图1的无损编码单元120的操作的流程图。参考图6，当频域中的音频频谱信号被输入到位平面映射器200中时，根据其频率，频域中的音频频谱信号被映射为位平面的数据(操作600)。然后，通过Golomb参数获得单元210来获得MSB和位平面的Golomb参数(操作610)。接着，二元样本选择器220以从MSB到LSB和从最低频率分量到最高频率分量的顺序，从位平面中选择要编码的二元样本(操作620)。接着，利用位于包括所选择的二元样本的位平面上的先前编码的二元样本，来计算所选择的二元样本的上下文(操作630)。接着，利用由Golomb参数获得单元210获得的Golomb参数和由上下文计算器230计算的上下文，来选择概率模型(操作640)。此后，利用概率模型来无损编码所选择的二元样本(操作650)。

图7是根据本发明的一个实施例的图3的无损编码单元的操作的流程图。参考图3，通过整数时间频率转换器300，时域中的音频信号被转换为频域中具有整数的音频频谱信号(操作710)。

接着，通过定标单元310定标频域中的音频频谱信号，使得它可以被匹配输入到有损编码单元320中(操作720)。接着，通过有损编码单元320来有损编码该已定标的音频频谱信号(操作730)。AAC核心编码器优选地用于该已定标的音频频谱信号的有损编码。

接着，误差映射器330获得为在有损编码的信号和频域中具有整数的音频频谱信号之间的差别的误差映射信号(操作740)。接着，无损编码单元340利用上下文来无损编码该误差映射信号(操作750)。

然后，多路复用器350多路复用由无损编码单元340生成的无损编码的信号和由有损编码单元320生成的有损编码的信号，以便产生位流(操作760)。

在操作750中，误差映射信号根据其频率被映射为位平面信号，接着，执行与图6的操作610到650相同的操作。

图8说明了用于计算要编码的样本的上下文而从位平面中选择的样本的范围，该位平面包括将要编码的样本。由虚线指明的部分表示可用于计算要编码的样本的概率分布的样本。

通常，执行MDCT造成在频率轴上的相邻样本之间产生相关性(correlation)的频谱泄露。换句话说，如果相邻样本的值为X，很有可能当前样本的值近似为X。因此，当为了上下文的计算而选择相邻的样本时，有可能利用其间的相关性来提高压缩率。

统计揭露出上部位平面值与较低样本的分布紧密相关。因此，当为了上下文的计算而选择相邻的样本时，有可能利用其间的相关性来提高压缩率。

现在将描述上下文的计算。在包括用于编码的所选择的样本的同样的位平面上存在的已经编码的样本可以用于上下文的计算。存在利用已经编码的样本来计算上下文的各种各样的方法。以下将描述代表性的方法。

在第一种方法中，在同样的位平面上的具有预定长度的已经编码的二元样本的值被改变成将被用作上下文的标量值。假定四个已经编码的二元样本被用于上下文的计算。如果四个二元样本表示0100的值，则0100被认为是二进制数字，即0100(2)，并且0100(2)表示4，上下文的值被确定为4。在这种情况中，很有可能当前样本具有1的值。在某些情况中，考虑到模型的大小而限制上下文值的范围。通常，上下文值具有从8到16的范围。

在第二种方法中，在同样的位平面上存在的1的数目被计算，并且已经编码的样本会具有值1的概率被计算。接着，通过以整数N乘以已经编码的样本会具有值1的概率，来获得整数值。如果获得的整数是0，则已经编码的样本没有具有值1的。在这种情况中，要被编码的样本很有可能具有值1。如果获得的整数近似于整数N，则大多数已经编码的样本具有值1，因此，要被编码的样本很有可能具有值0。在某些情况中，考虑到模型的大小而限制上下文值的范围。通常，上下文值具有从8到16的范围。

以同样频率的上部位平面样本，其中存在要被编码的样本，可以用于上下文计算。存在利用已经编码的样本来计算上下文的各种各样的方法。以下将描述代表性的方法。

在第一种方法中，已经编码的上部位平面值被用于上下文计算。如果上部位平面样本表示0110的值，则0100被认为是二进制数字，即，0110(2)，且0110(2)表示6，上下文的值被确定为6。在某些情况中，考虑到模型的大小而限制上下文值的范围。通常，上下文值具有从8到16的范围。

在第二种方法中，关于已经编码的上部位平面值是否存在的信息被用于上下文计算。当至少一个上部位平面值为1时，上下文值被确定为1，否则被确定为0。也就是说，如果MSB还没有被编码，则很有可能要被编码的当前样本具有值1。

假定第三位平面的第四样本将被编码，则第四样本具有值0，Golomb参数为4。在同样的位平面上存在的样本的上下文将会被计算。

在相同的位平面上获得上下文的第一种方法被使用。第一，根据第一种方法，样本表示二进制值001(2)，因此，上下文值(context1)为1。第二，在同样的频率处的样本表示二进制值10(2)，因此，它们的上下文值(context2)为2。

因此，利用以上三个参数来选择概率模型，例如具有值4的Golomb参数、上下文值1和上下文值2。概率模型可以被表示为代表三维排列的Prob[Golomb][Context1][Context2]。

接着，利用概率模型来无损编码音频信号。算术编码(arithmeticencoding)可以被用于无损编码音频信号。

现在将描述一种根据本发明的无损音频解码装置和方法。图9是根据本发明的一个实施例的无损音频解码装置的方框图。图9的装置包括：参数获得单元900、样本选择器910、上下文计算单元920、概率模型选择器930和算术解码器940。

当音频数据的位流被输入到参数获得单元900时，参数获得单元900从位流中获得MSB和Golomb参数。样本选择器910以从MSB到LSB和从最低频率分量到最高频率分量的顺序，选择要被解码的二元样本。

上下文计算单元920利用已经解码的样本来计算预定的上下文值。如在图10中示出的，上下文计算单元920包括第一上下文计算器1000和第二上下文计算器1020。第一上下文计算器1000利用在包括所选择的二元样本的位平面上存在的已经解码的样本，来计算第一上下文。第二上下文计算器1020利用其中所选择的二元样本所位于的以同样频率已经解码的上部位平面样本，来计算第二上下文。

概率模型选择器930利用由参数获得单元900获得的Golomb参数和由上下文计算器920计算的上下文来选择概率模型。算术解码器940利用概率模型来在算术上解码所选择的二元样本。

图11是根据本发明的另一个实施例的无损音频解码装置的方框图。图11的装置包括：多路分配器1100、有损解码单元1110、无损解码单元1120、音频信号合成单元1130和反向整数时间频率转换器1140。该装置最好进一步包括反向时间频率转换器1150。

当音频位流被输入到多路分配器1100中时，多路分配器1100多路分配音频位流，来提取(extract)当利用预定的有损编码方法编码位流时生成的有损位流和误差数据的误差位流。

有损解码单元1110利用相应于编码位流所采用的有损编码方法的有损解码方法来有损解码有损位流。无损解码单元1120利用相应于编码位流所采用的无损编码方法的无损解码方法来无损解码由多路分配器1100提取的误差位流。

音频信号合成单元1130合成解码的有损位流和误差位流，以获得原始的频率频谱信号。反向整数时间频率转换器1140对频率频谱信号执行反向整数时间频率的变换，以获得时域中的原始音频信号。

同样，反向时间频率转换器1150将由有损解码单元1110生成的频域中的音频信号恢复为时域中的原始音频信号。通过有损解码来获得所恢复的音频信号。

图12是图11的无损解码单元1120的详细方框图。无损解码单元1120包括：参数获得单元1200、样本选择器1210、上下文计算单元1220、概率模型选择器1230和算术解码器1240。

参数获得单元1200从音频位流中获得MSB和Golomb参数。样本选择器1210以从MSB到LSB和从最低频率分量到最高频率分量的顺序，来选择要被解码的二元样本。

上下文计算单元1220利用已经解码的样本来计算预定的上下文。上下文计算单元1220包括第一上下文计算器(未示出)和第二上下文计算器(未示出)。第一上下文计算器利用在包括所选择的二元样本的同样的位平面上存在的先前解码的样本，来计算第一上下文。第二上下文计算器利用其中所选择的二元样本存在的以同样频率已经解码的上部位平面样本，来计算第二上下文。

概率模型选择器1230利用Golomb参数以及第一和第二上下文值来选择概率模型。算术解码器1240利用概率模型来算术解码所选的二元样本。

图13是根据本发明的一个实施例的图9的无损音频解码装置的操作的流程图。参考图13，当音频数据的位流被输入到参数获得单元900时，从位流中获得Golomb参数(操作1300)。接着，样本选择器910以从MSB到LSB和从最低频率分量到最高频率分量的顺序，选择要被解码的二元样本(操作1310)。

在选择了二元样本后，上下文计算器920利用已经解码的样本来计算预定的上下文(操作1320)。在此，预定的上下文包括第一上下文和第二上下文。利用在包括所选择的二元样本的同样的位平面上存在的已经解码的样本，由图10的第一上下文计算器1000来计算第一上下文。利用其中所选择的二元样本所位于的以同样频率已经解码的上部位平面样本，由图10的第二上下文计算器1020来计算第二上下文。

接着，概率模型选择器930利用Golomb参数以及第一和第二上下文来选择概率模型(操作1330)。然后，利用概率模型来算术解码所选择的二元样本(操作1340)。重复进行操作1310到1340，直到所有选择到位平面的二元样本被解码为止(操作1350)。

图14是根据本发明的一个实施例的图11的无损音频解码装置的操作的流程图。在这个实施例中，在有损编码的音频数据和频域中具有整数的音频频谱信号之间的差别被称为是误差数据。参考图14，当音频位流被输入到多路分配器1100中时，多路分配位流以便提取利用预定的有损编码方法生成的有损位流和误差数据的误差位流(操作1400)。

接着，所提取的有损位流被输入到有损解码单元1110，并由有损解码单元1110利用相应于编码位流所采用的有损编码方法的预定有损解码，来进行有损解码(操作1410)。同样，所提取的误差位流被输入到无损解码单元1120，并通过无损解码单元1120来进行无损解码(操作1420)。操作1420与图13中的操作相似，因此，这里将省略其详细的描述。

接着，由有损解码单元1110生成的有损位流和由无损解码单元1120生成的误差位流被输入到音频信号合成单元1130，以便来恢复原始频率频谱信号(操作1430)。频率频谱信号被输入到反向整数时间频率转换器1140来恢复时域中的原始音频信号(操作1440)。

本发明可以被具体化为在计算机可读介质中的计算机可读代码。在此，计算机可以是能够处理信息的任意装置。同样，计算机可读介质可以是能够存储由计算机系统读取的数据的任意记录装置，例如只读存储器(ROM)、随机存取存储器(RAM)、压缩光盘(CD)-ROM、磁带、软盘、光学数据存储设备等。

根据本发明的无损音频编码/解码方法和装置能够利用基于整数MDCT系数的统计分布而不是整数MDCT系数的实际上的分布的概率模型，以最佳的压缩率来编码/解码音频信号。也就是说，可以达到最佳的压缩率而不管整数MDCT系数是否显示出拉普拉斯分布。相应的，可以利用基于上下文的编码来以最佳的压缩率压缩音频信号，比当利用BPGC的时候要好。

以下的伪码表示了根据本发明的一个实施例的使用无损编码单元(算术编码单元)的例子以及执行无损音频解码的上下文模型。本发明可适用于MPEG-4音频可伸缩无损音频压缩标准。

-用于依靠上下文的熵编码的伪码

    while(there exists cur_bp[g][sfb]＞＝0){

      for(g＝0；g＜num_windows_group；g++){

         for(sfb＝0；sfb＜total_sfb；sfb++){

          if(cur_bp[g][sfb]＞＝0&&low_energy_mode_used！＝1){

            width＝swb_offset[g][sfb+1]？swb-offset[g][sfb]；

              for(win＝0；win＜window_group-len[g]；win++){

                for(bin＝0；bin＜width；bin++){

                   if(！is_lle_ics_eof()){

                      if(M[g][win][sfb][bin]＞＝cur_bp[g][sfb]){

                        context1＝Context1_Calculation()；

                          probVa1＝model_select(context)；

    res[g][win][sfb][bin]+＝bpgc_decode(probVa1)＜＜cur_bp[g][sfb]；

                 /*decode bit-plane cur_bp*/

      if((！is_sig[g][win][sfb][bin])&&(res[g][win][sfb][bin])){

               res[g][win][sfb][bin]*＝(bpgc_decode())？1：-1；

                       is_sig[g][win][sfb][bin]＝1；

                              }

        else{/* lossy mode*/

          if(is_sig[g][win][sfb][bin]){

            res[g][win][sfb][bin]+＝res_fill；

              is_sig[g][win][sfb][bin]＝0；

                           }

                          }

                         }

                       }
        <!-- SIPO <DP n="14"> -->
        <dp n="d14"/>
                          }

      cur_bp[g][sfb]--；/*progress to next bit-plane*/

                      }

                    }

            if(low_energy_mode_used)

              {

                        decode_low_energy_mode()；

              }

      }

    }

虽然已经参考本发明的示范性实施例特别显示和描述了本发明，但是本技术领域技术人员可以理解，在不脱离由所附的权利要求定义的本发明的精神和范围的前提下，这里可以在形式和细节上进行各种各样的变化。

Claims

1、一种无损音频编码方法，包括：

将时域中的音频信号转换为频域中的具有整数的音频频谱信号；

根据其频率，将频域中的音频频谱信号映射为位平面信号；以及

利用根据预定的上下文确定的概率模型来无损编码位平面的二元样本。

2、根据权利要求1所述的无损音频编码方法，其中，二元样本的无损编码包括：

根据其频率，将频域中的音频频谱信号映射为位平面的数据；

获得最高有效位和用于每个位平面的golomb参数；

以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择要被编码的二元样本；

利用在包括所选二元样本的相同的位平面上存在的先前编码的样本，来计算所选二元样本的上下文；

利用所获得的golomb参数和上下文来选择概率模型；以及

利用概率模型来无损编码二元样本。

3、一种无损音频编码方法，包括：

(a)将时域中的音频信号转换为频域中的具有整数的音频频谱信号；

(b)对频域中的音频频谱信号进行定标，使得其能被匹配来输入到有损编码单元；

(c)有损编码已定标的信号来获得有损编码的数据；

(d)计算为在有损编码的数据和频域中具有整数的音频频谱信号之间的差别的误差映射信号；

(e)利用上下文来无损编码误差映射信号；以及

(f)多路复用该无损编码的信号和有损编码的信号，来产生位流。

4、根据权利要求3所述的无损音频编码方法，其中(e)包括：

(e1)根据其频率，将在(d)中获得的误差映射信号映射为位平面的数据；

(e2)获得最高有效位和位平面的golomb参数；

(e3)以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择要被编码的二元样本；

(e4)利用在包括所选择的二元样本的相同的位平面上存在的先前编码的样本，来计算所选择的二元样本的上下文；

(e5)利用golomb参数和上下文，来选择概率模型；以及

(e6)利用概率模型，无损编码所选择的二元样本。

5、根据权利要求4所述的无损音频编码方法，其中在(e4)中，获得在包括所选择的二元样本的同样的位平面上存在的先前编码的样本的标量值，并且利用该标量值来计算所选择的二元样本的上下文。

6、根据权利要求4所述的无损音频编码方法，其中在(e4)中，计算预定样本将会具有值为1的概率，该概率被乘以预定的整数来获得整数概率，并且利用该整数概率，来计算所选择的二元样本的上下文，所述预定样本存在在包括所选择的二元样本的同样的位平面上。

7、根据权利要求4所述的无损音频编码方法，其中在(e4)中，利用所选择的二元样本所位于的以同样频率已经编码的上部位平面值，来计算所选择的二元样本的上下文。

8、根据权利要求4所述的无损音频编码方法，其中在(e4)中，利用关于已经以同样频率编码的上部位平面值是否存在的信息，来计算所选择的二元样本的上下文，以及

当至少一个上部位平面值为1时，确定上下文具有值1，以及否则就确定上下文具有值0。

9、一种无损音频编码装置，包括：

整数时间频率转换器，用于将时域中的音频信号转换为频域中的具有整数的音频频谱信号；以及

无损编码单元，用于根据其频率，将频域中的音频频谱信号映射为位平面的数据，并利用预定的上下文来无损编码位平面的二元样本。

10、根据权利要求9所述的无损音频编码装置，其中，所述无损编码单元包括：

位平面映射器，用于根据其频率，将频域中的音频频谱信号映射为位平面的数据；

参数获得单元，用于获得最高有效位和位平面的golomb参数；

二元样本选择器，用于以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择二元样本；

上下文计算器，用于利用在包括所选择的二元样本的同样的位平面上的先前编码的样本，来计算所选择的二元样本的上下文；

概率模型选择器，用于利用golomb参数和所计算的上下文，来选择概率模型；以及

二元样本编码器，用于利用概率模型，来无损编码所选择的二元样本。

11、根据权利要求9所述的无损音频编码装置，其中，所述整数时间频率转换器执行整数改进型离散余弦变换。

12、一种无损音频编码装置，包括：

整数时间频率转换器，用于将时域中的音频信号转换为频域中的具有整数的音频频谱信号；

定标单元，用于定标音频频谱信号，使得音频频谱信号能被匹配输入到有损编码单元；

有损编码单元，用于有损编码已定标的信号；

误差映射器，用于计算为在有损编码的信号和通过整数时间频率转换器生成的音频频谱信号之间的差别的误差映射信号；

无损编码单元，用于利用上下文，无损编码误差映射信号；以及

多路复用器，用于多路复用有损编码的信号和无损编码的信号，来产生位流。

13、根据权利要求12所述的装置，其中，所述无损编码单元包括：

位平面映射器，用于根据其频率，将误差映射信号映射为位平面的数据；

参数获得单元，用于获得最高有效位和位平面的golomb参数；

上下文计算器，用于利用在包括所选择的二元样本的同样的位平面上存在的先前编码的样本，来计算所选择的二元样本的上下文；

二元样本编码器，用于利用概率模型，无损编码所选择的二元样本。

14、根据权利要求13所述的装置，其中，所述上下文计算器通过获得先前编码的样本的标量值，来计算所选择的二元样本的上下文。

15、根据权利要求13所述的装置，其中，所述上下文计算器通过计算在同样的位平面上的预定样本具有值为1的概率来计算所选择的二元样本的上下文，将该概率乘以预定的整数来获得整数概率，以及利用该整数概率来计算上下文。

16、根据权利要求13所述的装置，其中，所述上下文计算器利用所选择的二元样本所位于的已经以同样的频率编码的上部位平面值，来计算所选择的二元样本的上下文。

17、根据权利要求13所述的装置，其中，所述上下文计算器利用关于所选择的二元样本所位于的已经以同样的频率编码的上部位平面值是否存在的信息，来计算所选择的二元样本的上下文，以及

当至少一个上部位平面值为1时，确定上下文具有值1，否则确定上下文具有值0。

18、一种无损音频解码方法，包括：

从音频数据中获得golomb参数；

以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，从位平面中选择要被解码的二元样本；

利用已经解码的样本来计算预定的上下文；

利用golomb参数和上下文来选择概率模型；

利用概率模型来算术解码所选择的二元样本；以及

重复执行二元样本的选择、预定上下文的计算、概率模型的选择和所选择的二元样本的算术解码，直到所有所选择的二元样本被解码为止。

19、根据权利要求18所述的无损音频解码方法，其中，预定上下文的计算包括：

利用在包括所选择的二元样本的同样的位平面上存在的已经解码的样本，来计算第一上下文；以及

利用所选择的二元样本所位于的已经以同样的频率解码的上部位平面样本，来计算第二上下文。

20、一种无损音频解码方法，包括：

(aa)通过多路分配音频位流，来从误差数据中提取有损编码的预定有损位流和误差位流，该误差数据相应于在有损编码的音频数据和频域中具有整数的音频频谱信号之间的差别；

(bb)有损解码所提取的已编码有损位流；

(cc)无损解码所提取的误差位流；

(dd)利用所解码的有损位流和误差位流，来恢复原始的音频频率频谱信号；以及

(ee)通过对音频频谱信号执行反向整数时间频率变换，来恢复时域中的原始音频信号。

21、根据权利要求20所述的无损音频解码方法，其中，(cc)包括：

(cc1)从音频数据的位流中获得golomb参数；

(cc2)以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，选择要被解码的二元样本；

(cc3)利用已经解码的样本，来计算预定的上下文；

(cc4)利用golomb参数和上下文，来选择概率模型；

(cc5)利用概率模型，来算术解码所选择的二元样本；以及

(cc6)重复进行(cc2)到(cc5)，直到所有位平面的样本被解码为止。

22、根据权利要求21所述的无损音频解码方法，其中，(cc3)包括：利用在包括所选择的二元样本的同样的位平面上的已经解码的样本，来计算第一上下文。

23、根据权利要求21所述的无损音频解码方法，其中，(cc3)包括：利用所选择的二元样本所位于的已经以同样频率解码的上部位平面样本，来计算第二上下文。

24、根据权利要求21所述的无损音频解码方法，其中，(cc3)包括：

利用在包括所选择的二元样本的同样的位平面上的已经解码的样本，来计算第一上下文；以及

利用所选择的二元样本所位于的已经以同样频率解码的上部位平面样本，来计算第二上下文。

25、一种无损音频解码装置，包括：

参数获得单元，用于从音频数据的位流中获得golomb参数；

样本选择器，用于以从最高有效位到最低有效位和从最低频率分量到最高频率分量的顺序，选择要被解码的二元样本；

上下文计算单元，用于利用已经解码的样本，来计算预定的上下文；

概率模型选择器，用于利用golomb参数和上下文，来选择概率模型；以及

算术解码器，用于利用概率模型，来算术解码所选择的二元样本。

26、根据权利要求25所述的无损音频解码装置，其中，所述上下文计算单元包括：

第一上下文计算器，用于利用在包括所选择的二元样本的同样的位平面上存在的已经解码的样本，来计算第一上下文；以及

第二上下文计算器，用于利用所选择的二元样本所位于的已经以同样频率解码的上部位平面样本，来计算第二上下文。

27、一种无损音频解码装置，包括：

多路分配器，用于多路分配音频位流来从误差数据中提取有损编码的预定有损位流和误差位流，该误差数据对应于在有损编码的音频数据和频域中具有整数的音频频谱信号之间的差别；

有损解码单元，用于有损编码所提取的有损位流；

无损解码单元，用于无损解码所提取的误差位流；

音频信号合成单元，用于合成所解码的有损位流和误差位流来恢复音频频率频谱信号；以及

反向整数时间频率转换器，用于对所恢复的音频频率频谱信号执行反向整数时间频率变换，以恢复时域中的原始音频信号。

28、根据权利要求27所述的无损音频解码装置，其中，所述有损解码单元是ACC解码器。

29、根据权利要求27所述的无损音频解码装置，还包括：反向时间频率转换器，用于将通过有损解码单元解码的有损位流恢复为时域中的音频信号。

30、根据权利要求27所述的无损音频解码装置，其中，所述有损解码单元包括：

参数获得单元，用于从音频数据的位流中获得golomb参数；

概率模型选择器，用于利用golomb参数和上下文，来选择概率模型；和

31、根据权利要求30所述的无损音频解码装置，其中，所述上下文计算单元包括：