CN1681213B - 无损音频编码/解码方法和装置 - Google Patents

无损音频编码/解码方法和装置 Download PDF

Info

Publication number
CN1681213B
CN1681213B CN2005100741885A CN200510074188A CN1681213B CN 1681213 B CN1681213 B CN 1681213B CN 2005100741885 A CN2005100741885 A CN 2005100741885A CN 200510074188 A CN200510074188 A CN 200510074188A CN 1681213 B CN1681213 B CN 1681213B
Authority
CN
China
Prior art keywords
bit
frequency
planes
sample
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2005100741885A
Other languages
English (en)
Other versions
CN1681213A (zh
Inventor
吴殷美
金重会
苗磊
李时和
金尚煜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN1681213A publication Critical patent/CN1681213A/zh
Application granted granted Critical
Publication of CN1681213B publication Critical patent/CN1681213B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error

Abstract

提供一种无损音频编码和/或解码方法和装置。编码方法包括:将在频域中具有整数值的音频频谱信号映射为与频率相关的比特平面信号;获取每个比特平面的最高有效位和Golomb参数;按照从最高有效位到最低有效位和从低频分量到高频分量的顺序选择将被编码的比特平面上的二进制样本;通过使用已编码比特平面的有效位来计算所选二进制样本的上下文,该比特平面用于关于在所选二进制样本所属的频率线附近的多个频率线中的每一个;通过使用获取的Golomb参数和计算的上下文选择概率模型;和通过使用所选的概率模型无损编码二进制样本。根据该方法和装置,通过具有最佳性能的基于上下文的编码方法,提供优于比特平面Golomb编码(BPGC)的压缩比。

Description

无损音频编码/解码方法和装置
技术领域
本发明涉及音频信号的编码和/或解码,尤其涉及无损音频编码/解码方法和装置,它能够提供比使用基于文本编码方法的比特平面Golomb编码(BPGC)更高的压缩比。
背景技术
无损音频编码方法包括Meridian无损音频压缩编码,Monkey’s音频编码和自由无损音频编码。Meridian无损压缩(MLP)适用并使用于数字通用盘-音频(DVD-A)。随着因特网网络带宽的增加,可以提供大容量的多媒体内容。在音频内容的情况中,需要一种无损音频方法。在欧盟(EU),已经通过数字音频广播(DAB)开始数字音频广播,为此广播站和内容提供者正在使用无损音频编码方法。响应于此,MPEG组在ISO/IEC 14496-3:2001/AMD 5,以无损编码的音频伸缩(SLS)的名义进行了关于无损音频压缩的标准化工作。这个提供了精细粒度可伸缩性(FGS)并使无损音频压缩成为可能。
在无损音频压缩技术中最重要的因素压缩比可以通过消除数据项之间的冗余信息来改善。可以通过在相邻数据项之间的预测消除冗余信息,也可以通过在相邻数据项之间的上下文消除冗余信息。
整数修正离散余弦变换(MDCT)系数显示拉普拉斯分布,以及在这个分布中,命名为Golomb编码的压缩方式描述了最佳结果。为了提供FGS,需要比特平面编码,Golomb编码和比特平面编码的组合被称为比特平面Golomb编码(BPGC),他提供了最佳压缩比和FGS。然而,在某些情况中,整数MDCT系数显示拉普拉斯分布的假设在实际的数据分布中是不正确的。由于BPGC是一个设计假设整数MDCT系数表明拉普拉斯分布的算法,如果整数MDCT系数没有显示拉普拉斯分布,BPGC便不能提供最佳压缩比。因此,需要一种能不考虑整数MDCT系数表明拉普拉斯分布这样的假设提供最佳压缩比的无损音频编码和解码方法。
发明内容
本发明提供一种能够不考虑整数MDCT系数显示拉普拉斯分布这样的假设而提供最佳压缩比的无损音频编码/解码方法和装置。
根据本发明的一个方面,提供的编码方法包括:将具有整数值的频域中的音频频谱信号映射为与频率相关的比特平面信号;获得每个比特平面的最高有效比特和Golomb参数;按照从最高有效比特到最低有效比特和从低频分量到高频分量的次序选择将被编码的比特平面上的二进制样本;通过使用关于已选二进制样本所属的频率线附近存在的多个频率线中的每一个的已编码比特平面的有效位来计算所选二进制样本的上下文;通过使用获取的Golomb参数和计算的上下文来选择二进制样本的概率模型;和通过使用所选的概率模型无损编码二进制样本。
在计算所选二进制样本的上下文中,获取在比特平面上已编码的样本的有效位,该比特平面位于所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,通过二进制化该有效位,计算二进制样本的上下文值。
在计算所选二进制样本的上下文中,获取在比特平面上已编码的样本的有效位,该比特平面位于在所选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上;用整数表示在多个频率线中有多少个频率线具有有效位的比率,将该比率与预定的整数值相乘;然后,通过使用该整数计算二进制样本的上下文值。
根据本发明的另一个方面,提供的无损音频编码方法包括:定标在具有整数值中被用作有损编码器输入信号的音频频谱信号;有损压缩编码被定标的频率信号;获取对应被有损编码的数据差值的差错映射信号,以及在具有整数的值频域中的音频频谱信号;通过使用已获取的上下文无损编码差错映射信号,其中根据关于差错映射信号所属的频率线附近的多个频率线中的每一个的已编码比特平面的有效位获取该上下文;通过复用无损编码信号和有损编码信号产生比特流。
差错映射信号的无损解码包括:将差错映射信号映射到与频率相关的比特平面信号;获取比特平面的最高有效位和Golomb参数;按照从最高有效位到最低有效位和从低频分量到高频分量的次序选择比特平面上的二进制样本进行编码;通过使用已编码比特平面的有效位计算所选二进制样本的上下文,该比特平面与所选二进制样本所属的频率线附近的多个频率线中的每一个相关;通过使用获取的Golomb参数和已计算的上下文选择二进制样本的概率模型;通过使用所选的概率模型无损编码二进制样本的二进制样本。
在计算所选二进制样本的上下文中,获取在比特平面上已编码的样本的有效位,该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,通过二进制化该有效位,计算二进制样本的上下文值。
在计算所选二进制样本的上下文中,获取在比特平面上已编码的样本的有效位,该比特平面位于在所选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上;用整数表示在多个频率线中有多少个频率线具有有效位的比率,将该比率与预定的整数值相乘;然后,通过使用该整数计算二进制样本的上下文值。
根据本发明的另一个方面,提供的无损音频编码装置包括:比特平面映射单元,将具有整数值的频域中的音频频谱信号映射为与频率相关的比特平面信号;参数获取单元,获取各个比特平面的最高有效位和Golomb参数;二进制样本选择单元,按照从最高有效位到最低有效位和从低频分量到高频分量的次序选择将被编码的比特平面上的二进制样本;上下文计算单元,通过使用已编码比特平面的有效位计算所选二进制样本的上下文,该比特平面与所选二进制样本所属的频率线附近的多个频率线中的每一个相关;概率模型选择单元,通过使用获取的Golomb参数和计算的上下文选择二进制样本的概率模型;和二进制样本编码单元,通过使用所选的概率模型无损编码二进制样本。整数时间/频率变换单元可以是整数修正余弦变换(MDCT)单元。
根据本发明的另一个方面,提供的无损音频编码装置包括:定标单元,定标在具有整数值的频域中被作为有损编码器的输入信号的音频频谱信号;有损编码单元,对被定标的频率信号进行有损压缩编码;差错映射单元,获取被有损编码的信号的差值和整数时间/频率变换单元的信号;无损编码单元,通过使用已获取的上下文无损编码差错映射信号,其中根据已编码的比特平面的有效位获取该上下文,该比特平面与所选二进制样本所属的频率线附近的多个频率线中的每一个相关;复用器,通过复用无损编码信号和有损编码信号产生比特流。
无损解码单元包括:比特平面映射单元,将差错映射单元的差错映射信号映射为与频率相关的比特平面数据;参数获取单元,获取比特平面的最高有效位和Golomb参数;二进制样本选择单元,按照从最高有效位到最低有效位和从低频分量到高频分量的次序选择将被编码的比特平面上的二进制样本;上下文计算单元,通过使用已编码的比特平面的有效位计算所选二进制样本的上下文,该比特平面与所选二进制样本所属的频率线附近的多个频率线中的每一个相关;概率模型选择单元,通过使用获取的Golomb参数和计算的上下文选择二进制样本的概率模型;和二进制样本编码单元,通过使用所选的概率模型无损编码二进制样本。
根据本发明的又一个方面,提供的无损音频解码方法包括:从音频数据的比特流获取Golomb参数;按照从最高有效位到最低有效位和从低频分量到高频分量的次序选择二进制样本解码;通过使用已解码的比特平面的有效位计算被解码的二进制样本的上下文,该比特平面关于被解码的二进制样本所属的频率线附近的多个频率线中的每一个;通过使用Golomb参数和上下文选择二进制样本的概率模型;通过使用所选的概率模型执行算术解码;重复执行从选择将被解码的二进制样本到算术解码之间的操作,直到所有的样本被解码。
计算上下文包括:通过使用比特平面的已解码样本的有效位计算第一上下文,该比特平面位于被解码的样本所属的频率线附近的多个频率线中的每个相同的频率线;和通过使用比特平面上的已解码样本的有效位计算第二上下文,该比特平面位于被解码的样本所属的频率线之前的多个频率线中的每个相同的频率线。
根据本发明的又一个方面,提供一种无损音频解码方法,其中有损编码数据与在频域中具有整数值的音频频谱信号之间的差值被称为差错数据,该方法包括:通过去复用音频比特流,抽取以预定方法有损编码的有损比特流和差错数据的差错比特流;以预定方法对抽取的有损比特流进行有损解码;通过使用根据已解码的比特平面样本的有效位的上下文无损解码被抽取的差错比特流,该比特平面位于将被解码的样本所属的频率线附近的多个频率线中的每个相同的线中;通过使用被解码的有损比特流和差错比特流恢复频谱信号;和通过逆向整数时间/频率变换频谱信号恢复时域中的音频信号。
对抽取的差错比特流的无损解码包括:从音频数据的比特流获取Golomb参数;按照从最高有效位到最低有效位和从低频分量到高频分量的次序选择二进制样本解码;通过使用已被编码的比特平面的有效位计算所选二进制样本的上下文,该比特平面与已选二进制样本所属的频率线附近的多个频率线中的每一个相关;通过使用Golomb参数和上下文选择概率模型;通过使用所选的概率模型执行算术解码;重复执行从选择二进制样本到执行算术解码之间的操作,直到所有的样本被解码。
计算上下文包括:通过使用已解码的比特平面上的样本的有效位计算第一上下文,该比特平面在将被解码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;通过使用已解码的比特平面上的样本的有效位计算第二上下文,该比特平面在将被解码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
根据本发明的另一个方面,提供的一种无损音频解码装置包括:参数获取单元,从音频数据的比特流获取Golomb参数;样本选择单元,按照从最高有效位到最低有效位和从低频分量到高频分量的次序选择二进制样本解码;上下文计算单元,通过使用已被解码的比特平面的有效位计算将被解码的二进制样本的上下文,该比特平面关于将被解码的二进制样本所属的频率线附近的多个频率线中的每一个;概率模型选择单元,通过使用Golomb参数和上下文选择概率模型;和算术解码单元,通过使用所选的概率模型来执行算术解码。
上下文计算单元包括:第一上下文计算单元,通过获取已解码的比特平面上的样本的有效位以及二进制化该有效位来计算第一上下文,该比特平面在将被解码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;和第二上下文计算单元,通过获取已解码的比特平面上的样本的有效位,用整数描述在多个频率线中有多少个频率线具有有效位的比率,通过将该比率与预定整数值相乘,然后,使用该整数计算第二上下文,其中该比特平面在将被解码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
根据本发明的又一个方面,提供一种无损音频解码装置,其中有损编码数据与在频域中具有整数值的音频频谱信号之间的差值被称为差错数据,该装置包括:去复用单元,通过去复用音频比特流,抽取以预定方法有损编码的有损比特流和差错数据的差错比特流;有损解码单元,用预定方法对抽取的有损比特流进行有损解码;无损解码单元,通过使用根据已被解码的比特平面上样本的有效位的上下文无损解码被抽取的差错比特流,其中该比特平面在将被解码的二进制样本所属的频率线附近的多个频率线中的每个相同的频率线;和音频信号合成单元,通过合成被解码的有损比特流和差错比特流来恢复频谱信号;逆向整数时间/频率变换单元,通过逆向整数/频率变换频谱信号恢复时域中的音频信号。该有损解码单元可以是ACC解码单元。该装置进一步包括:逆向时间/频率变换单元,根据由有损解码单元所解码的频域中的音频信号恢复时域音频信号。
无损解码单元可以包括:参数获取单元,从音频数据的比特流获取Golomb参数;样本选择单元,按照从最高有效位到最低有效位和从低频分量到高频分量的次序选择二进制样本解码;上下文计算单元,通过使用已编码比特平面的有效位计算所选二进制样本的上下文,该比特平面关于已选的二进制样本所属的频率线附近的多个频率线中的每一个;概率模型选择单元,通过使用Golomb参数和上下文选择概率模型;和算术解码单元,通过使用所选的概率模型执行算术解码。
上下文计算单元可以包括:第一上下文计算单元,通过获取已编码比特平面上的样本的有效位以及二进制化该有效位计算第一上下文,其中该比特平面在已选的二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上;和第二上下文计算单元,获取已编码比特平面上的样本的有效位,该比特平面在已选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上,用整数描述在多个频率线中有多少个频率线具有有效位的比率,通过将该比率与预定整数值相乘,然后,通过使用该整数来计算第二上下文。
附图说明
本发明上述和其他的特点和优势将通过参照附图详细描述示范性实施例变得更加清楚,其中:
图1是根据本发明的无损音频编码装置的优选实施例的结构框图;
图2是图1的无损编码单元的结构框图;
图3是根据本发明的无损音频编码装置的另一个优选实施例的结构框图;
图4是图3的无损编码单元的结构框图;
图5是由图1中描述的无损音频编码装置所执行的操作的流程图;
图6是由图1中描述的无损编码单元所执行的操作的流程图;
图7是由图3中描述的无损音频编码装置所执行的操作的流程图;
图8描述在上下文计算单元中的全局上下文的框图;
图9是显示当上下文计算单元计算全局上下文时出现1的概率的图表;
图10是显示在上下文计算单元中的局部上下文的图表;
图11是显示当上下文计算单元计算局部上下文时出现1的概率的图表;
图12是显示根据本发明优选实施例的完整上下文模式的框图;
图13是显示根据本发明优选实施例的部分上下文模式的框图;
图14是显示根据本发明的用于基于上下文编码的伪码的示范类型;
图15是根据本发明的无损音频解码装置优选实施例的结构框图;
图16是图15所示的上下文计算单元的结构框图;
图17是根据本发明的无损音频解码装置的另一个优选实施例的结构框图;
图18是图17的无损解码单元的结构框图;
图19是由图15所示的无损音频解码装置所执行的操作的流程图;和
图20是由图17所示的无损音频解码装置所执行的操作的流程图。
具体实施方式
现在参照附图更详细地描述根据本发明的无损音频编码/解码方法和装置,其中附图中显示本发明的示范性实施例。
在音频编码中,为了提供精细粒度可伸缩性(FGS)和无损编码,使用整数修正离散余弦变换(MDCT)。尤其,众所周知如果音频信号的输入样本分布符合拉普拉斯分布,比特平面Golomb编码(BPGC)方法显示最佳压缩结果,这提供了相当于Golomb代码的结果。可以通过下面的等式获得Golomb参数:
For(L=0;(N<<L+1))<=A;L++);
根据该等式,可以获得Golomb参数L,由于Golomb代码的特征,在小于L的比特平面上出现0或1的概率等于1/2。在拉普拉斯分布的情况中这个结果是最佳的,但是如果该分布不是拉普拉斯分布,则不能提供最佳压缩比。因此,本发明的基本思想是通过在不符合拉普拉斯分布的数据分布的统计分析中使用上下文来提供最佳压缩比。
图1是根据本发明的无损音频编码装置优选实施例的结构框图。无损音频编码装置包括整数时间/频率变换单元100和无损编码单元120。整数时间/频率变换单元100将时域中的音频信号变换为在频域中具有整数值的音频频谱信号,优选地,使用整数MDCT。无损编码单元120将频域中的音频信号映射为与频率相关的比特平面数据,使用预定的上下文无损编码形成二进制样本的比特平面。无损编码单元120包括比特平面映射单元200、参数获取单元210、二进制样本选择单元220、上下文计算单元230、概率模型选择单元240和二进制样本编码单元250。
比特平面映射单元200将频域中的音频信号映射为与频率相关的比特平面数据。图8和10举例说明被映射为与频率相关的比特平面数据的音频信号的实例。
参数获取单元210获取比特平面的最高有效位(MSB)和Golomb参数。二进制样本选择单元220按照从MSB到最低有效位(LSB)和从低频分量到高频分量的顺序选择将被编码的在比特平面上的二进制样本。
上下文计算单元230通过使用已编码的比特平面的有效位计算所选二进制样本的上下文,该比特平面与所选二进制样本所属的频率线附近的多个频率线中的每一个相关。概率模型选择单元240通过使用获得的Golomb参数和计算的上下文选择概率模型。二进制样本编码单元250通过使用已选择的概率模型无损编码二进制样本。
在图2中,使用基于上下文的无损编码来编码所有二进制样本。然而,在另一个实施例中,因为复杂性的原因,使用基于上下文的无损编码来编码在比特平面上的一些二进制样本,而使用位-压缩来编码在比特平面上的另外一些二进制样本。由于在Golomb参数下的二进制样本是‘1’的概率是1/2,所以Golomb参数被用来确定在比特平面上将使用位压缩来编码二进制样本。
图3是根据本发明的无损音频编码装置的另一个优选实施例的结构框图。该装置包括整数时间/频率变换单元300、定标单元310、有损编码单元320、差错映射单元330、无损编码单元340和多路复用器350。
整数时间/频率变换单元300将时域音频信号变换为具有整数值的频域的音频频谱信号,最好使用整数MDCT。定标单元310伸缩整数时间/频率变换单元300中将被用作有损编码单元320输入信号的音频频率信号。由于整数时间/频率变换单元300的输出信号被描绘成整数,其不能直接用于有损编码单元320的输入。因此,在定标单元中伸缩(scale)整数时间/频率变换单元300的音频频率信号,使其可以被用作有损编码单元320的输入信号。
有损编码单元320有损编码被伸缩的频率信号,优选地,使用AAC核心编码器。差错映射单元330获取对应有损编码的信号与整数时间/频率变换单元300的信号差值的差错映射信号。无损编码单元340通过使用上下文无损编码差错映射信号。多路复用器350复用无损编码单元340的无损编码信号和有损编码单元320的有损编码信号,产生比特流。
图4是无损编码单元340的结构框图,它包括比特平面映射单元400、参数获取单元410、二进制样本选择单元420、上下文计算单元430、概率模型选择单元440和二进制样本编码单元450。
比特平面映射单元400将差错映射单元330的差错映射信号映射为与频率有关的比特平面数据。参数获取单元410获取比特平面的MSB和Golomb参数。二进制样本选择单元420按照从MSB到LSB和从低频分量到高频分量的顺序选择将被编码的比特平面上的二进制样本。上下文计算单元430通过使用已编码比特平面的有效位计算所选二进制样本的上下文,该比特平面与所选二进制样本所属的频率线附近的多个频率线中的每一个相关。概率模型选择单元440通过使用获得的Golomb参数和计算的上下文选择概率模型。二进制样本编码单元450通过使用已选择的概率模型无损编码二进制样本。
在图4中,使用基于上下文的无损编码来编码所有二进制样本。然而,在另一个实施例中,为了降低复杂性,使用基于上下文的无损编码来编码在比特平面上的一些二进制样本,而使用位压缩来编码在比特平面上的另外一些二进制样本。由于在Golomb参数下的二进制样本是‘1’的概率是1/2,所以Golomb参数被用来确定在比特平面上将使用位-压缩编码的二进制样本。现在说明在图2和图4所示的上下文计算单元230和430中对二进制样本上下文值的计算。如果相对于当前时间在相同频率线上的比特平面来讲的编码的先前样本中,一个频谱部分至少一次被编码为1,那么在本发明实施例中所使用的有效位被定义为1,如果没有频谱部分被编码为1,那么定义该有效位是0。
同样,上下文计算单元230和430可以使用例如全局上下文计算来计算二进制样本的上下文。全局上下文计算考虑到整个频谱的分布,利用频谱包络形状在频率轴上不会突然改变这样的事实,达到与先前的包络形状相似的样子。在全局上下文计算中,将所选二进制样本的频率线作为基础,上下文计算单元230和430通过使用在比特平面中的已编码的预定样本获取有效位为‘1’的概率值,该比特平面在所选二进制样本的频率线之前的每个频率线上。然后,上下文计算单元230和420用预定整数值乘概率值以便用整数来表示概率值,并通过使用该整数计算二进制样本的上下文值。
同样,上下文计算单元230和430可以使用局部上下文计算来计算二进制样本的上下文。局部上下文计算使用临近的二进制样本的相关性和有效位作为全局上下文计算。二进制化样本的有效位,该样本在位于当前将被编码的二进制样本的相同频率上的每个预定的N比特流上,之后再次变换为十进制数,然后计算上下文。在局部上下文计算中,将所选二进制样本的频率线作为基础,上下文计算单元230和430通过使用在多个比特平面中的预定样本来获取各个有效位,其中所述多个比特平面位于在所选二进制样本频率之前和之后的预定范围中所存在的每个频率线上,并通过将有效位变换为标量值来计算二进制样本的上下文值。在这个计算中使用的值N小于在全局上下文计算中使用的值M。
图5是由图1所示的无损音频编码装置所执行的操作骤的流程图。首先,对应时域中音频信号的PCM信号被输入到整数时间/频率变换单元100,在操作500中将其转换为在具有整数值的频域音频频谱信号。在此,优选地使用整数MDCT。然后,如图8和10所示,在操作520中,将频域音频信号映射为与频率相关的比特平面信号。然后,在操作540中,通过使用由预定的上下文确定的概率模型无损编码形成比特平面的二进制样本。
图6是由图1所示的无损编码单元120所执行的操作的流程图。
首先,如果频域的音频信号被输入到比特平面映射单元200,那么在操作600中,将频域的音频信号映射为与频率相关的比特平面数据。同样,在操作610中,通过Golomb参数获取单元210获取在各个比特平面的MSB和Golomb参数。然后,在操作620中,通过二进制样本选择单元220,按照从MSB到LSB和从低频分量到高频分量的顺序选择将被编码的在比特平面上的二进制样本。关于所选的二进制样本,在操作630通过使用已编码比特平面的有效位计算由比特样本选择单元220选择的二进制样本的上下文,其中比特平面与已选二进制样本所属的频率线附近的多个频率线中的每一个相关。在操作640通过使用在Golomb参数获取单元210获得的Golomb参数和在上下文计算单元230计算的上下文选择概率模型。在操作650通过使用在概率模型选择单元240选择的概率模型无损编码二进制样本。
在图6,使用基于上下文的无损编码来编码所有二进制样本。然而,在另一个实施例中,为了复杂性降低,使用基于上下文的无损编码来编码在比特平面上的一些二进制样本,而使用位-压缩来编码比特平面上的其他二进制样本。因为在Golomb参数下的二进制样本是‘1’的概率是1/2,Golomb参数被用来确定比特平面上将使用位-压缩编码二进制样本。
图7是由图3所示的无损音频编码装置所执行的操作的流程图,参照图7,现在说明无损音频编码装置的另一个优选实施例的操作。首先,在操作710通过整数时间/频率变换单元300将时域音频信号转换为在频域中具有整数值的音频频谱信号。
然后,在操作720,定标单元310定标将用于有损编码单元320输入信号的频域音频频谱信号。在操作730,有损压缩编码单元320有损压缩编码在定标单元310中定标的频率信号。优选地,通过AAC核心编码器执行有损压缩编码。
在操作740,差错映射单元330获取对应在有损编码单元320中被有损编码的数据与在频域中具有整数值的音频频谱信号的差值的差错映射信号。在操作750通过使用在无损编码单元340中的上下文无损编码差错映射信号。
在操作760,复用器350中复用在无损编码单元340被无损编码的信号和在有损编码单元320被有损编码的信号,并生成比特流。在操作750的无损编码中,差错映射信号被映射到与频率相关的比特平面。然后,获得MSB和Golomb参数的处理与参照图6所描述的内容相同,在这省略。
通常,由于MDCT的频谱遗漏,在频率轴上的邻近样本具有相关性。也就是,如果相邻样本的值是X,那么当前样本的值很有可能在X附近。因此,如果在X附近的相邻样本被选择为上下文,可以通过使用相关性改进压缩比。
同样,通过统计分析可知比特平面的值与低位样本(lower order sample)的概率分布具有较高相关性。因此,如果在X附近的相邻样本被选择为上下文,可以通过使用相关性改进压缩比。
现在解释计算上下文的方法。
图8是通过在上下文计算单元中使用全局上下文来获得上下文的框图。通过使用虚线所指示的部分,从已编码的样本中获得当前样本的概率分布。图9是显示当上下文计算单元使用全局上下文计算上下文时出现1的概率的图表。
参照图8,假设在网格线所指示的方框中的符号将被编码。在图8中,全局上下文表示为虚线部分。参照图9,其他两种类型的上下文被定为Golomb上下文(Context1)=1,以及局部上下文(Context2)=0。该图显示在使用BPGC的上下文计算中,出现1的概率保持在恒定水平,同时在使用全局上下文的上下文计算中,出现1的概率随着上下文指数(context index)的增高而显著增加。
图10是通过在上下文计算单元中使用局部上下文来获得上下文的框图。图11是显示当上下文计算单元使用局部上下文计算上下文时出现1的概率的图表。
参照图10,在局部上下文计算中,在三个邻近频率线上获得有效位。位组合被映射为从0到7的范围内的值(也就是,二进制数000,001,010,011,100,110,111)以计算符号概率。在局部上下文计算中,通过使用三个由虚线指示的部分,如图10所示,根据已编码的样本计算当前样本的概率分布。这里,在当前编码中出现1的概率在如上所示的从0到7的范围中,并由位组合,例如[0,1,1],的三个值确定。图11显示当其他两个上下文被定为Golomb上下文(Context1)=1和全局上下文(Context2)=4时,使用局部上下文计算上下文时出现1的概率。这里,该图显示当使用BPGC时,将出现1的概率固定在恒定水平。同时,当通过全局上下文计算上下文时,在前半部分出现1的概率比BPGC的高,而在后半部分比BPGC的低。
在实际的编码实例中,如果在用于计算全局上下文的10个邻近的将被编码的样本中,五个样本具有有效位1,那么概率是0.5,以及如果由值8来定标,它变成值4。因此,全局上下文是4。同时,之前和之后的两个样本的有效位被检查以便计算局部上下文,如果第(i-2)个样本是1、第(i-1)个样本是0、第(i+1)个样本是0并且第(i+2)个样本是1,则二进制的结果是1001,并且其十进制的表示是9。如果当前将被编码的数据的Golomb参数是4,则Golomb参数(Context1)=4、全局上下文(Context2)=4以及局部上下文(Context3)=9。通过使用Golomb参数、全局参数和局部参数选择概率模型。该概率模型相对于实施而改变,以及在它们中间,通过使用三维矩阵,一个实施方式被描述如下:
Prob[Golomb][Context1][Context2]
使用如此获取的概率模型,执行无损编码。作为典型的无损编码方式,使用算术编码方式。
通过本发明,全部的压缩与没有使用上下文的现有方法比改善了0.8%。
图12是显示根据本发明优选实施例的完整上下文模式的图表。图13是显示根据本发明优选实施例的部分上下文模式的图表。
参照图12,通过使用基于上下文的算术编码来编码所有二进制样本。然而,参照图13,在另一个实施例中,考虑到复杂性,使用基于上下文的算术编码来编码在比特平面上的一些二进制样本,而使用位-压缩来编码比特平面上的其他二进制样本。也就是,为那些二进制样本分配概率1/2。
图14显示用于关于本发明实施例的基于上下文编码的伪码。
现在解释根据本发明的无损音频解码装置和方法。
图15是根据本发明的无损音频解码装置的优选实施例的结构框图。该装置包括参数获取单元1500、样本选择单元1510、上下文计算单元1520、概率模型选择单元1530和算术解码单元1540。
当输入音频数据的比特流时,参数获取单元1500从比特流中获取MSB和Golomb参数。样本选择单元1510按照从MSB到LSB和从低频到高频的顺序选择将被解码的二进制样本。
上下文计算单元1520通过使用已解码的样本来计算预定上下文,如图16所示,上下文计算单元1520由第一上下文计算单元1600和第二上下文计算单元1620组合。第一上下文计算单元1600获取在已编码比特平面上的样本的有效位,二进制化该有效位,并计算第一上下文,其中该比特平面在所选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上。第二上下文计算单元1620获取在已编码比特平面上的样本的有效位,该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上;通过将比率与预定整数值相乘来用整数表示在多个频率线中有多少个频率线具有有效位的比率;然后,通过使用该整数计算第二上下文。
概率模型选择单元1530通过使用参数获取单元1500的Golomb参数和在上下文计算单元1520中计算的上下文来选择概率模型。算术解码单元1540通过使用在概率模型选择单元1530中所选的概率模型来执行算术解码。
在图15中,使用基于上下文的无损解码来解码所有二进制样本。然而,在另一个实施例中,为了降低复杂性,使用基于上下文的无损解码来解码在比特平面上的一些二进制样本,而使用位压缩解码在比特平面上的另外一些二进制样本。由于在Golomb参数下的二进制样本是‘1’的概率是1/2,所以Golomb参数被用来确定在比特平面上将使用位压缩解码的二进制样本。
图17是根据本发明的无损音频解码装置的另一个优选实施例的结构框图。该装置包括去复用单元1700、有损解码单元1710、无损解码单元1720、音频信号合成单元1730和逆向整数时间/频率变换单元1740,优选地,更进一步包括逆向时间/频率变换单元1750。
当输入音频比特流时,去复用单元1700去复用音频比特流,并抽取当编码比特流时使用的预定有损编码方法形成的有损比特流和差错数据的差错比特流。
有损解码单元1710有损解码在去复用单元1700中抽取的有损比特流,通过与当编码比特流时使用的预定有损编码方法相对应的预定有损解码方法。无损解码单元1720同样通过与无损编码对应的无损解码方法无损解码在去复用单元1700中抽取的差错比特流。
音频信号合成单元1730合成被解码的有损比特流和差错比特流,并恢复频谱信号。逆向整数时间/频率转换单元1740逆向整数时间/频率变换在音频信号合成单元1730中恢复的频谱信号,并恢复时域音频信号。
然后,逆向时间/频率变换单元1750将在有损解码单元1710中被解码的频域的音频信号恢复到时域音频信号,因此被恢复的信号是被有损解码的信号。
图18是图17的无损解码单元1720的结构框图,它包括参数获取单元1800、样本选择单元1810、上下文计算单元1820、概率模型选择单元1830和算术解码单元1840。
参数获取单元1800从音频数据的比特流中获取MSB和Golomb参数。样本选择单元1810按照从MSB到LSB和从低频到高频的顺序选择将被解码的二进制样本。
上下文计算单元1820通过使用已解码的样本计算预定的上下文,上下文计算单元1820包括第一上下文计算单元和第二上下文计算单元。第一上下文计算单元1600获取在已编码比特平面上的样本的有效位,二进制化该有效位,并计算第一上下文,其中该比特平面在所选二进制样本所属的频率线之前的多个频率线中每个相同的频率线上。第二上下文计算单元1620获取在已编码比特平面上的样本的有效位,该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上;通过将比率与预定整数值相乘以便用整数表示在多个频率线中有多少个频率线具有有效位的比率;然后,通过使用该整数计算第二上下文。
概率模型选择单元1830通过使用Golomb参数和上下文选择概率模型。算术解码单元1840使用所选的概率模型执行算术解码。
在图18中,使用基于上下文的无损解码来解码所有二进制样本。然而,在另一个实施例中,为了降低复杂性,通过使用基于上下文的无损解码来解码在比特平面上的一些二进制样本,而使用位-压缩解码在比特平面上的另外一些二进制样本。由于在Golomb参数下的二进制样本是‘1’的概率是1/2,所以Golomb参数被用来确定在比特平面上将使用位-压缩解码的二进制样本。
图19是由图15所示的无损音频解码装置所执行的操作的流程图。
首先,音频数据的比特流被输入到参数获取单元1500,在操作1900从音频数据的比特流中获取Golomb参数。然后,在操作1910,样本选择单元1510选择将按照从MSB到LSB和从低频到高频的顺序解码的二进制样本。
如果在样本选择单元1510中选择将被解码的样本,在操作1920,上下文计算单元1520通过使用已解码的样本计算预定的上下文。这里,上下文包括第一上下文和第二上下文,如图16所示,第一上下文计算单元1600获取在已编码比特平面上的样本的有效位,二进制化该有效位,并计算第一上下文,其中该比特平面在所选二进制样本所属的频率线之前的多个频率线中每个相同的频率线上。然后,第二上下文计算单元1620获取在已编码比特平面上的样本的有效位,该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上;通过将比率与预定整数值相乘以便用整数表示在多个频率线中有多少个频率线具有有效位的比率;然后,通过使用该整数计算第二上下文。
然后,在操作1930,概率模型选择单元1530通过使用Golomb参数与第一和第二上下文来选择概率模型。如果概率模型选择单元1530选择了概率模型,在操作1940通过使用所选的概率模型执行算术解码。操作1910至1940被重复执行直到所有样本在操作1950中被解码。
在图19中,使用基于上下文的无损解码来解码所有二进制样本。然而,在另一个实施例中,为了降低复杂性,使用基于上下文的无损解码来解码在比特平面上的一些二进制样本,而使用位-压缩解码在比特平面上的另外一些二进制样本。由于在Golomb参数下的二进制样本是‘1’的概率是1/2,所以Golomb参数被用来确定在比特平面上将使用位-压缩解码的二进制样本。
图20是由图17所示的无损音频解码装置所执行的操作的流程图。
在有损编码的数据与在频域中具有整数值的音频频谱信号之间的差值被定义为差错数据。首先,如果音频比特流被输入到去复用单元1700,去复用比特流,在操作2000抽取通过预定有损编码生成的有损比特流和差错数据的差错比特流。
将被抽取的有损比特流输入到有损解码单元1710,在操作2010,用与编码数据时使用的有损编码方法相对应的预定有损解码方法来有损解码输入的有损比特流。同样,被抽取的差错比特流输入到无损解码单元1720,并在操作2020中被无损解码。在操作2020中更详细的无损解码处理与在图19所示的相同。
在操作2030,在有损解码单元1710中被有损解码的有损比特流和在无损解码单元1720中被无损解码的差错比特流被输入到信号合成单元1730,并且被恢复为频谱信号。在操作2040,频谱信号被输入到逆向整数时间/频率变换单元1740,并被恢复为时域音频信号。
本发明也可以具体化为在计算机可读记录媒介上的计算机可读代码。计算机可读记录媒介是可以存储能被计算机系统在后读出数据的任何数据存储装置。计算机可读记录媒介的实例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备。
尽管已经参考本发明的示范性实施例特别显示并描述了本发明,但本领域的技术人员理解可以不脱离由以下权利要求所定义的精神和范围便实现在形式和细节上的各种变换。优选实施例应该被理解为了描述而不是为了限制的目的。因此,本发明的范围不是通过本发明的详细描述来定义,而是通过附加的权利要求定义,在范围内的所有不同也解释为包括在本发明中。
在根据本发明的无损音频编码/解码方式和装置中,通过基于使用全局上下文和局部上下文的统计分布的模式提供一个最佳的性能,而不考虑当执行无损音频编码和/或解码时的输入分布。同样,不考虑整数MDCT系数显示拉普拉斯分布的假设,提供一个最佳压缩比,以及通过基于上下文的编码方法提供优于BPGC压缩比的压缩比。

Claims (52)

1.一种无损音频编码方法,包括:
将在频域中具有整数值的音频频谱信号映射为与频率相关的比特平面信号;
获取各个比特平面的最高有效位和Golomb参数;
按照从最高有效位到最低有效位和从低频分量到高频分量的顺序选择将被编码的在比特平面上的二进制样本;
通过使用已编码的比特平面的有效位计算所选二进制样本的上下文,该比特平面与所选二进制样本所属的频率线附近的多个频率线中的每一个相关;
通过使用获取的Golomb参数和被计算的上下文选择二进制样本的概率模型;和
通过使用所选的概率模型无损编码二进制样本。
2.如权利要求1的方法,其中在有效位中,如果在已编码的比特平面中至少存在一个‘1’,则有效位是‘1’,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,如果不存在‘1’,则有效位是‘0’。
3.如权利要求1的方法,其中在计算所选二进制样本的上下文中,获取在已编码比特平面上的样本的有效位,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中每个相同的频率线上,并且通过二进制化该有效位,计算二进制样本的上下文值。
4.如权利要求1的方法,其中在计算所选二进制样本的上下文中,获取在已编码比特平面上的样本的有效位,该比特平面在所选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上;用整数表示在多个频率线中有多少个频率线具有有效位的比率,通过将该比率与预定整数值相乘;然后,通过使用该整数计算二进制样本的上下文值。
5.如权利要求1的方法,其中计算所选二进制样本的上下文包括:
通过使用已编码比特平面上的样本的有效位计算第一上下文,该比特平面在将被编码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;和
通过使用已编码比特平面上的样本的有效位计算第二上下文,该比特平面在将被编码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
6.如权利要求1的方法,用概率0.5编码在比特平面上的一些二进制样本。
7.如权利要求1的方法,更进一步包括将在时域音频信号变换为在频域中具有整数值的音频频谱信号。
8.一种无损音频编码方法,包括:
定标在频域中具有整数值的将作为有损编码器输入信号的音频频谱信号;
有损压缩编码被定标的频率信号;
获取对应被有损编码的信号与在频域中具有整数值的音频频谱信号之间的差值的差错映射信号;
通过使用根据已编码比特平面的有效位获取的上下文来无损编码差错映巧射信号,该比特平面与在差错映射信号所属的频率线附近的多个频率线中的每一个相关;和
通过复用无损编码信号和有损编码信号产生比特流,
其中差错映射信号的无损编码包括:
将差错映射信号映射为与频率相关的比特平面信号;
获取比特平面的最高有效位和Golomb参数;
按照从最高有效位到最低有效位和从低频分量到高频分量的顺序选择将被编码的在比特平面上的二进制样本;
通过使用已编码比特平面的有效位,来计算所选二进制样本的上下文,该比特平面与在所选二进制样本所属的频率线附近的多个频率线中的每一个相关;
通过使用获取的Golomb参数和计算的上下文选择二进制样本的概率模型;和
通过使用所选的概率模型无损编码二进制样本。
9.如权利要求8的方法,其中在有效位中,如果在已编码比特平面中至少存在一个‘1’,那么有效位是‘1’,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,如果不存在‘1’,则有效位是‘0’。
10.如权利要求8的方法,其中在计算所选二进制样本的上下文中,获取在已编码比特平面上的样本的有效位,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中每个相同的频率线上,并且通过二进制化该有效位,计算二进制样本的上下文值。
11.如权利要求8的方法,其中在计算所选二进制样本的上下文中,获取在已编码比特平面上的样本的有效位,该比特平面在所选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上;用整数表示在多个频率线中有多少个频率线具有有效位的比率,通过将该比率与预定整数值相乘;然后,通过使用该整数计算二进制样本的上下文值。
12.如权利要求8的方法,其中计算所选二进制样本的上下文包括:
通过使用已编码比特平面上的样本的有效位计算第一上下文,该比特平面在将被编码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;和
通过使用已编码比特平面上的样本的有效位计算第二上下文,该比特平面在将被编码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
13.如权利要求8的方法,用概率0.5编码在比特平面上的一些二进制样本。
14.如权利要求8的方法,更进一步包括将在时域音频信号变换为在频域中具有整数值的音频频谱信号。
15.一种无损音频编码装置,包括:
比特平面映射单元,将在频域中具有整数值的音频信号映射为与频率相关的比特平面信号;
参数获取单元,获取各个比特平面的最高有效位和Golomb参数;
二进制样本选择单元,按照从最高有效位到最低有效位和从低频分量到高频分量的顺序选择将被编码的在比特平面上的二进制样本;
上下文计算单元,通过使用已编码的比特平面的有效位计算所选二进制样本的上下文,该比特平面与所选二进制样本所属的频率线附近的多个频率线中的每一个相关;
概率模型选择单元,通过使用获取的Golomb参数和被计算的上下文选择二进制样本的概率模型;和
二进制样本编码单元,通过使用所选的概率模型无损编码二进制样本。
16.如权利要求15的装置,其中在有效位中,如果在已编码的比特平面中至少存在一个‘1’,则有效位是‘1’,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,如果不存在‘1’,则有效位是‘0’。
17.如权利要求15的装置,其中上下文计算单元包括:
第一上下文计算单元,通过获取已编码的比特平面上的样本的有效位以及二进制化有效位来计算第一上下文,该比特平面在将被编码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;和
第二上下文计算单元,通过获取已编码的比特平面的样本的有效位.将比率与预定的整数值相乘以便用整数表示在多个频率线中有多少个频率线具有有效位的比率然后使用该整数来计算第二上下文值,其中该比特平面在将被编码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
18.如权利要求15的装置,更进一步包括整数/频率变换单元,将时域音频信号变换为在频域中具有整数值的音频频谱信号。
19.如权利要求18的装置,其中整数时间/频率变换单元是整数修正离散余弦变换(MDCT)单元。
20.如权利要求15的装置,用概率0.5编码在比特平面上的一些二进制样本。
21.一种无损音频编码装置,包括:
定标单元,定标在频域中具有整数值的将作为有损编码器输入信号的音频频谱信号;
有损编码单元,有损压缩编码被定标的频率信号;
差错映射单元,获取在被有损编码的信号与整数时间/频率变换单元的信号之间的差值;
无损编码单元,通过使用根据已编码比特平面的有效位获取的上下文来无损编码差错映射信号,该比特平面与在差错映射信号所属的频率线附近的多个频率线中的每一个相关;
复用器,通过复用无损编码信号和有损编码信号产生比特流,
其中无损解码单元包括:
比特平面映射单元,将差错映射单元的差错映射信号映射为与频率相关的比特平面信号;
参数获取单元,获取比特平面的最高有效位和Golomb参数;
二进制样本选择单元,按照从最高有效位到最低有效位和从低频分量到高频分量的顺序选择将被编码的在比特平面上的二进制样本;
上下文计算单元,通过使用已编码比特平面的有效位,来计算所选二进制样本的上下文,该比特平面与在所选二进制样本所属的频率线附近的多个频率线中的每一个相关;
概率模型选择单元,通过使用获取的Golomb参数和计算的上下文选择二进制样本的概率模型;和
二进制样本编码单元,通过使用所选的概率模型无损编码二进制样本。
22.如权利要求21的装置,其中在有效位中,如果在已编码比特平面中至少存在一个‘1’,那么有效位是‘1’,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,如果不存在‘1’,则有效位是‘0’。
23.如权利要求21的装置,其中上下文计算单元包括:
第一上下文计算单元,通过获取已编码的比特平面上的样本的有效位以及二进制化有效位来计算第一上下文,该比特平面在将被编码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;和
第二上下文计算单元,通过获取已编码的比特平面的样本的有效位、将比率与预定的整数值相乘以便用整数表示在多个频率线中有多少个频率线具有有效位的比率然后使用该整数来计算第二上下文值,其中该比特平面在将被编码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
24.如权利要求21的装置,用概率0.5编码在比特平面上的一些二进制样本。
25.如权利要求21的装置,更进一步包括整数时间/频率变换单元,将时域音频信号变换为在频域中具有整数值的音频频谱信号。
26.一种无损音频解码方法,包括:
从音频数据的比特流中获取Golomb参数;
按照从最高有效位到最低有效位和从低频到高频的顺序选择将被解码的二进制样本;
通过使用已解码的比特平面的有效位来计算将被解码的二进制样本的上下文,该比特平面与在将被解码的二进制样本所属的频率线附近的多个频率线中的每一个相关;
通过使用Golomb参数和上下文选择二进制样本的概率模型;
通过使用所选的概率模型执行算术解码;和
重复执行从选择将被解码的二进制样本到算术解码之间的操作,直到所有的样本被解码。
27.如权利要求26的方法,其中在有效位中,如果在已解码的比特平面中至少存在一个‘1’,则有效位是‘1’,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,如果不存在‘1’,则有效位是‘0’。
28.如权利要求26的方法,其中在计算所选二进制样本的上下文中,获取在已解码比特平面上的样本的有效位,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中每个相同的频率线上,并且通过二进制化巧该有效位,计算二进制样本的上下文值。
29.如权利要求26的方法,其中在计算所选二进制样本的上下文中,获取在已解码比特平面上的样本的有效位,该比特平面在所选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上;用整数表示在多个频率线中有多少个频率线具有有效位的比率,通过将该比率与预定整数值相乘;然后,通过使用该整数计算二进制样本的上下文值。
30.如权利要求26的方法,其中计算所选二进制样本的上下文包括:
通过使用已解码比特平面上的样本的有效位计算第一上下文,该比特平面在将被解码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;
通过使用已解码比特平面上的样本的有效位计算第二上下文,该比特平面在将被解码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
31.如权利要求26的方法,用概率0.5解码在比特平面上的一些二进制样本。
32.一种无损音频解码方法,其中有损编码的数据与在频域中具有整数值的音频频谱信号之间的差值被称为差错数据,该方法包括:
通过去复用音频比特流,抽取以预定方法有损解码的有损比特流和差错数据的差错比特流;
用预定方法有损解码被抽取的有损比特流;
通过使用基于已解码的比特平面的有效位的上下文,无损解码被抽取的差错比特流,该比特平面在将被解码的样本所属的频率线附近的多个频率线中的每个相同的线上;
通过使用被解码的有损比特流和差错比特流来恢复频谱信号;和
通过逆向整数时间/频率变换频谱信号来恢复时域音频信号,
其中对抽取的差错比特流进行无损解码包括:
从音频数据的比特流中获取Golomb参数;
按照从最高有效位到最低有效位和从低频到高频的顺序选择将被解码的二进制样本;
通过使用已编码比特平面的有效位计算所选二进制样本的上下文,该比特平面与在已选的二进制样本所属的频率线附近的多个频率线中的每一个相关;
通过使用Golomb参数和上下文选择二进制样本的概率模型;
通过使用所选的概率模型执行算术解码;和
重复执行从选择二进制样本到执行算术解码之间的操作,直到所有的样本被解码。
33.如权利要求32的方法,其中在有效位中,如果在已解码比特平面中至少存在一个‘1’,那么有效位是‘1’,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,如果不存在‘1’,则有效位是‘0’。
34.如权利要求32的方法,其中在计算所选二进制样本的上下文中,获取在已解码比特平面上的样本的有效位,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中每个相同的频率线上,并且通过二进制化该有效位,计算二进制样本的上下文值。
35.如权利要求32的方法,其中在计算所选二进制样本的上下文中,获取在已解码比特平面上的样本的有效位,该比特平面在所选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上;用整数表示在多个频率线中有多少个频率线具有有效位的比率,通过将该比率与预定整数值相乘;然后,通过使用该整数计算二进制样本的上下文值。
36.如权利要求32的方法,其中计算所选上下文包括:
通过使用已解码比特平面上的样本的有效位计算第一上下文,该比特平面在将被解码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;和
通过使用已解码比特平面上的样本的有效位计算第二上下文,该比特平面在将被解码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
37.如权利要求32的方法,用概率0.5解码在比特平面上的一些二进制样本。
38.如权利要求32的方法,更进一步包括通过逆向整数时间/频率变换频谱信号来恢复时域音频信号。
39.一种无损音频解码装置,包括:
参数获取单元,从音频数据的比特流中获取Golomb参数;
样本选择单元,按照从最高有效位到最低有效位和从低频到高频的顺序选择将被解码的二进制样本;
上下文计算单元,通过使用已解码的比特平面的有效位来计算将被解码的二进制样本的上下文,该比特平面与在将被解码的二进制样本所属的频率线附近的多个频率线中的每一个相关;
概率模型选择单元,通过使用Golomb参数和上下文来选择概率模型;和
算术解码单元,通过使用所选的概率模型执行算术解码。
40.如权利要求39的装置,其中在有效位中,如果在已解码的比特平面中至少存在一个‘1’,则有效位是‘1’,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,如果不存在‘1’,则有效位是‘0’。
41.如权利要求39的装置,其中上下文计算单元包括:
第一上下文计算单元,通过获取已解码的比特平面上的样本的有效位以及二进制化有效位来计算第一上下文,该比特平面在将被解码的样本所属的频率线附近的多个频率线中的每个相同的频率线上;和
第二上下文计算单元,通过获取已解码的比特平面的样本的有效位.将比率与预定的整数值相乘以便用整数表示在多个频率线中有多少个频率线具有有效位的比率然后使用该整数来计算第二上下文值,其中该比特平面在将被解码的样本所属的频率线之前的多个频率线中的每个相同的频率线上。
42.如权利要求39的装置,用概率0.5解码在比特平面上的一些二进制样本。
43.一种无损音频解码装置,其中有损编码数据与在频域中具有整数值的音频频谱信号之间的差值被称为差错数据,该装置包括:
去复用单元,通过去复用音频比特流,抽取以预定方法有损解码的有损比特流和差错数据的差错比特流;
有损解码单元,用预定方法有损解码被抽取的有损比特流;
无损解码单元,通过使用基于已解码的比特平面的有效位的上下文,无损解码被抽取的差错比特流,该比特平面在将被解码的样本所属的频率线附近的多个频率线中的每个相同的线上;和
音频信号合成单元,通过使用被解码的有损比特流和差错比特流来恢复频谱信号,
其中无损解码单元包括:
参数获取单元,从音频数据的比特流中获取Golomb参数;
样本选择单元,按照从最高有效位到最低有效位和从低频到高频的顺序选择将被解码的二进制样本;
上下文计算单元,通过使用已编码比特平面的有效位计算所选二进制样本的上下文,该比特平面与在已选的二进制样本所属的频率线附近的多个频率线中的每一个相关;
概率模型选择单元,通过使用Golomb参数和上下文选择二进制样本的概率模型;和
算术解码单元,通过使用所选的概率模型执行算术解码。
44.权利要求43的装置,更进一步包括:
逆向整数时间/频率变换单元,通过逆向整数时间/频率变换频谱信号来恢复时域音频信号。
45.权利要求43的装置,更进一步包括:
逆向时间/频率转换单元,根据由有损解码单元所解码的频域的音频信号来恢复时域音频信号。
46.如权利要求43的装置,其中在有效位中,如果在已解码比特平面中至少存在一个‘1’,那么有效位是‘1’,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上,如果不存在‘1’,则有效位是‘0’。
47.如权利要求43的装置,其中上下文计算单元包括:
第一上下文计算单元,获取已编码比特平面的样本的有效位,并且通过二进制化该有效位计算第一上下文,其中该比特平面在所选二进制样本所属的频率线附近的多个频率线中的每个相同的频率线上;和
第二上下文计算单元,获取已编码的比特平面的样本的有效位,其中该比特平面在所选二进制样本所属的频率线之前的多个频率线中的每个相同的频率线上,通过将比率与预定整数值相乘以便用整数表示在多个频率线中有多少个频率线具有有效位的比率,然后通过使用该整数来计算第二上下文。
48.如权利要求43的装置,用概率0.5解码在比特平面上的一些二进制样本。
49.一种无损音频解码方法,该方法包括:
从音频数据的比特流获得Golomb参数;
按照从最高有效位到最低有效位和从最低频分量到最高频分量的顺序选择将被解码的比特平面符号;
使用已解码的比特平面符号的有效位计算上下文,并且使用该上下文和Golomb参数选择比特平面符号的概率模型;以及
通过使用选择的概率模型执行算术解码。
50.如权利要求49的方法,其中,通过使用选择的概率模型执行算术解码,重复执行选择比特平面符号,计算上下文和算术解码的操作,直到所有比特平面符号被解码。
51.一种无损音频解码方法,该方法包括:
从音频数据的比特流获得Golomb参数;
按照从最高有效位到最低有效位的顺序选择将被解码的二进制样本;
使用已解码的二进制样本的有效位计算上下文,并且使用该上下文和Golomb参数选择二进制样本的概率模型;以及
通过使用选择的概率模型执行算术解码。
52.如权利要求51的方法,其中,重复执行选择二进制样本,计算上下文和算术解码的操作,直到所有二进制样本被解码。
CN2005100741885A 2004-03-10 2005-03-10 无损音频编码/解码方法和装置 Expired - Fee Related CN1681213B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US55135904P 2004-03-10 2004-03-10
US60/551,359 2004-03-10
KR50479/2004 2004-06-30
KR1020040050479A KR100561869B1 (ko) 2004-03-10 2004-06-30 무손실 오디오 부호화/복호화 방법 및 장치
KR50479/04 2004-06-30

Publications (2)

Publication Number Publication Date
CN1681213A CN1681213A (zh) 2005-10-12
CN1681213B true CN1681213B (zh) 2010-05-26

Family

ID=34829555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005100741885A Expired - Fee Related CN1681213B (zh) 2004-03-10 2005-03-10 无损音频编码/解码方法和装置

Country Status (7)

Country Link
US (1) US7660720B2 (zh)
EP (1) EP1575032B1 (zh)
JP (2) JP4744899B2 (zh)
KR (1) KR100561869B1 (zh)
CN (1) CN1681213B (zh)
DE (1) DE602005019643D1 (zh)
ES (1) ES2339257T3 (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070037945A (ko) * 2005-10-04 2007-04-09 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR101237413B1 (ko) * 2005-12-07 2013-02-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법, 오디오 신호의부호화 및 복호화 장치
JP4732203B2 (ja) * 2006-03-17 2011-07-27 キヤノン株式会社 画像符号化装置及び復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US20080071550A1 (en) * 2006-09-18 2008-03-20 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode audio signal by using bandwidth extension technique
KR101346358B1 (ko) 2006-09-18 2013-12-31 삼성전자주식회사 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치
KR20090089304A (ko) * 2006-10-06 2009-08-21 에이전시 포 사이언스, 테크놀로지 앤드 리서치 부호화 방법, 복호화 방법, 부호화기, 복호화기 및 컴퓨터 프로그램 제품
KR101261524B1 (ko) * 2007-03-14 2013-05-06 삼성전자주식회사 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
US8086465B2 (en) * 2007-03-20 2011-12-27 Microsoft Corporation Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
US7991622B2 (en) * 2007-03-20 2011-08-02 Microsoft Corporation Audio compression and decompression using integer-reversible modulated lapped transforms
KR100889750B1 (ko) * 2007-05-17 2009-03-24 한국전자통신연구원 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
WO2009027606A1 (fr) * 2007-08-24 2009-03-05 France Telecom Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
EP3300076B1 (en) * 2008-07-11 2019-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder
US8462023B2 (en) 2008-09-16 2013-06-11 Sk Telecom Co., Ltd. Encoding method and encoding apparatus for B-transform, and encoded data for same
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
CA2778323C (en) 2009-10-20 2016-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values
SG182467A1 (en) 2010-01-12 2012-08-30 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
AU2011287747B2 (en) * 2010-07-20 2015-02-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using an optimized hash table
KR101676477B1 (ko) 2010-07-21 2016-11-15 삼성전자주식회사 컨텍스트 기반의 무손실 부호화 장치 및 방법, 그리고 복호화 장치 및 방법
CN102074243B (zh) * 2010-12-28 2012-09-05 武汉大学 一种基于比特平面的感知音频分级编码系统及方法
GB2495918B (en) * 2011-10-24 2015-11-04 Malcolm Law Lossless buried data
CN103248367B (zh) * 2012-02-03 2016-03-16 展讯通信(上海)有限公司 码流数据的编码、解码方法和装置
CN104509130B (zh) * 2012-05-29 2017-03-29 诺基亚技术有限公司 立体声音频信号编码器
JP6302071B2 (ja) * 2013-09-13 2018-03-28 サムスン エレクトロニクス カンパニー リミテッド 無損失符号化方法及び無損失復号化方法
KR102270106B1 (ko) 2013-09-13 2021-06-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치
CN103595503B (zh) * 2013-10-25 2016-08-17 福建升腾资讯有限公司 一种基于串口装置的频率编解码通讯系统
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
CN105187071B (zh) * 2015-09-29 2018-04-06 东北大学 一种管道毫秒级在线数据的复合压缩/解压缩方法
US20230318622A1 (en) * 2017-06-22 2023-10-05 Nippon Telegraph And Telephone Corporation Encoder, decoder, encoding method, decoding method and program
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1408146A (zh) * 2000-11-03 2003-04-02 皇家菲利浦电子有限公司 音频信号的参数编码
WO2003077565A1 (en) * 2002-03-07 2003-09-18 Aware, Inc. Jpeg 2000 coder using selective group modeling according to coding passes

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778965B1 (en) * 1996-10-10 2004-08-17 Koninklijke Philips Electronics N.V. Data compression and expansion of an audio signal
JP4049820B2 (ja) * 1996-11-07 2008-02-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビットストリーム信号のデータ処理
IL122714A (en) * 1997-04-02 2011-06-30 Samsung Electronics Co Ltd Digital data coding/decoding method and apparatus
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
US6314136B1 (en) * 1997-08-01 2001-11-06 Creative Technology Ltd. Method for performing wavelet-based image compaction losslessly and low bit precision requirements
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US6121904A (en) 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6223162B1 (en) * 1998-12-14 2001-04-24 Microsoft Corporation Multi-level run length coding for frequency-domain audio coding
US6400289B1 (en) * 2000-03-01 2002-06-04 Hughes Electronics Corporation System and method for performing lossless data compression and decompression
FI109393B (fi) * 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
US6675148B2 (en) * 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
US6735254B2 (en) * 2001-06-29 2004-05-11 Qualcomm, Inc. DCT compression using Golomb-Rice coding
US6650784B2 (en) * 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice
US6856701B2 (en) * 2001-09-14 2005-02-15 Nokia Corporation Method and system for context-based adaptive binary arithmetic coding
KR100908114B1 (ko) * 2002-03-09 2009-07-16 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
US7110941B2 (en) * 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7536305B2 (en) * 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
US7328150B2 (en) * 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
KR101015497B1 (ko) * 2003-03-22 2011-02-16 삼성전자주식회사 디지털 데이터의 부호화/복호화 방법 및 장치
ES2305852T3 (es) * 2003-10-10 2008-11-01 Agency For Science, Technology And Research Procedimiento de codificacion de una señal digital en un flujo binario escalable, procedimiento para la descodificacion de un flujo binario escalable.
JP2005173201A (ja) * 2003-12-11 2005-06-30 Canon Inc オーディオ復号装置、オーディオ復号方法、オーディオ復号プログラム、及びオーディオ復号プログラムを記録したコンピュータ可読記録媒体
KR100576548B1 (ko) * 2003-12-26 2006-05-03 한국전자통신연구원 문맥기반 적응 가변길이 복호화 장치 및 그 방법
KR20050087956A (ko) * 2004-02-27 2005-09-01 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1408146A (zh) * 2000-11-03 2003-04-02 皇家菲利浦电子有限公司 音频信号的参数编码
WO2003077565A1 (en) * 2002-03-07 2003-09-18 Aware, Inc. Jpeg 2000 coder using selective group modeling according to coding passes

Also Published As

Publication number Publication date
JP2011048388A (ja) 2011-03-10
CN1681213A (zh) 2005-10-12
JP5372886B2 (ja) 2013-12-18
ES2339257T3 (es) 2010-05-18
DE602005019643D1 (de) 2010-04-15
EP1575032A3 (en) 2006-09-27
US7660720B2 (en) 2010-02-09
KR100561869B1 (ko) 2006-03-17
US20050203731A1 (en) 2005-09-15
JP4744899B2 (ja) 2011-08-10
JP2005260969A (ja) 2005-09-22
EP1575032A2 (en) 2005-09-14
KR20050090941A (ko) 2005-09-14
EP1575032B1 (en) 2010-03-03

Similar Documents

Publication Publication Date Title
CN1681213B (zh) 无损音频编码/解码方法和装置
CN100588124C (zh) 无损音频解码/编码方法和装置
CN101223570B (zh) 获得用于数字媒体的高效编码的频带的频率分段
CN101223582B (zh) 一种音频编码方法、音频解码方法及音频编码器
CN101223577B (zh) 对低比特率音频信号进行编码/解码的方法和设备
CN101223576B (zh) 从音频信号提取重要频谱分量的方法和设备以及使用其的低比特率音频信号编码和/或解码方法和设备
KR101238239B1 (ko) 인코더
US20070078646A1 (en) Method and apparatus to encode/decode audio signal
US20140229186A1 (en) Entropy encoding and decoding using direct level and run-length/level context-adaptive arithmetic coding/decoding modes
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
KR19990041073A (ko) 비트율 조절이 가능한 오디오 부호화/복호화 방법 및 장치
KR20060121655A (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어스펙트럼 데이터의 효과적인 코딩
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
KR100947065B1 (ko) 무손실 오디오 부호화/복호화 방법 및 장치
JP3617804B2 (ja) Pcm信号符号化装置及び復号化装置
JP3361790B2 (ja) オーディオ信号符号化方法、オーディオ信号復号化方法およびオーディオ信号符号化/復号化装置と前記方法を実施するプログラムを記録した記録媒体
KR101644883B1 (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100526

Termination date: 20210310