CN1126265C - 可伸缩的立体声音频编码/解码方法和装置 - Google Patents
可伸缩的立体声音频编码/解码方法和装置 Download PDFInfo
- Publication number
- CN1126265C CN1126265C CN98115468A CN98115468A CN1126265C CN 1126265 C CN1126265 C CN 1126265C CN 98115468 A CN98115468 A CN 98115468A CN 98115468 A CN98115468 A CN 98115468A CN 1126265 C CN1126265 C CN 1126265C
- Authority
- CN
- China
- Prior art keywords
- coding
- data
- decoding
- carried out
- parts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereo-Broadcasting Methods (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
提供一种可伸缩的立体声编码/解码方法和装置。该方法包括以下步骤:对各预定编码频带的音频输入信号进行信号处理和量化,对量化数据中与基准层相对应的量化数据进行编码,对对应于基准层的下一增强层的量化数据进行编码,和对由于层数限制未编码而又属于编码层的剩余量化数据进行编码,对所有增强层顺序执行层编码步骤以便形成位流;随后按照从MSB序列到LSB序列的次序,使用先验概率模型进行算术编码,以预定向量组轮流对经过位片处理的左声道数据和右声道数据进行解码。
Description
技术领域
本发明涉及音频编码和解码方法,更确切地说,涉及采用位片式算术编码方法的可伸缩的立体声音频编码/解码方法和装置。
背景技术
在常规可伸缩音频编码/解码装置中,人们考虑了1-声道单声道信号的可伸缩性[K.Brandenbrug等,“可伸缩音频编码的主要思想”,97thAES-Convention,preprint 3294,San Francisco,1994]和[K.Brandenbrug等,“2级或3级位率的可伸缩音频编码系统”,99th AES-Convention,preprint 4132,New York,1995]。然而,MPEG音频标准[MPEG委员会ISO/IEC/JTCI/SC29/WG11,信息技术-以大约1.5Mbit/s速率对用于数据存储介质的动画以及各音频信号进行编码-第三部分:音频,ISO/IEC IS11172-3,1998]或AC-2/AC-3方法[Dolby,“Dolby AC-3多声道音频编码方法-提交给Grand Alliance Specialist Group”,Dolby实验室,1993年8月]提供了处理立体声和多声道信号以及单声道信号的技术。实际上,大部分音乐信号是由立体声信号组成的。因此,如同因特网或通信网一样,有必要采用两声道以上位流信号沿用的可伸缩的音频编码解码器。
通常,音乐信号为立体声信号。通过光盘(CD)、通信网络或广播网络提供立体声信号,而且未来仍将在多媒体环境下提供立体声信号。然而,现有可伸缩的音频编码解码器主要处理单声道信号,而并不处理立体声信号。为了处理立体声信号,必须按以下方式传输信号,即传输某声道的所有信号,然后传输另一声道的所有信号。然而,对于以上情况,由于两个声道中产生的位数通常并不相等,所以当立体声信号的位率较低时,可伸缩音频编码解码器的性能非常低。
发明内容
为了解决以上问题,本发明的目的在于提供一种可伸缩的立体声数字音频数据编码方法和装置,以及记录该编码方法的记录介质。利用位片式算术编码(BSAC)技术,通过生成由基于基准层的若干增强层组成的位流进行编码。
为了实现本发明的目的,本文提供可伸缩的立体声音频编码方法,该方法将音频信号编码为具有一层基准层和至少两层增强层的分层数据流,该方法包括以下步骤:对各预定编码频带的音频输入信号进行信号处理和量化,对量化数据中与基准层相对应的量化数据进行编码,对对应于基准层的下一增强层的量化数据进行编码,以及对由于层数限制未编码而又属于编码层的剩余量化数据进行编码,并且顺序对所有增强层顺序执行层编码步骤以便形成位流,其中执行基准层编码步骤、增强层编码步骤以及顺序编码步骤,从而可以利用相同的预定数字表示边信息以及与编码层相对应的量化数据,随后按照从最高有效位(MSB)序列到最低有效位(LSB)序列的次序,使用先验概率模型进行算术编码,以预定向量组轮流对位片式左声道数据和右声道数据进行编码。边信息至少包括比例因子和算术编码所使用的各概率模型的信息。预定向量是通过将四个位片式音频声道数据耦合为一个向量而生成的四维向量。根据预状态将四维向量划分为两个子向量,以便进行编码,其中预状态表示非零位片式频率分量是否进行过编码。
此外,对比例因子进行编码的步骤包括以下步骤:获得最大比例因子,获得最大比例因子与第一比例因子的差值,对该差值进行算术编码,获得紧接前一个算术编码的比例因子与第一比例因子之后各比例因子的差值,将该差值映射为预定值,并对映射值进行算术编码。
对比例因子进行编码的步骤包括以下步骤:获得最大比例因子,获得最大比例因子与各比例因子的差值,以及对该差值进行编码。
为了得到分层结构,对通常用于所有频带的标题信息进行编码,随后对利用位片信息形成的各层所需的边信息和量化频率进行编码。
通过以下步骤完成量化:将时域上的音频输入信号转换为频域信号,经过时间/频率映射以预定比例因子频带信号的方式连接转换信号,计算各比例因子频带的屏蔽阈值,进行时域噪声整形以便控制各转换窗口内量化噪声的瞬时形状,进行立体声强度处理,从而仅对两条声道中一条声道的比例因子频带的量化信息进行编码,并且仅传输另一条声道的比例因子,预测当前帧的频率系数,进行Mid/Side(M/S)立体声处理,以便将左声道信号和右声道信号转换为两个信号的相加信号以及其相减信号,对各预定编码频带的信号进行量化,从而各频带的量化噪声小于屏蔽阈值。
当量化数据是由符号数据和数值数据组成时,基准层和增强层编码以及位流形成步骤还包括以下步骤:对由数值数据的最高有效数字构成的最高有效数字序列进行算术编码,在最高有效数字序列中的编码对应非零数据的符号数据进行算术编码,在数字数据的未编码数值数据中对最高有效数字序列进行编码,在已编码数字序列中对对应于非零值数据一的符号数据中的未编码符号数据进行编码,对数字数据的各数字执行数值编码步骤和符号编码步骤,按预定向量组对左声道数据和右声道数据轮流执行各步骤。
可伸缩的立体声音频解码装置还包括:进行M/S立体声处理的M/S立体声处理部件,以便检查是否在位流编码方法中进行过M/S立体声处理,并且如果进行过M/S立体声处理,就将左声道信号和右声道信号转换为两个信号的相加信号及其相减信号,预测部件,该部件用于检测是否在位流编码方法中执行过预测步骤,并且如果执行过预测步骤,就预测当前帧的频率系数,立体声强度处理部件,该部件用于检测是否在位流编码方法中进行过立体声强度处理,并且如果进行过立体声强度处理,则由于仅对两条声道之一条声道(左声道)的比例系数频带的量化信息进行过编码,所以进行立体声强度处理以便将另一声道(右声道)的量化信息恢复到左声道值,和时域噪声整形(TNS)部件,该部件用于检测是否在位流编码方法中执行过时域噪声整形步骤,并且如果执行过TNS步骤,就进行瞬时噪声处理以便控制各转换窗口内量化噪声的瞬时形状。
根据本发明的另一方面,提供一种可伸缩的音频编码装置,该装置包括:量化部件,该部件用于各编码频带的音频输入信号的信号处理和量化,位片式算术编码部件,该部件用于编码所有层的位流从而具有分层结构,通过限制基准层的频带实现可伸缩,该部件还用于对对应于基准层的边信息进行编码,从最高有效位序列到最低有效位序列、从较低频率分量到较高频率分量对量化信息进行顺序编码,以预定向量组轮流对左声道数据和右声道数据进行编码,并且对对应于基准层的下一增强层一的边信息和量化数据进行编码,以及位流形成部件,该部件用于收集量化部件和位片式算术编码部件生成的数据并且生成位流。
量化部件包括时间/频率映射部件,该部件将时域上的音频输入信号转换为频域信号,音质部件,该部件通过时间/频率映射利用预定比例因子频带的信号连接转换信号,该部件还利用各信号相互影响而产生的屏蔽现象计算各比例因子频带的屏蔽阈值,以及量化部件,当比较各频带的量化噪声与屏蔽阈值时,该部件量化各预定编码频带的信号。
此外,该装置还包括时域噪声整形(TNS)部件,该部件进行时域噪声整形以便控制各转换窗口内量化噪声的瞬时形状,立体声强度处理部件,该部件进行立体声强度处理,从而仅对两个声道中之一个声道的比例因子频带的量化信息进行编码,传输另一个声道的比例因子,预测部件,该部件预测当前帧的频率系数,以及M/S立体声处理部件,该部件进行M/S立体声处理,以便将左声道信号和右声道信号转换为两个信号的相加信号及其相减信号。
根据本发明的另一方面,提供一种可伸缩的立体声音频解码方法,该方法用于解码音频数据编码以便具有分层位率,该方法包括以下步骤:分析具有分层结构的位流中各模块所需的数据,以具有分层结构的位流中各层的建立次序,至少对比例因子、算术编码模型系数和量化数据进行解码,其中按照从较高有效位到较低有效位的顺序,通过分析构成位流的位的有效性,轮流对各声道的量化数据进行解码,将经过解码的比例因子和量化数据恢复位具有原始数值的信号,以及将量化信号反演为时域信号。
可伸缩的立体声音频解码方法还包括以下步骤:进行M/S立体声处理,以便检查是否在位流编码方法中进行过M/S立体声处理,并且如果进行过M/S立体声处理,就将左声道信号和右声道信号转换为两个信号的相加信号及其相减信号,检测是否在位流编码方法中执行过预测步骤,并且如果执行过预测步骤,就预测当前帧的频率系数,检测是否在位流编码方法中进行过立体声强度处理,并且如果进行过立体声强度处理,则由于仅对两条声道中之一条声道(左声道)的比例系数频带的量化信息进行过编码,所以进行立体声强度处理以便将另一声道(右声道)的量化信息恢复到左声道值,检测是否在位流编码方法中执行过时域噪声整形(TNS)步骤,并且如果执行过TNS步骤,就进行时域噪声整形以便控制各转换窗口内量化噪声的瞬时形状。
当量化数据是由符号数据和数值数据组成时,通过顺序解码量化频率分量符号位的数值数据并且耦合数值数据和符号位,恢复量化频率分量。
按照从最高有效位到最低有效位的顺序执行解码步骤,并且通过对已解码的位片式数据耦合以及将耦合数据恢复为量化频率分量数据,执行恢复步骤。
在解码步骤中对以上数据进行解码,从而将四个样本的位片式信息解码为四维向量组。
进行四维向量解码,从而对根据预状态编码的两个子向量进行算术解码,并且将根据各样本的编码状态进行解码的两个子向量恢复为四维向量,其中预状态表示是否对非零位片式频率分量进行过编码。
此外,当根据MSB对各频率分量的位片式数据进行解码时,如果位片式数据为“0”就跳过解码,当位片式数据“1”第一次出现时,就对符号数据进行算术解码。通过解码位流中的最大比例因子,对最大比例因子和各比例因子的差值进行算术解码,从最大比例因子中减去该差值,就完成了比例因子的解码。此外,解码比例因子的步骤包括以下步骤:根据位流解码最大比例因子,通过映射获得最大比例因子与需要解码的比例因子之间的差值对该差值进行算术解码,根据映射值,对该差值进行逆映射,通过从最大比例因子中减去该差值获得第一比例因子,以及通过从前一比例因子中减去该差值获得剩余频带的比例因子。
通过执行以下步骤完成算术编码模型系数的解码:解码位流中的最小算术模型系数,解码最小系数与各层边信息中各系数之间的差值,累加最小系数与该差值。
另一方面,根据本发明,提供一种可伸缩的音频解码装置,该装置用于解码音频数据编码以便具有分层位率,该装置包括位流分析部件,用以分析具有分层结构的位流中各模块所需的数据,解码部件,该部件按具有分层结构的位流中各层的建立次序,至少对比例因子、算术编码模型系数和量化数据进行解码,其中按照从较高有效位到较低有效位的顺序,通过分析构成位流的位的有效性,轮流对各声道的量化数据进行解码,恢复部件,该部件将经过解码的比例因子和量化数据恢复为具有原始数值的信号,以及频率/时间映射部件,该部件将量化信号反演为时域信号。
该装置还包括以下部件:进行M/S立体声处理的M/S立体声处理部件,该部件用于检查是否在位流编码方法中进行过M/S立体声处理,并且如果进行过M/S立体声处理,就将左声道信号和右声道信号转换为两个信号的相加信号及其相减信号,预测部件,该部件用于检测是否在位流编码方法中执行过预测步骤,并且如果执行过预测步骤,就预测当前帧的频率系数,立体声强度处理部件,该部件用于检测是否在位流编码方法中进行过立体声强度处理,并且如果进行过立体声强度处理,则由于仅对两条声道之一条声道(左声道)的比例系数频带的量化信息进行过编码,所以进行立体声强度处理以便将另一声道(右声道)的量化信息恢复到左声道值,和时域噪声整形部件,该部件用于检测是否在位流编码方法中执行过时域噪声整形(TNS)步骤,并且如果执行过TNS步骤,就进行瞬时噪声处理以便控制各转换窗口内量化噪声的瞬时形状。
附图说明
通过参照附图详细说明本发明的最佳实施方式,本发明的上述目的和优点将会更加显而易见。其中附图是:
图1是根据本发明的编码装置的框图;
图2表示根据本发明的位流的结构;
图3是根据本发明的解码装置的框图;
图4说明长块(窗口长度=2048)频率分量的排列;和
图5说明短块(窗口长度=2048)频率分量的排列。
具体实施方式
以下,将参照附图详细说明本发明的最佳实施方式。
本发明准备采用位片式算术编码(BSAC)技术编码并解码可伸缩的立体声数字音频数据。换句话说,在本发明中,仅仅利用BSAC技术代替无损编码模块,而并不改变常规编码器的其他模块。本发明推广了按如上方式构造的可伸缩编码器/解码器的适用性,即,可以将本发明应用于立体声信号。
图1是根据本发明的可伸缩音频编码装置的框图。可伸缩音频编码装置包括时/频映射部件100,音质部件110,时域噪声整形部件120,立体声强度处理部件130,预测部件140,mid/side(M/S)立体声处理部件150,量化部件160,位片式算术编码部件170和位流形成部件180。
在对数字音频信号进行编码时,最重要的人类声音特征是屏蔽效果和临界频带特征。屏蔽效果指由于另一信号影响而听不到某个音频信号(声音)的现象。例如,当一列火车经过某个车站时,受该列火车造成的噪声的影响,在低声谈话期间,他/她不能听到对方的声音。在人类可听到频率范围内,人们对各个频段的音频信号的感受也不尽相同。此外,考虑到临界频带特征,当噪声信号处于临界频带内或噪声信号从关键信号中出来时,人们对具有相同振幅的各种噪声的感受也不相同。此时,当噪声信号越过临界频带时,可以更清楚地听到噪声。
本质上利用以上两个特征对人类音频特征进行编码,从而计算可能位于临界频带内的噪声范围,随后对应于计算范围产生量化噪声,以便将编码造成的信息损失降低到最低限度。
时/频映射部件100将时域内的音频信号转换为频域内的音频信号。
音质部件110利用预定比例因子频带信号连接时/频映射部件100的转换信号,并利用各信号相互作用产生的屏蔽现象计算各比例因子频带的屏蔽阈值。
时域噪声整形部件120控制各转换窗口内量化噪声的瞬时形状。通过过滤频率数据,可以对噪声进行瞬时整形。编码器可以选择使用该模块。
立体声强度处理部件130是一个模块,该模块用于更有效地处理立体声信号,立体声强度处理部件130仅对两个声道中某个声道的比例因子频带的量化信息进行编码,而传输另一个声道的比例因子频带。在编码器中不一定使用该模块,而是需要考虑各比例因子频带的所有要素,以便确定是否使用该模块。
预测部件140估计当前帧的频率系数。量化并编码预测值与实际频率分量之间的差值,以便降低生成的可用位的数量。在帧组中选择使用预测部件140。换句话说,由于使用预测部件140增加了预测后继频率系数的复杂性,所以可以不使用预测部件140。偶尔,经过估计实际生成的位数可能大于不经估计实际生成的位数。此时,不使用预测部件140。
用于更有效处理立体声信号的M/S立体声处理部件150,将左声道信号和右声道信号分别转换为两个信号的相加信号和相减信号,以便随后处理该信号。在编码器中不一定使用该模块,而是需要考虑各比例因子频带的所有要素,以便确定是否使用该模块。
量化部件160标量量化各频带的频率信号,从而各频带量化噪声的数值小于屏蔽阈值,以致觉察不到量化噪声。进行量化以使NMR(噪声屏蔽率)值小于等于0dB,其中NMR为音质部件110计算的屏蔽阈值与各频带所产生的噪声的比率。NMR值小于等于0dB意味着屏蔽阈值大于量化噪声。换句话说,听不到量化噪声。
由于诸如MPEG-2 ACC之类的现有音频编码解码器不具有可伸缩性,所以可以使用本发明的核心模块,即位片式算术编码部件170,作为ACC技术的无损编码部件的备择方案。为了实现可伸缩的音频编码解码器,通过组合相应频带的边信息和音频数据的量化数据,对量化部件160产生量化的频率数据进行编码。此外,除可伸缩性之外,可以在顶层提供ACC中的类似功能。以下详细说明位片式算术编码部件170的功能。将频带限制为与基准层相对应的频带以便伸缩,并对基准层的边信息进行编码。按照从MSB顺序到LSB顺序,从低频分量到高频分量的次序,对量化值信息进行顺序编码。此外,以预定向量组的方式对左声道和右声道轮流编码,以便对基准层进行编码。在结束基准层编码后,对下一增强层的边信息以及音频数据的量化值进行编码,从而按上述方式构成的位流具有分层结构。
位流形成部件180通过收集编码装置的各模块内形成的信息,根据适用于可伸缩编码解码器的预定语法产生位流。
图2表示根据本发明的位流的结构。如图2所示,该位流具有分层结构,其中根据位率,较低位率层的位流包含在较高位率层的位流中。通常,首先编码边信息,随后编码剩余信息,从而形成位流。然而,如图2所示,在本发明中分别编码各增强层的边信息。此外,尽管通常以采样组合的方式顺序编码量化数据,在本发明中,利用二进制数据表示量化数据,并且根据二进制数据的MSB顺序编码量化数据,以便在指定位内形成位流。
图3是根据本发明的解码装置的框图,解码装置包括位流分析部件300,位片式算术解码部件310,反向量化部件320,M/S立体声处理部件330,预测部件340,立体声强度处理部件350,时域噪声整形部件360,和频率/时间映射部件370。
位流分析部件300以输入位流的生成次序分离标题信息和编码数据,并将其传输到各模块。
位片式算术解码部件310以输入位流的生成次序解码边信息和位片式量化数据,并将解码结果传输到反向量化部件320。
仅接受立体声信号的M/S立体声处理部件330,处理与编码装置中进行M/S立体声处理相对应的比例因子频带。
当在编码装置中进行估计时,与编码装置中采用的方法相同,预测部件340以前一帧中解码数据的方式,经过估计搜索同一值。将位流分析部件300解码的差分信号加入到预测信号中,从而恢复原始频率分量。
仅接受立体声信号的立体声强度处理部件350,处理与编码装置中进行M/S立体声处理相对应的比例因子频带。
用于控制各转换窗口内量化噪声瞬时形状的时域噪声整形部件360进行相应的处理。
采用诸如ACC标准件之类的常规音频算法处理模块,将经过解码的数据恢复为时域信号。首先,反向量化部件320将经过解码的比例因子和量化数据恢复为具有原始数值的信号。随后,频率/时间映射部件370将量化信号反演为时域信号,以便还原。
现在将说明编码装置的操作。
在时间/频率映射部件100,经过MDCT(改良离散余弦变换),将输入信号转换为频域信号。音质部件110利用适宜的比例因子频带连接以上频域信号,以便获得屏蔽阈值。此外,转换为频域信号的音频信号通过用于提高编码效率的组件,即TNS部件120,立体声强度处理部件130,预测部件140和立体声处理部件150,以便更有效地压缩信号。
量化部件160进行标量量化,从而各比例因子频带的量化噪声值小于屏蔽阈值,可以听到但不会在指定位内觉察到该值。如果进行了满足以上条件的量化,就产生各比例因子频带的比例因子和量化频率值。
通常,考虑到人类音质,可以在较低的频率轻易觉察到几乎相等的频率分量。然而,随着频率的增加,可觉察的频率区间变宽。比例因子频带的带宽随着频带的增高而增高。然而,为了方便编码,并不采用其带宽不固定的比例因子频带进行编码,而是采用其带宽固定的编码频带。编码频带包括32个经过量化的频率系数值。
在处理立体声信号时,诸如ACC之类的仅考虑编码效率的常规编码/解码装置,首先对左右声道共同使用的信息进行编码。编码左声道数据,随后编码右声道数据。即以标题、左声道和右声道的次序进行编码。
如上所述,在处理了标题之后,当不考虑其有效值而排列并传输左右声道信息时,如果位率下降,则位于后边的右声道信号首先消失。因此,可显著觉察到性能下降。
然而,根据本发明的音频编码装置对各声道的边信息进行编码。换句话说,位片式算术编码部件170以左声道和右声道的次序,轮流编码各声道的边信息。为了有效压缩,稍微改进比例因子编码方法。
首先说明比例因子编码。根据本发明的立体声音频编码装置采用将在下面说明的两种方法对比例因子进行编码,以便提高编码效率。编码装置选择呈现较好性能的方法,并且将所选方法传输到解码装置。
第一,为了压缩比例因子,根据所有比例因子获得最大比例因子(max_scalefactor)。然后,获得各比例因子与最大比例因子之间的差值,并对该差值进行算术编码。采用四个模型对比例因子之间的差值进行算术编码。表5.5到表5.8表示以上四个模型。在scalefacotr_model中存储模型信息。
[表5.5]差分比例因子算术模型1
[表5.6]差分比例因子算术模型2
长度 | 累加频率 |
8 | 1342,790,510,344,214,127,57,0 |
长度 | 累加频率 |
16 | 2441,2094,1798,1563,1347,1154,956,818,634,464,342,241,157,97,55,0 |
[表5.7]差分比例因子算术模型3
长度 | 累加频率 |
32 | 3963,3525,3188,2949,2705,2502,2286,2085,1868,1668,1515,1354,1207,1055,930,821,651,510,373,269,192,134,90,58,37,29,24,15,10,8,5,0 |
[表5.8]差分比例因子算术模型4
长度 | 累加频率 |
64 | 13587,13282,12961,12656,12165,11721,11250,10582,10042,9587,8742,8010,7256,6619,6042,5480,4898,4331,3817,3374,3058,2759,2545,2363,2192,1989,1812,1582,1390,1165,1037,935,668,518,438,358,245,197,181,149,144,128,122,117,112,106,101,85,80,74,69,64,58,53,48,42,37,32,26,21,16,10,5,0 |
第二,为了压缩比例因子,正如第一方法,根据所有比例因子获得最大比例因子(max_scalefactor)。然后,获得第一比例因子与最大比例因子之间的差值,并对该差值进行算术编码。然后,获得剩余比例因子与先前比例因子之间的差值,并对所有差值进行算术编码。这样,由于指定了所用模型,所以scalefactor_model的值是无意义的。
下面,将说明对立体声信号量化频率分量进行的编码。各频道的量化数据是位片式的。当处理单声道信号时,利用四维向量耦合位片式数据,并且将四维向量用作基本组件。这种处理同样适用于对立体声声道信号的编码。换句话说,从MSB开始编码。从左声道开始对位片式数据的四维向量进行算术编码。接着,对位于相同频率的右声道的四维向量进行算术编码。这样,对左声道和右声道交替进行编码。
就单声道而论,按照从MSB到LSB的次序进行编码。按照从较低频率分量到较高频率分量的次序,对具有相同有效值的位片式数据进行编码。此时,如果分配到各向量的所有位比当前正被编码的位更有效,则不必对各向量进行编码,并跳过该编码处理。
XQ0,XQ1,XQ2,…,XQk,…
其中Xqk为从4*k到4*k+3的量化频率分量的位片式数据。
就双声道而言,如同单声道一样,按照从MSB到LSB的次序进行编码。同样,按照从较低频率分量到较高频率分量的次序,对具有相同有效值的位片式数据进行编码。然而,考虑到存在两个声道,需要确定编码顺序。假设左声道和右声道中的量化频率分量如下:
左声道:XQL0,XQL1,XQL2,XQL3,XQL4,XQL5,…,XQLk…
右声道:XQR0,XQR1,XQR2,XQL3,XQL4,XQL5,…,XQRk,…
其中XQLk和XQLRk为从4*k到(4*k+3)的量化频率分量的位片式数据。
这样,就双声道而言,以单声道中类似次序的方式,按照从较低频率分量到较高频率分量的次序进行编码。然而,为了首先对有效分量进行编码,需要交错声道分量。换句话说,按如下方式轮流对两个声道之间的各向量进行编码。
XQL1,XQR1,XQL2,XQR2,…
由于按照两个声道内有效值的次序,顺序对按上述方式构成的信息进行编码,所以即使降低可伸缩音频编码解码器的位率,其性能也不会显著下降。
现在,将说明本发明的最佳实施方式。本发明沿用ACC标准件的基本结构实现可伸缩的数字音频数据编码器,其中ACC标准件包括诸如附加模块(该模块用于提高编码效率)之类的所有模块。换句话说,在本发明中,在采用ACC标准编码/解码件中基本模块的同时,利用位片式编码方法取代无损编码模块,以便提供可伸缩的编码装置。在本发明中,在单一位流内不对仅为某一位率的信息进行编码,而在具有分层结构的位流(如图2所示)内,按照从较重要的信号分量到不太重要的信号分量的次序,对不同增强层的位率信息进行编码。
根据本发明的实施方式,在BSAC可伸缩编码解码器的无损编码之前,采用与ACC标准件相同的模块。因此,如果量化频率数据是通过对ACC位流进行解码而形成的,则可以将经过解码的数据恢复为BSAC可伸缩位流。这意味着可以在ACC位流和BSAC可伸缩位流之间进行自动译码。最后,根据环境提供与位流格式相称的相互转换。因此,可以同时满足编码效率和可伸缩性,并且编码效率和可伸缩性是互补的,这正是与其他可伸缩的编码解码器的区别。
利用按上述方式构成的位流,根据用户请求或传输声道的状态,通过简单重排包含在最高位流中的低位率位流,就能够形成具有低位率的位流。换句话说,可以将编码装置采用实时算法形成的位流或者存储在媒体上的位流,重排为适于用户请求的理想位率,以便传输。此外,即使具有适宜位流,如果用户的硬件性能较差,或者用户希望降低解码器的复杂性,也仅能恢复某些位流,从而控制了复杂性。
例如,在形成可伸缩位流时,基准层的位率为16Kbps,顶层的位率为64Kbps,各增强层的位率间隔为8Kbps,即该位流具有7层,各层位率分别为16、24、32、40、48、56和64Kbps。按照表2.1所示定义各增强层。如图3所示,由于编码装置形成的位流具有分层结构,所以64Kbps的顶层位流包含各增强层的位流(16、24、32、40、48、56和64Kbps)。如果用户请求顶层数据,则不进行任何处理就传输顶层位流。此外,如果另一用户请求基准层数据(对应于16Kbps),则只传输前导位流。
[表2.1]各层的位率(8kbps间隔)
层 | 位率(kbps) |
0 | 16 |
1 | 24 |
2 | 32 |
3 | 40 |
4 | 48 |
5 | 56 |
6 | 64 |
另一方面,可以以更细的间隔构造增强层。基准层的位率为16Kbps,顶层的位率为64Kbps,各增强层的位率间隔为1Kbps。按照表3.1所示构造增强层。因此,可以实现精粒可伸缩性,即以1kbps的位率间隔,形成从16kbps到64kbps的可伸缩位流。
[表3.1]各层的位率(1-kbps间隔)
层 | 位率 | 层 | 位率 | 层 | 位率 | 层 | 位率 |
0 | 16 | 12 | 28 | 24 | 40 | 36 | 52 |
1 | 17 | 13 | 29 | 25 | 41 | 37 | 53 |
2 | 18 | 14 | 30 | 26 | 42 | 38 | 54 |
3 | 19 | 15 | 31 | 27 | 43 | 39 | 55 |
4 | 20 | 16 | 32 | 28 | 44 | 40 | 56 |
5 | 21 | 17 | 33 | 29 | 45 | 41 | 57 |
6 | 22 | 18 | 34 | 30 | 46 | 42 | 58 |
7 | 23 | 19 | 35 | 31 | 47 | 43 | 59 |
8 | 24 | 20 | 36 | 32 | 48 | 44 | 60 |
9 | 25 | 21 | 37 | 33 | 49 | 45 | 61 |
10 | 26 | 22 | 38 | 34 | 50 | 46 | 62 |
11 | 27 | 23 | 39 | 35 | 51 | 47 | 63 |
48 | 64 |
根据位率,各层具有有限带宽。如果想要8kbps间隔的可伸缩性,则按照表2.2和表2.3所示限制带宽。对于1kbps间隔而言,按照表3.2和表3.3所示限制带宽。
[表2.2]用于短窗口的各层内的带限(8-kbps间隔)
[表2.3]用于长窗口的各层内的带限(8-kbps间隔)
[表3.2]用于短窗口的各层内的带限(1-kbps间隔)
[表3.3]用于长窗口的各层内的带限(1-kbps间隔)
层 | 带限 |
0 | 20 |
1 | 28 |
2 | 40 |
3 | 52 |
4 | 60 |
5 | 72 |
6 | 84 |
层 | 带限 |
0 | 160 |
1 | 244 |
2 | 328 |
3 | 416 |
4 | 500 |
5 | 584 |
6 | 672 |
层 | 带限 | 层 | 带限 | 层 | 带限 | 层 | 带限 |
0 | 20 | 12 | 36 | 24 | 52 | 36 | 68 |
1 | 20 | 13 | 36 | 25 | 52 | 37 | 68 |
2 | 20 | 14 | 36 | 26 | 52 | 38 | 68 |
3 | 24 | 15 | 40 | 27 | 56 | 39 | 72 |
4 | 24 | 16 | 40 | 28 | 56 | 40 | 72 |
5 | 24 | 17 | 40 | 29 | 56 | 41 | 72 |
6 | 28 | 18 | 44 | 30 | 60 | 42 | 76 |
7 | 28 | 19 | 44 | 31 | 60 | 43 | 76 |
8 | 28 | 20 | 44 | 32 | 60 | 44 | 76 |
9 | 32 | 21 | 48 | 33 | 64 | 45 | 80 |
10 | 32 | 22 | 48 | 34 | 64 | 46 | 80 |
11 | 32 | 23 | 48 | 35 | 64 | 47 | 80 |
48 | 84 |
层 | 带限 | 层 | 带限 | 层 | 带限 | 层 | 带限 |
0 | 160 | 12 | 288 | 24 | 416 | 36 | 544 |
1 | 168 | 13 | 296 | 25 | 424 | 37 | 552 |
2 | 180 | 14 | 308 | 26 | 436 | 38 | 564 |
3 | 192 | 15 | 320 | 27 | 448 | 39 | 576 |
4 | 200 | 16 | 328 | 28 | 456 | 40 | 584 |
5 | 212 | 17 | 340 | 29 | 468 | 41 | 596 |
6 | 224 | 18 | 352 | 30 | 480 | 42 | 608 |
7 | 232 | 19 | 360 | 31 | 488 | 43 | 616 |
8 | 244 | 20 | 372 | 32 | 500 | 44 | 628 |
9 | 256 | 21 | 384 | 33 | 512 | 45 | 640 |
10 | 264 | 22 | 392 | 34 | 520 | 46 | 648 |
11 | 276 | 23 | 404 | 35 | 532 | 47 | 660 |
48 | 672 |
输入数据为以48KHz频率进行采样的PCM数据,并且每帧的数据量为1024。就64Kbps的位率而言,一帧内的平均可用位数为1365.3333(=64000位/秒*(1024/48000))。同样,根据各位率,就可以计算各帧的可用位数。就8Kbps的位率而言,表2.4说明一帧内所有可用位的计算数。
[表2.4]各层内各声道的可用位(8-kbps间隔)
层 | 可用位 |
0 | 341 |
1 | 512 |
2 | 682 |
3 | 853 |
4 | 1024 |
5 | 1194 |
6 | 1365 |
现在,将详细说明根据本发明的立体声音频信号的编码和解码过程。
1.编码过程
整个编码过程与MPEG-2 ACC国际标准中的叙述相同,并且采用本发明推荐的位片式编码作为无损编码。
1.1.音质部件
利用音质模型,根据输入数据,首先生成正在处理的帧的块类型(长、启动、短、停止),各处理频带的SMR值,短块的分组信息,以及用于采用音质模型时/频同步的瞬时延迟PCM数据,并将其传输到时间/频率映射部件。采用ISO/IEC 11172-3模型2计算音质模型[MPEG委员会ISO/IEC/JTC1/SC29/WG11,信息技术-以大约1.5Mbit/s速率对用于数据存储介质的动画以及各音频信号进行编码-第三部分:音频,ISO/OEC IS11172-3,1993]。必须使用该模块,但是可以根据用户要求采用不同的模型。
1.2.时间/频率映射部件
采用MPEG-2 ACC国际标准中定义的时间/频率映射部件。利用音质模型,根据块类型输出,时间/频率映射部件采用MDCT将时域数据转换位频域数据。此时,关于长/启动/停止块和短块而言,其块长度分别为2048和256,并且执行8次MDCT。然后,将窗口类型和窗口分组信息传输到位流形成部件180。迄今为止,一直采用常规MPEG-2 ACC[MPEG委员会ISO/IEC/JTC1/SC29/WG11,ISO/IEC MPEG-2 ACC IS 13818-7,1997]中所采用的相同过程。
1.3.时域噪声整形部件(TNS)
采用MPEG-2 ACC国际标准中定义的时域噪声整形部件。TNS 120是一个选件,该选件控制各转换窗口内量化噪声的瞬时形状。通过过滤频率数据,就能够实现时域噪声整形。TNS 120将TNS信息传输到位流形成部件180。
1.4.立体声强度处理部件
采用MPEG-2 ACC国际标准中定义的立体声强度处理部件。立体声强度处理部件130是一种更有效处理立体声信号的方法。进行立体声强度处理,从而仅对两条声道中某条声道的比例因子频带的量化信息进行编码,而仅仅传输另一条声道的比例因子。该模块是可选模块,并且考虑各种条件,以便确定各比例因子频带是否使用该模块。立体声强度处理部件130将立体声强度标志值传输到位流形成部件180。
1.5.预测部件
采用MPEG-2 ACC国际标准中定义的预测部件。预测部件140为可选模块,该模块预测当前帧的频率系数。此外,预测部件140将和预测各的参数传输到位流形成部件180。
1.6.Mid/Side(M/S)立体声处理部件
采用MPEG-2 ACC国际标准中定义的M/S立体声处理部件。M/S立体声处理部件150为可选模块,该模块是一种更有效处理立体声信号的方法。进行M/S立体声处理以便将左声道信号和右声道信号转换为两个信号的相加信号以及其相减信号。
1.7.量化部件
利用渐增比例因子对转换为频域的数据进行量化,从而表1.1和表1.2所示的比例因子频带的SNR值小于音质模型的输出值SMR。这里,进行标量量化,并且基础比例因子为21/4。进行量化,从而将可觉察噪声降到最低限度。MPEG-2 ACC中说明了精确的量化过程。这里,得到的输出为各比例因子频带的量化数据和比例因子。
[表1.1]长块的比例因子频带
swb | swb_offset_longwindow | swb | swb_offset_longwindow | swb | swb_offset_longwindow | swb | swb_offset_longwindow |
0 | 0 | 12 | 56 | 24 | 196 | 37 | 576 |
1 | 4 | 13 | 64 | 25 | 216 | 38 | 608 |
2 | 8 | 14 | 72 | 26 | 240 | 39 | 640 |
3 | 12 | 15 | 80 | 27 | 264 | 40 | 672 |
4 | 16 | 16 | 88 | 28 | 292 | 41 | 704 |
5 | 20 | 17 | 96 | 29 | 320 | 42 | 736 |
6 | 24 | 18 | 108 | 30 | 352 | 43 | 768 |
7 | 28 | 19 | 120 | 31 | 384 | 44 | 800 |
8 | 32 | 20 | 132 | 32 | 416 | 45 | 832 |
9 | 36 | 21 | 144 | 33 | 448 | 46 | 864 |
10 | 40 | 22 | 160 | 34 | 480 | 47 | 896 |
11 | 48 | 23 | 176 | 35 | 512 | 48 | 928 |
36 | 544 | 1024 |
[表1.2]短块的比例因子频带
swb | swb_offset_shortwindow | swb | swb_offset_shortwindow |
0 | 0 | 8 | 44 |
1 | 4 | 9 | 56 |
2 | 8 | 10 | 68 |
3 | 12 | 11 | 80 |
4 | 16 | 12 | 96 |
5 | 20 | 13 | 112 |
6 | 28 | 128 | |
7 | 36 |
1.8.利用位片式算术编码进行位压缩
利用位片式算术编码部件170和位流形成部件180进行位压缩。为了方便编码,重新排列频率分量。取决于块类型,重排次序并不相同。如图4所示,当在块类型中使用长窗口时,按照比例因子频带的次序重排频率分量。如图5所示,当在块类型中使用短窗口时,按照渐增次序重复排列8块中的各个四频率分量。
经过重排的量化数据和比例因子构成分层位流。利用表7.1到表7.3所示的句法构造位流。位流的前导元素为常规ACC中所使用的元素,并且对本发明新推荐的元素进行具体解释。然而,其基本结构与ACC标准类似。[表7.1]bsac_lstep_data_block()句法
[表7.2]bsac_lstep_stream()句法
[表7.3]bsac_raw_data_block()句法
[表7.4]bsac_main_stream()句法
[表7.5]bsac_single_main_stream()句法
[表7.6]bsac_pair_main_stream()句法
[表7.7]bsac_layer_stream()句法
[表7.8]bsac_channel_stream()句法
[表7.9]bsac_general_info()句法
[表7.10]bsac_side_info()句法
句法 | 位数 | 助记符 |
bsac_lstep_data_block(){lslayer=0;while(data_available()){bsac_lstep_stream(lslayer)lslayer++;}} |
句法 | 位数 | 助记符 |
bsac_lstep_stream(lslayer){for(i=lstep_offset[lslayer];i<lstep_ofset[lslayer+1];i++)BSAC_stream_buf[i]/*将长步流保存在BSAC_stream_buf[]中。将BSAC_stream_buf[]映射到小步流,bsac_raw_data_block(),以便实际解码。详细说明参见BSAC长步可伸缩性的解码过程。*/} | 8 | unimsbf |
句法 | 位数 | 助记符 |
bsac_raw_data_block(){bsac_main_stream()layer=1;while(data_available()layer<=encoded_layer){bsac_layer_stream(nch,layer)layer++;}byte_alignment()} |
句法 | 位数 | 助记符 |
bsac_main-stream(){nchswitch(nch){case 1:bsac_single_main_stream()breakcase 2:bsac_pair_main_stream()break}} | 3 | unimsbf |
句法 | 位数 | 助记符 |
bsac_single_main_stream(){itp_data_presentif(ltp_dat_present)ltp_data()bsac_channel_stream(1,1)} | 1 | unimsbf |
句法 | 位数 | 助记符 |
bsac_pair_main_stream(){ltp_data_presentif(ltp_dat_present){ltp_data()ltp_data()}common_windowif(common_window)stereo_modebsac_channel_stream(2,commmon_window)}} | 112 | uimsbfuimsbfuimbf |
句法 | 位数 | 助记符 |
bsac_layer_stream(nch,layer){bsac_side_info(nch,layer)bsac_spectral_data(nch,layer) |
} |
句法 | 位数 | 助记符 |
bsac_channel_stream(nch,common_window){for(ch=0;ch<nch;ch++)max_scalefactor[ch]ics_info()if(!common_window)ics_info()for(ch=0;ch<nch;ch++){tns_data_present[ch]if(tns_data_present[ch])tns_data()gain_control_data_present[ch]if(gain_control_data_present[ch])gain_control_data()}PNS_data_presentif(PNS_data_present)PNS_start_sfb | 81116 | uimbfuimbfuimbfuimbfuimbf |
bsac_general_info(nch)bsac_layer_stream(nch,0)} |
句法 | 位数 | 助记符 |
bsac_general_info(nch){frame_lengthencoded_layerfor(ch=0;ch<nch;ch++){scalefactor_model[ch]main_ArModel[ch]ArModel_model[ch]scf_coding[ch]}} | 10/1162521 | uimbfuimbfuimbfuimbfuimbfuimbf |
句法 | 位数 | 助记符 |
bsac_side_info(nch,layer){if(nch==1 && PNS_data_present){for(sfb=PNS_start_sfb;sfb<max_sfb;sfb++)acode_noise_flag[g][sfb]}else if(stereo_mode>1 ‖PNS_data_present)for(g=0;g<num_window_group;g++)for(sfb=layer_sfb[layer];sfb<layer_sfb[layer+ | 0..1 | bslbf |
1];sfb++){if(stereo_mode==2)acode_ms_used[g][sfb]else if(stereo_mode==3)acode_stereo_info[g][sfb]}if(PNS_data_present &&sfb>=PNS_start_sfb){if(stereo_info==0 ‖stereo_info==3){acode_noise_flag_l[g][sfb]acode_noise_flag_r[g][sfb]}if(stereo_info==3){if(noise_flag_l[g][sfb] &&noise_flag_r[g][sfb])acode_noise_mode[g][sfb]}}}}for(ch=0;ch<nch;ch++)for(g=0;g<num_window_group;g++)for(sfb=layer_sfb[layer];sfb<layer_sfb[layer+1];sfb++)acode_scf[ch][g][sfb]for(ch=0;ch<nch;ch++) | 0..10..30..10..10..20..13 | bslbfbslbfbslbfbslbfbslbfbslbf |
for(sfb=layer_sfb[layer];sfb<layer_sfb[layer+1];sfb++)for(g=0;g<num_window_group;g++){band=(sfb*num_window_group)+gfor(i=swb_offset[band];i<swb_offset[band+1];i+=4)cband=index2cb(ch,l);if(!decode_cband[ch][cband]){acode_ArMode[ch][cband]decode_cband[ch][cband]=1;}}} |
[表7.11]bsac spectral data()句法
句法 | 位数 | 助记符 |
bsac_spectral_data(nch,layer){for(snf=maxsnf;snf>0;snf--){for(i=0;i<last_index;i+=4){for(ch=0;ch<nch;ch++){if(i>=layer_index[ch])continue;if(cur_snf[ch][i]<snf)continue;dim0=dim1=0for(k=0;k<4;k++)if(prestate[ch][i+k])dim1++else dim0++if(dim0) |
acode_vec0if(dim1)acode_vec1for(k=0;k<4;k++)if(sample[ch][i+k]&&!prestate[ch][i+k]){acode_signprestate[ch][i+k]=1}}cur_snf[ch][i]--if(total_estimated_bits >=available_bits[layer])return}}if(total_estimated_bits >=available_bits[layer])return}} | 0.140.141 | bslbfbslbfbslbf |
以下将具体解释本发明新推荐的元素。
1.8.1.bsac_channel_stream的编码
‘common_window’表示两个声道是否使用相同的格式块,‘max_scalefactor[ch]’表示比例因子的最大值,该值为整数,如8位。此外,‘tns_data_present[ch]’表示是否在编码装置中采用TNS。‘gain_control_data_present[ch]’表示一个标志,该标志表明为了在ACC中提供可伸缩的采样率(SSR)而采用的时间/频率映射方法。此外,‘stereo_mode’表示一个2位标志,该标志说明立体声信号处理方法,其中‘00’表示独立,‘01’表示所有ms_used均为1,‘10’表示在该层的边信息中存储有ms_used的max_sfb频带的1位屏蔽,‘11’表示在该层的边信息中存储有stereo_info的max_sfb频带的2位屏蔽。
1.8.2.bsac_data的编码
‘frame_length’表示某帧内所有位流的长度,其单位为字节,例如,对于单声道信号(M/S)而言,其长度为9位,对于立体声信号而言,其长度为10位。此外,‘encoded_layer’表示在位流内编码的顶层的编码,对于8-kbps间隔而言该编码为3位,而对于1-kbps间隔而言该编码为6位。表2.1和表3.1表示增强层的信息。此外,‘scalefactor_model[ch]’表示与模型各的信息,该模型用于对比例因子之间的差值进行算术编码。表4.2表示该模型。
[表4.2]差分比例因子的算术模型
模型号 | 最大差分比例因子 | 模型列表 |
0 | 7 | 表5.5 |
1 | 15 | 表5.6 |
2 | 31 | 表5.7 |
3 | 63 | 表5.8 |
‘min_ArModel’表示算术编码模型系数的最小值。‘ArModel_model’表示与模型各的信息,该模型用于对ArModel和min_ArModel之间的差分信号进行算术编码。表4.3表示该信息。
[表4.3]差分ArModel的算术模型
1.8.3.bsac_side_info的编码首先对能够用于所有层的信息进行编码,随后对通常用于各增强层的边信息进行编码。‘acode_ms_used[g][sfb]’表示对ms_used进行算术编码得到的编码字,ms_used为1位标志,该标志表示是否在窗口分组g和比例因子频带scf内进行M/S编码,其中ms_used定义如下:
模型号 | 最大差分比例因子 |
0 | 3 |
1 | 7 |
2 | 15 |
3 | 31 |
0:独立
1:ms_used。
‘acode_ms_used[g][sfb]’表示对ms_used进行算术编码得到的编码字,ms_used为1位标志,该标志表示是否在窗口分组g和比例因子频带scf内采用M/S编码,其中ms_used定义如下:
0:独立;和
1:ms_used。
‘acode_stereo_info[g][sfb]’表示对ms_used进行算术编码得到的编码字,ms_used为2位标志,该标志表示是否在窗口分组g和比例因子频带scf内采用立体声强度编码,其中stereo_info定义如下:
00:独立;
01:ms_used;
10:Intensity_in_phase;和
11:Intensity_out_of_phase。
‘Acode_scf’表示对比例因子进行算术编码得到的编码字,‘acode_ArModel’表示对ArModel进行算术编码得到的编码字。ArModel为根据表4.3所列模型选择的信息。
1.8.4.bsac_spectral_data的编码
利用BSAC技术,对通常用于各增强层的边信息以及经过量化的频率分量进行位片式处理,随后对其进行算术编码。‘acode_vec0’表示利用等于ArModel值的算术模型对第一子向量(subvector 0)进行算术编码而得到的编码字。‘acode_vec1’表示利用等于ArModel值的算术模型对第二子向量(subvector 1)进行算术编码而得到的编码字。‘acode_sign’表示利用表5.15定义的算术模型对符号位进行算术编码而得到的编码字。[表5.15]符号算术模型
长度 | 累加频率 |
2 | 8192,0 |
在计算对各子向量进行编码所使用的位数,并与各增强层的可用位数进行比较时,当使用位数大于等于可用位数时,才开始对下一增强层进行编码。
就长块而言,基准层的带宽被限制在第21条比例因子频带之下。然后,对前21条比例因子频带的比例因子,以及相应编码频带的算术编码模型进行编码。根据算术编码模型得到位分配信息。根据分配到各编码频带的位信息得到所分配位的最大值,并且利用前述编码方法,从最大量化位值开始进行编码。然后,顺序对下一量化位进行编码。如果某频带所分配的位数小于正被编码的频带所分配的位数,则不进行编码。如果某频带所分配的位数等于正被编码的频带所分配的位数,则首次对该频带进行编码。由于基准层的位率为16Kbps,所以全部位容量为336位。因此,连续计算总使用位数,并且当位数超过336位时,就终止编码。
在形成基准层(16Kbps)的所有位流后,就形成下一增强层的位流。由于增加了较高层的极限带宽,所以仅对基准层极限频带的新增频带的比例因子和算术编码模型进行编码。在基准层,按照基准层内的相同方式,从MSB开始,对各频带未编码的位片式数据以及新增频带的位片式数据进行编码。当总使用位数大于可用位数时,就终止编码,并且准备形成下一增强层位流。这样,就能够生成32、40、48、56和64Kbps的剩余层的位流。
2.解码过程
2.1.位流的分析和解码
2.1.1.bsac_channel_stream的解码
按照以下次序,对bsac_channel_stream进行解码。首先,得到max_scalefactor。然后,得到ics_info()。如果有TNS数据,则得到TNS数据。如果有两个声道,则得到stereo_mode,随后得到BSAC数据。
2.1.2.bsac_data的解码
在位流内,对解码frame_length所需的边信息、encoded_layer、比例因子模型以及算术模型进行解码。
2.1.3.bsac_stream的解码
BSAC流具有分层结构。首先,从位流中分离出基准层的边信息,随后对其进行算术解码。然后,从位流中分离出经过量化的频率分量的位片式信息,并对其进行算术解码。接着,对下一增强层的边信息进行解码,并对经过量化的频率分量的位片式信息进行算术解码。
反复对各增强层的边信息以及位片式数据进行解码,直至增强层大于编码层。
2.1.4.stereo_info或ms_used的解码
对stereo_info或ms_used进行的解码受stereo_mode的影响,其中stereo_mode表示立体声屏蔽。如果stereo_mode为0或1,则无需对stereo_info或ms_used进行解码。
如果stereo_mode为1,则所有的ms_used均为1。将有关ms_used的信息传输到M/S立体声处理部件,从而开始M/S立体声处理。如果stereo_mode为2,则采用表5.13所示的模型对ms_used的值进行算术编码。此外,将有关ms_used的信息传输到M/S立体声处理部件,从而开始M/S立体声处理。
[表5.13]ms_used模型
长度 | 累加频率 |
2 | 11469,0 |
如果stereo_mode为3,则采用表5.14所示的模型对stereo_info进行算术编码。正如ACC中所述,将经过解码的数据传输到M/S立体声处理部件或者立体声强度处理部件,从而以比例因子频带组的形式开始M/S立体声处理或者立体声强度处理。[表5.14]stereo_info模型
长度 | 累加频率 |
2 | 13926,4096,1638,0 |
2.1.5bsac_side_info的解码
按上述方式形成的可伸缩位流具有分层结构。首先,从位流中分离出基准层的边信息,随后对其进行解码。然后,从位流中分离出包含在基准层位流中的经过量化的频率分量的位片式信息,并对其进行解码。对其他增强层施加与基准层相同的解码过程。
2.1.5.1.比例因子的解码
将频率分量划分为比例因子频带,其中该比例因子频带的频率系数为4的倍数。每条比例因子频带均具有一个比例因子。采用两种方法对比例因子进行解码。根据scf_coding的值确定采用的方法。
首先,将max_scalefactor解码为8位无符号整数。通常,在编码期间,对经过映射差值而得到的值进行编码。因此,对于各比例因子频带,采用表5.2所示的模型对经过映射的值进行算术编码。此时,如果经过算术解码的值为54,这意味着映射值大于等于54,由于还对54与映射值之间的差值进行过编码,所以还需要对经过编码的差值进行解码,以便将其恢复为大于等于54的值。如果完成了对映射值的解码,就利用差分符号实现映射值的逆映射。利用表5.1和表5.2所示的映射表进行映射和逆映射。利用max_scalefactor与第一比例因子之间的差分符号,就可以得到第一比例因子。
表5.1.从差分比例因子到系数的转换表
D | I | D | I | D | I | D | I | D | I | D | I | D | I | D | I |
0 | 68 | 16 | 87 | 32 | 46 | 48 | 25 | 64 | 9 | 80 | 40 | 96 | 96 | 112 | 112 |
1 | 69 | 17 | 88 | 33 | 47 | 49 | 19 | 65 | 10 | 81 | 43 | 97 | 97 | 113 | 113 |
2 | 70 | 18 | 89 | 34 | 48 | 50 | 20 | 66 | 12 | 82 | 44 | 98 | 98 | 114 | 114 |
3 | 71 | 19 | 72 | 35 | 49 | 51 | 14 | 67 | 13 | 83 | 45 | 99 | 99 | 115 | 115 |
4 | 75 | 20 | 90 | 36 | 50 | 52 | 15 | 68 | 17 | 84 | 52 | 100 | 100 | 116 | 116 |
5 | 76 | 21 | 73 | 37 | 51 | 53 | 16 | 69 | 18 | 85 | 53 | 101 | 101 | 117 | 117 |
6 | 77 | 22 | 65 | 38 | 41 | 54 | 11 | 70 | 21 | 86 | 63 | 102 | 102 | 118 | 118 |
7 | 78 | 23 | 66 | 39 | 42 | 55 | 7 | 71 | 22 | 87 | 56 | 103 | 103 | 119 | 119 |
8 | 79 | 24 | 58 | 40 | 35 | 56 | 8 | 72 | 26 | 88 | 64 | 104 | 104 | 120 | 120 |
9 | 80 | 25 | 67 | 41 | 36 | 57 | 5 | 73 | 27 | 89 | 57 | 105 | 105 | 121 | 121 |
10 | 81 | 26 | 59 | 42 | 37 | 58 | 2 | 74 | 28 | 90 | 74 | 106 | 106 | 122 | 122 |
11 | 82 | 27 | 60 | 43 | 29 | 59 | 1 | 75 | 31 | 91 | 91 | 107 | 107 | 123 | 123 |
12 | 83 | 28 | 61 | 44 | 38 | 60 | 0 | 76 | 32 | 92 | 92 | 108 | 108 | 124 | 124 |
13 | 84 | 29 | 62 | 45 | 30 | 61 | 3 | 77 | 33 | 93 | 93 | 109 | 109 | 125 | 125 |
14 | 85 | 30 | 54 | 46 | 23 | 62 | 4 | 78 | 34 | 94 | 94 | 110 | 110 | 126 | 126 |
15 | 86 | 31 | 55 | 47 | 24 | 63 | 6 | 79 | 39 | 95 | 95 | 111 | 111 | 127 | 127 |
表5.2.从系数到差分比例因子的转换表
I | D | I | D | I | D | I | D | I | D | I | D | I | D | I | D |
0 | 60 | 16 | 53 | 32 | 76 | 48 | 34 | 64 | 88 | 80 | 9 | 96 | 96 | 112 | 112 |
1 | 59 | 17 | 68 | 33 | 77 | 49 | 35 | 65 | 22 | 81 | 10 | 97 | 97 | 113 | 113 |
2 | 58 | 18 | 69 | 34 | 78 | 50 | 36 | 66 | 23 | 82 | 11 | 98 | 98 | 114 | 114 |
3 | 61 | 19 | 49 | 35 | 40 | 51 | 37 | 67 | 25 | 83 | 12 | 99 | 99 | 115 | 115 |
4 | 62 | 20 | 50 | 36 | 41 | 52 | 84 | 68 | 0 | 84 | 13 | 100 | 100 | 116 | 116 |
5 | 57 | 21 | 70 | 37 | 42 | 53 | 85 | 69 | 1 | 85 | 14 | 101 | 101 | 117 | 117 |
6 | 63 | 22 | 71 | 38 | 44 | 54 | 30 | 70 | 2 | 86 | 15 | 102 | 102 | 118 | 118 |
7 | 55 | 23 | 46 | 39 | 79 | 55 | 31 | 71 | 3 | 87 | 16 | 103 | 103 | 119 | 119 |
8 | 56 | 24 | 47 | 40 | 80 | 56 | 87 | 72 | 19 | 88 | 17 | 104 | 104 | 120 | 120 |
9 | 64 | 25 | 48 | 41 | 38 | 57 | 89 | 73 | 21 | 89 | 18 | 105 | 105 | 121 | 121 |
10 | 65 | 26 | 72 | 42 | 39 | 58 | 24 | 74 | 90 | 90 | 20 | 106 | 106 | 122 | 122 |
11 | 54 | 27 | 73 | 43 | 81 | 59 | 26 | 75 | 4 | 91 | 91 | 107 | 107 | 123 | 123 |
12 | 66 | 28 | 74 | 44 | 82 | 60 | 27 | 76 | 5 | 92 | 92 | 108 | 108 | 124 | 124 |
13 | 67 | 29 | 43 | 45 | 83 | 61 | 28 | 77 | 6 | 93 | 93 | 109 | 109 | 125 | 125 |
14 | 51 | 30 | 45 | 46 | 32 | 62 | 29 | 78 | 7 | 94 | 94 | 110 | 110 | 126 | 126 |
15 | 52 | 31 | 75 | 47 | 33 | 63 | 86 | 79 | 8 | 95 | 95 | 111 | 111 | 127 | 127 |
第二,将max_scalefactor解码为8位无符号整数。对于所有的比例因子而言,对偏移值(即max_scalefactor)与所有比例因子之间的差值进行算术编码。从max_scalefactor中减去差值符号就能够得到比例因子。对以上差值进行解码的算术模型为构成位流的元素之一,并且该模型是从已经解码的位流中分离出来的。
以下伪码说明对基准层以及其他增强层的比例因子进行解码的方法。
for(ch=0;ch<nch;ch++) if(scf_coding[ch]==1) for(g=0;g<num_window_group;g++) for(sfb=layer_sfb[layer];sfb<layer_sfb[layer+1];sfb++){ sf[ch][g][sfb]=max_scalefactor-arithmetic_decoding(); } } } else{ for(g=0;g<num_window_group;g++){ for(sfb=layer_sfb[layer];sfb<layer_sfb[layer+1];sfb++) tmp_index=arithmetic_decoding(); if(tmp_index==54) tmp_index=54+arithmetic_decoding(); if(sfb==0) tmp_index=max_scalefactor-tmp_index; else tmp_index=sf[ch][g][sfb-1]-tmp_index; sf[ch][g][sfb]=index2sf[tmp_index]; } } } }
这里,layer_sfb[layer]是对各增强层中的比例因子进行解码所需的起始比例因子频带,而layer_sfb[layer+1]是结束比例因子频带。
2.1.5.2.算术模型系数的解码
将频率分量划分为具有32个频率系数的编码频带,以便进行无损编码。编码频带是无损编码中使用的基本部件。
算术编码模型系数是与模型各的信息,其中该模型用于对各频带的位片式数据进行算术编码/解码,该系数表示在算术编码/解码过程中采用表4.4所列模型中的哪个模型。
[表4.4]BSAC算术模型参数
ArModel索引 | 编码频带的分配位 | 模型列表 | ArModel索引 | 编码频带的分配位 | 模型列表 |
0 | 0 | 表6.1 | 16 | 8 | 表6.16 |
1 | - | 未用 | 17 | 8 | 表6.17 |
2 | 1 | 表6.2 | 18 | 9 | 表6.18 |
3 | 1 | 表6.3 | 19 | 9 | 表6.19 |
4 | 2 | 表6.4 | 20 | 10 | 表6.20 |
5 | 2 | 表6.5 | 21 | 10 | 表6.21 |
6 | 3 | 表6.6 | 22 | 11 | 表6.22 |
7 | 3 | 表6.7 | 23 | 11 | 表6.23 |
8 | 4 | 表6.8 | 24 | 12 | 表6.24 |
9 | 4 | 表6.9 | 25 | 12 | 表6.25 |
10 | 5 | 表6.10 | 26 | 13 | 表6.26 |
11 | 5 | 表6.11 | 27 | 13 | 表6.27 |
12 | 6 | 表6.12 | 28 | 14 | 表6.28 |
13 | 6 | 表6.13 | 29 | 14 | 表6.29 |
14 | 7 | 表6.14 | 30 | 15 | 表6.30 |
15 | 7 | 表6.15 | 31 | 15 | 表6.31 |
计算偏移值与所有算术编码模型系数之间的差值,随后利用表4.3所列模型对差分符号进行算术编码。这里,在表4.3所列的四个模型中,ArModel_model的值表示所使用的模型,并以2比特的长度将该模型存储在位流中。偏移值为存储在位流中的长度为5比特的min_ArModel的值。按照编码过程的相反次序对差分符号进行解码,随后将差分符号累加到偏移值中,以便恢复算术编码模型系数。
以下伪码说明对各增强层内的算术编码模型系数以及ArModel[cband]进行解码的方法。
for(ch=0;ch<nch;ch++) for(sfb=layer_sfb[layer];sfb<layer_sfb[layer+1];sfb++) for(g=0;g<num_window_group;g++){ band=(sfb*num_window_group)+g for(i=0;swb_offset[band];i<swb_offset[band+1];i+=4){ cband=index2cb(g,i); if(!decode_cband[ch][g][cband]){ ArModel[g][cband]=min_ArModel+arithmetic_decoding(); decode_cband[ch][g][cband]=1; } } }
这里,layer_sfb[layer]是对各增强层中的算术编码模型系数进行解码所需的起始比例因子频带,而layer_sfb[layer+1]是结束比例因子频带。decode_cband[ch][g][cband]是一个标志,该标志表示是(1)否(0)对算术编码模型进行过解码。
2.1.6.位片式数据的解码
以位片顺序形成量化序列。根据四维向量的状态,将每个四维向量划分为两个子向量。为了进行有效压缩,以无损编码方式对两个子向量进行算术编码。确定对各编码频带进行算术编码所使用的模型。将以上信息存储到ArModel中。
如表6.1到表6.31所示,每个算术编码模型是由几个低阶模型组成的。利用某个低阶模型对子向量进行编码。根据需要编码的子向量的位数、向量的有效值或各采样的编码状态,对低阶模型进行分类。根据需要编码的向量的位位置确定向量的有效值。换句话说,随着位片信息是MSB的位片信息、还是下一MSB的位片信息抑或是LSB的位片信息的不同,向量的有效值不同。MSB具有最高有效值,LSB具有最低有效值。当从MSB到LSB进行向量编码时,更新各采样的编码状态值。首先,将编码状态值初始化为0。然后,遇到非零比特值时,就将编码状态值改为1。
[表6.1]BSAC算术模型0
分配位=0
BSAC算术模型1
未用
[表6.2]BSAC算术模型2
分配位=1
[表6.3]BSAC算术模型3分配位=1
[表6.4]BSAC算术模型4分配位=2
[表6.5]BSAC算术模型5分配位=2
[表6.6]BSAC算术模型6分配位=3
[表6.7]BSAC算术模型7分配位=3
[表6.8]BSAC算术模型8分配位=4
[表6.9]BSAC算术模型9分配位=4
[表6.10]BSAC算术模型10分配位(Abit)=5
[表6.11]BSAC算术模型11分配位(Abit)=5
snf | pre_state | 维 | 累加频率 |
1 | 0 | 4 | 14858,13706,12545,11545,10434,9479,8475,7619,6457,5456,4497,3601,2600,1720,862,0 |
snf | pre_state | 维 | 累加频率 |
1 | 0 | 4 | 5476,4279,3542,3269,2545,2435,2199,2111,850,739,592,550,165,21,0 |
snf | pre_state | 维 | 累加频率 |
2 | 0 | 4 | 4299,3445,2583,2473,1569,1479,1371,1332,450,347,248,219,81,50,15,0 |
1 | 0 | 4 | 15290,14389,13434,12485,11559,10627,9683,8626,7691,5767,4655,3646,2533,1415,0 |
3 | 15139,13484,11909,9716,8068,5919,3590,0 | ||
2 | 14008,10384,6834,0 |
1 | 11228,0 | ||
1 | 4 | 10355,9160,7553,7004,5671,4902,4133,3433,1908,1661,1345,1222,796,714,233,0 | |
3 | 8328,6615,4466,3586,1759,1062,321,0 | ||
2 | 4631,2696,793,0 | ||
1 | 968,0 |
snf | pre_state | 维 | 累加频率 |
2 | 0 | 4 | 3119,2396,1878,1619,1076,1051,870,826,233,231,198,197,27,26,1,0 |
1 | 0 | 4 | 3691,2897,2406,2141,1752,1668,1497,1404,502,453,389,368,131,102,18,0 |
3 | 11106,8393,6517,4967,2739,2200,608,0 | ||
2 | 10771,6410,2619,0 | ||
1 | 6112,0 | ||
1 | 4 | 11484,10106,7809,7043,5053,3521,2756,2603,2296,2143,1990,1531,765,459,153,0 | |
3 | 10628,8930,6618,4585,2858,2129,796,0 | ||
2 | 7596,4499,1512,0 | ||
1 | 4155,0 |
Snf | pre_state | 维 | 累加频率 |
3 | 0 | 4 | 2845,2371,1684,1524,918,882,760,729,200,198,180,178,27,25,1,0 |
2 | 0 | 4 | 1621,1183,933,775,645,628,516,484,210,207,188,186,39,35,1,0 |
3 | 8800,6734,4886,3603,1326,1204,104,0 | ||
2 | 8869,5163,1078,0 | ||
1 | 3575,0 | ||
1 | 4 | 12603,12130,10082,9767,8979,8034,7404,6144,4253,3780,3150,2363,1575,945,630,0 | |
3 | 10410,8922,5694,4270,2656,1601,533,0 | ||
2 | 8459,5107,1670,0 | ||
1 | 4003,0 | ||
1 | 0 | 4 | 5185,4084,3423,3010,2406,2289,2169,2107,650,539,445,419,97,61,15,0 |
3 | 13514,11030,8596,6466,4345,3250,1294,0 | ||
2 | 13231,8754,4635,0 | ||
1 | 9876,0 | ||
1 | 4 | 14091,12522,11247,10299,8928,7954,6696,6024,4766,4033,3119,2508,1594,1008,353,0 | |
3 | 12596,10427,7608,6003,3782,2580,928,0 |
2 | 10008,6213,2350,0 | ||
1 | 5614,0 |
snf | pre_state | 维 | 累加频率 |
3 | 0 | 4 | 3833,3187,2542,2390,1676,1605,1385,1337,468,434,377,349,117,93,30,0 |
2 | 0 | 4 | 6621,5620,4784,4334,3563,3307,2923,2682,1700,1458,1213,1040,608,431,191,0 |
3 | 11369,9466,7519,6138,3544,2441,1136,0 | ||
2 | 11083,7446,3439,0 | ||
1 | 8823,0 | ||
1 | 4 | 12027,11572,9947,9687,9232,8126,7216,6176,4161,3705,3055,2210,1235,780,455,0 | |
3 | 9566,7943,4894,3847,2263,1596,562,0 | ||
2 | 7212,4217,1240,0 | ||
1 | 3296,0 | ||
1 | 0 | 4 | 14363,13143,12054,11153,10220,9388,8609,7680,6344,5408,4578,3623,2762,1932,1099,0 |
3 | 14785,13256,11596,9277,7581,5695,3348,0 | ||
2 | 14050,10293,6547,0 | ||
1 | 10948,0 | ||
1 | 4 | 13856,12350,11151,10158,8816,7913, |
6899,6214,4836,4062,3119,2505,1624,1020,378,0 | |||
3 | 12083,9880,7293,5875,3501,2372,828,0 | ||
2 | 8773,5285,1799,0 | ||
1 | 4452,0 |
snf | pre_state | 维 | 累加频率 |
4 | 0 | 4 | 2770,2075,1635,1511,1059,1055,928,923,204,202,190,188,9,8,1,0 |
3 | 0 | 4 | 1810,1254,1151,1020,788,785,767,758,139,138,133,132,14,13,1,0 |
3 | 7113,4895,3698,3193,1096,967,97,0 | ||
2 | 6858,4547,631,0 | ||
1 | 4028,0 | ||
1 | 4 | 13263,10922,10142,9752,8582,7801,5851,5071,3510,3120,2730,2340,1560,780,390,0 | |
3 | 12675,11275,7946,6356,4086,2875,1097,0 | ||
2 | 9473,5781,1840,0 | ||
1 | 3597,0 | ||
2 | 0 | 4 | 2600,1762,1459,1292,989,983,921,916,238,233,205,202,32,30,3,0 |
3 | 10797,8840,6149,5050,2371,1697,483,0 | ||
2 | 10571,6942,2445,0 |
1 | 7864,0 | ||
1 | 4 | 14866,12983,11297,10398,9386,8683,7559,6969,5451,4721,3484,3007,1882,1208,590,0 | |
3 | 12611,10374,8025,6167,4012,2608,967,0 | ||
2 | 10043,6306,2373,0 | ||
1 | 5766,0 | ||
1 | 0 | 4 | 6155,5057,4328,3845,3164,2977,2728,2590,1341,1095,885,764,303,188,64,0 |
3 | 12802,10407,8142,6263,3928,3013,1225,0 | ||
2 | 13131,9420,4928,0 | ||
1 | 10395,0 | ||
1 | 4 | 14536,13348,11819,11016,9340,8399,7135,6521,5114,4559,3521,2968,1768,1177,433,0 | |
3 | 12735,10606,7861,6011,3896,2637,917,0 | ||
2 | 9831,5972,2251,0 | ||
1 | 4944,0 |
snf | pre_state | 维 | 累加频率 |
4 | 0 | 4 | 3383,2550,1967,1794,1301,1249,1156,1118,340,298,247,213,81,54,15,0 |
3 | 0 | 4 | 7348,6275,5299,4935,3771,3605,2962,2818,1295,1143,980,860,310,230,75, |
0 | |||
3 | 9531,7809,5972,4892,2774,1782,823,0 | ||
2 | 11455,7068,3383,0 | ||
1 | 9437,0 | ||
1 | 4 | 12503,9701,8838,8407,6898,6036,4527,3664,2802,2586,2371,2155,1293,431,215,0 | |
3 | 11268,9422,6508,5277,3076,2460,1457,0 | ||
2 | 7631,3565,1506,0 | ||
1 | 2639,0 | ||
2 | 0 | 4 | 11210,9646,8429,7389,6252,5746,5140,4692,3350,2880,2416,2014,1240,851,404,0 |
3 | 12143,10250,7784,6445,3954,2528,1228,0 | ||
2 | 10891,7210,3874,0 | ||
1 | 9537,0 | ||
1 | 4 | 14988,13408,11860,10854,9631,8992,7834,7196,5616,4793,3571,2975,1926,1212,627,0 | |
3 | 12485,10041,7461,5732,3669,2361,940,0 | ||
2 | 9342,5547,1963,0 | ||
1 | 5410,0 | ||
1 | 0 | 4 | 14152,13258,12486,11635,11040,10290,9740,8573,7546,6643,5903,4928,4005,2972,1751,0 |
3 | 14895,13534,12007,9787,8063,5761,3570,0 | ||
2 | 14088,10108,6749,0 | ||
1 | 11041,0 | ||
1 | 4 | 14817,13545,12244,11281,10012,8952,7959,7136,5791,4920,3997,3126,2105,1282,623,0 | |
3 | 12873,10678,8257,6573,4186,2775,1053,0 | ||
2 | 9969,6059,2363,0 | ||
1 | 5694,0 |
snf | pre_state | 维 | 累加频率 |
Abit | 0 | 4 | 2335,1613,1371,1277,901,892,941,833,141,140,130,129,24,23,1,0 |
Abit-1 | 0 | 4 | 1746,1251,1038,998,615,611,583,582,106,104,101,99,3,2,1,0 |
3 | 7110,5230,4228,3552,686,622,46,0 | ||
2 | 6101,2575,265,0 | ||
1 | 1489,0 | ||
1 | 4 | 13010,12047,11565,11803,9637,8673,6264,5782,4336,3855,3373,2891,2409,1927,963,0 | |
3 | 10838,10132,8318,7158,5595,3428,2318,0 | ||
2 | 8209,5197,1287,0 | ||
1 | 4954,0 |
Abit-2 | 0 | 4 | 2137,1660,1471,1312,1007,1000,957,951,303,278,249,247,48,47,1,0 |
3 | 9327,7413,5073,4391,2037,1695,205,0 | ||
2 | 8658,5404,1628,0 | ||
1 | 5660,0 | ||
1 | 4 | 13360,12288,10727,9752,8484,7899,7119,6631,5363,3900,3023,2535,1852,1267,585,0 | |
3 | 13742,11685,8977,7230,5015,3427,1132,0 | ||
2 | 10402,6691,2828,0 | ||
1 | 5298,0 | ||
Abit-3 | 0 | 4 | 4124,3181,2702,2519,1949,1922,1733,1712,524,475,407,78,52,15,0 |
3 | 10829,8581,6285,4865,2539,1920,594,0 | ||
2 | 11074,7282,3092,0 | ||
1 | 8045,0 | ||
1 | 4 | 14541,13343,11637,10862,9328,8783,7213,6517,5485,5033,4115,3506,2143,1555,509,0 | |
3 | 13010,11143,8682,7202,4537,3297,1221,0 | ||
2 | 9941,5861,2191,0 | ||
1 | 5340,0 | ||
其 他snf | 0 | 4 | 9845,8235,7126,6401,5551,5131,4664,4320,2908,2399,1879,1506,935,603,27 |
7,0 | |||
3 | 13070,11424,9094,7203,4771,3479,1486,0 | ||
2 | 13169,9298,5406,0 | ||
1 | 10371,0 | ||
1 | 4 | 14766,13685,12358,11442,10035,9078,7967,7048,5842,5006,4058,3400,2350,1612,659,0 | |
3 | 13391,11189,8904,7172,4966,3183,1383,0 | ||
2 | 10280,6372,2633,0 | ||
1 | 5419,0 |
snf | pre_State | 维 | 累加频率 |
Abit | 0 | 4 | 2872,2294,1740,1593,1241,1155,1035,960,339,300,261,247,105,72,34,0 |
Abit-1 | 0 | 4 | 3854,3090,2469,2276,1801,1685,1568,1505,627,539,445,400,193,141,51,0 |
3 | 10654,8555,6875,4976,3286,2229,826,0 | ||
2 | 10569,6180,2695,0 | ||
1 | 6971,0 | ||
1 | 4 | 11419,11 170,10922,10426,7943,6950,3723,3475,1737,1489,1241,992,744,496,248,0 | |
3 | 11013,9245,6730,4962,3263,3263,1699,883,0 | ||
2 | 6969,4370,1366,0 |
1 | 3166,0 | ||
Abit-2 | 0 | 4 | 9505,8070,6943,6474,5305,5009,4290,4029,2323,1911,1591,1363,653,443,217,0 |
3 | 11639,9520,7523,6260,4012,2653,1021,0 | ||
2 | 12453,8284,4722,0 | ||
1 | 9182,0 | ||
1 | 4 | 13472,12294,10499,9167,7990,7464,6565,6008,4616,3747,2818,2477,1641,1084,557,0 | |
3 | 13099,10826,8476,6915,4488,2966,1223,0 | ||
2 | 9212,5772,2053,0 | ||
1 | 4244,0 | ||
Abit-3 | 0 | 4 | 14182,12785,11663,10680,9601,8748,8135,7353,6014,5227,4433,3727,2703,1818,866,0 |
3 | 13654,11814,9714,7856,5717,3916,2112,0 | ||
2 | 12497,8501,4969,0 | ||
1 | 10296,0 | ||
1 | 4 | 15068,13770,12294,11213,10230,9266,8439,7438,6295,5368,4361,3620,2594,1797,895,0 | |
3 | 13120,10879,8445,6665,4356,2794,1047,0 | ||
2 | 9311,5578,1793,0 | ||
1 | 4695,0 |
其 他snf | 0 | 4 | 15173,14794,14359,13659,13224,12600,11994,11067,10197,9573,9081,7624,6697,4691,3216,0 |
3 | 15328,13985,12748,10084,8587,6459,4111,0 | ||
2 | 14661,11179,7924,0 | ||
1 | 11399,0 | ||
1 | 4 | 14873,13768,12458,11491,10229,9164,7999,7186,5992,5012,4119,3369,2228,1427,684,0 | |
3 | 13063,10913,8477,6752,4529,3047,1241,0 | ||
2 | 10101,6369,2615,0 | ||
1 | 5359,0 |
[表6.12]BSAC算术模型12
与BSAC算术模型10相同,但分配位=6
[表6.13]BSAC算术模型13
与BSAC算术模型11相同,但分配位=6
[表6.14]BSAC算术模型14
与BSAC算术模型10相同,但分配位=7
[表6.15]BSAC算术模型15
与BSAC算术模型11相同,但分配位=7
[表6.16]BSAC算术模型16
与BSAC算术模型10相同,但分配位=8
[表6.17]BSAC算术模型17
与BSAC算术模型11相同,但分配位=8
[表6.18]BSAC算术模型18
与BSAC算术模型10相同,但分配位=9
[表6.19]BSAC算术模型19
与BSAC算术模型11相同,但分配位=9
[表6.20]BSAC算术模型20
与BSAC算术模型10相同,但分配位=10
[表6.21]BSAC算术模型21
与BSAC算术模型11相同,但分配位=10
[表6.22]BSAC算术模型22
与BSAC算术模型10相同,但分配位=11
[表6.23]BSAC算术模型23
与BSAC算术模型11相同,但分配位=11
[表6.24]BSAC算术模型24
与BSAC算术模型10相同,但分配位=12
[表6.25]BSAC算术模型25
与BSAC算术模型11相同,但分配位=12
[表6.26]BSAC算术模型26
与BSAC算术模型10相同,但分配位=13
[表6.27]BSAC算术模型27
与BSAC算术模型11相同,但分配位=13
[表6.28]BSAC算术模型28
与BSAC算术模型10相同,但分配位=14
[表6.29]BSAC算术模型29
与BSAC算术模型11相同,但分配位=14
[表6.30]BSAC算术模型30
与BSAC算术模型10相同,但分配位=15
[表6.31]BSAC算术模型31
与BSAC算术模型11相同,但分配位=15
两个子向量为1到4维向量。按照从MSB到LSB,从较低频率分量到较高频率分量的次序,对以上子向量进行算术编码。在将位片式数据传输到编码频带组中各编码频带之前,按照从低频到高频的次序,在位流内预先存储算术编码中所使用的算术编码模型系数。
对各位片式数据进行算术编码以得到编码字系数。通过利用以下伪码进行位耦合,将以上系数恢复为原始量化数据。
‘pre_state[]’为一状态,该状态表示当前解码值是否为0。‘snf’为经过解码的向量的有效值。‘idx0’为编码字系数,其预状态为0。‘idx1’为编码字系数,其预状态为1。‘dec_sample[]’为经过解码的数据。‘start_i’为经过解码的向量的起始频率行号。
for(i=start_i;i<(start_i+4);i++){ i(pre_state[i]){ if(idx1 & 0x01) <!-- SIPO <DP n="51"> --> <dp n="d51"/> dec_sample[i]|=(1<<(snf-1)) idx1>>=1; } else{ if(idx0 & 0x01) dec_sample[i]|=(1<<(snf-1)) idx0>>=1; } }
在按照从MSB到LSB的次序,对量化频率分量的位片式数据进行编码时,对非零频率系数的符号位进行算术编码。用1表示负(-)符号位,用0表示正(+)符号位。
因此,如果在解码器内对位片式数据进行算术解码,并且首先遇到经过算术解码的非零位值,则随后为位流中的符号信息,即acode_sign。借助表5.9所列模型,利用以上信息对sign_bit进行算术解码。如果sign_bit为1,则按如下方式,通过耦合分离数据将符号信息赋予量化数据(y)。
if(y!=0)
if(sign_bit==1)
y=-y
2.2.M/S立体声处理部件(可选模块)
根据位流中包含的标志以及ms_used[],确定各比例因子频带是否采用了M/S立体声处理部件。如果采用了该部件,就采用ACC中说明的相同过程进行M/S立体声处理。
2.3.预测部件(可选模块)
根据位流中包含的标志以及prediction_present,确定各比例因子频带是否采用了预测部件。如果采用了该部件,就采用ACC中说明的相同过程进行预测。
2.4.立体声强度处理部件(可选模块)
根据位流中包含的标志以及stereo_info,确定各比例因子频带是否采用了立体声强度处理部件。如果采用了该部件,就采用ACC中说明的相同过程进行立体声强度处理。
2.5.TNS部件(可选模块)
根据位流中包含的标志以及tns_present,确定是否采用了TNS部件。如果采用了该部件,就采用ACC中说明的相同过程进行TNS处理。
2.6.反向量化
反向量化部件将经过解码的比例因子与量化数据恢复为具有原始数值的信号。ACC标准说明了反向量化过程。
2.7.频率/时间映射
频率/时间映射部件将频域音频信号反演为时域信号,以便用户重播。ACC标准定义了将频域信号映射为时域信号的公式。此外,ACC标准还说明了各种术语,如与映射各的窗口。
本发明提供与常规编码器类似的性能,从而能够处理单声道信号和立体声信号以满足不同用户需求,同时形成可伸缩的位流,其中常规编码器仅仅考虑在较高的位率进行压缩。换句话说,根据用户请求,将各层的位率信息融合到某位流中而无需叠加,从而提供具有较好音质的位流。此外,在发送端和接收端之间不需要转换器。另外,本发明可以适应任何传输通道状态以及各种用户请求。
此外,可伸缩性适用于立体声信号,也适用于单声道信号。
可以将本发明沿用于具有以下模块的常规音频编码/解码装置,从而改进在不同位率下的性能,其中该模块用于提高编码/解码的效率。
此外,在本发明中,在使用ACC标准中所采用的基本模块(如时间/频率映射模块或量化模块)时,仅利用位片式编码方法取代无损编码模块,以便提供可伸缩性。
由于位流是可伸缩的,所以某位流可以包含具有各种位率的不同位流。与常规编码器不同,根据本发明的可伸缩的编码器具有精细分层的增强层,从而推广了应用范围。
此外,与其他可伸缩的编码解码器不同,在较高位率提供优良音质。
如果联合本发明与ACC标准,则在顶层位率下,也能够获得几乎相同的音质。
根据本发明,在利用诸如MPEG-2 ACC标准之类的常规音频算法时,只是无损编码部件与常规部件不同。因此,以ACC位流方式,对频域上的量化信号进行解码,并且能够根据经过解码的信号生成可伸缩的BSAC位流。换句话说,提供无损解码。此外,可以按照相反次序,根据可伸缩的BSAC位流生成ACC位流。由于以上功能,所以能够根据其环境转换使用仅仅为提高编码效率而生成的各种ACC位流。因此,为了提供可伸缩性,单个编码装置并不需要两倍或三倍的工作量来生成提供可伸缩性所需的位流。
此外,本发明具有良好的编码效率,即,如同常规编码技术一样,在固定位率呈现最佳性能,并且本发明涉及编码/解码方法和装置,其中恢复为适应多媒体技术的来临而编码的位率。此外,根据本发明,可以在某个位流内表示所有增强层的位率数据。因此,根据用户解码器的性能以及传输通道的带宽/拥塞或者根据用户请求,可以控制位率的高低以及其复杂性。
Claims (24)
1.一种可伸缩的立体声音频编码方法,该方法将音频信号编码为具有一层基准层和至少两层增强层的分层数据流,该方法包括以下步骤:
对各预定编码频带的音频输入信号进行信号处理和量化;
对量化数据中与基准层相对应的量化数据进行编码;
对对应于基准层的下一增强层相对应的量化数据进行编码,以及对由于层数限制未编码而又属于编码层的剩余量化数据进行编码;以及
对所有增强层顺序执行层编码步骤以便形成位流,其中执行基准层编码步骤、增强层编码步骤以及顺序编码步骤,从而可以利用相同的预定数字表示边信息以及与编码层相对应的量化数据;随后按照从MSB序列到LSB序列的次序,利用先验概率模型进行算术编码,以预定向量组轮流对位片式左声道数据和右声道数据进行编码。
2.根据权利要求1的可伸缩的立体声音频编码方法,其中边信息至少包括比例因子和算术编码所使用的各概率模型的信息。
3.根据权利要求1的可伸缩的立体声音频编码方法,其中预定向量是通过将四个位片式音频声道数据耦合为一个向量而生成的四维向量。
4.根据权利要求3的可伸缩的立体声音频编码方法,其中根据预状态将四维向量划分为两个子向量,以便进行编码,其中预状态表示是否对非零位片式频率分量进行过编码。
5.根据权利要求2的可伸缩的立体声音频编码方法,其中对比例因子进行编码的步骤包括以下步骤:
获得最大比例因子;
获得最大比例因子与第一比例因子的差值,对该差值进行算术编码;以及
获得紧接前一个算术编码的比例因子与第一比例因子之后各比例因子的差值,将该差值映射为预定值,并对映射值进行算术编码。
6.根据权利要求5的可伸缩的立体声音频编码方法,其中在映射步骤中使用表5.1所列的概率模型。
7.根据权利要求2的可伸缩的立体声音频编码方法,其中对比例因子进行编码的步骤包括以下步骤:
获得最大比例因子;以及
获得最大比例因子与各比例因子的差值,并对该差值进行算术编码。
8.根据权利要求1的可伸缩的立体声音频编码方法,其中为了得到分层结构,对通常用于所有频带的标题信息进行编码,随后对利用位片信息形成的各层所需的边信息和量化频率进行编码。
9.根据权利要求1的可伸缩的立体声音频编码方法,其中通过以下步骤完成量化:
将时域上的音频输入信号转换为频域信号;
利用时间/频率映射以预定比例因子频带信号的方式耦合转换信号,计算各比例因子频带的屏蔽阈值;
进行时域噪声整形,以便控制各转换窗口内量化噪声的瞬时形状;
进行立体声强度处理,从而仅对两条声道中一条声道的比例因子频带的量化信息进行编码,并且仅传输另一条声道的比例因子;
预测当前帧的频率系数;
进行M/S立体声处理,以便将左声道信号和右声道信号转换为两个信号的相加信号以及其相减信号;和
对各预定编码频带的信号进行量化,从而各频带的量化噪声小于屏蔽阈值。
10.根据权利要求1的可伸缩的立体声音频编码方法,其中当量化数据是由符号数据和数值数据组成时,基准层和增强层编码以及位流形成步骤还包括以下步骤:
对由数值数据的最高有效数字构成的最高有效数字序列进行算术编码;
对与编码最高有效数字序列中非零数据相对应的符号数据进行编码;
对数字数据的未编码数值数据中的最高有效数值序列进行编码;
对编码与编码数字序列中非零数值数据相对应的符号数据中的未编码符号数据进行编码;以及
对数字数据的各数字执行数值编码步骤和符号编码步骤,按预定向量组对左声道数据和右声道数据轮流执行各步骤。
11.一种可伸缩的音频编码装置,该装置包括:
量化部件,该部件用于各编码频带的音频输入信号的信号处理和量化;
位片式算术编码部件,该部件用于编码所有层的位流从而具有分层结构,通过限制基准层的频带实现可伸缩,该部件还用于编码与基准层相对应的边信息,从最高有效位序列到最低有效位序列、从较低频率分量到较高频率分量对量化信息进行顺序编码,以预定向量组轮流对左声道数据和右声道数据进行编码,对与基准层的下一增强层相对应的边信息和量化数据进行编码;以及
位流形成部件,该部件用于收集量化部件和位片式算术编码部件生成的数据并且生成位流;
其中所述量化部件包括:
时间/频率映射部件,该部件将时域上的音频输入信号转换位频域信号;
音质部件,该部件通过时间/频率映射利用预定比例因子频带的信号连接转换信号,该部件还利用各信号相互影响而产生的屏蔽现象计算各比例因子频带的屏蔽阈值。
12.根据权利要求11的可伸缩的音频编码装置,该装置还包括:
时域噪声整形(TNS)部件,该部件进行时域噪声整形以便控制各转换窗口内量化噪声的瞬时形状;
立体声强度处理部件,该部件进行立体声强度处理,从而仅对两个声道中之一个声道的比例因子频带的量化信息进行编码,传输另一个声道的比例因子;
预测部件,该部件预测当前帧的频率系数;以及
M/S立体声处理部件,该部件进行M/S立体声处理,以便将左声道信号和右声道信号转换为两个信号的相加信号及其相减信号。
13.一种可伸缩的立体声音频解码方法,该方法用于解码音频数据编码以便具有分层位率,该方法包括以下步骤:
分析具有分层结构的位流中各模块所需的数据;
按具有分层结构的位流中各层的建立次序,至少解码比例因子、算术编码模型系数和量化数据,其中按照从较高有效位到较低有效位的顺序,通过分析构成位流的位的有效性,轮流对各声道的量化数据进行解码;
将经过解码的比例因子和量化数据恢复位具有原始数值的信号;以及
将量化信号反演为时域信号。
14.根据权利要求13的可伸缩的立体声音频解码方法,该方法还包括以下步骤:
进行M/S立体声处理,以便检查是否在位流编码方法中进行过M/S立体声处理,并且如果进行过M/S立体声处理,就将左声道信号和右声道信号转换为两个信号的相加信号以及其相减信号;
检测是否在位流编码方法中执行过预测步骤,并且如果执行过预测步骤,就预测当前帧的频率系数;
检测是否在位流编码方法中进行过立体声强度处理,并且如果进行过立体声强度处理,则由于仅对两条声道中之一条声道(左声道)的比例系数频带的量化信息进行过编码,所以进行立体声强度处理以便将另一声道(右声道)的量化信息恢复到左声道值;以及
检测是否在位流编码方法中执行过时域噪声整形(TNS)步骤,并且如果执行过TNS步骤,就进行时域噪声整形以便控制各转换窗口内量化噪声的瞬时形状。
15.根据权利要求13或权利要求14的可伸缩的立体声音频解码方法,其中当量化数据是由符号数据和数值数据组成时,通过顺序解码量化频率分量符号位的数值数据并且耦合数值数据和符号位,恢复量化频率分量。
16.根据权利要求13的可伸缩的立体声音频解码方法,其中按照从最高有效位到最低有效位的顺序执行解码步骤,通过耦合经过解码的位片式数据以及将耦合数据恢复为量化频率分量数据,执行恢复步骤。
17.根据权利要求16的可伸缩的立体声音频解码方法,其中在解码步骤中对数据进行解码,从而将四个样本的位片式信息解码为四维向量组。
18.根据权利要求17的可伸缩的立体声音频解码方法,其中进行四维向量解码,从而对根据预状态编码的两个子向量进行算术解码,并且将根据各样本的编码状态进行解码的两个子向量恢复为四维向量,其中预状态表示是否对非零位片式频率分量进行过编码。
19.根据权利要求15的可伸缩的立体声音频解码方法,其中当根据MSB对各频率分量是位片式数据进行解码时,如果位片式数据为“0”就跳过解码,当位片式数据“1”第一次出现时,就对符号数据进行算术解码。
20.根据权利要求13的可伸缩的立体声音频解码方法,其中通过解码位流中的最大比例因子,算术解码最大比例因子和各比例因子的差值,从最大比例因子中减去该差值,就完成了比例因子的解码。
21.根据权利要求13的可伸缩的立体声音频解码方法,其中解码比例因子的步骤包括以下步骤:
根据位流解码最大比例因子;
通过映射获得最大比例因子与需要解码的比例因子之间的差值,算术解码该差值,根据映射值,对该差值进行逆映射;以及
通过从最大比例因子中减去该差值获得第一比例因子,而通过从前一比例因子中减去该差值获得剩余频带的比例因子。
22.根据权利要求13的可伸缩的立体声音频解码方法,其中通过执行以下步骤完成算术编码模型系数的解码:
解码位流中的最小算术模型系数,解码最小系数与各层边信息中各系数之间的差值,累加最小系数与该差值。
23.一种可伸缩的音频解码装置,该装置用于解码音频数据编码以便具有分层位率,该装置包括:
位流分析部件,该部件分析具有分层结构的位流中各模块所需的数据;
位片式算术解码部件,该部件按具有分层结构的位流中各层的建立次序,至少解码比例因子、算术编码模型系数和量化数据,其中按照从较高有效位到较低有效位的顺序,通过分析构成位流的位的有效性,轮流对各声道的量化数据进行解码;
反向量化部件,该部件将经过解码的比例因子和量化数据恢复位具有原始数值的信号;以及
频率/时间映射部件,该部件将量化信号反演为时域信号。
24.根据权利要求23的可伸缩的立体声音频解码装置,该装置还包括:
进行M/S立体声处理的M/S立体声处理部件,以便检查是否在位流编码方法中进行过M/S立体声处理,并且如果进行过M/S立体声处理,就将左声道信号和右声道信号转换为两个信号的相加信号以及其相减信号;
预测部件,该部件用于检测是否在位流编码方法中执行过预测步骤,并且如果执行过预测步骤,就预测当前帧的频率系数;
立体声强度处理部件,该部件用于检测是否在位流编码方法中进行过立体声强度处理,并且如果进行过立体声强度处理,则由于仅对两条声道之一条声道(左声道)的比例系数频带的量化信息进行过编码,所以进行立体声强度处理以便将另一声道(右声道)的量化信息恢复到左声道值;以及
时域噪声整形(TNS)部件,该部件用于检测是否在位流编码方法中执行过时域噪声整形步骤,并且如果执行过TNS步骤,就进行瞬时噪声处理以便控制各转换窗口内量化噪声的瞬时形状。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019970061605A KR100335611B1 (ko) | 1997-11-20 | 1997-11-20 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
KR61605/1997 | 1997-11-20 | ||
KR61605/97 | 1997-11-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1218334A CN1218334A (zh) | 1999-06-02 |
CN1126265C true CN1126265C (zh) | 2003-10-29 |
Family
ID=19525210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN98115468A Expired - Fee Related CN1126265C (zh) | 1997-11-20 | 1998-07-09 | 可伸缩的立体声音频编码/解码方法和装置 |
Country Status (11)
Country | Link |
---|---|
US (1) | US6529604B1 (zh) |
EP (1) | EP0918407B1 (zh) |
JP (1) | JP3412082B2 (zh) |
KR (1) | KR100335611B1 (zh) |
CN (1) | CN1126265C (zh) |
BR (1) | BR9806404B1 (zh) |
DE (1) | DE69834010T2 (zh) |
ID (1) | ID21304A (zh) |
IL (1) | IL125268A (zh) |
MY (1) | MY120333A (zh) |
RU (1) | RU2197776C2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103430458A (zh) * | 2011-03-10 | 2013-12-04 | 维德约股份有限公司 | 可伸缩视频编码的依存参数集 |
CN101640664B (zh) * | 2008-07-31 | 2014-11-26 | Tcl集团股份有限公司 | 一种互联网门户服务系统及其管理方法 |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6446037B1 (en) | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
KR100612003B1 (ko) * | 2000-02-26 | 2006-08-11 | 삼성전자주식회사 | 통신망에서 비트 스트림 송수신 장치 및 그 방법 |
US6735561B1 (en) * | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US20020133246A1 (en) * | 2001-03-02 | 2002-09-19 | Hong-Kee Kim | Method of editing audio data and recording medium thereof and digital audio player |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
KR100908114B1 (ko) * | 2002-03-09 | 2009-07-16 | 삼성전자주식회사 | 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법 |
KR100462615B1 (ko) | 2002-07-11 | 2004-12-20 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
CN105306067B (zh) * | 2002-09-20 | 2018-09-11 | 株式会社Ntt都科摩 | 算术编码的方法和设备 |
EP1414273A1 (en) | 2002-10-22 | 2004-04-28 | Koninklijke Philips Electronics N.V. | Embedded data signaling |
KR100908116B1 (ko) * | 2002-12-12 | 2009-07-16 | 삼성전자주식회사 | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 |
KR100923297B1 (ko) * | 2002-12-14 | 2009-10-23 | 삼성전자주식회사 | 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치 |
KR100908117B1 (ko) * | 2002-12-16 | 2009-07-16 | 삼성전자주식회사 | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 |
KR100528325B1 (ko) * | 2002-12-18 | 2005-11-15 | 삼성전자주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치 |
CN1748443B (zh) * | 2003-03-04 | 2010-09-22 | 诺基亚有限公司 | 多声道音频扩展支持 |
KR100917464B1 (ko) * | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
KR101015497B1 (ko) * | 2003-03-22 | 2011-02-16 | 삼성전자주식회사 | 디지털 데이터의 부호화/복호화 방법 및 장치 |
KR101000345B1 (ko) * | 2003-04-30 | 2010-12-13 | 파나소닉 주식회사 | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 |
US7620545B2 (en) | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
US20050010396A1 (en) * | 2003-07-08 | 2005-01-13 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
US7349842B2 (en) * | 2003-09-29 | 2008-03-25 | Sony Corporation | Rate-distortion control scheme in audio encoding |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
US7426462B2 (en) * | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
US7283968B2 (en) * | 2003-09-29 | 2007-10-16 | Sony Corporation | Method for grouping short windows in audio encoding |
KR100571824B1 (ko) | 2003-11-26 | 2006-04-17 | 삼성전자주식회사 | 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치 |
KR100537517B1 (ko) * | 2004-01-13 | 2005-12-19 | 삼성전자주식회사 | 오디오 데이타 변환 방법 및 장치 |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
CA2992097C (en) | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
KR100561869B1 (ko) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
EP2270774B1 (en) * | 2004-03-25 | 2016-07-27 | DTS, Inc. | Lossless multi-channel audio codec |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
DE102004042819A1 (de) * | 2004-09-03 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
US7937272B2 (en) * | 2005-01-11 | 2011-05-03 | Koninklijke Philips Electronics N.V. | Scalable encoding/decoding of audio signals |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
BRPI0608753B1 (pt) * | 2005-03-30 | 2019-12-24 | Koninl Philips Electronics Nv | codificador de áudio, decodificador de áudio, método para codificar um sinal de áudio de multicanal, método para gerar um sinal de áudio de multicanal, sinal de áudio de multicanal codificado, e meio de armazenamento |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
US9560349B2 (en) | 2005-04-19 | 2017-01-31 | Koninklijke Philips N.V. | Embedded data signaling |
EP1876585B1 (en) * | 2005-04-28 | 2010-06-16 | Panasonic Corporation | Audio encoding device and audio encoding method |
DE602006011600D1 (de) * | 2005-04-28 | 2010-02-25 | Panasonic Corp | Audiocodierungseinrichtung und audiocodierungsverfahren |
US20060269057A1 (en) * | 2005-05-26 | 2006-11-30 | Groove Mobile, Inc. | Systems and methods for high resolution signal analysis and chaotic data compression |
US8160888B2 (en) * | 2005-07-19 | 2012-04-17 | Koninklijke Philips Electronics N.V | Generation of multi-channel audio signals |
EP1912206B1 (en) * | 2005-08-31 | 2013-01-09 | Panasonic Corporation | Stereo encoding device, stereo decoding device, and stereo encoding method |
KR20070038699A (ko) * | 2005-10-06 | 2007-04-11 | 삼성전자주식회사 | 스케일러블 오디오 데이터 산술복호화 방법 및 장치 |
US20070094035A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
US8238561B2 (en) * | 2005-10-26 | 2012-08-07 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
KR100878766B1 (ko) | 2006-01-11 | 2009-01-14 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 방법과 장치 |
KR100793287B1 (ko) * | 2006-01-26 | 2008-01-10 | 주식회사 코아로직 | 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법 |
KR100654920B1 (ko) * | 2006-05-17 | 2006-12-08 | 케이에스엠기술 주식회사 | 도로의 슬라이딩 스틸그레이팅이 안착되는 배수로 구조 |
US8532984B2 (en) | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8571875B2 (en) * | 2006-10-18 | 2013-10-29 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus encoding and/or decoding multichannel audio signals |
CN101170590B (zh) * | 2006-10-27 | 2011-04-27 | 华为技术有限公司 | 一种背景噪声的编码码流传输的方法、系统及装置 |
JP4275167B2 (ja) * | 2006-11-24 | 2009-06-10 | 株式会社エヌ・ティ・ティ・ドコモ | 送信機 |
KR101336553B1 (ko) * | 2007-02-06 | 2013-12-03 | 한국전자통신연구원 | 계층적 부호화 장치 및 방법 |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
US8594484B2 (en) * | 2007-05-15 | 2013-11-26 | Warner Bros. Entertainment Inc. | DVD player with external connection for increased functionality |
US10182203B2 (en) | 2007-05-15 | 2019-01-15 | Warner Bros. Entertainment Inc. | DVD player with external connection for increased functionality |
EP2158769B1 (en) * | 2007-05-15 | 2014-07-30 | Warner Bros. Entertainment Inc. | Method and apparatus for providing additional functionality to a dvd player |
US8237776B2 (en) * | 2007-10-19 | 2012-08-07 | Warner Bros. Entertainment Inc. | Method and apparatus for generating stereoscopic images from a DVD disc |
WO2009001874A1 (ja) * | 2007-06-27 | 2008-12-31 | Nec Corporation | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
JP5264901B2 (ja) * | 2007-07-06 | 2013-08-14 | フランス・テレコム | デジタルオーディオ信号の階層符号化 |
KR101425354B1 (ko) * | 2007-08-28 | 2014-08-06 | 삼성전자주식회사 | 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
WO2009084918A1 (en) | 2007-12-31 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2009116280A1 (ja) | 2008-03-19 | 2009-09-24 | パナソニック株式会社 | ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法 |
KR101414412B1 (ko) * | 2008-05-09 | 2014-07-01 | 노키아 코포레이션 | 오디오 신호의 인코딩 장치, 오디오 신호의 디코딩 장치, 오디오 신호의 인코딩 방법, 스케일러블 인코딩 오디오 신호의 디코딩 방법, 인코더, 디코더, 전자기기 및 컴퓨터 판독가능한 기록 매체 |
CN101635145B (zh) * | 2008-07-24 | 2012-06-06 | 华为技术有限公司 | 编解码方法、装置和系统 |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
KR101316979B1 (ko) * | 2009-01-28 | 2013-10-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩 |
EP2406954A1 (en) * | 2009-03-13 | 2012-01-18 | Telefonaktiebolaget L M Ericsson (PUBL) | Technique for bringing encoded data items into conformity with a scalable coding protocol |
EP2407962A1 (en) * | 2009-03-13 | 2012-01-18 | Panasonic Corporation | Voice decoding apparatus and voice decoding method |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
WO2011048099A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
BR122021008583B1 (pt) | 2010-01-12 | 2022-03-22 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo |
US9530419B2 (en) * | 2011-05-04 | 2016-12-27 | Nokia Technologies Oy | Encoding of stereophonic signals |
DK2805464T3 (en) * | 2012-01-20 | 2016-07-04 | Sonova Ag | Wireless audio transmission and method |
RU2607998C9 (ru) * | 2012-03-28 | 2017-07-07 | ДжейВиСи КЕНВУД КОРПОРЕЙШН | Устройство кодирования изображения, способ кодирования изображения и программа кодирования изображения, а также устройство декодирования изображения, способ декодирования изображения и программа декодирования изображения |
PL3011557T3 (pl) | 2013-06-21 | 2017-10-31 | Fraunhofer Ges Forschung | Urządzenie i sposób do udoskonalonego stopniowego zmniejszania sygnału w przełączanych układach kodowania sygnału audio podczas ukrywania błędów |
WO2015036352A1 (en) | 2013-09-12 | 2015-03-19 | Dolby International Ab | Coding of multichannel audio content |
EP3614381A1 (en) * | 2013-09-16 | 2020-02-26 | Samsung Electronics Co., Ltd. | Signal encoding method and device and signal decoding method and device |
CN111968656B (zh) | 2014-07-28 | 2023-11-10 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
EP3107096A1 (en) | 2015-06-16 | 2016-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downscaled decoding |
EP3503574B1 (en) * | 2017-12-22 | 2021-10-27 | FalCom A/S | Hearing protection device with multiband limiter and related method |
CN117476016A (zh) * | 2022-07-27 | 2024-01-30 | 华为技术有限公司 | 音频编解码方法、装置、存储介质及计算机程序产品 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5341457A (en) * | 1988-12-30 | 1994-08-23 | At&T Bell Laboratories | Perceptual coding of audio signals |
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
US5291557A (en) * | 1992-10-13 | 1994-03-01 | Dolby Laboratories Licensing Corporation | Adaptive rematrixing of matrixed audio signals |
JPH0787033A (ja) * | 1993-09-17 | 1995-03-31 | Sharp Corp | ステレオ音声信号符号化装置 |
KR100269213B1 (ko) * | 1993-10-30 | 2000-10-16 | 윤종용 | 오디오신호의부호화방법 |
JPH07170193A (ja) * | 1993-12-15 | 1995-07-04 | Matsushita Electric Ind Co Ltd | マルチチャネル・オーディオ符号化方法 |
KR960012475B1 (ko) * | 1994-01-18 | 1996-09-20 | 대우전자 주식회사 | 디지탈 오디오 부호화장치의 채널별 비트 할당 장치 |
US5694332A (en) * | 1994-12-13 | 1997-12-02 | Lsi Logic Corporation | MPEG audio decoding system with subframe input buffering |
US5621772A (en) * | 1995-01-20 | 1997-04-15 | Lsi Logic Corporation | Hysteretic synchronization system for MPEG audio frame decoder |
US5910995A (en) * | 1995-11-22 | 1999-06-08 | Sony Corporation Of Japan | DSP decoder for decoding analog SR encoded audio signals |
DE69718735T2 (de) * | 1996-04-10 | 2003-11-13 | Koninklijke Philips Electronics N.V., Eindhoven | Kodiervorrichtung zum kodieren einer vielzahl von informationssignalen |
US6252965B1 (en) * | 1996-09-19 | 2001-06-26 | Terry D. Beard | Multichannel spectral mapping audio apparatus and method |
US5893066A (en) * | 1996-10-15 | 1999-04-06 | Samsung Electronics Co. Ltd. | Fast requantization apparatus and method for MPEG audio decoding |
KR100261253B1 (ko) * | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
US6108584A (en) * | 1997-07-09 | 2000-08-22 | Sony Corporation | Multichannel digital audio decoding method and apparatus |
US6016111A (en) * | 1997-07-31 | 2000-01-18 | Samsung Electronics Co., Ltd. | Digital data coding/decoding method and apparatus |
KR100335609B1 (ko) * | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
JP3352406B2 (ja) * | 1998-09-17 | 2002-12-03 | 松下電器産業株式会社 | オーディオ信号の符号化及び復号方法及び装置 |
-
1997
- 1997-11-20 KR KR1019970061605A patent/KR100335611B1/ko not_active IP Right Cessation
-
1998
- 1998-06-29 US US09/106,016 patent/US6529604B1/en not_active Expired - Lifetime
- 1998-07-06 BR BRPI9806404-5A patent/BR9806404B1/pt not_active IP Right Cessation
- 1998-07-06 DE DE69834010T patent/DE69834010T2/de not_active Expired - Lifetime
- 1998-07-06 EP EP98305341A patent/EP0918407B1/en not_active Expired - Lifetime
- 1998-07-08 IL IL12526898A patent/IL125268A/en not_active IP Right Cessation
- 1998-07-09 CN CN98115468A patent/CN1126265C/zh not_active Expired - Fee Related
- 1998-07-09 RU RU98113925/09A patent/RU2197776C2/ru not_active IP Right Cessation
- 1998-07-09 MY MYPI98003141A patent/MY120333A/en unknown
- 1998-07-10 ID IDP980988A patent/ID21304A/id unknown
- 1998-10-29 JP JP30826398A patent/JP3412082B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101640664B (zh) * | 2008-07-31 | 2014-11-26 | Tcl集团股份有限公司 | 一种互联网门户服务系统及其管理方法 |
CN103430458A (zh) * | 2011-03-10 | 2013-12-04 | 维德约股份有限公司 | 可伸缩视频编码的依存参数集 |
CN103430458B (zh) * | 2011-03-10 | 2016-03-02 | 维德约股份有限公司 | 可伸缩视频编码的依存参数集 |
Also Published As
Publication number | Publication date |
---|---|
EP0918407B1 (en) | 2006-03-29 |
IL125268A (en) | 2002-12-01 |
BR9806404B1 (pt) | 2014-09-16 |
DE69834010T2 (de) | 2006-12-07 |
JPH11317672A (ja) | 1999-11-16 |
ID21304A (id) | 1999-05-20 |
JP3412082B2 (ja) | 2003-06-03 |
CN1218334A (zh) | 1999-06-02 |
RU2197776C2 (ru) | 2003-01-27 |
KR100335611B1 (ko) | 2002-10-09 |
EP0918407A3 (en) | 2000-09-13 |
MY120333A (en) | 2005-10-31 |
KR19990041072A (ko) | 1999-06-15 |
IL125268A0 (en) | 1999-03-12 |
DE69834010D1 (de) | 2006-05-18 |
EP0918407A2 (en) | 1999-05-26 |
US6529604B1 (en) | 2003-03-04 |
BR9806404A (pt) | 1999-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1126265C (zh) | 可伸缩的立体声音频编码/解码方法和装置 | |
CN1131598C (zh) | 可缩放的音频编码/解码方法和装置 | |
CN1209744C (zh) | 编码装置和解码装置 | |
CN1748443A (zh) | 多声道音频扩展支持 | |
CN1132151C (zh) | 多通道声解码器 | |
CN1288625C (zh) | 音频编码与解码设备及其方法 | |
CN1233163C (zh) | 多声道数字音频信号的压缩编码和解码设备及其方法 | |
CN1765072A (zh) | 多声道音频扩展支持 | |
CN1255809C (zh) | 音频编解码方法和设备 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1101087C (zh) | 信号编码方法及装置、信号解码方法及装置和信号传送方法 | |
CN1910655A (zh) | 构造多通道输出信号或生成下混信号的设备和方法 | |
CN1969317A (zh) | 基于多个参数化的多声道重构 | |
CN1161751C (zh) | 语音分析方法和语音编码方法及其装置 | |
CN101036183A (zh) | 立体声兼容的多声道音频编码 | |
CN1871501A (zh) | 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法 | |
CN1890711A (zh) | 将数字信号编码成可扩缩比特流的方法和对可扩缩比特流解码的方法 | |
CN1930608A (zh) | 生成等级参数的设备和方法及生成多通道表示的设备和方法 | |
CN101055719A (zh) | 多声道数字音频编码设备及其方法 | |
CN1702974A (zh) | 用于对数字信号编码/解码的方法和设备 | |
CN1689069A (zh) | 声音编码设备和声音编码方法 | |
CN101048649A (zh) | 可扩展解码装置及可扩展编码装置 | |
CN1156872A (zh) | 语音编码的方法和装置 | |
CN1922660A (zh) | 通信装置和信号编码/解码方法 | |
CN1677493A (zh) | 一种增强音频编解码装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20031029 Termination date: 20150709 |
|
EXPY | Termination of patent right or utility model |