CN104318926A - 基于IntMDCT的无损音频编码方法、解码方法 - Google Patents

基于IntMDCT的无损音频编码方法、解码方法 Download PDF

Info

Publication number
CN104318926A
CN104318926A CN201410514084.0A CN201410514084A CN104318926A CN 104318926 A CN104318926 A CN 104318926A CN 201410514084 A CN201410514084 A CN 201410514084A CN 104318926 A CN104318926 A CN 104318926A
Authority
CN
China
Prior art keywords
mrow
mfrac
msub
mtd
mtr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410514084.0A
Other languages
English (en)
Other versions
CN104318926B (zh
Inventor
宋玉龄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Jiuzhou Electric Group Co Ltd
Original Assignee
Sichuan Jiuzhou Electric Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Jiuzhou Electric Group Co Ltd filed Critical Sichuan Jiuzhou Electric Group Co Ltd
Priority to CN201410514084.0A priority Critical patent/CN104318926B/zh
Publication of CN104318926A publication Critical patent/CN104318926A/zh
Application granted granted Critical
Publication of CN104318926B publication Critical patent/CN104318926B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供一种基于IntMDCT的无损音频编码方法、解码方法,该编码方法包括以下步骤:(1)将音频时域信号x(k)进行分帧,读取得到单帧时域信号x(k),k=0,...,N-1,N为帧长;(2)对时域信号进行IntMDCT变换,得到频域信号X(m),m=0,...,N-1;(3)对频域信号进行Rice编码得到编码码流;该解码方法是编码方法的逆过程,首先对输入的码流文件进行Rice解码,得到频域信号X(m),m=0,...,N-1,然后再进行IntMDCT的逆变换恢复出时域信号x(k),k=0,...,N-1。本发明不需要码表即能自适应得到编码参数,且压缩率值比块自适应Rice更低,适用范围更广。

Description

基于IntMDCT的无损音频编码方法、解码方法
技术领域
本发明涉及无损音频编、解码领域,尤其是涉及一种基于IntMDCT的无损音频编码方法、解码方法。 
背景技术
无损音频编码是指对音频信号进行编码来降低数据量并获得低比特率,不考虑任何信息损失的情况,接收端能够毫无差错的解码出来。 
国际上通常使用的无损音频编码框架主要包含两个步骤:预测/变换和熵编码。预测/变换实质上是去除音频信号的时间和空间上的相关性;而熵编码是去除音频信号间的统计相关性。 
目前两种主流的去相关技术主要有预测和变换。其中,预测是比较常用的方法。预测技术对于音频编码具有一定不足。许多音频片段会周期性出现同样的音调,这种情况下,低阶预测器不能有效进行预测,然而使用高阶预测器也不能完全解决这一问题,因为仅使用一帧音频信号通常不足以得到最佳的预测系数,并且音频信号常常同时伴有多个音调,即使使用针对语音信号性能比较好的预测器也不会有所改善。在频域编码方面,提出了子带编码和变换编码等技术。变换技术用于无损音频编码相对较晚,也得到比较优异的压缩率,但是大多数无损音频编码器仍使用线性预测技术较多,目前仅有LTAC、MPEG-4 SLS以及一些无损音频编码对变换编码技术进行研究。 
数字音频编码技术一般使用的熵编码方法有:游程编码(RLC,Run Length Coding,也称行程编码),霍夫曼Huffman编码,算术编码以及由Huffman演变而来的Golomb/Rice编码,其中Huffman应用范围最广。Rice编码算法是由Robert F.Rice于1979年提出的熵编码算法,它针对Golomb编码的一种特殊情况即m=2k,(k=0,1,...)提出了比较方便且性能较好的编码方法。Rice编码对于Laplacian拉普拉斯分布及几何的概率参数ρ已知的情况下确实是一种最优码,但事实上,Rice编码仍存在问题:概率参数ρ必须已知,最优码的编码参数s才能确定,但是 实际上并不能对整个信源进行充分估计得到最适合的ρ,进而得到最优Rice编码参数s,因此ρ的确定直接影响着Rice编码的效果。目前Rice编码主要有两种自适应编码方法:前向自适应和后向自适应。把前向自适应编码定义为:编码器在编码前先考察数据并测量统计编码参数(通常是平均值),然后将参数值放入首部以供解码器使用,最后再使用该参数对数据编码并写入比特流文件。通常,并不是要同时编码所有数据,因为其带来的延时和复杂度是实时应用中不能承受的。一般使用的方法是“块自适应”编码,即将数据分成小部分,即块,并制定一些块选择规则,比如在SHORTEN、MPEG-4 ALS中,对于每个块,首先计算输入数据的平均值μn,并使用式(其中常数C≈0.97)来估算Rice编码参数s,然后使用参数s对块内数据值编码,即对于与缓冲区内容相匹配的数据部分统计得到参数,并将编码器调整到该参数。但是前向自适应在实际应用中存在一定问题,归结为以下两点: 
(1)编码器需要两次通过每个数据,这在一些应用中会减慢编码过程或增加随机存取存储器的开销,比如数码相机中的图像编码; 
(2)选取合适的块长度尺寸比较困难,如果块尺寸太大,则统计量在块内会剧烈变化,而如果太小,则必须告知解码器哪个参数用于编码使得额外开销变得难以承担。 
另外,有研究分析并总结后向自适应编码方法为,在编码之后使用一定自适应机制对参数进行调整,然后直接用调整后的参数对下一数据进行编码。后向自适应编码方法虽然能避免以上前向自适应存在的问题,但是后向自适应编码效果带有一些不确定性,这是由于编码后的参数调整机制不可能适合所有信源变化情况;后向自适应编码只适用于快速衰减的分布,而对于重尾分布并不是最优码。 
可见,国际上常用的无损音频编、解码方法都存在缺陷,因而有必要对其进行进一步研究。 
发明内容
本发明的目的在于:针对现有技术存在的问题,提供一种基于压缩性能更好的IntMDCT的无损音频编码方法、解码方法。 
本发明的发明目的通过以下技术方案来实现: 
一种基于IntMDCT的无损音频编码方法,其特征在于,该编码方法包括以下 步骤: 
(1)将音频时域信号x(k)进行分帧,读取得到单帧时域信号x(k),k=0,...,N-1,N为帧长; 
(2)对时域信号进行IntMDCT变换,得到频域信号X(m),m=0,...,N-1; 
(3)对频域信号进行Rice编码得到编码码流。 
优选的,所述对时域信号进行IntMDCT变换的方法包括步骤: 
(21)对时域信号进行窗运算/时域混叠消除; 
(22)对前步骤处理后的数据进行DCT-IV变换。 
优选的,步骤(21)中窗运算使用的窗函数为正弦窗,则对时域信号进行窗运算的公式为: x ( N 2 + k ) x ( N 2 - 1 - k ) = cos α k - sin α k sin α k cos α k x ( N 2 + k ) x ( N 2 - 1 - k ) , k = 0 , . . . , N 2 - 1 , 其中, 
α k = arctan ( w ( N 2 - 1 - k ) w ( N 2 + k ) ) = ( N - 2 k - 1 ) π 4 N , k = 0 , . . . , N 2 - 1 ,
利用该公式进行相邻两次窗运算,前一次窗运算的输出序列为x'(0),...,x'(N-1),当前帧窗运算的输出序列为x'(N),...,x'(2N-1),则组合前一次窗运算的后半段输出序列和当前次窗运算的前半段输出序列,然后将此组合的N点序列乘以-1并反序,得到新序列:然后再对此新序列进行DCT-IV变换;同时,当前窗运算输出的后半段需要存储起来供下次DCT-IV变换使用。 
优选的,将半块N/2个“0”值样点和第一块的前半块N/2个样点组合成N点,将最后一块的后半块N/2个样点和半块N/2个“0”值样点组合成N点。 
优选的,DCT-IV变换的公式为: X ( m ) = 2 N Σ k = 0 N - 1 x ( k ) cos ( 2 k + 1 ) ( 2 m + 1 ) π 4 N ,  m=0,...,N-1。 
优选的,在IntMDCT中,所有运算都首先被分解为Givens旋转,然后对Givens旋转进行一系列的提升,且每次提升后都有一次取整操作以保证变换的可逆性,其中,DCT-IV变换的提升公式为:式中,x={x(k)}k=0,1,...,N-1,X={X(m)}m=0,1,...,N-1为DCT-IV变换核;  C N IV = I N / 2 0 H 1 I N / 2 I N / 2 H 2 0 I N / 2 I N / 2 0 H 3 + K 1 I N / 2 - D N / 2 K 2 0 I N / 2 I N / 2 0 K 3 I N / 2 P N , 该式中,  K 1 = - ( C N / 2 IV D N / 2 + 2 I N / 2 ) · C N / 2 IV , K 2 = C N / 2 IV / 2 , K 3 = 2 C N / 2 IV · D N / 2 + I N / 2 其中代表变换长度为N/2的DCT-IV矩阵, 
优选的,对频域信号进行Rice编码时,采用带阈值的点自适应Rice编码方法,包括步骤: 
(31)对输入的数据x,编码参数为s,令商q和余数r分别为:r=x-q·2s; 
(32)写符号位:若x≥0,则为“0”,反之,则为“1”;对r编码:用s位进行二进制表示;对q编码:采用TH-Rice对q进行阈值处理,若q>TH,经过TH-Rice后得到的高阶比特位MSBs=TH+2·O,若q≤TH,经过TH-Rice后得到的高阶比特位MSBs=q+1,其中TH为一个事先设定好的常量; 
(33)对r编码得到的比特位数定为低阶比特位LSBs,且LSBs=s;然后将符号位、低阶比特位LSBs、高阶比特位MSBs组合在一起,即完成数据x的编码。 
优选的,编码参数为s的计算公式: 其中,BN(xi)代表xi的二进制位数,HI为一个事先设定好的常量。 
优选的,所述HI=19,所述TH=3。 
一种基于IntMDCT的无损音频解码方法,其特征在于,该解码方法是编码方法的逆过程,首先对输入的码流文件进行Rice解码,得到频域信号X(m),m=0,...,N-1,然后再进行IntMDCT的逆变换恢复出时域信号x(k),k=0,...,N-1。 
与现有技术相比,本发明具有以下优点: 
1、由于IntMDCT谱系数的概率分布接近于几何分布,也相当于Laplacian分布均值为0的离散表示,而Rice编码基于一个编码参数s来进行编码,实质上是一种适用于Laplacian分布的Huffman码,编解码时不需要码表且可以迅速自适应得到编码参数,因此使得本发明可以达到较好的压缩性能; 
2、THP-Rice编码时,一方面,编码器只需要在码流最前端存储一次编码参数s的初始值,与块自适应编码相比,本发明方法无疑大大减少了额外的参数存储空间,尽管每编码一个数后都需要把这个数存储到一个用于更新的临时空间中,但这并不占用编码后的码流存储空间;另一方面,后面数据的s都是根据设定好的点自适应更新机制来不断计算出来,即使用当前编码数据前面的HI个点计算得出,因此使用此编码参数能够对数据更加有效的编码压缩;且由表1可看出,THP-Rice编码得到的压缩率值(压缩率=压缩后音频文件大小/源音频文件大小*100%)明显比块自适应Rice低,也就是说THP-Rice编码的压缩性能更好。 
3、实践证明,利用本方法可以实现对音频的无损压缩和恢复,并将本方法与其他无损音频编码算法进行压缩率(压缩性能)比较后得出结论:本算法对于绝大部分音频均具有较低的压缩率。 
4、本方法具有简单,易于实现的特点,除了可应用于数字音频无损压缩领域,还可以应用于具有高保真、高清晰度要求的视频压缩领域;此外,由于本方法在定点处理器上可以很好的实现,能够方便、快捷地在硬件上实现,大大降低了用户的处理器成本,未来可以应用于中国自主的无损音频标准事业中,因此,本发明方法具有很强的实用价值。 
附图说明
图1为是本发明的编解码实现框架图; 
图2是MDCT变换分解示意图; 
图3是THP-Rice编码示意图; 
图4是THP-Rice解码示意图; 
图5是对q的进行TH处理的编码流程图; 
图6是对q的进行TH处理的解码流程图。 
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。 
实施例 
如图1所示为本发明编解码实现框架图,在编码过程中,首先,时域信号x(k)经过分帧读取得到一帧时域信号x(k),k=0,...,N-1,N为帧长;其次,对时域信号进行IntMDCT变换得到频域信号X(m),m=0,...,N-1;最后,对频域信号进行Rice编码得到编码码流。解码过程是编码过程的逆过程,首先将输入的码流文件进行Rice解码得到频域信号X(m),m=0,...,N-1,然后再进行IntIMDCT变换(IntMDCT的逆变换)恢复出时域信号x(k),k=0,...,N-1。 
IntMDCT是MDCT(改进型离散余弦变换,Modified Discrete Cosine Transform) 的整数近似表示,通过对MDCT使用提升(lifting)方案来实现的。IntMDCT变换的实现步骤: 
首先,将MDCT分解为两个模块:窗运算/时域混叠消除和N点的DCT-IV(Discrete Cosine Transform of type IV,第四类型的离散余弦变换); 
其次,分别将两个模块进行整数提升。 
为了将MDCT完全进行Givens旋转分解,则需要分解为窗运算/时域混叠消除和N点的DCT-IV三步来实现MDCT,如图2所示。 
(1)窗运算/时域混叠消除的实现方法 
窗函数可以是正弦窗和凯赛-贝赛尔窗(Kaiser-Bessel Derived window,KBD窗),本发明使用的窗函数为正弦窗,定义为: 
w ( k ) = sin ( 2 k + 1 ) π 4 N , k = 0 , . . . , N - 1 - - - ( 1 )
其中N为窗长。 
然后对时域信号进行窗运算: 
x ( N 2 + k ) x ( N 2 - 1 - k ) = cos α k - sin α k sin α k cos α k x ( N 2 + k ) x ( N 2 - 1 - k ) , k = 0 , . . . , N 2 - 1 - - - ( 2 )
其反向窗运算为: 
x ( N 2 + k ) x ( N 2 - 1 - k ) = cos α k sin α k - sin α k cos α k x ( N 2 + k ) x ( N 2 - 1 - k ) , k = 0 , . . . , N 2 - 1 - - - ( 3 )
其中, 
α k = arctan ( w ( N 2 - 1 - k ) w ( N 2 + k ) ) = ( N - 2 k - 1 ) π 4 N , k = 0 , . . . , N 2 - 1 - - - ( 4 )
计算MDCT系数需要相邻两次窗运算的输出序列,其输入序列有50%的重叠,即N个样点。假设x'(0),...,x'(N-1)为前一次窗运算的输出序列, x'(N),...,x'(2N-1)为当前帧窗运算的输出序列,则组合前一次窗运算的后半段输出序列和当前次窗运算的前半段输出序列,然后将此组合的N点序列乘以-1并反序,得到: 
- x ′ ( N + N 2 - 1 ) , - x ′ ( N + N 2 - 2 ) , . . . , - x ′ ( N ) , - x ′ ( N - 1 ) , . . . , - x ′ ( N 2 )
然后再对此序列进行DCT-IV变换。同时,当前窗运算输出的后半段需要存储起来供下次DCT-IV变换使用。 
MDCT变换是MDCT变换的逆过程,其输出序列也有50%的重叠,相邻的输出块的重叠部分进行叠加可抵消时域混叠。将DCT-IV逆变换得到序列乘以-1并反序,其输出序列的前半段和上次存储的序列经由反向窗运算得到IMDCT的输出序列,后半段被存储起来供下次反向窗运算使用。 
特别地,将半块N/2个“0”值样点和第一块的前半块N/2个样点组合成N点,将最后一块的后半块N/2个样点和半块N/2个“0”值样点组合成N点,逆变换时以同样的方式进行组合。 
(2)DCT-IV的实现方法 
对上述组合的N点数据进行DCT-IV,其变换公式为: 
正变换: 
X ( m ) = 2 N Σ k = 0 N - 1 x ( k ) cos ( 2 k + 1 ) ( 2 m + 1 ) π 4 N , m = 0 , . . . , N - 1 - - - ( 5 )
其反变换为: 
x ( k ) = 2 N Σ m = 0 N - 1 X ( m ) cos ( 2 k + 1 ) ( 2 m + 1 ) π 4 N , k = 0 , . . . , N - 1 - - - ( 6 )
在IntMDCT中,所有运算都首先被分解为Givens旋转,然后对Givens旋转进行一系列的提升,且每次提升后都有一次取整操作以保证变换的可逆性。 
为了实现IntMDCT,DCT-IV采用了一种可逆的整数计算方法,称为Integer DCT-IV,即将DCT-IV完全分解为Givens旋转,然后对Givens旋转进行整数提升。 
本发明的DCT-IV整数实现采用了MDL(多维提升,Multi-Dimensional Lifting) [6][7]思想,以尽可能减少可逆Integer DCT-IV计算过程中的取整运算。 
对于式(5)中的DCT-IV正变换可以表示为如下矩阵形式: 
X = C N IV · x - - - ( 7 )
其中,x={x(k)}k=0,1,...,N-1,X={X(m)}m=0,1,...,N-1为DCT-IV变换核, 
C N IV = 2 N cos ( 2 k + 1 ) ( 2 m + 1 ) π 4 N , k , m = 0,1 , . . . , N - 1
为正交矩阵,即有
可由5个提升矩阵和1个排列矩阵(Permutation matrix)来实现: 
C N IV = I N / 2 0 H 1 I N / 2 I N / 2 H 2 0 I N / 2 I N / 2 0 H 3 + K 1 I N / 2 - D N / 2 K 2 0 I N / 2 I N / 2 0 K 3 I N / 2 P N - - - ( 10 )
式中, 
K 1 = - ( C N / 2 IV D N / 2 + 2 I N / 2 ) · C N / 2 IV - - - ( 11 )
K 2 = C N / 2 IV / 2 - - - ( 12 )
K 3 = 2 C N / 2 IV · D N / 2 + I N / 2 - - - ( 13 )
其中代表变换长度为N/2的DCT-IV矩阵。 
P是一个奇偶排列矩阵,它如下重新排列向量x中的分量: 
x ( 0 ) x ( 2 ) . . . x ( N - 2 ) x ( 1 ) x ( 3 ) . . . x ( N - 1 ) = P x ( 0 ) . . . x ( N - 1 ) - - - ( 17 )
求得PN为: 
相应地,在反向IntMDCT中,反向的整数提升公式为: 
( C N IV ) - 1 = P N - 1 I N / 2 0 K 3 I N / 2 - D N / 2 D N / 2 K 2 0 I N / 2 I N / 2 0 - H 3 - K 1 I N / 2 I N / 2 - H 2 0 I N / 2 I N / 2 0 - H 1 I N / 2 - - - ( 19 )
在对频域信号进行编码时,本发明利用一种带阈值的点自适应Rice编码方法(简称THP-Rice),属于前向自适应编码方法。其中引入了两种方法:带阈值的编码方法(简称TH-Rice)和点自适应的编码方法(简称P-Rice)。 
本发明利用的THP-Rice编、解码结构示意图如图3、图4所示,THP-Rice的编码过程为: 
对于输入数据x,编码参数为s(s的计算方法在后面给出),令商q和余数r分别为: 
(1)写符号位(sign bit):若x≥0,则为“0”;反之,则为“1”。 
(2)对r编码:用s位进行二进制表示。 
(3)对q编码:TH-Rice是一种对q进行阈值(简称TH)处理的方法。如图5、图6所示为对q的进行TH处理的编/解码流程图。其中,BN(qnew)代表qnew的二进制位数,用O来表示。 
对r编码得到的比特位数称为LSBs(低阶比特位),且LSBs=s;对q编码得到的比特位数称为MSBs(高阶比特位)。 
若q>TH,经过TH-Rice后得到的MSBs为: 
MSBs=TH+2·O(21) 
若q≤TH,经过TH-Rice后得到的MSBs为: 
MSBs=q+1(22) 
因此,TH的选取直接影响着数据x的编码长度。 
s的计算方法如下: 
本发明把使用的前向自适应规则命名为“点(Point)自适应”编码,因为在此算法中,除了每块数据的前面几个数之外,后面每对一个数进行编码前都要重新计算编码参数s,即逐个数进行自适应,因此将这种方法形象的称为P-Rice编码。 P-Rice中也有一个类似TH-Rice中TH的一个事先设定好的常量HI(History,即用于更新编码参数的),表示使用HI个过去的数来估算待编码数据需要的s,特别地,每块数据的最前面HI个数据的s是固定不变的,即s的初始值由这HI个数据计算得到,从第HI+1个数开始才不断更新s。s的计算公式为: 
其中,当i≤HI时计算s的初始值,当i>HI时计算s的更新值。 
实施过程中,将本发明方法的THP-Rice编码和传统的块自适应Rice编码方法的性能进行比较,其结果如表1所示。从表1可看出,THP-Rice编码得到的压缩率值(压缩率=压缩后音频文件大小/源音频文件大小*100%)明显比块自适应Rice低,也就是说THP-Rice编码的压缩性能更好,而且,本发明经过大量实验得到,当HI=19,TH=3时,THP-Rice编码的压缩率值最小。 
表1 THP-Rice编码和块自适应Rice编码方法的性能比较表 
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,应当指出的是,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。 

Claims (10)

1.一种基于IntMDCT的无损音频编码方法,其特征在于,该编码方法包括以下步骤:
(1)将音频时域信号x(k)进行分帧,读取得到单帧时域信号x(k),k=0,...,N-1,N为帧长;
(2)对时域信号进行IntMDCT变换,得到频域信号X(m),m=0,...,N-1;
(3)对频域信号进行Rice编码得到编码码流。
2.根据权利要求1所述的无损音频编码方法,其特征在于,所述对时域信号进行IntMDCT变换的方法包括步骤:
(21)对时域信号进行窗运算/时域混叠消除;
(22)对前步骤处理后的数据进行DCT-IV变换。
3.根据权利要求2所述的无损音频编码方法,其特征在于,步骤(21)中窗运算使用的窗函数为正弦窗,则对时域信号进行窗运算的公式为:
x ( N 2 + k ) x ( N 2 - 1 - k ) = cos α k - sin α k sin α k cos α k x ( N 2 + k ) x ( N 2 - 1 - k ) , k = 0 , . . . , N 2 - 1 , 其中,
α k = arctan ( w ( N 2 - 1 - k ) w ( N 2 + k ) ) = ( N - 2 k - 1 ) π 4 N , k = 0 , . . . , N 2 - 1 ,
利用该公式进行相邻两次窗运算,前一次窗运算的输出序列为x'(0),...,x'(N-1),当前帧窗运算的输出序列为x'(N),...,x'(2N-1),则组合前一次窗运算的后半段输出序列和当前次窗运算的前半段输出序列,然后将此组合的N点序列乘以-1并反序,得到新序列:然后再对此新序列进行DCT-IV变换;同时,当前窗运算输出的后半段需要存储起来供下次DCT-IV变换使用。
4.根据权利要求3所述的无损音频编码方法,其特征在于,将半块N/2个“0”值样点和第一块的前半块N/2个样点组合成N点,将最后一块的后半块N/2个样点和半块N/2个“0”值样点组合成N点。
5.根据权利要求2所述的无损音频编码方法,其特征在于,DCT-IV变换的公式为: X ( m ) = 2 N Σ k = 0 N - 1 x ( k ) cos ( 2 k + 1 ) ( 2 m + 1 ) π 4 N , m = 0 , . . . , N - 1 .
6.根据权利要求5所述的无损音频编码方法,其特征在于,在IntMDCT中,所有运算都首先被分解为Givens旋转,然后对Givens旋转进行一系列的提升,且每次提升后都有一次取整操作以保证变换的可逆性,其中,DCT-IV变换的提升公式为:式中,x={x(k)}k=0,1,...,N-1,X={X(m)}m=0,1,...,N-1为DCT-IV变换核; C N IV = I N / 2 0 H 1 I N / 2 I N / 2 H 2 0 I N / 2 I N / 2 0 H 3 + K 1 I N / 2 - D N / 2 K 2 0 I N / 2 I N / 2 0 K 3 I N / 2 P N , 该式中, K 1 = - ( C N / 2 IV D N / 2 + 2 I N / 2 ) · C N / 2 IV , K 2 = C N / 2 IV / 2 , K 3 = 2 C N / 2 IV · D N / 2 + I N / 2 其中代表变换长度为N/2的DCT-IV矩阵,
7.根据权利要求1所述的无损音频编码方法,其特征在于,对频域信号进行Rice编码时,采用带阈值的点自适应Rice编码方法,包括步骤:
(31)对输入的数据x,编码参数为s,令商q和余数r分别为:r=x-q·2s
(32)写符号位:若x≥0,则为“0”,反之,则为“1”;对r编码:用s位进行二进制表示;对q编码:采用TH-Rice对q进行阈值处理,若q>TH,经过TH-Rice后得到的高阶比特位MSBs=TH+2·O,若q≤TH,经过TH-Rice后得到的高阶比特位MSBs=q+1,其中TH为一个事先设定好的常量;
(33)对r编码得到的比特位数定为低阶比特位LSBs,且LSBs=s;然后将符号位、低阶比特位LSBs、高阶比特位MSBs组合在一起,即完成数据x的编码。
8.根据权利要求7所述的无损音频编码方法,其特征在于,编码参数为s的计算公式:其中,BN(xi)代表xi的二进制位数,HI为一个事先设定好的常量。
9.根据权利要求8所述的无损音频编码方法,其特征在于,所述HI=19,所述TH=3。
10.一种基于IntMDCT的无损音频解码方法,其特征在于,该解码方法是编码方法的逆过程,首先对输入的码流文件进行Rice解码,得到频域信号X(m),m=0,...,N-1,然后再进行IntMDCT的逆变换恢复出时域信号x(k),k=0,...,N-1。
CN201410514084.0A 2014-09-29 2014-09-29 基于IntMDCT的无损音频编码方法、解码方法 Active CN104318926B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410514084.0A CN104318926B (zh) 2014-09-29 2014-09-29 基于IntMDCT的无损音频编码方法、解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410514084.0A CN104318926B (zh) 2014-09-29 2014-09-29 基于IntMDCT的无损音频编码方法、解码方法

Publications (2)

Publication Number Publication Date
CN104318926A true CN104318926A (zh) 2015-01-28
CN104318926B CN104318926B (zh) 2018-08-31

Family

ID=52374149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410514084.0A Active CN104318926B (zh) 2014-09-29 2014-09-29 基于IntMDCT的无损音频编码方法、解码方法

Country Status (1)

Country Link
CN (1) CN104318926B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107251008A (zh) * 2015-02-27 2017-10-13 索尼克Ip股份有限公司 在实况视频编码和流传输中进行帧复制和帧扩展的系统和方法
WO2024179054A1 (zh) * 2023-02-28 2024-09-06 华为技术有限公司 音频编解码方法及相关装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1882938A (zh) * 2003-09-29 2006-12-20 新加坡科技研究局 确定给定变换函数的变换元素的过程和设备,数字信号变换方法和设备及计算机可读介质
WO2007107046A1 (fr) * 2006-03-23 2007-09-27 Beijing Ori-Reu Technology Co., Ltd Procédé de codage/décodage de signaux audio à variations rapides de fréquence
CN101601087A (zh) * 2006-11-16 2009-12-09 弗劳恩霍夫应用研究促进协会 用于编码和解码的设备
EP1921752B1 (en) * 2006-11-13 2012-12-19 Google, Inc. Adaptive arithmetic encoding and decoding of digital data

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1882938A (zh) * 2003-09-29 2006-12-20 新加坡科技研究局 确定给定变换函数的变换元素的过程和设备,数字信号变换方法和设备及计算机可读介质
CN1886737A (zh) * 2003-09-29 2006-12-27 新加坡科技研究局 将数字信号从时间域变换到频率域及其反向变换的方法
WO2007107046A1 (fr) * 2006-03-23 2007-09-27 Beijing Ori-Reu Technology Co., Ltd Procédé de codage/décodage de signaux audio à variations rapides de fréquence
EP1921752B1 (en) * 2006-11-13 2012-12-19 Google, Inc. Adaptive arithmetic encoding and decoding of digital data
CN101601087A (zh) * 2006-11-16 2009-12-09 弗劳恩霍夫应用研究促进协会 用于编码和解码的设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107251008A (zh) * 2015-02-27 2017-10-13 索尼克Ip股份有限公司 在实况视频编码和流传输中进行帧复制和帧扩展的系统和方法
US11134115B2 (en) 2015-02-27 2021-09-28 Divx, Llc Systems and methods for frame duplication and frame extension in live video encoding and streaming
US11824912B2 (en) 2015-02-27 2023-11-21 Divx, Llc Systems and methods for frame duplication and frame extension in live video encoding and streaming
WO2024179054A1 (zh) * 2023-02-28 2024-09-06 华为技术有限公司 音频编解码方法及相关装置

Also Published As

Publication number Publication date
CN104318926B (zh) 2018-08-31

Similar Documents

Publication Publication Date Title
US11670310B2 (en) Audio entropy encoder/decoder with different spectral resolutions and transform lengths and upsampling and/or downsampling
JP5265682B2 (ja) デジタルコンテンツの符号化および/または復号
CN102368385B (zh) 后向块自适应Golomb-Rice编解码方法及装置
JP2004264811A5 (zh)
RU2017129566A (ru) Звуковые кодирующее устройство и декодирующее устройство
KR960006301A (ko) 음향 신호 부호화/복호화 방법
WO2011097963A1 (zh) 编码方法、解码方法、编码器和解码器
Siddeq et al. Applied minimized matrix size algorithm on the transformed images by DCT and DWT used for image compression
CN104318926B (zh) 基于IntMDCT的无损音频编码方法、解码方法
US8487789B2 (en) Method and apparatus for lossless encoding and decoding based on context
CN105472395B (zh) 一种基于离散Krawtchouk正交多项式的图像无损压缩方法
CN103035249B (zh) 一种基于时频平面上下文的音频算术编码方法
CN114913863B (zh) 数字音信数据编码方法
CN102801427B (zh) 源信号变速率格矢量量化的编解码方法和系统
Karthikeyan et al. A survey on embedded zero tree wavelet
Chen et al. Scalefactor based bit shift FGS audio coding
WO2011129774A1 (en) Probability table generator, encoder and decoder
WO2013146895A1 (ja) 符号化方法、符号化装置、復号方法、復号装置、プログラム及び記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant