CN1148106C - 压缩多声道音频位元流的解码装置及方法 - Google Patents

压缩多声道音频位元流的解码装置及方法

Info

Publication number
CN1148106C
CN1148106C CNB991113276A CN99111327A CN1148106C CN 1148106 C CN1148106 C CN 1148106C CN B991113276 A CNB991113276 A CN B991113276A CN 99111327 A CN99111327 A CN 99111327A CN 1148106 C CN1148106 C CN 1148106C
Authority
CN
China
Prior art keywords
coefficient
discrete type
group
type cosine
conversion coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB991113276A
Other languages
English (en)
Other versions
CN1250293A (zh
Inventor
刘启民
李思玮
李文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ali Corp
Original Assignee
Ali Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/131,653 external-priority patent/US6141645A/en
Application filed by Ali Corp filed Critical Ali Corp
Publication of CN1250293A publication Critical patent/CN1250293A/zh
Application granted granted Critical
Publication of CN1148106C publication Critical patent/CN1148106C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Complex Calculations (AREA)

Abstract

一种压缩多声道音频位元流的解码装置及方法;本装置包括:减声道混音装置及频域到时域转换装置;本方法是在频域中进行压缩数字音频信号的减声道混音,将短离散式余弦系数快速虚拟转换为长离散式余弦系数,然后对长离散式余弦系数进行减声道混音,再对减声道混音后的长离散式余弦系数进行逆向离散式余弦转换,产生视窗域信号,再对视窗域信号进行叠加运算,产生适合放大的时域信号,本装置及方法可减少计算中的运算次数。

Description

压缩多声道音频位元流的解码装置及方法
技术领域
本发明涉及一种压缩多声道音频位元流的解码装置及方法,特别是一种可降低声道数的多声道音频位元流的解码装置及方法。
背景技术
不论由于降低表示完整语音信号的数字信息量是否能得到经济效益,音频压缩技术都是会被使用的,例如杜比(Dolby)AC-3、数字剧场系统(Digital Theatre System;DTS)和MPEG音频压缩编码法等等,美国已选定杜比AC-3的压缩格式作为高清晰度电视(highdefinition television;HDTV)的音频格式标准,其也被广泛使用在数字通用光盘(Digital Versatile Disk;DVD)上。
利用杜比AC-3数字压缩编码法,能将5.1声道的脉冲码从调制(pulse code modulation;PCM)编码变成为一序列位元流,以32kbps至640kbps的数据传送速率传送;此处,0.1声道表示只用小部分带宽的声道传送低频(超低音)信号。一般使用杜比AC-3数字压缩编码法时,压缩率可达1∶10,通常运用在人造卫星或地球上的音频信号传播,音频信号一般经由金属或光纤电缆传送,在磁性及光学材料、半导体或其他储存媒体中储存。
利用杜比AC-3编码法是使用一个时域消除滤波存储单元将一序列音频信号由时域信号转换成频域(frequency domain)系数,特别是转换成DTC(离散余弦转换)系数,经量化达到高压缩率。编码过程的第一步骤:将音频信号由一序列PCM时间采样转换为一组频率系数,各组频率系数以浮点表示法表示为一个二进位指数(exponent)和一个尾数(mantissa),根据相应的编码程序,将这些指数编码,然后,进行位元分配程序(bit allocation process),将这些尾数进行量化,量化的程度由位元分配过程决定。
解码过程是编码过程的逆过程,解码装置必须同时对被编码的位元流、检错码复原,以及取消对各种数据的格式形式(例如编码过的频谱波包和被量化的尾数),以将数据复原。解码过程主要包括下列四个步骤:(1)将频谱波包还原为指数;(2)将该指数进行位元分配;(3)此位元分配过程决定用于打开波包及去除尾数的位元数;(4)将频率系数的指数和尾数转换成时域信号,以产生PCM时间采样。对解码过程的详细描述,如下:
杜比AC-3解码器使用一时域消除(time-domain-aliasing-cancellation;TDAC)滤波器单元将输入的音频信号序列x(n)由时域信号转换为频域系数,更进一步说是进行离散式余弦转换(Discrete CosineTransform;以下简称为DCT),以512点采样视窗h(n)对该音频信号序列进行采样,以产生视窗化数据:
w(n)=h(n)xf(n)                     (1)
其中xf(n)是512个输入数据中的第fth个取样区块,xf-1(n)表示512个输入数据中的第(f-1)th个取样区块,第xf(n)与第xf-1(n)取样重复256点。
将这个视窗化数据w(n)转换为离散式余弦(DCT)系数时,可视数据内容决定是采用512点转换还是两次256点转换,512点转换称为长DCT转换,256点的转换称为短DCT转换。就长DCT转换而言,从下列公式可得一长DCT系数yf(k):
y f ( k ) = 1 256 Σ n = 0 511 w f ( n ) cos [ π 1024 ( 2 n + 1 ) ( 2 k + 1 ) + π 4 ( 2 k + 1 ) ] - - - - ( 2 )
其中0≤k≤255
就短DCT转换而言,视窗化数据w(n)则被分为两组256点数据,分别是wf1(n)与wf2(n),且被转换为两组短DCT系数yf1(k)与yf2(k):
y f 1 ( k ) = 1 128 Σ n = 0 255 w f 1 ( n ) cos [ π 512 ( 2 n + 1 ) ( 2 k + 1 ) ]
y f 2 ( k ) = 1 128 Σ n = 0 255 w f 2 ( n ) cos [ π 512 ( 2 n + 1 ) ( 2 k + 1 ) + π 4 ( 2 k + 1 ) ] - - - - ( 3 )
其中0≤k≤127且0≤n≤255
为重建原始数据,必须对该DCT系数进行一逆转换,就长DCT系数而言,该逆向转换公式如下:
w ‾ f ( n ) = Σ k = 0 255 y f ( k ) cos [ π 1024 ( 2 n + 1 ) ( 2 k + 1 ) + π 4 ( 2 k + 1 ) ] - - - - ( 4 )
其中0≤n≤511且0≤k≤255
就短DCT系数而言,逆转换公式如下:
w ‾ f 1 ( n ) = Σ k = 0 127 y f 1 ( k ) cos [ π 512 ( 2 n + 1 ) ( 2 k + 1 ) ]
w ‾ f 2 ( n ) = Σ k = 0 127 y f 2 ( k ) cos [ π 512 ( 2 n + 1 ) ( 2 k + 1 ) + π 2 ( 2 k + 1 ) ] - - - - ( 5 )
其中0≤n≤255  且0≤k≤127
经过逆运算之后,进行叠加运算,就长DCT系数而言,视窗域系数乘上一合成视窗f(n)再加上之前的系数可得原始数据:
x ~ ( n ) = w ~ ( n ) f ( n ) + w ~ f - 1 ( 256 + n ) f ( 256 + n ) - - - - ( 6 )
其中0≤n≤255
在短转换中,需将两个视窗域系数结合:
然后再经由类似长转换的运算处理。
在许多重建系统中,扬声器的数目与编码声道的数目并不一致,例如用一般个人电脑的左右扬声器输出经杜比AC-3压缩的5个声道的音频信号。为了重现全部声音效果,必须将5个(或5.1个)声道的信号相互混合(intermixing),在声道的数目减少的同时保留高质量的音频信号。
现有的减声道混音技术是在时域中进行,现有的减声道混音是以下面的形式进行:
L 0 ( n ) R 0 ( n ) = 1 c 0 s 0 0 c 1 0 s L ( n ) C ( n ) R ( n ) S L ( n ) S R ( n ) - - - - ( 7 )
其中L(n)、C(n)、R(n)、SL(n)以及SR(n)分别是原来的左、中央、右、左环绕以及右环绕声道,可变常数c和s为环绕混音级数,通常选自1至0.5范围的数值,L0(n)和R0(n)则为减声道混音之后的左右声道输出信号。
图1为现有技术中的解码器,用于将5个声道的音频信号减声道混音成2声道的音频信号。每一个声道都需要分别进行逆向离散式余弦转换(inverse discrete cosine transform;IDCT)和叠加(overlap-and-add;OA)运算。执行叠加运算是因为在编码过程中,时间取样的重叠区块被乘上时间视窗系数,然后将其转换成为频域系数,由于存在重叠区块,所以每一PCM输入取样都被表示为两个连续的转换区块,因此,在解码过程中必须反序对应。
逆向离散式余弦转换(IDCT)步骤,是将音频数据由频域系数转换为视窗域系数;叠加(OA)步骤,是由视窗域系数重建时域音频数据;视窗域系数是指仍然需要进行叠加的一种系数,由于,IDCT和OA转换的复杂性,所以需要减小在减声道混音过程中必须进行的IDCT和OA运算的次数。
如图2所示,其显示一个具有在视窗域中进行减声道混音的音频解码器,这个音频解码器包括五个逆向离散式余弦转换器1、2、3、4及5,一个减声道混音器,两个叠加器OA-1和OA-2,此逆向离散式余弦转换电路接收一预处理器(未显示)产生的五个声道的离散式余弦转换(DCT)系数,此预处理器接收一压缩音频位元流,执行错误更正以及区块重组(block de-formatting),然后,将DCT系数依不同声道分开,该处理程序为现有技术。
五个逆向离散式余弦转换器分别接收五个声道的DCT系数,然后输出视窗域系数至减声道混音器,此视窗域系数经由减声道混音器交互混合,产生左右声道的视窗域系数,再经由第一和第二叠加器将视窗域系数转变为时域系数,然后输出至扬声器放大单元(图中未显示)。
图2所示的解码器中,虽然减少了叠加器的数目,但是仍需要五个逆向离散式余弦转换器将DCT系数转换为视窗域系数,这种电路中的运算操作仍然很复杂。
发明内容
本发明的目的在于提供一种在频域范围中实现对数字式音频信号减声道混音的解码装置及方法,以减少杜比AC-3解码器的计算次数和硬件的复杂性。
为达到上述目的本发明采取如下措施:
本发明的一种用于对数字音频位元流解码的解码装置,该数字音频位元流具有一第一组频域系数,第一组频域系数表示来自至少二个不同声道的第一组时域音频信号;
解码装置包括:减声道混音装置及频域到时域转换装置;
其特征在于:
减声道混音装置,用以将第一组频域系数混合,以产生一第二组频域系数;混合后的声道数少于混合前的声道数;
频域到时域转换装置,用以将第二组频域系数转换为第二组时域信号。
其中,所述转换装置包括:频域系数到视窗域系数的转换装置及叠加装置;
频域系数到视窗域系数的转换装置,用以将所述第二组频域系数转换为一组视窗域系数;
叠加装置,用以将第二组视窗域系数叠加,以产生第二组时域信号。
本发明的另一种解码装置,用以将预处理的数字音频位元流解码,数字音频位元流具有一组短DCT系数及第一组长DCT系数,相应于来自不同声道的第一组时域音频信号,其特征在于,该装置包括:
第一转换装置,用以将该组短DCT系数转换为一第二组长DCT系数;
减声道混音装置,用以将第一组长DCT系数及第二组长DCT系数减声道混音,以产生一预设声道数音频信号的第三组长DCT系数;
第二转换装置,用以将第三组长DCT系数转换为第二组时域音频信号,提供给较第一组时域音频信号代表声道数更少的声道使用。
本发明的一种减声道混音的方法,包括下列步骤:
(a)将一第一组的DCT系数进行减声道混音,进而产生一组减声道混音后的DCT系数;
(b)将减声道混音后的DCT系数转换为第二组时域信号,以供一预设声道用。
其中,所述DCT系数转换步骤包括下列步骤:
(b1)逆向离散式余弦转换所述减声道混音后的DCT系数以产生视窗域系数;
(b2)对视窗域系数进行叠加运算,以产生所述第二组时域信号。
本发明的一种将预处理的数字音频位元流减声道混音的方法,该数字音频位元流具有一第一组频域系数,表示至少来自左声道、右声道、左环绕声道以及右环绕声道的音频信号,该方法包括下列步骤:
(a)转换具有短DCT系数的第一组频域系数为仅有长DCT系数的频域系数,进而产生一仅包含长DCT系数的第二组频域系数;
(b)减声道混音该第二组频域系数,以产生第三组频域系数,进而生成用于一左声道与一右声道的音频信号。
与现有技术相比,本发明具有如下效果:
1、本发明提供方法简单易行,由于采用本方法,可减少AC-3编码中所需的乘法运算量,可降低解码器的复杂性以及整体成本。
2、本发明经由简化计算过程,能够用软件来完成AC-3解码过程,而不必使用特定的硬件解码器。
附图说明
结合附图及实施例对本发明技术内容进行详细说明如下:
图1为现有技术中解码器的电路方框图,其是对以时域表示的数字式音频位元流执行减声道混音;
图2为现有技术中另一种解码器的电路方框图,其是对以视窗域表示的数字式音频位元流减声道混音;
图3本发明的对以频域表示的数字式音频位元流减声道混音的解码器的电路方框图,其中,同时使用长逆向离散式余弦转换器及短逆向离散式余弦转换器;
图4为本发明实施例的电路方框图,其中解码器包括数个虚拟转换器,将短离散式余弦系数转换为长离散式余弦系数,且在频域中进行减声道混音过程。
具体实施方式
为便于描述,上述方程式(1)至(6)改用矩阵表示,例如长DCT系数的逆向离散式余弦转换中,方程式(4)可写为:
w ~ f = w ~ f 1 w ~ f 2 = L 1 + L 2 - Y f - - - - ( 8 )
其中的Yf为由预处理器所提取的长DCT系数组成的256×256对角矩阵,且
⟨ L 1 + ⟩ n , k = cos ( π 1024 ( 2 n + 1 + 256 ) ( 2 k + 1 ) ) - - - for 0 ≤ n ≤ 255,0 ≤ k ≤ 255 - - - - ( 9 )
⟨ L 2 + ⟩ n , k = cos ( π 1024 ( 2 n + 1 + 768 ) ( 2 k + 1 ) ) - - - for 0 ≤ n ≤ 255,0 ≤ k ≤ 255 - - - - ( 10 )
对于短DCT系数的反离散式余弦转换,方程式(5)可写为:
w ~ f = w ~ f 1 w ~ f 2 = S 1 + 0 0 S 1 + Y f 1 Y f 2 - - - - ( 11 )
其中Yf1和Yf2为由预处理器所读取的短DCT系数组成的128×128对角矩阵。矩阵Yf1包括由预处理器所读取的短DCT系数的第一部分,而矩阵Yf2包括由预处理器所读取的短DCT系数的第二部分,其中,S1 +和S2 +项可表示为:
⟨ S 1 + ⟩ n , k = cos ( π 512 ( 2 n + 1 ) ( 2 k + 1 ) ) - - - for 0 ≤ n ≤ 255,0 ≤ k ≤ 127 - - - - ( 12 )
⟨ S 2 + ⟩ n , k = cos ( π 512 ( 2 n + 1 ) ( 2 k + 1 + 256 ) ) - - - for 0 ≤ n ≤ 255,0 ≤ k ≤ 127 - - - - ( 13 )
叠加过程中的方程式(6)可改变为
x ~ f = F 1 F 2 w ~ f 1 w ~ ( f - 1 ) 2 - - - - ( 14 )
其中F1和F2为256×256对角矩阵,定义为:
<F1>nn=f(n),<F2>nn=f(256+n)。
如图3所示,其为以频域表示的数字式音频位元流减少混频的解码器的电路方框图,其中,同时使用长离散式余弦转换及短离散式余弦转换;其中,音频解码器300包括一选择器302、一长减声道混音器304、一短减声道混音器306、两组长逆向离散式余弦转换(L-IDCT_1和L-IDCT_2)308、310、两个短逆向离散式余弦转换块(S-IDCT_1和S-IDCT_2)312、314、两个信号加法器316、318以及两个叠加块(OA-1和OA-2)320、322。
由图3可知,音频解码器300具有减声道混音、逆向离散式余弦转换以及叠加功能,以至使声道数少于原被编码的数字位元流的声道。
选择器302接收来自信号线324a到324e的DCT系数,判断信号为长DCT系数Yf还是短DCT系数(Yf1和Yf2),并分别传送至长减声道混音器304及短减声道混音器306;长减声道混音器304用下列的演算法执行减声道混音动作,以产生被减声道混音的长DCT系数:
Y f ( L D ) Y f ( L D ) = I C 0 S 0 0 C 1 0 S Y f ( L ) Y f ( C ) Y f ( R ) Y f ( S L ) Y f ( S R ) - - - - ( 15 )
其中Yf(LD)和Yf(RD)分别为左右声道减声道混音后的DCT系数。矩阵Yf(L)、Yf(C)、Yf(R)、Yf(SL)以及Yf(SR)包含预处理器读取的左、中央、右、左环绕及右环绕声道的长DCT系数,矩阵I为一单位矩阵,矩阵C和S为256×256的对角矩阵,
C = C 0 . . . 0 0 C . . . 0 0 0 . . . 0 0 0 . . . C , S = S 0 . . . 0 0 S . . . 0 0 0 . . . 0 0 0 . . . S - - - - ( 16 )
其中C和S为中间和环绕声道的混音系数,一般约在0.5至1的范围。
短减声道混音器304用下列的演算法执行减声道混音动作,以产生被减声道混音的短DCT系数:
Y f 1 ( L D ) Y f 1 ( L D ) = I C 0 S 0 0 C I 0 S Y f 1 ( L ) Y f 1 ( C ) Y f 1 ( R ) Y f 1 ( S L ) Y f 1 ( S R ) - - - - ( 17 )
Y f 2 ( L D ) Y f 2 ( L D ) = I C 0 S 0 0 C I 0 S Y f 2 ( L ) Y f 2 ( C ) Y f 2 ( R ) Y f 2 ( S L ) Y f 2 ( S R ) - - - - ( 18 )
其中Yf1(LD)、Yf1(RD)、Yf2(LD)以及Yf2(RD)分别为左右声道减声道混音后的短DCT系数。其中C和S为中央和环绕混音系数的128×128的对角矩阵。
经过长减声道混音器304混音后的长DCT系数,被传送至逆向离散式余弦转换器(L-IDCT_1和L-IDCT_2)308、310,进行左和右声道的长DCT系数运算,转换器308和310依据下列运算将长DCT系数转换为视窗域系数:
w ~ f 1 ( L 0 ) w ~ f 1 ( R 0 ) L 1 + 0 0 L 1 + Y f ( L D ) Y f ( R D ) - - - - ( 19 )
w ~ f 2 ( L 0 ) w ~ f 2 ( R 0 ) L 2 + 0 0 L 2 + Y f ( L D ) Y f ( R D ) - - - - ( 20 )
同样,经过短减声道混音器304混音后的短DCT系数,被传送至逆向离散式余弦转换器(S-IDCT_1和S-IDCT_2)312、314,进行左和右声道的短DCT系数运算,转换器312和314依据下列运算将短DCT系数转换为短视窗域系数:
w ~ f 1 ( L 0 ) w ~ f 1 ( R 0 ) S 1 + 0 0 S 1 + Y f 1 ( L D ) Y f 1 ( R D ) - - - - ( 21 )
w ~ f 2 ( L 0 ) w ~ f 2 ( R 0 ) S 2 + 0 0 S 2 + Y f 2 ( L D ) Y f 2 ( R D ) - - - - ( 22 )
由短逆向离散式余弦转换器312、314产生的短视窗域系数在信号加法器316和318中与长视窗域系数结合,结合后的信号传送至叠加器320、322,然后根据下列演算法转换为时域信号:
X f ( L 0 ) X f ( R 0 ) = F 1 F 2 0 0 0 0 F 1 F 2 ( w ~ f 1 ( L 0 ) w ~ ( f - 1 ) 2 ( L 0 ) 0 0 + 0 0 w ~ f 1 ( R 0 ) w ~ ( f - 1 ) 2 ( R 0 ) ) - - - - ( 23 )
其中Xf(LO)和Xf(RO)为左右声道减声道混音后的时域音频信号,而后再将时域音频信号传送至放大单元或扬声器。
如图4所示,其表示本发明的一实施例,为了减少减声道混音过程所需的逆向离散式余弦转换次数,首先将短DCT系数转换为长DCT系数,然后对长DCT系数进行减声道混音。解码器400包括5个虚拟(virtual)转换器402a、402b、402c、402d及402e、一个减声道混音器404、两个逆向离散式余弦转换器406a和406b,以及两个叠加器408a和408b。
这些虚拟转换器接收来自五个声道的信号,然后判定信号为短DCT系数或长DCT系数,若为短DCT系数则依下列方程式将其转换为长DCT系数:
Y f = V Y f 1 Y f 2 - - - - ( 24 )
其中
Figure C9911132700143
这里的Yf1和Yf2包含短DCT系数,且
&lang; L 1 &rang; kn = 1 256 cos ( &pi; 1024 ( 2 n + 1 + 256 ) ( 2 k + 1 ) ) , 0 &le; k &le; 255,0 &le; n &le; 255 - - - - ( 26 )
&lang; L 2 &rang; kn = 1 256 cos ( &pi; 1024 ( 2 n + 1 + 768 ) ( 2 k + 1 ) ) , 0 &le; k &le; 255,0 &le; n &le; 255 - - - - ( 27 )
矩阵H1和H2为对角矩阵,<H1>nn=h(n),0≤n≤255,<H2>nn=h(n+256),0≤n≤255;且F1、F2、S1 +以及S2 +与方程式(12)、(13)和(14)中的符号所代表的意义相同。
方程式(25)可改写为:
Y f ( k 1 ) = &Sigma; k 2 = 0 127 { V 1 ( k 1 , k 2 ) Y f 1 ( k 2 ) + V 2 ( k 1 , k 2 ) Y f 2 ( k 2 ) } - - - for k 1 = 0 &CenterDot; &CenterDot; &CenterDot; 255 - - - - ( 28 )
利用第二或第三阶的多项式展开,将不重要的项次取近似值可将上式更进一步简化,V1(k1、k2)中大部分的项次都集中在k2=k1/2附近,所以更远离k1/2附近的项次可利用多项式系数来逼近并不会降低其准确性。
重写(28)式的第一项为
Y f ( k 1 ) = &Sigma; k 1 = 0 127 { V 1 ( k 1 , k 2 ) Y f 1 ( k 2 ) } - - - - ( 29 )
可将上式拆成三部分,一部分包含邻近k2=k1/2的项次的中间部分,第二部分为中间之前的部分,第三部分为中间之后的部分。
Y f 1 ( k 1 ) = &Sigma; k 2 = 0 [ k 1 2 ] - M { V 1 ( k 1 , k 2 ) Y f 1 ( k 2 ) } + &Sigma; k 2 [ k 1 2 ] - M + 1 [ k 1 2 ] + M { V 1 ( k 1 , k 2 ) Y f 1 ( k 2 ) } + &Sigma; k 2 = [ k 1 2 ] + M + 1 127 { V 1 ( k 1 , k 2 ) Y f 1 ( k 2 ) } - - - - - ( 30 )
在这里中间部分包含2M个点,然后以第p阶的多项式对方程式(30)中的第一和第三项取进似值:
V 1 ( k 1 , k 2 ) = &Sigma; p = 0 p - 1 a ( k 1 , p ) k 2 p - - - for k 2 = 0 , &CenterDot; &CenterDot; &CenterDot; , [ k 1 2 ] - M - - - - ( 31 )
V 1 ( k 1 , k 2 ) = &Sigma; p = 0 p - 1 b ( k 1 , p ) k 2 p - - - for k 2 = [ k 1 2 ] - M + 1 , &CenterDot; &CenterDot; &CenterDot; , 127 - - - - ( 32 )
这里的a和b分别为当 k 2 = 0 , &CenterDot; &CenterDot; &CenterDot; , [ k 1 2 ] - M k 2 = [ k 1 2 ] - M + 1 , &CenterDot; &CenterDot; &CenterDot; , 127 时,多项式L1.H1.F1.S1 +的展开系数,用多项式近似法计算方程式(30)的第一和第三项,会比展开V1.Yf1的所有余弦项之和快得多。
另外,这里也显示V1(k1,k2)与V2(k1,k2)之间存在一一对应关系:
V2(k1,k2)=(-1)(k1+k2)×V1(255-k1,127-k2)            (33)
因此,一但得到V1的项次就可推算出V2,再将V2带入下式中:
Y f 2 ( k 1 ) = &Sigma; k 2 = 0 127 { V 2 ( k 1 , k 2 ) Y f 2 ( k 2 ) } - - - - ( 34 )
将方程式(31)与(34)的结果结合,可得到方程式(29)中的长DCT系数。
经由虚拟转换器402a至402e将短DCT系数转换为长DCT系数之后,将长DCT系数传送至减声道混音器404,减声道混音器404以前述的方程式(16)将长DCT系数进行减声道混音,然后将减声道混音后的长DCT系数传送至逆向离散式余弦转换器406a至406b。逆向离散式余弦转换器406a至406b产生的视窗域系数再传送至两个叠加器408a及408b,然后产生声道的时域音频信号。
以上仅为本发明的实施例的充分描述而已,并非用以限定本发明的保护范围;例如减声道混音法并非仅限定于使用在AC-3演算法,其他超过两声道的音频压缩演算法,例如MPEG-2或DTS,当扬声器或放大器的数目少于数字位元流的声道数时,均可使用减声道混音法,因此凡其它在本发明构思下完成的等效改变或修饰,均应包含在本发明的权利范围内。

Claims (7)

1、一种解码装置,用以将预处理的数字音频位元流解码,数字音频位元流具有一组短离散式余弦转换系数及第一组长离散式余弦转换系数,相应于来自不同声道的第一组时域音频信号,其特征在于,该装置包括:
第一转换装置,用以将该组短离散式余弦转换系数转换为一第二组长离散式余弦转换系数;
减声道混音装置,用以将第一组长离散式余弦转换系数及第二组长离散式余弦转换系数减声道混音,以产生一预设声道数音频信号的第三组长离散式余弦转换系数;
第二转换装置,用以将第三组长离散式余弦转换系数转换为第二组时域音频信号,提供给较第一组时域音频信号代表声道数更少的声道使用。
2、根据权利要求1所述的装置,其特征在于,所述第二转换装置包括:
离散式余弦转换-至-视窗域转换装置,用来将所述第三组长离散式余弦转换系数转换为一组视窗域系数;
叠加装置,用以将该组视窗域系数进行叠加运算,进而产生所述第二组时域音频信号。
3、根据权利要求1所述的装置,其特征在于,所述第一转换装置用下列方程式将短离散式余弦转换系数转换为长离散式余弦转换系数:
Y f ( k 1 ) = &Sigma; k 2 = 0 127 { V 1 ( k 1 , k 2 ) Y f 1 ( k 2 ) + V 2 ( k 1 , k 2 ) Y f 2 ( k 2 ) }
其中的Yf1(k2)和Yf2(k2)为短离散式余弦转换系数,V1(k1,k2)和V2(k1,k2)为转换系数,Yf(k1)为长离散式余弦转换系数,且k1为0至255的整数。
4、根据权利要求3所述的装置,其特征在于,所述V1(k1,k2)的特定项以多项式近似法计算。
5、根据权利要求3所述的装置,其特征在于,所述V2(k1,k2)用下列方程式计算:
V2(k1,k2)=(-1)(k1+k2)×V1(255-k1,127-k2)。
6、一种将预处理的数字音频位元流减声道混音的方法,该数字音频位元流具有一第一组频域系数,表示至少来自左声道、右声道、左环绕声道以及右环绕声道的音频信号,该方法包括下列步骤:
(a)转换具有短离散式余弦转换系数的第一组频域系数为仅有长离散式余弦转换系数的频域系数,进而产生一仅包含长离散式余弦转换系数的第二组频域系数;
(b)减声道混音该第二组频域系数,以产生第三组频域系数,进而生成用于一左声道与一右声道的音频信号。
7、根据权利要求6所述的方法,其特征在于,所述将短离散式余弦转换系数转换为长离散式余弦转换系数的步骤包括:将所述短离散式余弦转换系数与一组虚拟转换系数做向量乘积。
CNB991113276A 1998-08-10 1999-08-06 压缩多声道音频位元流的解码装置及方法 Expired - Fee Related CN1148106C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/131653 1998-08-10
US09/131,653 US6141645A (en) 1998-05-29 1998-08-10 Method and device for down mixing compressed audio bit stream having multiple audio channels

Publications (2)

Publication Number Publication Date
CN1250293A CN1250293A (zh) 2000-04-12
CN1148106C true CN1148106C (zh) 2004-04-28

Family

ID=22450425

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991113276A Expired - Fee Related CN1148106C (zh) 1998-08-10 1999-08-06 压缩多声道音频位元流的解码装置及方法

Country Status (2)

Country Link
CN (1) CN1148106C (zh)
TW (1) TW390104B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1774957A (zh) * 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 音频信号生成
US8423372B2 (en) * 2004-08-26 2013-04-16 Sisvel International S.A. Processing of encoded signals
PL1810280T3 (pl) * 2004-10-28 2018-01-31 Dts Inc Silnik przestrzennego środowiska dźwiękowego
CN1770256B (zh) * 2004-11-02 2010-05-05 北京中科信利技术有限公司 一种基于变换域的数字音频混合方法
CN102129861B (zh) * 2010-01-15 2013-06-12 富士通株式会社 信号变换方法和系统
BR112015019176B1 (pt) 2013-04-05 2021-02-09 Dolby Laboratories Licensing Corporation método e aparelho de expansão de um sinal de áudio, método e aparelho de compressão de um sinal de áudio, e mídia legível por computador
CN103745724A (zh) * 2014-01-13 2014-04-23 电子科技大学 一种应用于多声道音频解码的时频混合缩混方法

Also Published As

Publication number Publication date
TW390104B (en) 2000-05-11
CN1250293A (zh) 2000-04-12

Similar Documents

Publication Publication Date Title
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
CN1130691C (zh) 音频译码装置
CN1065381C (zh) 数字音频信号编码和/或译码方法
CN1217502C (zh) 音频信号的编码装置、解码装置及编码方法和解码方法
CN1783728A (zh) 通过使用空间信息来处理多声道音频信号的设备和方法
CN1992533A (zh) 信号编码设备和方法、信号译码设备和方法、程序及介质
CN1183685C (zh) 用于熵编码信号量化变换系数的系统和方法
CN1947172A (zh) 方法、装置、编码器设备、解码器设备以及音频系统
CN1675683A (zh) 用于可扩缩编码的设备及方法和用于可扩缩解码的设备及方法
CN1906664A (zh) 音频编码器和音频解码器
CN1451255A (zh) 具有向后兼容性混频的分立式多声道音响
CN101055720A (zh) 对音频信号编码和解码的方法和设备
CN1503572A (zh) 多个因式分解可逆变换的逐次浮现无损嵌入式音频编码器
CN1262990C (zh) 利用谐波提取的音频编码方法和设备
CN1093843A (zh) 高效编码和解码的方法及装置
CN102227769A (zh) 解码装置、解码方法、编码装置、编码方法和编辑装置
CN1148106C (zh) 压缩多声道音频位元流的解码装置及方法
CN1524348A (zh) 编码方法和装置以及解码方法和装置
CN1885724A (zh) 产生音频信号比特流方法和设备及音频编解码方法和设备
CN1879163A (zh) 利用重叠来促进平滑交叉渐变的基于帧的音频传输/存储
CN1795494A (zh) 位流水印嵌入
CN1242624C (zh) 编码装置与编码方法
CN1266672C (zh) 用较少的计算量重构高频分量的声频解码方法和装置
CN1711588A (zh) 音乐信息编码设备及方法和音乐信息解码设备及方法
Yang et al. A lossless audio compression scheme with random access property

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1040052

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040428

Termination date: 20140806

EXPY Termination of patent right or utility model