CN1942929A - 多信道编码器 - Google Patents

多信道编码器 Download PDF

Info

Publication number
CN1942929A
CN1942929A CNA2005800121043A CN200580012104A CN1942929A CN 1942929 A CN1942929 A CN 1942929A CN A2005800121043 A CNA2005800121043 A CN A2005800121043A CN 200580012104 A CN200580012104 A CN 200580012104A CN 1942929 A CN1942929 A CN 1942929A
Authority
CN
China
Prior art keywords
channel
signal
input signal
scrambler
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800121043A
Other languages
English (en)
Inventor
D·J·布里巴特
E·G·P·舒伊杰斯
G·H·霍托
M·W·范卢恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Priority to CN201110035024.7A priority Critical patent/CN102122509B/zh
Publication of CN1942929A publication Critical patent/CN1942929A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

描述了多信道编码器(10),用于处理在N个输入信道中所传送的输入信号(300,310,320,330,340)以生成在M个输出信道中所传送的相应输出信号(480,490)以及补充的参数数据(370,430,450);M和N为整数,其中N>M。编码器(10)包括下混频器,用于下混频输入信号(30,310,320,330,340)以生成相应的输出信号(480,490),该编码器还包括分析器,用于处理输入信号(300,310,320,330,340)以生成参数数据(370,430,450),参数数据描述了N个信道的输入信号之间的相互差,以允许在解码期间从M个信道的输出信号中重新生成N个信道输入信号的一个或多个。这样的编码器(10)能够提供高效的数据编码以及能够与具有少于N个解码输出信道的相对较简单的解码器向后兼容。本发明还涉及与这样的多信道相兼容的解码器。

Description

多信道编码器
技术领域
本发明涉及多信道编码器,例如利用空间音频的参数描述的多信道音频编码器。而且,本发明还涉及在这样的多信道编码器中处理信号、例如空间音频信号的方法。此外,本发明涉及解码器,所述解码器可操作地解码由这样的多信道编码器生成的信号。
背景技术
近年来,音频记录以及重现已经从非立体声单信道格式发展到双信道立体声格式以及最近发展到多信道格式,例如在家庭影院系统中经常使用的五信道音频格式。超音频光盘(SACD)和数字化视频光盘(DVD)数据载体的引入已经带来了目前对于这样的五信道音频重现不断增加的兴趣。许多用户目前在他们的家中拥有能够提供五信道音频重放的设备;相应地,在适当数据载体上的五信道音频节目内容正在变得愈加可用,例如上面所述的SACD和DVD类型的数据载体。由于对于多信道节目内容不断增长的兴趣,多信道音频节目内容的更高效编码正在成为一个重要课题,例如提供增强的质量、更长的播放时间或甚至更多的信道中的一个或多个。
能够通过参数描述符表示空间音频信息(例如用于音频节目内容)的编码器是已知的。例如,在公开的国际PCT专利申请no.PCT/IB2003/002858(WO2004/008805)中,描述了包括至少第一信号分量(LF)、第二信号分量(LR)和第三信号分量(RF)的多信道音频信号的编码。这种编码利用的方法包括以下步骤:
(a)通过使用第一参数编码器编码所述第一和第二信号分量,用于生成第一编码信号(L)和第一组编码参数(P2);
(b)通过使用第二参数编码器,编码所述第一编码信号(L)和另一个信号(R),用于生成第二编码信号(T)和第二组编码参数(P1),其中该另一个信号(R)由至少所述第三信号分量(RF)获得;以及
(c)至少通过从至少所述第二编码信号(T)、所述第一组编码参数(P2)和所述第二组编码参数(P1)得到的结果编码信号(T)来表示所述多信道音频信号。
近年来,音频信号的参数描述已经引起了兴趣,因为已经显示出传输描述音频信号的量化参数需要相对少的传输容量。这些量化的参数能够在解码器中被接收和处理以重新生成感觉上不是与其对应的原始音频信号明显不同的音频信号。
当前的多信道编码器生成输出编码数据,其比特率基本上随着在输出编码数据中传送的音频信道的数量线性地成比例变化。这样的特征致使包括另外的信道出现问题,因为用于给定数据载体存储容量的播放时间间隔或音频表现质量将必须相应地被牺牲以适应更多的信道。
发明内容
本发明的一个目的是提供一种多信道编码器,其可操作地提供多信道数据内容(例如多信道音频数据内容)的更高效编码。
发明人已经意识到,通过使用适当的编码方法,输出的编码数据能够传送对应例如五信道音频节目内容的信息,同时使用为传送二信道音频节目内容(即立体声)通常所需的比特率。
因此,根据本发明的第一方面,提供了一种多信道编码器,其被用来处理在N个输入信道中所传送的输入信号,以生成在M个输出信道中所传送的相应输出信号以及参数数据,使得M和N为整数并且N大于M,该编码器包括:
(a)下混频器,用于下混频输入信号以生成相应的输出信号;以及
(b)分析器,用于在下混频期间或者作为单独的过程处理该输入信号,所述分析器可操作地生成补充所述输出信号的所述参数数据,所述参数数据描述了输入信号的N个信道之间的相互差,以便基本上允许在解码期间从M个信道的输出信号中重新生成所述N个信道的输入信号中的一个或多个,所述输出信号为兼容于在解码器中进行重现的格式,所述解码器提供了N个或少于N个的输出信道以能够向后兼容。
本发明的优点在于该多信道编码器能够将多信道输入信号更高效地编码成输出流,该输出流例如可以致使与二信道立体声重放设备相兼容。
该编码器与较早类型的相应解码器的这种向后兼容性以三种方式来提供:
(a)从编码器输出的下混频信号以这样的方式来生成,即这些信号的重放(即无需额外的处理或解码)导致一个空间图像,其是例如5信道空间图像的良好近似,假定限制为相应有限数量的扬声器。这一属性保证了向后重放的兼容性。
(b)与下混频信号有关的空间参数被放置在该比特流的辅助数据部分。不能解码该辅助数据部分的解码器将仍旧能够解码所传输的信号。这一属性保证了向后解码的兼容性;以及
(c)存储在比特流的辅助部分和该解码器结构中的参数以这样的方式来配制,即参数解码器能够重新生成适当的2、3和4信道信号。这一属性在采用的重放系统方面提供了灵活性,并且因此提供了与2、3和4信道系统的向后兼容性。
优选地,在编码器中,分析器包括处理装置,用于经由从时域到频域的变换来转换该输入信号,并且用于处理这些被变换的输入信号以生成参数数据。在频域内输入信号的处理在该编码器内提供高效的编码方面是有益的。更优选地,在编码器中,下混频器和分析器中的至少一个被用来将输入信号作为时间-频率片(tile)的序列进行处理以生成该输出信号。
优选地,在编码器中,该片通过相互重叠分析窗的变换来获得。当输出信号随后被解码以重新生成该输入信号的一个表示时,这样的重叠允许更好的连续性并且由此减少了编码假象。
优选地,该编码器包括编码装置,用于处理该输入信号以生成M个中间音频数据信道用于包括在该M个输出信号中,该分析器被用来输出与至少下列之一有关的参数数据中的信息:
(a)信道间输入信号功率比或对数水平(level)差;
(b)输入信号之间的信道间相关;
(c)一个或多个信道的输入信号和该一个或多个信道的输入信号的功率和之间的功率比;以及
(d)信号对之间的相位差或时间差。
更优选地,在(d)中的相位差为平均相位差。
优选地,在编码器中,对相位差、相关数据和功率比中的至少一个进行计算之后是主要分量分析(PCA)和/或信道间相位校准以生成该输出信号。
优选地,为了在重新生成输入数据时提供与该原始输入信号更近的相似性,在所述编码器中在该N个信道中所传送的该输入信号的至少一个对应效果信道。
优选地,该编码器适应于以适合于使用常规的重放系统进行重放的格式生成输出信号。
根据本发明的第二方面,提供了一种在多信道编码器中编码在N个输入信道中所传送的输入信号以生成在M个输出信道中所传送的相应输出信号以及参数数据,使得M和N为整数并且N大于M的方法,该方法包括步骤:
(a)下混频该输入信号以生成相应的输出信号;以及
(b)当被下混频时在分析器中处理该输入信号或者进行单独地处理该输入信号,所述处理提供补充该输出信号的所述参数数据,所述参数数据描述了N个信道的输入数据之间的相互差,以便基本上允许在解码期间从M个信道的输出信号中重新生成N个信道的输入信号,所述输出信号为兼容于在解码器中进行重现的格式,该解码器提供N个或少于N个输出信道。
优选地,该方法适应于编码对应5个信道的输入信号并且生成输出信号和参数数据,其格式兼容于对应的2信道立体声解码器、3信道解码器和4信道解码器中的一个或多个。
优选地,在该方法中,所述处理包括经由从时域到频域的变换来转换输入信号。
优选地,在该方法中,至少一个输入信号被作为时间-频率片的序列来处理以生成输出信号。
优选地,在该方法中,所述片对应相互重叠的分析窗。
优选地,该方法包括使用编码装置用于处理该输入信号以生成M个中间音频数据信道以便包括在该输出信号中的步骤,该编码装置被用来输出与至少下列之一相关的参数数据中的信息:
(a)信道间输入信号功率比或对数水平差;
(b)输入信号之间的信道间相关;
(c)一个或多个信道的输入信号和该一个或多个信道的输入信号的功率和之间的功率比;以及
(d)信号对之间的相位差或时间差。
更优选地,在(d)中的相位差为平均相位差。
优选地,在该方法中,对水平差、相关数据和功率比中的至少一个进行计算之后是主要分量分析和/或相位校准以生成该输出信号。
优选地,在该方法中,在N个信道中所传送的输入信号中的至少一个对应效果信道。
根据本发明的第三方面,提供了存储在数据载体上的编码数据内容,所述数据内容使用根据本发明的第二方面的方法来生成。
根据本方面的第四方面,提供了一种解码器,其可操作地解码由根据本发明的第一方面的编码器所生成的编码输出数据,所述编码输出数据包括M个信道以及从N个信道的输入信号所生成的相关参数数据,使得M<N,其中M和N为整数,该解码器包括处理器:
(a)用于接收编码的输出数据并且将该数据从时域转换到频域;
(b)用于在频域中应用该参数数据以从该M个信道中提取内容,以便从该M个信道中重新生成对应N个信道中的一个或多个输入信号的重新生成的数据内容,该数据内容不是直接包括在编码的输出数据中或从编码的输出数据中遗漏;以及
(c)用于处理该重新生成的数据内容,从而在解码器的一个或多个输出端输出N个信道的一个或多个重新生成的输入信号。
优选地,在该解码器中,处理器可操作地应用全通去相关滤波器以获得信号的去相关形式,用于在解码器处重新生成N个信道的所述一个或多个输入信号。
优选地,在该解码器中,处理器可操作地应用编码器逆旋转以将M个信道的信号和其去相关形式分离成它们的组成分量,用于在解码器处重新生成N个信道的所述一个或多个输入信号。
应当理解,本方面的特征能够在不背离本发明的范围的情况下在任何组合中被组合。
附图说明
现在将参照附图仅以示例的方式描述本发明的实施例,其中:
图1为根据本发明的第一多信道编码器的示意图;
图2为根据本发明的第二多信道编码器的示意图,包括提供效果、例如低频效果,以及
图3为根据本发明的多信道解码器的示意图,该解码器补充图1和2的编码器,并且能够解码从这样的编码器提供的输出数据。
具体实施方式
为了改善在多信道编码器中执行的编码,其中给多信道编码器提供了N个信道的输入数据并且该多信道编码器被用来编码该输入数据以生成对应的编码的输出数据流,本发明人已经设想该编码器有利地可操作地:
(a)将该N个信道的输入数据下混频为M个信道,使得M<N;以及
(b)当生成该输出数据流时,生成相对小数量的参数开销数据以结合M个信道的数据,该参数数据被用来在随后的被提供输出数据流的解码器处能够重新构建对应于N个信道的数据。
例如,该多信道编码器优选地为五信道编码器,即N=5。该五信道编码器被配置用于下混频对应于五个输入信道的数据,以生成两个信道的中间数据,即M=2。而且,该五信道编码器可操作地生成相关的参数开销数据以结合该两个信道的数据以生成输出数据流,该参数数据足以使该解码器能够重新构建该五个输入信道的一个表示。该解码器是有益的,因为其能够向后兼容以支持在其中N=2,3,4的情况,即向后兼容2信道、3信道和4信道输出的情况。
在本发明的一个优选实施例中,编码器可操作地处理N个输入数据信道。该N个输入信道优选地对应中心音频数据信道、左前音频数据信道、左后音频数据信道、右前音频数据信道和右后音频数据信道;这样的五个信道能够创建适合于家庭影院型节目内容再现的明显的3维分配。该N个输入数据信道被下混频为例如使用现代立体声音频编码装置编码的两个中间音频数据信道。该编码装置有利地使用主要分量分析和/或左前和左后数据信道的相位校准。该编码器还被用来使用单独的主要分量分析和/或右前和右后输入信道上的相位校准。而且,该编码器可操作地生成包括与下列有关的信息的参数开销数据:
(a)左前和左后数据信道之间的信道间水平差;
(b)右前和右后数据信道之间的信道间水平差;
(c)与左前和左后数据信道相关的信道间相关数据;
(d)与右前和右后数据信道相关的信道间相关数据;以及
(e)在中心数据信道和该左前、左后、右前和右后数据信道的功率和之间的功率比。
这两个中间数据信道和参数开销数据被结合以从编码器生成编码的输出数据。任选地,与信道间相位差以及优选地一侧的左前和左后数据信道与另一侧的右前和右后数据信道之间的总相位差相关的数据,被包括在来自该编码器的编码的输出数据中。关于本发明的这个例示实施例在(a)至(e)中执行的参数分析,优选地涉及时间和频率分析;更优选地,该分析通过后面将进一步解释的时间-频率片来执行。
在本发明的优选实施例中,编码器的操作现在将根据其相关的数学函数参照图1更详细地加以描述,其中图1的部件和信号以如表1中提供的来定义。
表1:
  10   编码器   320   中心信号,Sc
  20   第一信道   330   右前信号,Srf
  30   第二信道   340   右后信号,Srr
  40   第三信道   350   左前变换信号,TSlf
  100   分段和变换单元   360   左后变换信号,TSlr
  110   参数分析单元   370   第一参数组,PS1
  120   参数至下混频矢量单元   380   左中间信号,LI
  130   下混频单元   400   中心中间信号,CI
  140   分段和变换单元   410   右前变换信号,TSrf
  150   分段和变换单元   420   右后变换信号,TSrr
  160   参数分析单元   430   第二参数组,PS2
  170   参数至下混频矢量单元   440   右中间信号,RI
  180   下混频单元   450   第三参数组,PS3
  200   混频和参数提取单元   460   右预输出信号,PRout
  210   逆变换和OLA单元   470   左预输出信号,PLout
  300   左前输入信号,Slf   480   右输出信号,Rout
  310   左后输入信号,Slr   490   左输出信号,Lout
在图1中,示出了通常由10表示的编码器。编码器10分别包括第一、第二和第三输入信道20、30、40。来自这三个信道20、30、40的输出信号380、400、440(即LI、CI、RI)分别被耦合到混频和参数提取单元200。该提取单元200包括相关的右和左预输出信号460、470,即PRout、PLout,其被连接到逆变换和OLA单元210,用于分别生成编码的右和左输出信号480、490,即Rout、Lout
第一信道20包括分段和变换单元100,用于分别接收左前和左后输入信号300、310,即Slf、Slr。对应的左前和左后变换信号350、360(即TSlf、TSlr)被耦合到信道20的下混频单元130,以及还耦合到信道20的参数分析单元110。第一参数组信号370(即PS1)被耦合到参数至下混频矢量转换单元120的输入端,所述参数至下混频矢量转换单元120的相应输出被耦合到下混频单元130。
第二信道30包括分段和变换单元140,其被用来接收中心输入信号320,即Sc。该中心中间信号400,即CI,如上所述,被从变换单元140耦合到参数提取单元200。
第三信道40包括一个分段和变换单元150,用于分别接收右前和右后输入信号330、340,即Srf、Srr。对应的右前和右后变换信号410、420(即TSrf、TSrr)被耦合到信道40的下混频单元180,以及还耦合到信道40的参数分析单元160。第二参数组信号430(即PS2)被耦合到参数至下混频矢量转换单元170的输入端,所述参数至下混频矢量转换单元170的相应输出被耦合到下混频单元180。
参数提取单元200被用来从信道20、30、40接收信号380、400、440以生成第三参数组输出450(即PS3)以及预输出信号470、460,即用于OLA单元210的PRout、PLout
编码器10能够在专用硬件中实现。可替换地,编码器10可以基于计算机硬件,该计算机硬件被用来执行用于实现编码器10的处理功能的软件。作为又一可替换方案,编码器10可以由耦合到在软件控制下工作的计算机硬件的专用硬件的组合来实现。
现在将参照图1对编码器10的操作进行描述。信号Slf[n]、Slf[n]、Srf[n]、Srr[n]、Sc[n]分别描述了左前、左后、右前、右后和中心音频信号的离散时间波形。在信道20、30、40中,这五个信号使用常用分段,优选地使用重叠分析窗来进行分段。随后,使用复变换(例如付立叶变换或同等类型的变换)将每个分段从时域变换到频域;可替换地,复滤波器组结构(例如使用至少一种硬件或在软件中模拟来实现)可以被使用以获得时间/频率片。这样的信号处理导致在由Lf[k]、Lr[k]、Rf[k]、Rr[k]、C[k]表示的频域中输入信号的分段子带表示,其中参数k表示频率指数,L表示左,R表示右,f表示前,r表示后以及C表示中心。
在参数提取单元200中,在第一步骤中执行数据处理以估计左前和左后信号之间的相关参数。这些参数包括水平差IIDL、相位差IPDL和相关ICCL。优选地,相位差IPDL对应平均相位差。此外,这些参数IIDL、IPDL和ICCL如等式1至3(Eq.1至Eq.3)中提供的那样来计算:
IID L = 10 log 10 ( Σ k L f [ k ] L f * [ k ] Σ k L r [ k ] L r * [ k ] ) - - - Eq . 1
IPD L = ∠ ( Σ k L f [ k ] L r * [ k ] Σ k L f [ k ] L f * [ k ] Σ k L r [ k ] L r * [ k ] ) - - - Eq . 2
ICC L = | ( Σ k L f [ k ] L r * [ k ] Σ k L f [ k ] L f * [ k ] Σ k L r [ k ] L r * [ k ] ) | - - - Eq . 3
其中符号*表示复共轭。
由等式1至3描述的处理还为右前和右后信号进行重复,这样的处理导致分别与水平差、相位差和相关有关的相应参数IIDR、IPDR和ICCR
在参数至下混频矢量变换单元120中,在第二步骤中执行数据处理以计算用于两个信号左前Lf和左后Lr的下混频的复权重。在优选实施例中,被发送到下混频单元130的下混频矢量被用来通过应用输入信号空间的旋转α和/或复相位校准来最大化下混频信号Y[k]的能量。
下混频应用如下。使用旋转角度α将该两个信号Lf和Lr进行旋转以获得主信号Y[k]和相应的残留信号Q[k],所述旋转角度α最大化如等式4(Eq.4)描述的主信号Y[k]的能量:
Y [ k ] Q [ k ] = cos α sin α - sin α cos α L f [ k ] exp ( j ( - OPD L ) ) L r [ k ] exp ( j ( - OPD L + IPD L ) ) - - - Eq . 4
其中,角度OPDL表示总的相位旋转角度,同时计算相位差IPDL以保证这两个信号Lf、Lr的最大相位校准。旋转角度α可以使用等式5和6(Eq.5和Eq.6)根据所提取的参数来计算:
α = 1 2 arctan ( 2 g ICC L g 2 - 1 ) - - - Eq . 5
其中,
g = 10 IID L 20 - - - Eq . 6
等式4的信号Q[k]随后在参数提取单元200中被丢弃,信号Y[k]由标量β来按比例缩放以获得信号L[k],使得信号L[k]具有与信号Q[k]的功率加上信号Y[k]的功率近似的功率;换句话说,信号Q[k]被丢弃同时所引起的信号功率中的相应损失通过按比例缩放信号Y[k]来补偿。使用等式7和8(Eq.7和Eq.8)来计算标量β:
β = 1 + 1 - μ 1 + μ - - - Eq . 7
其中
μ = 1 + 4 ICC L 2 - 4 ( g + 1 g ) 2 - - - Eq . 8
还为该右前和右后信号对重复第一和第二步骤,导致生成相应的信号R[k]。应当注意到,PCA旋转的使用可以通过使用旋转角度α的固定值来防止(circumvent)。
在编码器10中执行的第三处理步骤包括将中心信号C[k]混频到两个信号L[k]和R[k],这导致分别产生预输出信号470、460,即PLout、PRout。这样的混频按照等式9(Eq.9)来执行:
PL out [ k ] PR out [ k ] = L [ k ] + ϵC [ k ] R [ k ] + ϵC [ k ] - - - Eq . 9
其中,参数ε表示在与等式9相关的混频中确定信号C[k]强度的权重,例如典型地ε=0.707。优选地,L、C和R的相应组合在相位方面被对准,否则出现相位相消。
描述了信号C的功率相对于信号L和R的功率的参数IIDC可根据等式10(Eq.10)来计算:
IID C = 10 log 10 ( ϵ 2 Σ k C [ k ] C * [ k ] Σ k L [ k ] L * [ k ] + Σ k R [ k ] R * [ k ] ) - - - Eq . 10
在编码器10中,为每个时间/频率片重复执行包括前面所述的第一、第二和第三步骤的上述处理。
信号PLout[k]和PRout[k]随后在编码器中被转换到时域并且使用重叠相加类型的和与以前的分段相结合以分别生成上述输出信号490、480,即Lout、Rout
来自编码器10的输出数据能够通过通信网络被传送,例如通过因特网或其它类似的广播网络。可替换地,或附加地,该输出数据能够通过数据载体进行传送,例如DVD数据光盘或其它类似类型的数据传送介质。
来自编码器10的输出数据能够在与编码器10兼容的解码器中进行解码,例如在图3中通常由800表示的解码器。解码器800包括数据处理单元810,用于对从编码器10、600接收的输出信号480、490和相关参数数据370、430、450、690进行各种数学运算以生成相应的解码的输出信号(DOP)。
为了提供向后兼容性,这样的解码器可以为立体声、3信道和5信道设备的至少一种。在与编码器10兼容的立体声型解码器中,即其中解码器800包括仅用于DOP的两个解码输出,该立体声类型的解码器具有两个重放信道,从编码器10提供的信号Rout、Lout在立体声型解码器中通过两个重放信道来再现,无须执行进一步的处理。
在与编码器10兼容的3信道解码器中,具有三个重放信道的解码器,即其中解码器800包括用于DOP的三个解码输出,例如从数据载体(诸如DVD光盘)读取的两个信号Rout、Lout被分段并且然后被变换为上述频域。相应的再现信号L[k]、R[k]和C[k]于是使用等式11至16(Eq.11至Eq.16)来得到:
L [ k ] R [ k ] C [ k ] = w L L out w R R out w LC L out + w RC R out - - - Eq . 11
其中
w LC = 0.5 ϵ σ C 2 σ L 2 - - - Eq . 12
w RC = 0.5 ϵ σ C 2 σ L 2 - - - Eq . 13
σ L 2 = Σ k L [ k ] L * [ k ] - - - Eq . 14
σ R 2 = Σ k R [ k ] R * [ k ] - - - Eq . 15
σ C 2 = σ L 2 + σ R 2 2 + 10 - IID C 10 - - - Eq . 16
用于用户欣赏的三信道音频信号于是以类似上面描述的方式从信号L[k]、R[k]和C[k]中获取。
在与编码器10兼容的五信道解码器(即提供五个解码输出的解码器800)中,使用上面所述的三信道重放重建,这导致在解码器处重新生成信号L[k]、R[k]和C[k]。在该五信道解码器中,执行进一步的步骤,其涉及将信号L[k]分离成其组成分量,即前左分量Lf[k]和后左分量Lr[k];类似地,信号R[k]也被分离成其组成分量,即前右分量Rf[k]和后右分量Rr[k]。这样的信号分离利用编码器逆旋转运算,其补充与上面描述的编码器10中执行的旋转。该逆旋转所需的主信号Y[k]和残留信号Q[k]使用等式17和18(Eq.17、18)在该五路解码器中获取:
Y [ k ] Q [ k ] = L [ k ] cos γ H [ k ] L [ k ] sin γ - - - Eq . 17
其中,
γ = arctan ( 1 - μ 1 + μ ) - - - Eq . 18
其中参数μ在上面等式8(Eq.8)中先前定义。在等式17中,H[k]表示全通去相关滤波器以获得信号L[k]的去相关形式。随后,信号Lf[k]和Lr[k]使用如等式19(Eq.19)所描述的编码器逆旋转函数来生成:
L f [ k ] L r [ k ] = cos α - sin α sin α cos α exp ( j OPD L ) 0 0 exp ( j OPD L - IPD L ) Y [ k ] Q [ k ] - - - Eq . 19
类似的处理还应用到右侧信道分量。
在与编码器10兼容的四信道解码器中,该四信道解码器可操作来首先以一种类似在上面所述的五信道解码器中使用的方式解码五个信道,以生成五个音频信号Slf、Slr、Srf、Srr和Sc。其后,按照等式20和21(Eq.20、21)进行简单混频,以生成左前和右前音频信号Slf,playback、Srf,playback给用户欣赏:
Slf,playback=Slf+qSc                   Eq.20
Srr,playback=Srf+qSc                   Eq.21
其中,系数q=0.707。
对于所述四信道解码器,系数q保证了中心信号分量的总功率基本不变,不论通过单个中心扬声器重放还是作为用户的仿真主观声源(phantom apparent source of sound),该声源是由耦合到四信道解码器的左前和右前扬声器创建的。
应当理解,上面所描述的本发明的实施例能在不背离由所附权利要求定义的本发明的范围的前提下进行修改。
本发明人已经认识到,编码器10不支持效果信道(LFE)的编码,例如低频效果信道。这样的LFE信道是有益的,例如用于传送声音效果信息(诸如雷声信息或爆炸声信息),其在例如家庭影院系统中有利地伴随着视觉信息同时呈现给用户。因此,在本发明的一个实施例中,发明人已经意识到,有利地修改编码器10以增强其第二信道30并且由此产生如图2中所描述的并且在其中通常表示为600的编码器。任选地,LFE信道具有大致120Hz的相对受限的频率带宽,尽管也能供给可选择的相对更大的带宽。
编码器600通常类似于编码器10,除了编码器600的第二信道30被提供有参数分析单元630、参数至下混频矢量单元640和下混频单元650,它们以分别与第一和第三信道20、40的相应部件类似的方式被连接;编码器600的信道30可操作地输出第四参数组690,即PS4。此外,编码器600的第二信道30包括用于接收低频效果信号S1fe的低频效果(lfe)输入610,以及还有用于接收上述中心信号SC的一个输入620。优选地,信号Slfe的处理限于从子音频频率向上的120Hz频率带宽并且因此可能适合驱动现代的亚低音扬声器类型的扬声器。然而,本发明的实施例能够使用具有远大于120Hz的带宽的第二信道30来实现,例如以提供对应于类似脉冲的声音的高频信号信息。
与编码器10相比,包括来自编码器600的输出中的低频效果信息,这要求使用额外的参数。呈现给输入610的信号在编码器600中被分析以确定相应的典型参数,该参数在时间/频率片的基础上以类似于通过编码器10处理上述音频信号的方式进行分析。相应的解码器优选地被用来包括额外的特征,用于解码该低频信息,以重新生成例如适合于放大以驱动家庭影院系统中的音频亚低音扬声器的信号。
在所附的权利要求中,括号中的数字和其它符号被用来帮助理解权利要求并且并非旨在以任何方式限制权利要求的范围。
诸如“包含”、“包括”、“结合”、“包纳”、“是”以及“具有”等表达当解释本说明书和其相关权利要求时以非排他的方式被解释,即被解释为允许出现没有明确定义的其他项或组件。对单数的引用还被解释为对复数的引用,并且反之亦然。

Claims (25)

1.一种多信道编码器(10;600),所述编码器被用来处理在N个输入信道中传送的输入信号(300,310,320,330,340;300,310,610,620,330,340)以生成在M个输出信道中传送的相应输出信号(480,490)以及参数数据(450),使得M和N为整数并且N大于M,该编码器包括:
(a)下混频器,用于下混频输入信号以生成相应的输出信号;以及
(b)分析器,用于在下混频期间或者作为单独的过程处理该输入信号,所述分析器可操作地生成补充输出信号的所述参数数据,所述参数数据描述了输入信号的N个信道之间的相互差,以便基本上允许在解码期间从M个信道的输出信号中重新生成所述N个信道的输入信号中的一个或多个,所述输出信号为兼容于解码器中进行重现的格式,所述解码器提供了N个或少于N个输出信道以能够向后兼容。
2.根据权利要求1的编码器,其中该编码器为5信道编码器,所述5信道编码器被用来以与相应的2信道立体声解码器、3信道解码器和4信道解码器中的至少一种相兼容的格式生成所述输出信号和参数数据。
3.根据权利要求1的编码器,其中所述分析器包括处理装置,用于经由从时域到频域的变换来转换该输入信号,并且用于处理这些被变换的输入信号以生成参数数据。
4.根据权利要求3的编码器,其中所述下混频器和分析器中的至少一个被用来将输入信号作为时间-频率片的序列进行处理以生成该输出信号。
5.根据权利要求4的编码器,其中该片通过相互重叠分析窗的变换来获得。
6.根据权利要求1的编码器,包括编码装置,用于处理该输入信号以生成M个中间音频数据信道,以包括在M个输出信号中,该分析器被用来输出与至少下列之一相关的参数数据中的信息:
(a)信道间输入信号功率比或对数水平差;
(b)输入信号之间的信道间相关;
(c)一个或多个信道的输入信号和该一个或多个信道的输入信号的功率和之间的功率比;以及
(d)信号对之间的相位差或时间差。
7.根据权利要求6的编码器,其中在(d)中的所述相位差为平均相位差。
8.根据权利要求6的编码器,其中对相位差、相关数据和功率比中的至少一个进行计算之后是主要分量分析(PCA)和/或信道间相位校准以生成该N个输出信号。
9.根据权利要求1的编码器,其中在N个信道中所传送的至少一个输入信号对应效果信道。
10.根据权利要求1的编码器,以适合于使用常规的重放系统进行重放的格式生成输出信号。
11.一种在多信道编码器中编码在N个输入信道中所传送的输入信号以生成在M个输出信道中所传送的相应输出信号以及参数数据,使得M和N为整数并且N大于M的方法,该方法包括步骤:
(a)下混频该输入信号以生成相应的输出信号;以及
(b)当被下混频时在分析器中处理该输入信号或者单独地处理该输入信号,所述处理提供补充该输出信号的所述参数数据,所述参数数据描述了N个信道的输入信号之间的相互差以便基本上允许在解码期间从M个信道的输出信号中重新生成N个信道的输入信号,所述输出信号是兼容于在解码器中进行再现的格式,该解码器提供N或少于N个信道。
12.根据权利要求11的方法,适应于编码对应5个信道的输入信号并且生成其格式兼容于相应的2信道立体声解码器、3信道解码器和4信道解码器中的一种或多种解码器的输出信号和参数数据。
13.根据权利要求11的方法,其中所述处理包括经由从时域到频域的变换来转换输入信号。
14.根据权利要求13的方法,其中至少一个输入信号被作为时间-频率片序列来处理以生成输出信号。
15.根据权利要求14的方法,其中所述的片对应相互重叠的分析窗。
16.根据权利要求11的方法,该方法包括使用编码装置用于处理该输入信号以生成M个中间音频数据信道以便包括在输出信号中的步骤,该编码装置被用来输出与至少下列之一相关的参数数据中的信息:
(a)信道间输入功率比或对数水平差;
(b)输入信号之间的信道间相关;
(c)一个或多个信道的输入信号和该一个或多个信道的输入信号的功率和之间的功率比;以及
(d)信号对之间的功率差或时间差。
17.根据权利要求16的方法,其中功率差为平均功率差。
18.根据权利要求16的方法,其中对所述相位差、相关数据和功率比中的至少一个进行计算之后是主要分量分析(PCA)和/或信道间相位校准以生成该输出信号。
19.根据权利要求11的方法,其中在N个信道中所传送的输入信号中的至少一个对应效果信道。
20.使用根据权利要求11的方法生成的编码数据内容。
21.在其上存储如在权利要求20中所述的编码数据的数据载体。
22.一种解码器(800),可操作地解码由根据权利要求1的编码器(10;600)生成的编码的输出数据(370,430,450,480,490,690),所述编码的输出数据(370,430,450,480,490,690)包括M个信道(480,490)以及从N个信道的输入信号所生成的相关参数数据(370,430,450,690),使得M<N,其中M和N为整数,该解码器(800)包括处理器(810):
(a)用于接收编码的输出数据(370,430,450,460,490,690)并且将该数据从时域转换到频域;
(b)用于在频域中应用该参数数据以从该M个信道提取内容以便从该M个信道中重新生成对应N个信道中的一个或多个的输入信号的重新生成的数据内容,该数据内容不是直接包括在编码的输出数据中或从编码的输出数据中遗漏;以及
(c)用于处理该重新生成的数据,从而在解码器的一个或多个输出端输出N个信道的一个或多个重新生成的输入信号。
23.根据权利要求22的解码器(800),其中所述处理器(810)可操作地应用全通去相关滤波器以获得信号的去相关形式,用于在解码器处重新生成N个信道的所述一个或多个输入信号。
24.根据权利要求23的解码器(800),其中所述处理器可操作来应用编码器逆旋转,以将M个信道的信号和其去相关形式分离成它们的组成分量,用于在解码器处重新生成N个信道的所述一个或多个输入信号。
25.根据权利要求24的解码器(800),其中所述解码器(800)可操作地单独从在所述解码器(800)处接收的所述编码的输出数据(450,480,490)中生成其一个或多个解码器输出(1300至1340)。
CNA2005800121043A 2004-04-05 2005-03-25 多信道编码器 Pending CN1942929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110035024.7A CN102122509B (zh) 2004-04-05 2005-03-25 多信道解码器和多信道解码方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04101405.1 2004-04-05
EP04101405 2004-04-05
EP04102863.0 2004-06-22

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201110035024.7A Division CN102122509B (zh) 2004-04-05 2005-03-25 多信道解码器和多信道解码方法

Publications (1)

Publication Number Publication Date
CN1942929A true CN1942929A (zh) 2007-04-04

Family

ID=37955211

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800121043A Pending CN1942929A (zh) 2004-04-05 2005-03-25 多信道编码器

Country Status (1)

Country Link
CN (1) CN1942929A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
CN102714036A (zh) * 2009-12-28 2012-10-03 松下电器产业株式会社 语音编码装置和语音编码方法
CN105518775A (zh) * 2013-07-22 2016-04-20 弗朗霍夫应用科学研究促进协会 使用自适应相位校准的多声道降混的梳型滤波器的伪迹消除
CN105632505A (zh) * 2014-11-28 2016-06-01 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102714036A (zh) * 2009-12-28 2012-10-03 松下电器产业株式会社 语音编码装置和语音编码方法
CN102714036B (zh) * 2009-12-28 2014-01-22 松下电器产业株式会社 语音编码装置和语音编码方法
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
US9319818B2 (en) 2010-02-12 2016-04-19 Huawei Technologies Co., Ltd. Stereo signal down-mixing method, encoding/decoding apparatus and encoding and decoding system
CN105518775A (zh) * 2013-07-22 2016-04-20 弗朗霍夫应用科学研究促进协会 使用自适应相位校准的多声道降混的梳型滤波器的伪迹消除
US10360918B2 (en) 2013-07-22 2019-07-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
US10937435B2 (en) 2013-07-22 2021-03-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
CN105632505A (zh) * 2014-11-28 2016-06-01 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置
CN105632505B (zh) * 2014-11-28 2019-12-20 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置

Similar Documents

Publication Publication Date Title
CN102122509B (zh) 多信道解码器和多信道解码方法
US9473870B2 (en) Loudspeaker position compensation with 3D-audio hierarchical coding
CN101044550A (zh) 产生编码多通道信号的设备和方法、对编码多通道信号进行解码的设备和方法
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
CN1357136A (zh) 不损失译码器兼容性下低比特率音频编码系统的音质提高
CN1947172A (zh) 方法、装置、编码器设备、解码器设备以及音频系统
CN1993733A (zh) 用于空间音频参数的有效编码的能量相关量化
CN1451255A (zh) 具有向后兼容性混频的分立式多声道音响
CN1906664A (zh) 音频编码器和音频解码器
CN1669359A (zh) 音频编码
MXPA06009931A (es) Codificacion, basada en la frecuencia, de canales en sistemas de codificacion parametricos de multiples canales.
CN101031959A (zh) 带有压缩侧面信息的多声道分级音频编码
CN1783728A (zh) 通过使用空间信息来处理多声道音频信号的设备和方法
CN1647156A (zh) 参数多声道音频表示
CN1922654A (zh) 音频分发系统、音频编码器、音频解码器及其操作方法
RU2007139918A (ru) Кодирование многоканального аудио
EP1866911A1 (en) Scalable multi-channel audio coding
CN1897467A (zh) 信号编码、信号解码装置和方法、程序以及记录介质
CN1910655A (zh) 构造多通道输出信号或生成下混信号的设备和方法
CN101053017A (zh) 多通道音频信号的编码和解码
CN1655651A (zh) 基于后期混响的听觉场景
CN1503572A (zh) 多个因式分解可逆变换的逐次浮现无损嵌入式音频编码器
CN1234896A (zh) 信息解码方法和装置、信息编码方法和装置以及供应媒体
CN1469684A (zh) 用于产生多声道声音的方法和装置
CN1930914A (zh) 参数多声道编码系统中基于频率的音频声道编码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070404