CN101160619B - 音频编码器及相应的编码方法 - Google Patents
音频编码器及相应的编码方法 Download PDFInfo
- Publication number
- CN101160619B CN101160619B CN2006800121211A CN200680012121A CN101160619B CN 101160619 B CN101160619 B CN 101160619B CN 2006800121211 A CN2006800121211 A CN 2006800121211A CN 200680012121 A CN200680012121 A CN 200680012121A CN 101160619 B CN101160619 B CN 101160619B
- Authority
- CN
- China
- Prior art keywords
- signal
- audio
- audio signal
- relevant parameters
- passages
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003044 adaptive effect Effects 0.000 title description 8
- 230000005236 sound signal Effects 0.000 claims abstract description 211
- 238000002156 mixing Methods 0.000 claims abstract description 99
- 238000000034 method Methods 0.000 claims abstract description 68
- 238000012545 processing Methods 0.000 claims description 38
- 238000009795 derivation Methods 0.000 claims description 15
- 230000006835 compression Effects 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 238000012546 transfer Methods 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000013459 approach Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 claims description 2
- 230000006837 decompression Effects 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 6
- 230000008447 perception Effects 0.000 abstract description 3
- 238000012805 post-processing Methods 0.000 abstract 1
- 239000011159 matrix material Substances 0.000 description 21
- 238000012937 correction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000003750 conditioning effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000004134 energy conservation Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- VEMKTZHHVJILDY-UHFFFAOYSA-N resmethrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UHFFFAOYSA-N 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
当所使用的下混音规则取决于空间参数时,具有至少两个通道的音频信号可被有效地下混音为下混音信号与残余信号,所述空间参数是从所述音频信号导出的并由限制器进行后处理,以将特定限制应用于所导出的空间参数,从而避免在上混音或下混音处理期间的不稳定。通过具有一种动态地取决于描述了音频通道之间相互关系的参数的下混音规则,可确保在所述下混音残余信号中的能量是尽可能的小,这对于编码效率是有利的。在下混音中使用限制器之前,使用限制器对空间参数进行后处理,可避免在下混音或上混音中的不稳定,否则这会造成对编码或解码音频信号的空间感知的干扰。
Description
技术领域
本发明与音频信号的编码与解码有关,特别是与音频通道对的有效高质量编码有关。
背景技术
最近,随着利用像是卫星或地面数字音频或视频广播所进行的压缩音频或视频内容数字分发的广泛使用,使得有效高质量编码的音频信号变的愈来愈重要。举例而言,已知的MP3技术,允许遍及因特网或其它具有有限的带宽传送通道的音频标题的方便传送。
除MP3以外,许多其它音频编码结构的目标,都是将给定压缩比例或比特率下的音频质量最大化。在PCT/SE02/01372的“Efficientand scalable Parametric Stereo Coding for Low Bit rate Audio CodingApplication”中已经证明当附加地使用一种通常称为”空间信号(spatialcue)”的立体声信号的紧凑表示时,可以从单声道信号重新建立几乎与基础的原始立体声图像非常类似的立体声信号。此公开的原则是将该立体声输入信号分至频带中,并为了每个频带分别估计称为通道间强度差(IID)与通道间相干性(ICC)的参数。第一参数描述在特定频带中两个通道之间的功率分布测量,而第二参数描述两个通道之间相关性的估计。在“High-Quality Parametric Spatial Audio Coding at LowBitrates”,J.Breebaart,S.van de Par,A.Kohlrausch和E.Schuijers,Proc.116th AES会议,柏林(德国),2004年5月8-11日中可以获得更完整的空间参数叙述。根据这些空间信号,将立体声输入信号适应性地组合为单声道信号。对空间信号与单声道信号两者进行编码,并将编码后的表示多路复用至比特流中,接着传送至解码器。在解码器侧,通过根据IID数据在两输出通道之间分布单声道信号能量,并通过加入保 留如由ICC参数所描述的原始立体声通道的通道相关性的去相关信号,以从所述单声道信号中重新建立该立体声图像。
当可以利用更多的传送带宽时,可以通过以所传送的残余信号取代解码器中的去相关性单声道信号,以获得较高的音频质量。也就是说,需要将附加的残余信号传送至该解码器。在对立体声信号通道的和与差进行编码、而并非对左通道与右通道进行直接编码的中-侧(MS)编码(mid-side coding)的情况中也是如此。在“Sum-differencestereo transform coding”,Proc.Int.Conf.Acoust.Speech Signal Process(ICASSP),San Francisco,USA,1992,pp.II 569-572中,可获得对于MS技术的描述。MS编码是根据立体声信号的左与右通道可能具有相当高的相似程度的发现。因此,在大多时间中,左通道与右通道之差在大多数时间只产生具有较低强度的信号,换言之,差信号的振幅将相当的小。因此,当对差信号进行编码时,可节约大量的比特率,因为描述了所述差信号的参数可以被粗略地量化。当进行编码时,所述和信号显然将需要大概与所述单个左通道或右通道相同的带宽。因此,当利用MS编码方案时,总体上而言可节约大量的带宽。当在左通道与右通道之间存在大强度差时,MS技术存在限制,因为差通道也明显地包含大量能量,并因此需要较高的带宽。然而可以注意的是,由于高编码成本的因素,在规则的立体声编码实施方式中,在这种情况下并不使用MS编码。在那些情况中,有利的情况是可以根据已经编码的原始音频通道所具备的强度,在一般立体声编码与所述MS编码之间进行切换。
通过发明具有描述了由两立体声通道组合而成的两中间通道的组成的矩阵元素的解码器旋转矩阵,来代替构建要进行编码的两立体声通道的和与差的静态概念,便可以克服上述的问题。所述矩阵元素取决于参数化立体声参数,该参数化立体声参数是从立体声信号的左与右通道中所提取的。适应性残余编码能够动态地使用于产生中间通道的所述组合规则适于当前信号的属性,以通过MS编码获得明显的性能增益。
从所述参数化立体声参数中选择称为旋转矩阵的矩阵元素的适合的相关性,便可以实现使差通道中的能量尽可能的最小化,如同在欧洲申请专利申请EP 04103168.3中已经提到的。当引入了旋转矩阵以将所述(下混音或上混音)立体声信号转换为信号m与s(中间信号,换言之,下混音信号m与残余信号s)时,对于所述方法而言,重要的是所述旋转矩阵(解码器旋转矩阵与编码器旋转矩阵)必须受到限制。这意味着所述矩阵之中的矩阵元素不会在可能的参数化立体声编码参数完整范围之中发散至无限大。换句话说,必须要限制这两个旋转矩阵,从而在所述矩阵条件数量足够小以至于对于所述参数化立体声编码参数完整范围而言可以允许进行无疑的矩阵转换,而这并非在现有技术中所实现的情况。
现有技术中已知与以上不稳定问题相关的多个文献。
一种方式(WERNER COMEN,ERIK SCHUIJERS,HEIKOPURNHAGEN,JONAS ENGDEGARD:“MPEG4-EXT2:CE ON LOWCOMPLEXITY PARAMTERTIC STEREO-ISO/IEC JTC1/SC29/WG11-MPEG2003/M10366”CODING OF MOVING PICTURES AND AUDIO-ISO/IEC,2003年12月(2003-12),XP002388137,夏威夷)涉及MPEG4格式的音频编码。提出了将参数化立体声参数限制于预定的固定限制内,以避免计算不稳定问题。
类似地,在另一方式中(FALLER CHRISTOF:“Parametric codingof spatial audio-Thesis No 3062” THESE PRESENTEE A LA FACULTEINFORMATIQUE ET COMMUNICATIONS INSTITUT DE SXSTEMESDE COMMUNICATION SE
美国专利6021386涉及对音频信息的多个通道进行编码。在编码器中,表示多维声音源的音频通道的多个通道被分为子带信号,以及将一个或多个子带中的子带信号组合以形成要传送的复合信号。在编码后的输出信号内附加地传送组合为复合信号的子带信号的谱等级。 谱等级信息传送了组合后的子带信号的振幅或功率、或者通过组合后的子带信号所表示的源场的明显方向。为了避免人工信号,可以对复合信号施加限制。
发明内容
本发明的目标是提供一种高质量音频编码的概念,该高质量音频编码形成了音频信号的一种高度压缩表示,并同时有效避免了由编码或解码引入的人工信号(artefact)。
根据本发明的第一方面,此目标是通过一种用以对具有至少两个通道的音频信号进行编码的音频编码器所实现,所述音频编码器包括:参数提取器,用以从音频信号导出空间参数,其中所述空间参数描述所述至少两个通道之间的相互关系;限制器,用以利用限制规则限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及下混音器,用以利用取决于所述限制后的空间参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
根据本发明的第二方面,此目标是通过一种音频解码器所实现,所述音频解码器用以对表示具有至少两个通道原始音频信号的编码音频信号进行解码,所述编码音频信号具有下混音信号、残余信号与描述所述至少两个通道之间相互关系的空间参数,所述音频解码器包括:限制器,用以利用一种限制规则限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及上混音器,用以利用取决于所述限制后的空间参数的上混音 规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
根据本发明的第三方面,此目标是通过一种用于对具有至少两个通道的音频信号进行编码的方法所实现,所述方法包括:从所述音频信号导出空间参数,其中所述空间参数描述了在所述至少两个通道之间的相互关系;利用限制规则限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及利用取决于所述限制后的空间参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
根据本发明的第四方面,此目标是通过一种用以对表示具有至少两个通道原始音频信号的编码音频信号进行解码的方法所实现,所述编码音频信号具有下混音信号、残余信号与描述所述至少两个通道之间相互关系的空间参数,所述方法包括:利用限制规则来限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及利用取决于所述限制后的空间参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
根据本发明的第五方面,此目标是通过一种传送器或音频记录器所实现,其具有用以对具有至少两个通道的音频信号进行编码的音频编码器,所述传送器或音频记录器包括:参数提取器,用以从所述音频信号导出空间参数,其中所述空间参数描述了在所述至少两个通道之间的相互关系;限制器,用以利用限制规则来限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及下混音器,用以利用取决于所述限制后的空间参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
根据本发明的第六方面,此目标是通过一种接收器或音频播放器所实现,其具有用以对表示具有至少两个通道的原始音频信号的编码音频信号进行解码的音频解码器,所述编码音频信号具有下混音信号、残余信号与描述所述至少两个通道之间相互关系的空间参数,所述接收器或音频播放器包括:限制器,用以利用限制规则来限制所述空间 参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及上混音器,用以利用取决于所述限制后的空间参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
根据本发明的第七方面,此目标是通过一种进行传送或音频记录的方法所实现,所述方法具有产生编码信号的方法,所述方法包括用于对具有至少两个通道的音频信号进行编码的方法,所述方法包括:从所述音频信号导出空间参数,其中所述空间参数描述在所述至少两个通道之间的相互关系;利用限制规则来限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及利用取决于所述限制后的空间参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
根据本发明的第八方面,此目标是通过一种用于接收或音频播放的方法所实现,所述方法具有用以对编码音频信号进行解码的方法,所述方法包括用以对表示具有至少两个通道原始音频信号的编码音频信号进行解码的方法,所述编码音频信号具有下混音信号、残余信号与描述所述至少两个通道之间相互关系的空间参数,所述方法包括:利用限制规则来限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及利用取决于所述限制后的空间参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
根据本发明的第九方面,此目标是通过一种传送系统所实现,其具有传送器与接收器,所述传送器具有对具有至少两个通道音频信号进行编码的音频编码器,包括:参数提取器,用以从所述音频信号导出空间参数,其中所述空间参数描述在所述至少两个通道之间的相互关系;限制器,用以利用限制规则来限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及下混音器,用以利用取决于所述限制后的空间参数的下混音规则,从所述音频信号导出下混音信号与残余信号;以及所述接收器具有用以对表示具有至少两个通道原始音频信号的编码音频信号 进行解码的音频解码器,所述编码音频信号具有下混音信号、残余信号与描述所述至少两个通道之间相互关系的空间参数,包括:限制器,用以利用限制规则来限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及上混音器,用以利用取决于所述限制后的空间参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
根据本发明的第十方面,此目标是通过一种传送与接收的方法所实现,所述方法包括传送方法,其具有产生具有至少两个通道的音频信号的编码信号的方法,所述传送方法包括:从所述音频信号导出空间参数,其中所述空间参数描述在所述至少两个通道之间的相互关系;利用限制规则来限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及利用取决于所述限制后的空间参数的下混音规则,从所述音频信号导出下混音信号与残余信号;所述方法也包括接收方法,其具有对编码音频信号进行解码的方法,所述接收方法包括:利用限制规则来限制所述空间参数,以导出限制后的空间参数,其中所述限制规则取决于所述至少两个通道之间的相互关系;以及利用取决于所述限制后的空间参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
根据本发明的第十一方面,此目标是通过一种表示具有至少两个通道音频信号的编码音频信号所实现,所述编码音频信号具有描述在所述至少两个通道之间相互关系的空间参数、下混音信号与残余信号,其中所述下混音信号与残余信号是利用取决于限制后的空间参数的下混音规则,从所述音频信号所导出的,而所述限制后的空间参数则是利用取决于所述至少两个通道相互关系的限制规则所导出的。
本发明是根据当一种具有至少两个通道的音频信号,其所使用的下混音规则取决于由所述音频信号所导出的空间参数,并由限制器进行后处理以对所述导出空间参数应用特定限制时,可以被有效地下混音为下混音信号与残余信号,并以避免在上混音或下混音处理期间的不稳定为目标。通过具有一种与描述所述音频通道之间相互关系动态 相关的下混音规则,可确保在所述下混音残余信号中的能量是尽可能的小,这对于编码效率的方面是有利的。通过在下混音之前利用限制器进行所述空间参数后处理的方式,可避免在下混音或上混音中的不稳定,否则便会造成所述编码或解码音频信号的空间感知的干扰。
在本发明的一实施例中,将具有左与右通道的原始立体声信号供应至下混音器与参数提取器。所述参数提取器导出一般所知的空间参数ICC(通道间相关)及IID(通道间强度差)。下混音器能够将左与右通道下混音为下混音信号与残余信号,其中所述下混音规则使得所述形成的残余信号具有最小可获得的能量。因此,利用标准音频编码器对所形成的残余信号进行后续压缩将会形成一种极为紧凑的代码。这可以通过使取决于空间参数ICC及IID的下混音规则方程式化来实现,因为所述两参数都描述所述原始立体声通道的强度或振幅比率。在编码期间的普遍问题是能量保存。原始信号与编码信号两者都需要包含相同的能量,因为违反能量守恒将造成对该编码信号的不同响度感知,或甚至造成在所述编码信号响度中的不可控制的跳跃。因此,在上述的编码方案中,下混音信号与残余信号必须利用缩放因子进行缩放,该缩放因子确保了能量守恒规则。
如果要进行编码的原始音频信号具有特定特性,特别是左与右原始通道完全不相关时,换言之,当左与右原始通道具有相同振幅而其相位差异刚好为180°时,可将此缩放因子进行发散(diverge)。在本发明概念中,这种不稳定性可以通过对ICC参数应用限制函数所避免,其中所述限制函数取决于最大可接受缩放因子和IID参数。为了避免可能的发散,直接地改变描述所述下混音的规则,而在现有技术的实施方式中,所述缩放因子仅简单地利用设置阈值的方式限制,并在超过所述阈值时利用所述阈值数值取代所述缩放因子。
本发明概念的极大优点为,在下混音通道与残余通道两者内的信号都通过改变作为下混音处理基础的参数来进行改变。当根据现有技术应用阈值时,只对下混音通道中的信号产生影响,因此之后利用本发明概念,便可以实现更好地保存原始左与右通道之间相互关系的目的。
上述概念的另一项优点是,通常在编码过程中导出所使用的空间参数。因此可以实现所需要的限制逻辑,而无须引入其它的新参数。
在本发明的另一实施例中,在解码器侧应用限制器,该限制器具有与编码器侧的限制器所具有的相同的限制规则。这意味着在所述解码器侧上,接收到下混音与残余信号以及空间参数IID与ICC,而所接收的空间参数则利用在所述编码处理期间所使用的相同限制规则进行限制。接着,上混音取决于限制后的空间参数,这确保了在所述上混音处理中不会发生发散。在所述编码与解码中具有相同限制规则的优点是很明显的,因为只需要进行一次的硬件电路开发或软件算法实现。可以利用低成本的方式开发具有编码与解码功能的硬件或软件,因为对于所述限制功能而言能够重新利用相同的硬件或软件。
在本发明的另一实施例中,下混音信号与空间参数在产生之后便进行压缩,产生了用于所述下混音信号的两音频比特流以及具有压缩空间参数的参数比特流。这降低了要传送的编码表示的尺寸,进一步节省了带宽,其中编码可以是有损耗或无损耗的,因为所述编码规则本身与本发明概念无关。根据本发明概念的本发明解码器包括解压缩级,其中所述压缩表示在进行上混音之前,被解压缩为空间参数、下混音通道与残余通道。
在本发明的另一实施例中,考虑到在存储介质上方便地存储所产生的文件,例如通过多路复用,将已经被压缩的音频比特流与参数字元串流组合成组合后的比特流。这也考虑到流形成应用,举例而言,通过因特网而将编码后的内容形成流,因为所有的相关信息均被包括在单个文件或比特流之中,在与传送三个分离比特流的情况相比之下,形成一种更方便的处理。相应的本发明解码器具有去组合级,这可以是一种多路分解器,用于将所述比特流去组合为三个分离比特流,也就是两个音频比特流与参数比特流。
在此要注意的是,本发明概念对于现有技术残余编码而言提供了完美的后向兼容性,其中,所述空间参数并不受到限制,甚至在现有技术的参数化立体声编码中(其中解码器并无法利用残余信号)。所以这当然主要优点,因为可以利用本发明解码器以最大可能的质量再现 新的编码音频数据,而也可以利用根据现有技术的现有解码器进行再现。
在本发明的另一实施例中,组合三个本发明的编码器,以对包括六个各自通道的多通道音频信号进行编码,其中三个本发明的编码器的每一个都对通道对进行编码、导出用于每个通道对的空间参数、下混音与残余信号。本发明的概念也可以用来进行多通道音频信号的编码,其中所述编码的效率与所形成的表示的压缩程度具有更高的优先级,因为要进行编码与传送的数据总量比立体声信号高得多。原则上,可以组合任意数目的本发明的音频编码器,以同时对基本上具有任意单个音频通道数目的多通道音频信号进行编码。在多通道音频编码器的另一实施例中,利用3比2下混音器,对各自下混音信号与残余信号及所述参数比特流进行组合,以接收公共左信号、公共右信号、公共残余信号与组合后的参数比特流,另外减少所需带宽的总量。相应的解码器直接包括2比3的上混音级。
在本发明的另一实施例中,传送器或音频记录器包括本发明的编码器,用以进行紧凑、高质量的音频记录或传送,其中可以大大地减少所传送或存储的音频内容的尺寸。这样的音频内容可以存储在给定容量的存储介质上,或是在所述音频信号的传送期间使用较少的带宽。
在另一实施例中,接收器或音频播放器具有本发明的解码器,允许在移动电话之类的有限的带宽环境中的流应用,或是利用具有有限的容量以允许小型可携式回放设备的结构。
本发明传送器与接收器的组合形成了一种传送系统,可以通过有线或无线传送接口进行方便的音频内容传送,像是无线LAN、蓝牙、有线LAN、电力线技术、无线电传送或是任何其它的数据传送形式。
附图说明
接下来,通过参照附图对本发明的优选实施例进行描述,其中:
图1显示本发明编码器的框图;
图2显示本发明编码原则的框图;
图3显示本发明编码器的另一实施例;
图4显示对于现有技术解码器具有后向兼容性的本发明编码方案;
图5显示本发明多通道音频编码器;
图6显示本发明音频解码器的框图;
图7显示本发明解码概念的框图;
图8显示本发明解码器的另一实施例;
图9显示本发明多通道音频解码器的实施例;
图10显示本发明音频编码器的可选实施例;
图11显示本发明音频解码器的可选实施例;
图12显示本发明传送器/音频记录器;
图13显示本发明接收器/音频播放器;
图14显示本发明传送系统。
具体实施方式
图1显示本发明音频编码器10的框图,包括下混音器12、限制器14,以及参数提取器16。
具有左与右通道的立体声信号18被同时输入至所述下混音器12与所述参数提取器16之中。所述参数提取器16提取空间参数19,空间参数19描述了在所述立体声信号18的左与右通道之间的相互关系。这些参数一方面可用于传送,另一方面也被输入至所述限制器14之中。所述限制器14对所述参数应用限制规则。在后续章节中应导出适当限制规则的细节。
限制器导出限制后的空间参数,并将其输入至所述下混音器12之中,其中所述下混音器12对所述立体声信号18的左与右通道应用下混音规则,以从所述立体声信号的左与右通道导出下混音信号20与残余信号22。所述下混音规则另外取决于所述限制后的空间参数。
当选择用于所述限制器的适当限制规则时,只向下混音器12供应限制后的参数,所述限制后的参数是以所述下混音规则不因为下混音动作而造成发散或产生任何使所述左与右通道空间相互关系恶化的方式所限制。
因此,在音频编码器10执行编码处理之后,立体声信号18便由下混音信号20、残余信号22与空间参数表示。
为了理解下混音规则与限制规则必须如何关联以提供包含最小可用能量的所产生的残余信号22,同时限制空间参数,使得下混音规则不造成任何的发散,在后续一些章节中更详细地阐释本发明所构成的基本概念。
由参数提取器16所提取的参数典型地来自于离散时间信号的复调制滤波器组分析中的子带样本的单个时间与频率间隔。这意味着立体声信号18的左与右通道的音频信号首先被分为给定长度的时间帧,而在所述单个时间帧中,将频谱细分为多个子带采样。对于每个单个子带而言,参数提取器16通过比较所感兴趣的子带中的立体声信号的左与右通道来导出空间参数。因此,在图1中立体声信号18的左与右通道和下混音信号m及残余信号s必须被理解为离散及有限长度的向量,描述了离散时间间隔之中的基本信号。如同以上所指出的,在下混音期间必须确保能量保存。对于离散的复向量x、y而言,复数内积与平方范数(与能量相比)被定义为
依照一般的规范,*标示复数共轭。从此开始,大写字母表示由小写字母所标注的相应有限长度复向量的平方和或能量。
根据本发明,由所述适应性下混音所产生的下混音通道m为原始左与右通道的能量加权总和,并因此由以下表达式定义:
m=g·(l+r)(2)
其中g为调整后的实数正数增益因子,使得下混音信号(M)的能量与左(L)与右(R)通道信号向量的能量总和相等(M=L+R)。
随着该增益因子发散至无限大,当l与r为非同相位并具有可比较的能量时(换言之,在方程式(2)中的l+r=0),便需要以一种最大增益因子g0限制该因子,g0一般是位于区间[1,2]之中。如在图1中所显 示,参数提取器16提取空间音频参数IID(通道间强度差)与ICC(通道间相干性),IID和ICC由以下表达式所表示:
在此,c标示IID参数,而ρ标示ICC参数。增益因子g可以依据所述ICC与IID参数进行表示,而所述增益因子所需限制可以由以下表达式所表示:
为了达到最大的编码效率,便期望在残余信号22中的能量为最小。后续推导求解了一种更一般的优化问题,该问题包括附加残余信号t,该附加残余信号t接着可由方程式(9)证明是多余的。从解码器侧考虑此问题,需要确定增益a、b,从而在所述上混音中的s、t便具有最小能量
方程式(5)的解为
其中
在系数a、b为实数的额外限制之下,同样的问题具有将方程式(7)的实数部分带入至方程式(6)中所得到的解答。在这种情况中,p可以表示为PS参数c、ρ,如同以下表达式:
通过将方程式(6)带入方程式(5),并加上方程式(5)之中的两方程式,可得到
t=-s(9)
以一般矩阵标注描述所述上混音处理,所述上混音可以利用一种如以下所表示的旋转矩阵H表示:
在g并不由方程式(4)中的g0所限制的情况中,所述最佳系数a、b的不同表示则如以下表达式所表示:
所述旋转矩阵H的第一列与参数化立体声中所使用的振幅旋转器(例如,在WO 03/090206 A1中所导出的)相同。
所述下混音需要与所述上混音兼容的意思为当消除所有的有损耗的编码步骤时,可以获得完美重建。因此下混音矩阵D,
必须为上混音旋转器H的反矩阵。所进行的基本计算获得了
其中所述第一行与方程式(2)一致。
利用方程式(10)与(13)所给定的两个最佳旋转器存在稳定性问题。当(c,ρ)趋近于(1,-1)时,由方程式(8)给定的p值发生发散。因此不得不在所述PS参数域的该点附近的最佳旋转器中发生偏离。由本发明所得到的解决方案是利用在编码器与解码器两者中的不稳定限制器来修正所述PS参数。
在一般形式中,这样的限制器将改变在(1,-1)附近的(c,ρ)对的值,以达成一种对于p而言的限制范围。一种特别吸引人的解决方案基于 方程式(8)分母与方程式(4)分母相同的发现。本发明的解决方案保持c不变,而在方程式(4)中通过g0来限制适应性下混音增益g时正确地修正ρ。这在以下表达式的情况中发生
由不稳定限制器14所执行的ρ的优选修正是:
在之前的章节中,对于导致了限制器14的定义的问题分析进行详细说明。虽然所述标注是以立体声信号为基础的,但明显的是所述相同的方法也可以应用至任何的音频信号对,如从多通道音频信号的部分下混音所产生或选择的通道对。特别有利的是,相同的限制规则也可以用来限制所述上混音与所述降混频矩阵之中的参数。
图2利用框图描述本发明音频的编码步骤,其显示如何以本发明概念的方式来执行音频编码。在第一参数提取步骤30中,导出ICC与IID参数。
这些参数接着被转发作为输出23,并传送以用作所述限制步骤32之中的输入,其中,利用所计算的最小ICC参数ICCmin与所述ICC参数进行比较,其中ICCmin取决于IID。在第一情况中,所述ICC参数超过所述最小ICC参数ICCmin(IID),将所述ICC参数直接转发至下混音步骤34。
如果所述ICC参数并未超过ICCmin(IID)参数,则进行额外的交换步骤36,其中所述ICC参数值被所述最小ICC参数ICCmin(IID)的值所取代。在交换步骤36之后,便将具有新值的ICC参数传送至下混音步骤34。
在下混音步骤34中,根据参数ICC与IID,从通道1与r中导出下混音信号20与残余信号22。
最后,参数23(ICC与IID)、下混音信号20与残余信号22便可用作编码步骤的输出。
图3显示本发明音频编码设备50的另一实施例,该音频编码设备50包括音频编码器10,具有第一音频压缩器52、第二音频压缩器54与参数压缩器56的信号处理单元51,以及输出接口58。
所述音频编码器10的组件已经在先前章节中所讨论。因此,在后续章节中只讨论从所述音频编码器10进行扩展的音频编码设备50的部分。
所述信号处理单元51的一般目的是用来压缩下混音信号20、残余信号22以及参数23。因此,下混音信号20便被输入至第一音频压缩器52,残余信号22被输入至第二音频压缩器54,而空间参数23被输入至参数压缩器56。第一音频压缩器52导出第一音频比特流60,第二音频压缩器54导出第二音频比特流62,而参数压缩器56导出参数比特流64。第一与第二音频比特流(60、62)与参数比特流64被用作所述输出接口的输入,输出接口将所述三个比特流(60、62、64)进行组合,以导出组合后的比特流66,作为本发明编码设备50的输出。
由所述输出接口58所执行的组合可以例如是对所述三个输入比特流的简单的多路复用。此外,也可以是产生单个输出比特流66的任何种类的组合。对于如通过因特网或其它数据链路的流形成的处理而言,只处理单个比特流方便得多。
换句话说,图3描述一种编码器,该编码器利用包括通道l、r的双通道音频信号作为输入,并产生之后由参数化立体声解码器进行解码的比特流。适应性下混音利用所述双通道信号l、r,产生单声道下混音信号m与残余信号s。接着这些信号可以利用感知音频编码器进行编码,以产生紧凑的音频比特流。参数化立体声(PS)参数估算器则利用所述双通道信号l、r作为输入,并产生PS参数组。所述不稳定限制器修正控制所述适应性下混音的PS参数。编码块从PS参数估计的未修正输出中产生参数化立体声侧信息(PS侧信息)。多路复用器将所有的编码数据组合以形成组合后的比特流。
本发明编码概念的主要优点之一,是与现有技术的参数化立体声解码器完全地后向兼容。为了描述此优点,图4显示一种现有技术的参数化立体声解码器。
所述参数化立体声解码器70包括输入接口72、音频解码器74、参数解码器76与上混音器78。
输入接口72接收由本发明音频编码器50产生的组合后的比特流80。现有技术参数化立体声解码器70的输入接口72并不辨识残余信号22,因此只从输入比特流80中提取下混音信号60(图3中的第一音频比特流60)与参数比特流64。音频解码器74为所述第一音频压缩器52的互补设备,而参数解码器76为所述参数压缩器56的互补设备。因此,所述音频比特流60被解码为下混音信号20,而所述参数比特流64则被解码为空间参数23。因为空间参数23已经被直接地传送,并且并未由本发明的编码器10或50进行进一步处理,因此现有技术的上混音器78便可进行左与右通道的重建,利用空间参数23从下混音信号20建立输出信号80。
换句话说,图4描述一种参数化立体声解码器,其利用本发明编码设备50所产生的兼容比特流作为输入,并产生包括通道l与r的立体声音频信号,而不需要利用或不需要取得描述了残余信号的比特流部分。首先,多路分解器利用兼容比特流作为输入,并将其分解为音频比特流与PS侧信息。所述感知音频解码器产生单声道信号m,而所述参数化立体声侧信息被解码为PS参数。PS合成根据所述PS参数,将所述单声道信号转换为左右信号l及r,特别是通过加入一去相关后的信号,以重新获得原始立体声通道的通道相关性。
图5显示一种本发明多通道音频编码器100,用于将6通道音频信号编码为立体声下混音信号与多个参数组。
所述多通道音频编码器100包括第一适应性编码器102、第二适应性编码器104、估计模块106、参数提取器108与3比2下混音器110。
所述第一适应性编码器102与第二适应性编码器104为本发明编码器10的实施例。所述6通道输入信号具有左前通道112a、左后通 道112b、右前通道114a、右后通道114b、中心通道116a与低频增强通道116b。所述左前通道112a与左后通道112b被输入至所述第一适应性编码器102之中,以导出第一下混音信号118a、相应的残余信号118b与空间参数118c。所述右前通道114a与右后通道114b则被输入至所述第二适应性编码器104,以导出第二下混音信号120a、相应的残余信号120b与基础空间参数120c。所述中心通道116a与低频增强通道116b被输入至求和模块106之中,该求和模块将信号相加以建立单声道信号122a与相应的空间参数122b。
所述3比2下混音器110接收下混音信号118a、120a与122a,以将它们下混音为具有左与右通道的立体声输出信号124。所述3比2下混音器110另外从输入通道118a、120a与122a导出残余信号126。此外,所述3比2下混音器110从所述参数组118b、120b与122b中导出一参数组128。
简单总结来说,图5描述空间音频编码器的部分,该空间音频编码器利用5.1格式的多通道音频信号作为输入,包括Lf(左前)、Lr(左后)、Rf(右前)、Rr(右后)、C(中心)与LFE(低频有效)通道,并建立包括L0与R0的立体声下混音信号以及多个参数组。在此图中并未显示的是时间至频率的转换、下混音信号与参数的编码,以及将所述编码信息多路复用为可以由相应的空间音频解码器进行解码的比特流。所述适应性下混音利用信号Lf和Lr作为输入,并产生单声道信号L与残余信号L。所述参数化立体声(PS)参数估计利用双通道信号Lf和Lr作为输入,并产生PS参数组。所述不稳定限制器修正控制适应性下混音的PS参数。以类似的方式,所述适应性下混音利用信号Rf和Rr作为输入,并产生单声道信号R与残余信号R。所述参数化立体声(PS)参数估计利用双通道信号Rf和Rr作为输入,并产生PS参数组。所述不稳定限制器修正控制所述适应性下混音的所述PS参数。所述求和模块将信号C与LFE相加,以建立单声道信号C。所述参数化立体声(PS)参数估计利用双通道信号C与LFE作为输入,并产生IID参数组,PS参数的子集。所述单声道信号L、与C则由所述3比2模块混合为立体声信号(Lo与Ro)及残余信号 Eo。所述3比2模块也输出参数组{Lo,Ro}。
图6描述一种本发明音频解码器140,包括上混音器142与限制器144。
本发明解码器140接收下混音信号146、残余信号148与空间参数150。所述下混音信号146与所述残余信号148被输入至所述上混音器142之中,而所述空间参数150被输入至所述限制器144之中。所述限制器144限制所述空间参数150以导出限制后的空间参数152。
重要的是要注意,所述限制器是利用与相应编码器在编码处理期间所使用的相同的限制规则,以导出所述限制后的参数。所述限制后的参数用来控制在所述上混音器142中的上混音过程,上混音器从所述下混音信号146与所述残余信号148中导出具有左与右通道的立体声信号154。
图7显示描述本发明解码器原则的框图。在第一限制步骤160中,限制所述接收空间参数ICC与IID。也就是说,检查所接收的ICC参数是否超过最小ICC参数(ICCmin(IID))。如果超过,便将所述空间参数150(ICC与IID)、所接收的下混音信号146与所接收的残余信号148传送至所述上混音步骤162。如果所述ICC参数并未超过所述最小ICC参数(ICCmin(IID)),便额外执行限制步骤164,也就是利用参数ICCmin(IID)的值来交换所述ICC参数的值,这具有以下效果:将所述ICCmin(IID)的值传送至所述上混音步骤162。
在所述上混音步骤162中,利用所述空间参数ICC与IID,从所述下混音信号146与所述残余信号148中导出具有左与右通道的立体声信号154。
图8显示本发明解码设备180的另一实施例,所述解码设备180包括解码器140、具有第一音频解码器184、第二音频解码器186与参数解码器188的信号处理单元182。所述解码设备180另外包括输入接口190,用以接收由本发明编码设备50所产生的组合后的比特流192。
所述组合后的比特流192由所述输入接口190分解为第一音频比特流194a、第二音频比特流194b与参数比特流196。
所述第一音频比特流194a被输入至所述第一音频解码器184之中,所述第二音频比特流194b被输入至所述第二音频解码器186之中,而所述参数比特流196则被输入至所述参数解码器188之中。所述分解的下混音信号198(m)与所述残余信号200(s)被输入至所述解码器140的上混音器142之中。由所述参数解码器188所导出的空间参数202被输入至所述音频解码器140的限制器144之中。所述空间参数与所述上混音的限制已经在所述音频解码器140的叙述中所说明。其详细叙述可从图6的相关章节描述所得。
本发明解码设备180最后输出具有左与右通道的立体声信号204。
换句话说,图8描述一种参数化立体声解码器,其利用兼容比特流作为输入,并产生包括通道l与r的立体声音频信号。首先多路分解器利用所述兼容比特流作为输入,并将其分解为两个音频比特流及PS侧信息。感知音频解码器分别产生单声道信号m与残余信号s,所述PS侧信息通过所述参数解码器解码为PS参数。所述上混音器通过由不稳定限制器所修正的PS参数所定义的旋转矩阵,将所述单声道与所述残余信号转换为左与右信号l及r。
图9显示一种本发明多通道音频解码器210,包括第一双通道解码器212、第二双通道解码器214、合成模块216与2比3模块218。
图9显示空间音频解码器的部分,其利用立体声音频信号(包括Lo与Ro)、残余信号Eo与参数组{Lo,Ro}作为输入。所述2比3模块218从上述提到的输入中产生三个音频通道L、R与C。所述单通道L与所述残余通道L通过第一双通道解码器212转换为所述Lf和Lr输出信号。所述不稳定限制器修正所述PS参数组L。类似地,所述单通道R与所述残余通道R通过第二双通道解码器214转换为所述Rf和Rr输出信号。在产生所述单通道信号R的期间,同样也使用所述不稳定限制器修正所述PS参数组R。所述PS合成模块216利用所述单通道C与所述参数组C,产生所述C与LFE输出通道。
图10与11显示在避免不稳定问题的情况下,对于编码器与解码器的可选解决方案。所述可选方案基于将限制后的空间参数用作要进行编码与传送的参数。这可以从图10中的本发明编码器中所见,它基 于图3的本发明编码设备。
图10显示了对已经在图3中显示的本发明编码器的修改,其差异在于,在节点300处(即在所述限制处理之后)采用了馈入参数编码器56中的参数。也就是说,取代所述原始参数,对所述限制后的参数进行编码及传送。
在图11中所显示的解码器侧,其修正为与所述解码设备180相比可以省略所述限制器。因此,所述解码空间参数310便直接地输入至所述上混音器142,以导出所述立体声信号204。
此方法与先前所教导取代不稳定限制器以及在先前图标中所显示的方法相比之下,其缺点分为两方面。首先,所述有限参数的量化将进一步使得所述旋转器离开所需要的优化状况。所述残余信号的尺寸一般上便因此变的较大,导致对于所述残余编码方法而言的一种编码增益损失。第二,将会失去对于参数化立体声解码的后向兼容性。在临界情况中,当所述原始通道的通道相关性为负值时,所述解码器将无法在不取得所述残余信号的情况下再现此相关性。
图12显示一种本发明的音频传送器或记录器330,具有音频编码器50、输入接口332与输出接口334。
在所述传送器/记录器330的输入接口332处可以供应音频信号。所述音频信号是利用在所述传送器/记录器之中的本发明的编码器50进行编码,而所述编码表示在所述传送器/记录器330的输出接口334处输出。所述编码表示接着可以被传送或存储在存储介质上。
图13显示一种本发明的接收器或音频播放器340,具有本发明的音频解码器180、比特流输入342与音频输出344。
在本发明的接收器/音频播放器340输入342处,可以输入比特流。所述比特流可以通过所述解码器180进行解码,而所述解码信号在本发明接收器/音频播放器340输出344处输出或播放。
图14显示了一种传送系统,包括本发明的传送器330及本发明的接收器340。
对在所述传送器330的输入接口332处输入的音频信号进行编码,并从所述传送器330的输出334传送至所述接收器340的输入342。 所述接收器对所述音频信号进行解码,并在其输出344上播放或输出所述音频信号。
以上提及及叙述的本发明实施例只是用于描述本发明改善是应用残余编码的原则。应该了解的是,在此描述的配置与细节修正可以由本领域其它技术人员所运用。因此,这仅受到所附权利要求的范围的限制,但不局限于在此叙述与说明实施例的特定细节。
虽然在上述图示中所叙述的本发明实施例主要只利用对于立体声信号所使用的术语所描述,明显的是本发明并不只局限于立体声信号,其可以应用至任何的两音频信号结合形式,例如在图5与图9中所显示的多通道音频编码器及解码器。
利用具有传送器与接收器的本发明的传送系统,在所述传送器与所述接收器之间的传送可以利用多种方式所实现。例如可以直接通过电缆线或像是无线局域网络、蓝牙与其它可想象的数据联结方式连接所述传送器与所述接收器,通过因特网或其它网络媒介的生活流,并在计算机可读取介质上存储文件及传送所述介质。
虽然已经详细叙述,所述ICC参数的改变只是用来确保得到一种不发散的上混音与下混音矩阵,也可以限制所述IID与ICC参数,从而不产生任何的发散。更一般地,应用本发明概念也可以导出其它空间参数,并对这些参数应用限制规则,以确保一种不发散的上混音与下混音。
在本发明编码器与解码器中的输出与输入接口并不仅局限为简单的多路复用器与多路分解器。在一种更复杂的变化中,所述输出接口可以不只利用所述多路复用,也利用其它的装置进行比特流的组合,甚至可能尝试某些额外的熵编码技术,以减少所述比特流的尺寸。
根据本发明方法的特定实施方式要求,本发明方法也可以在硬件或软件中实现。所述实现可以利用一种数字存储介质进行,特别是在其上存储有电子可读控制信号的盘、DVD或CD,其与一可程序化计算机系统结合,以实现本发明方法。一般来说,本发明因此是一种计算机程序产品,其具有在机器可读介质上所存储的程序代码,所述程序代码在所述计算机程序产品于计算机上执行时,可以操作以实作本 发明方法。换句话说,本发明因此是一种计算机程序,用于当所述计算机程序于计算机上执行时具有实现至少本发明方法之一的程序代码。
虽然之前已经特别说明并叙述所述参考特定实施例,本领域技术人员应该了解的是,在不背离本发明方面及精神下可以进行细节与形式的改变。应该了解的是在不背离在此公开与由权利要求所包含的概念下,可以在不同的实施例中调整各种不同的变化。
Claims (38)
1.一种音频编码器(10),用以对具有至少两个通道(18)的音频信号进行编码,包括:
参数提取器(16),用以导出相干参数和电平参数作为空间参数,其中所述相干参数描述所述至少两个通道的第一和第二通道之间的相干性,以及所述电平参数描述了所述第一和第二通道之间的电平差;
限制器(14),用以限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
下混音器(12),用以利用取决于所述限制后的相干参数的下混音规则,从所述音频信号导出下混音信号(20)与残余信号(18)。
2.如权利要求1所述的音频编码器(10),其中所述参数提取器(16)操作以导出针对音频信号的给定时间部分的多个空间参数。
3.如权利要求1或2所述的音频编码器(10),其中所述限制器(14)操作以限制所述相干参数,使得所述下混音信号(20)与所述至少两个通道之间的强度比例不超过预定限制。
4.如权利要求1所述的音频编码器(10),其中所述限制器(14)的限制规则使得能够通过以下表达式来描述取决于预定增益因子g0及所述电平参数IID的所述相干参数ICC的下限:
5.如权利要求4所述的音频编码器(10),其中所述预定增益因子g0是从区间[1,2]中所选择的。
6.如权利要求1所述的音频编码器(10),其中所述下混音器(12)操作以使用下混音规则,使得通过从所述至少两个通道形成通道的线性组合而导出所述下混音信号(20)与所述残余信号(18),其中所述线性组合的系数取决于所述限制后的相干参数。
7.如权利要求6所述的音频编码器(10),其中所述下混音规则使得能够根据所述限制后的相干参数ICC、电平参数IID、第一通道l和第二通道r,通过以下等式来描述所述下混音信号(20)m和所述残余信号(18)s的导出:
8.如权利要求1所述的音频编码器(10),进一步包括信号处理单元(51),用以处理或传送所述下混音信号(20)、所述残余信号(18)与所述空间参数,以导出处理后的下混音信号、处理后的残余信号与处理后的参数。
9.如权利要求8所述的音频编码器(10),其中所述信号处理单元(51)操作以导出所述处理后的下混音信号、所述处理后的残余信号与所述处理后的参数,使得所述导出包含所述下混音信号(20)、所述残余信号(18)与所述空间参数的压缩。
10.如权利要求8所述的音频编码器(10),进一步包括输出接口(58),用以提供所述处理后的下混音信号(20)、所述处理后的残余信号(18)与所述处理后的参数的信息。
11.如权利要求10所述的音频编码器(10),其中所述输出接口(58)操作以将所述处理后的下混音信号、所述处理后的残余信号与所述处理后的空间参数组合,以导出输出比特流,所述输出比特流具有所述处理后的下混音信号、所述处理后的残余信号与所述处理后的参数的信息。
12.如权利要求11所述的音频编码器(10),其中所述输出接口(58)操作以对所述处理后的下混音信号、所述处理后的残余信号与所述处理后的空间参数进行多路复用,以导出所述输出比特流。
13.如权利要求1所述的音频编码器(10),其中所述至少两个通道是通道对,以及对所述通道对和至少一个另外的通道对进行编码,其中为每一通道对导出空间参数、下混音信号(20)与残余信号(18)。
14.如权利要求13所述的音频编码器(10),其中所述通道对和至少一个另外的通道对包括左前、左后、右前、右后、低频增强与中心通道。
15.一种音频解码器(140),用以对编码音频信号进行解码,所述编码音频信号表示具有至少两个通道的原始音频信号,所述编码音频信号具有下混音信号、残余信号以及作为空间参数的相干参数ICC和电平参数IID,所述相干参数描述了所述至少两个通道的第一和第二通道之间的相互关系,所述电平参数描述了所述第一和第二通道之间的电平差,所述音频解码器包括:
限制器(144),用以限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
上混音器(142),用以利用取决于所述限制后的相干参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号(154)的重建。
16.如权利要求15所述的音频解码器(140),其中所述限制器(144)操作以限制针对与所述原始音频信号的时间帧相对应的编码音频信号的给定时间部分的多个空间参数。
17.如权利要求15或16所述的音频解码器(140),其中所述限制器(144)操作以限制所述相干参数,使得描述了所述下混音信号与所述原始音频信号的所述至少两个通道之间的强度比例的增益因子不超过预定限制。
18.如权利要求15所述的音频解码器(140),其中所述限制器(144)的限制规则使得能够通过以下表达式来描述取决于预定增益因子g0及所述电平参数IID的所述相干参数ICC的下限:
19.如权利要求18所述的音频解码器(140),其中所述预定增益因子g0是从区间[1,2]中所选择的。
20.如权利要求15所述的音频解码器(140),其中所述上混音器(142)操作以使用上混音规则,使得通过形成所述下混音信号与所述残余信号的线性组合来导出所述至少两个通道的第一重建通道与第二重建通道,其中所述线性组合的系数取决于所述限制后的相干参数。
21.如权利要求20所述的音频解码器(140),其中所述上混音规则使得从所述下混音信号m与所述残余信号s中对所述第一重建通道l与所述第二重建通道r的导出取决于限制后的相干参数ICC和电平参数IID,如以下等式所描述:
l=cL·cos(α+β)·m+s
r=cR·cos(-α+β)·m-s,其中
22.如权利要求15所述的音频解码器(140),进一步包括信号处理单元(182),用以传送或处理处理后的残余信号、处理后的下混音信号与处理后的空间参数,以导出所述残余信号、所述下混音信号与所述空间参数。
23.如权利要求22所述的音频解码器(140),其中所述信号处理单元(182)操作以导出所述残余信号、所述下混音信号与所述空间参数,使得所述残余信号、所述下混音信号与所述空间参数的导出包括对所述处理后的残余信号、所述处理后的下混音信号与所述处理后的参数的解压缩。
24.如权利要求22所述的音频解码器(140),进一步包括输入接口(190),用以提供所述处理后的所述残余信号、所述处理后的下混音信号与所述处理后的参数。
25.如权利要求24所述的音频解码器(140),其中所述输入接口(190)操作以分解单个输入比特流,以导出所述处理后的所述残余信号、所述处理后的下混音信号与所述处理后的参数。
26.如权利要求25所述的音频解码器(140),其中所述输入接口(190)操作以分解所述单个输入比特流,使得所述处理后的残余信号、所述处理后的下混音信号与所述处理后的参数的导出包括对所述输入比特流的多路分解。
27.一种用于将具有至少两个通道的音频信号进行编码的方法,所述方法包括:
导出相干参数和电平参数作为空间参数,其中所述相干参数描述了所述至少两个通道的第一和第二通道之间的相干性,以及所述电平参数描述了所述第一和第二通道之间的电平差;
限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
利用取决于所述限制后的相干参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
28.一种用以对编码音频信号进行解码的方法,所述编码音频信号表示具有至少两个通道的原始音频信号,所述编码音频信号具有下混音信号、残余信号,以及作为空间参数的相干参数和电平参数,所述相干参数描述了所述至少两个通道的第一和第二通道之间的相互关系,所述电平参数描述了所述第一和第二通道之间的电平差,所述方法包括:
限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
利用取决于所述限制后的相干参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
29.一种具有用以对具有至少两个通道的音频信号进行编码的音频编码器(10)的传送器,所述传送器包括:
参数提取器(16),用以导出相干参数和电平参数作为空间参数,其中所述相干参数描述所述至少两个通道的第一和第二通道之间的相干性,以及所述电平参数描述了所述第一和第二通道之间的电平差;
限制器(14),用以限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
下混音器(12),用以利用取决于所述限制后的相干参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
30.一种具有用以对表示具有至少两个通道的原始音频信号的编码音频信号进行解码的音频解码器(140)的接收器,所述编码音频信号具有下混音信号、残余信号以及作为空间参数的相干参数和电平参数,所述相干参数描述了所述至少两个通道的第一和第二通道之间的相干性,所述电平参数描述了所述第一和第二通道之间的电平差,所述接收器包括:
限制器(144),用以限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
上混音器(142),用以利用取决于所述限制后的相干参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
31.一种用于传送的方法,所述方法具有对具有至少两个通道的音频信号进行编码的方法的方法,所述方法包括:
导出相干参数和电平参数作为空间参数,其中所述相干参数描述所述至少两个通道的第一和第二通道之间的相干性,以及所述电平参数描述了所述第一和第二通道之间的电平差;
限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
利用取决于所述限制后的相干参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
32.一种用于接收的方法,所述方法具有对编码音频信号进行解码的方法,所述编码音频信号表示具有至少两个通道的原始音频信号,所述编码音频信号具有下混音信号、残余信号以及作为空间参数的相干参数和电平参数,所述相干参数描述了所述至少两个通道的第一和第二通道之间的相互关系,所述电平参数描述了所述第一和第二通道之间的电平差,所述方法包括:
限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
利用取决于所述限制后的相干参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
33.一种传送系统,具有传送器与接收器,
所述传送器包括如权利要求1至14之一所述的用以对音频信号进行编码的音频编码器(10);以及
所述接收器包括如权利要求15至26之一所述的音频解码器(140)。
34.一种传送与接收的方法,所述方法包括
传送方法,包括如权利要求27所述的用以对音频信号进行编码的方法:以及
接收方法,包括如权利要求28所述的用以对编码音频信号进行解码的方法。
35.一种具有用以对具有至少两个通道的音频信号进行编码的音频编码器(10)的音频记录器,所述音频记录器包括:
参数提取器(16),用以导出相干参数和电平参数作为空间参数,其中所述相干参数描述所述至少两个通道的第一和第二通道之间的相干性,以及所述电平参数描述了所述第一和第二通道之间的电平差;
限制器(14),用以限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
下混音器(12),用以利用取决于所述限制后的相干参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
36.一种具有用以对表示具有至少两个通道的原始音频信号的编码音频信号进行解码的音频解码器(140)的音频播放器,所述编码音频信号具有下混音信号、残余信号以及作为空间参数的相干参数和电平参数,所述相干参数描述了所述至少两个通道的第一和第二通道之间的相干性,所述电平参数描述了所述第一和第二通道之间的电平差,所述音频播放器包括:
限制器(144),用以限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
上混音器(142),用以利用取决于所述限制后的相干参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
37.一种用于音频记录的方法,所述方法具有对具有至少两个通道的音频信号进行编码的方法的方法,所述方法包括:
导出相干参数和电平参数作为空间参数,其中所述相干参数描述所述至少两个通道的第一和第二通道之间的相干性,以及所述电平参数描述了所述第一和第二通道之间的电平差;
限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
利用取决于所述限制后的相干参数的下混音规则,从所述音频信号导出下混音信号与残余信号。
38.一种用于音频播放的方法,所述方法具有对编码音频信号进行解码的方法,所述编码音频信号表示具有至少两个通道的原始音频信号,所述编码音频信号具有下混音信号、残余信号以及作为空间参数的相干参数和电平参数,所述相干参数描述了所述至少两个通道的第一和第二通道之间的相互关系,所述电平参数描述了所述第一和第二通道之间的电平差,所述方法包括:
限制所述相干参数,以导出限制后的相干参数,其中所述相干参数的限制取决于所述电平参数和缩放因子;以及
利用取决于所述限制后的相干参数的上混音规则,从所述下混音信号与所述残余信号导出对所述原始音频信号的重建。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67158105P | 2005-04-15 | 2005-04-15 | |
US60/671,581 | 2005-04-15 | ||
US11/247,555 | 2005-10-11 | ||
US11/247,555 US7751572B2 (en) | 2005-04-15 | 2005-10-11 | Adaptive residual audio coding |
PCT/EP2006/003200 WO2006108573A1 (en) | 2005-04-15 | 2006-04-07 | Adaptive residual audio coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101160619A CN101160619A (zh) | 2008-04-09 |
CN101160619B true CN101160619B (zh) | 2011-09-07 |
Family
ID=36589009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800121211A Active CN101160619B (zh) | 2005-04-15 | 2006-04-07 | 音频编码器及相应的编码方法 |
Country Status (16)
Country | Link |
---|---|
US (1) | US7751572B2 (zh) |
EP (1) | EP1869668B1 (zh) |
JP (1) | JP4685925B2 (zh) |
KR (1) | KR100955361B1 (zh) |
CN (1) | CN101160619B (zh) |
AT (1) | ATE454693T1 (zh) |
BR (1) | BRPI0612218B1 (zh) |
DE (1) | DE602006011591D1 (zh) |
ES (1) | ES2338918T3 (zh) |
HK (1) | HK1110985A1 (zh) |
MX (1) | MX2007012686A (zh) |
MY (1) | MY147609A (zh) |
PL (1) | PL1869668T3 (zh) |
RU (1) | RU2380766C2 (zh) |
TW (1) | TWI303411B (zh) |
WO (1) | WO2006108573A1 (zh) |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2387256T3 (es) * | 2004-07-14 | 2012-09-19 | Koninklijke Philips Electronics N.V. | Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
EP1858006B1 (en) * | 2005-03-25 | 2017-01-25 | Panasonic Intellectual Property Corporation of America | Sound encoding device and sound encoding method |
US8577686B2 (en) * | 2005-05-26 | 2013-11-05 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
JP4988716B2 (ja) * | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
EP1921606B1 (en) * | 2005-09-02 | 2011-10-19 | Panasonic Corporation | Energy shaping device and energy shaping method |
WO2007032647A1 (en) * | 2005-09-14 | 2007-03-22 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
US20080221907A1 (en) * | 2005-09-14 | 2008-09-11 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
WO2007046660A1 (en) * | 2005-10-20 | 2007-04-26 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
EP1974347B1 (en) | 2006-01-19 | 2014-08-06 | LG Electronics Inc. | Method and apparatus for processing a media signal |
KR100921453B1 (ko) * | 2006-02-07 | 2009-10-13 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
FR2898725A1 (fr) * | 2006-03-15 | 2007-09-21 | France Telecom | Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale |
ATE531036T1 (de) * | 2006-03-15 | 2011-11-15 | France Telecom | Einrichtung und verfahren zur codierung durch hauptkomponentenanalyse eines mehrkanaligen audiosignals |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
US20080235006A1 (en) * | 2006-08-18 | 2008-09-25 | Lg Electronics, Inc. | Method and Apparatus for Decoding an Audio Signal |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
EP2595150A3 (en) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Apparatus for coding multi-object audio signals |
EP2116051A2 (en) | 2007-01-12 | 2009-11-11 | ActiveVideo Networks, Inc. | Mpeg objects and systems and methods for using mpeg objects |
US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
CN101689368B (zh) * | 2007-03-30 | 2012-08-22 | 韩国电子通信研究院 | 对具有多声道的多对象音频信号进行编码和解码的设备和方法 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
EP2128856A4 (en) * | 2007-10-16 | 2011-11-02 | Panasonic Corp | DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD |
RU2452043C2 (ru) | 2007-10-17 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Аудиокодирование с использованием понижающего микширования |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
CN102017402B (zh) | 2007-12-21 | 2015-01-07 | Dts有限责任公司 | 用于调节音频信号的感知响度的系统 |
EP2225893B1 (en) * | 2008-01-01 | 2012-09-05 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
AU2008344073B2 (en) * | 2008-01-01 | 2011-08-11 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
ES2401817T3 (es) * | 2008-01-31 | 2013-04-24 | Agency For Science, Technology And Research | Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable |
CN101960514A (zh) * | 2008-03-14 | 2011-01-26 | 日本电气株式会社 | 信号分析控制系统及其方法、信号控制装置及其方法和程序 |
MX2010012580A (es) | 2008-05-23 | 2010-12-20 | Koninkl Philips Electronics Nv | Aparato de mezcla ascendente estereo parametrico, decodificador estereo parametrico, aparato de mezcla descendente estereo parametrico, codificador estereo parametrico. |
EP2287836B1 (en) * | 2008-05-30 | 2014-10-15 | Panasonic Intellectual Property Corporation of America | Encoder and encoding method |
EP2293292B1 (en) * | 2008-06-19 | 2013-06-05 | Panasonic Corporation | Quantizing apparatus, quantizing method and encoding apparatus |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
EP2312578A4 (en) * | 2008-07-11 | 2012-09-12 | Nec Corp | SIGNAL ANALYSIS DEVICE, SIGNAL CONTROL DEVICE AND METHOD AND PROGRAM THEREFOR |
KR101614160B1 (ko) | 2008-07-16 | 2016-04-20 | 한국전자통신연구원 | 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치 |
FR2936898A1 (fr) * | 2008-10-08 | 2010-04-09 | France Telecom | Codage a echantillonnage critique avec codeur predictif |
CN102177542B (zh) * | 2008-10-10 | 2013-01-09 | 艾利森电话股份有限公司 | 能量保留多通道音频编码 |
BRPI0823033B1 (pt) | 2008-12-11 | 2020-12-29 | Fraunhofer-Gesellschaft Zür Förderung Der Angewandten Forschung E.V | aparelho para gerar um sinal de áudio multi-canal |
WO2010091736A1 (en) * | 2009-02-13 | 2010-08-19 | Nokia Corporation | Ambience coding and decoding for audio applications |
JP5564803B2 (ja) * | 2009-03-06 | 2014-08-06 | ソニー株式会社 | 音響機器及び音響処理方法 |
US9082395B2 (en) | 2009-03-17 | 2015-07-14 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
MX2011006248A (es) | 2009-04-08 | 2011-07-20 | Fraunhofer Ges Forschung | Aparato, metodo y programa de computacion para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavizacion de valor de fase. |
KR101387808B1 (ko) * | 2009-04-15 | 2014-04-21 | 한국전자통신연구원 | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 |
US20120053949A1 (en) * | 2009-05-29 | 2012-03-01 | Nippon Telegraph And Telephone Corp. | Encoding device, decoding device, encoding method, decoding method and program therefor |
CN102171754B (zh) * | 2009-07-31 | 2013-06-26 | 松下电器产业株式会社 | 编码装置以及解码装置 |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
KR20110018107A (ko) * | 2009-08-17 | 2011-02-23 | 삼성전자주식회사 | 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치 |
KR101613975B1 (ko) * | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
EP2476113B1 (en) * | 2009-09-11 | 2014-08-13 | Nokia Corporation | Method, apparatus and computer program product for audio coding |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
US9042559B2 (en) * | 2010-01-06 | 2015-05-26 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
JP5604933B2 (ja) | 2010-03-30 | 2014-10-15 | 富士通株式会社 | ダウンミクス装置およびダウンミクス方法 |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
AU2011237882B2 (en) | 2010-04-09 | 2014-07-24 | Dolby International Ab | MDCT-based complex prediction stereo coding |
EP2609592B1 (en) * | 2010-08-24 | 2014-11-05 | Dolby International AB | Concealment of intermittent mono reception of fm stereo radio receivers |
US8885701B2 (en) * | 2010-09-08 | 2014-11-11 | Samsung Electronics Co., Ltd. | Low complexity transform coding using adaptive DCT/DST for intra-prediction |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
AU2011315950B2 (en) | 2010-10-14 | 2015-09-03 | Activevideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
TWI462087B (zh) * | 2010-11-12 | 2014-11-21 | Dolby Lab Licensing Corp | 複數音頻信號之降混方法、編解碼方法及混合系統 |
CN102056053B (zh) * | 2010-12-17 | 2015-04-01 | 中兴通讯股份有限公司 | 一种多话筒混音方法及装置 |
US9204203B2 (en) | 2011-04-07 | 2015-12-01 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
UA107771C2 (en) * | 2011-09-29 | 2015-02-10 | Dolby Int Ab | Prediction-based fm stereo radio noise reduction |
US10409445B2 (en) | 2012-01-09 | 2019-09-10 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
KR20140017338A (ko) * | 2012-07-31 | 2014-02-11 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 장치 및 방법 |
KR101903664B1 (ko) * | 2012-08-10 | 2018-11-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 파라미터 오디오 오브젝트 코딩을 위한 잔류 개념을 이용하는 인코더, 디코더, 시스템 및 방법 |
EP2757558A1 (en) * | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
CN103067629B (zh) * | 2013-01-18 | 2014-10-29 | 苏州科达科技股份有限公司 | 回声消除装置 |
EP3203471B1 (en) * | 2013-01-29 | 2023-03-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder for generating a frequency enhanced audio signal, method of decoding, encoder for generating an encoded signal and method of encoding using compact selection side information |
WO2014145921A1 (en) | 2013-03-15 | 2014-09-18 | Activevideo Networks, Inc. | A multiple-mode system and method for providing user selectable video content |
KR20140123015A (ko) * | 2013-04-10 | 2014-10-21 | 한국전자통신연구원 | 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법 |
EP3005352B1 (en) | 2013-05-24 | 2017-03-29 | Dolby International AB | Audio object encoding and decoding |
US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
EP3005712A1 (en) | 2013-06-06 | 2016-04-13 | ActiveVideo Networks, Inc. | Overlay rendering of user interface onto source video |
KR20150009474A (ko) * | 2013-07-15 | 2015-01-26 | 한국전자통신연구원 | 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법 |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
TWI579831B (zh) | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
US10170125B2 (en) | 2013-09-12 | 2019-01-01 | Dolby International Ab | Audio decoding system and audio encoding system |
CN104768121A (zh) * | 2014-01-03 | 2015-07-08 | 杜比实验室特许公司 | 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频 |
US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
CN105989851B (zh) | 2015-02-15 | 2021-05-07 | 杜比实验室特许公司 | 音频源分离 |
ES2955962T3 (es) | 2015-09-25 | 2023-12-11 | Voiceage Corp | Método y sistema que utiliza una diferencia de correlación a largo plazo entre los canales izquierdo y derecho para mezcla descendente en el dominio del tiempo de una señal de sonido estéreo en canales primarios y secundarios |
US9978381B2 (en) * | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
KR20190109726A (ko) * | 2017-02-17 | 2019-09-26 | 앰비디오 인코포레이티드 | 멀티채널 오디오 신호들을 다운믹싱하기 위한 장치 및 방법 |
EP3669556B1 (en) * | 2017-10-16 | 2022-06-08 | Sony Europe B.V. | Audio processing |
EP3550561A1 (en) * | 2018-04-06 | 2019-10-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
CN114708874A (zh) * | 2018-05-31 | 2022-07-05 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
CN110556119B (zh) | 2018-05-31 | 2022-02-18 | 华为技术有限公司 | 一种下混信号的计算方法及装置 |
RU2769429C2 (ru) * | 2018-08-17 | 2022-03-31 | Нокиа Текнолоджиз Ой | Кодер звукового сигнала |
GB2578625A (en) * | 2018-11-01 | 2020-05-20 | Nokia Technologies Oy | Apparatus, methods and computer programs for encoding spatial metadata |
GB2582749A (en) * | 2019-03-28 | 2020-10-07 | Nokia Technologies Oy | Determination of the significance of spatial audio parameters and associated encoding |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1153369A (zh) * | 1995-10-05 | 1997-07-02 | 索尼公司 | 使用多通道音频信号的编码方法及装置 |
US6021386A (en) * | 1991-01-08 | 2000-02-01 | Dolby Laboratories Licensing Corporation | Coding method and apparatus for multiple channels of audio information representing three-dimensional sound fields |
CN1501350A (zh) * | 2002-11-19 | 2004-06-02 | 华为技术有限公司 | 多通道声码器的语音处理方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4236989C2 (de) | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US6036878A (en) * | 1996-02-02 | 2000-03-14 | Applied Materials, Inc. | Low density high frequency process for a parallel-plate electrode plasma reactor having an inductive antenna |
SG54379A1 (en) | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
MY149792A (en) | 1999-04-07 | 2013-10-14 | Dolby Lab Licensing Corp | Matrix improvements to lossless encoding and decoding |
US6363338B1 (en) | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
JP2002076904A (ja) | 2000-09-04 | 2002-03-15 | Victor Co Of Japan Ltd | 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置 |
US7120587B2 (en) | 2000-11-03 | 2006-10-10 | Koninklijke Philips Electronics N.V. | Sinusoidal model based coding of audio signals |
JP2002175097A (ja) | 2000-12-06 | 2002-06-21 | Yamaha Corp | 音声信号のエンコード/圧縮装置およびデコード/伸長装置 |
JP3951690B2 (ja) | 2000-12-14 | 2007-08-01 | ソニー株式会社 | 符号化装置および方法、並びに記録媒体 |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
AU2003201097A1 (en) | 2002-02-18 | 2003-09-04 | Koninklijke Philips Electronics N.V. | Parametric audio coding |
KR101016251B1 (ko) | 2002-04-10 | 2011-02-25 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 스테레오 신호의 코딩 |
CN1311426C (zh) | 2002-04-10 | 2007-04-18 | 皇家飞利浦电子股份有限公司 | 立体声信号的编码、解码方法和装置及其传输设备 |
JP4714416B2 (ja) | 2002-04-22 | 2011-06-29 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間的オーディオのパラメータ表示 |
JP2003330497A (ja) | 2002-05-15 | 2003-11-19 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化方法及び装置、符号化及び復号化システム、並びに符号化を実行するプログラム及び当該プログラムを記録した記録媒体 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
-
2005
- 2005-10-11 US US11/247,555 patent/US7751572B2/en active Active
-
2006
- 2006-04-07 CN CN2006800121211A patent/CN101160619B/zh active Active
- 2006-04-07 AT AT06742550T patent/ATE454693T1/de not_active IP Right Cessation
- 2006-04-07 RU RU2007142177/09A patent/RU2380766C2/ru active
- 2006-04-07 WO PCT/EP2006/003200 patent/WO2006108573A1/en active Application Filing
- 2006-04-07 EP EP06742550A patent/EP1869668B1/en active Active
- 2006-04-07 BR BRPI0612218-3A patent/BRPI0612218B1/pt active IP Right Grant
- 2006-04-07 PL PL06742550T patent/PL1869668T3/pl unknown
- 2006-04-07 KR KR1020077023341A patent/KR100955361B1/ko active IP Right Grant
- 2006-04-07 JP JP2008505784A patent/JP4685925B2/ja active Active
- 2006-04-07 MX MX2007012686A patent/MX2007012686A/es active IP Right Grant
- 2006-04-07 DE DE602006011591T patent/DE602006011591D1/de active Active
- 2006-04-07 ES ES06742550T patent/ES2338918T3/es active Active
- 2006-04-12 TW TW095113074A patent/TWI303411B/zh active
- 2006-04-12 MY MYPI20061673A patent/MY147609A/en unknown
-
2008
- 2008-05-05 HK HK08104988.8A patent/HK1110985A1/xx unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6021386A (en) * | 1991-01-08 | 2000-02-01 | Dolby Laboratories Licensing Corporation | Coding method and apparatus for multiple channels of audio information representing three-dimensional sound fields |
CN1153369A (zh) * | 1995-10-05 | 1997-07-02 | 索尼公司 | 使用多通道音频信号的编码方法及装置 |
CN1501350A (zh) * | 2002-11-19 | 2004-06-02 | 华为技术有限公司 | 多通道声码器的语音处理方法 |
Non-Patent Citations (11)
Title |
---|
Encoder specification |
Enhanced aacPlus general audio codec |
ETSI TS 126 405.《ETSI STANDARDS 》.2005,第3卷(第610期),全文. |
EUROPEAN TELECOMMUNICATIONS STANDARDS INSTITUTE.Universal Mobile Telecommunications System (UMTS) |
EUROPEAN TELECOMMUNICATIONS STANDARDS INSTITUTE.Universal Mobile Telecommunications System (UMTS) General audio codec audio processing functions Enhanced aacPlus general audio codec Encoder specification;Parametric stereo part (3GPP TS 26.405 version 6.1.0 Release 6) ETSI TS 126 405.《ETSI STANDARDS 》.2005,第3卷(第610期),全文. * |
FALLER CHRISTOF.Parametric coding of spatial audio -Thesis No 3062.《THESE PRESENTEE A LA FACULTE INFORMATIQUE ET COMMUNICATIONS INSTITUT 》.2004,全文. |
FALLER CHRISTOF.Parametric coding of spatial audio-Thesis No 3062.《THESE PRESENTEE A LA FACULTE INFORMATIQUE ET COMMUNICATIONS INSTITUT 》.2004,全文. * |
General audio codec audio processing functions |
Parametric stereo part (3GPP TS 26.405 version 6.1.0 Release 6) |
WERNER OOMEN ET AL.MPEG4-EXT2: CE ON LOW COMPLEXITY PARAMETRIC STEREO - ISO/IEC JTC1/SC29/WG11 - MPEG2003/M10366.《CODING OF MOVING PICTURES AND AUDIO - ISO/IEC》.2003,全文. |
WERNER OOMEN ET AL.MPEG4-EXT2: CE ON LOW COMPLEXITY PARAMETRIC STEREO- ISO/IEC JTC1/SC29/WG11- MPEG2003/M10366.《CODING OF MOVING PICTURES AND AUDIO- ISO/IEC》.2003,全文. * |
Also Published As
Publication number | Publication date |
---|---|
RU2380766C2 (ru) | 2010-01-27 |
TW200643897A (en) | 2006-12-16 |
KR100955361B1 (ko) | 2010-04-29 |
JP2008536184A (ja) | 2008-09-04 |
JP4685925B2 (ja) | 2011-05-18 |
DE602006011591D1 (de) | 2010-02-25 |
RU2007142177A (ru) | 2009-05-27 |
EP1869668A1 (en) | 2007-12-26 |
US7751572B2 (en) | 2010-07-06 |
EP1869668B1 (en) | 2010-01-06 |
MY147609A (en) | 2012-12-31 |
TWI303411B (en) | 2008-11-21 |
CN101160619A (zh) | 2008-04-09 |
ATE454693T1 (de) | 2010-01-15 |
BRPI0612218B1 (pt) | 2021-03-02 |
WO2006108573A1 (en) | 2006-10-19 |
KR20070120527A (ko) | 2007-12-24 |
PL1869668T3 (pl) | 2010-06-30 |
US20060233379A1 (en) | 2006-10-19 |
ES2338918T3 (es) | 2010-05-13 |
MX2007012686A (es) | 2008-03-14 |
HK1110985A1 (en) | 2008-07-25 |
BRPI0612218A2 (pt) | 2010-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101160619B (zh) | 音频编码器及相应的编码方法 | |
JP5027799B2 (ja) | 符号化効率向上のためのパラメータの適応グループ化 | |
CN101036183B (zh) | 用于立体声兼容的多声道音频编码/解码的方法和设备 | |
US7620554B2 (en) | Multichannel audio extension | |
RU2363116C2 (ru) | Аудиокодирование | |
CN1910655B (zh) | 构造多通道输出信号或生成下混信号的设备和方法 | |
CN101151660B (zh) | 多通道音频编码器、解码器以及相应方法 | |
CN1312660C (zh) | 信号合成方法和设备 | |
CN101553868B (zh) | 用于处理音频信号的方法和装置 | |
CN102789782B (zh) | 对输入数据流进行混合以及从中产生输出数据流 | |
US20020049586A1 (en) | Audio encoder, audio decoder, and broadcasting system | |
CN101548315B (zh) | 用于立体声编码的方法和装置 | |
CN102270452A (zh) | 近透明或透明的多声道编码器/解码器方案 | |
CN102656628B (zh) | 优化的低吞吐量参数编码/解码 | |
CN101887726A (zh) | 立体声编码和解码的方法及其设备 | |
TW200818122A (en) | Concept for combining multiple parametrically coded audio sources | |
CN101202043B (zh) | 音频信号的编码方法和装置与解码方法和装置 | |
CN102077276A (zh) | 多声道音频信号的空间合成 | |
CN101506875B (zh) | 用于组合多个参数编码的音频源的设备和方法 | |
KR20230088400A (ko) | 복수의 오디오 객체를 인코딩하는 장치 및 방법 또는 둘 이상의 관련 오디오 객체를 이용하여 디코딩하는 장치 및 방법(Apparatus and method for encoding a plurality of audio objects or appratus and method for decoding using two or more relevant audio objects) | |
JP2009514034A (ja) | 信号処理方法及びその装置、並びにエンコード、デコード方法及びその装置 | |
CN1969318B (zh) | 音频编码装置、解码装置以及方法 | |
CN113228169A (zh) | 用于对空间元数据进行编码的装置、方法及计算机程序 | |
US20230197087A1 (en) | Spatial audio parameter encoding and associated decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee |
Owner name: DOLBY INTERNATIONAL CO., LTD. Free format text: FORMER NAME: CODING TECHNOLOGIES AB |
|
CP03 | Change of name, title or address |
Address after: Amsterdam Co-patentee after: Koninklijke Philips Electronics N.V. Patentee after: Dolby International AB Address before: Stockholm Co-patentee before: Koninklijke Philips Electronics N.V. Patentee before: Coding Technologies AB |