CN102077276B - 多声道音频信号的空间合成 - Google Patents

多声道音频信号的空间合成 Download PDF

Info

Publication number
CN102077276B
CN102077276B CN200980124551.6A CN200980124551A CN102077276B CN 102077276 B CN102077276 B CN 102077276B CN 200980124551 A CN200980124551 A CN 200980124551A CN 102077276 B CN102077276 B CN 102077276B
Authority
CN
China
Prior art keywords
signal
parameter
composite matrix
spatialization
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980124551.6A
Other languages
English (en)
Other versions
CN102077276A (zh
Inventor
弗罗伦特·贾莱特
戴维·维雷特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN102077276A publication Critical patent/CN102077276A/zh
Application granted granted Critical
Publication of CN102077276B publication Critical patent/CN102077276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

本发明关于一种用于对总和信号进行空间合成、从而获得至少两个输出信号的方法,该总和信号以及空间化参数从通过原始多声道信号的矩阵化而进行的参数编码中输出。该方法包括以下步骤:-对总和信号(S)进行去相关(Decorr.),以获得去相关的信号(d);-向去相关信号并向总和信号施加(Synth.)合成矩阵(M Minq)从而获得所述输出信号,该合成矩阵(M Minq)的系数取决于空间化参数(R、I),并且使得,针对至少一个空间化参数的至少一个取值范围,根据用于使定量函数(q)最小化的准则来确定该合成矩阵的系数,该定量函数(q)与通过该施加合成矩阵的步骤所获得的输出信号的每一个中的去相关信号的量有关。本发明还适用于合成装置、包括至少一个合成装置的解码器、以及包括这样的解码器的多媒体设备。

Description

多声道音频信号的空间合成
技术领域
本发明关于多声道数字音频信号的编码/解码的领域。
更具体地,本发明关于多声道音频信号的参数编码/解码。
背景技术
这种类型的编码/解码基于空间化参数的提取,使得在解码时,可以重建收听者的空间感受。
这样的编码技术的英文名称已知为“双耳声提示编码”(BCC,BinauralCue Coding),其目的在于,一方面提取听觉空间化索引并然后对所述索引进行编码,而另一方面对源自于原始多声道信号的矩阵化的单声道或立体声信号进行编码。
此参数方法是低吞吐量编码。此编码方法的主要优点在于,与用于对多声道数字音频信号进行压缩的传统过程相比允许了更好的压缩率,同时确保了所获得的压缩格式与已经存在的编码格式和广播系统的向后兼容性。
因而,本发明更具体地涉及基于缩减数目的传送声道的3D声音场景的空间解码。
在文献MPEG standard ISO/IEC 23003-1:2007中、和在Journal of theAudio Engineering Society 55-5(2007)331-351中作者为“Breebaart,J.和Hotho,G.和Koppens,J.和Schuijers,E.和Oomen,W.和van de Par,S.”的、标题为“Background,concept,and architecture for the recent MPEG surround standard onmultichannel audio compression”的文献中描述的MPEG环绕标准描述了用于对多声道音频信号进行编码/解码的特定结构。
图1描述了这样的编码/解码系统,其中编码器100通过(在110处)对原始多声道信号S的声道进行矩阵化来构造总和信号(英文中的“downmix”(“缩混”))Ss,并且经由参数提取模块120来提供用于表征原始多声道信号的空间内容的参数P的缩减集合。
在解码器150处,由合成模块160来对该多声道信号进行重构(S′),该合成模块160同时地考虑到所传送的该总和信号和参数P。
该总和信号包括缩减数目的声道。在传送或存储之前,可以由传统的音频编码器来对这些声道进行编码。典型地,该总和信号包括两个声道,并且与传统的立体声广播兼容。在传送或存储之前,因而可以由任何传统的立体声编码器来对此总和信号进行编码。于是,如此编码的信号与包括用于在忽略空间数据的同时对该总和信号进行重构的对应解码器的装置兼容。
MPEG环绕标准已经采纳了用于表现空间数据的特定结构:编码器依赖于树状编码结构,该树状编码结构基于缩减数目的基本编码块而构造,所述基本编码块中的每一个使得可能提取关于缩减数目的声道的空间参数。存在两种类型的基本编码块:
-TTO(代表了英文中的“Two To One”(“二到一”))块,该TTO块使得可能提取两个声道之间的空间参数,并且基于这两个声道来构造单声道总和信号;
-TTT(代表了英文中的“Three To Two”(“三到二”))块,该TTT块使得可能提取三个声道之间的空间参数,并且基于这三个声道来构造包含了两个声道的总和信号。
图2图示了基于5.1多声道信号来使用TTO块(TTO0、TTO1、TTO2、TTO3和TTO4)以获得单声道信号S的编码结构或编码树的第一示例,该5.1多声道信号包括6个声道(L、R、C、LFE、Ls和Rs)。
图3图示了基于5.1信号来同时地使用TTO块和TTT块以获得立体声信号Sl和Sr的第二示范编码结构。
通过使用与图2和3所表现的编码树对称的解码树来执行如此接收到的单声道或者立体声信号的解码。
因而,针对根据图2的树而编码的信号的解码,可以将该解码看作是一系列的重构步骤。
在此情况下,第一解码步骤在于基于总和信号S和由TTO0提取的空间参数来重构与块TTO0的输入信号对应的信号,然后,接下来的步骤在于基于在先前步骤中重构的信号和由块TTO1提取的空间参数来重构与块TTO1的输入信号对应的信号,其后,该解码以类似的方式继续,直到重构了编码多声道信号的所有声道为止。实践中,解码器构造以下矩阵,该矩阵使得可能从单声道总和信号直接转换(pass)到通过对各个TTO和TTT块的较小尺寸的矩阵进行组合而重构的6声道。
然而,在用于对TTO块进行解码的MPEG环绕标准中采纳的技术针对包括反相声道的多声道信号的编码强加了非常不利的(penalizing)限制。
在2003年10月30日、以号码WO 03/090206A1公布的标题为“signalsynthesizing”的专利申请(申请人:Koninklijke Philips Electronics N.V.;发明人:Dirk J.Breebaart)中更精确地描述了此解码技术。
如参考图4所表现的,此技术在于在410处通过对总和信号s进行滤波来执行去相关步骤,以获得去相关的信号d。其后,由合成模块420经由作为空间参数R和I的函数的合成矩阵M来处理该总和信号和如此获得的去相关的信号,从而创建符合指定的空间参数的两个信号l和r。这里,参数R和I分别是多声道信号的声道之间的能量比和用于多声道信号的声道的声道间相关性指数(correlation index)。
根据以下关系来完成信号s和d的矩阵化:
l r = λ 1 cos ( α + β ) λ 1 sin ( α + β ) λ 2 cos ( - α + β ) λ 2 sin ( - α + β ) s d - - - ( 1 )
其中, λ 1 = R 1 + R , λ 2 = 1 1 + R , α = 1 2 arccos ( I ) 并且 β = arctan ( λ 2 - λ 1 λ 2 + λ 1 tan ( α ) ) .
现在,该矩阵化呈现出在上文中提及的限制,并且该限制致使该过程不适于呈现出负声道间相关性的多声道音频信号的编码。
具体地,这样的技术不适于包括了声道之间的反相的立体混响信号的解码。
实际上,当声道间相关性I为负时,并且具体地,当它接近于-1时,用于对信号1和r进行合成的去相关信号的比例变得非常巨大,在某些典型情况下,其显著地超出了所使用的总和信号s的量。在大多数有问题的情况下,可以注意到,针对0dB的声道间电平差(即,针对R=1),当声道间相关性I趋近于-1时,该混合矩阵趋近于以下矩阵:
0 2 2 0 - 2 2 . - - - ( 2 )
此矩阵对应于重构信号
Figure BPA00001280616300041
Figure BPA00001280616300042
所述重构信号在其表达式中不涉及该总和信号,而是单独地使用去相关的信号。因而,因为该去相关的信号完全取决于由信号s经历的去相关,所以无法控制该去相关信号的波形。
在极端情况下,先前示例所说明的重构问题针对R和I的其他值也会出现,并且I越接近于-1,该重构问题就越发明显。因而,在这些情况下,重构声道的波形并不是尽可能地接近于原始信号,由此不必要地限制了重构信号的质量。
当该信号呈现出具有接近于-1的声道间相关性的几个声道时,该限制的效果还要更加明显。在此情况下,虽然多于两个声道具有接近的波形,但是它们中的一些处于反相中。
在原始多声道信号的恢复期间,具有接近波形的这些各个声道的信号将在恢复区中相互作用,从而创建了将使得可能重构期望的声场的构造性和破坏性干扰。
在解码之后,因为先前间接提到的问题,所述声道的波形将极度变形。
此外,由于在解码树中涉及的每个TTO块解码器使用不同的去相关滤波器,所以针对各个声道,波形的变形将不相同。
于是,重构的声道将不再如原始信号中一样地具有接近的波形,并且于是,在恢复期间允许了声场的重构的干扰不再如原始信号中一样地发生。这一方面造成了声音场景的不良空间重构,而另一方面造成了可听假象(audibleartifact)的创建,波形中的差异引起可感受噪声分量的创建。
发明内容
本发明旨在改善该情形。
为此目的,本发明提出了一种用于对总和信号进行空间合成、以获得至少两个输出信号的方法,该总和信号连同空间化参数通过经由原始多声道信号的矩阵化而进行的参数编码来输出。该方法包括以下步骤:
-对总和信号进行去相关,以获得去相关的信号;
-向去相关信号并向总和信号施加合成矩阵从而获得所述输出信号,该合成矩阵的系数取决于空间化参数,
其特征在于,针对至少一个空间化参数的至少一个取值范围,根据用于使定量函数(q)最小化的准则来确定该合成矩阵的系数,该定量函数(q)与通过施加合成矩阵的步骤所获得的输出信号的每一个中的去相关信号的量有关。
因而,通过考虑到在每个信号中的并因此在对信号进行合成的步骤中的去相关信号的量,可能避免其中在合成矩阵化中仅仅涉及去相关信号的先前所提及的典型情况。因而,根据本发明的方法使得可能应对其中位于预定取值范围中的空间化参数引起这样的情形的情况。
在具体的实施例中,该定量函数(quantitative function)使得,向去相关信号施加的合成矩阵的系数的绝对值的增加使施加到这些相同系数的所述函数的值增加。
这样的定量函数的最小化使得可能定义合成矩阵的系数,该系数使得可能确保输出信号中与输入信号波形的良好符合性。
更具体地且按照简单的方式,这样的定量函数可以是去相关信号的能量函数。
此函数完全符合先前所提及的特性。
按照更一般的方式,该定量函数是以下类型:
其中p是大于或等于1的整数。
在具体实施例中,该空间化参数是多声道信号的声道之间的能量比的参数(R)和多声道信号的声道间相关性的参数(I),取值范围是其中声道间相关性参数为负的范围。
因而,本发明更具体地适用于呈现出负声道间相关性的多声道信号。
因此,可以单独针对声道间相关性参数的负值或针对此参数的任何值来实现本发明。
在另一实施例中,依照该空间化参数的取值范围来选择不同的定量函数。
于是,可能调节期望向各个合成矩阵赋予的相对重要性。因而,可能针对具体的参数范围来向诸如现有技术所定义的矩阵赋予重要的权重;并相反地,针对另一参数范围来向本发明意图内的合成矩阵赋予重要的权重。因而,可能在某一操作范围中保留与现有系统的兼容性,并且可能改善具体范围中的系统质量。此外,使用根据各个准则而获得的几个合成矩阵的可能性使得可能针对整个操作范围来对全局的系统质量进行优化。
本发明还关于一种用于对总和信号进行空间合成的、用于生成至少两个输出信号的装置,该总和信号连同空间化参数通过用于实现原始多声道信号的矩阵化的参数编码装置来输出。该装置包括:
-用于对总和信号进行去相关以获得去相关的信号的部件(510);
-用于向去相关信号并向总和信号施加合成矩阵(M Minq)从而获得所述输出信号的部件(520),该合成矩阵(M Minq)的系数取决于空间化参数,
其特征在于,针对至少一个空间化参数的至少一个取值范围,根据用于使定量函数最小化的准则来确定该合成矩阵的系数,该定量函数与由用于施加合成矩阵的部件所获得的输出信号的每一个中的去相关信号的量有关。
本发明还关于一种解码器,包括诸如在上文中所描述的合成装置。
本发明还旨在一种多媒体设备,包括诸如在上文中所描述的解码器。
按照非限制性方式,这样的设备例如可以是移动电话、电子日记或数字内容阅读器、计算机、娱乐室解码器(lounge decoder)(“机顶盒”)。
最后,本发明旨在一种计算机程序,包括代码指令,用于当由处理器执行这些指令时、实现诸如在上文中所描述的方法的步骤。
附图说明
一旦阅读了单独借助于非限制性示例并参考附图而给出的接下来的描述,本发明的其他特性和优点就将变得更加清楚明显,其中:
-图1图示了诸如先前所描述的现有技术的传统参数编码/解码系统;
-图2和图3图示了在5.1类型的多声道信号的情况下的、根据MPEG环绕标准的诸如先前所描述的编码树的示例;
-图4图示了诸如先前所描述的用于TTO块的现有技术解码系统;
-图5图示了用于TTO块的解码的根据本发明的合成装置;
-图6图示了根据具体实施例的用于TTO块的解码的合成装置;
-图7图示了在5.1类型的多声道信号的情况下的、根据本发明的解码器;以及
-图8图示了包括至少一个根据本发明的合成装置的示范多媒体设备。
具体实施方式
图5图示了本发明的实施例。它图示了用于TTO块的解码的合成装置(TTO-1)。此装置包括去相关模块510,该去相关模块510能够执行对所接收到的信号s进行去相关的步骤,该所接收到的信号s是在通过多声道信号的矩阵化而进行编码时获得的总和信号。
此去相关步骤例如是在先前所引用的MPEG环绕标准中描述的去相关步骤。
在合成模块520中使用矩阵M Minq来考虑此去相关的信号d和总和信号s并产生输出信号l和r,该矩阵M Minq的系数取决于所接收到的空间化参数R和I。
更精确地,通过以下矩阵化来生成信号l和r:
l r = h 11 h 12 h 21 h 22 s d - - - ( 3 )
同时,符合以下条件:
-保持总能量,即:
h11 2+h12 2+h21 2+h22 2=1                    (4)
-l和r之间的能量比等于R,即:
h11 2+h12 2=R(h21 2+h22 2)                   (5)
-l和r之间的归一化互相关等于I,即:
h 11 h 21 + h 12 h 22 ( h 11 2 + h 12 2 ) ( h 21 2 + h 22 2 ) = I - - - ( 6 )
使用最初两个条件,我们得到
h 11 2 + h 12 2 = R R + 1 h 21 2 + h 22 2 = 1 R + 1 (7)
因此,可以将解写为以下形式:
h 11 = R R + 1 cos ( a ) , h 12 = R R + 1 sin ( a ) , h 21 = 1 R + 1 cos ( b ) , h 22 = 1 R + 1 sin ( b ) - - - ( 8 )
于是,可以将第三条件写为:
cos(a)cos(b)+sin(a)sin(b)=I              (9)
即,cos(a-b)=I。
因此,可以看出用于该问题的求解矩阵是以下形式的由β∈[0,2π)参数化的矩阵的集合:
h 11 h 12 h 21 h 22 = R R + 1 0 0 1 R + 1 cos ( β + α ) sin ( β + α ) cos ( β - α ) sin ( β - α ) (10)
其中, α = ± arccos ( I ) 2 .
因而,α的两个值是可能的。β的值取决于R和I,并且根据本发明的实施例而选择,从而限制引入到重构信号中的去相关信号d的量,而无论相关值I是什么,包括用于负值。
因而,可以通过引入与在用于信号重构的矩阵化中考虑的去相关信号的量有关的定量函数q,来对值β的选择进行形式化。
按照一般的方式,定量函数q使得,向去相关信号施加的合成矩阵的系数的绝对值的增加使施加到这些相同系数的函数q的值增加。
因而,这个定量函数q使得它满足以下条件:
-针对所有实数x、x′、y,如果|x′|≥|x|,则q(x′,y)≥q(x,y)
-并且对称地,针对所有实数x、y、y′,如果|y′|≥|y|,则q(x,y′)≥q(x,y)
令I和R固定,通过使以下函数最小化来选择β的值:
f ( β ) = q ( h 12 , h 22 ) = q ( R R + 1 sin ( β + α ) , 1 R + 1 sin ( β - α ) ) - - - ( 11 )
可以选择符合在上文中所描述的条件的数个定量函数,并且所述函数使得可能针对β做出满意的选择。
因而,函数q例如可以是以下类型:
q ( x , y ) = ( | x | p + | y | p ) 1 p - - - ( 12 )
其中,p是大于或等于1的整数。
在具体实施例中,定量函数q是去相关信号的能量函数。
因此,函数q使得:
q(x,y)=x2+y2                    (13)
因而,选择根据这里所描述本发明实施例的保证了满意重构的β的值,从而使重构信号中去相关信号d的总能量最小化。
于是,我们寻求β,以最小化:
h 12 2 + h 22 2 = R R + 1 sin 2 ( β + α ) + 1 R + 1 sin 2 ( β - α ) - - - ( 14 )
h 12 2 + h 22 2 = 1 2 ( R R + 1 ( 1 - cos ( 2 β + 2 α ) ) + 1 R + 1 ( 1 - cos ( 2 β - 2 α ) ) ) - - - ( 15 )
这相当于最大化:
g ( β ) = R R + 1 cos ( 2 β + 2 α ) + 1 R + 1 cos ( 2 β - 2 α ) - - - ( 16 )
g的导数是:
g ′ ( β ) = - 2 ( R R + 1 sin ( 2 β + 2 α ) + 1 R + 1 sin ( 2 β - 2 α ) ) (17)
g ′ ( β ) = - 2 ( R - 1 R + 1 sin ( 2 α ) cos ( 2 β ) + R + 1 R + 1 cos ( 2 α ) sin ( 2 β ) ) (18)
当以下等式成立时,它变成零:
tan ( 2 β ) = 1 - R R + 1 tan ( 2 α ) - - - ( 19 )
因此,从满足了
Figure BPA00001280616300096
Figure BPA00001280616300097
并且实际上对应于g的最大值的值之中选择所采纳的β的值。
因而,图5表现了用于对TTO块进行解码的合成装置,这里叫做TTO-1,其包括用于对总和信号进行去相关的模块510和能够将合成矩阵施加到去相关信号和总和信号的合成模块520。根据诸如在上文中所描述的用于使与去相关信号的量有关的定量函数q最小化的准则来确定此合成矩阵的系数。
图5还图示了根据本发明的空间合成方法的步骤,其中基于总和信号s来获得至少两个输出信号l和r。该总和信号从通过还用于提供空间化参数的多声道信号的矩阵化而进行的参数编码中输出。
由合成装置实现的该方法包括以下步骤:
-对总和信号进行去相关(Decorr.),以获得去相关的信号d;
-向去相关信号(d)并向总和信号(s)施加(Synth.)合成矩阵(M Minq)以获得所述输出信号,该合成矩阵(M Minq)的系数取决于空间化参数(I、R)。
此方法使得,针对至少一个空间化参数的至少一个取值范围,根据用于使定量函数最小化的准则来确定该合成矩阵的系数,该定量函数与在该施加合成矩阵的步骤中考虑的去相关信号的量有关。
在先前参考图5所描述的实施例中,所述空间化参数是用于指明原始多声道信号的声道之间的能量比R和此相同信号的声道间相关性的测量的参数。
也可以选择由该参数编码输出的其他空间化参数。例如,这些参数可以是用于指明多声道信号的声道之间的相移的参数、或者音频声道的时间包络的参数。
图6图示了本发明的另一实施例,其中作为所接收到的空间化参数中的至少一个(这里,声道间相关性参数I)的取值范围的函数,选择不同的合成矩阵。
图6所图示的示例示出了两种类型的合成矩阵。
第一合成矩阵M例如是在MPEG环绕标准的现有技术中描述的合成矩阵。在630处图示了对应的合成模块。这里,当参数I为正时,将此合成矩阵施加到总和信号s并且施加到去相关信号d。
当参数I为负时,合成矩阵M Minq是参考图5所描述的合成矩阵。在620处表现了对应的合成模块。
因而,由此实施例实现的方法使得可能有效地处理呈现出负声道间相关性的多声道信号。
这种类型的多声道信号例如是立体混响类型的信号。实际上,这种类型的信号呈现出反相声道。在作者为M.Gerzon的、标题为“Hierarchical Systemof Surround Sound Transmission for HDTV”或“Ambisonic Decoders for HDTV”的文章中说明了源自于立体混响声音拾取的信号的此特性元素。
在变体实施例中,可以向空间化参数的不同取值范围提供几个合成矩阵。
因而,可能作为所接收到的参数值的函数来对期望向各个合成矩阵赋予的相对重要性进行调节。
例如,因而可能针对具体的参数范围来向诸如现有技术所描述的矩阵M赋予重要的权重;并相反地,针对另一参数范围来向本发明意图内的合成矩阵MMinq赋予重要的权重。
于是,在某一操作范围中保留了与现有系统的兼容性。于是,在此实施例中获得了空间化参数的具体取值范围中合成质量的改善。
此外,使用根据各个准则而获得的几个合成矩阵的可能性使得可能针对整个操作范围来对全局的合成质量进行优化。
例如,可能取决于至少一个空间化参数的值为低或相反地为重要而使用各个合成矩阵。
因而,在实施例的这个变体中,将使用两个合成矩阵,使得针对相关指数I的正值,将使用诸如现有技术所描述的矩阵M,而针对相关指数I的负值,将使用矩阵MMinq。
例如,将还可能定义各个操作范围,例如:
·针对I>0,使用矩阵Minter=M
·针对0≥I>-0.25,将使用两个矩阵Minter=αM+(1-α)MMinq的内插
·针对-0.25≥I>-1,将使用矩阵Minter=MMinq
将诸如图5或图6所表现的这种类型的装置TTO-1集成到数字信号解码器中。例如,参考图7来图示这样的类型的解码器。
典型地,提供此图所表现的解码器,以用于对5.1类型的多声道信号进行解码。因而,此解码器包括根据本发明的多个装置TTO-1(TTO0 -1、TTO1 -1、TTO2 -1、TTO3 -1、TTO4 -1),用于基于所接收到的信号S来获得包括6个声道(L、R、C、LFE、Ls、Rs)的多声道信号。
很明显地,可以按照根据曾用于原始多声道信号的编码树的不同方式来配置包括此多个合成装置的解码模块730。
诸如图7所表现的解码器包括分析模块QMF(代表了英文中的“Quadrature Mirror Filter”(“正交镜像滤波器”),能够执行源自于编码器的总和时间信号(或缩混)S到基于子带的频率信号的变换。然后,向解码模块730提供基于频带的信号作为输入。当从解码模块输出时,处理后的信号进入QMF合成模块720,该QMF合成模块720能够执行逆变换并且将所获得的多声道信号返回到时域。
此QMF分析和QMF合成模块例如可以是在MPEG环绕标准中描述的那些模块。
诸如图7所表现的解码器从编码器接收源自于原始多声道信号的参数编码的空间化参数P。
典型地,这些参数可以是声道间能量比、声道间相关性测量抑或声道间相移或最终的时间包络的参数。
可以将此解码器700集成到诸如娱乐室解码器或“机顶盒”、计算机抑或移动电话、数字内容阅读器、个人电子日记等之类的多媒体设备中。
图8图示了这样的多媒体设备的示例,该多媒体设备具体地包括输入模块E,能够通过例如通信网络或借助于多声道声音拾取来接收压缩后的多声道声音信号。
已经通过参数编码过程来对这些多声道信号进行压缩,该参数编码过程通过原始信号的矩阵化来生成总和信号S和空间化参数P。在替换模式中,可以在多媒体设备中提供此编码。
此设备包括以硬件项(这里,通过处理器PROC)表现的根据本发明的一个或多个合成装置,该处理器PROC与包括存储器和/或工作存储器MEM的存储器块BM协作。
该存储器块可以有利地包括含有代码指令的计算机程序,该代码指令用于当由处理器PROC执行这些指令时、实现本发明意图内的方法的步骤,且具体地,所述步骤为对所接收到的总和信号进行去相关从而获得去相关信号的步骤、和向去相关信号并向总和信号施加系数取决于空间化参数的合成矩阵从而获得至少两个输出信号的步骤。该合成矩阵使得,针对至少一个空间化参数的至少一个取值范围,根据用于使定量函数最小化的准则来确定它的系数,该定量函数与在该施加合成矩阵的步骤中考虑的去相关信号的量有关。
典型地,图5的描述采用了诸如此步骤之类的计算机程序算法的步骤。还可以在可由装置的读取器读取的存储器支持上存储该计算机程序,或可以将该计算机程序下载到设备的存储器空间中。
该存储器块因而包括诸如在上文中所定义的合成矩阵的系数。
在诸如参考图6所描述的本发明的另一实施例中,此存储器块可以包括定义了几个合成矩阵的系数,所述合成矩阵作为所接收到的空间化参数的取值范围的函数而被施加到总和信号和去相关信号。
同样地,该设备的处理器还可以包括指令,用于实现诸如参考图7所描述的解码器的分析和合成的步骤。
诸如所图示的多媒体设备还包括输出S,用于通过扬声器类型的恢复部件或者通过能够传送重构的多声道信号S′的通信部件来传递此多声道信号。

Claims (8)

1.一种用于对缩混信号进行空间合成、以获得至少两个输出信号的方法,该缩混信号连同空间化参数通过经由原始多声道信号的矩阵化而进行的参数编码来输出,该方法包括以下步骤:
-对缩混信号(S)进行去相关(Decorr.),以获得去相关的信号(d);
-向去相关信号并向缩混信号施加(Synth.)合成矩阵(M Minq、M)从而获得所述输出信号,该合成矩阵(M Minq、M)的系数取决于空间化参数(R、I),
其特征在于,根据至少空间化参数的范围值来选择不同的矩阵,从而对于空间化参数的至少第一取值范围,施加第一合成矩阵(M),以及对于所述空间化参数的至少第二取值范围,施加不同于第一合成矩阵的第二合成矩阵(M Minq),根据用于使定量函数(q)最小化的准则来确定所述第二合成矩阵的系数,该定量函数(q)与通过该施加合成矩阵的步骤所获得的输出信号的每一个中的去相关信号的量有关,
其特征在于,所述定量函数使得它满足如下的条件:
-针对所有实数x、x′、y,如果|x′|≥|x|则q(x′,y)≥q(x,y)
-对称地,针对所有实数x、y、y′,如果|y′|≥|y|,则q(x,y′)≥q(x,y)。
2.根据权利要求1的方法,其特征在于,所述定量函数是去相关信号的能量函数。
3.根据权利要求1的方法,其特征在于,所述定量函数是以下类型:
Figure FSB0000115912610000011
其中p是大于或等于1的整数,x、y是实数。
4.根据权利要求1的方法,其特征在于,所述空间化参数是多声道信号的声道之间的能量比的参数(R)和多声道信号的声道间相关性的参数(I),取值范围是其中声道间相关性参数为负的范围。
5.根据权利要求1的方法,其特征在于,依照所述空间化参数的取值范围来选择不同的定量函数。
6.一种用于对缩混信号进行空间合成、以用于生成至少两个输出信号的装置,该缩混信号连同空间化参数通过用于实现原始多声道信号的矩阵化的参数编码装置来输出,该装置包括:
-用于对缩混信号进行去相关以获得去相关的信号的部件(510);
-用于向去相关信号并向缩混信号施加合成矩阵(M Minq、M)从而获得所述输出信号的部件(520),该合成矩阵(M Minq、M)的系数取决于空间化参数,
其特征在于,根据至少空间化参数的范围值来选择不同的矩阵,从而对于空间化参数的至少第一取值范围,施加第一合成矩阵(M),以及对于所述空间化参数的至少第二取值范围,施加不同于第一合成矩阵的第二合成矩阵(M Minq),根据用于使定量函数(q)最小化的准则来确定所述第二合成矩阵的系数,该定量函数(q)与通过该施加合成矩阵的步骤所获得的输出信号的每一个中的去相关信号的量有关,
其特征在于,所述定量函数使得它满足如下的条件:
-针对所有实数x、x′、y,如果|x′|≥|x|则q(x′,y)≥q(x,y)
-对称地,针对所有实数x、y、y′,如果|y′|≥|y|,则q(x,y′)≥q(x,y)。
7.一种数字音频信号解码器,包括至少一个根据权利要求6的合成装置。
8.一种多媒体设备,包括根据权利要求7的解码器。
CN200980124551.6A 2008-06-26 2009-06-16 多声道音频信号的空间合成 Active CN102077276B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0854282 2008-06-26
FR0854282 2008-06-26
PCT/FR2009/051146 WO2010004155A1 (fr) 2008-06-26 2009-06-16 Synthese spatiale de signaux audio multicanaux

Publications (2)

Publication Number Publication Date
CN102077276A CN102077276A (zh) 2011-05-25
CN102077276B true CN102077276B (zh) 2014-04-09

Family

ID=40328191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980124551.6A Active CN102077276B (zh) 2008-06-26 2009-06-16 多声道音频信号的空间合成

Country Status (7)

Country Link
US (1) US8583424B2 (zh)
EP (1) EP2304721B1 (zh)
JP (1) JP5366104B2 (zh)
CN (1) CN102077276B (zh)
AT (1) ATE557386T1 (zh)
ES (1) ES2387867T3 (zh)
WO (1) WO2010004155A1 (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
KR101756838B1 (ko) 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
RU2628195C2 (ru) * 2012-08-03 2017-08-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер и способ параметрической концепции обобщенного пространственного кодирования аудиообъектов для случаев многоканального понижающего микширования/повышающего микширования
EP2717263B1 (en) 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
PT3022949T (pt) * 2013-07-22 2018-01-23 Fraunhofer Ges Forschung Descodificador de áudio multicanal, codificador de áudio de multicanal, métodos, programa de computador e representação de áudio codificada usando uma descorrelação dos sinais de áudio renderizados
EP2830334A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals
TWI774136B (zh) 2013-09-12 2022-08-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
KR20160081844A (ko) * 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
WO2016108655A1 (ko) 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
CN111407268B (zh) * 2020-03-27 2021-05-14 华南理工大学 一种基于相关函数的多通道脑电信号压缩方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1525438A (zh) * 2002-12-14 2004-09-01 三星电子株式会社 立体声音频编码方法及装置,音频流解码方法及装置
CN1672464A (zh) * 2002-08-07 2005-09-21 杜比实验室特许公司 音频声道空间转换

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5835375A (en) * 1996-01-02 1998-11-10 Ati Technologies Inc. Integrated MPEG audio decoder and signal processor
DE19632734A1 (de) * 1996-08-14 1998-02-19 Thomson Brandt Gmbh Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
US6199039B1 (en) * 1998-08-03 2001-03-06 National Science Council Synthesis subband filter in MPEG-II audio decoding
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
BRPI0304541B1 (pt) 2002-04-22 2017-07-04 Koninklijke Philips N. V. Method and arrangement for synthesizing a first and a second output sign from an input sign, and, device for providing a decoded audio signal

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1672464A (zh) * 2002-08-07 2005-09-21 杜比实验室特许公司 音频声道空间转换
CN1525438A (zh) * 2002-12-14 2004-09-01 三星电子株式会社 立体声音频编码方法及装置,音频流解码方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JEROEN BREEBAART et al.Background, Concept, and Architecture for the Recent MPEG Surround Standard on Multichannel Audio Compression.《JOURNAL OF THE AUDIO ENGINEERING SOCIETY》.2007,第55卷(第5期),第331-351页. *
Jeroen Breebaart et al.Parametric Coding of Stereo Audio.《 EURASIP Journal on Applied Signal Processing》.2005,第1305-1322页. *

Also Published As

Publication number Publication date
JP5366104B2 (ja) 2013-12-11
WO2010004155A1 (fr) 2010-01-14
US20110106543A1 (en) 2011-05-05
ES2387867T3 (es) 2012-10-03
EP2304721B1 (fr) 2012-05-09
EP2304721A1 (fr) 2011-04-06
US8583424B2 (en) 2013-11-12
ATE557386T1 (de) 2012-05-15
JP2011525999A (ja) 2011-09-29
CN102077276A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
CN102077276B (zh) 多声道音频信号的空间合成
US11343631B2 (en) Compatible multi-channel coding/decoding
KR101315077B1 (ko) 멀티-채널 오디오 데이터를 인코딩 및 디코딩하기 위한 방법, 및 인코더들 및 디코더들
JP4519919B2 (ja) コンパクトなサイド情報を用いたマルチチャネルの階層的オーディオ符号化
KR100947013B1 (ko) 멀티채널 오디오 신호의 시간적 및 공간적 정형
CN105612577B (zh) 针对音频声道及音频对象的音频编码及解码的概念
CN101410890B (zh) 用于导出上混参数的参数计算器和方法以及包括该参数计算器的声道重构器和音频接收机
KR100857920B1 (ko) 멀티채널 신호를 복원하기 위한 장치 및 방법과 이를 위한파라미터 데이터 세트를 발생하기 위한 장치 및 방법
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
CN103137130B (zh) 用于创建空间线索信息的代码转换设备
CA2673624C (en) Apparatus and method for multi-channel parameter transformation
CN1985303B (zh) 产生多通道输出信号的装置和方法
CN103400583B (zh) 多声道下混对象编码的增强编码和参数表示
CN101553865B (zh) 用于处理音频信号的方法和装置
US20070223708A1 (en) Generation of spatial downmixes from parametric representations of multi channel signals
BRPI0706285A2 (pt) métodos para decodificar um fluxo de bits de áudio envolvente de multicanal paramétrico e para transmitir dados digitais representando som a uma unidade móvel, decodificador envolvente paramétrico para decodificar um fluxo de bits de áudio envolvente de multicanal paramétrico, e, terminal móvel
CN101185119B (zh) 解码音频信号的方法和装置
TWI281356B (en) Device and method for generate a coded multi-channels signal and device and method for decode a coded multi-channels signal and recordable medium
AU2004306509B2 (en) Compatible multi-channel coding/decoding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant