CN102037507A - 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器 - Google Patents

参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器 Download PDF

Info

Publication number
CN102037507A
CN102037507A CN2009801187544A CN200980118754A CN102037507A CN 102037507 A CN102037507 A CN 102037507A CN 2009801187544 A CN2009801187544 A CN 2009801187544A CN 200980118754 A CN200980118754 A CN 200980118754A CN 102037507 A CN102037507 A CN 102037507A
Authority
CN
China
Prior art keywords
signal
monophony
parameter
under
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801187544A
Other languages
English (en)
Other versions
CN102037507B (zh
Inventor
E·G·P·舒伊杰斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN102037507A publication Critical patent/CN102037507A/zh
Application granted granted Critical
Publication of CN102037507B publication Critical patent/CN102037507B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Abstract

一种参数立体声上混合设备(300,400),其根据空间参数(205)从单声道下混合信号(204)生成左信号(206)和右信号(207)。所述参数立体声上混合的特征在于,它包括用于根据用预测系数(321)缩放的单声道下混合信号(204)来预测差信号(311)的装置(310),该差信号(311)包括在左信号(206)与右信号(207)之间的差值。所述预测系数是从空间参数(205)得出的。所述参数立体声上混合设备(300,400)还包括算术装置(330),用于根据单声道下混合信号(204)与所述差信号(311)的和值与差值来得出左信号(206)和右信号(207)。

Description

参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
技术领域
本发明涉及用于根据空间参数从单声道下混合(mono downmix)信号生成左信号和右信号的参数立体声上混合(stereo upmix)设备。本发明还涉及:包括参数立体声上混合设备的参数立体声译码器,用于根据空间参数从单声道下混合信号生成左信号和右信号的方法,音频播放设备,参数立体声下混合设备,参数立体声编码器,用于生成对于差信号(difference signal)的预测残留(residual)信号的方法,以及计算机程序产品。
技术背景
参数立体声(PS)是最近几年来音频编码的主要进展之一。参数立体声的基本要素在J.Breebaart,S.van de Par,A.Kohlrausch和E.Schuijers的“Parametric Coding of Stereo Audio”,in EURASIP J.Appl.Signal Process.,vol 9,pp.1305-1322(2004)中说明。与传统的、所谓的音频信号的离散编码相比较,如图1所描绘的PS编码器把立体声信号对(l,r)101、102变换成单个单声道下混合信号104加上描述空间图像的少量参数103。这些参数包括声道间强度差(iid)、声道间相位(或时间)差(ipd/itd)和声道间相干性/相关性(icc)。在PS编码器100中,立体声输入信号(l,r)的空间图像被分析,从而产生iid、ipd和icc参数。优选地,参数是依赖于时间和频率的。对于每个时间/频率片(tile),确定iid、ipd和icc参数。这些参数被量化和被编码140,从而产生PS比特流。而且,参数也被典型地使用来控制如何生成立体声输入信号的下混合。随后通过使用传统的单声道音频编码器120对最终得到的(多个)单声道和值信号104进行编码。最后,最终得到的单声道和PS比特流被合并,以构建总的立体声比特流107。
在PS译码器200中,立体声比特流被分成单声道比特流202和PS比特流203。单声道音频信号被译码,从而导致单声道下混合信号204的重建。单声道下混合信号连同译码的空间图像参数205一起被馈送到PS上混合230。PS上混合然后生成输出的立体声信号对(l,r)206、207。为了合成icc线索(cue),PS上混合利用所谓的去相关的信号(sd),即,从单声道音频信号生成一个概略地具有相同的频谱和时间包络、然而具有对于该单声道输入信号的基本上是零相关性的信号。然后,根据空间图像参数,在PS上混合内对于每个时间/频率片确定和应用2×2矩阵:
l r = H 11 H 12 H 21 H 22 s s d ,
其中Hij代表(i,j)上混合矩阵H元。H矩阵元是PS参数iid、icc和任选地ipd/opd的函数。在现有技术水平的PS系统中,在利用ipd/opd参数的情形下,上混合矩阵H可被分解为:
Figure BPA00001258059900022
其中左面的2×2矩阵代表相位旋转,ipd和opd参数的函数,而右面的2×2矩阵代表恢复(reinstate)iid和icc参数的部分。
在WO 2003090206 A1中,提出在译码器中把ipd相等地分布在左声道和右声道上。而且,提出通过按所测量的ipd的一半朝向彼此地旋转左信号和右信号以达到对准,从而生成下混合信号。实际上,在差不多异相信号的情形下,这对于在编码器中生成的下混合以及在译码器中生成的上混合两者,都导致ipd随时间而在180度左右轻微地变化,其由于环绕(wrapping)而可能由角度序列组成,诸如179、178、-179、177、-179...。由于这些跳跃,所以在下混合中的随后的时间/频率片呈现相位不连续性,或换句话说,相位的不稳定性。由于固有的重叠-相加合成结构,这导致可听见的人工产物。
作为例子,考虑这样的下混合,其中在一个时间/频率片中下混合被生成为:
s=lej(π/2-ε)+rej(-π/2+ε)
其中ε是某个任意小的角度,意味着所测量的ipd接近于180度,而对于下一个时间-频率片,下混合被生成为:
s=lej(-π/2+ε)+rej(π/2-ε)
意味着所测量的ipd接近于-180度。通过使用典型的重叠-相加合成,在产生人工产物的随后的时间/频率片的中点之间将出现相位抵消。
如以上所讨论的参数立体声编码的主要缺点是在PS译码器中被使用于生成输出立体声对的耳间相位差(ipd)线索的合成的不稳定性。这个不稳定性源于在为了生成下混合而执行于PS编码器中和在为了生成输出信号而执行于PS译码器中的相位修改。由于这个不稳定性,会体验到输出立体声对的较低的音频质量。
为了在实践中应对这个相位不稳定性问题,常常放弃ipd合成。然而,这导致重建的立体声信号的降低的(空间)音频质量。
应对在使用ipd参数时的这个不稳定性问题的另一个替换例是:在比特流中引入所谓的总的相位差(opd),以便给译码器提供相位基准。这样,在时间/频率片上的连续性可以通过允许通常的相位旋转而增加。然而,这是以比特速率的增加为代价而发生的,因此导致总的系统性能恶化。
发明概要
本发明的目的是提供用于从单声道下混合信号生成左信号和右信号的、增强的参数立体声上混合设备,它改进了所生成的左信号和右信号的音频质量,而无需附加的比特速率增加,并且它也不会遭受由耳间相位差(ipd)合成导致的不稳定性。
这个目的是通过如下的参数立体声(PS)上混合设备而达到的,所述参数立体声(PS)上混合设备包括用于根据用预测系数缩放的单声道下混合信号来预测差信号的装置,该差信号包括在左信号与右信号之间的差值。所述预测系数是从空间参数得出的。所述PS上混合设备还包括用于根据单声道下混合信号与所述差信号的和值与差值来得出左信号和右信号的算术装置。
所提出的PS上混合设备提供了与已知的PS译码器的这个不同的得出左信号和右信号的方式。取代像在已知的PS译码器中所做的那样去应用空间参数来恢复在统计意义上正确的空间图像,所提出的PS上混合设备从单声道下混合信号和空间参数来构建差信号。已知的和所提出的PS都力求恢复正确的功率比值(iid)、互相关性(icc)和相位关系(ipd)。然而,已知的PS译码器没有努力去获得最精确的波形匹配。而是它保证所测量的编码器参数在统计上匹配于恢复的译码器参数。在所提出的PS上混合中,通过把简单的算术运算,诸如求和与求差,应用到单声道下混合信号和估计的差信号,而得到左信号和右信号。这样的构建对于重建的左信号和右信号的质量和稳定性给出好得多的结果,因为它提供了恢复信号的原始相位性状的接近的波形匹配。
在实施例中,所述预测系数是基于下混合信号到差信号上的波形匹配。这样,波形匹配不会像在已知的PS译码器中被使用于ipd和opd合成的统计方法那样遭受不稳定性,因为它固有地提供相位保持。因此,通过将得出的差信号用作(复数值的)缩放的单声道下混合信号以及根据波形匹配得出预测系数,去除了已知的PS译码器的不稳定性的源。所述波形匹配包括例如单声道下混合信号到差信号上的最小平方匹配,计算差信号为:
d=α·s,
其中s是下混合信号,而α是预测系数。众所周知,最小平方预测解由下式给出:
α = ⟨ s , d ⟩ * ⟨ s , s ⟩ ,
其中<s,d>*代表下混合信号与差信号的互相关的复共轭,以及<s,s>代表下混合信号的功率。
在另一个实施例中,预测系数作为空间参数的函数被给出:
&alpha; = iid - 1 - j &CenterDot; 2 &CenterDot; sin ( ipd ) &CenterDot; icc &CenterDot; iid iid + 1 + 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid
其中iid、ipd和icc是空间参数,以及iid是声道间强度差,ipd是声道间相位差,而icc是声道间相干性。通常很难就感知上有意义而言量化复数值的预测系数α,因为所需要的精度取决于要被构建的左信号和右信号的属性。因此,这个实施例的优点在于,与复数预测系数α相对比,对于空间参数的所需要的量化精度从心理声学上是熟知的。这样,心理声学知识的最佳使用可被利用来高效地——即以最少的可能的步骤——量化预测系数,以便降低比特速率。而且,这个实施例允许使用可后向兼容的PS内容的上混合。
在另一个实施例中,用于预测差信号的装置被安排成通过加上缩放的去相关的单声道下混合信号而增强差信号。由于通常不可能从单声道下混合信号中完全预测原始的编码器差信号,所以它导致残留信号。这个残留信号与下混合信号没有相关性,因为否则的话它就会借助于预测系数而被考虑。在许多情形下,残留信号包括记录的交混回响的声场。残留信号可以通过使用从单声道下混合信号得出的去相关的单声道下混合信号而被有效地合成。
在另一个实施例中,所述去相关的单声道下混合借助于对单声道下混合信号滤波而获得。这个滤波的目的是有效地生成具有与单声道下混合信号类似的频谱和时间包络、但具有基本上接近于零的相关性的信号,这样使得它对应于在编码器中得出的残留分量的合成的变体。这例如可以通过全通滤波、延迟、网格交混回响滤波器,反馈延迟网络或它们的组合而达到。另外,功率归一化可以被应用到去相关的信号,以便保证对于去相关的信号的每个时间/频率片的功率都接近地对应于单声道下混合信号的功率。这样,保证译码器输出信号将包含去相关信号功率的正确的量。
在另一个实施例中,施加到去相关的单声道下混合的缩放因子被设置来补偿预测能量损耗。施加到去相关的单声道下混合的缩放因子保证在译码器侧的左信号与右信号的总信号功率分别匹配于在编码器侧的左信号与右信号功率的信号功率。这样,缩放因子β也可被解译为预测能量损耗补偿因子。
在另一个实施例中,施加到去相关的单声道下混合的缩放因子按空间参数的函数被给出:
&beta; = iid + 1 - 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid iid + 1 + 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid - | &alpha; | 2
其中iid、ipd和icc是空间参数,以及iid是声道间强度差,ipd是声道间相位差,icc是声道间相干性,而α是预测系数。与在预测系数的情形下类似地,把去相关的缩放因子β表达为空间参数的函数使得能使用关于这些空间参数的所需要的量化精度的知识。这样,心理声学知识的最佳使用可被利用来降低比特速率。
在另一个实施例中,所述参数立体声上混合把对于差信号的预测残留信号作为附加输入,由此算术装置被安排成根据所述对于差信号的预测残留信号得出左信号和右信号。为了避免长的信号名称,在本专利申请的其余部分,对于差信号的预测残留信号使用预测残留信号。预测残留信号是按照用合成的去相关信号341的原始编码器对应部分来替代该合成的去相关信号341而操作的。它允许在译码器中恢复原始立体声信号。然而,这是以附加的比特速率为代价,因为预测信号需要被编码和被发送到译码器。所以,典型地,预测残留信号的带宽是有限的。预测残留信号或者可以完全代替对于给定的时间/频率片的去相关单声道下混合信号,或者它可以以补充方式工作。在预测残留信号仅仅被稀疏地编码的情形下,例如,在仅仅最有效频率仓(bin)中的几个被编码的情形下,后者可以是有利的。在那种情形下,与编码器情形相比较,能量仍将丢失。这种能量缺失将被去相关的信号填补。新的去相关的缩放因子β’于是被计算为:
&beta; &prime; = &beta; 2 - &lang; d res , cod , d res , cod &rang; &lang; s , s &rang; ,
其中<dres,cod,dres,cod>是编码的预测残留信号的信号功率,以及<s,s>是单声道下混合信号的功率。这些信号功率可以在译码器侧被测量,因此不需要作为信号参数被发送。
本发明还提供包括所述参数立体声上混合设备的参数立体声译码器,以及包括所述参数立体声译码器的音频播放设备。
本发明还提供参数立体声下混合设备,以及包括所述参数立体声下混合设备的参数立体声编码器。
本发明还提供方法权利要求,以及使得可编程设备能够执行按照本发明的方法的计算机程序产品。
附图简述
从附图显示的实施例中,本发明的这些和其它方面将是明显的,并将参照这些实施例来阐述这些和其它方面,其中:
图1示意地显示参数立体声编码器(现有技术)的体系结构;
图2示意地显示参数立体声译码器(现有技术)的体系结构;
图3显示按照本发明的参数立体声上混合设备,所述参数立体声上混合设备根据空间参数从单声道下混合信号生成左信号和右信号;
图4显示包括预测装置的参数立体声上混合设备,该预测装置被安排成通过加上缩放的去相关的单声道下混合信号而增强差信号;
图5显示参数立体声上混合设备,其具有对于差信号的预测残留信号作为附加输入;
图6显示按照本发明的、包括参数立体声上混合设备的参数立体声译码器;
图7显示按照本发明的、用于根据空间参数从单声道下混合信号生成左信号和右信号的方法的流程图;
图8显示按照本发明的参数立体声下混合设备,所述参数立体声下混合设备根据空间参数从左信号和右信号生成单声道下混合信号;
图9显示按照本发明的、包括参数立体声下混合设备的参数立体声编码器。
在所有的图上,相同的参考标号表示类似的或相应的特征。在图上表示的某些特征典型地用软件来实施,这样,其代表软件实体,诸如软件模块或对象。
优选实施例详细说明
图3显示按照本发明的参数立体声上混合设备300。所述参数立体声上混合设备300根据空间参数205从单声道下混合信号204生成左信号206和右信号207。
所述参数立体声上混合设备300包括:用于根据用预测系数321缩放的单声道下混合信号204来预测差信号311的装置310,该差信号311包括在左信号206和右信号207之间的差值,其中所述预测系数321是在单元320中从空间参数205得出的;以及算术装置330,用于根据单声道下混合信号204和所述差信号311的和值与差值得出左信号206和右信号207。
左信号206和右信号207优选地被如下地重建:
l=s+d,
r=s-d,
其中s是单声道下混合信号,以及d是差信号。这是在编码器和值信号被如下地计算的假设下:
s = l + r 2 .
实际上,当构建左信号206和右信号207时,常常应用增益归一化:
l = 1 2 c &CenterDot; ( s + d ) ,
r = 1 2 c &CenterDot; ( s - d ) ,
其中c是增益归一化常数,且是空间参数的函数。增益归一化保证单声道下混合信号204的功率等于左信号206与右信号207的功率的和。在这种情形下,编码器和值信号被计算为:
s=c·(l+r).
空间参数在编码器中事先被确定,并被发送到包括参数立体声上混合300的译码器。所述空间参数对于每个时间/频率片被在逐帧的基础上确定为:
iid = &lang; l , l &rang; &lang; r , r &rang; ,
icc = | &lang; l , r &rang; | &lang; l , l &rang; &CenterDot; &lang; r , r &rang; ,
ipd=∠<l,r>,
其中iid是声道间强度差,icc是声道间相干性,ipd是声道间相位差,而<l,l>与<r,r>分别是左信号和右信号功率,以及<l,r>代表在左信号与右信号之间的非归一化复数值的协方差系数。
对于典型的复数值频域,诸如DFT(FFT),这些功率被测量为:
&lang; l , l &rang; = &Sigma; k &Element; k tile l [ k ] &CenterDot; l * [ k ] ,
&lang; r , r &rang; = &Sigma; k &Element; k tile r [ k ] &CenterDot; r * [ k ] ,
&lang; l , r &rang; = &Sigma; k &Element; k tile l [ k ] &CenterDot; r * [ k ] ,
其中ktile代表对应于参数频带的DFT仓。应当指出,还可以使用其它复数域表示法,诸如像在P.Ekstrand的“Bandwidth extension of audio signals by spectral band replication”,in Proc.1st IEEE Benelux Workshop on Model based Processing and Coding of Audio(MPCA-2002),Leuven,Belgium,2002年11月,第73-79页中描述的复数指数调制的QMF库。
对于一直到1.5-2kHz的低频率,以上的方程成立。然而,对于更高的频率,ipd参数是与感知无关的,所以,它们被设置为零值,导致:
iid = &lang; l , l &rang; &lang; r , r &rang; ,
Figure BPA00001258059900087
ipd=0.
替换地,由于在更高的频率上,对于感知更重要的不是相位差而是宽带包络,所以icc被计算为:
icc = | &lang; l , r &rang; | &lang; l , l &rang; &CenterDot; &lang; r , r &rang; .
增益归一化常数c被表达为:
c = iid + 1 iid + 1 + 2 &CenterDot; icc &CenterDot; cos ( ipd ) &CenterDot; iid .
由于左信号和右信号是异相的,c可能趋近无穷大,所以增益归一化常数c的值典型地被限制为:
c = min ( iid + 1 iid + 1 + 2 &CenterDot; icc &CenterDot; cos ( ipd ) &CenterDot; iid , c max ) ,
其中cmax是最大放大因子,例如,cmax=2。
在一个实施例中,所述预测系数是基于通过使用波形匹配来从单声道下混合信号204估计差信号311。所述波形匹配包括例如单声道下混合信号204到差信号311上的最小平方匹配,导致差信号被提供为:
d=α·s
其中s是单声道下混合信号204,而α是预测系数321。
除了最小平方匹配以外,可以使用利用与L2-模不同的模的波形匹配。替换地,p-模误差‖d-α·s‖p例如可以在感知上加权。然而,最小平方匹配是有利的,因为它导致对于从发送的空间图像参数得出预测系数的相对较简单的计算。
众所周知,对于预测系数α的最小平方预测解由下式给出:
&alpha; = &lang; s , d &rang; * &lang; s , s &rang; ,
其中<s,d>*代表单声道下混合信号204与差信号311的互相关的复共轭,以及<s,s>代表单声道下混合信号的功率。
在另一个实施例中,预测系数321作为空间参数的函数被给出:
&alpha; = iid - 1 - j &CenterDot; 2 &CenterDot; sin ( ipd ) &CenterDot; icc &CenterDot; iid iid + 1 + 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid .
所述预测系数在单元320中按照以上公式计算。
图4显示包括预测装置310的参数立体声上混合设备300,该预测装置310被安排成通过加上缩放的去相关的单声道下混合信号而增强差信号。单声道下混合信号204被提供到单元340以便去相关。结果,去相关的单声道下混合信号341在单元340的输出处被提供。在预测装置310中,通过用预测系数321缩放单声道下混合信号204而计算差信号的第一部分。另外,去相关的单声道下混合信号341也在预测装置310中用缩放因子322予以缩放。最终得到的、差信号的第二部分因此被加到差信号的第一部分,产生增强的差信号311。单声道下混合信号204和增强的差信号311被提供到用来计算左信号206和右信号207的算术装置330。
通常,不可能只是通过用预测系数进行缩放而从单声道下混合信号精确地预测差信号。这导致残留信号dres=d-α·s。这个残留信号与下混合信号没有相关性,因为否则的话它就会借助于预测系数被考虑。在许多情形下,残留信号包括记录的交混回响的声场。通过使用从单声道下混合信号得出的去相关的单声道下混合信号而有效地合成残留信号。所述去相关信号是在预测装置310中计算出来的差信号的第二部分。
在另一个实施例中,所述去相关的单声道下混合341借助于对单声道下混合信号204滤波而获得。所述滤波在单元340中执行。这个滤波生成具有与单声道下混合信号204类似的频谱和时间包络、但具有基本上接近于零的相关性的信号,这样使得它对应于在编码器中得出的残留分量的合成的变体。这个效果例如通过全通滤波、延迟、网格交混回响滤波器、反馈延迟网络或它们的组合而达到。
在另一个实施例中,施加到去相关的下混合341的缩放因子322被设置为补偿预测能量损耗。施加到去相关的单声道下混合341的缩放因子322保证:在参数立体声上混合设备300的输出处的左信号206与右信号207的总信号功率分别匹配于在编码器侧的左信号与右信号功率的信号功率。这样,进一步地被表示为β的缩放因子322被解译为预测能量损耗补偿因子。差信号d于是被表达为:
d=α·s+β·sd
其中sd是去相关的单声道下混合信号。
可以证明,所述缩放因子322可被表达为:
&beta; = &lang; d , d &rang; &lang; s , s &rang; - | &alpha; | 2
这是就对应于差信号d和单声道下混合信号s的信号功率而言。
在另一个实施例中,施加到去相关的单声道下混合341的缩放因子322作为空间参数205的函数被给出:
&beta; = iid + 1 - 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid iid + 1 + 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid - | &alpha; | 2 .
所述缩放因子322在单元320中得出。
倘若在编码器中没有施加下混合归一化,即,下混合信号被计算为s=1/2(l+r),则左信号206和右信号207被表达为:
l r = 1 + &alpha; &beta; 1 - &alpha; - &beta; s s d .
倘若施加下混合归一化,即,下混合信号被计算为s=c(l+r),则左信号206和右信号207被表达为:
l r = 1 / 2 c 0 0 1 / 2 c 1 + &alpha; &beta; 1 - &alpha; - &beta; s s d .
图5显示参数立体声上混合设备500,其把对于差信号的预测残留信号331作为附加输入。算术装置330被安排成根据单声道下混合信号204、差信号311和所述预测残留信号331而得出左信号206和右信号207。装置310根据用预测系数321缩放的单声道下混合信号204预测差信号311。所述预测系数321是在单元320中根据空间参数205而得出的。
左信号206和右信号207分别被给出为:
l=s+d+dres
r=s-d-dres
其中dres是预测残留信号。
替换地,倘若把功率归一化施加到下混合信号,但没有施加到残留信号,则左信号和右信号可被得出为:
l = 1 2 c &CenterDot; ( s + d ) + d res ,
r = 1 2 c &CenterDot; ( s - d ) - d res .
预测残留信号331是按照用合成的去相关信号341的原始编码器对应部分来替代该合成的去相关信号341而操作的。它允许由参数立体声上混合设备300恢复原始立体声信号。预测残留信号331或者可以完全代替对于给定的时间/频率片的去相关的单声道下混合信号341,或者它可以以补充方式工作。在预测残留信号仅仅被稀疏地编码的情形下,例如在仅仅最有效的频率仓中的几个被编码的情形下,后者是有利的。在这种情形下,与编码器预测残留信号相比较,能量仍旧损失。这种能量缺失将由去相关的信号341填补。新的去相关的缩放因子β’于是被计算为:
&beta; &prime; &beta; 2 - &lang; d res , cod , d res , cod &rang; &lang; s , s &rang; ,
其中<dres,cod,dres,cod>是编码的预测残留信号的信号功率,而<s,s>是单声道下混合信号204的功率。
参数立体声上混合设备300可以在参数立体声译码器的现有技术水平的体系结构中被使用,而不用任何附加调整。参数立体声上混合设备300因而替代图2中所描绘的上混合单元230。当预测残留信号331被参数立体声上混合400使用时,需要几点调整,这在图6中描绘。
图6显示按照本发明的、包括参数立体声上混合设备400的参数立体声译码器。参数立体声译码器包括多路分解装置210,用于把输入比特流分成单声道比特流202、预测残留比特流332和参数比特流203。单声道译码装置220把所述单声道比特流202译码成单声道下混合信号204。该单声道译码装置还被配置成把预测残留比特流332译码成预测残留信号331。参数译码装置240把参数比特流203译码成空间参数205。参数立体声上混合设备400根据空间参数205从单声道下混合信号204和预测残留信号331生成左信号206和右信号207。虽然单声道下混合信号204和预测残留信号的译码由译码装置220执行,但也有可能由对于要被译码的每个信号分开的译码软件和/或硬件执行所述译码。
图7显示按照本发明的、用于根据空间参数从单声道下混合信号204生成左信号206和右信号207的方法的流程图。在第一步骤710,根据用预测系数321缩放的单声道下混合信号204来预测差信号311,该差信号311包括在左信号206与右信号207之间的差值,其中所述预测系数从空间参数205得出。在第二步骤720,根据单声道下混合信号204与所述差信号311的和值与差值得出左信号206与右信号207。
在第二步骤720中,当预测残留信号是可提供时,紧接于单声道下混合信号204和差信号311,预测残留信号被使用来得出左信号206与右信号207。
当在参数立体声译码器中使用参数立体声上混合300时,不需要对参数立体声编码器进行修改。可以使用在现有技术中已知的参数立体声编码器。
然而,当使用参数立体声上混合400时,参数立体声编码器必须被调整以在比特流中提供预测残留信号。
图8显示按照本发明的参数立体声下混合设备800,所述参数立体声下混合设备根据空间参数从左信号和右信号生成单声道下混合信号。所述参数立体声下混合设备800紧接于单声道下混合信号104输出作为预测残留信号的附加信号801。所述参数立体声下混合设备800包括另一个算术装置810,用于得出单声道下混合信号104和差信号811,该差信号811包括在左信号101与右信号102之间的差值。所述参数立体声下混合设备800还包括另一个预测装置820,用于得出(对于差信号的)预测残留信号801作为在差信号811与用从空间参数103得出的预定的预测系数831缩放的单声道下混合信号104之间的差值。所述预定的预测系数在单元830中被确定。该预定的预测系数被选择成提供与单声道下混合信号104正交的预测残留信号801。另外,可以利用下混合信号的功率归一化(图8上未示出)。
虽然对应于单声道下混合和预测残留的信号的编号在参数立体声上混合设备和参数立体声下混合设备中具有不同的参考标号,但应当清楚,单声道下混合信号204和104互相对应,以及预测残留信号331和801也互相对应。
图9显示按照本发明的、包括参数立体声下混合设备800的参数立体声编码器。所述参数立体声编码器包括:
-估计装置130,用于从左信号101和右信号102得出空间参数103,
-按照本发明的参数立体声下混合设备110,用于根据空间参数103从左信号101和右信号102生成单声道下混合信号104,
-单声道编码装置120,用于把所述单声道下混合信号104编码成单声道比特流105,所述单声道编码装置120还被安排成把预测残留信号801编码成预测残留比特流802,
-参数编码装置140,用于把空间参数103编码成参数比特流106,以及
-复用装置150,用于把单声道比特流105、参数比特流106和预测残留比特流802合并成输出比特流107。
虽然单声道下混合信号104和预测残留信号801的编码由编码装置120执行,但也有可能由对于要被编码的每个信号分开的译码软件和/或硬件执行所述编码。
而且,虽然被一个个地列出,但多个装置、单元或方法步骤可以由例如单个单元或处理器来实施。另外,虽然各个特征可能被包括在不同的权利要求中,但这些特征有可能被有利地组合,以及被包括在不同的权利要求中并不意味着特征的组合是不可行的和/或是不利的。另外,把特征包括在一种类别的权利要求中并不意味着限于这个类别,而是表示在适当时该特征同样可应用于其它权利要求类别。而且,特征在权利要求中的次序并不意味着这些特征必须按任何特定的次序而起作用,尤其是,在方法权利要求中的各个步骤的次序并不意味着这些步骤必须以这个次序执行。而是,这些步骤可以以任何适当的次序执行。另外,单数引用不排除多数。因此,“一”、“一个”(“a”,“an”)、“第一”、“第二”等等的引用不排除多个。在权利要求中的参考符号仅仅被提供来作为澄清性的例子,无论如何不应当将其解释为限制权利要求的范围。

Claims (18)

1.一种用于根据空间参数(205)从单声道下混合信号(204)生成左信号(206)和右信号(207)的参数立体声上混合设备(300,400),其特征在于,所述参数立体声上混合设备(300,400)包括:用于根据用预测系数(321)缩放的单声道下混合信号(204)来预测差信号(311)的装置(310),该差信号(311)包括在左信号(206)与右信号(207)之间的差值,其中所述预测系数是从空间参数(205)得出的;以及算术装置(330),用于根据单声道下混合信号(204)与所述差信号(311)的和值与差值来得出左信号(206)和右信号(207)。
2.如在权利要求1中要求的参数立体声上混合设备,其中所述预测系数(321)是基于下混合信号(204)到差信号(311)上的波形匹配。
3.如在权利要求2中要求的参数立体声上混合设备,其中预测系数(321)作为空间参数(205)的函数被给出:
&alpha; = iid - 1 - j &CenterDot; 2 &CenterDot; sin ( ipd ) &CenterDot; icc &CenterDot; iid iid + 1 + 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid
其中iid、ipd和icc是空间参数,以及iid是声道间强度差,ipd是声道间相位差,而icc是声道间相干性。
4.如在权利要求1到3中要求的参数立体声上混合设备,其中用于预测差信号(311)的装置(310)被安排成通过加上缩放的去相关的单声道下混合信号而增强差信号。
5.如在权利要求4中要求的参数立体声上混合设备,其中所述去相关的单声道下混合(341)借助于对单声道下混合信号(204)滤波而获得。
6.如在权利要求4中要求的参数立体声上混合,其中施加到去相关的单声道下混合(341)的缩放因子(322)被设置来补偿预测能量损耗。
7.如在权利要求6中要求的参数立体声上混合设备,其中施加到去相关的单声道下混合(341)的缩放因子(322)作为空间参数的函数被给出:
&beta; = iid + 1 - 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid iid + 1 + 2 &CenterDot; cos ( ipd ) &CenterDot; icc &CenterDot; iid - | &alpha; | 2
其中iid、ipd和icc是空间参数,以及iid是声道间强度差,ipd是声道间相位差,icc是声道间相干性,而α是预测系数(321)。
8.按照权利要求1到7的参数立体声上混合设备,其中所述参数立体声上混合(300,400)把对于差信号的预测残留信号(331)作为附加输入,其中算术装置(330)被安排成根据单声道下混合信号(204)、所述差信号(311)和所述对于差信号的预测残留信号(331)得出左信号(206)和右信号(207)。
9.一种参数立体声译码器,包括:多路分解装置(210),用于把输入比特流(201)分成单声道比特流(202)和参数比特流(203);单声道译码装置(220),用于把所述单声道比特流译码成单声道下混合信号(204);参数译码装置(240),用于把所述参数比特流译码成空间参数(205);以及参数立体声上混合装置(230),用于根据空间参数(205)从单声道下混合信号(204)生成左信号(206)和右信号(207),所述参数立体声译码器还包括按照权利要求1-7的参数立体声上混合设备(300)。
10.一种参数立体声译码器,包括:多路分解装置(210),用于把输入比特流(201)分成单声道比特流(202)和参数比特流(203);单声道译码装置(220),用于把所述单声道比特流译码成单声道下混合信号(204);参数译码装置(240),用于把参数比特流译码成空间参数(205);以及参数立体声上混合装置(230),用于根据空间参数(205)从单声道下混合信号(204)生成左信号(106)和右信号(207);其特征在于,该多路分解装置(210)还被安排成从输入比特流中提取预测残留比特流(332),该单声道译码装置(220)还被安排成从预测残留比特流译码对于差信号的预测残留信号(331),以及该参数立体声上混合装置(230)是按照权利要求8的参数立体声上混合设备。
11.一种用于根据空间参数从单声道下混合信号生成左信号和右信号的方法,其特征在于:
-根据用预测系数缩放的单声道下混合信号来预测差信号,该差信号包括在左信号与右信号之间的差值,其中所述预测系数是从空间参数得出的;
-根据单声道下混合信号与所述差信号的和值与差值来得出左信号和右信号。
12.如在权利要求11中要求的、用于根据空间参数从单声道下混合信号生成左信号和右信号的方法,其中得出左信号和右信号的步骤还基于对于差信号的预测残留信号。
13.一种包括按照权利要求9或10的参数立体声译码器的音频播放设备。
14.一种用于根据空间参数(103)从左信号(101)和右信号(102)生成单声道下混合信号(104)的参数立体声下混合设备(800),其特征在于,所述参数立体声下混合设备(800)把对于差信号的预测残留信号(801)作为附加输入,其中所述参数立体声下混合设备包括:另一个算术装置(810),用于得出单声道下混合信号(104)和差信号(811),该差信号(811)包括在左信号与右信号之间的差值;和另一个预测装置(820),用于得出对于差信号的预测残留信号(801),作为在差信号(811)与用从空间参数(103)得出的预定的预测系数(831)缩放的单声道下混合信号(104)之间的差值。
15.一种参数立体声编码器,包括:估计装置(130),用于从左信号(101)和右信号(102)得出空间参数(103);参数立体声下混合装置(110),用于根据空间参数从左信号和右信号生成单声道下混合信号(104);单声道编码装置(120),用于把所述单声道下混合信号编码成单声道比特流(105);参数编码装置(140),用于把空间参数编码成参数比特流(106);以及复用装置(150),用于把单声道比特流和参数比特流合并成输出比特流;其特征在于,该参数立体声下混合装置(110)是按照权利要求14的参数立体声下混合设备,以及该单声道编码装置(220)还被安排成把对于差信号的预测残留信号(801)编码成预测残留比特流(802),以及该复用装置(150)还被安排成把预测比特流合并到输出流中。
16.一种用于根据空间参数从左信号和右信号生成对于差信号的预测残留信号的方法,其特征在于:
-得出在左信号与右信号之间的差信号;
-得出对于差信号的预测残留信号,作为在差信号与用从空间参数得出的预测系数缩放的单声道下混合信号之间的差值。
17.一种数据比特流,其包括合并的单声道下混合流、参数流和预测残留流。
18.一种计算机程序产品,用于执行权利要求11、12或16的任一项的方法。
CN2009801187544A 2008-05-23 2009-05-14 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器 Active CN102037507B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP08156801.6 2008-05-23
EP08156801 2008-05-23
PCT/IB2009/052009 WO2009141775A1 (en) 2008-05-23 2009-05-14 A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder

Publications (2)

Publication Number Publication Date
CN102037507A true CN102037507A (zh) 2011-04-27
CN102037507B CN102037507B (zh) 2013-02-06

Family

ID=40943873

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801187544A Active CN102037507B (zh) 2008-05-23 2009-05-14 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器

Country Status (10)

Country Link
US (6) US8811621B2 (zh)
EP (1) EP2283483B1 (zh)
JP (1) JP5122681B2 (zh)
KR (1) KR101629862B1 (zh)
CN (1) CN102037507B (zh)
BR (3) BR122020009727B1 (zh)
MX (1) MX2010012580A (zh)
RU (1) RU2497204C2 (zh)
TW (1) TWI484477B (zh)
WO (1) WO2009141775A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329197A (zh) * 2010-10-22 2013-09-25 法国电信公司 用于反相声道的改进的立体声参数编码/解码
CN103700372A (zh) * 2013-12-30 2014-04-02 北京大学 一种基于正交解相关技术的参数立体声编码、解码方法
CN105556596A (zh) * 2013-07-22 2016-05-04 弗朗霍夫应用科学研究促进协会 使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和计算机程序
CN109389987A (zh) * 2017-08-10 2019-02-26 华为技术有限公司 音频编解码模式确定方法和相关产品
CN110268727A (zh) * 2017-01-04 2019-09-20 塔特公司 具有先进的环绕处理功能的可配置的多带压缩器架构

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4643453B2 (ja) 2006-01-10 2011-03-02 株式会社東芝 情報処理装置及び情報処理装置の動画像復号方法
BR122020009727B1 (pt) * 2008-05-23 2021-04-06 Koninklijke Philips N.V. Método
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
KR101391110B1 (ko) * 2009-09-29 2014-04-30 돌비 인터네셔널 에이비 오디오 신호 디코더, 오디오 신호 인코더, 업믹스 신호 표현을 제공하는 방법, 다운믹스 신호 표현을 제공하는 방법, 공통 객체 간의 상관 파라미터 값을 이용한 컴퓨터 프로그램 및 비트스트림
TWI444989B (zh) 2010-01-22 2014-07-11 Dolby Lab Licensing Corp 針對改良多通道上混使用多通道解相關之技術
KR101410575B1 (ko) * 2010-02-24 2014-06-23 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 강화 다운믹스 신호를 생성하는 장치, 강화 다운믹스 신호를 생성하는 방법 및 컴퓨터 프로그램
ES2656815T3 (es) 2010-03-29 2018-02-28 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung Procesador de audio espacial y procedimiento para proporcionar parámetros espaciales en base a una señal de entrada acústica
AU2016222372B2 (en) * 2010-04-09 2018-06-28 Dolby International Ab Mdct-based complex prediction stereo coding
BR112012025878B1 (pt) 2010-04-09 2021-01-05 Dolby International Ab sistema decodificador, sistema codificador, método de decodificação e método de codificação.
EP2375409A1 (en) * 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
KR101430118B1 (ko) * 2010-04-13 2014-08-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 또는 비디오 인코더, 오디오 또는 비디오 디코더 그리고 가변적인 예상 방향을 이용하여 멀티-채널 오디오 또는 비디오 신호들을 프로세싱하기 위한 관련 방법들
CN102314882B (zh) * 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
JP2012100241A (ja) 2010-10-05 2012-05-24 Panasonic Corp 画像編集装置、画像編集方法、及び、そのプログラム
US8654984B2 (en) * 2011-04-26 2014-02-18 Skype Processing stereophonic audio signals
WO2013186344A2 (en) 2012-06-14 2013-12-19 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
JP6133422B2 (ja) 2012-08-03 2017-05-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法
EP3893240B1 (en) * 2013-01-08 2024-04-24 Dolby International AB Model based prediction in a critically sampled filterbank
EP3933834A1 (en) 2013-07-05 2022-01-05 Dolby International AB Enhanced soundfield coding using parametric component generation
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
KR101461110B1 (ko) * 2013-09-06 2014-11-12 광주과학기술원 스테레오 확장장치 및 스테레오 확장방법
KR102244379B1 (ko) * 2013-10-21 2021-04-26 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
SG11201602628TA (en) 2013-10-21 2016-05-30 Dolby Int Ab Decorrelator structure for parametric reconstruction of audio signals
KR102486338B1 (ko) * 2014-10-31 2023-01-10 돌비 인터네셔널 에이비 멀티채널 오디오 신호의 파라메트릭 인코딩 및 디코딩
BR112018014799A2 (pt) 2016-01-22 2018-12-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. aparelho e método para estimativa de uma diferença de tempo entre canais
US9978381B2 (en) * 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10224042B2 (en) * 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
AU2017357453B2 (en) * 2016-11-08 2021-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
CN110419079B (zh) 2016-11-08 2023-06-27 弗劳恩霍夫应用研究促进协会 用于下混频至少两声道的下混频器和方法以及多声道编码器和多声道解码器
US10877192B2 (en) 2017-04-18 2020-12-29 Saudi Arabian Oil Company Method of fabricating smart photonic structures for material monitoring
US10401155B2 (en) 2017-05-12 2019-09-03 Saudi Arabian Oil Company Apparatus and method for smart material analysis
WO2019020757A2 (en) 2017-07-28 2019-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. APPARATUS FOR ENCODING OR DECODING A MULTI-CHANNEL SIGNAL ENCODED USING A FILLING SIGNAL GENERATED BY A BROADBAND FILTER
CN109389984B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
CN117292695A (zh) * 2017-08-10 2023-12-26 华为技术有限公司 时域立体声参数的编码方法和相关产品
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
KR20200099561A (ko) 2017-12-19 2020-08-24 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 개선을 위한 방법, 장치 및 시스템
BR112020012654A2 (pt) 2017-12-19 2020-12-01 Dolby International Ab métodos, aparelhos e sistemas para aprimoramentos de decodificação e codificação de fala e áudio unificados com transpositor de harmônico com base em qmf
CN112262433B (zh) 2018-04-05 2024-03-01 弗劳恩霍夫应用研究促进协会 用于估计通道间时间差的装置、方法或计算机程序
CN112154502B (zh) * 2018-04-05 2024-03-01 瑞典爱立信有限公司 支持生成舒适噪声
CN112352277A (zh) 2018-07-03 2021-02-09 松下电器(美国)知识产权公司 编码装置及编码方法
US10841689B2 (en) * 2018-10-02 2020-11-17 Harman International Industries, Incorporated Loudspeaker and tower configuration
BR112021010964A2 (pt) 2018-12-07 2021-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho e método para gerar uma descrição de campo de som
KR20220025107A (ko) * 2019-06-14 2022-03-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 매개변수 인코딩 및 디코딩
CN115280411A (zh) 2020-03-09 2022-11-01 日本电信电话株式会社 声音信号缩混方法、声音信号编码方法、声音信号缩混装置、声音信号编码装置、程序及记录介质
WO2021181746A1 (ja) * 2020-03-09 2021-09-16 日本電信電話株式会社 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体
CN115244619A (zh) 2020-03-09 2022-10-25 日本电信电话株式会社 声音信号编码方法、声音信号解码方法、声音信号编码装置、声音信号解码装置、程序以及记录介质
WO2021181473A1 (ja) * 2020-03-09 2021-09-16 日本電信電話株式会社 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
AU2003209957A1 (en) * 2002-04-10 2003-10-20 Koninklijke Philips Electronics N.V. Coding of stereo signals
DE60311794T2 (de) * 2002-04-22 2007-10-31 Koninklijke Philips Electronics N.V. Signalsynthese
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
WO2005078707A1 (en) * 2004-02-16 2005-08-25 Koninklijke Philips Electronics N.V. A transcoder and method of transcoding therefore
BRPI0509100B1 (pt) * 2004-04-05 2018-11-06 Koninl Philips Electronics Nv Codificador de multicanal operável para processar sinais de entrada, método paracodificar sinais de entrada em um codificador de multicanal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7835918B2 (en) 2004-11-04 2010-11-16 Koninklijke Philips Electronics N.V. Encoding and decoding a set of signals
EP1817767B1 (en) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
PL1905006T3 (pl) 2005-07-19 2014-02-28 Koninl Philips Electronics Nv Generowanie wielokanałowych sygnałów audio
KR100923156B1 (ko) * 2006-05-02 2009-10-23 한국전자통신연구원 멀티채널 오디오 인코딩 및 디코딩 시스템 및 방법
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
CN103400583B (zh) * 2006-10-16 2016-01-20 杜比国际公司 多声道下混对象编码的增强编码和参数表示
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
JP5133401B2 (ja) * 2007-04-26 2013-01-30 ドルビー・インターナショナル・アクチボラゲット 出力信号の合成装置及び合成方法
EP2023600A1 (en) 2007-07-27 2009-02-11 Thomson Licensing Method of color mapping from non-convex source gamut into non-convex target gamut
BR122020009727B1 (pt) * 2008-05-23 2021-04-06 Koninklijke Philips N.V. Método

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329197A (zh) * 2010-10-22 2013-09-25 法国电信公司 用于反相声道的改进的立体声参数编码/解码
CN103329197B (zh) * 2010-10-22 2015-11-25 法国电信公司 用于反相声道的改进的立体声参数编码/解码
CN105556596A (zh) * 2013-07-22 2016-05-04 弗朗霍夫应用科学研究促进协会 使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和计算机程序
CN105556596B (zh) * 2013-07-22 2019-12-13 弗朗霍夫应用科学研究促进协会 使用基于残差信号调整解相关信号贡献的多声道音频解码器、多声道音频编码器、方法和数据载体
CN110895944A (zh) * 2013-07-22 2020-03-20 弗朗霍夫应用科学研究促进协会 提供音频信号的音频解码器、音频编码器、方法和程序
CN103700372A (zh) * 2013-12-30 2014-04-02 北京大学 一种基于正交解相关技术的参数立体声编码、解码方法
CN110268727A (zh) * 2017-01-04 2019-09-20 塔特公司 具有先进的环绕处理功能的可配置的多带压缩器架构
CN110268727B (zh) * 2017-01-04 2021-06-22 塔特公司 具有先进的环绕处理功能的可配置的多带压缩器架构
CN109389987A (zh) * 2017-08-10 2019-02-26 华为技术有限公司 音频编解码模式确定方法和相关产品
CN109389987B (zh) * 2017-08-10 2022-05-10 华为技术有限公司 音频编解码模式确定方法和相关产品
US11935547B2 (en) 2017-08-10 2024-03-19 Huawei Technologies Co., Ltd. Method for determining audio coding/decoding mode and related product

Also Published As

Publication number Publication date
US11019445B2 (en) 2021-05-25
KR101629862B1 (ko) 2016-06-24
BRPI0908630A2 (pt) 2017-10-03
US10136237B2 (en) 2018-11-20
US9591425B2 (en) 2017-03-07
BRPI0908630B1 (pt) 2020-09-15
RU2010152580A (ru) 2012-06-27
TW201011736A (en) 2010-03-16
BRPI0908630A8 (pt) 2017-12-12
BR122020009727B1 (pt) 2021-04-06
BR122020009732B1 (pt) 2021-01-19
US11871205B2 (en) 2024-01-09
RU2497204C2 (ru) 2013-10-27
US20210274302A1 (en) 2021-09-02
WO2009141775A1 (en) 2009-11-26
EP2283483A1 (en) 2011-02-16
JP5122681B2 (ja) 2013-01-16
US20240121567A1 (en) 2024-04-11
MX2010012580A (es) 2010-12-20
EP2283483B1 (en) 2013-03-13
US20190058960A1 (en) 2019-02-21
US20140321652A1 (en) 2014-10-30
US20170134875A1 (en) 2017-05-11
JP2011522472A (ja) 2011-07-28
US20110096932A1 (en) 2011-04-28
CN102037507B (zh) 2013-02-06
US8811621B2 (en) 2014-08-19
KR20110020846A (ko) 2011-03-03
TWI484477B (zh) 2015-05-11

Similar Documents

Publication Publication Date Title
CN102037507B (zh) 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
RU2690885C1 (ru) Стереофонический кодер и декодер аудиосигналов
JP4887307B2 (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
CN101410889B (zh) 对作为听觉事件的函数的空间音频编码参数进行控制
US8359194B2 (en) Device and method for graduated encoding of a multichannel audio signal based on a principal component analysis
KR100803344B1 (ko) 멀티채널 출력 신호를 구성하고 다운믹스 신호를 생성하기위한 장치 및 방법
EP1999747B1 (en) Audio decoding
JP4918490B2 (ja) エネルギー整形装置及びエネルギー整形方法
CN103180898A (zh) 用于利用合成单元和混频器解码包括瞬时的信号的设备
JPWO2006003891A1 (ja) 音声信号復号化装置及び音声信号符号化装置
KR20110022252A (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치
JP2007104601A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための装置
KR20110022251A (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant