CN103518386B - 用于产生立体声输出信号以提供额外输出声道的装置、方法及计算机可读存储介质 - Google Patents
用于产生立体声输出信号以提供额外输出声道的装置、方法及计算机可读存储介质 Download PDFInfo
- Publication number
- CN103518386B CN103518386B CN201280022921.7A CN201280022921A CN103518386B CN 103518386 B CN103518386 B CN 103518386B CN 201280022921 A CN201280022921 A CN 201280022921A CN 103518386 B CN103518386 B CN 103518386B
- Authority
- CN
- China
- Prior art keywords
- signal
- sound channel
- input sound
- value
- mrow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/02—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/05—Generation or adaptation of centre channel in multi-channel audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
一种用于产生立体声输出信号的装置,包括:操控信息产生器(110、210、340、440、640),其经调适以依据第一输入声道的第一信号指示值和第二输入声道的第二信号指示值来产生操控信息;以及操控器(120、220、360、370、460、470、660、670),其可基于该操控信息来操控组合信号,以得到第一经操纵的信号作为第一输出声道,以及得到第二经操控的信号作为该第二输出声道。该组合信号是藉由组合第一输入声道和第二输入声道而导出的信号。此外,该操控器(120、220、360、370、460、470、660、670)经配置,可在该第一信号指示值与该第二信号指示值成第一关系时以第一方式来操控该组合信号,或者在该第一信号指示值与该第二信号指示值成不同的第二关系时以不同的第二方式来操控该组合信号。
Description
本发明有关音频处理,特别涉及用于产生立体声输出信号的技术。
音频处理已有了多方面的进步。具体而言,环绕系统已变得愈发重要。然而,大多数的音乐录音仍被编码及作为立体声信号传输,而非作为多声道信号传输。由于环绕系统包含多个(举例而言,四个或五个)扩音器,已有的许多研究主题是,当仅有两个输入信号可供利用时,要将哪些信号提供给扩音器中的某一个。提供上述未经变更的第一输入信号给第一组扩音器,以及提供上述未经变更的第二输入信号给第二组扩音器,自然是一种解决方案。但收听者或将无法真正得到真实的环绕声音的印象,而会或将听到来自不同扩音器的相同声音。
此外,考虑由包括中央扩音器的五个扩音器所构成的环绕系统。为了给使用者提供真实声音的体验,事实上起源于该收听者前方的某一位置的声音应由该前方扩音器来重现,而非由该收听者后方的左右环绕扩音器来重现。所以,一些未包含此等声音部分的音频信号应可供利用。
此外,想要体验真实环绕音频的收听者亦期待来自左右环绕扩音器的高品质音频声音。以同一信号提供两个环绕扩音器并非为期盼的解决方案。起源于该收听者所在位置的左侧的声音不应由该右侧环绕扩音器重现,反之亦然。
然而,如早已提及,大多数的音乐录音仍被编码成立体声信号。许多立体声音乐制作采用幅值平移(panning)。多个声音来源sk会被录音,以及继而会藉由施加加权掩码ak加以平移,以致在立体声系统中,这些声音来源会看起来起源于接收立体声输入信号的左声道xL的左扩音器与接收该立体声输入信号的右声道XR的右扩音器之间的特定位置。此外,此类录音包含例如起源于室内交混回响的环境信号部分n1、n2。环境信号部分会出现在两个声道中,但不会涉及到特定的声音来源。所以,立体声输入信号的 左声道xL和右声道xR可能包括:
xL:左立体声信号
xR:右立体声信号
ak:声音来源k的平移因数
sk:信号声音来源k
n1,n2:环境信号部分
在环绕系统中,一般而言,假定仅有一些扩音器位于收听者的座位的前方(举例而言,中央、左前、和右前扩音器),而假定其他的扩音器位于收听者的座位的左后和右后方(举例而言,左环绕和右环绕扩音器)。
等量出现在该立体声输入信号的两个声道中的信号分量(sk=ak·sk)看起来会起源于在该收听者前方的中央位置处的声音来源。所以,这些信号不被该收听者后方的左环绕和右环绕扩音器重现会是合乎需要的。
此外,主要出现在左立体声声道中的信号分量(sk>>ak·sk)由该左环绕扩音器来重现;以及主要出现在右立体声声道中的信号分量(sk<<ak·sk)由该右环绕扩音器来重现会是合乎需要的。
此外,该左立体声声道的环境信号部分n1应由该左环绕扩音器来重现,而该右立体声声道的环境信号部分n2应由该右环绕扩音器来重现,会是更合乎需要的。
因此,为了给左环绕扬声器和右环绕扬声器提供适当的信号,从立体声输入信号的两个声道提供至少两个输出声道,这两个输出声道与两个输入声道不同并且具有所描述的性质,将会是倍受青睐的。
然而,上述用于从立体声输入信号产生立体声输出信号的需要并非受限于环绕系统,而可能也适用于传统立体声系统。立体声输出信号亦可能用于提供某种不同的声音体验,举例而言,通过提供立体声低音强化来使具有两个扩音器的传统立体声系统获得较宽的声场。就使用立体声扩音器或耳机的重播而论,可产生较宽和/或包封音频的印象。
依据第一现有技术的方法,单声输入源会被处理,以产生立体声信号 用于回放,从而可从该单声输入源建立两个声道。藉由此动作,藉由互补式滤波器对输入信号加以修饰,以产生立体声输出信号。当被两个扩音器重播时,上述产生的立体声信号会建立比起同一信号未经滤波的重播更宽的声音。然而,该立体声信号内所包含的声音源会被“模糊化”,因为不会产生方向性信息。一些细节呈现在:
Manfred Schroeder在1957年10月8-12日的第9年度AES会议中所递交的“AnArtificial Stereophonic Effect Obtained From Using a Single Signal(使用单一信号所得的假象立体声效应)”。
另一个提议出的解决方案呈现在WO9215180A1:“Sound reproduction systemshaving a matrix converter(具有一个矩阵转换器的声音重现系统)”。
依据此先前技术,藉由应用该立体声输入信号的声道的一个线性组合,可从立体声输入信号产生立体声输出信号。藉由应用此方法,可能产生输出信号,输出信号可使该输入信号的中央平移部分显著地衰减。然而,此方法亦会造成许多串音(由左声道至右声道,反之亦然)。藉由限制右输入信号对左输出信号的影响,可减少串音,反的亦然,因为该线性组合的对应加权因数会受到调整。然而,这也将会造成环绕扩音器中的中央平移信号部分的衰减的降低。起源于前中央位置的信号将会无意地被后方的环绕扩音器重现。
先前技术的另一个提议出的概念是藉由在一个频域中应用复数信号分析技术来决定立体声输入信号的方向和环境。举例而言,此先前技术概念在US7257231B1、US7412380B1、和US7315624B2中呈现。依据此解决方案,对于每个时间频率解析单元(bin),相对于方向和环境检查两个输入信号,并依据该方向和环境分析的结果在一个环绕系统中重新平移两个输入信号。依据此解决方案,采用相关分析来决定环境信号部分。基于该项分析,可产生环绕声道,环绕声道主要包含环境信号部分,并且可从环绕声道中移除中央平移的信号部分。然而,由于方向分析加上环境提取两者基于一些并非总是无错误的预测,可能会产生不希望有的假象。若输入信号混合包含若干具有重迭频谱的信号(举例而言,属不同仪器),上述产生 不当假象的问题将会增加。要从该立体声信号移除中央平移的部分,需要有效的信号相依性滤波,然而,该信号相依性滤波会使得因“音乐噪声”而造成的一些预测错误清晰可见。此外,方向分析和环境提取的组合更会从两种方法导致假象的增加。
所以,本发明的一个目的旨在提供用以产生立体声输出信号的改良型概念。本发明的目的藉由依据权利要求1的用以产生立体声输出信号的装置、依据权利要求14的上混合器、依据权利要求15的用以立体声低音扩展的装置、依据权利要求16的用以产生立体声输出信号的方法、依据权利要求17的编码器、和依据权利要求18的计算机程序来加以解决。
依据本发明,提供用以产生立体声输出信号的装置。此装置可从具有第一输入声道和一个第二输入声道的立体声输入信号产生具有第一输出声道和第二输出声道的立体声输出信号。
该装置可包括操控信息产生器,该操控信息产生器经调适可依据该第一输入声道的第一信号标志值以及依据该第二输入声道的第二信号标志值,来产生一些操控信息。此外,该装置包括操控器,该操控器可基于该操控信息来操控组合信号,以获得第一经操控的信号作为该第一输出声道,以及得到第二经操控的信号作为该第二输出声道。
该组合信号是藉由组合第一输入声道和第二输入声道而导出的信号。此外,该操控器可被配置成,当第一信号指示值与第二信号指示值处于第一关系时按照第一方式来操控该组合信号,并当第一信号指示值与第二信号指示值处于不同的第二关系时按照不同的第二方式来操控该组合信号。
所以,藉由操控组合信号来产生该立体声输出信号。由于该组合信号是藉由组合第一和第二输入声道而导出,以及因而包含两者立体声输入声道有关的信息,该组合信号是用以从两个输入声道产生立体声输出信号的适当基础。
在实施例中,该操控信息产生器被配置成,依据作为该第一输入声道的第一信号指示值的第一能量值以及依据作为该第二输入声道的第二信号指示值的第二能量值,来产生操控信息。此外,该操控器被配置成,当该 第一能量值与该第二能量值成第一关系时以第一方式来操控该组合信号,或者当该第一能量值与该第二能量值成不同的第二关系时以不同的第二方式来操控该组合信号。在这样的实施例中,第一和第二输入声道的能量值会被用作操控信息。该两个输入声道的能量提供了关于如何操控组合信号来得到第一和第二输出声道的适当指示,因为第一和第二输出声道包含与第一和第二输入声道有关的重要信息。
在另一实施例中,该装置还包括可计算第一和第二信号指示值的信号指示计算单元。
在另一实施例中,该操控器经调适以可操控该组合信号,其中该组合信号表示第一和第二输入声道之间的差异。此实施例基于上述采用差异信号来提供重要优点的研究结果。
依据又一个实施例,该装置还包括变换器单元,该变换器单元可将第一和第二输入声道从时域变换至频域。这可容许信号源的频率相依性处理。
此外,依据某一实施例的装置经调适以产生依据该第一信号指示值的第一加权掩码和依据该第二信号指示值的第二加权掩码。该装置经调适以藉由应用该第一加权掩码至该组合信号的幅值以得到第一经修饰的幅值来操控该组合信号,,以及经调适以藉由应用该第二加权掩码至该组合信号的幅值以得到第二经修饰的幅值来操控该组合信号。第一和第二加权掩码提供了基于第一和第二输入信号来修饰该差异信号的有效方法。
在又一个实施例中,该装置包含组合器,其经调适以组合该组合信号的该第一幅值和相位值以得到该第一输出声道,以及组合该组合信号的该第二幅值和相位值以得到该第二输出声道。在此种实施例中,该组合信号的相位值保持不变。
依据另一实施例,通过确定该第一声道的信号指示值与该第二声道的信号指示值之间的关系来产生第一和/或第二加权掩码。调谐可能采用调谐参数。
依据又一个实施例,提供变换器单元和组合信号产生器。在此实施例中,在产生组合信号之前,将输入信号转换至频域。因此,避免了将该组合信号转换至频域,而可节省处理时间。
此外,提供了一种上混合器、一种用以立体声低音扩展的装置、一种用以产生立体声输出信号的方法、一种用以编码操控信息的装置、和一种用以产生立体声输出信号的计算机程序。
在下文中,将参照所附诸图,说明一些较佳的实施例,其中:
图1例示依据实施例的用以产生立体声输出信号的装置;
图2描述依据另一实施例用以产生立体声输出信号的装置;
图3显示依据又一实施例用以产生立体声输出信号的装置;
图4例示用以产生立体声输出信号的装置的另一个实施例;
图5例示可显示依据本发明的实施例的不同的加权掩码相对于能量值的图表;
图6描述依据又一个实施例用以产生立体声输出信号的装置;
图7例示依据实施例的上混合器;
图8描述依据又一个实施例的上混合器;
图9显示依据一个实施例用以立体声低音扩展的装置;而
图10则描述依据实施例的编码器。
图1例示依据一个实施例用以产生一个立体声输出信号的装置。该装置包含操控信息产生器110和操控器120。该操控信息产生器110经调适,可依据立体声输入信号的第一声道的信号指示值VL,来产生第一操控信息GL。此外,该操控信息产生器110经调适,可依据立体声输入信号的第二声道的信号指示值VR,来产生一个第二操纵信息GR。
在实施例中,该第一声道的信号指示值VL是该第一声道的能量值,且该第二声道的信号指示值VR是该第二声道的能量值。在另一实施例中,该第一声道的信号指示值VL是该第一声道的幅值,且该第二声道的信号指示值VR是该第二声道的幅值。
所产生的操控信息GL、GR被提供给操控器120。此外,组合信号d被馈送进该操控器120内。该组合信号d藉由该立体声输入信号的第一和第二输入声道而导入。
该操控器120基于该第一操控信息GL以及基于该组合信号d来产生第一操控信号dL。此外,该操控器120亦基于该第二操控信息GR以及基于该组合信号d来产生第二操控信号dR。该操控器120经配置为,在该第一信号指示值VL与该第二信号指示值VR成第一关系时以第一方式来操控该组合信号d,或者在该第一信号指示VL与该第二信号指示值VR成不同的第二关系时以不同的第二方式来操控该组合信号d。
在实施例中,该组合信号d为差异信号。举例而言,可能已从该立体声输入信号的第一声道减去该立体声输入信号的第二声道。采用差异信号作为一个组合信号是基于差异信号特别适合被修饰来产生立体声输出信号的研究结果。此研究结果基于下文:
(单声道)差异信号,亦称做“S”(侧)信号是从立体声输入信号的左声道和右声道(举例而言,在时域中)藉由应用如下公式而产生:
S=xL-xR,
S:差异信号
xL:左输入信号
xR:右输入信号
采用xL与xR的上述定义:
藉由依据上述公式而产生差异信号,在产生该差异信号时,一些等量出现在两个输入声道(ak=1)中的声音源sk会被移除。(假定一些等量出现在两个立体声输入声道中的声音源源自于该收听者前方中的中央位置处的部位)。此外,一些被平移而使该声音源几乎等量出现在该立体声输入信号(ak≈1)的两个声道中的声音源sk将会在该差异信号中被强烈地衰减。
然而,一些被平移而使仅出现在(或主要出现在)该立体声输入信号的左声道(ak→0)中的声音源将全然不会被衰减(或者将仅会稍许被衰减)。此外,一些被平移而使仅出现在(或主要出现在)该立体声输入信号的右声道(ak>>1)中的声音源亦将全然不会被衰减(或者将仅会稍许被衰减)。
大体而言,立体声输入信号的左声道和右声道的环境信号部分n1和n2相互仅有稍许关联。所以,在形成差异信号时,左声道和右声道的环境信 号部分n1和n2仅稍许被衰减。
差异信号可能被采用在上述用以产生立体声输出信号的过程中。若该S-信号在时域中产生,将不会有假象产生。
图2例示依据本发明的另一实施例用以产生立体声输出系统的装置。该装置包含:操控信息产生器210、操控器220、以及信号指示计算单元230。
立体声输入信号的第一声道xL和第二声道xR被馈送进信号指示计算单元230内。此信号指示计算单元230可计算与该第一输入声道xL相关的第一信号指示值VL,和与该第二输入声道xL相关的第二信号指示值VR。举例而言,该第一输入声道xL的第一能量值会被计算为该第一信号指示值VL,以及该第二输入声道xR的第二能量值会被计算为该第二信号指示值VR。或者,该第一输入声道xL的第一幅值会被计算为该第一信号指示值VL,以及该第二输入声道xR的第二幅值会被计算为该第二信号指示值VR。
在其他实施例中,依据馈送进该信号指示计算单元230内的输入声道的数目,会有超过两个的声道被馈送进该信号指示计算单元230内,以及会有超过两个的信号指示值被计算。
计算得的信号指示值VL、VR会被馈送进该操控信息产生器210内。
该操控信息产生器210经调适,可依据该立体声输入信号的第一声道xL的第一信号指示值VL来产生操控信息GL,以及可依据该立体声输入信号的第二声道xR的第二信号指示值VR来产生操控信息GR。基于该操控信息产生器210所产生的操控信息GL、GR,该操纵器220会产生第一和第二操控信号dL、dR分别作为该立体声输出信号的第一和第二输出声道。此外,该操控器220经配置为,可在该第一信号指示值VL与该第二信号指示VR成第一关系时以第一方式来操控该组合信号d,或者在该第一信号指示值VL与该第二信号指示值VR成不同的第二关系时以不同的第二方式来操控该组合信号d。
图3例示用以产生立体声输出信号的装置。具有表示在时域中的两个输入声道xL(t)、xR(t)的立体声输入信号被馈送进变换器单元320内,以及被馈送进组合信号产生器310内。第一输入声道xL(t)和第二输入声道xR(t)可分别为该立体声输入信号的左输入声道xL(t)和右输入声道xR(t)。输入信 号xL(t)、xR(t)可为离散时间信号。
该组合信号产生器310可基于立体声输入信号的第一输入声道xL(t)和第二输入声道xR(t)来产生组合信号d(t)。所产生的组合信号d(t)可为离散时间信号d(t)。在实施例中,该组合信号d(t)可能为差异信号,以及举例而言,可藉由从该第一(举例而言,左)输入声道xL(t)减除该第二(举例而言,右)输入声道xR(t)(或者反的亦然)藉由应用公式来产生该组合信号d(t):
d(t)=xL(t)-xR(t).
在另一实施例中,采用其他类型的组合信号。举例而言,该组合信号产生器310可依据以下公式来产生组合信号d(t):
d(t)=a·xL(t)-b·xR(t)
参数a和b被称为操控参数。藉由选择操控参数a和b使a不同于b,在产生该组合信号d(t)时,即使非等量出现在该立体声输入信号的声道xL(t)、xR(t)中的信号声音源也可被移除。因此,藉由选择不同于b的a,可能移除一些举例而言已藉由采用幅值平移而被安排至该中央左侧或中央右侧的位置的声音源。
举例而言,考虑经安排使其显得为起源自该中央左侧的位置的声音源r(t)的情况,举例而言,藉由设定:
xL(t)=2·r(t)+f(t);和
xR(t)=0.5·r(t)+g(t).
接着,设定操控参数a和b成a=0.5和b=2,可从该组合信号移除该信号源r(t):
d(t)=a·xL(t)-b·xR(t)
=a·(2·r(t)+f(t))-b·(0.5·r(t)+g(t))
=0.5·(2·r(t)+f(t))-2·(0.5·r(t)+g(t))
=0.5·f(t)-2·g(t);
在一些实施例中,该组合信号d(t)=a·xL(t)-b·xR(t)会被采用,使藉由设定操控参数a和b至一些适当的值,而从该组合信号移除起源自某一定位置的声音源。举例而言,该支配性声音源可能为以管弦乐录音为例的音乐录音中的支配性器乐。操控参数a、b可能被设定成某一值,使在产生 该组合信号时移除一些起源自该支配性声音源的位置的声音。
在实施例中,操控参数a和b可依据该立体声输入信号的输入声道xL(t)、xR(t)动态地加以调整。举例而言,该组合信号产生器310经调整,可能动态地调整操控参数a和b,使得从该组合信号移除一个支配性声音源。该支配性声音源的位置可能不同。在一个时间点处,该支配性声音源位于第一位置处,而在另一个时间点处,由于该支配性声音源的移动,或由于另一个声音源已变成该录音中的支配性声音源,该支配性声音源位于不同的第二位置处。藉由动态地调整操控参数a和b,可从该组合信号移除真实的支配性声音源。
在又一实施例中,该第一和第二输入信号的能量关系可能现存于该组合信号产生器310中。举例而言,该能量关系可指示该第一输入声道xL(t)的能量值与该第二输入声道xR(t)的能量值间的关系。在此种实施例中,操控参数a和b的值可能基于该能量关系而动态地加以决定。
在一个实施例中,举例而言,操控参数a和b的值可能会被选择而使a=1;以及b=E(xL(t))/E(xR(t));(E(y)=y的能量值)。在其他的实施例中,可采用用以决定a和b的值的其他规则。
此外,在另一个实施例中,举例而言,藉由在一个时域或频域中分析输入声道的能量关系,该组合信号产生器本身可确定第一和第二输入声道xL(t)、xR(t)的能量关系。
在又一实施例中,第一和第二输入声道xL(t)、xR(t)的幅值关系在该组合信号产生器310中可用。举例而言,该幅值关系可能指示该第一输入声道xL(t)的幅值与该第二输入声道xR(t)的幅值间的关系。在此种实施例中,操控参数a、b的值可能基于该幅值关系而动态地确定。操控参数a和b的确定可类似于在各实施例中那样进行,其中基于能量关系确定a和b。在又一实施例中,该组合信号产生器本身可确定第一和第二输入声道xL(t)、xR(t)的幅值关系,举例而言可通过以下方式:使输入声道xL(t)、xR(t)从一个时域变换至一个频域,举例而言,藉由应用短时间傅立叶变换(STFT),藉由决定两个声道xL(t)、xR(t)的频域表示的幅值,以及藉由将该第一输入声道xL(t)的一个或多个幅值与该第二输入声道xR(t)的一个或多个幅值设定为成 关系。当该第一输入声道xL(t)的多个幅值被设定成与第二输入声道xR(t)的多个幅值成关系时,可计算该第一多个幅值的平均值和该第二多个幅值的平均值。
图3的实施例中的装置还包括第一变换器单元320。该组合信号产生器310将该组合信号d(t)馈送进该第一变换器单元320内。此外,该立体声输入信号的第一输入声道xL(t)和第二输入声道xR(t)亦会被馈送进该第一变换器单元320内。该第一变换器单元320可藉由采用适当的变换方法将该第一输入声道xL(t)、该第二输入声道xR(t)和该差异信号d(t)变换到频域中。
在图3的实施例中,该第一变换器单元320可采用滤波器排组(举例而言,藉由采用短时间傅立叶变换(STFT))将离散时间输入声道xL(t)、xR(t)和该离散时间差异信号d(t)变换到频域中。在其他的实施例中,该第一变换器单元320经调适可采用其他类型的变换方法,举例而言QMF(正交镜像滤波器)滤波器排组,将信号从时域变换到频域中。
在藉由采用短时间傅立叶变换来变换输入声道xL(t)、xR(t)和差异信号d(t)之后,该频域差异信号D(m,k)和该频域第一输入声道XL(m,k)和第二输入声道XR(m,k)表示复数频谱。m为该STFT时间指数,k为该频率指数。
该第一变换器单元320可将该差异信号的复数频域信号D(m,k),馈送进幅值相位计算单元350内。该幅值相位计算单元,可从该频域差异信号D(m,k)的复数频谱计算出幅值频谱│D(m,k)│和相位频谱
此外,该第一变换器单元320可将第一复数频域输入声道XL(m,k)和第二复数频域输入声道XR(m,k)馈送进信号指示计算单元330内。该信号指示计算单元330可从该第一频域输入声道XL(m,k)计算出第一信号指示值,以及可从该第二频域输入声道XR(m,k)计算出第二信号指示值。更明确而言,在图3的实施例中,该信号指示计算单元330可从该第一频域输入声道XL(m,k)计算出第一能量值EL(m,k)作为第一信号指示值,并从该第二频域输入声道XR(m,k)计算出第二能量值ER(m,k)作为第二信号指示值。
该信号指示计算单元330可考虑每个信号部分,举例而言,第一频域输入声道XL(m,k)和第二频域输入声道XR(m,k)的每个时间频率解析单元(m,k)。关于每个时间频率解析单元,图3的实施例中的信号指示计算单元 330可计算与该第一频域输入声道XL(m,k)有关的第一能量EL(m,k),和与该第二频域输入声道XR(m,k)有关的第二能量ER(m,k)。举例而言,第一和第二能量EL(m,k)和ER(m,k)可依据下列公式来计算:
EL(m,k)=(Re{XL(m,k)})2+(Im{XL(m,k)})2
ER(m,k)=(Re{XR(m,k)})2+(Im{XR(m,k)})2.
在另一个实施例中,该信号指示计算单元330可计算该第一频域输入声道XL(m,k)的幅值作为第一信号指示值,以及可计算该第二频域输入声道XR(m,k)的幅值作为第二信号指示值。在此种实施例中,该信号指示计算单元330可确定该第一频域输入信号XL(m,k)的每个时间频率解析单元的幅值,以导出第一信号指示值。此外,该信号值计算单元330可确定该第二频域输入信号XR(m,k)的每个时间频率解析单元的幅值,以导出第二信号指示值。
图3的信号指示计算单元330可将信号指示值(举例而言,第一和第二输入声道XL(m,k)、XR(m,k)的能量值EL(m,k)、ER(m,k))传递给操控信息产生器340。
在图3的实施例中,该操控信息产生器340举例而言,可针对每个输入信号XL(m,k)、XR(m,k)的每个时间频率解析单元产生加权掩码(举例而言,加权因数)。依据第一和第二信号指示值的关系,举例而言,依据左和右频域信号的能量关系,可产生上述与该第一输入信号XL(m,k)有关的加权掩码GL(m,k),和上述与该第二输入信号XR(m,k)有关的加权掩码GR(m,k)。就特定的时间频率解析单元而论,若EL(m,k)>>ER(m,k),则GL(m,k)具有接近1的值。另一方面,若ER(m,k)>>EL(m,k),GL(m,k)具有接近0的值。就右加权掩码而言,情况则相反。在该操控信息产生器接收幅值作为第一和第二信号指示值的实施例中,相同的关系同样适用。
加权掩码在计算上,举例而言,可能依据公式:
和
可采用可调整的参数来计算加权掩码,倘若声音源并非位于远左侧或 远右侧处,而是在这些值之间的话,则加权掩码会变得相关联。稍后将参照图5说明有关如何计算加权掩码GL(m,k)、GR(m,k)的其它范例。
该信号值计算单元330可将上述产生的第一加权掩码GL(m,k)馈送进第一操纵器360内。此外,该幅值相位计算单元350将该差异信号D(m,k)的幅值│D(m,k)│馈送进该第一操控器360内。接着将该第一加权掩码GL(m,k)应用至该差异信号的幅值,以得到该差异信号D(m,k)的第一经修饰的幅值│DL(m,k)│。可将该第一加权掩码GL(m,k)应用至该差异信号的幅值│D(m,k)│,举例而言,藉由使该幅值│D(m,k)│乘以GL(m,k),其中│D(m,k)│和GL(m,k)与该同一时间频率解析单元(m,k)有关。该第一操控器360可针对所有的时间频率解析单元产生经修饰的幅值│DL(m,k)│,该第一操控器360接收针对所有的时间频率解析单元的加权掩码值GL(m,k)和差异信号幅值│D(m,k)│。
此外,该信号值计算单元330可将上述产生的第二加权掩码GR(m,k)馈送进第二操控器370内。此外,该幅值相位计算单元350可将该差异信号D(m,k)的幅值频谱│D(m,k)│馈送进该第二操控器370内。然后将该第二加权掩码GR(m,k)应用至该差异信号的幅值,以获得该差异信号D(m,k)的第二经修饰的幅值│DL(m,k)│。再次地,可将该第二加权掩码GR(m,k)应用至该差异信号D(m,k)的幅值│D(m,k)│,举例而言,藉由使该幅值│D(m,k)│乘以GR(m,k),其中│D(m,k)│和GR(m,k)与该同一时间频率解析单元(m,k)有关。该第二操控器370可针对所有的时间频率解析单元产生经修饰的幅值│DL(m,k)│,该第二操控器370接收针对所有的时间频率解析单元的加权掩码值GR(m,k)和差异信号幅值│D(m,k)│。
该第一经修饰的幅值│DL(m,k)│以及该第二经修饰的幅值│DR(m,k)│被馈送进组合器380内。该组合器380可将每个第一经修饰的幅值│DL(m,k)│与该差异信号的对应相位值(与同一时间频率解析单元有关的相位值)组合,以得到第一复数频域输出声道DL(m,k)。此外,该组合器380可组合每个第二修饰的幅值│DR(m,k)│与该差异信号的对应相位值(与同一时间频率解析单元有关的相位值),以得到第二复数频域输出声道DR(m,k)。
依据另一个实施例,该组合器380可组合每个第一幅值│DL(m,k)│与该第一(举例而言,左)输入声道XL(m,k)的对应相位值(与同一时间频率解析单元相关的相位值),以及还可组合每个第二幅值│DR(m,k)│与该第二(举例而言,右)输入声道XR(m,k)的对应相位值(与同一时间频率解析单元相关的相位值)。
在其他实施例中,第一幅值│DL(m,k)│和第二幅值│DR(m,k)│可与经组合的相位值相结合。此种经组合的相位值举例而言,可藉由组合该第一输入信号的相位值与该第二输入信号的相位值而得到,举例而言,藉由应用公式:
在其他实施例中,第一和第二幅值的第一组合被应用至该第一输入信号的相位值,以及第一和第二幅值的第二组合被应用至该第二输入信号的相位值。
图3的组合器380可将所产生的第一和第二复数频域输出信号DL(m,k)、DR(m,k)馈送进第二变换器单元390内。该第二变换器单元390举例而言可藉由实施反短时间傅立叶变换(ISTFT)将第一和第二复数频域输出信号DL(m,k)、DR(m,k)变换到时域中,以分别从该第一频域输出信号DL(m,k)得到第一时域输出信号dL(t),以及从该第二频域输出信号DR(m,k)得到第二时域输出信号dR(t)。
图4例示又一个实施例。图4的实施例不同于图3中所描述的实施例,只在于该变换器单元420将第一和第二输入声道xL(t)、xR(t)从时域变换至频域。然而,该变换器单元并不会变换组合信号。取而代之的是,提供组合信号产生器410,其可从第一和第二频域输入声道XL(m,k)和XR(m,k)产生频域组合信号。当该组合信号在频域中产生时,会有一个变换步骤已被省去,因为避免了将该组合信号变换到频域中。举例而言,该组合信号产生器410可能产生频域差异信号,举例而言,藉由针对每个时间频率解析单元应用下列公式:
D(m,k)=XL(m,k)-XR(m,k).
在另一个实施例中,该组合信号产生器可能采用任何其他类型的组合 信号,举例而言:
D(m,k)=a·XL(m,k)-b·XR(m,k).
图5例示考虑调谐参数α的情况下的加权掩码GL、GR与能量值EL、ER间的关系。虽然下文的解释主要涉及加权掩码与能量值间的关系,但其同样适用于加权掩码与幅值间的关系,举例而言,同样适用于当操控信息产生器基于第一和第二输入声道的幅值而产生加权掩码时的情况。所以,解释和公式就幅值而言同样适用。
观念上,加权掩码基于用以计算两点间的重心的法则而产生:
xc:重心
x1:点1
x2:点2
m1:点1处的质量
m2:点2处的质量
若此公式被用来计算能量值EL(m,k)和ER(m,k)的“重心”,此会产生:
C(m,k):能量值EL(m,k)和ER(m,k)的重心。
要获得左声道的加权掩码,x1被设定为x1=1,以及x2被设定为x2=0:
此种加权掩码GL(m,k)在左平移信号(EL(m,k)>>ER(m,k))的情况下具有所希望的结果GL(m,k)→1,以及在右平移信号(ER(m,k)>>EL(m,k))的情况下具有所希望的结果GL(m,k)→0。
同理,用于右声道的加权掩码藉由设定x1=0和x2=1而得到:
此加权掩码GR(m,k)在右平移信号(ER(m,k)>>EL(m,k))的情况下具有所希望的结果GR(m,k)→1,以及在左平移信号(EL(m,k)>>ER(m,k))的情况下具有所希望的结果GR(m,k)→0。
关于中央平移的输入信号(EL(m,k)=ER(m,k)),加权掩码GL(m,k)和GR(m,k)等于0.5。参数α被用来操控有关中央平移的信号和接近中央平移的信号的加权掩码的特性,其中α为依据以下公式应用在加权掩码上的指数:
加权掩码GL(m,k)和GR(m,k)藉由这些公式基于能量来计算。
诚如上文所陈述,这些公式同样适用于第一输入声道和第二输入声道的幅值|XL(m,k)|、|XR(m,k)|。在该情况下,举例而言,在操控信息产生器基于幅值而非能量值来产生加权掩码的实施例中,EL(m,k)具有|XL(m,k)|的值,以及ER(m,k)具有|XR(m,k)|的值。
图5藉由例示与该调谐参数α的不同值有关的曲线,来例示应用该调谐参数的效果。若α被设定为α=0.4,在左输入和右输入声道中包含相等或相似的能量的解析单元,会受到稍微的衰减。唯有在该右输入声道中具有明显较高的能量的解析单元会因该左加权掩码GL(m,k)而受到强烈的衰减。类似地,一些在该左输入声道中具有明显较高的能量的解析单元会因该右加权掩码GR(m,k)而受到强烈的衰减。当仅有少许信号部分由于这样的滤波器而受到强烈的衰减时,该调谐参数的此种设定可能被称作“低选择性”。
一个较高的参数值,举例而言α=2,会产生“相当高的选择性”。如图5中可见到的是,在左声道和右声道中具有相等或相似的能量解析单元会受到严重的衰减。依据该应用例,上述希望的选择性可能藉由该调谐参数α来加以操控。
图6例示用以依据又一个实施例来产生立体声输出信号的装置。图6的装置不同于图3的实施例,除其他因素之外,其进一步包含信号延迟单元605。立体声输入信号的第一输入声道xLA(t)和第二输入声道xRA(t)被馈送进该信号延迟单元605内。第一输入声道xLA(t)和第二输入声道xRA(t)亦被馈送到第一变换器单元620内。
该信号延迟单元605经调适可使该第一输入声道xLA(t)和/或该第二输 入声道xRA(t)延迟。在实施例中,该信号延迟单元可藉由采用第一和第二输入声道xLA(t)、xRA(t)的关联性分析来确定延迟时间。举例而言,xLA(t)和xRA(t)以逐步骤的方式做时间偏移。对于每一步骤,会进行关联性分析。接着,确定上述具有最大关联性的时间偏移。假定已采用延迟平移来安排该立体声输入信号中的信号源而使其看起来源自特定的位置,则假定上述具有最大关联性的时间偏移对应于源自该延迟平移的延迟。在实施例中,该信号延迟单元可重新安排该延迟平移的信号源,而使其被重新安排至中央位置。举例而言,若该关联性分析指出该输入声道xLA(t)业已延迟了Δt,则该信号延迟单元605接着会使该输入声道xRA(t)延迟Δt。
最终修饰过的第一声道xLB(t)和第二声道xRB(t)继而会被馈送进该组合信号产生器620内,组合信号产生器620可产生组合信号。在实施例中,该组合信号产生器可藉由应用以下公式产生差异信号作为组合信号:
d(t)=xLB(t)–xRB(t).
当该延迟平移的信号源已经被重新安排至中央位置时,该信号源接着会等量出现在最终修饰过的第一和第二声道xLB(t)、xRB(t)中,以及将会因而自该差异信号d(t)中移除。藉由采用上述依据图6的实施例的装置,有可能产生组合信号,而不需要对应延迟平移的信号源。
图7例示上混合器700,其可将立体声输入信号上混合成五个输出声道,举例而言,环绕系统的五个声道。该立体声输入信号具有第一输入声道L和第二输入声道R,第一输入声道L和第二输入声道R被馈送进该上混合器700内。五个输出声道可能为中央声道、左前声道、右前声道、左环绕声道和右环绕声道。中央声道、左前声道、右前声道、左环绕声道、和右环绕声道分别被提供给中央扩音器720、左前扩音器730、右前扩音器740、左环绕扩音器750、和右环绕扩音器760。这些扩音器可位于收听者的座位710四周。
该上混合器700可藉由添加该立体声输入信号的左输入声道L和右输入声道R而产生该中央扩音器720的中央声道。该上混合器700可将上述未经修饰的左输入声道L提供给该左前扩音器730,以及可能进一步将上述未经修饰的右输入声道R提供给该右前扩音器740。此外,该上混合器 包含用以依据上文说明的实施例中的一个来产生立体声输出信号的装置770。左输入声道L和右输入声道R被馈送进该装置770内,分别作为该装置的第一和第二输入声道,以用于产生立体声输出信号770。该装置770的第一输出声道被提供给该左环绕扩音器750作为左环绕声道,而该装置770的第二输出声道被提供给该右环绕扩音器760作为该右环绕声道。
图8例示上混合器800的又一个实施例,其具有五个输出声道,举例而言,环绕系统的五个声道。该立体声输入信号具有第一输入声道L和第二输入声道R,彼等系馈送进该上混合器800内。如同在图7中所例示的实施例中,五个输出声道可为中央声道、左前声道、右前声道、左环绕声道、和右环绕声道。中央声道、左前声道、右前声道、左环绕声道、和右环绕声道分别被提供给中央扩音器820、左前扩音器830、右前扩音器840、左环绕扩音器850、和右环绕扩音器860。再次地,扩音器可位于收听者的座位810四周。
上述提供给该中央扩音器820的中央声道藉由加入左输入声道L和右输入声道R来产生。此外,该上混合器包括用以依据上文所说明的实施例中的一个来产生立体声输出信号的装置870。左输入声道L和右输入声道R被馈送进该装置870内,该装置870可产生立体声输出信号的第一和第二输出声道。该第一输出声道被提供给该左前扩音器830;该第二输出声道被提供给该右前扩音器840。此外,该装置870所产生的第一和第二输出声道被提供给环境提取器880。该环境提取器880可从该装置870所产生的第一输出声道提取出第一环境信号分量,以及可提供该第一环境信号分量给该左环绕扩音器850作为该左环绕声道。此外,该环境提取器880可从该装置870所产生的第二输出声道提取出第二环境信号分量,以及可提供该第二环境信号分量给该右环绕扩音器860作为该右环绕声道。
图9例示依据某一实施例用以立体声低音扩展的装置900。在图9中,立体声输入信号的第一输入声道L和第二输入声道R被馈送进该装置900内。上述用于立体声低音扩展900的装置包括依据上文所说明的实施例中的一个实施例的用以产生立体声输出信号的装置910。用于立体声低音扩展900的装置的第一和第二输入声道L、R被馈送进上述用以产生立体声输出 信号的装置910内。
上述用以产生立体声输出信号的装置910的第一输出声道被馈送进第一组合器920内,该第一组合器920可组合该第一输入声道L与用以产生立体声输出信号的装置910的第一输出声道,以产生用于立体声低音扩展900的装置的第一输出声道。
对应地,用以产生立体声输出信号910的装置的第二输出声道被馈送进第二组合器930内,其可组合该第二输入声道R与用以产生立体声输出信号910的装置的第二输出声道,以产生上述用以立体声低音扩展900的装置的第二输出声道。
通过上述方式,产生扩展的立体声输出信号。该组合器可组合两个接收到的声道,举例而言,藉由添加两个声道,藉由采用两个声道的线性组合,或者藉由采用组合两个声道的另一方法。
图10例示依据实施例的编码器。立体声信号的第一声道XL(m,k)和第二声道XR(m,k)被馈送进该编码器内。该立体声信号可在频域中表示。
该编码器包含包括信号指示计算单元1010,用于确定立体声信号的第一和第二声道XL(m,k)、XR(m,k)的第一信号指示值VL和第二信号指示值VR,举例而言,第一和第二声道XL(m,k)、XR(m,k)的第一和第二能量值EL(m,k)、ER(m,k)。该编码器经调适,可按照类似于上文所说明的实施例用以产生立体声输出信号的装置的方式来确定能量值EL(m,k)、ER(m,k)。举例而言,该编码器可藉由采用以下公式来决定能量值:
EL(m,k)=(Re{XL(m,k)})2+(Im{XL(m,k)})2
ER(m,k)=(Re{XR(m,k)})2+(Im{XR(m,k)})2.
在另一实施例中,信号指示计算单元1010可确定第一和第二声道XL(m,k)、XR(m,k)的幅值。在另一实施例中,该信号指示计算单元1010可按照类似于上文所说明的实施例的用以产生立体声输出信号的装置的方式来确定第一和第二声道XL(m,k)、XR(m,k)的幅值。
该信号值计算单元1010可将上述决定的能量值EL(m,k)、ER(m,k)和/或上述决定的幅值馈送进操控信息产生器1020内。该操控信息产生器1020接着可藉由在类似于上文所说明、特别是如同参照图5中所解释的实施例 的用以产生立体声输出信号的装置的方式,基于上述接收到的能量值EL(m,k)、ER(m,k)和/或幅值来产生操控信息,举例而言,第一加权掩码GL(m,k)和第二加权掩码GR(m,k)。
在实施例中,该操控信息产生器1020可基于第一和第二声道XL(m,k)、XR(m,k)的幅值来确定该操控信息。在此种实施例中,该操控信息产生器1020可应用一些类似于上文所说明的实施例的用以产生立体声输出信号的装置的观念。
该操控信息产生器1020接着可将加权掩码GL(m,k)和GR(m,k)传递给输出模块1030。
该输出模块1030输出适当的资料格式(举例而言,按照比特流或作为信号值)来输出操控信息。
所输出的操控信息可能被传输给解码器,该解码器可藉由应用上述传输的操控信息来产生立体声输出信号,举例而言,藉由将上述传输的加权掩码与差异信号组合或如参照上文用以产生一个立体声输出信号的装置的实施例所说明的立体声输入信号组合来产生立体声输出信号。
虽然已在装置的环境背景中说明一些方面,但这些方面很显然亦代表相应方法的描述,其中块或装置相当于方法步骤或方法步骤的特征。类似地,在方法步骤的环境背景中所说明的属性亦代表对应的块或项目或对应的装置的特征的说明。
依据某一定的体现需求,本发明的实施例可在硬件或软件中实现。该实现可使用数字储存介质来执行,例如其上储存有一些可以电子方式读取的控制信号的磁片、DVD、CD、ROM、PROM、EPROM、EEPROM、或快闪记忆体,该数字存储介质可与可编程计算机系统协作(或有能力协作)来执行该对应的方法。
某些依据本发明的实施例包括数据载体,其具有一些可以电子方式读取的控制信号,该数据载体可与可编程计算机系统协动,而执行本说明书所说明的方法中的一个。
一般而言,本发明的实施例可实现为具有程序代码的计算机程序产品,当该计算机程序产品在一个计算机上运行时,该程序码可运作而执行方法 中的一个。举例而言,该程序码可储存在机器可读取载体上面。
其他的实施例包括上述储存在机器可读取式载体或非瞬态储存介质上而可执行本说明书所说明的方法中的一个的计算机程序。
换言之,因此本发明方法的一个实施例是具有程序代码的计算机程序,在该计算机程序在计算机上运行时,该计算机程序代码用于执行本说明书所说明的方法中的一个。
因此,本发明方法的又一实施例是数据载体(或数字储存介质,或计算机可读取式介质),其上记录有上述用以执行本说明书所说明的方法中的一个的计算机程序。
因此,本发明方法的又一实施例是代表上述用以执行本说明书所说明的方法中的一个的计算机程序的数据流或信号序列。举例而言,该数据流或信号序列可能经配置为经由数据通信连接(举例而言,经由网际网路)来转移。
又一实施例包括处理装置(举例而言,计算机、或可编程逻辑器件),该处理装置经配置或经调适可执行本说明书所说明的方法中的一个。
又一个实施例包括计算机,其上安装有上述用以执行本说明书所说明的方法中的一个的计算机程序。
在某些实施例中,可编程逻辑器件(举例而言,现场可编程逻辑门阵列)可能被用来执行本说明书所说明的方法的某些或所有功能性。在某些实施例中,现场可编程逻辑门阵列可与微处理器协作以执行本说明书所说明的方法中的一个。一般而言,这些方法较佳的是由任何硬体装置来执行。
上文说明的实施例仅为例示本发明的原理。理应了解的是,本说明书所说明的布置和细节的修改和变型将对本领域普通技术人员而言明显。所以,意图在于仅受限于待审的专利权利要求的范围,而非受限于通过对本说明书中的实施例的说明和解释所呈现的特定细节。
Claims (18)
1.一种用于从具有第一输入声道和第二输入声道的立体声输入信号产生具有第一输出声道和第二输出声道的立体声输出信号的装置,包括:
操控信息产生器(110、210、340、440、640),其经调适可依据第一输入声道的第一信号指示值和第二输入声道的第二信号指示值来产生操控信息,其中所述操控信息产生器被配置成通过将所述第一信号指示值和所述第二信号指示值用于计算第一加权掩码来确定所述操控信息,并且其中所述操控信息产生器被配置成通过将所述第一信号指示值和所述第二信号指示值用于计算第二加权掩码来确定所述操控信息,所述第二加权掩码不同于所述第一加权掩码;以及
操控器(120、220、360、370、460、470、660、670),其通过对组合信号应用所述第一加权掩码来生成所述第一输出声道;
其中,所述组合信号依据所述第一输入声道和所述第二输入声道,其中所述组合信号是通过组合所述第一输入声道和所述第二输入声道所推导出的信号;以及
其中,所述操控器(120、220、360、370、460、470、660、670)经配置为通过对所述组合信号应用所述第二加权掩码来生成所述第二输出声道。
2.如权利要求1所述的装置,其特征在于,
所述操控信息产生器(110、210、340、440、640)经调适以依据作为第一输入声道的第一信号指示值的第一能量值和作为第二输入声道的第二信号指示值的第二能量值来产生所述操控信息;以及
其中,所述操控器(120、220、360、370、460、470、660、670)经配置为,在第一能量值与第二能量值成第一关系时以第一方式来操控该组合信号,或在第一能量值与第二能量值成不同的第二关系时以不同的第二方式来操控该组合信号。
3.如权利要求1所述的装置,其特征在于,
操控信息产生器(110、210、340、440、640)经调适可依据第一输入声道的第一信号指示值或者依据第二输入声道的第二信号指示值来产生操控信息,
其中,第一输入声道的第一信号指示值取决于第一输入声道的幅值;
其中,第二输入声道的第二信号指示值取决于该第二输入声道的幅值;以及
其中,所述操控器(120、220、360、370、460、470、660、670)经配置为,在第一信号指示值与第二信号指示值成第一关系时以第一方式来操控组合信号,或者在第一信号指示值与第二信号指示值成不同的第二关系时以不同的第二方式来操控组合信号。
4.如权利要求1所述的装置,其特征在于,
所述装置进一步包括信号指示计算单元(230、330、430、630),其经调适以基于第一输入声道来计算第一信号指示值,以及进一步经调适以基于第二输入声道来计算第二信号指示值。
5.如权利要求1所述的装置,其特征在于,
所述操控器(120、220、360、370、460、470、660、670)经调适以操控所述组合信号,其中所述组合信号依据下列公式而产生:
d(t)=a·xL(t)–b·xR(t),
其中d(t)表示所述组合信号,其中xL(t)表示第一输入声道,其中xR(t)系表示第二输入声道,以及其中a和b是操控参数。
6.如权利要求1所述的装置,其特征在于,
所述操控器(120、220、360、370、460、470、660、670)经调适以操控所述组合信号,其中所述组合信号表示第一输入声道与第二输入声道之间的差异。
7.如权利要求1所述的装置,其特征在于,
所述装置进一步包括变换器单元(320、420、620),用于将立体声输入信号的第一和第二输入声道从时域变换到频域。
8.如权利要求1所述的装置,其特征在于,
所述操控信息产生器(110、210、340、440、640)经调适以依据第一信号指示值产生第一加权掩码,以及依据第二信号指示值产生第二加权掩码;以及
其中所述操控器经调适为,藉由应用第一加权掩码至组合信号的幅值以得到第一经修饰的幅值来操纵所述组合信号,以及藉由应用第二加权掩码至组合信号的幅值以得到第二经修饰的幅值来操控所述组合信号。
9.如权利要求8所述的装置,其特征在于,
所述装置进一步包括组合器(380、480、680),其经调适以组合第一经修饰的幅值与组合信号的相位值,以得到第一操控信号作为第一输出声道;以及
其中所述组合器(380、480、680)经调适以组合第二经修饰的幅值与组合信号的相位值,以得到第二操控信号作为第二输出声道。
10.如权利要求8所述的装置,其特征在于,
操控信息产生器(110、210、340、440、640)经调适以依据下列公式产生第一加权掩码GL(m,k)
<mrow>
<msub>
<mi>G</mi>
<mi>L</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msup>
<mrow>
<mo>(</mo>
<mfrac>
<mrow>
<msub>
<mi>E</mi>
<mi>L</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>E</mi>
<mi>L</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>E</mi>
<mi>R</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mi>&alpha;</mi>
</msup>
</mrow>
或者其中所述操控信息产生器(110、210、340、440、640)经调适以依据下列公式产生第二加权掩码GR(m,k)
<mrow>
<msub>
<mi>G</mi>
<mi>R</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<msup>
<mrow>
<mo>(</mo>
<mfrac>
<mrow>
<msub>
<mi>E</mi>
<mi>R</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msub>
<mi>E</mi>
<mi>L</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>E</mi>
<mi>R</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>m</mi>
<mo>,</mo>
<mi>k</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>)</mo>
</mrow>
<mi>&alpha;</mi>
</msup>
</mrow>
其中GL(m,k)指示时间频率解析单元(m,k)的第一加权掩码,其中GR(m,k)指示时间频率解析单元(m,k)的第二加权掩码,其中EL(m,k)是时间频率解析单元(m,k)的第一输入声道的信号指示值,其中ER(m,k)是时间频率解析单元(m,k)的第二输入声道的信号指示值,以及其中α为调谐参数。
11.如权利要求10所述的装置,其特征在于,
所述操控信息产生器(110、210、340、440、640)经调适以产生第一或第二加权掩码,其中所述调谐参数α为α=1。
12.如权利要求1所述的装置,其特征在于,
所述装置包括变换器单元(320、420、620)和组合信号产生器(310、410、610);
其中变换器单元(320、420、620)经调适以接收第一和第二输入声道,以及可将第一和第二输入声道从时域变换至频域,以得到第一频域输入声道和第二频域输入声道;
以及其中组合信号产生器(310、410、610)经调适以基于第一和第二频域输入声道来产生组合信号。
13.如权利要求1所述的装置,其特征在于,
所述装置进一步包括信号延迟单元(605),其经调适以延迟第一输入声道和/或第二输入声道。
14.一种可从至少两个输入声道产生至少三个输出声道的上混合器(700、800),包括:
用于依据权利要求1产生立体声输出信号(710、810)的装置,其经安排以接收上混合器(700、800)的输入声道中的两个作为输入声道;以及
组合单元(770、870),用于组合上混合器(700、800)的至少两个输入信号以提供组合声道;
其中上混合器(700、800)经调适以输出用于产生立体声输出信号(710、810)的装置的第一输出声道,或从用于产生立体声输出信号(710、810)的装置的第一输出声道导出的信号,作为上混合器(700、800)的第一输出声道;
其中上混合器(700、800)经调适以输出用于产生立体声输出信号(710、810)的装置的第二输出声道,或从用于产生立体声输出信号(710、810)的装置的第二输出声道导出的信号,作为上混合器(700、800)的第二输出声道;以及
其中上混合器(700、800)经调适以输出所述组合声道作为上混合器(700、800)的第三输出声道。
15.一种用于立体声低音扩展以从两个输入声道产生两个输出声道的装置(900),包括:
用于依据权利要求1产生立体声输出信号(910)的装置,其经安排以接收所述用于立体声低音扩展的装置(900)的两个输入声道作为输入声道;以及
组合单元(920、930),其用于组合所述用于产生立体声输出信号(910)的装置的至少一个输出声道与所述用于立体声低音扩展的装置(900)的至少一个输入声道,以提供组合声道;
其中所述用于立体声低音扩展的装置(900)经调适以输出所述组合声道或从所述组合声道导出的信号。
16.一种用于从具有第一输入声道和第二输入声道的立体声输入信号产生包括第一输出声道和第二输出声道的立体声输出信号的方法,包括:
依据第一输入声道的第一信号指示值和第二输入声道的第二信号指示值,来产生操控信息,其中通过将所述第一信号指示值和所述第二信号指示值用于计算第一加权掩码来确定所述操控信息,并且其中通过将所述第一信号指示值和所述第二信号指示值用于计算第二加权掩码来确定所述操控信息,所述第二加权掩码不同于所述第一加权掩码;以及
通过对组合信号应用所述第一加权掩码来生成所述第一输出声道;
其中所述组合信号依据所述第一输入声道和所述第二输出声道,其中所述组合信号是通过组合所述第一输入声道和所述第二输入声道所推导出的信号;以及
通过对所述组合信号应用所述第二加权掩码来生成所述第二输出声道。
17.一种用于编码操控信息的装置,包括:
信号指示计算单元(1010),用于确定立体声输入信号的第一声道的第一信号指示值,以及用于确定立体声输入信号的第二声道的第二信号指示值;
操控信息产生器(1020),其经调适可依据第一输入声道的第一信号指示值以及依据第二输入声道的第二信号指示值,来产生操控信息,其中所述操控信息产生器被配置成通过将所述第一信号指示值和所述第二信号指示值用于计算第一加权掩码来确定所述操控信息,并且其中所述操控信息产生器被配置成通过将所述第一信号指示值和所述第二信号指示值用于计算第二加权掩码来确定所述操控信息,所述第二加权掩码不同于所述第一加权掩码;以及
输出模块(1030),用于输出所述操控信息;
其中所述操控信息适用来通过对组合信号应用所述第一加权掩码来生成第一输出声道;
其中所述组合信号依据所述第一输入声道和所述第二输入声道,其中所述组合信号是通过组合所述第一输入声道和所述第二输入声道所推导出的信号;以及
通过对所述组合信号应用所述第二加权掩码来生成第二输出声道。
18.一种计算机可读存储介质,在所述计算机可读存储介质上存储有用于从具有第一输入声道和第二输入声道的立体声输入信号产生包括第一输出声道和第二输出声道的立体声输出信号的代码,所述代码包括:
用于依据第一输入声道的第一信号指示值和第二输入声道的第二信号指示值来产生操控信息的代码,其中通过将所述第一信号指示值和所述第二信号指示值用于计算第一加权掩码来确定所述操控信息,并且其中通过将所述第一信号指示值和所述第二信号指示值用于计算第二加权掩码来确定所述操控信息,所述第二加权掩码不同于所述第一加权掩码;以及
用于通过对组合信号应用所述第一加权掩码来生成所述第一输出声道的代码,其中所述组合信号依据所述第一输入声道和所述第二输出声道,其中所述组合信号是通过组合所述第一输入声道和所述第二输入声道所推导出的信号;以及
用于通过对所述组合信号应用所述第二加权掩码来生成所述第二输出声道的代码。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161486087P | 2011-05-13 | 2011-05-13 | |
US61/486,087 | 2011-05-13 | ||
EP11173101.4 | 2011-07-07 | ||
EP11173101A EP2523472A1 (en) | 2011-05-13 | 2011-07-07 | Apparatus and method and computer program for generating a stereo output signal for providing additional output channels |
PCT/EP2012/058435 WO2012156232A1 (en) | 2011-05-13 | 2012-05-08 | Apparatus and method and computer program for generating a stereo output signal for providing additional output channels |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103518386A CN103518386A (zh) | 2014-01-15 |
CN103518386B true CN103518386B (zh) | 2017-11-28 |
Family
ID=44582183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280022921.7A Active CN103518386B (zh) | 2011-05-13 | 2012-05-08 | 用于产生立体声输出信号以提供额外输出声道的装置、方法及计算机可读存储介质 |
Country Status (16)
Country | Link |
---|---|
US (1) | US9913036B2 (zh) |
EP (2) | EP2523472A1 (zh) |
JP (1) | JP5931182B2 (zh) |
KR (1) | KR101637407B1 (zh) |
CN (1) | CN103518386B (zh) |
AR (1) | AR086354A1 (zh) |
AU (1) | AU2012257865B2 (zh) |
BR (1) | BR112013029136B1 (zh) |
CA (1) | CA2835742C (zh) |
ES (1) | ES2544997T3 (zh) |
HK (1) | HK1196198A1 (zh) |
MX (1) | MX2013012999A (zh) |
PL (1) | PL2708041T3 (zh) |
RU (1) | RU2595541C2 (zh) |
TW (1) | TWI468031B (zh) |
WO (1) | WO2012156232A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101871234B1 (ko) * | 2012-01-02 | 2018-08-02 | 삼성전자주식회사 | 사운드 파노라마 생성 장치 및 방법 |
JP6355049B2 (ja) * | 2013-11-27 | 2018-07-11 | パナソニックIpマネジメント株式会社 | 音響信号処理方法、及び音響信号処理装置 |
US9928842B1 (en) | 2016-09-23 | 2018-03-27 | Apple Inc. | Ambience extraction from stereo signals based on least-squares approach |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
US10299039B2 (en) | 2017-06-02 | 2019-05-21 | Apple Inc. | Audio adaptation to room |
CN110556116B (zh) * | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001024577A1 (en) * | 1999-09-27 | 2001-04-05 | Creative Technology, Ltd. | Process for removing voice from stereo recordings |
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6268129A (ja) | 1985-09-18 | 1987-03-28 | Nissan Motor Co Ltd | 燃料タンクの燃料吸込装置 |
JPS63174000A (ja) | 1987-01-13 | 1988-07-18 | 石川島播磨重工業株式会社 | 放射性廃棄物の処分方法 |
JPS63174000U (zh) * | 1987-05-07 | 1988-11-11 | ||
JP3092149B2 (ja) * | 1990-08-09 | 2000-09-25 | 日本電気株式会社 | 4チャンネルサラウンドプロセッサ |
GB9103207D0 (en) | 1991-02-15 | 1991-04-03 | Gerzon Michael A | Stereophonic sound reproduction system |
US5333201A (en) * | 1992-11-12 | 1994-07-26 | Rocktron Corporation | Multi dimensional sound circuit |
JPH07212896A (ja) * | 1994-01-17 | 1995-08-11 | Mitsubishi Electric Corp | 音響再生装置 |
JP3976360B2 (ja) * | 1996-08-29 | 2007-09-19 | 富士通株式会社 | 立体音響処理装置 |
US7031474B1 (en) * | 1999-10-04 | 2006-04-18 | Srs Labs, Inc. | Acoustic correction apparatus |
WO2002007481A2 (en) | 2000-07-19 | 2002-01-24 | Koninklijke Philips Electronics N.V. | Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
TW569551B (en) * | 2001-09-25 | 2004-01-01 | Roger Wallace Dressler | Method and apparatus for multichannel logic matrix decoding |
WO2003075609A2 (en) * | 2002-03-07 | 2003-09-12 | Koninklijke Philips Electronics N.V. | User controlled multi-channel audio conversion system |
US7567845B1 (en) | 2002-06-04 | 2009-07-28 | Creative Technology Ltd | Ambience generation for stereo signals |
US7257231B1 (en) | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
WO2004005562A2 (en) | 2002-07-09 | 2004-01-15 | Pechiney Rhenalu | AlCuMg ALLOYS FOR AEROSPACE APPLICATION |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
MXPA06011396A (es) * | 2004-04-05 | 2006-12-20 | Koninkl Philips Electronics Nv | Metodos de codificacion y decodificacion de senales estereofonicas y aparatos que utilizan los mismos. |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US8019087B2 (en) | 2004-08-31 | 2011-09-13 | Panasonic Corporation | Stereo signal generating apparatus and stereo signal generating method |
JP2006100869A (ja) * | 2004-09-28 | 2006-04-13 | Sony Corp | 音声信号処理装置および音声信号処理方法 |
SG124306A1 (en) | 2005-01-20 | 2006-08-30 | St Microelectronics Asia | A system and method for expanding multi-speaker playback |
TWI313857B (en) * | 2005-04-12 | 2009-08-21 | Coding Tech Ab | Apparatus for generating a parameter representation of a multi-channel signal and method for representing multi-channel audio signals |
MX2007015118A (es) * | 2005-06-03 | 2008-02-14 | Dolby Lab Licensing Corp | Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion. |
EP1761110A1 (en) | 2005-09-02 | 2007-03-07 | Ecole Polytechnique Fédérale de Lausanne | Method to generate multi-channel audio signals from stereo signals |
JP4128591B2 (ja) | 2005-10-18 | 2008-07-30 | 有限会社ウォールストン | ワイドステレオ信号処理装置 |
KR100636252B1 (ko) * | 2005-10-25 | 2006-10-19 | 삼성전자주식회사 | 공간 스테레오 사운드 생성 방법 및 장치 |
TWI309140B (en) * | 2005-12-20 | 2009-04-21 | Fraunhofer Ges Forschung | Device and method for generating a multi-channel signal or a parameter data set |
US8619998B2 (en) * | 2006-08-07 | 2013-12-31 | Creative Technology Ltd | Spatial audio enhancement processing method and apparatus |
CN101529504B (zh) | 2006-10-16 | 2012-08-22 | 弗劳恩霍夫应用研究促进协会 | 多通道参数转换的装置和方法 |
US8064624B2 (en) * | 2007-07-19 | 2011-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for generating a stereo signal with enhanced perceptual quality |
US8107631B2 (en) | 2007-10-04 | 2012-01-31 | Creative Technology Ltd | Correlation-based method for ambience extraction from two-channel audio signals |
EP2082396A1 (en) | 2007-10-17 | 2009-07-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
US8103005B2 (en) | 2008-02-04 | 2012-01-24 | Creative Technology Ltd | Primary-ambient decomposition of stereo audio signals using a complex similarity index |
WO2010073187A1 (en) * | 2008-12-22 | 2010-07-01 | Koninklijke Philips Electronics N.V. | Generating an output signal by send effect processing |
JP5802753B2 (ja) * | 2010-09-06 | 2015-11-04 | ドルビー・インターナショナル・アクチボラゲットDolby International Ab | マルチチャンネルオーディオ再生のためのアップミキシング方法及びシステム |
-
2011
- 2011-07-07 EP EP11173101A patent/EP2523472A1/en not_active Withdrawn
-
2012
- 2012-05-08 PL PL12721243T patent/PL2708041T3/pl unknown
- 2012-05-08 CA CA2835742A patent/CA2835742C/en active Active
- 2012-05-08 JP JP2014510730A patent/JP5931182B2/ja active Active
- 2012-05-08 MX MX2013012999A patent/MX2013012999A/es active IP Right Grant
- 2012-05-08 RU RU2013155384/08A patent/RU2595541C2/ru active
- 2012-05-08 AU AU2012257865A patent/AU2012257865B2/en active Active
- 2012-05-08 ES ES12721243.9T patent/ES2544997T3/es active Active
- 2012-05-08 WO PCT/EP2012/058435 patent/WO2012156232A1/en active Application Filing
- 2012-05-08 EP EP12721243.9A patent/EP2708041B1/en active Active
- 2012-05-08 CN CN201280022921.7A patent/CN103518386B/zh active Active
- 2012-05-08 KR KR1020137029983A patent/KR101637407B1/ko active IP Right Grant
- 2012-05-08 BR BR112013029136-2A patent/BR112013029136B1/pt active IP Right Grant
- 2012-05-11 TW TW101116878A patent/TWI468031B/zh active
- 2012-05-11 AR ARP120101666A patent/AR086354A1/es active IP Right Grant
-
2013
- 2013-11-12 US US14/078,433 patent/US9913036B2/en active Active
-
2014
- 2014-09-19 HK HK14109453.5A patent/HK1196198A1/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001024577A1 (en) * | 1999-09-27 | 2001-04-05 | Creative Technology, Ltd. | Process for removing voice from stereo recordings |
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
Also Published As
Publication number | Publication date |
---|---|
BR112013029136A2 (pt) | 2017-10-17 |
EP2708041B1 (en) | 2015-06-17 |
RU2013155384A (ru) | 2015-06-20 |
KR20140017639A (ko) | 2014-02-11 |
JP2014517600A (ja) | 2014-07-17 |
CA2835742C (en) | 2018-01-09 |
TWI468031B (zh) | 2015-01-01 |
AU2012257865A1 (en) | 2013-11-21 |
HK1196198A1 (zh) | 2014-12-05 |
WO2012156232A1 (en) | 2012-11-22 |
CA2835742A1 (en) | 2012-11-22 |
US20140072124A1 (en) | 2014-03-13 |
BR112013029136B1 (pt) | 2022-09-20 |
TW201251481A (en) | 2012-12-16 |
EP2523472A1 (en) | 2012-11-14 |
AR086354A1 (es) | 2013-12-04 |
RU2595541C2 (ru) | 2016-08-27 |
EP2708041A1 (en) | 2014-03-19 |
CN103518386A (zh) | 2014-01-15 |
KR101637407B1 (ko) | 2016-07-20 |
ES2544997T3 (es) | 2015-09-07 |
AU2012257865B2 (en) | 2015-07-09 |
MX2013012999A (es) | 2014-01-31 |
US9913036B2 (en) | 2018-03-06 |
JP5931182B2 (ja) | 2016-06-08 |
PL2708041T3 (pl) | 2015-12-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103518386B (zh) | 用于产生立体声输出信号以提供额外输出声道的装置、方法及计算机可读存储介质 | |
CN101044794B (zh) | 用于双声道提示码编码方案和类似方案的散射声音整形的方法和设备 | |
CN105900455B (zh) | 用于处理音频信号的方法和设备 | |
CN101484935B (zh) | 用于编码和解码基于对象的音频信号的方法和装置 | |
JP5156386B2 (ja) | 空間音声のパラメトリック符号化のためのコンパクトなサイド情報 | |
JP5455647B2 (ja) | オーディオデコーダ | |
CN105075117B (zh) | 根据多个音频主干进行自动多声道音乐混合的系统和方法 | |
TW201810249A (zh) | 使用近場/遠場渲染之距離聲相偏移 | |
CN107851449A (zh) | 基于编码音频元数据的均衡 | |
CN105556992A (zh) | 将第一和第二输入声道映射至至少一个输出声道的装置,方法和计算机程序 | |
CN105659630A (zh) | 用于处理多媒体信号的方法和设备 | |
US9264838B2 (en) | System and method for variable decorrelation of audio signals | |
CN106537502A (zh) | 用于生成音频内容的方法和装置 | |
CN111724757A (zh) | 一种音频数据处理方法及相关产品 | |
Kim | Subjective evaluation of stereo-9.1 upmixing algorithms using perceptual band allocation | |
Adami et al. | Investigations Towards Plausible Blind Upmixing of Applause Signals | |
Christensen et al. | Stereo upmix design for shaping sound experiences | |
ACOUSTICS | AES 131st Convention Program | |
Keyes | The Dynamic Redistribution of Spectral Energies for Upmixing and Re-Animation of Recorded Audio | |
CN109416915A (zh) | 用于处理多声道音频信号的装置和方法 | |
Emulator | AES 136th Convention Program | |
Koenig | Surround Sound Track Productions Based on a More Channel Headphone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |