CN101341792A

CN101341792A - 使用两个输入声道合成三个输出声道的装置与方法

Info

Publication number: CN101341792A
Application number: CNA200580052379XA
Authority: CN
Inventors: 奥立弗·赫尔穆特; 于尔根·赫勒; 哈拉尔德·波普; 安德列亚斯·沃尔特
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2005-12-20
Filing date: 2005-12-20
Publication date: 2009-01-07
Anticipated expiration: 2025-12-20
Also published as: CA2632394C; AU2005339439B2; AU2005339439A1; PL1964442T3; JP4792086B2; HK1114994A1; EP1964442B1; BRPI0520802B1; DE602005019484D1; BRPI0520802A2; CN101341792B; ES2340784T3; WO2007071270A1; JP2009520419A; KR20080070066A; EP1964442A1; NO339830B1; ATE458364T1; CA2632394A1; IL191688A0

Abstract

为了使用两个立体声输入声道合成至少三个输出声道，分析(15)立体声输入声道以检测在两个输入声道中都出现的信号分量。信号发生器(16)可操作地将已检测信号分量的至少一部分引入到与意向扬声器方案中第二个扬声器相关联的第二声道(12b)，第二扬声器位于该扬声器方案中的第一和第三扬声器之间。然而，当已检测信号分量的完全馈送会引起限幅情况时，已检测信号分量的仅仅一部分被馈入作为真实中心声道的第二声道，剩余部分定位到作为虚构中心声道的第一和第三声道中。

Description

使用两个输入声道合成三个输出声道的装置与方法

技术领域

本发明涉及多声道合成器，特别地，涉及使用两个立体声输入声道生成三个或更多输出声道的设备。

背景技术

多声道音频材料在消费者家庭环境中正变得越来越受欢迎。这主要是由于以下事实：DVD上的电影提供5.1多声道声音，所以甚至家庭用户也频繁安装音频重放系统，其能够再现多声道音频。这种装置由譬如前端的3个扬声器L、C、R，后端的2个扬声器Ls、Rs，以及低频增强声道LFE组成，并提供较2声道立体声再现的若干众所周知的优势，譬如：

-改进的前端映像稳定性，即使由中心声道确定的最佳中心收听位置之外(更大的“甜点(sweet-spot)”＝最佳收听位置)

-增加了由后部扬声器创建的收听者的“参与(involvement)”感。

然而，存在譬如压缩盘(CD)上的大量遗留音频内容，其只由两个(“立体声”)音频声道组成。

为了在5.1多声道装置上重放两声道的遗留音频材料，有两种基本选择：

1.在L和R扬声器上分别再现左、右声道立体声信号，即以遗留方式将其重放。这种解决方法没有利用扩展的扬声器结构(中心和后端的扬声器)。

2.可使用将内容材料的两个声道转换为多声道信号的方法(这可“即时地(on the fly)”或凭借预处理而发生)，其使用所有的5.1扬声器并以这种方式从多声道装置的前述优势中获益。

解决方法#2明显较#1有优势，但包含一些问题，尤其关于两个前端声道(左和右＝LR)向三个前端声道的转换(多声道左、中和右＝L’C’R’)。

优良的LR向L’C’R’转换解决方案应满足以下需求：

1)为了在L’C’R’中重建类似但比LR重放情况中更稳定的前端映像，如果收听者在“甜点”处，则中心声道将再现通常被感知到来自左和右扬声器之间的中部的所有声音事件。此外，左前端位置处的信号和右前端位置处的信号将分别由L’C’和R’C’再现(见J.M.Jot and C.Avendano，“Spatial Enhancement of Audio Recordings”，AES 23^rdConference，Copenhagen，2003)。

2)由声道L’C’R’发射的声音能量的总和应与源声道LR的声音能量的总和相等，以实现L’C’R’与LR的相同的声音印象。假定所有再现声道中有相等的特性，这可说明为“声道L’C’R’的电能总和应与源声道LR的电能总和相等。”

由于需求#1，左和右声道的信号可混音为一个(单个)中心声道。如果左和右声道的信号是几乎相同的，即它们表示前端声级中部的虚构(phantom)声源，则这尤其适用。该虚构映像现在被中心扬声器生成的“真实”映像所替代。由于需求#2，此中心信号将携带左和右的能量的总和。如果左或右声道信号的电平接近声道可发送的最大幅度(＝0dBFS；dBFS＝dB满刻度(dB Full Scale))，则两声道电平的总和将超过最大电平，这可以表示为声道/系统(channel/system)。这通常会导致不期望的“限幅(clipping)”效应。

限幅情况显示于图6。图6示出由具有最大正阈值61a和最大负阈值61b的处理器所处理的信号60的时间波形。由处理数字信号的数字处理器的能力而定，最大正阈值和最大负阈值可以是+1和-1。或者，当数字处理器被用来表示整数形式的数时，最大正阈值将是对应于2¹⁵的32768，最大负阈值将是对应于-2¹⁵的-32768。

由于时间波形信号由采样序列表示，每个采样都是-32768与+32768之间的数字，所以容易看出，譬如对于某特定时间情况，当第一声道具有很高的值而且第二声道也具有很高的值且当这些很高的值相加在一起时，可得到更高的数字。理论上，由这种两声道加在一起得到的最大数字是65536。然而，数字信号处理器不能表示这么高的数字。相反，数字处理器只会表示等于最大正阈值或最大负阈值的数字。所以，在高于或等于最大正阈值或最大负阈值的数字由等于最大正阈值或最大负阈值的数字所替代以使得关于图6所示情况出现时，数字信号处理器执行限幅。在限幅时间部分62内，波形60不具有其自然(正弦)形状，而是变平或被限幅。当根据频谱观点估计此限幅波形时，可以清楚地得到，时域限幅导致由限幅时间部分62的开始和结束处的高梯度值引发的强谐波分量。

此“数字限幅”不涉及重放装置，即用以呈现音频信号的放大器和扬声器。然而，每个放大器/扬声器组合也只具有有限的线性范围，当被处理的信号超出此线性范围时，某种限幅也会发生，其可使用本发明的概念来避免。

在任何情况下，限幅的出现都在音频信号中引入重度失真，这会使被感知声音质量非常恶化。因此，必须避免限幅的出现。这甚至更多地由于以下事实：通过由例如5.1扬声器系统这种多声道结构重现立体声信号得到的声音改进与非常恼人的限幅失真相比是很小的。所以，当不能保证限幅不出现时，优选地只使用用于呈现立体声信号的多声道装置中的左和右扬声器。

存在现有技术解决方案来克服此限幅问题。

克服此问题的简单解决方案是按比例将所有声道均匀地缩减到一定电平，在该电平处没有声道信号(特别是中心信号)超过0dBFS界限。这可通过预定义的固定值来静态地完成。在这种情况下，固定值必须对于最坏情况同样有效，其中左和右声道具有最大电平。对于一般的LR向L’C’R转换，这会导致比原始立体声LR显著地更安静的L’C’R’版本，这是不期望的，特别是当用户在立体声与多声道再现之间切换时。该行为可在用作LR向L’C’R转换器的商业可用矩阵解码器(Dolby ProLogicII和Logic7 Decoder)处观察到。见DolbyPublication：“Dolby Surround Pro Logic II Decoder-Principles ofOperation”，

htp://www.dolby.com/assets/pdf/tech_library/209_Dolby_Surround_Pro_ Logic_II_Decoder_Principles_of_Operation.pdf或Griesinger，D.：“Multichannel Matrix Surround Decoders for Two-Eared Listeners”，101^stAES Convention，Los Angeles，USA，1996，Preprint 4402。

另一个简单解决方案是使用动态范围压缩以动态地(由信号而定)限制峰值信号，其有时也称为“限幅器(limiter)”。此方法的劣势是音频程序的真实动态范围不再现而是受到压缩(见Digital AudioEffects DAFX；Udo

Editor；2002；Wiley&Sons；p.99ff：“Limiter”)。

缩减(downscaling)问题是不期望的，因为与最初信号的电平相比它降低声音信号的电平或音量。为了完全避免限幅的任何的甚至理论上的出现，将会通过等于0.5的缩放因数对所有声道进行缩减。这会得到与原始信号相比的多声道信号的强烈降低的输出电平。当只收听此缩减的多声道信号时，可以通过增大声音放大器的放大来补偿此电平降低。然而，当在若干源之间时，(遗留)立体声信号将非常响亮地呈现给收听者，当使用放大器的相同放大设置重放时，多声道再现的设置将非常响亮地呈现给收听者。

因此，用户将必须考虑在从立体声信号的多声道表示切换到该立体声信号的真实立体声表示之前降低其放大器的放大设置，以避免伤害她或他的耳朵或装备。

使用动态范围补偿的另一现有技术方法有效地避免限幅。然而，音频信号本身被改变。因此，动态压缩导致不可靠的音频信号，即使当引入的伪信号不太恼人时，该不可靠音频信号从可靠性观点来说也是不可信的。

发明内容

本发明的目的是提供一种使用两个输入声道的多声道合成的改进概念。

此目的由依照权利要求1所述的合成装置、依照权利要求14所述的合成方法、依照权利要求15所述的计算机程序或依照权利要求16所述的三声道表示来实现。

本发明基于以下发现：为了克服限幅问题并仍实现由使用多声道装置中的三个或更多声道来重放立体声信号所带来的优势，中心声道照常被生成，即接收定位于左和右扬声器之间的中部的声音事件，其也称作“真实中心”呈现。然而，当真实中心进入限幅范围时，表示音频装置的中部事件的信号分量的仅一部分能量馈入中心声道。这些声音事件的剩余能量反馈到第一和第三(或左和右)声道或从开始就保持在那里。

因此，对于可能出现限幅的时帧，当两/三上混音(upmix)过程执行且无修改时，中心声道按缩减到低于或等于最大可能电平的电平且无限幅。然而，不能由中心声道重现的信号的遗失部分/能量可利用作为“虚拟中心”或“虚构中心”的左声道和右声道来再现。

在重放期间，真实中心和虚拟中心的信号的声学组合重新创建没有限幅的预期(intended)中心。真实中心和虚拟中心的这种“混合”得到立体声音频信号的改进的、更稳定的前端映像，即增大的甜点，虽然甜点不及根本没有虚构中心时那样大。然而，本发明的过程不具有任何限幅伪信号，因为由限幅问题引起的第二声道内所不能处理的剩余能量不会丢失，而是由原始的左和右声道呈现。

这里需要注意，对于任何情况，多声道装置中左和右声道的能量低于原始的左和右声道中的能量，因为中心声道的能量从左和右声道中提取。所以，依照本发明，即使当剩余部分的能量反馈到左和右输出声道时，也不会存在这些声道内的限幅问题。

本发明的其他优势是以某种方式执行本发明的信号生成，即在该方式下，在优选实施例中，生成的三个输出声道(以及可选地生成的附加输出声道，例如Ls、Rs、Cs、LFE、...)的总的电或声能量关于原始立体声信号的能量而保持。与呈现信号方式无关，即信号是使用只具有两个扬声器的立体声装置来重现还是使用具有多于两个扬声器的多声道装置来重现，可以保证相同的总响度。

此外，只有当限幅不可避免，即第二中心声道在这些情况下完全不变，其不受限幅影响，即当第二声道的采样值保持低于或只等于最大阈值时，本发明的信号生成和将声能分配到中心声道及左和右声道才是动态应用的。

此外，得到的“真实中心”和“虚构中心”的声组合产生距离很靠近最佳三声道配置的信号，所述最佳三声道配置没有限幅，或在其中容许没有任何最小/最大阈值的采样值的三个声道。所以，本发明的声音映像在优选实施例中，既与立体声输入信号相比并非在电平上有所不同，又不像使用限幅器或简单限幅器的情况下那样不可靠。

附图说明

本发明的优选实施例随后参照附图来解释，在附图中：

图1示出依照本发明的优选实施例用于合成上面声道的装置；

图2a示出具有后处理器的图1中的信号发生器的优选实施例；

图2b示出图2a中的后处理器的优选实现；

图3示出具有迭代上混音器控制器的本发明的信号发生器的又一实施例；

图4示出完全运行在参数域中的本发明的信号发生器的又一实施例；

图5示出可选地还具有环绕中心声道C_s的5.1声音系统的示例；

图6示出限幅波形的图解；

图7示出限幅前后的原始两声道输入信号和三声道输出信号的能量情况的示意图解；以及

图8示出优选的输入声道分析器。

具体实施方式

图1示出用于使用两个输入声道来合成三个输出声道的本发明装置的优选实施例，其中三个输出声道的第二个声道用于音频重放装置的扬声器，其位于接收第一输出声道和第三输出声道的两个扬声器之间。输入声道由10a指示，该声道可以是譬如左声道L，10b用于第二声道，其可以是右声道R。输出声道被指示为12a用于右声道，12b用于中心声道，12c用于左声道。可生成额外的输出声道，例如左环绕输出声道14a、右环绕输出声道14b和低频增强声道14c。对于这些声道的相应扬声器的设置显示在图5中。在这些扬声器12a、12b、12c、14a、14b中间的是甜点50。当收听者位于甜点内时，他或她将获得最佳声音印象。

另外，可增加中心环绕声道51C_s，其位于左环绕声道14a与右环绕声道14b之间。中心环绕声道51的信号可使用与计算中心声道12b的信号相同的过程计算。另外，本发明的方法因此也可应用于中心环绕声道的计算以避免中心环绕声道中的限幅。

必须注意，本发明的过程可用于每个音频声道群(constellation)，在其中使用用于重放装置中两个不同空间位置的两个输入声道，并且使用这两个输入声道生成三个输出声道，其中三个声道中的第二声道位于重放装置中两个额外的扬声器之间，向这两个额外的扬声器提供第一和第三输入声道信号。

图1中的本发明的合成装置包含输入声道分析器15，其用于分析两个输入声道以确定在两个输入声道中都出现的信号分量。在两个输入声道中都出现的这些信号分量可用于建立真实中心声道，即可通过图5中所示的中心声道C来呈现。典型地，立体声信号包含许多这种单声道信号分量，例如讲话者，或当考虑音乐信号时是位于管弦乐团前面因而位于观众前面的歌手或独奏乐器。

本发明的合成装置还另外包含时间和频率选择性的并依赖于信号的信号发生器16，其用于使用两个输入声道10a、10b和与已检测信号分量有关的信息来生成三个输出声道12a、12b、12c，所述已检测信号分量出现在如通过线路13提供的两个输入声道中。特别地，本发明的信号发生器可操作地将已检测信号分量至少部分地馈入第二声道。此外，当存在这种情况：已检测信号分量的全部馈入会导致超出最大阈值时，该发生器可操作地只将一部分已检测信号分量馈入第二声道。

因此，第二输出声道具有时间部分，其只包含部分已检测信号分量以避免限幅，而在第二输出声道的不同部分中，整个已检测信号分量已被馈入第二输出声道。剩余已检测信号分量包含在第一和第三输出声道中，所以，当这些声道通过例如图5中示出的扬声器装置来重现时，将形成“虚构中心”。

取决于本发明概念的实施，位于第二声道中的“部分”已检测信号分量、以及位于第一和第三声道中的剩余已检测信号分量可以是能量部分或频率部分或任何其它部分，从而第二声道只包含一部分已检测信号分量，并且不会具有高于最大阈值的任何值，因而不会引起任何限幅失真。

图2a示出图1的本发明的信号分析器16的优选实施例。特别地，在图2a的实施例中，信号分析器包含执行上混音过程的2-3-上混音器16，所述上混音过程由图1的输入声道分析器15控制。2-3-上混音器的输出L、R、C是上混音声道。然而，声道C可能受到限幅，因为声道C使用相加处理而生成，在该过程中来自左声道和来自右声道的信号分量相加在一起。

中心声道C输入到限幅检测器16d，所述16d向后处理器16c馈送，后处理器16c也接收有关已检测信号分量的信息。特别地，限幅检测器16b可操作地检查中心声道12c的时间波形。

取决于该实施，限幅检测器可以不同方式构造。当假定图2a信号发生器可处理具有高于预定最大阈值的数值的数时，限幅检测器16b仅检查时间波形以察看是否存在比后续处理级的最大阈值更大的数。当检测出这种情况时，通过激活线路16d激活后处理器16c以启动后处理，以使得中心声道的能量减小并且左和右声道的能量增大，从而三个输出声道12a、12b、12c最终由后处理器16c输出。因此，依照图2a实施例，LR向LCR的转换过程照常完成。分析内部第一级中心声道信号20b以检查：如果它必须输出为例如AES/EBU或SPDIF格式的外部信号，是否会出现限幅。当这会发生时，在后处理器16c中移去信号20b的一部分，从而得到经修改的中心声道信号12b，且改为分发到中间的左和右声道20a、20c作为“虚构中心”成分。后处理之后，中心声道信号12b再次低于0dBFS。

后处理器16c的优选实施例显示于图2b中。上混音器16a之后的中心声道20b输入到部分提取器25。该部分提取器接收有关已检测信号分量的信息13，并通过线路16d从限幅检测器接收控制信号，所述控制信号也可包含提取量的指示。备选地，每个迭代步骤的提取量可独立于任何出现的限幅而固定，而且可以应用迭代试验/误差过程，以逐步的方式提取越来越多的已检测信号分量，直到限幅检测器16b不再检测到任何限幅。之后，经修改的中心声道12b由部分提取器输出，对应于提取部分的剩余已检测信号分量在乘以0.5之后必须重新分配到由上混音器输出的左和右声道20c、20a。为此，后处理器包含：两个乘法器26，每个分支中均有一个；或在分支之前的单独的乘法器；以及左加法器27a和右加法器27b。

当在两输入声道中出现的信号分量的检测已经理想时，左和右声道20a、20c就不包含任何“虚构中心”。然而，通过将提取分量(乘以0.5之后)与这些声道相加，虚构中心与左和右声道相加。

随后，结合图3讨论本发明的又一实施例，具体为图1的信号发生器16的又一实施例。输入声道输入到可控2-3-上混音器，所述可控2-3-上混音器接收有关已检测信号分量的信息，用于在由迭代控制器30控制的第一迭代步骤中生成三个输出声道。第一步骤将等同于图2a中的上混音器操作，即中心声道20b可具有限幅问题。这种限幅情况将通过限幅检测器16b来检测。对照图2a实施例，限幅检测器16b以反馈方式通过上混音器控制线路31来控制上混音器16a，以特定方式改变上混音规则，从而生成的中心声道20b在由迭代控制器30控制的一个或更多个迭代步骤之后只接收所允许部分的已检测信号分量，从而不再有限幅出现。

因此，图3实施例示出迭代过程。在该迭代过程的第一通路中，照常进行上混音操作。在输出端，检测器16b检查限幅是否出现。当检测出限幅时，再次处理该时间帧，此时使用重映射过程，并使用重路由将中心信号能量的一部分重路由到左和右声道作为虚构中心成分。

图4实施例完全在参数域中操作。为此，提供上混音参数计算器40，其连接到参数变换器41。另外，提供限幅检测器42，其可操作地检查原始左和右声道或经计算的上混音器参数，以查明在前向(straight forward)上混音过程之后是否会出现限幅。当限幅检测器42检测到限幅危险时，它通过控制线路44来控制参数变换器41，以提供已变换的上混音参数，所述参数而后被提供到前向上混音器16a，而上混音器16a生成第一、第二和第三输出声道，以使第二声道中不出现限幅，并且对于某时帧(在其中限幅检测器42最初检测出限幅问题)，左和右声道12c和12a具有虚构中心成分。

对照图2和图3的实施例，本发明的过程基于处理参数来执行，所述处理参数用于从输入立体声信号导出输出信号20a、20b、20c或12a、12b、12c。因此为了提供仍具有较低计算复杂性的实施，限幅检测和信号电平的处理或其一部分基于所述处理参数。这与图2和图3实施例形成对照，其中本发明的过程对实际音频声道信号而执行，所述实际音频声道信号在可能的限幅被检测之后已针对中心声道而创建。

本发明的限幅检测/控制可通过后处理来完成。因此，根据本发明的概念来分析和修改意向(intended)转换参数，以在实际输出音频信号合成之后提供限幅。控制参数变换器41的备选方式是通过迭代方式。分析意向转换参数。在真实音频信号合成后，当限幅可能出现时，修改转换参数。之后，再次启动该过程，最后，在没有任何限幅并且真实中心和虚构中心成分在相应声道中的情况下，合成输出声道信号。

随后，将讨论输入声道分析器的优选实现。为此，参考图8，其示出这种优选输入声道分析器15。首先，使用加窗块80来生成彼此相随的并发(subsequent)或重叠(overlapping)帧，以便在块80的输出端，在线路81a上存在左声道值的块，在线路81b上存在右声道值的块。之后，对每个块单独执行频率分析。为此，为每个声道提供频率分析器82。

频率分析器可以是用于生成时域信号的频域表示的任何设备。这种频率分析器可包含短时间傅立叶变换、FFT算法、或MDCT变换或任何其他变换设备。备选地，频率分析器块82也可包含子带滤波器组，用于根据输入信号值的块来生成例如32个子带频道或更高或更低数目的子带频道。取决于子带滤波器组的实施，成帧设备80和频率分析块82的功能可在单独的数字实现的子带滤波器组中实现。

之后，如设备84所指示，执行逐频带的互相关。因此，互相关器确定相应频带之间的互相关度，所述相应频带即具有相同频率指数(frequency index)的频带。由块84确定的互相关度可具有介于0和1之间的值，其中0指示不相关，其中1指示完全相关。当设备84输出低互相关度时，这意味着各个频带中的左和右信号分量彼此不同，从而该频带不包含在两个频带中都出现的信号分量，其应当被插入中心声道。然而，当互相关度较高、指示两个频带中的信号彼此非常相似时，则这个频带具有出现在左和右声道中的信号分量，从而这个频带应当被插入中心声道。

用于判定在诸频带中的信号是否彼此相似的又一标准是信号能量。所以，本发明的输入声道分析器的优选实施例包含逐频带的能量计算器85，其计算每个频带中的能量并输出能量相似度，所述能量相似度指示相应频带中的能量彼此相似还是彼此不同。

设备85输出的能量相似度和设备84输出的互相关度均被输入最后的判定级86，其得出结论：在特定帧中，特定频带i是否在两个声道中都出现。当判定级86确定信号在两个声道中都出现时，则该信号部分馈入中心声道以生成“真实中心”。

图8示出用于实现输入声道分析器的实施例。另外的实施例在本领域中是公知的，例如在“Spatial enhancement of audio recordings”，Jotand Avendano，23^rd International AES Conference，Copenhagen，Denmark，May 23-25，2003中阐述。特别地，分析两个声道以发现这些声道中信号分量的其他方法包括统计或分析的解析方法，例如主分量分析或独立子空间分析或在音频分析领域内公知的其他方法。所有这些方法的共同点是：它们检测在两个声道中都出现的信号分量，该信号分量应当被馈入中心声道以生成真实中心。

随后，参考图7以示出由附图中的2-3上混音器16a实现2-3上混音过程前后的能量情况。图7中在70处示出的左输入声道L具有特定的能量。在这个示例中，两立体声输入声道的右输入声道具有如71所示的不同的(较低的)能量。假定声道分析器已查明存在在两声道中都出现的信号分量。在两声道中都出现的这些信号分量具有如图7中72所示的能量。当全部能量72馈入如73所示的中心声道时，中心声道的能量将高于能量界限，其中所述能量界限至少粗略地示出：具有该高能量的信号具有高于幅度最大阈值的幅度值。所以，能量72中仅有一部分输入真实中心，而超过的部分均匀地(重新)分配到已合成的左和右声道L’和R’，如箭头76所示。

在此上下文中，需要注意，存在不同的方式将能量从中心声道重新分配回到左和右声道或用于将恰当量的能量从原始左声道和原始右声道引入中心声道。例如，可以通过特定的缩减因数对所有已检测信号分量进行缩减，并将缩减的信号引入中心声道。当应用频率选择性分析时，这对于每个频带中的信号分量具有相同的结果。备选地，也可执行逐频带的能量控制。这意味着当已检测到具有已检测信号分量的例如10个频带时，可只将5个频带引入中心声道，并将其余5个频带留在左和右声道中以减小中心声道中的能量。

取决于本发明的方法的特定实施需求，本发明的方法可在硬件或软件中实现。可使用数字存储媒体，尤其是在其上存储电可读控制信号的盘或CD来实现，所述盘或CD可与可编程计算机系统合作以执行本发明的方法。所以一般地，本发明是一种具有存储在机器可读载体上的程序代码的计算机程序产品，当该计算机程序产品在计算机上运行时，所述程序代码被配置用于执行本发明的方法。换句话说，本发明还是一种具有程序代码的计算机程序，当该计算机程序在计算机上运行时，所述程序代码用于执行本发明的方法。

Claims

1.一种用于使用两个输入声道(10a，10b)来合成三个输出声道(12a，12b，12c)的装置，其中所述三个输出声道的第二声道可馈入意向音频呈现方案中的扬声器，所述扬声器位于可被馈送所述第一输出声道和所述第三输出声道的两个扬声器之间，所述装置包含：

分析器(15)，用于分析所述两个输入声道，以检测在所述两个输入声道中都出现的信号分量；以及

信号发生器(16)，用于使用所述两个输入声道(10a，10b)来生成所述三个输出声道(12a，12b，12c)，其中所述信号发生器可操作地：

将已检测信号分量至少部分地馈入所述第二声道(12b)，以及

当所述已检测信号分量的完全馈送导致超出所述第二声道的最大阈值(61a，61b)时，只将已检测信号分量的一部分馈入所述第二声道(12b)。

2.依照权利要求1所述的装置，其中所述信号发生器(16)包含：

2-3上混音器(16a)，用于生成三个中间声道，其中所述第二声道包含所述已检测信号分量；

限幅检测器(16b)，用于检测具有高于所述最大阈值的幅度的所述第二声道的一部分；以及

后处理器(16c)，用于从由所述限幅检测器检测的一部分的所述第二声道中移去所述已检测信号分量的一部分，并用于将与所述移去部分相对应的信号与所述第一声道和所述第三声道相加。

3.依照权利要求1或2所述的装置，其中所述信号发生器(16)包含：

2-3上混音器(16a)，用于生成至少第二中间声道(12b)，所述第二中间声道包含至少所述已检测信号分量的一部分；

2-3上混音控制器(30，31)，用于控制所述三个输出声道的生成，使得所述已检测信号分量的仅仅一部分被馈入所述第二声道，并且所述信号分量的剩余部分保持在所述第一和所述第三输出声道中。

4.依照前述权利要求中任何一个所述的装置，其中所述信号发生器(16)包含：

限幅检测器(42)，用于确定所述输入声道中存在限幅可能性的一部分；

2-3上混音器(16a)，用于生成三个中间声道，其中第二中间声道包含所述已检测信号分量的至少一部分；以及

控制器(41)，用于控制所述2-3上混音器(16a)，从而控制用于对所述限幅检测器确定的部分进行上混音的生成参数，以使得所述第二声道总是具有低于或等于所述最大阈值的幅度。

5.依照前述权利要求中任何一个所述的装置，其中所述信号发生器(16)可操作地生成所述三个输出声道，以使得对于特定时期，所述三个输出声道和潜在生成的额外的输出声道的总能量等于所述两个输入声道的电能或声能。

6.依照前述权利要求中任何一个所述的装置，其中所述信号发生器(16)可操作地生成所述第二输出声道，以使得馈入所述第二声道的所述已检测信号分量的所述部分尽可能大，从而仅包含所述已检测信号分量的所述部分的所述第二输出声道的能量总是具有低于或等于所述最大阈值(61a，61b)的最大幅度。

7.依照前述权利要求中任何一个所述的装置，其中所述信号发生器(16)被适配，使得不在所述第二声道中的所述已检测信号分量的剩余部分(73)被包含在所述第一和所述第三声道中。

8.依照前述权利要求中任何一个所述的装置，其中所述最大阈值(61a，61b)是由所述合成装置或连接到所述合成装置的数字或模拟处理设备所确定的满标度幅度。

9.依照权利要求8所述的装置，其中所述最大阈值(61a，61b)等于信号时域波形的最大容许正或负采样值。

10.依照前述权利要求中任何一个所述的装置，其中所述分析器(15)可操作地确定(84)所述第一输入声道的至少一部分和所述第二声道之间的互相关度，并检测(86)具有高于相似性阈值的互相关度的部分。

11.依照前述权利要求中任何一个所述的装置，其中所述分析器(15)可操作地检测(85)所述第一声道的一部分和所述第二声道的一部分的能量，并检测(86)如下声道部分：这些部分具有相等的能量，或其能量差小于等同性阈值。

12.依照前述权利要求中任何一个所述的装置，其中所述分析器(15)和所述信号发生器(16)可操作地执行频率选择性或时间选择性分析和合成。

13.依照前述权利要求中任何一个所述的装置，其中所述第一和第二声道是音频信号的立体声表示的左声道(L)和右声道(R)，以及

其中所述三个输出声道是前端左声道(L’)、中心声道(C’)和前端右声道(R’)，或后端左声道(L_s)、后端中心声道(C_s)和后端右声道(C_s)。

14.一种使用两个输入声道(10a，10b)来合成三个输出声道(12a，12b，12c)的方法，其中所述三个输出声道的第二声道(12b)可馈入意向音频呈现方案中的扬声器，所述扬声器位于可被馈送所述第一输出声道和所述第三输出声道的两个扬声器之间，所述方法包括：

分析(15)所述两个输入声道，以检测在所述两个输入声道中都出现的信号分量；以及

使用所述两个输入声道来生成(16)所述三个输出声道，其中所述生成步骤可操作地：

将已检测信号分量(72)至少部分地馈入所述第二声道，以及

当所述已检测信号分量的完全馈送导致超出所述第二声道的最大阈值时，只将已检测信号分量的一部分馈入所述第二声道。

15.一种计算机程序，用于：当其运行在计算机上时，执行依照权利要求14所述的合成方法。

16.一种两声道输入信号(10a，10b)的三声道表示(12a，12b，12c)，其中所述三声道表示(12a，12b，12c)的第二声道(12b)可馈入意向音频呈现方案中的扬声器，所述扬声器位于可被馈入所述三声道表示中的所述第一输出声道(12a)和所述第三输出声道(12c)的两个扬声器之间，所述三声道表示包括：

具有时间部分(62)的所述第二声道(12c)，在所述两个输入声道中都出现的信号分量(72)的仅仅一部分存在于所述时间部分中，以及

具有所述信号分量的剩余部分(73)的所述第一声道(12a)和所述第三声道(12c)，所述剩余部分不包含在所述时间部分(62)中的所述第二声道之中。

17.依照权利要求16所述的三声道表示，其存储在计算机可读介质上。