CN1278996A - 5-2-5矩阵编码器和解码器系统 - Google Patents

5-2-5矩阵编码器和解码器系统 Download PDF

Info

Publication number
CN1278996A
CN1278996A CN98810913A CN98810913A CN1278996A CN 1278996 A CN1278996 A CN 1278996A CN 98810913 A CN98810913 A CN 98810913A CN 98810913 A CN98810913 A CN 98810913A CN 1278996 A CN1278996 A CN 1278996A
Authority
CN
China
Prior art keywords
signal
output
channel
decoder
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98810913A
Other languages
English (en)
Other versions
CN1214690C (zh
Inventor
戴维·H·格里辛格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LECKHIKON Inc
Original Assignee
LECKHIKON Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LECKHIKON Inc filed Critical LECKHIKON Inc
Priority claimed from US09/146,442 external-priority patent/US6697491B1/en
Publication of CN1278996A publication Critical patent/CN1278996A/zh
Application granted granted Critical
Publication of CN1214690C publication Critical patent/CN1214690C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Error Detection And Correction (AREA)

Abstract

用于将两个输入声道上的立体声信号转换为多输出声通信号,例如中央、左前、右前、左侧、右侧、左后、和右后声道信号的一种声音再现系统,所说立体声信号可以利用一种相位/幅值影片矩阵编码器从4或5声道原始录音进行定向编码,这种信号包括至少一个借助于相位和幅值编码装置编码的分量和至少一个没有定向编码但是在两个输入声道中不同的分量,该系统包括用于增强所需方向上输入信号的定向编码分量和降低这些信号在与编码方向不相关声道中的强度的解码装置,同时保持对应的左声道与右声道之间的最大分隔和在各个输出声道中输入声道的非定向编码分量的总能量,使得记录在右输入声道上的乐器继续留在输出声道的右侧,记录在左输入声道上的乐器继续留在输出声道的左侧,所有输出声道中所有乐器的视在响度保持相同,而与所说输入信号的定向编码分量的方向无关;该系统还包括一些电路,以增大解码器中非相关的左侧和右侧输入的分隔,改善对于侧面和后部之间视在运动再现效果,补偿声场前部象限中信号增大,和当其它方向控制信号改变时限制每个方向控制信号的最大偏差。

Description

5-2-5矩阵编码器和解码器系统
本申请基于美国临时专利申请No.60/058169,其发明名称为“5-2-5矩阵编码器和解码器系统”,申请日为1997年9月5日,该申请是美国专利申请No.08/742460的增补申请,其发明名称为“具有最大横向分隔的多声道有源矩阵编码器和解码器”,申请日为1996年11月1日,而该申请又为美国专利申请No.08/684948的增补申请,其发明名称为“具有最大横向分隔的多声道有源矩阵声音再现系统”,申请日为1996年7月19日。
本发明涉及声音再现系统,该系统将一对立体声的输入音频信号解码为多声道输出信号,经过适当放大之后由设置在听众周围的同样数目的扬声器予以再现。
更具体地说,本发明涉及创建具有最佳音质的解码矩阵的一套改进的设计标准及其解决方案,其中所说解码矩阵在立体声信号的左声道分量和右声道分量之间具有较大分隔,同时不论输入音频信号中定向编码分量的方向如何,都使非定向的编码分量保持在一个恒定的声级。
此外,本发明涉及将多声道音频信号解码为双声道,以便利用本发明的解码器予以再现。特别是,本发明涉及一种5-2-5矩阵编码器和解码器系统的改进的矩阵系数。
用于将一对立体声的左声道和右声道输入音频信号解码为多声道输出信号的装置通常被称作环绕声解码器或处理器。环绕声解码器通过将所说的左声道和右声道输入音频信号按照不同的比例组合而生成多声道,即N声道输出信号。所说输入音频信号的多种组合可以利用一个N行2列矩阵以数学方式来表达,其中包含2N个系数,每个系数都与在一个特定输出信号中所包含的左声道输入音频信号或右声道输入音频信号的比例相关。
在所说矩阵为无源矩阵的情况下,所说矩阵系数可以是固定不变的,而在所说矩阵为有源矩阵的情况下,所说矩阵系数在一个或多个控制信号的限定下随时间变化。解码矩阵中的系数可以是实数或复数。在实践中,复数系数要求使用精确的相位正交电路,这种电路十分昂贵,所以,现在的大多数环绕声解码器不使用它们,因而所有的矩阵系数都是实数。在本专利申请中所述的大部分实施例中,矩阵元也都是实数。实数系数的实现成本低廉,并且最佳的是用于对利用本专利所述的有源编码器编码的5声道影片进行解码。
但是,当对包含利用诸如在本申请中所述的无源编码器编码的5声道原始信号的影片进行解码时,实数系数就不是最佳的,并且在对利用现有技术中的标准4声道编码器制成的影片进行解码时也不是最佳的。能够最佳地解码这类影片的改进的解码器设计也有披露。尽管所披露之技术方案只是解码器输入信号的相位校正器,其校正效果也可以通过使矩阵元变为复数而实现。
在被定义为其中所有系数均为常数的一个无源矩阵,诸如杜比环绕声矩阵中,通过适当选择系数可以实现若干理想特性。这些特性包括:
利用标准编码器编码的信号可以利用具有相同响度的一个无源矩阵解码器与它们的编码方向无关地予以再现。
不具有特定编码方向的信号,即解相关信号,例如录制的音乐信号,其进入解码器的两路输入信号不具有相关性,可以以相同的响度在所有的输出声道中再现。
如果所说输入信号由定向编码信号分量与解相关信号分量组合而成,则当定向编码信号分量的编码方向变化时,解相关信号分量的响度或视在分隔都不改变。
无源解码器的缺点是输入信号中定向分量和解相关分量的分隔都不是最佳的。例如,预定来自前部中心的信号也在左前输出声道和右前输出声道中再现,并且通常只具有3dB的声级差。所以,大多数现代解码器根据主要声源的视在方向适当改变矩阵系数,即它们是有源的,而不是无源的。
按照最初的杜比环绕声解码器格式,只产生一个后声道输出信号,这个信号通常在一个以上的扬声器中再现,所有这类扬声器都是以并行方式驱动的,使得在后声道中不存在左右分隔。但是,在沿相反方向编码的信号之间存在较大分隔。
以往的专利已经公开了用于将立体声音频信号对转换成多声道输出信号的有源矩阵环绕声解码器的许多方面的内容。这些现有技术披露了如何从所说立体声信号对的左右声道分量的幅度比值的对数,以及这些幅度之和与幅度之差之间的比值的对数确定一个定向编码信号分量的视在方向。在本申请中采取了这个算法,以及由此或以其它方式导出的能够平滑定向控制信号的许多算法。我们假定这两个方向控制信号具有可以使用的形式。为了本发明的目的,可以从记录在数字音频信号一个副声道上的方向信息获取这些方向控制信号。
本发明涉及这些方向控制信号在控制有源矩阵方面的应用,即在两个输入端上接收信号,并根据定向控制信号按照适当变化的比例将它们分配到多个输出声道中。
在Scheiber的美国专利US-3959590中给出了这种矩阵的一个简单的例子。另一种常用的矩阵是Mandell在美国专利US-5046098中所述的矩阵。在Griesinger的美国专利US-4862502中详细地介绍了一种四输出的矩阵,而对于这种矩阵完整的数学描述以及对于一种6输出矩阵的数学描述公开在Griesinger的美国专利US-5136650中。在Fosgate的美国专利US-5307415中记载了一种不同的6输出矩阵。所有这些现有技术中的矩阵都在上述方向控制信号的控制下将输入音频信号分配到各个输出声道中。
这些矩阵中每一个都有所不同,但是在各种情况下每个输出信号都是由两个输入信号之和构成的,并且每个输入信号首先已经乘以一个系数。因此,只要知道每个输出信号的两个系数值以及这些系数作为提供上述方向信息的方向控制信号的函数如何变化,就能够完全限定现有技术中的每个矩阵。这两个系数是一个N乘2矩阵的矩阵元,其中N为输出声道的数目,它完全限定了解码器的特征。在大部分现有技术文献中没有明确地表述这些矩阵元,但是从所给出的说明中可以推断出它们。在具体实施例中,也能够容易地测得它们。
1992年8月4日授予Griesinger的美国专利US-5136650给出了每个矩阵元与方向控制信号之间的完整函数关系。
自从上述的Griesinger的专利被授予以来,电影工业已经建立了一种“5加1”分立声音标准。许多影院版本和某些家庭版本利用包含5个独立的全带宽音频声道,即中央声道、左前声道、右前声道、左后声道和右后声道,和用于产生非常低频效果的一个缩减带宽的第6音频声道的声迹制成。再现这些声迹需要特殊的数字硬件将所说声道信号分隔和解压缩为所说的5+1输出声道。但是,以前发行的影片胶片和录象存在非常大的选择度,它们应用双声道声迹矩阵编码格式,即模拟和数字格式。这种声迹是在混声过程中使用标准的四声道至双声道编码器进行编码的。
虽然Griesinger和其他人的早期研究已经利用复杂的各个信号之和来表述解码器的输出:即利用输入信号、它们的和、和它们的差,以及在通过由方向控制信号控制的可变增益放大器之后的同样四个信号,但是仍然能够汇集每个输出信号与特定输入相关的项,从而以闭合形式完整地表述所说矩阵,使得能够以数字或模拟硬件分量实现所说的解码器。
在一个标准影片解码器中,当存在一个受到强烈控制的信号如对话时,就在前部声道中施加一个增大的电压。这种方式相对于在分立的5声道影院系统中的这些信号之间的平衡扰乱了这些信号与背景效果或音乐之间的平衡。于是需要这里所述的一种改进的有源编码器校正所说受到强烈控制的前部信号与音乐之间的平衡。还需要对于左侧和右侧信号同时改进编码器和解码器的性能。解码器中的其它改进是限制方向控制信号的急剧变化的影响,以对其中的迅速变化提供较好的动态响应。
此外,本发明还对上文中所引用的Griesinger以前的美国专利中的解码器作了进一步的改进。
本发明涉及具有使其音质性能最佳的某些特性的有源矩阵的实现。
该发明包括一种具有可变矩阵值的环绕声解码器,其构成方式使得能够减小输出信号中在预定方向再现时不直接涉及的那些定向编码音频分量;而增强输出信号中在预定方向再现时直接涉及的那些定向编码音频分量,以便使这些信号维持恒定的总功率;同时与定向传播信号无关地使非定向信号的左声道和右声道之间保持较大的分隔;并且使定义为非定向信号的总音频功率量级的响度有效地保持不变,而不考虑是否存在定向编码信号,以及如果存在的话,它们的预定方向。
在一个优选实施例中,设置了一个环绕声解码器用于将包含定向编码分量和非定向编码分量的一对左右音频输入信号再分配到多个输出声道,以通过环绕听众所在区域的多个扬声器再现,所说解码器还与用于确定所说的左右音频信号的方向信息的电路结合,并由此产生至少一个左至右定向传播信号和中央环绕定向传播信号。
所说解码器包括用于延迟各个左右音频输入信号以提供延迟的左右音频信号的延迟电路;数量为输出声道数目两倍的多个乘法器,它们成对配置,每对中的一个第一元件接收所说的延迟左声道音频信号,一个第二元件接收延迟的右声道音频信号,每个乘法器将其输入音频信号乘以一个可变矩阵系数以提供一个输出信号;所说可变矩阵系数由所说定向传播信号中的一个或两个控制。还设置有多个加法器,每个加法器对应于多个输出声道中的一个,每个加法器接收一对乘法器的输出信号,并在其输出端产生所说多个输出信号之一。所说解码器所具有的可变矩阵值这样构成,使得能够减小输出信号中在预定方向再现时不直接涉及的定向编码音频分量,而增强输出信号中在预定方向再现时直接涉及的定向编码音频分量,从而使这些信号的总功率保持不变;同时与定向传播信号无关地使非定向信号的左声道分量与右声道分量之间保持较大的分隔,并且不论是否存在定向编码信号,以及如果存在的话,与其预定方向无关地使定义为非定向信号的总音频功率电平有效地保持恒定。
本发明还包括改进的有源编码器实施例,该实施例校正由于在标准影片解码器中产生的前部信号的电平升高而受到强烈控制的前部信号与去相关音乐信号之间的平衡,当不相关的左右声道输入信号输入到所说编码器中时,该编码器还增大了编码器输出信号之间的分隔。本发明还包括影片解码器有关左右声道编码信号的改进性能。解码器中的进一步改进涉及定向控制信号中急剧变化的影响和限制较慢变化信号,以提供对于迅速变化信号较好的动态响应。
虽然首先以模拟实施例描述本发明,但是本发明的一个优点就是它可以用数字信号处理器实现。
本发明的一个优点是所说解码矩阵的设计能够使所有输出声道中的左右分隔较大。
本发明的另一个优点是它能够与主要编码信号的方向无关地保持所说的较大分隔。
本发明的再一个优点是能够与主要编码信号的方向无关地使所有非编码的解相关信号的总输出能量保持不变。
本发明的又一个优点是它能以接近地匹配5+1声道分立声迹版本中声音的方式再现按照常规方法编码的声迹。
本发明的再另一个优点是它提供一个编码为5声道声迹中2个声道的简单的无源矩阵,该矩阵可解码为与原始的5声道主观差别非常小的5个或更多个声道。
本发明的又另一个优点是它提供一种有源编码器,其相对于左右环绕声输入信号具有比用无源5声道编码器更好的性能。
虽然当采用有源5声道编码器时本发明的解码器工作性能最佳,本发明的另一个优点是利用一个附加的相位校正电路,它还可以最佳地再现利用现有技术的标准4声道无源编码器或作为本发明一个方面的5声道无源矩阵编码器编码的电影声迹。
本发明的有源矩阵编码器的一个优点是它能够对受到强烈控制的前部信号与非定向音乐之间的平衡实现动态控制,以补偿在标准影片解码器中施加到这些受控信号上的升压。
所说编码器的另一个优点是当利用标准影片解码器解码时,它能够使左声道和右声道信号的分隔同时得到提高。
本发明解码器的一个优点是当一个信号在听众任一侧生成时,它能够使前部扬声器相对于后部扬声器产生更大的声级变化,改善了这些信号源的视在运动。
根据本发明构成的解码器的另一个优点是当两个定向传播信号中的一个迅速变化时,能够限制另一个的绝对值,从而较好地再现动态效果。
更具体地说,本发明涉及对于前文所述在若干专利中公开的适当改变的矩阵系数导出方式的改进,上述专利包括Griesinger的美国专利US-4862502(1989)、US-5136650(1992)、Griesinger在1996年7月提交的美国专利申请No.08/684948、和他在1996年11月提交的美国专利申请No.08/742460、以及在1997年9月提出的临时专利申请。以往所使用的系数是在被称为1.11版的解码器中实施的。本发明包括对于在1996年7月19日提出的在先专利申请No.08/684948中导出的系数的两种主要改变。第一种是对于后部声道的“TV矩阵”校正的改变。当所说定向传播沿后侧方向时没有变化,但是发现,当定向传播方向朝前时如果使后部输出电平保持降低3dB效果较好。当控制信号的绝对值|lr|从零上升到22.5度时,输出电平回升到初始电平,但是与控制信号|cs|的值无关。这种改变在有关TV矩阵校正的一节中讲述,并且图示在有关LRL和LRR的校正图中。这种校正的一个优点是当所说定向传播发生在向前方向时,后部声道的相对声级只有较小的变化,从而实现更加自然和平滑的解码。
第二种改变在于对前部声道和中央声道的处理。对于1.11版解码器的全面试听表明在确定中央声道的处理时需要考虑所有声道的功率。在先前的专利申请中有关中央声道一节中的数学表述已经被修改以反映这种改变。前提是在所说解码器输出的总声音功率中应当保持所说编码器的中央输入声道中的功率与其它声道中的功率的比值。中央声道的改变要求在实现LRL矩阵元时采用不同的运算策略。这里所给出的运算策略在数学上是简洁的,但是包含了除法运算。使用了一个两维查阅表来代替这个除法运算。具体地说,本发明包括对于在上述三个专利和专利申请中导出的系数值的下述改进。
第一,在接近cs=0边界的左后象限中的LRL矩阵元中加入内插值。
第二,校正所说左后象限中沿所说lr=0边界的LRR矩阵元中的软件误差。
第三,增加左后象限中LFL和LFR矩阵元的复杂性,从而从所说左前输出信号中消除定向传播左后输出的输入信号。
第四,校正所说LFL和LFR矩阵元,使得它们沿从左侧至中央和从右侧至中央的边界遵循sin和cos曲线,但是保持沿所说lr=0轴的增强。
第五,对于左前象限中的LFL和LFR矩阵元重新进行数学计算分析。重新设计(其超过1991年的专利)的目的是使矩阵元平方之和沿cs=0轴等于1。本发明的一个优点是减小由于声源定向传播引起的总功率的不利变化。
第六,包括一个重新设计的中央声道增强功能,它按照比1.11版解码器低的速度增强。按照本发明的这个方面,一个优点是已经在试听的基础上仔细地选择了中央声道增强功能,以使得对于在左右主扬声器与中央扬声器之间的声音或对话的运动具有最小的灵敏度,而使与所说声音一起存在的乐器的左右分隔度最大。
第七,增加一个特定函数CF,其取代了以往使LFR沿lr=0轴的增强,并使之与所说轴相交,该交点使得在所说解码器的输出信号的功率和中保持输入编码器的信号中央声道分量功率与输入编码器的信号总功率的比值。本发明这一方面的一个优点是这个方法使得音乐声和影片中的对话具有与在它们编码之前所处环境一致的解码环境中相同的平衡度。这种方法还保持了在最初为双声道放音而混合的录音中的平衡。该新函数CF保持接近于零-就是说当形成所说左前输出信号时没有从所说解码器的左声道输入中减去解码器的右声道输入,并且这个低值一直保持到cs达到向前大约30度为止。随着所说控制信号cs在这个范围内增加,中央声道电平首先迅速上升到比杜比前向逻辑值大约低3dB的一个值,然后保持不变。随着cs增大超过30度,所说中央电平迅速上升到杜比前向逻辑所使用的同一最大值。所说CF函数也在这个范围内急剧减小,增大减数,并从所说左前和右前输出中消除中央分量。当控制信号lr的绝对值趋近边界时,CF的值也迅速下降到以前的值。
第八,对校正沿边界的电平的新中央矩阵元进行展平校正。本发明的这个方面对于在沿这些方向定向传播过程中减小电平波动具有优点。
本发明的主要优点是在存在声源显著定向传播的情况下减小各个方向信号的变化,特别是当定向传播朝向前部时减小后部信号的变化,而当定向传播朝向其它方向时减小中央信号的变化。尤其是在对TV矩阵解码的校正中可以看到这一点。
本发明的另外一个优点是本发明可以更加平滑和更加清晰地再现环绕声效果,而不会产生由于声源定向传播活动引起的中央前部信号的总音量输出的不利变化。
本发明的再一个优点是相对于非定向声音更加精确地平衡音乐声与影片中对话声的电平,使得在解码环境中的平衡与在编码之前的素材中的平衡一致。
本发明的又一个优点是保持最初为双声道放音而混合的录音中的平衡。
在权利要求中表述了据信表示本发明特性的新特征。通过以下结合附图对于图示实施例的详细描述可以最好地理解本发明本身,以及该发明的其它特征和优点。在所说附图中:
图1为现有技术中的一种无源矩阵杜比环绕解码器的方框示意图;
图2为现有技术中的一种标准杜比矩阵编码器的方框示意图;
图3为本发明用于产生分立5声道声迹的杜比矩阵兼容编码的一种5声道编码器的方框示意图;
图4为本发明的解码器的一个5声道实施例的方框示意图;
图5a和5b为可以用于图4所示电路中的一种典型移相器的详细示意图;
图6a-6e表示图4所示解码器中各个信号之间的关系;
图7表示本发明的一个有源编码器的方框示意图;
图8表示用于产生与图9所示相位校正电路结合使用的ls/rs信号的一个相位灵敏检测电路;
图9表示设置在图4所示解码器之前用以对无源编码的影片声迹实现最佳解码的一个输入相位校正电路,图中包含表示所说控制信号ls/rs与所说定向传播角度ΘLS之间关系的曲线;
图10为本发明经过简化的有源编码器的方框示意图,图中也包含表示所说定向传播角度ΘRS与所说控制信号rs/ls之间关系的曲线;
图11为本发明的一种有源矩阵编码器的方框示意图,所说编码器对于声源明显定向传播的前部信号给予幅值补偿,并且同时产生的左右两侧输入具有较大的分隔;
图12a-12c以图表形式表示在图11所示编码器中当定向传播从左侧至左侧时前部象限定向传播的GL、GC和GR信号的变化,以及左-左(LL)矩阵元和左-右(LR)矩阵元的变化;
图13以图表形式表示当如输入到图4所示解码器或其7声道变型编码器中的其它信号改变时,对于在左侧与中央之间定向传播的信号,每个控制信号l/r和c/s的最大允许值;
图14为图4所示普通类型的1.11版解码器中左后左(LRL)矩阵元值的透视曲线图,图中表示在接近左侧顶点处存在不连续点;
图15类似地表示1.11版解码器的左后右(LRR)矩阵元值,图中表示在后部沿lr=0轴处存在不连续点;
图16以透视曲线图形式表示预定用于1.11版解码器中的LRL矩阵元与图14所示实际上使用的具有瑕疵的矩阵元之间的对比;
图17类似地表示美国专利US-4862502中和杜比前向逻辑的左前左(LFL)矩阵元,按照其标度最大值为1;
图18类似地表示美国专利US-4862502中和杜比前向逻辑的左前右(LFR)矩阵元,其标度为0.71,从而最小值和最大值为±0.5。
图19以透视曲线图形式表示美国专利US-4862502中LFL和LFR的平方和的平方根,按照其标度最大值为1,该图表示从不定向传播位置至右侧所说值沿所说轴保持为0.71,而从不定向传播位置至左侧上升3dB达到值1,而从不定向传播位置至中央或者至后部下降3dB达到值0.5,在该曲线图中后部方向分布与中央方向分布相同;
图20类似地表示前述美国专利申请No.08/742460中LFL和LFR矩阵元之和的平方根,按照其标度最大值为1,图中表示在整个右半平面中保持常数值0.71,并向左侧平缓地达到最高点1;
图21以透视曲线图形式表示1.11版解码器中左前左(LFL)矩阵元,图中表示随着定向传播信号朝中央移动,沿着lr=0轴和沿着从左侧至中央边界都发生增强,并且随着定向传播信号向后部移动,电平也减小;
图22类似地表示沿着从左侧至中央边界,以及沿着从中央至右侧边界具有校正幅值的左前左矩阵元(LFL);
图23为一曲线图,表示沿着左侧的后边界和完全后边界的LFL和LFR的特性,其中所示的小干扰信号是由于在22.5度缺少一个数值点;
图24以透视曲线图形式表示从左后部观察看到的左前左(LFL)矩阵元,图中表示了沿左后边界较大的校正,这使得当定向传播信号从左侧向左后部传播时所说左前输出信号趋于零,而当所说定向传播信号移动到完全后部时该输出信号保持为零,但是沿着lr=0轴和在右后象限中该函数与杜比矩阵一样;
图25类似地表示左前右(LFR)矩阵元,其中在从左侧至后部边界中的较大峰值与所说的LFL矩阵元一起产生作用,当定向传播信号从左后侧向完全后部移动时,使所说前部输出沿该边界减小到零,而在向后方向沿所说lr=0轴和所说右后象限所说矩阵元仍然与杜比矩阵一样;
图26表示根据本发明LFL和LFR的平方和的均方根;
图27表示从左后侧观察看到的LFL和LFR的平方和的平方根,其中包含对于后部信号电平的校正,图中表示从不定向传播位置(中部)至右侧轴具有值1,中央最高点的值为0.71,后部最高点的值为0.5,左侧最高点的值为1.41,并表示出沿中部至中央轴的峰值;
图28为一曲线图,图中实线曲线以dB为单位将中央矩阵元表示为CS的函数,其中假定声功率比与立体声一样,并在后部使用比通常所使用功率低3dB的杜比矩阵元,而点线表示前向逻辑中中央矩阵元的实际值,该图表示虽然实际值给出了一个不定向传播信号和一个完全定向传播信号的合理值,但是它们只有大约1.5dB,对于中部来说这个值过低;
图29类似地以实线表示中央矩阵元的值,其中假定具有与立体声相同的功率,给出在杜比前向逻辑中实际使用的矩阵元和标准,以点线表示前向逻辑中中央矩阵元的实际值,图中表示对于所有定向传播信号所说实际值大大低于3dB;
图30表示LRL和LRR平方和的平方根,图中使用在1.11版解码器中应用的矩阵元表示在左前象限沿着从中部至左侧最高点的直线有3dB的倾斜,而沿着左侧与中央之间的边界电平有接近3dB的升高,图中还表示后部象限中的“山地范围”,和在该平面中央“TV矩阵”有3dB的倾斜,在这个投影图中很难看到;
图31以曲线图形式表示对于沿cs=0轴具有恒定功率电平和沿左侧与中央之间边界具有零输出的GS和GR的数值解;
图32以透视曲线图形式使用根据本发明导出的GR和GS值表示LRL和LRR的平方和的平方根,图中表示除了由“TV矩阵”校正生成的谷值以外,所说平方和接近1,并且是连续的;
图33类似地表示4声道解码器(和前向逻辑解码器)的中左(CL)矩阵元,如果将左右互换该图也表示中右(CR)矩阵元,该图表示该曲线的中部和右侧及后侧最高点的值为1,中央最高点的值为1.41,但是在实践中这样标度矩阵元,使得最大值为1;
图34为了比较而表示1.11版解码器中中左矩阵元,其中所说中部值和右侧及后侧最高点已经减小4.5dB,从而随着cs增大,所说中央值以两个斜率上升到值1.41;
图35为一曲线图,图中实线表示当定向传播角度向前增大时,如果要在前部三个声道中保持输入信号中央分量的能量,根据本发明导出的LFL和LFR值所需的中央衰减,图中还以点线表示一个标准解码器的中央值;
图36为一曲线图,实线表示根据本发明为保持与中央衰减Gc的恒定能量比所需的GF值,虚线表示sin(cs)*corr1的值(以前的LFR矩阵元),而点线表示sin(cs),图中表示在cs达到30度之前GF值都趋于零,然后急剧增大;
图37表示左前右(LFR)矩阵元,其中包含沿lr=O轴对于中央电平的校正,该图表示在该平面的中部(没有定向传播)所说矩阵元值为零,而当cs沿着lr=O轴增大到22.5度时该值保持在零,并沿着从左侧至中央和从右侧至中央的边界下降以与以前的值匹配;
图38以透视图形式表示根据本发明导出的中左(CL)矩阵元,其中包含附加的中央增强函数,该图还表示沿左侧与中央之间边界的展平校正;
图39以曲线图形式表示当一个信号从中央至左侧展平时中央输出信号和左侧输出信号的电平,该图表示利用校正中央输出分展平,尽管不是完美无缺的,可以合理地接近左侧输出的倒数(将cs轴上的值倒置);和
图40表示根据本发明构成的一个有源编码器的方框示意图。
本发明的优选实施例包括具有最大横向分隔的一种5声道解码器和一种7声道解码器,尽管是以一般设计原理为基础进行阐述的,但是这些原理同样可以应用于具有其它数日声道的解码器中。
在设计一个无源矩阵时,一般假定按照标准杜比环绕矩阵进行编码,所说解码器具有四个输出,从而从所说解码器中输出的左声道信号包括左输入信号乘以1,中央声道为左输入信号乘以0.7(严格地说为 0 . 5 或0.7071)加右输入乘以0.7;右声道输出信号为右输入信号乘以1;后部声道输出信号为左输入乘以0.7与右输入乘以-0.7之和。
参见图1,该图为现有技术中一种无源杜比环绕矩阵解码器1的简化示意图,其中保持了这些信号关系。A(左LEFT)音频信号和B(右RIGHT)音频信号分别施加到输入端2、4,并利用单位增益缓冲放大器6和8分别缓存。它们还由信号合成器10和12以上面规定的比例组合。缓存器6、8的输出分别由左(L)和右(R)输出端14、16输出,信号合成器10、12的输出由中央(C)和环绕(S)输出端18、20输出。
如上所述,这个矩阵在所有方向上具有不变的增益,并且当输入信号为解相关信号时,所有输出信号的幅值都相等。
将所说无源矩阵结构扩展到多于4个声道是可能的。如果我们希望有一个左后扬声器,可以利用适合的矩阵元构成相应的信号,但是需要附加条件以获得一个唯一解;所有输出端的信号解相关分量的响度都应当是相等的,沿相反方向的分隔应当是较大的。
所说矩阵元由输出信号方向角的正弦和余弦给出。例如,如果将角度α定义为对于完全左输出α=0,而对于前部中央的输出为90°,则所说前部中央矩阵元为:
左矩阵元=cos(α/2)    (1)
右矩阵元=sin(α/2)    (2)
因此对于α=90°,两个矩阵元都为0.71,如标准杜比环绕矩阵所规定的。
由方程(1)和(2)定义的矩阵元对于α=0(完全左)至α=180°(完全右)都是有效的,其中左矩阵元的符号改变。对于左后象限,α从0°至-90°变化,从而所说右矩阵元分量的符号为负。但是,对于右后象限,左矩阵元符号为负。在中央后部,α=270°或-90°,所说的两个分量相等,而符号相反;按照惯例在这种情况下右信号系数为负值。这可以通过将方程(1)和(2)中α的范围表述为[-90°,270°]而加以规定,其中方括号表示包含相邻极限值,而圆括号表示该极限值不包含在所说范围内。
两个输出之间的分隔定义为一个输出信号电平与另一个输出信号电平之间的差值,以分贝(dB)表示。因此,如果有一个全左信号,则右输入分量为零,而左输出和中央输出中的信号分量分别为1和0.71乘以左输入信号。所说分隔为电平比0.71或-3dB(负号通常省去)。
对于这个矩阵,角度差为90°的任意两个方向之间的分隔总是等于3dB。对于分离角度小于90°的方向,所说分隔小于3dB。例如,在全后(α=-45°)和左后(α=-90°)的输出之间的分隔由下式给出:
分隔=cos(45°)*L/(cos(22.5°)*L)=0.77=2.3dB    (3)
这种状态可以利用一个有源矩阵改进。有源矩阵的目的是当在解码器输入中存在定向编码信号时,增加相邻输出之间的分隔。我们还可以求解该方程以获知当所说输入完全由解相关的“音乐”构成时这样一个解码器的特性如何,以及当定向信号与音乐混合时所说解码器的特性如何。在本申请中,我们使用单词“音乐”指示任何解相关信号,其十分简单,从而前文所述并且假定从立体声音频输入信号中获得的方向控制信号都有效地变为零。
下述设计准则可以应用于任何有源矩阵,应当指出,这些准则已经由现有技术中的解码器取得了不同程度的成功。
A.如果没有解相关信号,则这些声道中应当有一个最小输出与在再现所说方向信号时所产生的输出无关。例如,预定在右侧与中央的一个中间位置再现的一个信号应当在左声道和后声道中不产生输出。同样,预定在中央再现的一个信号应当在左声道或右声道中没有输出。(这是成对混声的原理,亦扩展到环绕声再现。)
B.所说解码器定向信号的输出应当具有相等的响度,而与编码方向无关。就是说,如果一个恒定电平的定向分量在所有方向上移动,其各个输出的平方和应当是不变的。大部分现有技术解码器不完全满足这个准则。存在响度误差,但是这些误差实际上是不明显的。这就是恒定响度准则。
C.一个输入信号的音乐分量(即解相关分量)的响度应当在所有输出声道中都是恒定的,与所说输入信号的该定向分量如何移动无关,并且与所说定向分量和音乐的的相对电平无关。这个要求意味着当矩阵元随方向变化时,每个输出声道的矩阵元的平方和应当是不变的。现有技术中的解码器显然违反这个准则。这个准则可以称为恒定功率准则。
D.仅仅再现解相关音乐分量与仅仅再现定向信号之间的过渡,当它们的相关电平改变时,应当是平滑的,而且不产生声音视在方向的移动。现有技术中的解码器也明显不符合这个准则。该准则可以称为恒定方向准则。
在必须遵循杜比前向逻辑,一种常用环绕声再现系统规范的影片解码器中,不应用上述的准则D,而是必须满足下列准则E:
E.当输入信号的解相关分量很小或没有解相关分量(即不包含音乐)时,预定来自房间前部任何方向,即从左侧经中央至右侧的信号的电平应当相对于这个信号在一个无源杜比环绕矩阵中可能具有的电平提高3dB。当音乐是主要的输入信号时(没有相关分量),其电平不升高。因此当解码器从仅仅包含音乐的信号过渡到一个纯定向编码信号时,在前半球中的定向信号的电平应当上升。
符合杜比前向逻辑规范的解码器的最佳设计应当在除了在具有强定向编码信号的输出声道之外的所有声道中包含解相关音乐分量,在这些声道中的音乐电平可以正比于所说定向信号相对于所说音乐信号的强度最大上升3dB。音乐电平在没有定向编码信号的任何输出声道中都不应当降低。这个准则可以称之为最小增益免除准则。
在所有现有技术的有源矩阵解码器中应用的一个工作原则是在没有定向编码信号的情况下,所说矩阵应当回复为上述的无源矩阵,如应用于所需数目的输出声道。这个假定乍看起来似乎是合理的,但是从音质感觉的角度来看,它既不需要,也不可取。本发明的解码器用下述的要求代替了上述的假定:
F.有源解码器矩阵应当在再现解相关音乐信号过程中和在存在定向编码信号情况下再现音乐信号时始终具有最大横向分隔。例如,如果所说音乐信号只包含位于左侧的小提琴和位于右侧的大提琴,则应当保持这些位置,而与同时存在的定向信号的强度和方向无关。仅仅在从一个输出声道中消除不应当再现的一个强定向编码信号时才可以放宽这个要求。在这些条件下,除非变更所说矩阵元,所说音乐的电平将会下降,以便从与所说目标方向相反方向上向受到影响的声道增加更多的能量。这样会减小声道分隔,但是在有强定向编码信号存在的情况下,这种声道分隔的减小很难听到。
对于较大声道分隔的需要(特别是当没有定向编码信号时)来自于音质的要求。现有技术中设想所说矩阵是固有对称的,认为所有方向都是同样重要的。但是,实际上不是这种情况。人有两耳,并且在观看电影或听音乐时他们通常面向前方。因此,对于正面声音和侧面声音的感觉是不同的。
至多具有4dB声道分隔的声场与具有更大分隔的声场之间具有戏剧性的差别。(这个事实是在CBS SQ矩阵中认识到的,该矩阵在无源解码器中具有超过8dB的侧面分隔,而牺牲了从前至后的分隔。)按照本发明人的观点,分立的5声道影片再现与常规的矩阵再现之间的差别是由于环绕声道之间较小的侧向分隔所产生的。
Griesinger的美国专利US-5136650认识到这种要求(F)的价值,并且记载了一种6声道解码器,其在听众两侧设置了两个附加声道。只要所说输出的定向分量朝向前半声区,这些输出声道具有左后和右后输出声道所需的特性。就是说,它们减小了定向分量的电平,而不考虑其方向,当没有定向编码信号时,它们具有完全的左右分隔。在上文所引用专利中记载的输出在存在定向信号的情况下,其中的非定向编码音乐信号不具有恒定电平,在本发明中克服了这个缺陷。
上文所引用专利中的编码器设计在经过某些改进之后构成了许多具有商业价值的解码器。这些解码器在后半声区中的矩阵设计是试探地开发研究的,但是一般来说完全满足上述要求。但是,比最佳情况存在更多的音乐“泵动”,并且定向信号在左后和右后输出中的泄漏超过允许的电平。在本文中,“泵动”表示由于与所说定向编码信号的方向相应的定向控制信号的变化引起的音乐信号的听觉变化。
由于这些理由,有必要改进解码器设计,本发明正是由这种努力而产生的。这样上述的准则A至F唯一地规定了一个矩阵,下面将以数学方法加以阐述。
为了使数学表述简单,在解码器的设计中假定所说编码器是一个简单的平面区。如果声音沿从左侧至中央至右侧方向传播,则使用标准的正弦-余弦曲线,如上述方程(1)和(2)所示。这些可以重新表示为:
L=cost                                 (4)
R=sint                                 (5)其中
t=α/2    (6)
在上述的声音正向传播模式中,角度t从0°变化到90°。对于声音在房间的后半声区中传播,即从左侧至后侧(环绕)至右侧,所说右声道平面区输出极性是反的。这可以利用一对方程来表示:
L=cost    (7)
R=-sint    (8)
当t=45°时产生完全后侧方向传播,而当t=22.5°时产生左环绕传播,即到达左侧与后侧之间的一个位置。
应当注意这个编码方案与上述无源矩阵的矩阵元是类似的。但是,这里定向传播角度被一分为二,并且显然造成后侧定向传播信号的符号改变。
在设计所说解码器时,首先必须决定想要产生什么样的输出,和当输入编码信号定向传播角度变化时所说输入信号的定向传播分量在每个输出声道中如何变化。在下面的数学表述中,这个函数可以是任意的。但是,为了满足要求B,即恒定响度准则,从而当信号在两个输出声道之间展平时保持响度,显然需要对这些幅值函数进行选择。
假定有左前声道、右声道和中央声道输出,则可以假设这些输出中每一个的幅值函数为角度t的两倍的正弦或余弦。例如,当t从左侧,即t=0°,变化到t=45°时,所说输出幅值应为:
左声道输出=cos2t    (9)
中央声道输出=sin2t    (10)
右声道输出=0    (11)当t从中央变化到右侧,即t=45°至90°时
左声道输出=0    (12)
中央声道输出=sin(2t-90°)=-cos2t    (13)
右侧声道输出=cos(2t-90°)=sin2t    (14)
这些函数可以使得声源在左侧和中央以及右侧和中央之间实现最佳布置。这些函数还得到了矩阵问题的非常简单的解。在上述任何一种情况下,预定在房间后部再现的任何输出信号都应当同一地为零。
在设计5声道版的改进型解码器时,在左侧与左环绕之间,即t=0至t=22.5°的后半声区中定向传播的信号应当包含:
左后声道输出=sin4t    (15)
右后声道输出=0    (16)而当所说信号在左环绕与完全后侧之间定向传播时,所说总的后侧输出应当保持相同。用于实现这个要求的矩阵系数不是恒定的,而是变化的,从而当在完全后侧定向传播时,右声道输入至左后声道输出的矩阵元变为零。
在7声道实施例中,当t从0变化至22.5°时,左侧和左后声道的输出应当是相等的,并且平滑增大,正比于sin4t。当t从22.5°变化至45°时,左侧的输出下降6dB,左后声道中的输出上升2dB,并使总响度,即每个输出的平方和保持不变。
如上所述,在改进的解码器中,即使所说定向传播信号完全朝向后侧,由于右侧输入至左后输出(以及左侧输入至右后输出)的矩阵元为零而导致完全分隔,所说左后和右后输出对于解相关的音乐信号具有最大分隔。尽管当所说定向传播角度t从0变化到22.5°时右后声道输出中定向传播信号为零,但是仍然需要调整用于实现这种信号消除的矩阵元,以使音乐输出保持恒定,并且与所说左后声道中的音乐信号具有最小的相关性。
另外,为了减小环绕声场中的相关性,所说的7声道实施例在侧面声道中包含大约15ms的时间延迟,在两个版本的解码器中,所说后侧声道都延迟大约25ms。
只要在存在定向传播信号条件下为各个输出声道选择了响度函数,这些函数具有左右对称性,就可以计算出矩阵元对于定向传播角度的函数关系。
标准的杜比环绕声配置使所有的环绕声扬声器同相连接,杜比屏幕影院也是采用类似方式装备的。但是,如上文中参照图1所述的标准无源矩阵在左后声道和右后声道输出方面存在问题。从左声道至环绕声道的展平造成L与L-R之间的过渡,从右声道至环绕声道的展平导致从R至R-L的过渡。因此,如果所说的两个后声道输出完全朝向后侧,则它们的输出是异相的。尤其是在美国专利US-5307415中记载的Fosgate6轴解码器具有这种不规则的相位关系。在听这种解码器放音时,随着向后传播的声音,例如飞机飞过的声音在后侧变得很薄而且不同相,这种异相效果令人无法接受。本发明的解码器包括一个移相器,用于在声音完全朝向后侧传播的情况下翻转右后声道输出的符号。所说相移是中央声道输出与环绕声道输出比值对数的函数,并且在声音朝前传播时不起作用。在下文中参照图5a和图5b介绍用于实现此目的的典型的移相器。
真实世界的编码器并非象上述的平面区域那样简单。但是,通过详细地选择检测输入信号定向传播角度的方法,可以在很大程度上避免在标准4声道编码器中存在的问题。
因此,即使是用4声道编码器制作的标准影片也可以解码为在后半声区具有相当数量的定向传播信号。
参见图2,该图表示现有技术中的一种标准编码器21,如在先前的Griesinger的美国专利US-5136650的图1中所示,有4个输入信号L、R、C和S(分别对应于左声道、右声道、中央声道和环绕声道),它们分别施加到相应的输入端22、24、26和28,以及图中所示的信号合成器和移相器单元中。来自输入端22的左声道(L)信号23和来自输入端24的中央信号(C)分别以1和0.707的比值施加到一个信号合成器30;来自输入端26的右声道(R)信号27和中央声道信号25以同样的比值类似地施加到信号合成器32。信号合成器30的输出31施加到一个移相器34,信号合成器32的输出33施加到一个同样的第二移相器38。来自输入端28的环绕声道(S)信号29施加到一个第二移相器36,该移相器相对于移相器34、38具有90°的相位滞后。移相器34的输出35,以及移相器36的输出37的0.707倍,一同施加到信号合成器40。类似地,移相器38的输出39在信号合成器42中与移相器36的输出37的-0.707倍合成。编码器的输出A和B分别为信号合成器40和42的输出信号41和43。
用数学方法,这些编码器输出可以利用下列方程表示:
左声道输出(A)=L+0.707C-0.707jS    (17)
右声道输出(B)=R+0.707C+0.707jS    (18)
虽然标准的4声道编码器并不用于5声道影片,但是可以设计一种能够与根据本发明构成的改进型解码器非常适合地配合使用的5声道编码器。下面参照图3介绍这样一种编码器。
所说新编码器48的附加矩阵元施加在图2所示标准编码器21之前,如上所述。
左声道、中央声道和右声道信号51、53和55分别施加到图3中的输入端50、52和54。在所说左声道、中央声道和右声道中每一个的信号路径上都分别插入一个全通移相器56、58和60,所说移相器具有相移函数φ(f)(表示为φ)。左环绕声道信号63施加到输入端62,然后按照相移函数φ-90°通过一个全通移相器66。来自输入端64的右环绕声道信号65施加到一个φ-90°移相器68。
信号合成器70将来自移相器56的左声道移相器输出信号57与来自移相器66的左环绕声道相移输出信号67的0.83倍合成,产生标记为L的输出信号71,该信号通过输出端76施加到标准编码器21的左声道输入端22。
类似地,信号合成器72将来自移相器60的右声道移相器输出信号61与来自移相器68的右环绕声道相移输出信号69的-0.83倍合成,产生标记为R的输出信号73,该信号通过输出端82施加到标准编码器21的右声道输入端26。
类似地,信号合成器74将来自移相器66的左环绕声道移相器输出信号67的-0.53倍与来自移相器68的右环绕相移输出信号69的0.53倍合成,产生标记为S的输出信号75,该信号通过输出端80施加到标准编码器21的环绕声道输入端28。
标记为C的中央声道移相器58的输出信号59通过输出端78施加到标准编码器21的中央声道输入端24。
图3所示的编码器具有这样的特性,任何一个分立输入端LS、L、C、R和RS上的信号将产生能够由本发明的解码器正确地再现的一个编码信号。两个环绕声道输入端LS、RS中同相的信号将产生一个完全向后传播的输入信号,而两个环绕声道输入端中异相的信号将产生一个非定向传播的信号,因为所说标准编码器的输出信号A和B是正交的。
下面给出与图2所示标准编码器结合使用的图3所示编码器的数学表达:
A=(L-j0.83LS)+0.71C+0.38(RS-LS)              …(19)
B= (R+j0.83RS)+0.71C-0.38(RS-LS)             …(20)
目前所有使用有源矩阵的环绕声解码器都是根据输入信号传输的信息控制矩阵系数。所有目前的解码器,包括本发明的解码器,都通过求得经过校正和平滑的左声道和右声道输入信号A和B、以及它们的和A+B和它们的差A-B的对数来导出这种信息。然后将这四个对数相减以获得所说左声道与右声道信号之比l/r的对数,以及和信号和差信号之比的对数,对于中央声道与环绕声道,该比值表示为c/s。在本说明书中,假定l/r和c/s是以分贝为单位的,从而如果左声道响度大于右声道,则l/r是正值,而如果所说信号是向前传播信号,即所说和信号大于所说差信号,则c/s为正值。当仅仅驱动所说LS输入信号时,需要选择上述5声道无源编码器中的衰减值,以产生相同值的l/r,应当理解,当将角度t设定为22.5°(后侧)时,可以利用简化的编码器用于设计所说的解码器。在这种情况下,l/r为2.41,或近似为8分贝。
对于由简化编码器分配在两个输入声道之间的非立体声信号来说,由于A=cost和B=±sint,l/r和c/s不是独立的。为了求出定向传播角度t,我们只需要求出左声道电平与右声道电平之比的反正切,或者如果我们定义正左方向t=0,并且如果如上所述l/r以dB为单位,则
t=90°-arctan(10^((l/r)/20))   …(21)度。
但是,由于仅仅将两个电平的幅值进行比较,以确定所说定向传播方向是否向前或向后,我们需要知道c/s的符号,对于向前的传播方向其符号为正,而对于向后的传播方向其符号为负。
在真实世界中,施加到解码器的输入信号不是从平面区域产生的,而是由图2所示的一种编码器产生的,该编码器利用了正交移相器。此外,几乎总是有解相关的“音乐信号”与定向传播信号共存。
在以下描述中,根据使用编码空间的象限,即左前象限、左后象限、右前象限或右后象限,将规定矩阵元的问题分为四个部分。
我们假设一种具有左前声道、中央声道、右前声道、左声道、右声道、左后声道和右后声道输出的7声道解码器。对于每个输出必须规定两个矩阵元,根据定向传播象限的不同,这些矩阵元也是不同的。因为所说矩阵具有左右对称性,所以右前和右后象限系数可以利用前-后轴的反射求出,因此只需要推导左前和左后定向传播的影响。
对于前部象限,我们假设使用关于杜比环绕声的准则D,而不是准则E,并且在以后加入校正处理。
向前传播与Griesinger所述(美国专利US-5136650)类似,但是在本发明中表述定向传播的函数是不同的,并且是唯一的。为了导出这些函数,我们必须分别考虑每一个输出。
当角度t从0变化到45°时,所说左声道输出应当减小到零,因为我们不希望在左前声道中出现任何定向传播信号。如果t=0代表完全左侧,则我们定义角度
ts=arctan(10^((c/s)/20))-45°    …(22)
所说左声道输出为矩阵元LL乘以左声道输入加上矩阵元LR乘以右声道输入。从所说简化编码器中产生的完全定向传播信号使得在这个区域内左声道输入A=costs和右声道输入B=sints。我们希望当t增大时左声道输出电平按照函数FL(ts)平滑减小,在我们的示例解码器中假定所说函数等于cos(2ts)。因此,将所说左声道输出表示为:
左声道输出=LLcosts+LRsints=FL(ts)=cos(2ts)    …(23)
如果解相关音乐信号的输出是恒定的,所说矩阵系数的平方和必须为1,即
LL2+LR2=1    …(24)
这些方程对于所有输出来说是基本相同的,它们构成LFR的一组正交方程,该组方程具有两个解。在每一种情况下,这些解中的一个对于另一个都是非常可取的。对于左声道输出:
LR=sints cos(2ts) +/- costs sin(2ts)                    …(25)
LL=costs cos(2ts) -/+ sints sin(2ts)                    …(26)
选择优选的符号,在方程(25)中为负号,在方程(26)中为正号,应用数学恒等式,将上述方程进一步简化为:
LL=costs                                      …(27)
LR=-sints                                     …(28)
所说右声道输出在角度ts的同一范围内应为零,即:
右声道输出=RLcosts+RRsints=0                …(29)
同样,所说解相关音乐信号应当是恒定的,所以
RL2+RR2=1                                      …(30)这样由于类似的理由得到下列结果:
RL=-sints                                     …(31)
RR=costs                                      …(32)
当定向传播方向为向左或向右移动时,所说中央声道输出应当平滑减小,并且这种减小应当由l/r的幅值,而不是c/s的幅值控制。向左或向右的强定向传播应当引起所说的减小。这会使中央左声道矩阵元CL和中央右声道矩阵元CR具有十分不同的值,当定向方向转换为从右向左时,所说矩阵元的值交换。基于l/r的定向传播角度在这里被称为tl。假定从正左侧的0度变化45°,当定向传播方向为正中央,或者没有定向传播信号时:
tl=90°-arctan(10^((l/r)/20))                       …(33)其中l/r以dB为单位表示。
当tl从0(正左方向)变化到45°(中央)时,中央声道输出应当平滑增大。反映这种增大的函数被称为FC(tl),在本实施例中该函数等于sin(2tl)。利用上述方法,
中央声道输出=CLcostl+CRsintl=FC(tl)=sin(2tl)                         …(34)同样,对于音乐信号的恒定响度
CL2+CR2=1                             …(35)由此得到解
CR=sintlsin(2tl) -/+ costlcos(2tl)                 …(36)
CL=costlsin(2tl) +/- sintlcos(2tl)                 …(37)方程(36)中优选的符号为正号,方程(37)中优选的符号为负号。当声音前向传播时关于后侧声道输出的矩阵元不象前向声道输出的矩阵元那样容易导出。为了导出它们,我们使用了在Griesinger专利(US-5136650)中给出的理论和公式。
问题是我们希望当没有定向传播信号时,左后LRL矩阵元为1,并且我们希望在存在向左定向传播或向中央定向传播信号时这个声道没有定向输出信号。如果我们按照上述所使用的方法,我们可以得到当信号向左或向中央定向传播时没有输出的矩阵元,但是,当没有定向传播信号时,输出为两个输入信号之和。这是一个常规解,其中当定向传播信号停止时,声道分隔程度很低。我们希望完全分隔,这意味着在没有定向传播信号时LRL必须为1,LRR必须为零。
为了解决这个问题,必须使所说矩阵同时依赖于l/r和c/s的值。在Griesinger的美国专利US-5136650中给出一个解,其中左侧和右侧输出为“补充输出”。从中求得的这个解解决了消除所说左侧输出中所有角度的方向分量的问题,但是当定向传播方向变为正中央方向时所说输出的音乐分量下降3dB。
我们可以通过将这些系数乘以因子(costs+sints)来校正这些系数以避免这个缺陷,其中ts为一个角度,当c/s等于1时该角度为零,而当c/s增大并且为正值时该角度增大到45°。在下列方程中,可以从c/s和l/r中分别求得角度ts和tl:
ts=arctan(c/s)-45°                             …(38)
tl=arctan(l/r)-45°                             …(39)应当指出,这里的tl与前面为中央声道输出定义的角度是不同的。
按照过去专利的术语,输入到若干可变增益放大器(VGA)中的控制信号相对于左声道、中央声道、右声道和环绕声道分别被称为GL、GC、GR和GS,从这些信号可以导出左环绕和右环绕VGA的两个补充信号GSL和GSR。这里所述的系数使用这些G值的线性组合,以分别获得作为所说的两个角度,即从c/s导出的ts和从l/r导出的tl的函数的左声道和右声道系数。由该定义,得到:
GL=((costl-sintl)/costl)=1-tantl             …(40)
GC=2(sints/(costs+sints))                     …(41)(有一个因子2在早期专利打印时漏掉了),
GS=0                                              …(42)(因为这是一个前部象限),和
Figure 9881091300321
sintl)/costl)=GL(sectl-tantl)=(1-tantl) (sectl-tantl)              …(43)左声道和右声道补充信号由下式给出:
LS=A(1-GSL)-0.5(A+B)GC-0.5(A-B)GS-B×GL           …(44)
Figure 9881091300322
GC+0.5(A-B)GS-A×GR                                …(45)因此,系数LSL和LRL由下式给出:
LSL=LRL=(costs+sints)(1-GSL-0.5GC)               …(46)在经过一定处理之后,上式变为
LSL=LRL=(costs+sints)(sectl-1)×(sectl-tantl)-sints …(47)系数LSR和LRR也是相等的,由下式给出:
LSR=LRR=(costs+sints)(-0.5GC-GL)…(48)
在经过一定处理之后,上式变为
LSR=LRR=(costs+sints)(tantl-1)-sints            …(49)当输入信号在左侧与中央之间定向传播时,可以利用前述方法求得所说右侧和后侧输出,但是所使用的定向角度必须是从c/s导出的ts,从而如果没有定向传播信号,则该信号回复为所说右声道输入信号。我们只需要消除向中央方向传播的信号。所求解的方程为:
Right rear output=RRL costs-RRR sints=0             …(50)和
RRL2+RRR2=1                                           …(51)由此得到解:
RRR=RSR=costs
RRL=RSL=sints                                        …(52)
上述方程完全限定了向前传播信号的矩阵元。对于向后传播信号,当c/s为负值时,下述结论成立:
对于向前传播信号来说,左声道和右声道主矩阵元是相同的,不同之处在于角度ts是由log(c/s)的绝对值确定的,其给出:
ts=arctan(10  ^(s/c)/20))-45°                      …(53)交叉矩阵元的符号是相反的,由此得到:
LL=costs                                            …(54)
LR=sints                                            …(55)和
RL=sints                                       …(56)
RR=costs                                       …(57)在声音向后传播情况下,所说中央矩阵元是相同的,因为它们仅仅依赖于从l/r导出的角度,而不依赖于c/s的符号。
当定向性很低或为零时,所说的左侧和右侧输出应当完全分隔。但是,当存在较强的向左传播信号时,必须消除左侧和后侧输出中的信号。
对于向中央方向传播的信号,我们使用以前关于tl的定义,
tl=90°-arctan(10^((l/r)/20))                   …(58)其中tl从0°变化到22.5°。在存在较强的定向传播信号情况下,当tl=0°时,所说左侧和左后输出为零,但是按照sin4tl的值随tl增加。在存在不相关的音乐信号,即由A=cost和B=-sint表示的信号情况下,所说系数LSL、LRL、LSR和RSR必须满足:
LSL=LRL                         …(59)
LSR=LRR                         …(60)以使得在侧向和后侧具有相等的输出,在定向传播过程中的幅值由下式给出
FS(tl)=sin4tl,从而LSL costl-LSR sintl=FS(tl)                  …(61)对于音乐信号,为了具有恒定电平,
LSL2+LSR2=1                             …(62)如上所述,求解得到
-LSR=sintl FS(tl)+/-costl√-(1-FS(tl)2)         …(63)
LSL=costl FS(tl)-/+sintl √-(1-FS(tl)2)         …(64)如上所述,经过简化和使用优选符号,得到
-LSR=sintl sin4tl+costl cos4tl                   …(65)
LSL=costl sin4tl-sintl cos4tl                    …(66)上述方程可以进一步简化为:
-LSR=cos3tl                             …(67)
LSL=sin3tl                              …(68)当在左后象限中存在定向传播信号时,所说右侧和右后输出自然地不包含左侧输入信号,但是,我们必须消除向中央或后侧传播的信号,因此必须包含对c/s敏感的项。右侧和右后输出是相等的,但是具有不同的相位滞后,我们必须求解:
右后/右侧输出=RSL costs+RSR sints=0    …(69)RSL2+RSR2=1                                   …(70)由此得到解:
RSL=sints                                   …(71)
RSR=costs                                   …(72)至此,该解码器满足开始时提出的所有要求。输出中不应包含的信号都被清除,当没有定向传播信号时可以保持声道之间完全分隔,在所有输出中音乐信号都具有恒定电平,而与定向传播信号无关。不过,对于后侧象限中的后侧输出,我们无法满足所有这些要求。必须放弃上述假定之一,至少应当放弃的一个有问题的假定是当所说定向传播信号完全向后时音乐电平恒定的假设。标准的影片解码器不会提高后侧扬声器的电平,因此当声音效果向后侧移动时,标准影片解码器不会增大音乐信号电平。标准的影片解码器在后侧声道中没有分隔。我们只需让音乐电平在声音向后强定向传播过程中增大3dB就可以获得后侧分隔。这在实践中是完全可以接受的。在这些条件下适当增大音乐电平是听不出来的,甚至是必要的。
我们已经根据从l/r电平比值导出的定向角度tl求得后侧声道的矩阵元。当从tl=22.5°变化到tl=45°时,以dB为单位表示的这个比值减小到零,而中央声道与环绕声道比值(c/s)的对数变为一个较大的负值。
我们考虑当定向角度为tl=22.5°的定向信号逐渐消隐到非定向的音乐信号中时会发生什么。在这种情况下,随着非定向音乐信号变为主要信号l/r的对数减小到零。我们需要将这种情况与上述情况,即定向信号清晰地向后传播的情况区分开来。最佳的方案是当l/r变为零时使矩阵元减小至高分隔,而保持音乐信号恒定。这个结果很容易推导出来:
tl=90°-arctan(l/r)                         …(73)
LRL=cos(45°-tl)                            …(74)
LRR=-sin(45°-tl)                            …(75)其中tl从22.5°变化到45°。这些矩阵元使音乐电平保持不变,但是当定向信号向后传播时它们使得定向信号的输出减小3dB。我们可以通过在c/s上增加一个相关系数,使LRL值正比于c/s比值的对数增大一个量来保证这一点。求解保持向后声道输出电平恒定所需的增大值,我们可以将结果表示在下表中:
c/s in dB        RBOOST
 -32              0.41
 -23              0.29
 -18              0.19
 -15              0.12
 -13              0.06
 -11              0.03
 -9               0.01
 -8               0.00
表1:RBOOST值与c/s的变化关系
按照这些结果,在5声道型解码器中的左后输出矩阵系数为:
LSL=cos(45°-tl)+RBOOST(logc/s)                  …(76)
LSR=-sin(45°-tl)                                  …(77)类似地,对于右声道,
RSL=sin(45°-tl)                          …(78)RSR=cos(45°-tl)+RBOOST(log c/s)              …(79)对于本发明的7声道实施例,我们在c/s上增加一个附加的相关系数,以将当所说定向传播方向完全向后时左侧和右侧声道中输出所需的减小值考虑在内。应当记得,在定向信号从正左侧向左后侧移动的情况下,左侧和左后声道的系数是相等的。侧面输出的减小伴随着相应的后侧输出的增大,以使定向信号的功率保持不变。增大交叉项也是必要的,它使分隔略微减小,但显然是听不出来的。
我们利用从c/s值导出的角度ts定义一个后侧增大函数RSBOOST(ts):
ts=90°-arctan(s/c)
方程其中ts从22.5°变化到45°,从而RSBOOST函数从ts=22.5°时的零值变化到ts=45°时的0.5。于是
RSBOOST=0.5 sin(2(ts-22.5°))                   …(80)对于侧面输出
LSL=cos(45°-tl)+RBOOST(log c/s)-RSBOOST(ts)     …(81)
LSR=-sin(45°-tl)                                 …(82)
RSL=sin(45°-tl)                                  …(83)
RSR=cos(45°-tl)+RBOOST(log c/s)-RSBOOST(ts)     …(84)对于后侧输出
LRL=cos(45°-tl)+RBOOST(log c/s)+0.5RSBOOST(ts)                   …(85)LRR=-sin(45°-tl)                                 …(86)RRL=sin(45°-tl)                             …(87)RRR=cos(45°-tl)+RBOOST(log c/s)+0.5 RSBOOST(ts)                   …(88)
对于影片解码器模式,我们必须用准则E代替上述的准则D,该准则就是在所有向前的方向上将前部声道的电平提高3dB。可以通过在向前定向传播过程中的前部矩阵元中添加用类似方式导出的增大项使所说矩阵实现这种功能。例如,在声音向左传播过程中,LL矩阵元,这里称之为LFL,应当按照依赖于l/r的一个提升函数增大,其中我们定义两个角度:
tlr=90°-arctan(l/r)                           …(89)
trl=90°-arctan(r/l)                           …(90)于是(比较上文中的方程(27))
LFL=costs+LFBOOST(tlr)                         …(91)
对于向右传播的信号
RFR=costs+LFBOOST(trl)                         …(92)在向中央传播的过程中,中央矩阵元也都增大:
CL=sintl+0.71 LFBOOST(ts)                     …(93)
CR=costl+0.71 LFBOOST(ts)                     …(94)这些方程完全限定了对于影片解码器的附加要求。
如果没有中央声道扬声器,杜比规范建议应当将中央声道输出以-3dB或0.707的增益添加到左前或右前声道输出中。在以适合的电平再现中央声道对话的同时,减小了左声道与右声道之间的分隔。例如,当没有定向传播信号时,中央声道输出为0.71L+0.7lR.将该输出添加到左声道和右声道,得到左声道输出1.5L+0.5R和右声道输出1.5R+0.5L,从而所说分隔减小到0.5/1.5=9.5dB。
为了避免这种效果,在有向中央传播信号时,最好使用从c/s导出的角度ts修改左声道矩阵元和右声道矩阵元,从而:
LFL=1+LFBOOST(ts)                     …(95)
RFR=1+LFBOOST(ts)                     …(96)
LRF=RFL=0                             …(97)与前文中导出的矩阵系数不同,这些矩阵系数没有将对话信号从左声道和右声道中消除,而是仍然保持其在房间中的适当响度,同时只要定向信号处于前半声区,就保持左右声道之间的完全分隔。
在图4所示的一种优选的5声道实施例中,实现了上述7声道中的5个声道,该解码器提供了左声道、中央声道、右声道、左后声道和右后声道输出,略去了左侧和右侧输出。从以上的数学表述可以理解,所说7声道解码器的左后和右后声道输出电路可以由与图示的左环绕和右环绕声道输出电路类似的电路构成,与方框96和118具有15ms延迟相似,具有附加的10ms延迟。
在上文中所述为7声道解码器、影片解码器和无中央声道模式增加RBOOST、RSBOOST和LFBOOST函数对于本领域技术人员来说显然是一种简单的改进。在数字实现方式中,它们只需在执行产生矩阵输出信号所需的乘法和加法之前将根据所说定向传播方向采用适合的定义从角度ts和tl导出的适合的增大表示式添加到相应的矩阵系数中。
在图4所示的解码器90中,所说输入端92和94分别接收标记为A和B的左声道和右声道立体声音频输入信号,所说输入信号通常可以直接地或者在借助于典型的音频再现媒体传输/记录和再现/回放之后从图2、3、或7所示的编码器中输出。
输入端92处的A信号在施加到下述的其它电路元件之前经过一段短时延迟(一般为15ms),从而能够进行信号处理,使得l/r和c/s信号可在相近的时间期间内完成,进而使所说控制信号在精确的时刻作用在经过延迟处理的音频信号上,以使它们到达适合的扬声器。
来自输入端92的A信号缓存在单位增益缓存器98中,并传送到整流电路100和对数放大器102中。
类似地,来自输入端94的B信号传送到缓存器104、整流电路106和对数放大器108中。
减法器110将对数放大器102和108的、分别标记为A”和B”的输出合成以产生l/r方向控制信号,该信号经由开关112传送到下述的矩阵电路中。在这种路径中开关112的转换位置处插入一个形成时间常数的电阻器114和电容器116,以减慢l/r信号的输出传输速率。
来自输入端94的B信号由于上述理由也经过15ms的延迟。
来自输入端92和94的A信号和B信号在一个模拟加法器中相加,经过整流电路122整流,通过对数放大器124。
类似地,所说A信号和B信号在减法器126中相减,然后通过整流器128和对数放大器130。从所说对数放大器124和130中输出的信号在减法器132中合成,以产生信号c/s,该信号通过开关134。在开关134的转换位置,所说信号通过由电阻器136和电容器138形成的时间常数元件,所说电阻器和电容器具有与相应元件114和116相同的值。至此,已经介绍了控制电压产生电路。正如这种电路典型的作用一样,l/r和c/s信号的变化正比于左声道A信号和右声道B信号,以及这些信号的中央(和值)和环绕(差值)声道信号之间幅值比的对数。
所说矩阵元由电路方框140-158表示,它们分别根据它们按照前述方程模拟的系数加以标记。因此,例如,标记为LL的方框140执行由方程(27)、(54)、(91)或(95)所述的函数。在各种情况下,该函数依赖于c/s输出,该输出用一个箭头表示为该方框的一个输入信号,以将其指定为一个控制输入信号而不是一个音频输入信号。所说音频输入信号为左声道输入信号A在通过延迟方框96之后产生的延迟信号,该信号在方框140中与系数LL相乘,以从该方框产生所说输出信号。
几个矩阵元的输出在加法器160-168中相加,从而分别在输出端172、174、176、178和180产生5个输出L、C、R、LS和RS。如上所述,所说RS信号在施加到所说输出端180之前通过一个可变移相器170。移相器170由所说c/s信号控制,以产生一定的相移,当信号c/s从前部移向后部时所说相移从0°变化到180°。
在所说7声道解码器中,电路元件152-158、166、168和170是成对的,输入信号来自与图4中所示相应元件相同的节点,但是在相应于152-158的方框中分别具有系数LRL、LRR、RRL和RRR,并且与方框96和118相似具有附加的10ms延迟,该延迟可以插入在这些方框之前,或者在相应的加法元件之后插入方框166和168中。
虽然图4中表示一种模拟实施方案,但是利用一个数字信号处理器(DSP)芯片完全以数字方式实现这些解码器函数也是可能的,并且在物理结构上要简单得多。这类芯片对于本领域技术人员来说是十分熟悉的,图4所示的方框示意图可以很容易地作为在这样一个DSP中运行以执行应用于上述方程中的各种信号延迟、乘法和加法,以及从这些信号导出所说信号l/r和c/s及角度tl和ts的程序来实现,从而提供本发明解码器的全部功能。
现在参见图5a,图中表示一个模拟移相器170。在该移相器电路中,输入信号RS’缓存在一个运算放大器182中,然后利用一个第二运算放大器184与限定单位增益的输入电阻器186和等值的反馈电阻器188将该信号反相。放大器182和184的输出分别通过可变电阻器190和电容器192施加到一个第三运算放大器196中,该放大器将所说电压信号缓存在可变电阻器190和电容器192的节点处,以向图4所示输出端180提供输出信号RS。这个电路是具有全通特性的一种常规单极移相器。
可变电阻器190由c/s信号以这样的方式控制,使得当所说信号向前传播时所说移相器的翻转频率较高,从而所说后侧输出信号是异相的(由于这些矩阵系数),但是当所说信号向后传播时它们减小,进而由于右后声道输出RS的反相所说后侧输出信号变为同相。虽然所说相移不是在所有频率都相同的,但是该移相器的音质效果是可以接受的,并且实质上减小了后侧信号的相位变化。正如对本领域技术人员来说显而易见的,可以使用更加复杂的多极移相器,但是在所有的输出声道中都需要增加电路,所以这种方法对于平滑转换后侧声道相位来说成本较高。
图5b中表示了一种常规的可变数字延迟元件,这种元件可以用于实现图4所示电路中的延迟方框170的数字实施例。在该电路中,增益值g由控制信号c/s的值控制,以便执行与图5a所示模拟移相器相同的功能。在该电路中,施加到加法器200的信号相加,并且由一个延迟方框202延迟,其输出经由增益为g的一个乘法器204反馈到加法器200的输入端之一。所说RS’信号被施加到加法器204的另一个输入端,以及乘法器206,在乘法器中将其乘以一个系数-g。从延迟方框202中输出的信号在乘法器208中乘以(1-g2),并在加法器210中与来自乘法器206的信号相加,以在加法器210的输出端产生RS信号。
虽然这种移相器的特性与图5a所示的模拟物不尽相同,但是对于产生必要的效果来说已是足够相似。
图6a至图6e以曲线图形式表示图4所示解码器的各个矩阵系数的变化,以及在解释图4时利用前文中所述方程表述的增强,以便进一步清楚地解释这种解码器的工作。
在图6a中,曲线A和B分别表示随着c/s值从0dB变化到大约33dB时系数LL(LFL)和-LR(-LFR)的变化。如在方程(27)和(28)中推导得出的,这些曲线遵循正弦-余弦定律。RR(RFR)和RL(RFL)的变化在形式上与声音信号在右前象限中定向传播的情况相似。
曲线C和D分别表示在先前的Griesinger的专利US-5136650中所述解码器的LFL和LFR的相应值,以供比较。在这些曲线中,其在向中央强定向传播条件下趋近值0.5,音乐分量大大低于3dB,因此相交于0.71值处的新解码器曲线A和B具有恒定的音乐电平,而老的曲线不具有这个特性。
在图6b中表示曲线E和F,它们表示在l/r从中央(0dB)向左(33dB)定向传播条件下中央声道系数CL和CR。随着定向信号移动到左侧,左系数CL增大3dB,而右系数CR减小到零。当声音信号向右定向传播时,可以应用类似的考虑,但是在相反的意义上。
曲线G和H分别表示上述Griesinger专利中所述解码器的系数CL和CR,其中也表示出音乐电平没有保持恒定,因为曲线G没有增大所需的3dB。
现在参见图6c,曲线J和K分别表示当比值l/r从0dB(没有定向传播信号或者朝向中央)变化到33dB(表示完全向左传播)过程中系数LSL和LSR的值。当从左环绕声道中消除左声道信号时,LSL曲线J减小到零,而LSR信号增大,从而房间中的音乐电平保持恒定。从这些曲线可以清楚地看出,在8dB处有一个折点,对应于传播角度从22.5°变为向后。这里,当输入信号中只有一个方向信号时,矩阵元的总值必须为1(以r.m.s.形式)。如从曲线中看到的,如果它们具有cos22.5°或0.92和sin22.5°或0.38的值,这是可以实现的。
在本文中,应当指出,不论在所说信号完全向后传播时,或者是在没有定向传播信号分量时,l/r都可以为零。在任何一种情况下,所说矩阵变为具有所需的左右声道完全分隔。
在图6d中,曲线L表示在上述表1中列出并在其后用于方程(76)和(79)中的RBOOST值。当向正后方传播时,LSL的值太小,所以将RBOOST的值与之相加以使音乐电平保持恒定。只有LSL被增大,所以仍然能够保持声道完全分隔。当c/s从-8dB变化到-33dB(向正后方)时,即曲线的x-轴为-c/s,RBOOST的值仅仅依赖于c/s,其中c/s以dB为单位。
图6d中还表示出曲线M,该曲线表示RSBOOST值。在7声道解码器中,当定向传播信号从左后(-8dB)变化到正后方(-33dB)时,将这个值从左侧系数中减去,并将该值的一半添加到左后分量中。同样,所说轴为-(c/s,dB),如上述方程(80)所表述的,这条曲线从零变化到0.5。
最后,在图6e中表示了曲线N,该曲线表示校正因子(sints+costs)与施加到后部声道和侧环绕声道以保持音乐电平恒定的控制信号的变化,如上述方程(39)所表述的。
现在参见图7,图中表示一般来说适用于影片声迹编码,特别是适用于上述解码器实施例的一种有源编码器。
在图7中,如在图3所示编码器中一样,将相同的5个信号LS、L、C、R和RS分别施加到相应数目的输入端62、50、52、54、64。对于这些信号中的每一个,都设置有一个相应的电平检测器和对数放大器,以产生正比于每个信号幅值对数的信号。这些元件标号为212-230。所说对数信号相应于输入信号LS、L、C、R和RS分别标记为lsl、ll、cl、rl、和rsl。然后在一个比较器(未示出)中将这些信号电平进行比较,它们的作用在下文中介绍。
衰减器254和256分别将所说LS信号衰减0.53和0.83,衰减器258和260分别将所说RS信号衰减0.83和0.53。
5个输入信号中的每一个都通过一个全通移相电路,标记为232、234的方框对于来自衰减器254和256的衰减信号LS分别作用相移函数φ和φ-90°,方框236、238和240分别对信号L、C和R中的每一个作用相移函数φ。一个信号合成器242将0.38LS与-0.38RS相加以向移相器方框244提供一个中央环绕信号,所说移相器具有相移函数φ。移相器方框246和248在来自衰减器258和260的RS声道信号中分别作用相移函数φ-90°和φ。
一个信号合成矩阵250将经过衰减器254衰减增益为sinΘLS的LS(φ)信号、经过衰减器256衰减增益为cosΘLS增益为0.707的L(φ)信号、C(φ)信号和相位为φ的环绕信号S=(0.38LS-0.38RS),其标记为S(φ)相加,以在输出端44产生所说左声道输出信号A。
一个类似的矩阵252将增益为sinΘRS的RS(φ)信号、增益为cosΘRS的RS(φ-90°)信号、增益为0.707的R(φ)信号、C(φ)信号、和S(φ)信号相加,以在输出端46产生所说右声道输出信号B。
在本发明的这个实施例中定向传播角度ΘLS和ΘRS以下述方式与对数幅值信号lsl、ll、cl、rl、和rsl相关:
无论何时,只要lsl大于其余信号中任何一个,则ΘLS趋近于90°,其它情况下,ΘLS趋近于0。这些值可以是一条平滑曲线的极端值。类似地,如果rsl大于其它信号中任何一个,ΘRS趋近于90°,其它情况下,ΘRS趋近于0。
这种工作模式的特殊优点是当仅仅有一个信号施加到LS或RS输入端时,编码器的输出为实数,并在解码器中产生2.41∶1(8dB)的l/r比值,这个值与由简化编码器和无源编码器产生的值相同。
现在参见图8,其中表示根据本发明构成的一种解码器的一部分,该解码器具有复数矩阵系数,而不是实数矩阵系数,该图表示产生第三控制信号ls/rs(除了由图4所示解码器产生的信号l/r和c/s)的一种方法,该信号用于改变图9所示设置在图4所示解码器之前的附加相移网路,以影响复数矩阵系数的产生。
可以看到所说A信号和B信号现在分别施加到输出端300和302,而不是图4所示的输入端92和94。具有频率为f的相位函数φ(f)的一个全通相移网路304和具有相位函数φ(f)-90°的一个第二全通相移网路306接受来自输出端300的A信号。来自304的相移信号在衰减器308中衰减-0.42倍,来自306的滞后正交相移信号在衰减器310中衰减0.91倍。衰减器308和310的输出信号在加法器312中相加。
来自输出端302的B信号通过一个全通相移网路314,从而加法器312的输出为信号A相对于相移器314输出端的B信号相移65°。
加法器312的输出通过衰减器316,衰减系数为0.46,并传送到加法器318的一个输入端,在该加法器中与来自相移器314的相移信号B相加。类似地,相移器314的输出由衰减器314以相同的衰减系数0.46衰减,并传送到加法器322,在该加法器中与加法器312的输出,即相移的A信号相加。衰减器308、310、316和320中的系数是经过专门选择的,使得只施加到无源编码器LS输入端的信号在加法器308不产生输出信号,和只施加到RS输入端的信号在加法器322不产生输出信号。因此,目的是设计一个电路,在所说信号只施加到编码器左侧或右侧声道时,可以将该电路当作所说解码器的输入端。它是利用对消技术实现的,从而当所说条件成立时这两个信号中的一个或另一个变为零。
加法器318的输出传送到电平检测电路324和对数放大器326,而加法器322的输出通过电平检测器328和对数放大器330。对数放大器326和330的输出传送到减法器332,其产生正比于它们的对数比的一个输出信号。可以利用开关334选择这个输出信号,或者利用开关334交替选择来自由电阻器336和电容器338构成的R-C时间常数电路的输出信号,并作为定向传播信号ls/rs传送到输出端340,所说电阻器和电容器的值与图4所示相应元件相同。
因此,所说信号ls/rs或者当将一个信号施加到无源编码器的LS输入端时是一个最大正值,或者当将一个信号施加到RS输入端时是一个最大负值。
信号ls/rs的目的是控制施加到图4所示解码器的输入相位。因此,图9所示网路设置在施加于图4所示输入端92和94的A信号和B信号之间。
图9所示的电路包括具有相位函数φ的一个移相器342,它可以是与图8中304相同的移相器,其后为具有衰减值cosΘRS的一个衰减器344,而具有相位函数φ-90°的移相器346可以是与图8中306相同的移相器,其后为衰减系数为sinΘRS的衰减器348。衰减器344和348的输出在加法器350中相加,以在输出端352产生一个经过校正的A信号,该信号直接传送到图4所示的输出端92。
在图9的下半部分中,如在图8中一样,所说B信号施加到输出端302,该信号在一个分路中通过具有相位函数φ的移相器354和衰减系数为cosΘLS的衰减器356,而在另一分路中,该信号通过具有相位函数φ-90°的移相器358和衰减系数为sinΘLS的衰减器360。从衰减器356和360输出的信号在减法器362中合成,以在输出端364产生一个经过校正的B信号,该信号直接传送到图4所示输出端94。相位改变的结果就是当只有无源编码器的LS或RS输入端被信号驱动时,使解码器的LS和RS输出之间(以及7声道解码器中的LR与RR输出之间)具有较好的分隔。
图9的插图表示控制信号ls/rs与定向传播角度ΘLS之间的关系。当ls/rs达到3dB时,角度ΘLS从0°开始变化在ls/rs的高值点上升到65°。另一定向传播角度ΘRS具有完全互补的关系,它由ls/rs的反相信号,即我们称之为rs/ls的信号控制,从而当rs/ls超过3dB时,ΘRS的值从0°开始增大,当rs/ls达到其最大值时,该角度渐进变化到-65°。当ΘLS和ΘRS变化时,由于图4所示解码器主要部分输入端的相位变化,所说矩阵系数有效地变为复数。
图10表示编码器的另一实施例,其通过简化相移网路而与图7所示编码器有所不同。通过在将实信号传送到φ移相器之前将它们合成可以减少相移网路的数目,从而只需两个φ和两个φ-90°相移网路。ΘLS和ΘRS的表述也简化了。当lsl/rsl大于3dB时,ΘLS趋近于90°,在其它情况下为零(如在解码器设计中)。同样,当rsl/lsl大于3dB时,ΘRS趋近于90°,在其它情况下为零。
在图10中,与图7右半部分中元件,即衰减器254-260和φ-90°移相器234和246相应的元件具有相应的编号。为了更加详细地讨论这个编码器与图7所示编码器之间的差别,图10中不是相应的元件也给予编号。可以看到,在图7所示的信号合成器元件242、250和252中表示的系数已经从所说信号合成器中抽取出来,并在衰减器元件262-274中分别作用于每个相关信号,经过如此校正的这些信号在简化的加法器276-284中合成,而5个φ移相器232、236-240和248被两个移相器286-288代替。
在图10中,从图7所示输出端62输出的LS信号的信号路径与以前一样通过衰减器元件256和φ-90°相移器234,然后通过具有衰减系数cosΘLS的有源控制的衰减器270,这是先前在图7所示信号合成器250中表示的系数。这个信号在加法器276中作为在图7所示输出端44输出的标记为A的信号的一个分量进行加和。
在图7所示输出端64的RS信号的信号路径类似地穿过衰减器258和移相器246,然后通过具有衰减系数cosΘRS的有源衰减器274,图7所示信号合成器252的前半部分,传送到加法器280,在该加法器中该信号作为图7所示输出端46输出的标记为B的信号的一个分量。
从图7所示输出端52输出的中央声道信号C的信号路径首先通过衰减系数为0.71的衰减器266,之后,该信号传送到加法器278和282。从图7所示输出端50输出的L信号直接施加到加法器278。从图7所示输出端54输出的R信号直接施加到加法器282。所说的LS信号也经由衰减器254和衰减系数为sinΘLS的有源衰减器268施加到所说加法器278。所说RS信号也通过衰减器260和衰减系数为ΘRS的有源衰减器272传送到加法器282。最后,所说LS信号通过衰减系数为0.38的衰减器262,所说RS信号通过衰减系数为-0.38的衰减器264,在结果信号传送到具有正符号的加法器278和具有负符号的加法器282之前,所说的两个衰减信号在加法器284中相加。
加法器278的输出通过φ移相器286传送到加法器276,加法器282的输出通过φ移相器288传送到加法器280,加法器276和280分别向图7所示的输出端44和46提供信号A和B。
通过检验输出信号A和B中各个信号LS、L、C、R和RS的衰减和加和可以发现这些输出信号与图7所示的那些信号相同,但是相对于图7所示包含较少的三个昂贵的移相器。
在图10中还以曲线图形式表示了角度ΘRS与在右侧象限中定向传播的信号的rs/ls(或-ls/rs)值之间的关系。这个角度影响了电路元件272和274,如箭头所示。在定向角度ΘLS与ls/rs值之间也存在完全相似的关系,这个角度影响了电路元件268和270。
现在参见图11,其中表示一个编码器,该编码器的结构与图10所示编码器非常相似。所以,那些功能相似的元件具有相对应的编号。有几个新元件,四个增益控制元件、可变衰减器290-293,和两个控制信号发生器元件294、295。输入端和输出端已经相应于图7进行了编号。
增加的增益控制元件的作用是校正向前强定向信号与音乐信号之间平衡,和响应同时发生的左侧和右侧信号造成的分隔减小。当在左声道、中央声道和右声道中出现强定向信号时,杜比前向逻辑兼容型解码器,即在满足准则E,而不是准则D的情况,使前部声道电平提高3dB。当例如对话与音乐之间的平衡发生偏移时,这种电平增大是完全听得见的。通常,在混合用于以杜比兼容解码器回放的声迹过程中,音频信号混合器操作者对在对话和其它强定向传播前部声道中的记录电平进行补偿,所说音频信号混合器操作者通过实施所说电平增大的一个解码器试听所说声迹。但是,借助于无源编码器或上文中参照图7和图10所述的有源编码器编码的5声道影片不需要进行这样的补偿。
在新型编码器中,三个前部信号L、C和R通过增益系数分别为GL、GC和GR的三个可变衰减器290-292。这些系数由从所说编码器输出求得的定向传播控制信号控制。为了实现这一目的,将输出信号A和B传送到一个定向传播信号电压发生器294的输入端中,所说发生器包括与图4所示解码器相同的电路。由此获得两个定向传播电压信号l/r和c/s,并且这两个信号与在有源解码器中所产生的信号一样。这两个定向传播电压信号以图12a和图12b所示的方式影响所说增益系数。信号l/r和反相信号r/l分别控制元件290和292的增益GL和GR,而元件291的增益由c/s控制。
当l/r为正值时(向左定向传播),根据图12a所示的曲线GL值从1开始减小,而GR的值保持在1。类似地,当l/r为负值时,GR值按照同一曲线减小(相对于|l/r|),而GL值保持1不变。同样,当前/后定向传播信号c/s为正值(向前定向传播)时,增益GC按照图12a所示曲线随c/s变化,但是当c/s信号为负值时,GC保持为1。图12a所示曲线是图6e所示曲线N的反转。
由于所说l/r和c/s信号是在一个反馈回路中产生的,因为改变增益也影响到定向信号电压,所以施加到每个前部信号上的校正作用与在影片解码器中施加到其上的电压提升完全匹配。这样的结果是当将原本的5声道编码为2声道,然后解码恢复到5声道或7声道时,使对话、音乐和向左或向右强定向声音效果保持原本的分立混合的效果。事实上,当将所说的2声道版本与5声道原本比较时,主观质量只有非常小的损失。大部分时间,根本没有明显的差别。
对于图11所示编码器的进一步改进是增大可变衰减器293的增益系数GS,该系数是由所说控制电压产生电路295控制的。所说增益系数GS作用于从加法器284输出的信号上,该信号是左侧输入信号与右侧输入信号之间的差值信号(乘以0.38)。这个侧向差值信号的目的是当有一个强定向的左侧或右侧信号输入到所说编码器时提供具有适合负值的c/s信号。但是,当左侧输入信号和右侧输入信号同时存在时,该侧向差值信号减小了左侧与右侧输入信号之间的分隔。这种分隔减小在LS与RS输入几乎相等但是不相关的情况下尤其重要,例如在音乐、掌声或环绕声效果如雨声发生过程中。
在这些非定向声音效果产生过程中,我们希望不使用所说差值信号,当在施加到编码器的左侧和右侧信号之间不存在强相关性时,这可以通过减小GS值来实现。
相关性是否存在可以利用与元件294中类似的一个控制电压发生电路295,根据从所说输入编码器的左侧和右侧信号获得的定向电压信号来确定,所说发生电路由此产生所说控制信号ls/rs和cs/ss。所说ls/rs定向传播电压信号在图7所示有源编码器原型上也可获得,用以控制ΘLS和ΘRS值。虽然在图11所示编码器中保持了这个特征,但是附加电路可以确定所说侧向信号的前后分量。ls/rs和cs/ss信号都可控制衰减器元件293的增益GS。所说ls/rs信号也控制衰减器270和272中的定向传播角度tls,而其反相信号rs/ls控制衰减器272和274中的定向传播角度trs。
于是可以通过取信号ls/rs和cs/ss中绝对值较大的一个来确定GS值,将这个值限制在7dB,除以7,然后从1中减去其结果。因此,任何具有7dB或更大相关性的信号将使得GS=1,从而所说编码器如以前一样工作,但是当将不相关信号施加到LS和RS时,GS值将因此而减小,所说解码器将回复这些输入信号之间的较大分隔。
在将编码/解码信号与非编码多声道声音进行比较的过程中,在存在侧向定向信号时左前或右前声道的输出很显然没有足够地减小。根据杜比前向逻辑规范,其不包括左侧声道和右侧声道,所以所说解码器的左前输出的幅值仅仅减小2.5dB。所说前部声道的这种特性是有意设置的,以遵循杜比规范,但是在标准杜比规范中没有用以解码的侧面声道,而只有一个后侧输出。所以在有侧面扬声器时需要修改有关在存在后侧定向传播信号时左前和右前声道输出的杜比规范。
在修改的规范中,当在同一侧存在向后定向传播信号时所说左前和右前输出又另外减小3dB。因此所说左前信号将减小与从左至左侧信号一样的量,所说右前信号类似地减小与从右至右侧信号一样的量。在安装侧面扬声器之后,清楚地改善了信号从前部到任何一侧,然后到后侧的视在移动效果;但是,对于一部标准前向逻辑编码影片,它不会产生造成很大听觉区别的偏差。在图12b和12c中分别表示了在存在左至左侧定向传播情况下LL和LR矩阵元增益的变化。类似的曲线也适用于存在右侧定向传播的情况。
解码器改进的另一个方面是一种特殊限定校正,这种校正可以以数字方式施加于所说的l/r和c/s方向控制信号。这具有提高定向传播速度和精确度的优点。在一个强定向信号从作至中央的展开过程中,所说l/r信号和c/s信号不是独立的,而是如图13所示,按照一条互补的路径行进。如果所说对数检测器反应迅速,则可以动态跟随这条曲线,但是当包括一个时间常数时,该上升信号的值会迅速增大,而下降信号通常以较慢的速度变化。其结果是所说下降信号大于它应当具有的值,从而减小了动态分隔。为了校正这个问题,使用更迅速变化的信号以限制其它信号遵循图13所示的曲线。尽管某些现有技术解码器包括用于限制在迅速变化过程中控制电压变化范围的电路,但是这些电路不是基于控制信号的变化速率,而是基于它们的绝对值。变化速率方法的一个特别的优点是能够使增大信号迅速增大,同时使下降信号更加迅速地变化,所说下降信号表示使矩阵沿以前的方向定向变化。
记住这些信号的定义,很容易获得所说控制信号之间的关系,其仅仅是一个最大限值,在存在解相关音乐信号的情况下不会达到该限值的。
如果我们考虑从左至中央的展开,L=cost和R=sint,则控制信号为
l/r=20*log10(cost/sint)                        …(98)
c/s=20*log10((cost+sint)/(cost-sint))        …(99)
在图13中相互对照地绘出了这些关系。
图14表示用于图4所示矩阵中的左后左(LRL)矩阵元系数的形式以供参考,如在先前的专利申请08/684948中的解码器中实施的。这个系数的值以三维格式,即相对于cs和lr控制信号的高度坐标绘制,它是由在图4所示解码器中的常规对数比检测器获得的。所说cs信号表示中央前部至后侧环绕信号幅值的比值,所说lr信号表示左至右信号幅值的比值。这些信号中每一个都编码为具有在从0至90度范围内变化的一个角度。如从图中可以看到的,在接近左侧顶点处这个矩阵元的值存在间断,当信号向后移动时形成一个小“陡壁”。在这个图中还存在一个中央“低谷”。图15类似地表示左后右矩阵元的值,其沿着朝向后部的lr=0轴具有一个类似的间断。
这些间断是由于在以往专利申请中所述理论的偏差造成的。问题是对左后象限中的矩阵元施加了校正,所说校正是利用通过一个被称为lr约束变量的变量索引的一个表进行的。它使得仅仅在所校正误差对称时才采取这种类型的校正。沿所说cs轴的这种校正是对称的,但是沿lr=0边界的校正不是对称的。实现这种校正较好的一种方法是利用一种内插法,如按照上述有关沿lr轴的LRR矩阵元的论文中所述理论实施的方法。实际上,这种内插法可以利用两个附加查阅表以很少的计算量实现。下文中将给出这种内插法的方程。
将LRR矩阵元沿lr轴恰当地内插。但是,如在图15中所看到的,沿cs轴有一个间断。这个间断是由于1.11版解码器中的一个编程错误造成的。在以往的专利申请中所述的理论产生如图16所示的矩阵元。图16表示左后右矩阵元,如根据以往的专利申请在1.11版解码器中应当实施的一样,其中已经消除所说间断。通过正确的内插和调试,在lr=0边界不再有间断。现在来看TV声音矩阵,图17表示如在US-4862502中所述,并按照杜比前向逻辑实现的LFL矩阵元,按照其标度方式,最大值为1。
假定cs和lr分别为沿中央/环绕和左/右轴的定向传播方向,在所说的1989年专利中关于前向矩阵元的方程如下:在左前象限中,LFL=1-0.5*G(cs)+0.41*G(lr)     …(100)LFR=-0.5*G(cs)…(101)在右前象限中,
LFL=1-0.5*G(cs)                          …(102)LFR=-0.5*G(cs)                           …(103)在左后象限中,
LFL=1-0.5*G(-cs)+.41*G(lr)           …(104)
LFR=0.5*G(-cs)                        …(105)在右后象限中,
LFL=1-0.5*G(-cs)                      …(106)
LFR=0.5*G(-cs)                        …(107)函数G(x)在US-4862502中有记载,并且在US-5307415中加以规定。当x从0度变化到45度时,它从0变化到1。在先前的专利申请中,将其表示为等于1-tan(|r|/|l|),其中|r|和|l|为右输入信号幅值和左输入信号幅值。
在图18中,表示美国专利US-4862502和杜比前向逻辑中的LFR矩阵元,该矩阵元标度为0.71,从而最小值和最大值为±0.5。在先前的专利申请No.08/684948中,通过增加非定向传播信号的响度应当与定向传播方向无关地保持不变的要求可以改善这些矩阵元。在数学上这意味着LFL和LFR矩阵元的均方根应当是恒定的。在该申请中指出这个目标应当在定向传播方向实现,就是说,当定向方向为正左时,矩阵元平方的和应当增大3dB。我们可以看到,上述矩阵元不满足这个要求。
图19表示美国专利US-4862502中LFL和LFR平方和的平方根,按照其标度,最大值为1。注意该值沿从非定向传播方向至右侧的轴保持不变为0.71。非定向方向至左侧的值上升3dB达到值1,而非定向方向至中央或至后侧的值下降3dB达到值0.5。该后方向与中央方向是一致的,但是由于该视图为透视图,所以不容易看出。
先前的专利申请No.08/684948通过用正弦和余弦代替矩阵方程中的函数G(x)校正这个幅值误差:对于左前象限
LFL=cos(cs)+0.41*G(lr)                    …(108)
LFR=-sin(cs)                               …(109)对于右前象限
LFL=cos(cs)                                …(110)
LFR=-sin(cs)                               …(111)对于左后象限
LFL=cos(-cs)+0.41*G(lr)                   …(112)
LFR=sin(-cs)                               …(113)对于右后象限
LFL=cos(-cs)                              …(114)
LFR=sin(-cs)                              …(115)图20表示先前专利申请No.08/684948中矩阵元LFL和LFR之和的平方根,按照其标度最大值为1。记住在该平面的整个右半部分中保持恒定值0.71,并向左侧顶点平缓上升到1。
1.11版解码器对这些矩阵元作了某些改变。在保持基本函数关系的前提下,又在前部沿cs轴进一步增大矩阵元值,并且在后部沿cs轴增加一个断点。增大矩阵元值的原因是为了改善向前扩展的立体声音乐的音质。后部断点的目的是当立体声音乐向后部展开时增大前部声道与后部声道之间的分隔。对于左前象限
LFL=(cos(cs)+0.41*G(lr))*boostl(cs)            …(116)
LFR=(-sin(cs))*boostl(cs)                       …(117)对于右前象限
LFL=(cos(cs))*boostl(cs)                        …(118)
LFR=(-sin(cs))*boostl(cs)                       …(119)对于左后象限
LFL=(cos(-cs)+0.41*G(lr))/boost(cs)           …(120)
LFR=(sin(cs))/boost(cs)                        …(121)对于右后象限
LFL=(cos(cs))/boost(cs)                        …(122)
LFR=(sin(cs))/boost(cs)                        …(123)函数G(x)是在先前的专利申请中定义的。它等于G(x)=1-tan(45-x),并且与用于杜比矩阵中的函数相同。
函数boostl(cs),如用于1.11版解码器中的函数为在定向传播方向的最初22.5°范围内线性增大至3dB,然后在后22.5°范围内减小至0dB。(参见下列伪码中的corrl。)Boost(cs)由下列代码中的corr(x)给出,其中注释之前用符号%标引:
%计算在22.5度时增大+3dB的函数
%corr(x)增大3dB并保持该值,corrl(x)增大然后再减小,
其中x=1:24;%x的值为1至24
corr(x)=10^(3*(x-1)/(23*20));%在这个范围内增大3dB
corrl(x)=corr(x);
结束
其中x=25∶46;%在这个范围内corrl又减小corr(x)=1.41;
corrl(x)=corr(48-x);
结束
这些方程生成图21所示1.11版解码器中矩阵元LFL的平面。应当指出,当定向传播方向向中央移动时沿着lr=0轴和沿着从左至中央边界矩阵元值都增大。还需指出,当定向方向向后移动时信号电平减小。
沿所说边界的增大产生扩展误差。沿后侧方向形成的断点也不是最佳的。有两个方面的特性得以提高。第一个方面是沿左侧与中央之间,和右侧与中央之间的边界定向传播的特性。当一个强定向信号从左侧扩展到中央时,在图21中可以看到,LFL矩阵元的值在左侧与中央之间的中点处达到最大值。这种矩阵元值的增大是当在立体声音乐中加入一中央声道信号时,左声道主输出和右声道主输出信号电平预定增大的必然结果。
如在上文中所解释的,当立体声信号向前展开时,需要使所说左前和右前输出的电平增大,以补偿由于矩阵将相关分量从这些输出中消除引起的电平减小。但是,在这些条件下用于增大电平的方法应当仅仅在输入信号的lr分量最小时,就是说在没有向左或向右定向传播信号存在时采用。然而,在1.11版解码器中选择用于实现这种增大的方法与lr的值无关,并且当一个强信号跨过边界展开时导致电平的增大。
问题是仅仅需要沿lr=0轴增大电平。当lr为非零值时,矩阵元不应当增值。这个问题可以通过在矩阵元中添加一项,而不是乘以一个系数来解决。我们定义一个新的定向传播位标,受到边界限制的cs值具有下列代码:
我们假定对于在左前象限中的信号lr和cs都大于零,还假定cs和lr遵守从1至46变化的matlab约定:
%求出具有边界约束的c/s
如果(cs<24)
bcs=cs-(lr-1);如果(bcs<1)%,这限制了最大值
bcs=1;结束
否则
bos=47-cs-(lr-1)
如果(bcs<1)
bcs=1;结束 结束
如果cs<22.5,lr=0,(按照Matlab,约定cs<24,lr=1)则bcs等于cs。但是当lr增大时,bcs将减小到零。如果cs>22.5,当lr增大时,bcs也减小。
现在为了求得所需的校正函数,我们求得增值矩阵元与非增值矩阵元之间沿lr=0轴的差值。我们称这个差值为cos_tbl_plus和sin_tbl_plus。(这个代码写在校正的Matlab中,其中变量为多值矢量。注释之前用符号%标引)
α=0∶45%以1度为阶距定义一个矢量。α的值为0-45度
α1=2*pi*α/360;%转换为弧度
%现在定义正弦和余弦表,以及前部的增值表
sin_tbl=sin(al);
cos_tbl=cos(al);
cos_tbl_plus=cos(al).*corrl(a+1);
cos_tbl_pLus=cos_tbl_plus-cos_tbl;%这是我们所使用的
cos_tbl_minus=cos(al)/corr(a+1);
sin_tbl_plus=sin(al).*corrl(a+1);
sin_tbl_plus=sin_tbl_plus-sin_tbl;%这是我们所使用的
sin_tbl_minus=sin(al)./corr(a+1);其中sin_tbl_plus和cos_tbl_plus为简单正弦与余弦之间,和增值正弦与余弦之间的差值。现在我们定义
LFL=cos(cs)+0.41*G(lr)+cos_tbl_plus(bcs)        …(124)
LFR=-sin_tbl_plus(bcs)+sin(cs)                   …(125)
右前象限中的LFL和LFR是相似的,但是不合有+0.41*G项。由这些新定义导出下列矩阵元。
后部象限中的定向传播都不是最佳的。在上述曲线中当定向传播向后时,所说矩阵元由下式给出:
LFL=cos_tbl_minus(-cs)+0.41*G(-cs)          …(126)
LFR=sin_tbl_minus(-cs)                       …(127)
这些矩阵元与杜比矩阵元非常接近。考虑一个强信号从左向后展开的情况。杜比矩阵元是这样设计的,使得仅仅当这个信号完全向后时才完全消除左前输出中的输出信号。但是在根据本发明构成的解码器中,当编码信号到达左后方向时(cs=-22.5和lr=22.5),要求左前输出端的输出信号应当为零。当所说信号进一步向正后方展开时,所说左前输出应当保持为零。在1.11版解码器-上述的解码器-中所使用的矩阵元导致当一个信号展开到所说左后位置时所说左前声道中的输出大约为-9dB。这个电平差值对于所说矩阵的良好性能来说是足够的,但是没有达到它应有的程度。
通过改变左后象限中LFL和LFR矩阵元可以改善这种性能。注意我们所关心的是矩阵元沿左侧与后部之间的边界如何变化的问题。在AES论文(“两耳听众用多声道矩阵环绕解码器”,David Griesinger,AES preprint No.4402,1996年10月)中给出的数学方法可以用于获得矩阵元沿边界的变化特征。让我们假定当t从0(左侧)变化到-22.5度(左后侧)时左前输出的幅值应当按照函数F(t)减小。该方法给出矩阵元:
LFL=cos(t)*F(t)-/+sin(t)*(sqrt(1-F(t)^2))          …(128)
LFR=-(sin(t)*F(t)+/-cos(t)*(sqrt(1-F(t)^2)))       …(129)
如果我们选择F(t)=cos(4*t),并选择正确的符号,这些方程简化为:
LFL=cos(t)*cos(4*t)+sin(t)*sin(4*t)               …(130)
LFR=-(sin(t)*cos(4*t)-cos(t)*sin(4*t)             …(131)
这些矩阵元工作良好-左前输出随着t从0变化到-22.5度平滑地减小。图22表示左前左矩阵元沿所说左至中央边界,以及沿所说中央至右边界具有正确的幅值。
我们希望当定向传播方向继续从22.5度变化到45度(正后方)时所说输出保持为零。沿该边界部分,
LFL=-sin(t)                            …(132)
LFR=cos(t)                             …(133)
应当指出,这些矩阵元与沿lr=0边界的矩阵元之间有很大的距离,其中在先前的专利申请中这些值为
LFL=cos(cs)                             …(134)
LFR=sin(cs)                             …(135)
图23表示沿左侧与正后方之间的后侧边界LFL和LFR的变化特性。少许的干扰信号是由于在22.5度处缺少一个点。
我们需要当lr和cs趋近所说边界时将上述方程平滑地转换为沿所说边界的方程的一种方法。可以使用一种线性内插法。在通常用于这些解码器中的处理器中,其中乘法是运算量较大的,较好的策略是定义一种新变量-lr和cs的最小值:
%新变量-求出边界参数
if (bp>y)
bp=y;
end和与bp相关的一个新校正函数:
for x= 1∶24
ax=2*pi*(46-x)/360;
front_boundary_tbl(x)= (cos(ax)-sin(ax))/(cos(ax)+sin(ax));
end
for x=25∶46
ax=2*pi*(x-1)/360;
front_boundary_tbl(x)=(cos(ax)-sin(ax))/(cos(ax)+sin(ax));
end
然后我们将这个象限中的LFL和LFR定义为:
LFL=cos(cs)/(cos(cs)+sin(cs))-front_boundary_table(bp)+0.41*G(lr)…(136)
LFR=sin(cs)/(cos(cs)+sin(cs))+front_boundary_table(bp) …(137)
注意cos(cs)+sin(cs)的校正。当我们将cos(cs)除以这个因子时,我们得到函数1-0.5*G(cs),该函数与该象限中的杜比矩阵相同。
在右后象限中,
LFL=cos(cs)/(cos(cs)+sin(cs))                  …(138)
LFR=sin(cs)/(cos(cs)+sin(cs))                  …(139)
图24表示从左后侧看到的左前左矩阵元。注意沿左后边界的较大校正。当定向传播方向从左向左后变化时,这种校正使得左前输出变为零。当定向传播方向朝向正后方时该输出保持零值。但是,沿所说lr=0轴和在右后象限中,该函数与杜比矩阵相同。
图25表示左前右矩阵元。注意在左至后边界中较大的峰值。这个峰值与所说LFL矩阵元结合工作,以在定向传播方向从左后向正后方变化时使所说前部输出沿该边界减小到零。在沿lr=0轴的向后方向和在右后象限中,矩阵元也与杜比矩阵相同。
本发明的改进矩阵的主要设计目的之一是使施加到解码器输入端的任何给定的非定向传播信号输出的响度应当保持恒定,而与同时存在的定向传播信号的方向无关。如上所述,这意味着每个输出的矩阵元的平方和应当为1,与定向传播方向无关。如前所述,当沿所讨论之输出的方向存在强定向信号时,必须放宽这个要求。就是说,如果我们正在考虑左前输出,则当定向传播方向朝向正左时,必须使矩阵元的平方和增大3dB。
通过绘制矩阵元平方和的平方根曲线,我们可以验证我们的设计是否成功。
图26表示使用新设计后的LFL和LFR的平方和的均方根。(为作该曲线图,我们删除了后部象限中的1/(sin(cs)+cos(cs))校正,因此我们能够看到所得和值如何准确地归一。)注意在左侧方向上的3dB峰值,和当一个信号从非定向传播变化到沿中央方向22.5度时略微减小的峰值。这个峰值是在存在左前定向传播信号时有意增大左声道和右声道输出造成的。注意在其它象限中rms和值非常接近1,与设计意图相符。左后象限中的值不恰好等于1,因为用于生成这些矩阵元的方法是一种近似方法,但是匹配程度相当好。
图27表示从左后侧观察看到的LFL和LFR平方和的平方根,其中包含对于后部信号电平的校正。非定向传播(中部)至右侧轴的值为1,中央顶点的值为0.71,后侧顶点的值为0.5,左侧顶点的值为1.41。注意沿中部至中央轴的峰值。
本发明关注的下一个问题是在存在向前定向传播信号时对于后部矩阵元值的校正。
在Griesinger的1989年美国专利US-4862502中后部矩阵元由下式给出:对于左前象限:
LRL=.71-.71*G(lr)+.41*.71*G(cs)                …(140)
LRR=-.71*G(lr)+.41*.71* G(cs)                   …(141)对于左后象限:
LRL=.71-.71*G-(lr)+.41*.71*G(-cs)               …(142)
LRR=.71*G(lr)+.41*.71*G(-cs)                     …(143)(平面的右半部分是相同的,只是要将LRL与LRR交换。)
杜比前向逻辑中的后部矩阵元为对于左前象限:LRL=.71-.71*G(lr)+.41*.71*G(cs)                …(144)LRR=-.71*G(lr)+.41*.71*G(cs)                    …(145)
对于左后象限:
LRL=.71-.71*G(lr)                      …(146)
LRR=.71*G(lr)                           …(147)(平面的右半部分相同,但是LRL与LRR交换。)
现在我们短暂地离题,讨论一下杜比前向逻辑中的环绕声道电平-注意杜比矩阵元在前部是相等的,但是不包括在后部与cs相关的增值.这个差别事实上是十分重要的.上面所列方程在某种程度上掩盖了这些解码器实际应用的方法。我们采用相对任意的标度导出所有矩阵元。在大部分情况下,这些矩阵元是存在的,好象它们的最大值为1.41。实际上,由于技术上的原因,这些矩阵元最后都被标度为最大值等于1。此外,当解码器最终被投入使用时,调整每个扬声器输出信号的增益,使得当已经从四个主要方向-左侧、中央、右侧和后方编码的一个信号输入所说解码器时,在听众位置处的声音功率是相同的。在实践中,这意味着需要将矩阵元的实际电平进行定标,以使解码器的四个输出在完全定向传播条件下是相等的。
在杜比解码器中后侧方向的电平没有增大表明在定标过程中后部输出的增益将要相对于其它输出增大3dB。实际上,对于实践中使用的杜比解码器:
LRL=1-G(lr)                          …(148)
LRR=-1                               …(149)
这种差别并非不重要。当前部矩阵元经过定标使得在一个方向上存在完全定向传播信号时它们的最大值为1时,我们求得在没有定向传播信号条件下,1989年专利中的矩阵元的值为0.71,并且这些矩阵元的平方和为1。对于杜比后部矩阵元来说在定标时不是如此。在没有定向传播信号时LRL的值为1,平方和值为2,或者比1989年专利中的输出高3dB。注意所说定标方法生成一个矩阵,当该矩阵不是定向传播时,它并不对应于一个“杜比环绕”无源矩阵。所说杜比环绕无源矩阵规定后部输出应当具有值0.71*(Ain+Bin),并且前向逻辑矩阵不满足这个规定。如果有两个扬声器共用这个输出,每个扬声器的电平降低3dB,这将使得当解码器输入为不相关信号时所有5个扬声器具有近似相等的声音功率。如果使用1989年专利中的矩阵元,同样的定标方法导致在解码器输入为不相关信号时后部声道的声音功率减小3dB。在新设计的解码器中后部输出的矩阵元包括当输出为完全定向传播信号-或者向左或向右侧-或者完全向后时的一种电平升高形式。因此,当它们为非定向传播信号时它们的环声音电平与1989年专利所述相同。
为了看清这个问题的重要性,可以考虑当我们有一个解码器输入信号的情况,该输入信号包含三个分量,一个不相关的左声道分量和右声道分量,以及一个独立的不相关中夹声道分量。
Ain=Lin+.71*Cin                               …(150)
Bin=Rin+.71*Cin                               …(151)
当以立体声形式回放Ain和Bin时,房间中的声音功率正比于Lin^2+Rin^2+Cin^2。如果所有这三个分量都具有近似相等的幅值,则中央分量与左加右分量的比值为1∶2。
我们希望我们的解码器能够在房间中再现具有与立体声相同功率近似相等的声音功率比,而与Cin与Lin和Rin的功率比值无关。我们可以用数学公式表示这一特征。实质上,如果所有其它矩阵元都按给出的方程取值的话,这种功率比相等的要求规定了沿cs轴的中央矩阵元的函数形式。如果我们假定杜比矩阵元的标定使得当所说矩阵完全是定向传播矩阵时后部声音功率比其它三个输出低3dB-即在无定向传播信号条件下该矩阵与杜比环绕矩阵相同,则所说中央矩阵元应当具有图28和图29所示的形状。
在图28中,实线曲线表示作为cs+1函数(以dB为单位)的中央矩阵值,其中假定声音功率比与立体声相同,并且使用了在后部具有比通常所使用功率低3dB的杜比矩阵元。虚线曲线表示前向逻辑中中央矩阵元的实际值。注意虽然所说实际值给出了非定向信号和完全定向传播信号的合理结果,但是它们在中部只有1.5dB之低。
类似地,在图29中,实线曲线表示中央矩阵元的值,其中假定矩阵元具有与立体声相等的功率比,和采用在杜比前向逻辑中实际使用的定标方法。虚线表示前向逻辑中中央矩阵元的实际值。注意所说实际值对于所有定向传播信号来说要比3dB低得多。
这两个附图表示混响工程师常常需要了解的-就是说为在一个杜比前向逻辑系统中回放所制作的混音可能常常需要比为在立体声系统中回放所需制作的混音具有更大的中央响度。相反地,为立体声制作的混音在一个前向逻辑解码器中回放时会丧失声音的清晰度。反过来说,对于一个无源杜比环绕解码器来说不是如此,这种解码器与上述附图中非定向传播条件下的解码器相同。
如下所述,本发明还包括生成两个独立的后部输出。
在1989年专利的矩阵元和杜比矩阵元中存在的主要问题是只有一个后部输出。Griesinger在1991年的美国专利US-5136650中所公开的发明生成两个独立的侧面输出,该专利中的数学表述结合在1996年7月提出的美国专利申请No.08/684948的左前象限中。在这个象限中的矩阵元的作用是消除从左向中央定向传播的一个信号的输出,而保留在左后声道中同时存在的非定向传播信号的某些输出。为了实现这个目的,我们假定LRL矩阵元具有下列形式:对于左前象限:
LRL=1- GS(lr)-0.5*G(cs)                    …(152)
LRR=-0.5*G(cs)-G(lr)                       …(153)
可以看到,这些矩阵元与Griesinger 1989年提出的专利US-4862502中的矩阵元非常相似,但是在LRR中增加了一个G(lr)项,在LRL中增加了一个GS(lr)项。包含G(lr)项是为了将来自解码器B输入声道的信号增加到左后声道输出中,以便当将定向传播信号消除时提供某些非定向信号功率。然后我们利用当一个完全定向传播信号从左侧向中央移动时应当没有信号输出的标准求解函数GS(lr)。尽管在1991年的专利(5136650)中给出一个更加复杂的公式,但是这里给出计算GS(lr)的公式等于G^2(lr)。可以证明这两个公式是等效的。
在1996年7月的申请中,通过给定(sin(cs)+cos(cs))的增值以使这些矩阵元更加接近非定向信号的恒定响度,可以校正这些矩阵元。尽管在右前象限中完全成功,但是这种校正在左前象限中不是非常成功。
对于右前象限,这些矩阵元与在1989年专利(4862502)中给出并在1.11版解码器中实施的后部矩阵元是相同的。
左前象限的问题可以参见图30,该图使用在上文中给出的在1.11版解码器中实施的矩阵元,表示LRL和LRR的平方和的平方根。注意在左前象限中,沿从中部至左侧顶点的直线有一个3dB的降低,而沿着左侧与中央之间的边界电平上升将近3dB。下面将要讨论在后部象限中的所说变化范围。该图包含在平面中部的3dB的“TV矩阵”下降,在这个投影图中很难看到。
首先,我们考虑所说平方和沿cs=0轴的下降。因为在LRR中使用了G(lr),所以存在所说降低。这种选择完全是任意的-尽管它使得比较容易以模拟电路实现。理论上,我们希望在这个方程中包含一个函数GR(lr),并选择GS(lr)和GR(lr),使得能够保持LRL和LRR的平方和沿cs=0轴为常数,和保持该输出沿左侧与中央之间的边界为零。这可以实现。我们还希望确保所说矩阵元与右前象限中沿lr=0轴的矩阵元相同。因此,我们假定:
LRL=cos(cs)-GS(lr)                        …(154)
LRR=-sin(cs)-GR(lr)                       …(155)
我们希望所说平方和沿cs=0轴为1,所以
(1-GS(lr))^2+(GR(lr))^2=1                 …(156)并且对于一个定向传播信号,或者当t从0变化到45度时,该输出应当为零,
LRL*cos(t)+LRR*sin(t)=0                    …(157)
这两个方程可以生成关于GR和GS的一个繁杂的二次方程,该二次方程可以用数值方法求解。
图31表示在沿cs=0轴具有恒定功率电平,和沿左侧与中央之间边界具有零输出条件下GS和GR的数值解。
使用如图所示的GS和GR值获得沿lr=0轴的较大改善,如预期一样。但是,保留了平方和沿左侧与中央之间边界的峰值。在实际的设计中,补偿这个误差或许不是非常重要的,但是我们可以采取一下策略来尝试这样做。我们用一个因子去除两个矩阵元,所说因子与基于lr和cs的一个新合成变量相关。这个新变量称为xymin。(实际上如下所述,可以用乘以所说因子的倒数代替相除)。定义xymin(用Matlab符号)的一种方法是:
%求得x或y的最小值
if(xymin>y)
xymin=y;
end
if(xymin>23)
xymin=23;
end
注意xymin从零变化到22.5度。如果我们将它乘以4,它将从0变化到90度,并且可以用于下列方程中。在左前象限中
LRL=(cos(cs)-GS(lr))/(1+.29*sin(4*xymin))           …(158)
LRR=(-sin(cs)-GR(lr))/(1+.29*sin(4*xymin))          …(159)在右前象限中
LRL=cos(cs)                                   …(160)
LRR=-sin(cs)                                  …(161)
如在先前的论文中所解释的,这些矩阵元又乘以“TV矩阵”校正,当所说定向传播靠近平面中部时,这会减小信号幅值。我们将TV矩阵的校正称为tvcorr(|lr|+|cs|)。在零度时tvcorr(|lr|+|cs|)为-3dB,当幅角变量为22.5度和更高时为1。
图32使用GR和GS的新值表示LRL和LRR平方和的平方根。在图32中这个因子以零定向传播点为中心呈现低谷形状。注意,除了由“TV矩阵”校正生成的低谷之外,平方和接近1,并且是连续的。
在本发明中,“TV矩阵”校正已经改进,从而当cs沿正面时仅仅依赖于lr的绝对值。这会使得上述平面沿前部的lr=0轴保持在0.71。在这种情况下,TV矩阵校正变为tvcorr(|lr|)。Tvcorr(|lr|)在零度时为-3dB,当幅角变量为22.5度和更高时为1。
上文中已经参照图14-16讨论了在存在后部定向传播情况下的后部矩阵元。在1991年专利(5136650)中给出的后部矩阵元不适合于5声道解码器,在Lexicon的CP-3产品中进行了试探性的改进。1996年7月的专利申请(08/684948)使用一种数学方法推导沿左后象限边界的这些矩阵元。如在先前的论文中所述,这种方法导致沿lr=0轴和沿cs=0轴存在间断点。在1.11版解码器中,通过对这些矩阵元进行附加校正修复了(大部分)这些间断点,所说矩阵元保留它们沿定向传播边界的特性。在本申请中早已说明了LRR矩阵元的软件错误,例如沿cs=0边界所说LRL矩阵元的小的间断(参见图14、15)。
对于这里所述的这些新矩阵元,这些错误已经修正,首先沿cs=0边界对LRL使用内插法,当cs为零时,使得其值与GS(lr)的值匹配,并且当cs向后侧以负值形式增大时平滑地增大到由上述数学公式给出的值。在新软件中,LRR沿cs=0轴内插到GR(lr)中。在1.11版解码器中,LRR内插到G(lr)。
当定向传播方向不确定或者位于正右侧和右后侧之间的任何方向时,我们首先考虑左后左矩阵元和左后右矩阵元。就是说,lr可以从0变化到-45度,cs可以从0变化到-22.5度。
在这些条件下,应当将输入的定向分量从左声道输出中消除-当定向传播朝向右侧或右后方向时左后声道中应当没有输出。
在1991年专利(5136650)中给出的矩阵元达到了这个目的。它们与4声道解码器中的后侧声道矩阵元基本相同,但是对非定向信号的响度增加了sin(cs)+cos(cs)的校正。经过这种校正,使得矩阵元十分简单。我们定义两个新函数,在这个范围内,它们就简单地等于cs的正弦sin和余弦cos。
LRL=cos(-cs)=sri(-cs)                          …(162)
LRR=sin(-cs)=sric(-cs)                         …(163)
为了在cs=0至-22.5范围内完成LRL和LRR,我们必须使“TV矩阵”模式的增益减小。在“TV矩阵”模式,我们还希望当定向传播方向不确定时输出减小3dB,但是当定向传播向后超过22.5度时,增大到“逻辑7”版解码器的值。通过使该减小值对|lr|和|cs|的和值敏感可以在一定程度上改善性能。在目前的设计中是通过在所说和值为零时使RRR和RRL矩阵元同时减小3dB,而当所说和值达到22.5度时使它们增大回复到它们的原始值而实现的。此外,这种增益变化的斜率是相对任意的,只要RRR和RRL都以同样方式变化即可。我们将这种TV矩阵校正称为tvcorr(|lr|+|cs|)。当幅角为零时tvcorr(|lr|+|cs|)为-3dB,而当所说幅角为22.5度或更高时为1。LRL=cos(-cs)*tvcorr(|lr|+|cs|) = sri(-cs)*tvcorr(|lr|+|cs|)  …(164)LRR=sin(-cs)*tvcorr(|lr|+|cs|)=sric(-cs)*tvcorr(|lr|+|cs|)   …(165)
注意,我们已经定义了一个新函数sric(x)和sri(x),前一个函数在0至22.5度的范围内等于sin(x),后者等于cos(x)。在定义存在向后定向传播信号时的左后矩阵元时我们将再次使用这些函数。
现在考虑当cs大于-22.5度时的相同矩阵元。如在Griesinger的早期AES论文和前文中所引用的专利和专利申请中所述,LRL在这个范围内应当增大到1或更大,而LRR应当减小到零。简单的函数就可以实现这一点:(记住cs为负值)
LRL=(cos(45+cs)+rboost(-cs))=(sri(-cs)+rboost(cs))     …(166)
LRR=sin(45+cs)=sric(-cs)                               …(167)
在存在向后定向传播信号时的左后矩阵元现在是完善的。左后左和左后右矩阵元的特性更加复杂。当lr从45减小到22.5或0时,所说的左后左矩阵元必须迅速从0增大到接近最大值。在1996年11月提出的修改申请中给出的矩阵元就是这样变化的,但是在前面我们已经证明,在cs=0边界处存在连续性问题(参见图15)。
对于1.11版解码器,使用具有一个变量和若干条件的几个函数求得了一个解。在Griesinger的AES论文和上文中引用的专利申请中,因为在cs=0边界的前侧上LRL矩阵元由GS(lr)给出,所以产生了在cs=0边界处的连续性问题。在后侧,由AES论文给出的所说函数具有相同的端点,但是在矩阵元之间是不同的。
在AES论文中提出的数学方法给出了在22.5<lr<45范围内左后矩阵元的下列方程:(记住t=45-lr)
LRL=cos(45-lr)*sin(4*(45-lr))-sin(45-lr)*cos(4*(45-lr))=sra(lr)                                    …(168)
LRR=-(sin(45-lr)*sin(4*(45-lr))+cos(45-lr).*cos(4* (45-lr))=-srac(lr)                                   …(169)
如果cs<=22.5,lr仍然可以从0变化到45。AES论文定义了当lr在0<lr<22.5的范围时的LRL和LRR,如在AES论文中图6所示。
LRL=cos(lr)= sra(lr)                             …(170)
LRR=-sin(lr)=-srac(lr)                           …(171)
于是定义了在0<lr<45范围内的两个函数sra(x)和srac(x)。
在1.11版解码器中,使用下述方法修复在cs=0边界上的断点。按照AES论文,在接近cs=0处,LRL和LRR都具有同一变量的函数。为了修复沿cs=0边界的连续性缺陷,我们增加了一个lr和cs的复合函数。这个新变量为lr_bounded,即lr与cs的约束差值。这个变量的定义十分复杂,我以伪-c(MATLAB)形式来表示它。
lr_bounded=lr-cs;%求得差值
if(lr_bounded<0)%%only iflr>cs
lr_bounded=0;
if(45-|cs|<lr_bounded)%使用两个值中较小的一个
lr_bounded=45-cs;
我们定义一个新函数,该函数等于前两个方程在cs=0时的差值。即是rear_active_correct(lr_bounded)。
For 0<x<45
Rear_active_correct(x) =sra(x)-(1-GSL(x))               …(172)
LRL=(sri(cs)+sra(lr)-rear_active_correct(lr_bounded)-1)*tvcorr(|lr|+|cs|)                            …(173)这种方法的重要点是当lr<22.5度时它起作用,而当lr大于22.5度时它不起作用。在1.11版解码器中没有使用的一种较好的方法是用于LRR的内插法。
1.11版解码器中的LRR矩阵元使用了一个较好的方法。这里存在两个断点。沿cs=0边界,后部LRR必须与向前方向的LRR匹配,这表明沿cs=0边界LRR=-G(lr)。
在1.11版“逻辑7”解码器中使用的选择-尽管计算量较大-利用基于cs在0至15度范围内的值的一种内插法。换句话说,当cs为零时,我们应用G(lr)求得LRR。当cs增大到15度时,我们插入值srac(lr)。
还有一种沿lr=0轴存在断点的可能性。通过在LRR中增加利用cs_bounded导出的一项我们可以求解这个断点。这一项简单地表示就是sric(cs_bounded)。这个项将确保整个lr=0轴的连续性。
首先我们定义cs_bounded
cs_bounded=lr-cs;
if (cs_bounded<1)%这限制了最大值
cs_bounded=0;
结束
if(45-|lr|<cs_bounded)%
使用两个值中较小的一个
cs_bounded=45-lr;
结束
对于cs=0至15
LRR=(-(srac(lr)+(srac(lr)-G(lr))*(15-cs)/15)+sric(cs_bounded))*tvcorr(|lr|+|cs|);
对于cs=0至15至22.5
LRR=(-srac(lr)+sric(cs_bounded))*tvcorr(|lr|+|cs|);
在根据本发明构成的解码器中,采用内插法计算LRL,就如LRR一样:对于cs=0至15
LRL=((sra(lr)+(sra(lr)-GS(lr))*(15-cs)/15)+sri(cs))*tvcorr(|lr|+|cs|);对于cs=15至22.5
LRL=(sra(lr)+sri(-cs))*tvcorr(|lr|+|cs|);
当定向传播方向从左后变化到正后方时,所说矩阵元与在AES论文中给出的相同,但是增加了对于后部响度的校正。对于cs>22.5,lr<22.5
LRL=(sra(lr)+sri(cs)+rboost(cs))                    …(174)
LRR=-srac(lr)+sric(cs_bounded)                      …(175)
这样完成了在向左定向传播时的LRL和LRR矩阵元。通过在定义中交换左和右可以求得在向右定向传播时的矩阵元值。
接着要讨论的改进是本发明中中央矩阵元的计算。
1.11版解码器中中央矩阵元与1996年7月的专利申请中的中央矩阵元具有明显差别。’89专利和杜比前向逻辑具有下列矩阵元。对于向前定向传播
CL=1+.41*G(cs)-G(lr)                   …(176)
CR=1+.41*G(cs)                         …(177)对于向后定向传播
CL=1-G(lr)                              …(178)
CR=1                                    …(179)
由于所说矩阵元具有围绕左/右轴的对称性,通过交换CL和CR可以求得在向右定向传播时的CL和CR值。
图33以三维形式表示4声道和杜比前向逻辑解码器的中央左(CL)矩阵元。如果将左和右交换,该图又是表示中央右矩阵元的图。该曲线的中部和右侧及后部顶点的值都为1。中央顶点的值为1.41。实际上,将这个矩阵元定标为最大值等于1。
在1996年7月提出的专利申请中,用正弦和余弦代替这些矩阵元:对于向前定向传播
GL=cos(45-lr)*sin(2*(45-lr))-sin(45-lr)*cos (2*(45-lr))+.41*G(cs)…(180)
CR=sin(45-lr)*sin(2*(45-lr))+cos(45-lr)*cos(2*(45-lr))+.41*G(cs)…(181)
这些方程过去从未使用过。在1.11版解码器中是基于1989专利中的定向传播方程,但是具有不同的定标,和不同的cs函数。我们发现减小中央输出中的非定向信号电平是重要的,并选择比前向逻辑电平低4.5dB的值。增殖函数(0.41*G(cs))被改变以当cs向中央增大时使所说矩阵元值增大回复到前向逻辑值。在1.11版解码器中增值函数的选择是相对任意的。
在1.11版解码器中,新的cs增值函数同以前一样从0开始,并随着cs的变化以这样的方式增大,即当cs从0变化到22.5度时CL和CR增大4.5dB。在1.11版解码器中,相对于cs每dB的增大,这种矩阵元增值为恒定的dB数。然后该函数呈一定斜率变化,使得在下一个20度范围内,所说矩阵元再增大3dB,之后保持不变。因此当定向传播朝向“前半部分”(8dB或23度)时,新矩阵元等于老矩阵元的中间值。当定向传播方向继续向前移动时,新矩阵元与老矩阵元变成相等。
因此,当定向传播方向不确定时中央声道的输出比老输出降低4.5dB,但是当定向传播方向完全朝向中央时,新矩阵元值增大到老矩阵元值。
图33表示在1.11版逻辑7解码器中的中央左矩阵元。注意,相对于图38中的曲线,中部值和右侧顶点及后部顶点已经减小4.5dB。当cs增大时,中央矩阵元以两个斜率增大到值1.41。
在1.11版解码器中使用的中央矩阵元解不是最佳的。在实践中解码器的大量经验已经表明当你在立体声(双声道)再现与矩阵再现模式之间切换时,可能会丢失流行音乐录音,和在某些影片中的对话的中央声道部分。此外,当中央声道电平改变时,与前部扬声器距离不等的听众会注意到中央声音移动的视在位置。在研究本发明的新矩阵过程中深入分析了这个问题。正如我们在后面能够看到的,当一个信号从左侧向中央或从右侧向中央沿边界展开时也存在一个问题。当展开至它们之间的中间点时上述值使得中央扬声器的输出过低。
现在我们考虑新设计中的中央声道。
所说中央声道输出必须从解码器的A和B输入信号获得。虽然能够利用矩阵方法将A或B输入信号从中央声道输出中去除,但是只要定向传播方向不是偏向左侧或右侧,中央声道就必须再现具有某个增益因子,增大或减小的A和B输入信号之和。它应当具有多高的响度?
这个问题的答案取决于左声道和右声道主输出的特性。上文给出的LFL和LFR的矩阵值用于当定向传播方向向前移动时消除所说输入信号中的中央分量。我们可以证明,如果输入信号已经提前用某些类型的交叉混声器,例如立体声宽度控制编码,上面所给出的矩阵元(1989年专利US-4862502中的矩阵元、1996年7月申请中的矩阵元、1.11版解码器矩阵元、和根据本发明导出的新矩阵元)都完全恢复了初始分隔。1.11版解码器矩阵元(当cs大约为22.5时电平升高)也恢复了初始分隔。
但是,如果解码器输入包括不相关的左声道和右声道,其中增加了一个不相关的中央声道:
A=Lin+.71*Cin                                      …(182)
B=Rin+.71*Cin                                      …(183)则当Cin的电平相对于Lin和Rin增大时,解码器的L和R前部输出的C分量不会完全消除,除非Cin比Lin和Rin大。通常在L和R前部输出中有一些Cin分量保留下来。听众会听到什么?
有两种方法可以计算听众听到什么。如果一个听众与左扬声器、右扬声器和中央扬声器之间是完全等距离的,他们将听到来自各个扬声器的声压之和。这与将三个前部输出相加是等效的。在这些条件下,容易证明,左扬声器和右扬声器的中央分量的任何减小都会造成中央分量声压的净损耗,而与中央扬声器的幅值无关。这是因为中央扬声器信号总是从A和B输入之和产生的,当它的幅值增大时,Lin和Rin的幅值都必须随着Cin信号的幅值一起增大。
但是,如果听众距离各个扬声器不是等距离的,则听众更有可能听到来自各个扬声器的声功率之和,该和值等于三个前部输出的平方和。事实上,仔细的试听已经证明所有扬声器的功率之和实际上是很重要的,所以我们必须考虑解码器所有输出的平方和。
如果我们希望设计矩阵,使得当在立体声再现与矩阵再现之间切换时能够保持Lin、Rin和Cin之间的幅值比,则中央输出中Cin分量的声功率的增大必须精确正比于它在左声道和右声道输出中声功率的减小,以及它在后部输出中的减小。增加的复杂性是左前和右前输出的电平产生上述的升高。这将导致中央输出需要较高的响度以保持功率比值不变。我们可以将这个要求写成一组声音功率方程。求解这些方程可以获得中央扬声器所需的增益函数。
以前我们给出了表示杜比前向逻辑解码器在各种条件下的能量关系。这种前向逻辑解码器不是最佳的。用我们的新解码器可以达到同样的目的。
在图35中,实线表示如果当定向传播方向角度向前部增大时在前部三个声道中保持了输入信号的中央分量的能量,新LFL和LFR所需的中央分量衰减。虚线表示一个标准解码器的中央分量值。
如在实线中可以看到的,中央声道电平所需的增大是十分急剧的-相对于每dB的定向传播变化值,所说电平幅值上升许多dB。这种幅值的急剧变化实际上是可以听到的。此外,尽管在流行音乐唱片中很好地保留了中央声道信息的相对平衡,但是如果一个人站在靠近中央扬声器处,电平的突然变化仍然会使人不快。另外,中央声道的响度是极限值。我们测试这个曲线,并发现中央平衡极佳,但是舞台前部主要是中央扬声器,左-右声道分隔最小。
有一个较好的方案。假定前面给出的LFL和LFR矩阵元,导出图35所示的中央声道衰减。如果我们使用不同的矩阵元怎么办?具体地说,我们需要主动地将中央分量从左前和右前输出中去掉吗?
试听表明1.11版解码器的矩阵元不必主动去除中央分量。从声学观点来看,也没有必要说它们应当这样做。从它们中去除的能量必须提供给中央扬声器。如果我们不去除这个能量,它会从左扬声器和右扬声器中产生,声场是类似的。技巧在于实现左扬声器和右扬声器中中央分量功率与中央扬声器中中央分量之间的平衡。
我们首先通过选择当cs沿lr=0轴增大时关于中央输出电平增高的平缓函数来生成最佳系统。然后我们可以求解左前输出和右前输出中所需的电平减小,以使房间中声场的Cin分量功率保持恒定。
让我们假定中央声道电平减小到比Griesinger的1989年专利中的解码器(4862502)中的电平低4.5dB,或者说,总共衰减7.5dB。这时的衰减系数为0.42。对于向前定向传播,
CL=.42-.42*G(lr)+GC(cs)                …(184)
CR=.42+GC(cs)                           …(185)对于向后定向传播
CL=.42-.42*G(lr)                     …(186)
CR=.42                                …(187)
对于GS(cs)尝试若干个函数。下面给出的一个函数是用角度cs(以度为单位)项表达的,利用某种试算法获得:
用MATLAB符号表示为:
center_max=.65;
center_rate=.75;
center_max2=1;
center_rate2=.3;
center_rate3=.1;
if(cs<12)
gc(cs+1)=.42* 10^(db*center_rate/(20));
tmp=gc(cs+1);
elseif (cs<30)
gc(cs+1)=tmp*10^((cs-11)*center_rate3/(20));
if(gc(cs+1)>center_max)
gc(cs+1)=center_max;
结束其它情况
gc(cs+1)=center_max*10^((cs-29)*center_rate2/(20));
if(gc(cs+1)>center_max2)
gc(cs+1)=center_max2;
结束结束
在图36中这个函数以实线表示。
如果假定LFL、LRL和LRR函数,我们可以求解所需的LFR函数。我们希望获得左声道和右声道输出中Cin分量应当减小的速率,然后设计产生该减小速率的矩阵元。这些矩阵元还应当使Lin和Rin分量有一定的增大,并且在左侧至中央边界,以及右侧至中央边界应当具有目前的形状。
我们假定:
LFL=GP(cs)                             …(188)
LFR=GF(cs)                             …(189)
CL=.42-.42*G(lr)+GC(cs)              …(190)
CR=.42+GC(cs)                         …(191)
左前和右侧扬声器的功率由下式给出:PLR=(GP^2+GF^2)*(Lin^2+Rin^2)+(GP-GF)^2*Cin^2    …(192)
中央扬声器的功率为:PC=GC^2*(Lin^2+Rin^2)+2*GC^2*Cin^2               …(193)
后部扬声器的功率与我们所使用的矩阵元有关。我们假定后部声道在存在向前定向传播信号时衰减3dB,和LRL为cos(cs),LRR为sin(cs)。于是,从一个扬声器,
PREAR=(.71*(cos(cs)*(Lin+.71*Cin)-sin(cs)*(Rin+.71*Cin)))^2…(194)如果我们假定Lin^2和Rin^2近似相等,对于两个扬声器,
PREAR=.5*Cin^2*((cos(cs)-sin(cs))^2+Lin^2        …(195)所有扬声器的总功率为PLR+PC+PREAR,因此:
PT=(GP^2+GF^2+GC^2)*(Lin^2+Rin^2)+((GP-GF)^2+2*GC^2)*Cin^2+PREAR            …(196)
所以Cin功率与Lin和Rin功率的比值(假定Lin^2和Rin^2相等)为:
RATIO=((GP^2+GF^2+GC^2)*(Lin^2+Rin^2)+((GP-GF)^2+2*GC^2)*Cin^2+PREAR)/PREAR=(((gp(cs)-gf(cs))^2+2*gc(cs)^2 +.5*(cos(cs)-sin(cs))^2)*Cin^2/2*(gp(cs)^2+gc(cs)^2+gf(cs)^2)+1)*Lin^2=(Cin^2/Lin^2)*((gp(cs)-gf(cs))^2+2*(gc(cs)^2)+.5*(cos(cs)-sin(cs))^2)/2*(gp(cs)^2+gc(cs)^2+gf(cs)^2)+1)     …(197)
对于标准立体声,GC=0,GP=1,和GF=0。于是,中央与LR功率比值为:
RATIO=(Cin^2/Lin^2)*0.5                            …(198)
如果这个比值是恒定的,而与有源矩阵的Cin^2/Lin^2比值无关,这是我们所希望的,则:
((gp(cs)-gf(cs))^2-2*gc(cs)^2)+.5*(cos(cs)-sin(cs))^2)=(gp(cs)^2+gc(cs)^2+gf(cs)^2)-.5)                   …(199)
方程(199)可以用数值方法求解。如果我们象前面一样假定上述的GC值,和GP=LFL,则图36以实线表示所得的GF值,以虚线表示sin(cs)*corrl(以前的LFR矩阵元),以点线表示sin(cs)。注意,在cs达到30度之前GF保持接近零值,然后急剧增大。实际上,我们在30度以上任意增大GF,以达到如虚线和点线所示的0.71值。这样当存在强定向传播信号时能够完全消除左声道和右声道中的中央声道分量。而且,必须将GF值沿所说边界平滑地插入到过去值中。实际上这些曲线的符号都是负号。
当cs从零增加到中央时,GF给定LFR矩阵元沿lr=0轴的形状。我们需要一种将该特性加入过去的LFR矩阵元的特性中的方法,所说特性沿左侧与中央,以及从右侧至中央之间的边界保持。当cs≤22.5度时实现这个目的的一种方法是定义GF与sin(cs)之间的一个差值函数。然后我们以各种方式限制这个函数。
用Matlab符号表示,
gf_diff=sin(cs)-gf(cs);
for cs=0∶45;
if(gf_diff(cs)>sin(cs))
gf_diff(cs)=sin(cs);
end
if(gf_diff(cs)<0)
gf_diff(cs)=0;
end
end
%求得约束的c/s
if(y<24)
bcs=y-(x-1);
if(bcs<1) %这限制了最大值
bcs=1;
结束其它情况
bcs=47-y-(x-1);
if(bcs<1)%>46)
bcs=1;%46;
结束结束
现在LFR矩阵元可以写成:
%该简结技巧在边界上进引插值
%当然,代价是分隔
if(y<23)%这是半个区域的简单方式
lfr3d(47-x,47-y)=-sin_tbl(y)+gf_diff(bcs);
else
tmp=((47-y-x)/(47-y))*gf_diff(y);
lfr3d(47-x,47-y)=-sin_tbl(y)+tmp;end
注意,在上述方程中gf_diff的符号是正号。因此,gf_diff消去了sin(cs)值,使矩阵元的值沿lr=0轴的第一部分减小到零。
图37表示左前右(LFR)矩阵元,其中对沿lr=0轴的中央声道电平进行了校正。注意,在平面中部(没有定向传播信号)该值为零,并且当cs沿lr=0轴增大到22.5度时保持为零。然后其值降低以沿从左侧至中央和从右侧至中央的边界与过去值匹配。
现在我们考虑中央输出中的展开误差。
图38表示具有新中央增值函数GC(cs)的中央左(CL)矩阵元。注意沿左侧与中央之间边界对于信号展开的校正。
当其导出时,新中央函数(如果我们以这种方式写出):
CL=.42-.42*G(lr)+GC(cs)                …(200)
CR=.42+GC(cs)                           …(201)沿lr=0工作良好,但是沿左侧与中央,和右侧与中央之间的边界产生展开误差。在1996年7月的专利申请中的值沿左侧边界给出一个平滑函数cos(2*cs),该函数构成左侧与中央之间的平滑展开。我们希望我们的新中央函数沿这个边界具有类似的特性。
我们可以对所说矩阵元进行校正,通过增加一个xymin的附加函数可以实现(用Matlab符号表示):
center_fix_tbl=.8*(corrl-1);
CL=.42-.42*G(lr)+GC(cs)+center_fix_table(xymin)
CR=.42+GC(cs)+center_fix_table(xymin)
图39表示当一个信号从中央向左侧展开时中央输出和左侧输出的电平。注意,对中央展开进行校正,虽然并不完美,但是可以合理地接近左侧输出的倒数。(cs轴上的值是倒置的)。
现在我们考虑一个新的5声道编码器(称为“逻辑7”),这种编码器用于与由上述方程和算法规定的解码器正确地配合工作。
这种编码器有两个主要目标。第一,它应当能够以这样的方式编码一个5.1声道磁带,使得能够将编码内容用根据本发明构成的逻辑7解码器以最大精确度解码。第二,编码输出应当与立体声兼容-就是说,它听起来应当尽可能地接近相同声音的人工双声道混音效果。这种与立体声兼容的一个要素应当是当该编码器的输出在一个标准立体声系统上播放时,对于初始的5声道混音中的每个声源应当给出相同的感觉响度。立体声中声源的视在位置也应当尽可能地接近5声道初始信号中的视在位置。在与慕尼黑广播技术研究所(IRT)的讨论中,已经清楚,如上所述立体声信号的立体声兼容性的目的无法通过单独调整编码器实现。其中所有声道都具有同等前景重要性的一个5声道录音必须按照上述方式编码。这种编码要求在保持能量恒定的前提下将环绕声道混合到编码器输出中。就是说,编码器输出的总能量应当是相同的,而与哪一个输入信号驱动无关。这种技术包括大部分影片声源和5声道音乐声源,其中乐器被分配到所有5个扬声器。尽管这种音乐声源在目前并不普及,但是本发明人认为将来它们会很普及。但是在前台乐器放置在前部三个声道中,在后部声道中主要是混响,的音乐录音需要一种不同的技术。
经过在IRT和其它地方的一系列测试之后,已经确定,如果将环绕声道以比其它声道功率低3dB进行混音,就可以用立体声兼容方式成功地对这种类型的音乐记录进行编码。这个3dB电平在欧洲已经作为环绕声编码的一个标准,但是该标准规定为了特殊目的,可以使用其它的环绕声电平值。正如我们在下文中将要看到的,新编码器包含检测环绕声道中强信号的有源电路。当这类信号偶尔出现时,该解码器使用完全环绕声电平。如果环绕声输入继续为-6dB或比前部声道低,则环绕声增益逐渐降低3dB以符合欧洲标准。
在慕尼黑IRT进行测试的过程中发现,将一盘特殊的录音带用在AES论文(预印本号No.4402)中所述的编码器错误地编码。为此开发出一种新的结构格式来解决这盘录音带的问题。虽然仅仅对这盘特殊录音带的编码进行了或多或少的改进,但是新编码器在多种很难的题材上具有优异的性能。原来的编码器首先被用作一个无源编码器,对于各种输入信号它都具有相当良好的表现。所说新编码器也能以无源模式工作,但是主要是用作有源编码器(即在该编码器中编码处理与在其输入端的信号类型有关)。这个有源电路校正了设计中固有的一些小的错误。但是,即使没有有源校正,其性能也优于前文所述的编码器。
在仔细试听之后,发现了第一种编码器存在的一些小问题。在新编码器中已经解决了这些问题中的许多,但不是全部。例如,当将立体声信号同时施加到该编码器前部声道和后部声道输入端时,所形成的编码器输出过于偏向前部。这种新编码器通过略微增大声音向后的偏移来补偿这种效应。同样,我们已经发现,当用基本为环绕声的分量对一部影片进行编码时,存在一个净的声音向后偏移,这会减小在中央声道中的对话信号功率。这在影片中是重要的,对话的清晰度是极为重要的。这种新编码器通过在这些条件下略微提高输入到编码器中的中央声道分量来补偿这种效应。
在图40中以方框示意图形式表示的新编码器按照与以往的编码器,以及与杜比编码器相同的方式处理左声道、中央声道和右声道,只是衰减器302中的中央衰减函数fcn等于0.71或-3dB。
根据图10和11中所示的以前的编码器设计,左声道(L)、中央声道(C)和右声道(R)信号分别施加到编码器电路的输入端50、52和54。左侧(LS)声道和右侧(RS)声道信号分别施加到输入端62和64。一个附加信号LFE(在5+1混音中制造低频效果)施加到一个新的输入端370.所说C信号和LFE信号分别通过衰减器/增益元件372、374,其中C信号放大fcn倍,LFE放大2.0倍。这些信号分别施加到两个加法电路278和282。所说L信号直接施加到加法电路278,类似地,R信号施加到加法电路282。环绕信号也施加到这些加法电路中,但是仅仅在某些操作之后,它似乎比其实际情况复杂得多。在环绕声道衰减器376、378、380和382中,函数fc()和fs()使得环绕声道或者连接到相对于前部声道(其经由相移器286和288)具有90度相移的一条路径(经由相移元件234和246)或者是没有相对相移的一条路径。在基本编码器中,fc为1,fs为0,从而有源路径通过90度相移器。因此,所说LS信号没有改变地通过方框376到达衰减器396,在所说衰减器中将该信号乘以0.91的因子,然后传送到加法器406,在加法器中将其与来自衰减器404的交叉耦合RS信号混合,衰减器404的增益为-crx。crx的值通常为0.38。它控制每个环绕声道的负交叉馈电量。然后,该信号通过一个90度相移器234和一个加法器276,在加法器中将其与从相移器286传送至这个加法器的其它信号进行混合,并作为所说“A”信号传送至输出端44。与以前的编码器一样,当只有一个输入信号施加的回绕声道之一时,输出端44和46的A和B输出分别具有幅值比-0.38/0.91,这样形成了向后的22.5度的定向传播角。
施加到输入端64的所说RS信号类似地以单位增益通过衰减器382,传送至变换元件400,然后,对于LS声道,以0.91的增益通过一个衰减器402。之后在加法器408中将这个信号与-crx乘以未改变的RS信号相加。至于LS声道,所说信号通过一个90度相移器单元246,并由此传送至一个加法器元件280。所说R、C、LFE信号在加法电路中相加之后经由一个相移元件288输入加法器280,在加法器中它们与发生相移的RS和发生交叉的LS信号混合,以在输出端46形成“B”输出信号。
如常,对于输出端44和46的每一个输出信号,输出电平为1,因为0.38和0.91的平方和为1。
虽然当只驱动一个声道时,编码器的输出是简单的,但是当同时驱动两个环绕输入时就会产生问题。如果我们用同一信号驱动LS和RS输入,这是影片中的一种通用做法,在加法器节点的所有信号都是同相的,所以总输出电平为0.38+0.91,或1.29。输出放大1.29倍或增大2.2dB后太强了。当出现这种情形,即,当所说的两个环绕声道的幅值相同并且同相时,设置在编码器中的有源电路(未示出,但是与解码器中的有源电路相似)将所说增益减小2.2dB。
当两个环绕输入信号电平相等并且异相时产生其它错误。在这种情况下,这两个衰减系数相减,因此输出电平为0.91-0.38或者等于0.53。这个信号将作为一个中央方向信号解码,并且电平降低。这个错误是严重的。以前的编码器在这些条件下产生一个非定向传播信号,这是合理的。而施加到后侧输入端的信号应当产生一个中央方向的信号是不合理的。因此,当两个后部声道近似,但是反相时,有源电路(未示出,但是与解码器中的类似)使fs的值增大。将后部声道的真正路径与相移路径合并的结果是在输出声道A和B之间产生90度的相位差,其代表一个非定向传播信号,这是所希望的效果。
在慕尼黑IRT讨论过程中,注意到有一种欧洲标准环绕声编码器。这种编码器将两个环绕声道简单地衰减3dB,并将它们加入前部声道。因此左后声道被衰减3dB,并加入左前声道中。这种编码器在对多声道影片声音或包含指定环绕声道的特殊乐器的唱片进行编码时具有许多不足。这些乐器的响度和方向都会被错误地编码。但是,这种编码器在古典音乐的情况下工作得非常好,其中两个环绕声道主要是混响。通过试听仔细地选择3dB衰减,以提供立体声兼容编码。当对古典音乐进行编码时,本发明的新编码器还应当结合这个3dB衰减,并且通过监测编码器中前部声道与环绕声道的相对电平能够检测这种条件。
所以,环绕声道中函数fc的主要作用是当环绕声道比前部声道声音低时,将输出混合信号中环绕声道的电平减小3dB。设置与解码器中类似的电路来比较前部声道和后部声道电平,并且当后部声道降低3dB时,fc最多减小到3dB。当后部声道强度比前部声道小8dB时,达到这个3dB最大衰减。这个有源电路似乎工作良好。它使得新编码器与用于古典音乐的欧洲标准编码器兼容。但是,用全电平编码那些预期在后部声道中较强的乐器。
环绕声道实数系数混声路径fs还有其它作用。应当指出,在施加于加法电路278和282之前,这条路径通过衰减器378和380,还通过交叉馈电元件384和386,传送至相反声道中的加法器392和394,在主信号路径中包含衰减系数为0.91的衰减器元件388和390。当一个声音从左前输入端向左后输入端移动时,有源电路(未示出)将这些输入端中的电平进行比较,并检测这些信号是否幅值相等和同相,在这些条件下,fc减小到零,而fs增大到1。这种在编码过程中改变为实数系数使得对于这种类型的声音展开的编码精度更高。在实践中,这种作用可能不是必需的,但是看起来它似乎是一种精细的改进。
总之,所说有源电路包括用于将每一侧的前部声道与后部声道之间的电平和相位进行比较,和用于将所说前部声道和后部声道中的相对能量进行比较的元件。这些电路很容易以对数比检测器的形式实现,对于本领域技术人员来说是众所周知的。根据这些检测器输出的结果,这些有源电路
1、当这些信号同相时,将环绕声道的电平减小2.2dB;
2、当两个后部声道异相时,使后部声道的实数系数混声路径足够增大,以建立非定向传播条件;
3、当环绕声电平比前部声道小得多(-8dB)时,减小环绕声道的电平3dB;
4、当后部声道的电平与前部声道电平相似时,增大后部声道的电平和负相位;和
5、当一个声源从一个前部输入端向相应的后部输入端展开时,使环绕声道与实数系数混合。
对于编码器的其它改进很可能包括前部声道的特征,从而当两个前部声道异相时,编码器不会使解码器将声音后置,象现在这样,而是检测这种状态,并使编码输出似乎是非定向的(即所说A与B声道之间产生正交相移)。
虽然已经介绍和说明了本发明的优选实施例,但是还存在许多其它可能的实施例,这些和其它改进对于本领域技术人员来说是显而易见的,而没有脱离本发明的构思。

Claims (13)

1.一种环绕声解码器,其用于将包含定向编码分量和非定向分量的一对左和右音频输入信号重新分配到多个输出声道以借助于环绕一个听场的多个扬声器予以再现,结合有用于确定所说左和右音频信号中的定向分量,并从中产生至少一个左-右定向传播信号和中央-环绕定向传播信号,所说解码器包括:
延迟器,用于延迟所说左和右音频输入信号中的每一个以产生经过延迟的左和右音频信号;
多个乘法器,其数目等于所说多个输出声道数目的两倍,成对设置,每对所说乘法器中的一个第一元件接收所说经过延迟的左音频信号,一个第二元件接收所说经过延迟的右音频信号,每个所说乘法器将其输入音频信号乘以一个可变矩阵系数以产生一个输出信号;
所说可变矩阵系数由所说定向传播信号之一或两个控制;
多个加法器,一个加法器对应于所说多个输出声道中的一个,每个所说加法器接收一对所说乘法器的输出信号,并在其输出端产生所说多个输出信号之一,
所说解码器所具有的可变矩阵值这样构成,使得能够减小输出信号中沿预定方向再现时不直接涉及的定向编码音频分量;增强输出信号中沿预定方向再现时直接涉及的定向编码分量,从而保持这些信号具有恒定的总功率;同时与所说定向传播信号无关地保持所说非定向信号的左声道和右声道分量之间的较大分隔;和不论是否存在定向编码信号,和如果存在则与其预定方向无关地,都使定义为非定向信号总音频功率电平的响度有效地保持恒定。
2.如权利要求1所述的解码器,其特征在于所说左和右音频输入信号起初是从5声道编码为2声道,其中所说多个输出信号为5个,从而所说左和右音频输入信号解码为5个输出信号,通过放大和将所说5个经过放大的输出信号施加到设置在听众周围的5个扬声器而再现所说输出信号。
3.如权利要求2所述的解码器,其特征在于所说扬声器位于听众的左前、中央前部、右前、左后和右后位置,通常按照所说输出信号相对于听众位置的预定方位对它们命名。
4.如权利要求3所述的解码器,其特征在于除了所列举的5个输出信号以外,为了产生低频声音效果,还产生一个带宽有所减小的第六音频输出信号。
5.如权利要求1至4所述的解码器,其特征在于利用模拟电路将所说左和右音频输入信号解码为所说的多个输出信号。
6.如权利要求1至4所述的解码器,其特征在于利用数字信号处理电路将所说左和右音频输入信号解码为所说的多个输出信号,在首先将所说输入信号转换为数字形式之后,最后将所说输出信号转换回适合在听众周围的同样多个扬声器上再现的模拟形式。
7.如权利要求3所述的解码器,其特征在于所说可变矩阵系数确定:当所说左-右定向传播信号具有较小幅值时所说后部输出信号的电平保持在低3dB的电平值,而当所说定向传播信号幅值在再现电视声的工作模式下等效于22.5度或更大的定向传播角度时,所说输出信号电平提高到全幅值,但是与所说中央-环绕定向信号无关,从而当在向前方向上出现定向传播信号时,使后部输出相对于前部输出的声音电平变化较小,进而产生更加自然和平滑的环绕声效果。
8.如权利要求3所述的解码器,其特征在于当所说定向传播信号之一急剧变化时,限制另一所说定向传播信号的绝对值,从而对动态效果产生改进的响应。
9.如权利要求3所述的解码器,其特征在于在每个前部象限中计算所说输入信号左分量和右分量的系数,使得当所说中央-环绕定向传播信号接近零时,这些矩阵元的平方和等于1,从而减小由于定向传播而使传输到所说扬声器的总功率产生的不利变化。
10.如权利要求3所述的解码器,其特征在于提供一个中央增值函数,使得在保持非定向声音的最大左-右分隔的同时,中央声源的视在移动最小。
11.如权利要求3所述的解码器,其特征在于使一个新的中央前部矩阵系数以这样的方式与所说中央环绕定向传播信号相关,使得在达到向前的一个30度有效角度时所说中央声道输出增大到比标准型解码器低3dB的一个值,然后更加急剧地增大到当定向传播完全向前时在所说标准型解码器中所使用的最大电平相同值,此外减小左前和右前声道中信号的中央分量电平,以保持在解码器的每个输出的功率之和中中央输入信号功率与编码器的所有其它输入信号的总功率的比值不变,所说解码器的左和右音频输入信号从所说比值获得;从而保持所说解码器的输出中中央信号与其它信号之间具有与所说信号编码之前相同的平衡,并且还保持最初用于2声道回放的录音中中央信号与其它信号之间的平衡。
12.一种有源编码器,其适用于将全带宽5声道音频信号编码到两个输出声道上,所说5个输入声道分别为左前、中央前部、右前、左后或环绕、和右后或环绕声道,所说输出声道分别包括左或A声道和右或B声道,所说编码器包括:
分别用于所说左前、中央前部、右前、左环绕、和右环绕声道的第一、第二、第三、第四和第五输入端;
与所说第二输入端相连的一个衰减器电路,其用于将所说中央前部信号衰减fen倍;
 第一和第二加法电路,所说第一加法电路从所说衰减器电路接收经过衰减的中央前部信号和从所说第一输入端直接接收所说左前输入信号,所说第二加法电路也接收所说经过衰减的中央前部信号和从所说第三输入端直接接收所说右前信号;
第一函数衰减器,其具有衰减函数fc(l,ls),用于衰减从所说第四输入端接收的所说左环绕信号;
第二函数衰减器,其具有衰减函数fc(r,rs),用于衰减从所说第五输入端接收的所说右环绕信号;
第三函数衰减器,其具有衰减函数fs(l,ls),用于衰减从所说第四输入端接收的所说左环绕信号;
第四函数衰减器,其具有衰减函数fs(r,rs),用于衰减从所说第五输入端接收的所说右环绕信号;
第一、第二、第三和第四交叉馈电衰减器,其具有衰减系数-crx,各个衰减器分别从所说的第一、第二、第三和第四函数衰减器接收所说输出信号;
第一、第二、第三和第四固定衰减器,其衰减系数为0.91,各个衰减器分别从所说第一、第二、第三和第四函数衰减器接收所说输出信号;
第一、第二、第三和第四加法器,各个加法器分别从所说第一、第二、第三和第四固定衰减器接收所说输出信号,并将它们分别与所说第二、第一、第四和第三交叉馈电衰减器的输出信号相加;
第一和第二相移器电路,其具有相移函数-90°,分别用于接收所说第一和第二加法器的输出;
第三和第四相移器电路,其具有相移函数-0°,分别用于接收所说第一和第二加法电路的输出,所说第一和第二加法电路还分别接收所说第三和第四加法器的输出,并分别将它们与左前和右前输入信号以及从与所说第二输入端相连的所说衰减器电路输出的经过衰减的中央前部信号相结合;
第三加法电路,其用于将分别从所说第一和第三相移器电路输出的信号相加,以向一个第一输出端提供所说左或A输出信号;
第四加法电路,其用于将分别从所说第二和第四相移器电路输出的信号相加,以向一个第二输出端提供所说右或B输出信号;
第一、第二、第三、第四和第五对数幅值检测器,其用于检测施加到所说第一、第二、第三、第四和第五输入端的信号幅值;
第一和第二比较器,其用于将分别在左侧和右侧上的前和后信号的对数幅值进行比较;
响应所说第一比较器输出的装置,其用于当主要信号方向从左前方向变化到左环绕方向时,使所说第一函数衰减器的函数fs(l,ls)从1减小到0,和使所说第三函数衰减器的函数fc(l,ls)以互补方式从0增大到1;
响应所说第二比较器输出的装置,其用于当主要信号方向从右前方向变化到右环绕方向时,使所说第二函数衰减器的函数fc(r,rs)从1减小到0,和使所说第四函数衰减器的函数fs(r,rs)以互补方式从0增大到1;
第三比较器,其用于将所说前部信号的对数幅值与所说后部信号对数幅值进行比较;
响应所说第三比较器输出信号的装置,其用于当所说前部信号超过后部信号达到(可达)8dB或更多时,使所说函数fcn减小(可达)3dB;
第四比较器,其用于比较施加到所说第四和四五输入端的左环绕和右环绕输入信号之间的相位和幅值;和
响应所说第四比较器输出信号的装置,其用于当所说的两个环绕信号幅值相同并且同相时使所说第一和第二函数衰减器的增益减小2.2dB,和当所说的两个环绕信号幅值相同而相位相反时使所说第三和第四函数衰减器的增益增大,从而迫使所说A和B输出具有代表一种非定向传播条件的正交相位关系。
13.如权利要求12所述的编码器,它还包括:
一个第六输入端,用于接收一个低频效果信号;
一个增益为2.0的增益级,其用于放大所说的低频效果信号;
所说经过放大的低频效果信号还同等地施加到所说第一和第二加法电路的附加输入端,从而分别使得所说第一和第二输出端的A和B输出相等并且同相。
CNB988109131A 1997-09-05 1998-09-03 5-2-5矩阵编码器和解码器系统 Expired - Lifetime CN1214690C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US5816997P 1997-09-05 1997-09-05
US60/058,169 1997-09-05
US09/146,442 US6697491B1 (en) 1996-07-19 1998-09-03 5-2-5 matrix encoder and decoder system
US09/146,442 1998-09-03

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2005100635227A Division CN1691841B (zh) 1997-09-05 1998-09-03 5-2-5矩阵编码器和解码器系统

Publications (2)

Publication Number Publication Date
CN1278996A true CN1278996A (zh) 2001-01-03
CN1214690C CN1214690C (zh) 2005-08-10

Family

ID=26737320

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB988109131A Expired - Lifetime CN1214690C (zh) 1997-09-05 1998-09-03 5-2-5矩阵编码器和解码器系统

Country Status (6)

Country Link
EP (1) EP1013140B1 (zh)
JP (2) JP2004507904A (zh)
CN (1) CN1214690C (zh)
AU (1) AU750877C (zh)
PL (1) PL338988A1 (zh)
WO (1) WO1999012386A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100589657C (zh) * 2005-04-13 2010-02-10 杜比实验室特许公司 编码音频的节约式响度测量方法及装置
CN101010986B (zh) * 2004-08-26 2010-11-17 雅马哈株式会社 音频再现设备
CN1748247B (zh) * 2003-02-11 2011-06-15 皇家飞利浦电子股份有限公司 音频编码
CN102292772A (zh) * 2008-10-30 2011-12-21 三星电子株式会社 多声道信号的编码/解码装置和方法
CN1901043B (zh) * 2002-12-14 2012-01-11 三星电子株式会社 立体声音频编码方法及装置,音频流解码方法及装置
CN101336563B (zh) * 2005-12-02 2012-02-15 杜比实验室特许公司 低复杂度的音频矩阵解码器
CN101228575B (zh) * 2005-06-03 2012-09-26 杜比实验室特许公司 利用侧向信息的声道重新配置
CN101233571B (zh) * 2005-07-29 2012-12-05 Lg电子株式会社 处理音频信号的方法和装置
CN101361122B (zh) * 2006-04-03 2012-12-19 Lg电子株式会社 处理媒体信号的装置及其方法
CN103000179A (zh) * 2011-09-16 2013-03-27 中国科学院声学研究所 一种多通道音频编解码系统及其方法
CN102124513B (zh) * 2008-08-13 2014-04-09 弗朗霍夫应用科学研究促进协会 用于确定转换的空间音频信号的装置
CN104160442A (zh) * 2012-02-24 2014-11-19 杜比国际公司 音频处理
CN108206021B (zh) * 2016-12-16 2020-12-18 南京青衿信息科技有限公司 一种后向兼容式三维声编码器、解码器及其编解码方法

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6154660A (en) * 1998-07-21 2000-11-28 Ericsson Inc. Callee-based telephone line preselection
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
WO2007043388A1 (ja) * 2005-10-07 2007-04-19 Matsushita Electric Industrial Co., Ltd. 音響信号処理装置および音響信号処理方法
TWI517562B (zh) * 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
US8515106B2 (en) 2007-11-28 2013-08-20 Qualcomm Incorporated Methods and apparatus for providing an interface to a processing engine that utilizes intelligent audio mixing techniques
US8660280B2 (en) * 2007-11-28 2014-02-25 Qualcomm Incorporated Methods and apparatus for providing a distinct perceptual location for an audio source within an audio mixture
MY159890A (en) 2008-04-18 2017-02-15 Dolby Laboratories Licensing Corp Method and apparatus for maintaining speech audibiliy in multi-channel audio with minimal impact on surround experience
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4152542A (en) * 1971-10-06 1979-05-01 Cooper Duane P Multichannel matrix logic and encoding systems
JPS5248001B2 (zh) * 1973-08-20 1977-12-07
US4862502A (en) * 1988-01-06 1989-08-29 Lexicon, Inc. Sound reproduction
JP2647991B2 (ja) * 1990-04-26 1997-08-27 三洋電機株式会社 方向性強調を有するオーディオ信号処理装置
US5504819A (en) * 1990-06-08 1996-04-02 Harman International Industries, Inc. Surround sound processor with improved control voltage generator
US5172415A (en) * 1990-06-08 1992-12-15 Fosgate James W Surround processor
US5136650A (en) * 1991-01-09 1992-08-04 Lexicon, Inc. Sound reproduction
GB9103207D0 (en) * 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
JPH0560098U (ja) * 1992-01-09 1993-08-06 三洋電機株式会社 音声信号処理装置
US5796844A (en) * 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1901043B (zh) * 2002-12-14 2012-01-11 三星电子株式会社 立体声音频编码方法及装置,音频流解码方法及装置
CN1748247B (zh) * 2003-02-11 2011-06-15 皇家飞利浦电子股份有限公司 音频编码
CN101010986B (zh) * 2004-08-26 2010-11-17 雅马哈株式会社 音频再现设备
CN100589657C (zh) * 2005-04-13 2010-02-10 杜比实验室特许公司 编码音频的节约式响度测量方法及装置
TWI424754B (zh) * 2005-06-03 2014-01-21 Dolby Lab Licensing Corp 利用側邊資訊之聲道重新組配技術
CN101228575B (zh) * 2005-06-03 2012-09-26 杜比实验室特许公司 利用侧向信息的声道重新配置
CN101233571B (zh) * 2005-07-29 2012-12-05 Lg电子株式会社 处理音频信号的方法和装置
CN101336563B (zh) * 2005-12-02 2012-02-15 杜比实验室特许公司 低复杂度的音频矩阵解码器
CN101361122B (zh) * 2006-04-03 2012-12-19 Lg电子株式会社 处理媒体信号的装置及其方法
CN102124513B (zh) * 2008-08-13 2014-04-09 弗朗霍夫应用科学研究促进协会 用于确定转换的空间音频信号的装置
CN102292772A (zh) * 2008-10-30 2011-12-21 三星电子株式会社 多声道信号的编码/解码装置和方法
US8959026B2 (en) 2008-10-30 2015-02-17 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding multichannel signal
US9384743B2 (en) 2008-10-30 2016-07-05 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding multichannel signal
CN102292772B (zh) * 2008-10-30 2016-08-31 三星电子株式会社 多声道信号的编码/解码装置和方法
CN103000179A (zh) * 2011-09-16 2013-03-27 中国科学院声学研究所 一种多通道音频编解码系统及其方法
CN103000179B (zh) * 2011-09-16 2014-11-12 中国科学院声学研究所 一种多通道音频编解码系统及其方法
CN104160442A (zh) * 2012-02-24 2014-11-19 杜比国际公司 音频处理
CN104160442B (zh) * 2012-02-24 2016-10-12 杜比国际公司 音频处理
US9728194B2 (en) 2012-02-24 2017-08-08 Dolby International Ab Audio processing
CN108206021B (zh) * 2016-12-16 2020-12-18 南京青衿信息科技有限公司 一种后向兼容式三维声编码器、解码器及其编解码方法

Also Published As

Publication number Publication date
JP4782614B2 (ja) 2011-09-28
WO1999012386A9 (en) 2004-10-21
EP1013140A1 (en) 2000-06-28
AU750877B2 (en) 2002-08-01
AU9302698A (en) 1999-03-22
WO1999012386A1 (en) 1999-03-11
PL338988A1 (en) 2000-12-04
CN1214690C (zh) 2005-08-10
JP2006238498A (ja) 2006-09-07
EP1013140B1 (en) 2012-12-05
AU750877C (en) 2004-04-29
JP2004507904A (ja) 2004-03-11
EP1013140A4 (en) 2003-05-07

Similar Documents

Publication Publication Date Title
CN1278996A (zh) 5-2-5矩阵编码器和解码器系统
CN1116785C (zh) 具有最大横向分离度的多声道主动型矩阵音响重放
CN1116737C (zh) 用户可调节的适应听力的音量控制
CN1926607A (zh) 多信道音频编码
CN101040564A (zh) 音频信号处理装置及音频信号处理方法
CN1250045C (zh) 车载音响重现装置
CN1211775C (zh) 在数字音频产生过程中用于适应主要内容音频和次要内容剩余音频能力的方法
CN1281098C (zh) 环绕处理系统、环绕处理装置和环绕处理方法
CN1254153C (zh) 声校正装置和声校正的方法
JP5513887B2 (ja) 多チャネル信号のためのスイートスポット操作
CN1605225A (zh) 产生声场的方法和装置
CN1248223C (zh) 信息信号再现设备
CN1672464A (zh) 音频声道空间转换
CN1226901C (zh) 从两路输入音频信号中导出至少三路音频信号的方法
CN101039536A (zh) 音频信号处理设备、音频信号处理方法及程序
CN1111984C (zh) 噪声抑制装置
CN1541456A (zh) 多通道回声消除方法、多通道声音传送方法、立体回声消除器、立体声音传送装置和传递函数计算装置
CN1627862A (zh) 多个扬声器的音响系统以及自动控制方法
CN1468029A (zh) 声音映像控制系统
CN1208288A (zh) 用于视听设备的信号处理及声象定位装置和方法
CN1257639A (zh) 音频信道混合
CN101044551A (zh) 用于双声道提示编码方案和类似方案的单通道整形
CN1643982A (zh) 用于控制声场再现单元的方法和器件
CN1495705A (zh) 多通道声码器
CN1756446A (zh) 音频信号处理装置及用于其的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20050810

CX01 Expiry of patent term