CN1214690C - 5-2-5矩阵编码器和解码器系统 - Google Patents

5-2-5矩阵编码器和解码器系统 Download PDF

Info

Publication number
CN1214690C
CN1214690C CNB988109131A CN98810913A CN1214690C CN 1214690 C CN1214690 C CN 1214690C CN B988109131 A CNB988109131 A CN B988109131A CN 98810913 A CN98810913 A CN 98810913A CN 1214690 C CN1214690 C CN 1214690C
Authority
CN
China
Prior art keywords
signal
output
sound
decoder
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB988109131A
Other languages
English (en)
Other versions
CN1278996A (zh
Inventor
戴维·H·格里辛格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LEXICON
Original Assignee
LEXICON
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LEXICON filed Critical LEXICON
Priority claimed from US09/146,442 external-priority patent/US6697491B1/en
Publication of CN1278996A publication Critical patent/CN1278996A/zh
Application granted granted Critical
Publication of CN1214690C publication Critical patent/CN1214690C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Error Detection And Correction (AREA)

Abstract

用于将2输入声道的立体声信号转换为多个输出声道信号的一种声再现系统,在所说两个输入声道中至少一个信号分量是定向编码和相关的,并且至少一个信号分量是非定向编码和去相关的,包括解码装置,用于增强输入信号中沿所需方向的相关分量和减小声道中与编码方向不相关的信号的强度,同时保持对应的左输出声道与右输出声道之间的分离度,和保持在各个输出声道中输入声道的去相关分量的总能量,从而使记录在右输入声道上的乐器保留在输出声道的右侧,而记录在左声道上的乐器保留在左侧,在所有输出声道中的所有乐器的视在响度都与输入信号中定向编码分量方向无关地保持相同,和编码装置,用于编码5输入声道,从而可以在本发明的解码器中,和在目前的影片标准解码器中以正确的方向和电平对它们进行解码。该解码装置最佳地调节中央声道的电平,以在再现影片时保持输入信号的能量比值,或者在再现音乐信号时从左前和右前输出中消除输入信号的中央分量;它还包括设置在环绕输出中的频率相关单元,以改善在5声道和7声道扬声器中再现侧面和后部信号分量的效果。

Description

5-2-5矩阵编码器和解码器系统
                       相关申请的交叉参引
本申请基于1997年9月5日提出的、发明名称为“5-2-5矩阵编码器和解码器系统”的美国临时专利申请No.60/058169。
                          发明领域
本发明涉及声音再现系统,该系统用于将一对立体声输入音频信号解码为多个输出信号,从而在经过设置于听众周围的同样多个扬声器适当放大之后予以再现,以及将多声道信号编码为2声道信号。
                          发明背景
本发明涉及建立解码矩阵的改进的设计标准及其解决方案,所说矩阵在再现经过编码的多声道素材信号以及标准的2声道素材信号时具有最佳的心理声学特性,包括在所有状态下,即使在输入信号中存在净向前或向后的偏离分量时,或者当存在沿特定方向的一个强的声音分量时,使立体声信号左右分量之间保持较大的分离度,在使具有限定方向的各个输出信号之间保持较大的分离度的同时,使非定向编码的分量保持恒定的声级,而不管输入音频信号的定向编码分量的方向如何,还包括频率相关电路,该电路改善了前部信号与后部信号之间的平衡,形成该系统7声道版的声音平滑运动特质,和使5声道版的声音效果接近7声道版的声音效果。
此外,本发明涉及建立编码电路的改进的设计标准及其解决方案,所说编码电路用于将多声道声音编码为2声道信号,以便在标准的2声道接收器中和使用根据本发明构成的解码器再现。
本发明是使将多声道音频信号编码为两个独立声道,然后将所获得的2声道分解回复到它们初始的多声道信号的手段精益求精的不懈努力的一部分。这种编码/解码程序的目标之一是重建听起来尽可能与初始信号相同的初始信号。这种解码器的另一个重要目的是从并非由5声道初始信号编码而成的2声道源信号中析取5声道或更多独立声道的信号。所得的5声道信号的表现力必须至少同初始的2声道信号表现力一样富于音乐美感。
本发明涉及对于适合的可变矩阵系数偏差的改进。为了帮助理解这些改进,本说明书引用Griessinger的美国专利US-4862502(1989年申请),该专利被称为89年专利;US-5136650(1992年申请),该专利被称为92年专利;Griessinger于1996年7月提出的美国专利申请No.08/684948,该申请被称为96年7月申请;和Griesinger于1996年11月提出的美国专利申请No.08/742460,该申请被称为96年11月申请。基于最后一项申请制造的解码器市售版被称为1.11版(或V1.11)。其它的一些改进公开在1997年9月提出的临时专利申请60/058169中,该申请被称为2.01版(或V2.0)。V1.11和V2.01这些版本的解码器,和本发明的解码器统称为“逻辑7”解码器。
引用的其它技术文献为[1]“Multichannel Matrix SurroundDecoders for Two-Eared Listeners,”David Griesinger.AESpreprint#4402,1996年10月,和[2]“Progress in 5-2-5 MatrixSystems,”David Griesinger,AES prerint #4625,1997年9月。
                         发明概述
用于实现重建从5声道编码为2声道的初始信号和以5声道格式音质优美地再现2声道素材信号的两个目标的手段随着我们不断地日益理解其物理和心理声学特性而得以发展。上面所引用的早期专利和专利申请都体现了制造有用的解码器装置的设计哲学。
本发明涉及实现具有使其音质最佳的某些特性的一种有源矩阵。另一方面,本发明披露了对于这种有源矩阵的某些输出信号的与频率相关的改善。再一方面,本发明提供了能够将5声道输入信号编码为2声道输出信号的有源电路,所获得的2声道信号可以利用标准的2声道设备,利用根据本发明构成的解码器,和利用工业标准的“杜比全向逻辑”解码器都能得到最佳的表现。
本发明的一部分内容涉及一种有源矩阵解码器,这种有源矩阵解码器的矩阵元依赖于输入信号定向分量变化。所说矩阵元以这样一种方式变化,使得输出信号中不属于预定方向的定向编码信号的响度减小,而使再现该预定方向时属于所包含方向的那些信号的响度增强,同时始终保持可能同时传输至输入端的其它信号的左/右分离度。此外,根据本发明建立的矩阵元已经通过增加或减少两个输入信号之间的混合,例如通过立体声频宽控制,复原了去相关的2声道素材信号的左/右分离度,其中所说2声道信号经过了定向编码。此外,根据本发明建立的矩阵元可以尽可能多地保持输入信号各个分量之间的能量平衡,从而保持解码器输出信号中声音与伴奏之间的平衡。因而,根据本发明建立的矩阵元能够同时保持输入音频信号中非定向编码分量的响度和这些分量的左/右分离度。
此外,根据本发明构成的解码器包括频率相关电路,该电路提高了播放标准的2声道素材信号时解码器输出的兼容性,将用于5声道解码器的2声道环绕输出信号转换为用于7声道解码器的4声道环绕输出信号,并校正了5声道解码器中后部声道的频谱,从而使其声音方向与7声道解码器中的声音方向更加相似。
根据本发明构成的编码器将5输入声道(或5个全频信道加一个低频信道)混声为2输出声道,从而当一个特定输入信号的输入电平较强时,在输出中保持该输入信号的能量;并且按照所说输出信号的相位/幅值比将强输入的方向进行编码;进而所说强信号可以在该编码器的任何两个输入端之间展开,而且可以对所说输出信号进行正确的定向编码。另外,施加到所说编码器的两个后部输入信号的去相关素材信号将以这样的方式编码为2声道,使得当用根据本发明构成的解码器解码所说编码器的输出信号时能够保持输入信号的左/右分离度,从而施加到所说编码器的两个后部声道的同相输入信号将会产生解码至根据本发明构成的解码器和根据杜比标准构成的解码器的后部声道的一个2声道输出信号,而且施加到所说编码器的两个后部声道的反相输入信号将会产生对应于根据本发明构成的解码器和根据杜比标准构成的解码器的一个非定向信号的输出信号,并且对施加到所说编码器的两个后部输入声道的低电平混响信号进行编码,使其在2声道输出信号中的电平减小3dB。
                          附图简介
在所附的权利要求书中记载了据信为本发明特点的新颖特征。通过以下结合附图对于所示实施例的详细描述可以最为清楚地地理解本发明,以及本发明的其它特征和优点。在所说附图中:
图1为一方框示意图,该图表示根据本发明构成的一种解码器中的方向检测部分和一个2-5声道矩阵部分,但是不包含在图2和图3中所示的其它部分;
图2为一方框示意图,该图表示一个5声道频率相关有源信号处理器电路,该电路可以连接在图1所示矩阵部分的输出与解码器输出之间;
图3为一方框示意图,该图表示一个5-7声道频率相关有源信号处理器,该处理器也可以连接在图1所示的矩阵部分的输出与所说解码器输出之间;
图4为一方框示意图,该图表示根据本发明构成的一种5声道-2声道有源编码器;
图5为一三维曲线图,该图表示89年专利和杜比全向逻辑中的现有技术的左前左(LFL)矩阵元,按照其标度最大值为1;
图6为一三维曲线图,该图表示89年专利和杜比全向逻辑中的现有技术的左前右(LFR)矩阵元,按照其标度最小值为-0.5,最大值为+0.5;
图7为一三维曲线图,该图表示89年专利中的现有技术的LFL和-LFR的平方和之平方根,按照其标度最大值为1;
图8为一三维曲线图,该图表示申请No.08/742460中LFL和LFR矩阵元之和的平方根,按照其标度最大值为1;
图9为一三维曲线图,该图表示V1.11中左前左(LFL)矩阵元;
图10为一三维曲线图,该图表示本发明中部分完成的左前左矩阵元;
图11为一曲线图,该图表示本发明的LFL和LFR沿左侧与完全后部之间的后部边界的特性;
图12为一三维曲线图,该图表示从左后部观察得到的本发明中完全完成的左前左(LFL)矩阵元;
图13为一三维曲线图,该图表示本发明的完全完成的左前右(LFR)矩阵元;
图14为一三维曲线图,该图表示本发明的LFL和LFR的均方根和;
图15为一三维曲线图,该图表示从左后部观察得到的本发明的LFL和LFR的平方和的平方根,包括对于后部信号电平的校正;
图16为一曲线图,其中实线表示在现有技术杜比全向逻辑解码器中应当使用的作为CS函数的中央矩阵元(单位为dB),点线表示在所说杜比全向逻辑解码器中中央矩阵元的实际值;
图17为一曲线图,其中实线表示中央矩阵元的理想值,点线表示现有技术杜比全向逻辑解码器中央矩阵元的实际值;
图18为一三维曲线图,该图表示LRL和LRR的平方和的平方根,其中使用现有技术中V1.11的矩阵元;
图19为一曲线图,该图表示GS(lr)和GR(lr)在恒定功率条件下沿cs=0轴的数值解,和沿左侧与中央之间边界的零输出;
图20为一三维曲线图,该图表示本发明的LRL和LRR平方和的平方根,其中使用GR和GS的值;
图21为一三维曲线图,该图表示现有技术89年专利中4声道解码器(和杜比全向逻辑解码器)的中央左(CL)矩阵元,如果将左右交换,该图也可以表示中央右(CR)矩阵元;
图22为一三维曲线图,该图表示在逻辑7V1.11解码器中中央左(CL)矩阵元;
图23为一曲线图,其中实线表示新LFL和LFR所需的中央输出声道衰减,点线表示现有技术的标准杜比全向逻辑解码器的中央衰减;
图24为一曲线图,其中实线表示本发明适用于“影片”策略的理想的中央声道衰减,虚线表示工作明显较好的一个值,点线表示用于比较的标准杜比解码器的中央声道衰减;
图25表示本发明适用于“音乐”策略的中央衰减;
图26为一曲线图,其中实线表示本发明的与“音乐”中央衰减GC的恒定能量比所需的GF值,虚线表示以前的LFR矩阵元sin(cs)*corr1,点线表示sin(cs)的值;
图27为一三维曲线图,表示新发明中左前右(LFR)矩阵元,包括对于沿lr=0轴的中央电平的校正;
图28为一三维曲线图,该图用新的中央增值函数表示中央左(CL)矩阵元;和
图29为一曲线图,该图表示当一个强信号从中央扩展到左侧时左前输出的输出电平(点线)和中央输出(实线)。
                       优选实施例的详细描述
本发明的设计保留了以往解码器的许多设计理念,但是实际的设计在许多方面都已改变。在有限篇幅的文献中不可能完整地描述这个设计的演变。为了使这篇文献的内容保持连贯,在本申请中,我们将表现最重要的一些设计主导思想,给出所讨论问题的数学解,并对该申请的基本技术方案提出权利要求。参阅我们以前有关这个主题的申请是十分有益的,但并不是必需的。
借助于在96年7月专利、和96年11月专利申请、以及97年9月临时专利申请中所述的解码器和编码器方面的经历,我们已经作出一些过去从未涉及的改进。本申请将记载本发明改进的编码器和解码器的最基本的特征,并且对于自从美国专利申请No.08/742460以来增加的新颖特征提出权利要求。
1.解码器概述
在本申请中所述的解码器包括两个独立的部分。第一部分是一个矩阵,该矩阵将2输入声道分解为5输出声道,这5个声道通常被称为中央声道、左前声道、右前声道、左后声道和右后声道。第二部分包括一系列延迟和滤波,它们校正了频谱和两个后部输出的电平。第二部分的功能之一是当需要7声道解码器时,导出一对附加输出,即左侧和右侧输出。在申请08/742460中,第二部分是不明确的-两个附加声道是从初始矩阵中的一对附加矩阵元得出的。
在描述解码器和编码器的数学方程中,对于大部分变量我们将使用标准的印刷体,单变量用斜体字母表示,矢量用粗黑小写体字母表示,矩阵用粗黑大写体字母表示。作为从一个指定输入声道获得的一个指定输出声道的系数的矩阵元用正常的大写体字母表示。某些单变量诸如lr和cs用双字母命名,它们不表示两个独立的单变量的乘积。其它变量l/r和c/s在某种意义上表示左-右和中央-环绕比值,但是其值为从这些比值得出的控制信号电压。这些表示惯例也用于本申请中所引用的在先美国专利和专利申请中。用Matlab语言编写的程序段也通过使用不同的字体和字号表示和将这些行缩进排版而加以区别。各个方程都有编号,以将它们与Matlab赋值语句区别开来,和对本申请中所述的具体特征给出标引。
图1与美国专利申请No.08/742460中的图4相同,是解码器第一部分,即将2声道变为5声道的矩阵90的方框示意图。图1中用一条垂直虚线分开的左半部分表示用于获得两个定向传播(steering)电压l/r和c/s的装置。这些电压表示输入信号包含固有的或分别沿左/右或前/后方向的定向编码分量的程度。对于图1中的这一部分在本申请中不再详细讨论,因为在上述专利申请中已经充分地进行了讨论,所说专利申请以引用方式结合在本申请中。
在图1中,解码器90的方向检测装置包括单元92至138,其后为一个5×2矩阵,它位于所说垂直虚线的右侧。这个矩阵的矩阵元140至158确定每个输入声道的量,所说每个输入声道与其它输入声道线性组合以构成各个输出声道。假设这些矩阵元是实数。(在美国专利申请No.08/742460中讨论了复数矩阵元的情况,故在本申请中不再讨论。)这些矩阵元是所说的两个定向传播电压l/r和c/s的函数。美国专利申请No.08/742460给出了这些函数的数学方程。在本申请中,一部分新颖性就在于对于这些表达式的改进。我们以图表形式表示这些方程,并且解释它们之所以成为这种形式的原因。
2.定向传播电压概述
如图1所示,所说定向传播电压c/s和l/r由输入端92的左输入信号幅值与输入端94的右输入信号幅值比值的对数,以及幅值和与幅值差比值的对数获得。在描述这些矩阵元时,将l/r和c/s表示为从+45度变化到-45度的角度是比较方便的。在V1.11和V2.01解码器中,这些电压的单位为分贝(dB)。我们可以将所说定向传播参数变换为角度,其中
lr=90-arctan(10^((l/r)/20))                      ...(1a)
cs=90-arctan(10^((c/s)/20))                      ...(1b)
所说角度lr和cs确定了输入信号具有定向分量的程度。例如,当解码器输入为去相关信号时,lr和cs都为零。对于仅仅来自中央声道的信号,lr为零,cs的值为45度。对于来自后部的信号,lr为零,cs为-45度。类似地,对于来自左声道的信号,lr的值为45度,cs的值为零,而对于来自右声道的信号,lr的值为-45度,cs的值为零。在我们的设计中我们假定生成编码信号的编码器具有这样的属性,即当我们对左后信号编码时,lr=22.5度,cs=22.5度.类似地,施加到编码器右后输入的信号的lr值等于22.5度,cs的值等于22.5。
从l/r和c/s的定义以及lr和cs的导出,可以看出lr和cs的绝对值不大于45度。lr和cs的允许值构成由abs(lr)-abs(cs)=45度曲线轨迹约束的一个表面。产生位于该表面边界上的lr和cs值的任何输入信号都是完全局域化的,就是说,它只包含编码为来自一个特定方向的单一声音信号。
在本申请中,我们将广泛使用作为覆盖这个两维表面的函数的矩阵元曲线图。一般来说,矩阵元的导出在该表面的四个象限中是不同的。换句话说,根据所说定向传播向前或向后,以及向左或向右而采用不同的方式描述这些矩阵元。为了确保该表面在不同象限之间的边界上是连续的,需要大量的计算。在某些点偶尔出现不连续是V1.11解码器的问题之一,这也正是本申请所要解决的问题。
3.频率相关矩阵元
图1所示的矩阵元是实数,因此与频率无关。输入中的所有信号都转变为依赖于导出角度lr和cs的输出。(在目前的现有技术中,利用图1中未示出的滤波器,在从输入信号导出lr和cs时使低频和非常高频分量衰减。但是,矩阵元本身是宽频带的。)
我们在实践中已经发现在矩阵之后将信号施加于频率相关电路具有若干优点。这些频率相关电路之一,即在图1中右侧输出180侧的相移电路170,在美国专利申请No.08/742460中已经介绍过,这里不再赘述。
图2表示附加的频率相关电路的5声道版。这些电路不具有固定参数。其频率和电平特性依赖于定向值lr和cs。这些电路实现若干目的。首先,在5声道解码器和7声道解码器中,当所说定向传播不确定(neutral)(lr和cs为零)或者向前(cs>0)时,附加矩阵元使得能够调整后部声道的视在响度。在美国专利申请No.08/742460中,这种衰减是作为矩阵本身的一部分功能实现的,因而是与频率无关的。通过理论研究和测听试验,我们已经发现非常需要在听众四周再现低频分量。因此在本发明的解码器中,只利用可变低通滤波器182、184、188和190将高频分量衰减。
这是通过利用器件188、190将后部声道中500Hz以上频率衰减,利用器件182、184将4kHz以上频率衰减而实现的,当所说定向传播始终近乎不确定或向前时,使用在本申请下文中定义的一个背景控制信号186。偶尔存在的向后定向传播的声音降低了衰减效果,这是将环绕声编码素材信号与普通2声道素材信号自动区别开来的一个特征。
当所说定向传播向后(cs<0)时,在5声道解码器中的其它器件192、194使用所说c/s信号196校正该声音的频谱,从而使扬声器似乎位于听众的背后,即使它们的实际位置在侧面。经过校正的左环绕和右环绕信号分别在输出端198和200输出。这个电路的其它细节在本说明书的后面一个部分中介绍。
图3表示所说频率相关器件的7声道版。如前所述,当所说定向传播不确定或者向前时,第一组滤波器182、184、188和190将侧面和后部输出的较高频分量衰减,同样这也是在背景控制信号186控制下完成的。这种衰减还导致更为向前的声象,并且可以根据听众的喜好加以调整。当由c/s信号196表示的定向传播向后移动时,附加电路202、204、206和208用于使所说侧面输出与后部输出相区别。当定向传播向后移动时,在侧面扬声器中上述衰减首先被器件204和206去掉,以产生侧向声音。当定向传播进一步向后移动时,器件204和206的衰减恢复并且增大。其结果是声音从前部扬声器平滑地移动到侧面扬声器,然后移动到后部扬声器,所说后部扬声器有大约10ms的延迟,这是利用延迟器件202和208产生的。由于低频分量不受到这些电路的影响,在侧面扬声器中的低频响度(用于形成宽敞度感觉)不受声音移动的影响。同样,在下文中将介绍图3的其它细节。
4.编码器概述
图4为用于将5个输入声道自动混声为2个输出声道的一种编码器的方框示意图。其结构与在美国专利申请No.08/742460中所述的编码器完全不同。新设计的目的是保留5声道初始信号的音乐平衡,同时提供相位/幅值插入信号,以使解码器可以抽取初始的5声道。前述的编码器具有类似的目的,但是其用于实现这些目的的方法有一些改进。保留音乐平衡对于编码器是非常重要的。这种编码器的基本目的之一是自动生成5声道录音的2声道混合信号,这些信号将以与5声道初始信号一样的优美音质在普通的2声道系统中播放。这种新编码器设计包括有源器件以确保保留音乐平衡。
与97年11月申请中的编码器不同,新编码器可以使输入信号在编码器的5个输入的任意两个之间平移(pan)。例如,一个声音可以从左前输入平移到右后输入。当利用本申请所述的解码器对所得的2声道信号进行解码时,其结果非常接近原始声音。利用早期的环绕解码器的解码结果也与原始声音相似。
在下文中详细介绍编码器。
5.解码器有源矩阵元的设计目的
本发明最基本的目的与我们以前的解码器,特别是在美国专利申请No.08/742460中所述的解码器相同-“本发明是一种环绕声解码器,其所具有的可变矩阵元这样构成,使得可以减小在沿预定方向再现时输出中没有直接涉及的那些定向编码音频分量;增强在沿预定方向再现时输出中直接涉及的那些定向编码音频分量,从而使这些信号的总功率保持恒定;同时与定向传播信号无关地保持非定向信号中左声道与右声道分量之间高分离度;并使定义为非定向信号的总音频功率电平的响度有效地保持恒定,而不管是否存在定向编码信号,或者如果存在的话其方向如何。”
表面上看,所有矩阵解码器都具有这些目的中的大部分。本发明的新颖性部分在于知晓如何更加精确地实现上述规则,部分在于知晓何时不应用上述规则。但是,美国专利申请No.08/742460中的大部分方法得以保留。以前的目的中最重要的一个是在所有条件下清楚地保持解码器左声道与右声道之间的高分离度。所有以前的4声道解码器都不能保持后部声道的分离度,因为它们只具有一个后部声道。其它制造商的5声道解码器在许多方面牺牲了分离度。在本申请中所述的解码器以与V1.11解码器相似的方式满足这个目的-但是它同样满足其它目的。
美国专利申请No.08/742460还公开了许多较小的改进,例如用于提高定向信号精度的电路,和用于在强向后定向传播时转换后部声道之一相位的可变相移电路。在新解码器中保留了V1.11解码器的这些特征,但是不会被该文献所覆盖。
在图4中,分别将前部输入信号L、C和R施加到输入端50、52和54。L和R分别直接进入加法器278和282,而C信号在施加到加法器278和282输入端之前首先在衰喊器372中衰减,衰减系数为fcn。低频效果信号LFE通过一个增益为2.0的器件374,然后施加到加法器278和282。
环绕声输入信号LS和RS分别通过两个输入端施加到两条独立的路径:LS信号的路径为通过增益为fs(l,ls)的衰减器378,RS信号的路径为通过增益为fs(r,rs)的一个对应的衰减器380。这些输出传输到增益系数为-crx的互耦器件384和386中,其中crx标准值为0.383。从这些器件输出的互耦信号传送至加法器392和394,它们也从0.91衰减器388和392接收经过衰减的LS和RS信号。加法器392、394的输出施加到加法器278、282的输入端。这样分别将所说器件定位在解码器空间中央后部的左45度和右45度。
其它信号路径分别使LS和RS信号通过增益为fc(l,ls)的衰减器376和增益为fc(r,rs)的衰减器382,然后通过互耦器件396、398、402、404、406和408的一个类似排列,所说加法器406和408的输出与以前一样,以中央后部45度左和45度右表示左后输入和右后输入。但是,这些信号现在分别通过相移器234和246,而来自加法器278和282的左信号和右信号分别通过相移器286和288。这些相移器单元都是全通滤波器,相移器286和288的相位响应为(f),相移器234和246的相位响应为(f)-90°。对于这些滤波器中所需分量值的计算在本领域中是熟知的,这里不再赘述。其结果是使加法器406和408所有频率的输出在通过如图4所示的全通滤波器网路之后比加法器278和282的输出滞后90度。全通滤波器网路234和286的输出在加法器276中结合,在输出端44产生所说A(或左)输出信号,而滤波器246和288的输出在加法器280中结合,在输出端46产生所说B(或右)输出信号。
增益函数fs和fc用于使强环绕信号与其它声音同相,而使弱环绕信号通过90度相移的路径,以使去相关的“音乐”信号保持恒定电平。crx的值也可以改变,进而改变听到所说环绕声的角度。
6.自从申请No.08/742460以来的设计改进
本发明相对于美国专利申请No.08/742460最引人注目的改进之一是当信号沿中央方向定向传播时,对于中央矩阵元和左前及右前矩阵元的改变。我们发现按照以前的方式编码和解码的中央声道存在两个问题。最显著的问题是,在5声道矩阵系统中,中央声道的使用与尽可能保持左/右分离度的目的本质上是相抵触的。如果所说矩阵要从常规的2声道立体声素材信号产生一个可以感知的输出,当所说两个输入声道没有左/右分量时,必须用左输入声道与右输入声道之和驱动所说中央声道。因此,左解码器输入和右解码器输入都会在中央扬声器中再现,原来仅仅在左(或右)声道中的声音也会从中央声道中再现。其结果必然是,这些声音的视在位置被拉到房间的中间。这种效果出现的程度取决于中央声道的响度。
美国专利US-4862502和US-5136650使用最小值比左右声道低3dB的矩阵元。当解码器的输入去相关时,所说中央声道的响度等于左右声道的响度。当定向传播向前方移动时,所说中央矩阵元再增大3dB。这种高响度效果是大大减小前部声象的宽度。应当听出位于声象左侧和右侧的乐器总是被拉向声象的中央。
美国专利申请No.08/742460使用最小值比以前值低4.5dB的中央矩阵元。这个最小值是根据测听试验选择的。当输入素材信号为含有管弦乐的非相关信号时,这种衰减产生向前部声象扩展的令人愉快的效果。所说前部声象不会发声严重的变窄现象。在美国专利申请No.08/742460中,当定向传播移向前方时这些矩阵元增大,最终达到杜比矩阵元中所使用的值。
使用V1.11解码器的经历证明,尽管中央声道响度的减小解决了空间问题,但是该矩阵未能保持输入信号的功率平衡。数学分析揭示,不仅V1.11解码器是错误的,而且杜比解码器和我们以前的解码器也是错误的。十分矛盾的是,虽然从再现前部声象宽度的观点来看中央声道太强,但是从保持功率平衡的角度来看它又太弱。这个问题对于Mandel解码器-标准杜比解码器尤其严重。在标准杜比解码器中,后部声道比专利US-4862502中我们的解码器强。因此,为了保持功率恒定,中央声道必须较强。中央声道无法保持功率恒定是杜比解码器存在已久的问题。杜比建议混声工程师应当经常测听矩阵的平衡,从而使矩阵中的功率不平衡在混声过程中得以弥补。但是,现代的影片都是为在5声道音响系统中播放而混声录制的,自动编码为2声道可能导致人物对话电平方面的问题。
进一步的分析和测听表明影片和音乐在平衡问题上需要不同的解决方案。对于影片,我们发现保留在美国专利申请No.08/742460中所述的左右前部矩阵元是最有用的。这些矩阵元从左前和右前声道中尽可能地消除了中央声道信息。这样使对话声音泄漏到左前和右前声道的程度最小。在新的“影片”型解码器设计中,通过改变中央矩阵元,即当定向传播向前移动时(当cs变为大于o时)使中央声道响度比标准解码器更为迅速地增大来校正功率平衡。实际上,并不需要中央矩阵元的最终值大于标准解码器中的值,因为这种条件仅仅当中央声道有源时才能实现。只是要求当中央声道与左右声道电平基本相等时,中央声道电平大于标准解码器中的电平。
采用这种“影片”策略,增大中央声道响度以保持输入信号中的功率平衡,而使中央声道分量在所有其它输出中最小。这种策略对于影片来说似乎是理想的,而中央声道的主要用途是播放对话,从中央以外的其它位置发出的对话是无法预料的。这种策略的主要缺点是在任何存在明显的中央定向性的期间-例如在许多类型的流行音乐中那样-前部声象变窄。但是,对于影片的优点-对话泄漏到前部声道的程度最小和具有优异的功率平衡-超过了这个缺点。
对于音乐我们采取另一项策略。在这种情况下我们可以使中央声道响度以与美国专利申请No.08/742460中一样的速率增大,直至定向传播的中间值,这时cs≥22.5度。为了恢复所说音乐平衡,我们改变左前和右前矩阵元,使得输入信号中的中央分量不完全去除。调整左前和右前声道中中央声道分量的含量,使得解码器所有输出的声音功率都与输入信号的声音功率匹配-而不会使中央声道响度过大。
采取这种策略,全部三个前部扬声器都再现原始编码素材信号中存在的中央声道信息。最实用的采取这种策略的解码器限制了在输入信号中央分量的中央输出比另外两个前部输出中任意一个强6dB的点处的定向传播。通过限制cs的正值即刻简单地实现这一点。
这种新策略-使中央声道分量从全部三个前部扬声器中输出,和当中央声道响度比左前和右前声道大6dB时限制定向传播-使得对于各种音乐都表现出优异的特性。经过编码的5声道混合信号和普通的2声道混合信号都解码为具有稳定的中央声道效果,和中央声道与左右声道之间足够的分离度。需要指出的是,与以往的解码器不同,中央声道与左右声道之间的分离度是故意使之不完全的。将预计来自左声道的信号从中央声道中去除,而不是采用其它方式。对于音乐来说,这种策略所提供的较大的横向分离度和稳定的前部声象弥补了不具有完全分离度的缺点。对于这些侧重影片设计的测听表明,尽管存在一些对话来自左前和右前扬声器的情况,但是所得声象的稳定性是极佳的。其声音效果是令人愉快的,而不会使人分散注意力。因此,对于采用音乐解码器的影片的听众来说,不会感到影片的艺术品质降低。而对于采用电影解码器的音乐录音的听众来说,会感到存在更多问题。
本申请中下一个最为重要的改进或许就是当一个信号向左前或左后方向定向传播时增大前部声道与后部声道之间的分离度。在这些条件下V1.11解码器的前部声道使用美国专利US-4852502中所述的矩阵元。这些矩阵元仅仅在向正后方位置-即左后与右后的中间方向定向传播时才完全消除向后定向传播信号。当定向传播为向左后或右后(不是正后方)时,左前或右前输出的值比相应的后部输出低9dB。在本发明中,修改了前部矩阵元以当定向传播朝向方向为左后与右后之间的任何位置时消除来自前部的声音。
7.对于后部矩阵元的改进
一般听众对于后部矩阵元的改进不是能够立刻感觉到的。这些改进校正了在各个象限之间的边界上矩阵元连续性方面的错误。它们也改善了在各种条件下定向信号与非定向信号之间的功率平衡。下面所给出的这些矩阵元的数学表述包含了这些改进。
8.有源矩阵元的详细描述
Matlab语言
用于表述这些矩阵元的数学方法不是基于变量cs和lr的连续函数。一般包括对于方程的附条件、绝对值、和其它非线性修正。因此,我们使用一种程序语言表述矩阵元。Matlab语言提供了以图表方式检验方程的一种简单方法。Matlab语言非常类似于Fortran语言或C语言。它们的主要区别在于Matlab语言中的变量可以是矢量-就是说,每个变量可以表示为顺序排列的数值矩阵。例如,我们可以按照下述方式定义变量x:
x=1∶10;
这个Matlab语言规定建立了从1到10十个数值的线性序列。变量x包括所有10个值。它表示一个矢量,一个1乘10矩阵。可以存取或处理每个矢量中的单个数值。例如,表示式
x(4)=4;
将设定矢量x中第4个分量的值等于4。变量还可以表示一个两维矩阵。可以用简单的方式为矩阵中的单个矩阵元赋值:
X(2,3)=10;
将值10赋予矩阵X的第2行和第3列。
对于下述矩阵元的详细描述与在参考文献[2]中基本相同。其内容已经有所改变。主要差别是:
1、参考文献[2]包含“tv矩阵”特征。当定向传播不确定或者向前时这个特征使后部输出的电平减小。在本申请中这种功能是利用设置在矩阵之后的频率相关电路实现的。所以我们省去了这种“tv矩阵”校正。
2、关于中央矩阵元的部分已经修改为包含“影片”策略、“音乐”策略、和限制“音乐”设置特性的内容。参考文献[2]仅仅记载了“音乐”设置,而没有限制。
9.用方程和图表表示的矩阵解码器
在参考文献[1]中我们提出了一种矩阵解码器的设计,这种解码器可以用一个n×2矩阵的矩阵元表示,其中n为输出声道的数目。每个输出可以看作是两个输入的线性组合,其中所说线性组合的系数由该矩阵的矩阵元给出。在这篇论文中,通过字母的简单组合来标识这些矩阵元。参考文献[1]记载了一种5声道解码器和一种7声道解码器。从5声道到7声道的转换现在是在解码器的频率相关部分实现的,所以这里我们只讲述一种5声道解码器。
从对称性角度考虑,我们显然只需要描述6个矩阵元的特性-即中央矩阵元、两个左前矩阵元、和两个左后矩阵元。可以发现,通过简单地变换左右标识,就可以从左侧矩阵元获得右侧矩阵元。这些矩阵元包括:
CL:左输入声道至中央输出的矩阵元
CR:右输入声道至中央输出的矩阵元
LFL:左输入声道至左前输出
LFR:右输入声道至左前输出
LRL:左输入声道至左后输出
LRR:右输入声道至左后输出
这些矩阵元不是恒定的。它们的值作为输入声音的视在方向的两维函数变化。大部分相位/幅值解码器通过比较输入信号幅值来确定输入的视在方向。例如从左输入声道幅值与右输入声道幅值的比值可以确定沿向右/向左方向定向传播的角度。按照类似的方式,从输入声道幅值的和值和差值的比值可以确定沿向前/向后方向定向传播的角度。尽管逻辑7解码器在如何实现这些功能方面与标准解码器明显不同,但是在本申请中我们不讨论确定这些定向传播方向的方法,我们假设已经确定了定向传播方向。这里,我们将这些方向表示为角度-一个角度用于表示左/右方向(lr),一个角度用于表示前/后(中央/环绕)方向(cs)。这两个定向传播方向为有正负之分的变量。当lr和cs都为零时,输入信号是非定向的,就是说,这两个输入声道是不相关的。
当输入中包含一个已经定向编码的信号时,这两个定向传播方向具有其最大值。但是在这些条件下它们不是独立的。将定向传播值表示为角度的优点是当只有一个信号时,这两个定向值的绝对值之和必须为45度。当所说输入除了强定向信号以外还包含去相关素材信号时,定向值的绝对值之和必须小于45度。
             |lr|+|cs|≤45
             ...(2)
如果我们在由定向值形成的一个两维平面中绘出这些矩阵元值,该平面中央的值将为(0,0),定向值之和的法定值不超过45度。实际上,由于非线性滤波器的特性,该和值有可能超过45度-申请No.08/742460要求保护一个电路,该电路限制lr和cs中较小者,以使它们的和值不超过45度。这里不再详细讨论该权利要求。我们假设当出现超出限值情况时这些矩阵元的数学表示式仍然能够很好地表示其变化。当我们绘制矩阵元值时,如果超过了输入变量的法定和值,我们就任意地将其值设定为零。这使得我们能够直接观察到矩阵元沿边界轨迹-即强定向信号遵循的轨迹的变化特性。这种图表是利用Matlab语言生成的。按照Matlab语言,非定向位置为(46,46),因为Matlab语言要求角度变量比实际的角度值大1。幸运的是,这样规定不至于太混乱。
以前的矩阵解码器倾向于只考虑矩阵对于强定向信号的行为-即矩阵在所说表面边界周围的行为。从表面上看这是一个基本错误。当你研究真实信号-影片或者音乐信号时,你会发现极少达到表面的边界。对于大部分情况来说,信号都是在平面中部周围摆动-略微朝向中央前部。矩阵在这些条件下的行为对于声音来说是至关重要的。当你将我们的矩阵元与以前的矩阵元进行比较时,你可以看出表面中部区域的复杂性显著增加。正是这种复杂性导致声音的改善。
这种复杂性是有代价的。我们最初的1987年的设计-参见1989年专利-简单到用模拟器件来实现。这些新矩阵元几乎完全用一维查阅表表述,所说查阅表通常是以数字方式实施的。设计具有类似性能的模拟解码器是可能的,但是这样做没有价值。
在本申请中,我们对比矩阵元的几个不同版本。最早的是我们1989年专利中所述的矩阵元。这些矩阵元用于我们第一个环绕声处理器中,并且与标准(杜比)环绕声处理器的左声道、中央声道和右声道的矩阵元是一样的(但是与环绕声道的不同)。在我们的设计中,环绕声道是与中央声道对称处理的。在标准(杜比)解码器中,所说环绕声道是按照不同方式处理的,在本申请后面的一部分将讨论这个问题。
这里所述的矩阵元并不总是正确标度的。一般来说,这样进行表示,使得非零矩阵元的非定向值对于任何给定声道都是1。实际上,常常这样标度矩阵元,使得每个矩阵元的最大值为1或小于1。无论如何,在最终的产品中,矩阵元的标度在定标程序中还要改变。应当假设这里所述的矩阵元可以用适合的常数标度。
10.我们1989年专利中的左前矩阵元
假设cs和lr分别为沿中央/环绕和左/右轴向的定向传播方向(以角度度数表示)。
在1989年专利中用于表示前部矩阵元的方程为:在左前象限:
LFL=1-0.-5*G(cs)+0.41*G(lr)                            ...(3a)
LFR=-0.5*G(cs)                                         ...(3b)
在右前象限:
LFL=1-0.5*G(cs)                                        ...(3c)
LFR=-0.5*G(cs)                                         ...(3d)
在左后象限:
LFL=1-0.5*G(cs)+0.41*G(lr)                             ...(3e)
LFR=-0.5*G(cs)                                         ...(3f)
在右后象限:
LFL=1-0.5*G(cs)                                        ...(3g)
LFR=-0.5*G(cs)                                         ...(3h)
函数G(x)是在1989年专利中用实验方法确定的,并在91年专利中用数学方程加以规定。当x从0变化到45度时,该函数从0变化到1。当定向传播在左前象限中时(lr和cs都是正值),G(x)可以表示为等于1-|r|/|l|,其中|r|和|l|为右输入和左输入幅值。G(x)还可以利用多种方程以定向传播角度为变量表示。其中一个方程在91年专利中给出,其它方程将在本申请下文中给出。参见图5和图6以lr和cs轴为基准绘制的LFL和LFR矩阵元的三维图表。
在参考文献[1]中,通过增加非定向素材信号响度应当与定向传播方向无关地保持恒定的要求改进了这些矩阵元。从数学上说,这意味着LFL和LFR矩阵元的均方根之和应当是一个常数。在该论文中指出这个目的在定向传播方向应当改变-就是说,当定向传播向正左方向时,这些矩阵元的平方和应当提高3dB。图7表示这些矩阵元的平方和,它表明上述矩阵元不满足恒定响度的要求。应当注意,在图7中所说矩阵元值沿从非定向方向至右的轴向保持为0.71。非定向至左方向的值提高3dB达到值1,非定向至中央或至后方的值下降3dB达到值0.5。图表中的这个部分被左侧的峰值遮挡住了。向后方向的电平与中央方向的电平相同。
在申请No.08/742460和参考文献[1]中,我们通过用正弦和余弦代替矩阵方程中的函数G(x)校正了图7中的幅值错误:参见图8,其中表示经过校正的矩阵元LFL和LFR平方和的图表,该图表由以下的方程(4a)-(4b)表述。
注意在该平面的整个右半部分保持为常数值0.71,而朝向左侧顶点平缓上升到1。
对于左前象限:
LFL=cos(cs)+0.41*G(lr)                        ...(4a)
LFR=-sin(cs)                                  ...(4b)
对于右前象限:
LFL=cos(cs)                                   ...(4c)
LFR=-sin(cs)                                  ...(4d)
对于左后象限:
LFL=cos(-cs)+0.41*G(lr)                       ...(4e)
LFR=sin(-cs)                                  ...(4f)
对于右后象限:
LFL=cos(-cs)                                  ...(4g)
LFR=sin(-cs)                                  ...(4h)
11.对于左前矩阵元的改进
在1996年3月,我们对这些矩阵元作出了一些改变。我们保留了基本函数关系,但是沿前部的cs轴增加了一个附加增值,和沿后部的cs轴增加了一个减值。增值的理由是改善向前平移动的立体声音乐的音质。在后部减值的理由是当立体声音乐向后部平移动时增大前部声道与后部声道之间的分离度。
对于左前象限:
LFL=(cos(cs)-0.41*G(lr))*boost1(cs)                        ...(5a)
LFR=(-sin(cs))*boost 1(cs)                                 ...(5b)
对于右前象限:
LFL=(cos(cs))*boost1(cs)                                   ...(5c)
LFR=(-sin(cs))*boost 1(cs)                                 ...(5d)
对于左后象限:
LFL=(cos(-cs)+0.41*G(lr))/boost(cs)                        ...(5e)
LFR=(sin(cs))/boost(cs)                                    ...(5f)
对于右后象限:
LFL=(cos(cs))1boost(cs)                                    ...(5g)
LFR=(sin(cs))/boost(cs)                                    ...(5h)
函数G(x)与89年专利中的一样。当用角度作为输入进行表示时,可以将其表示为等于:
G(x)=1-tan(45-x)                                           ...(6)
1997年3月使用的函数boost1(cs)是3dB的线性增值全部施加到定向传播的前一个22.5度上,在下一个22.5度又减小到0dB。Boost(cs)是用下面的Matlab码中的corr(x)给出的(注释行之前使用百分号%)。
  %计算在22.5度处+3dB的提升函数

  %corr(x)提升3dB并维持高值。corr(x)提升然后下降

  for x=1∶24;%x有值1-24,代表0-23度

  corr(x)=10^(3*(x-1)/(23*20));%在该范围上升3dB

      corr1(x)=corr(x),

    end

  for x=25∶46%在24-45度范围上corr1走回低值

      corr(x)=1.41;

      corr(x)=corr(48-x);

    end
参见图9,即根据方程(5a)-(5h)所得的LFL的图表。注意当定向方向向中央移动时,沿lr=0轴和沿左至中央边界都发生增值。还需注意当定向传播向后移动时电平降低。
1997年3月所设计电路的性能可以提高。第一个问题是定向信号沿左与中央,右与中央之间边界的行为。当一个强信号从左向中央平移时,在图9中可以看到LFL矩阵元的值在左与中央中间增大到最大值。这种值的增大是当将中央信号加入立体声音乐中时有意增大左侧主要输出和右侧主要输出电平的未曾预料的结果。
当立体声信号向前平移时,要求左前和右前输出的电平增大以补偿矩阵从这些输出中消除相关分量。但是用于在这些条件下增大电平的方法应当仅仅在输入的lr分量为最小值时-即当不存在净向左或向右定向传播时采用。在1997年3月选择用于实现这种增大的方法与lr值无关,当一个强信号平移穿过边界时导致电平增大。
仅仅沿lr=0轴需要这种增值。当lr为非零值时,矩阵元不应当增值。这个问题可以通过使用矩阵元的一个附加项代替相乘来解决。我们定义一个新的定向传播指标,用Matlab码表示的边界限定的cs值:
假设lr和cs都大于0,则我们在左前象限中
(假设cs和lr遵循从1到+46变化的Matlab约定)
  %找约束的c/s

  if(cs<24)

     bcs=cs-(lr-1);

     if(bcs<1)%它限制了最大值

       bcs=1;

     end

  else

     bcs=47-cs-(lr-1);

     if(bcs<1)

       bcs=1;

     end

  end
如果cs<22.5度,lr=0,(按照Matlab约定,cs<24,lr=1),bcs等于cs。但是,随着Ir增大bcs将减小到0。如果cs>22.5,随着lr增大,bcs也减小。
现在为了找到所需的校正函数,我们求得沿lr=0轴增值矩阵元与未增值矩阵元之间的差值。我们将这个差值称为cos_tbl_plus和sin_tbl_plus。利用Matlab码,a=0∶45;%按一度为一级定义矢量,a值在0-45度间degrees
a1=2*pi*a/360:%转为弧度
%现有定义正弦和余弦表,以及前向的提升表
sin_tbl=sin(a1);
cos_tbl=cos(a1);
cos_tbl_plus=cos(a1).*corr1(a+1);
cos_tbl_plus=cos_tbl_plus-cos_tbl;%这是我们采用的定义
cos_tbl_minus=cos(a1)./corr(a+1);
sin_tbl_plus=sin(a1).*corr1(a+1);
sin_tbl_plus=sin_tbl_plus-sin_tbl;%这是我们采用的定义
sin_tbl_minus=sin(a1)./corr(a+1);
矢量cos_tbl_plus和sin_tbl_plus为简单正弦与简单余弦之间,以及增值正弦与增值余弦之间的差值。现在我们定义
LFL=cos(cs)+0.41*G(lr)+cos_tbl_plus(bcs)                ...(7a)
LFR=-sin(cs)-sin_tbl_plus(bcs)                          ...(7b)
右前象限中的LFL和LFR是相似的,但是没有+0.41*G项。这些新定义导致在图10中表示的矩阵元。
在图10中,注意所说新矩阵元沿左至中央边界,以及右至中央边界具有校正幅值。
在后部象限中的定向传播也不是最佳的。当定向传播朝向后部时,上述矩阵元由下式给出:
LFL=cos_tbl_minus(-cs)+0.41*G(-cs)                      ...(8a)
LFR=sin_tbl_minus(-cs)                                  ...(8b)
这些矩阵元与89年专利中的矩阵元非常接近。考虑一个强信号从左向后平移的情况。89年专利是这样设计的,仅仅当这个信号完全向后时(cs=-45,lr=0),才完全消除左前输出。但是,在逻辑7解码器中,当编码信号朝向左后方向(cs=-22.5和lr=22.5)时,要求左前输出应当为零。当所说信号进一步向正后方平移时,所说左前输出应当保持为零。在1997年3月版解码器中所使用的矩阵元,即上述的矩阵元,导致当一个信号平移至左后位置时左前声道中的输出大约为-9dB。这个电平差值对于矩阵元具有良好的特性是足够的,但是还没有达到尽善尽美的程度。
通过改变左后象限中的LFL和LFR矩阵元可以提高这种性能。我们在这里只讨论矩阵元沿左与后之间边界如何变化。在参考文献[1]中给出的数学方法可以用于获知矩阵元沿所说边界的变化。让我们假设当t从0(左)变化到-22.5度(左后)时左前输出的幅值按照函数F(t)变化。所说方法给出矩阵元:
LFL=cos(t)*F(t)-/+sin(t)*(sqrt(1-F(t)^2))              ...(9a)
LFR=(sin(t)*F(t)+/-cos(t)*(sqrt(1-F(t)^2)))            ...(9b)
如果我们选择F(t)=cos(4*t),并选择正确符号,则这些方程简化为:
LFL=cos(t)*cos(4*t)+sin(t)*sin(4*t)                   ...(9c)
LFR=(sin(t)*cos(4*t)-cos(t)*sin(4*t)                  ...(9d)
参见图11中这些系数LFL(实线)和LFR(点线)相对于t的曲线。(中间的微小假信号是由于在22.5度缺少一个点,因为按照Matlab语言,所有角度都是整数。)
这些矩阵元工作良好-随着t从0变化到22.5度,所说左前输出平滑地减小到0。我们希望当定向传播方向从22.5度继续变化到45度(正后方)时,所说输出保持为零。沿着所说边界的这一部分,
LFL=-sin(t)                                          ...(10a)
LFR=cos(t)                                           ...(10b)
应当指出这些矩阵元距离沿lr=0边界上的矩阵元很远,在参考文献[1]中这些值为
LFL=cos(cs)                                          ...(10c)
LFR=sin(cs)                                          ...(10d)
应当指出,这些矩阵元用于适当地处理强定向传播信号,在这种情况下cs和lr都具有最大值。以前的矩阵元对于lr接近零时的信号,即已经平移到后方的立体声信号的处理是成功的。我们需要一种方法,能够在lr和cs趋近于边界时将以前的矩阵元变换为新矩阵元。可以使用一种线性内插法。在Lexicon产品中使用的处理器中,采用乘法是不适合的,较好的策略是定义一个新变量,即lr和cs的最小值,如下面用Matlab程序段所定义的:%新,发现边界参数
bp=x;
if(bp>y)
  bp=y;
    end
以及一个依赖于bp的新校正函数
for x=1∶24
  ax=2*pi*(46-x)360;
  front_boundary_tbl(x)=(cos(ax)-sin(ax))/(cos(ax)+sln(ax));
end
for x=25∶46
  ax=2*pi*(x-1)/360;
  front_boundary_tbl(x)=(cos(ax)-sin(ax))/(cos(ax)+sin(ax));
end
然后我们将这个象限中的LFL和LFR定义为:LFL=cos(cs)/(cos(cs)+sin(cs))-front_boundary_tbl(bp)+0.41*G(lr)
                                                      ...(11a)LFR=sin(cs)/(cos(cs)+sin(cs))+front_boundary_tbl(bp)     ...(11b)
注意其中cos(cs)+sin(cs)的校正。如果我们用cos(cs)除以这个系数,我们得到函数1-0.5*G(cs),该函数与这个象限中的杜比矩阵相同。如果我们用sin(cs)除以这个系数,我们得到以前的函数+0.5*G(cs)。
类似地在右后象限中:
LFL=cos(cs)/(cos(cs)+sin(cs))=1-0.5*G(cs)             …(12a)
LFR=sin(cs)/(cos(cs)+sin(cs))=0.5*G(cs)               …(12b)
参见图12和图13中这些值的曲线表示。
在图12中,该图表示左后象限的系数,注意其中沿左后边界的较大校正值。这导致当定向传播方向从左向左后移动时,左前输出变为零。当所说定向传播方向继续向正后方移动时,所说输出保持为零。沿lr=0轴和在右后象限中,该函数与杜比矩阵相同。
在图13中,注意在左至后边界中的较大峰值。这个峰值与LFL矩阵元一起使得当定向传播方向从左后向正后方移动时所说前部输出沿这个边界保持为零。此外,在向后方向上沿lr=0轴和在右后象限中所说矩阵元也与杜比矩阵相同。
逻辑7矩阵解码器的主要设计目的之一是使解码器输入中非定向传播信号的任何给定输出的响度保持恒定,而与同时存在的定向传播信号的方向无关。如上所述,这意味着对于每个输出来说,这些矩阵元的平方和应当为1,而与定向传播方向无关。如前所述,当沿所涉及输出方向存在强定向传播信号时,必须改变这个要求。就是说,如果我们考虑左前输出,当所说定向传播方向为正左方向时,这些矩阵元的平方和必须增大3dB。当定向传播沿lr=0轴向前或向后移动时,上述矩阵元也在某种程度上改变了这个要求。
但是,通过绘制这些矩阵元平方和之平方根的曲线,也能够验证我们的设计是成功的。参见图14和图15,其中表示了这种改进设计的曲线图。
在图14中,注意在左方向上的3dB峰值,和当一个信号从非定向传播变化为沿中央方向22.5度时的较小峰值。(为了这个曲线图,我们删除了后部象限中的1/(sin(cs)+cos(cs)),从而我们能够看清所得和值如何精确地变为单位值。)这个峰值是在定向传播朝向半前部时左输出和右输出预定增值的结果。应当指出,在其它象限中所说rms和值非常接近1,与设计目标一样。左后象限中的值并不完全等于1,因为用于生成这些矩阵元的方法是一种近似方法,但是其符合程度非常好。
在图15中,从非定向传播(中间)向右轴上的值为1,中央顶点值为0.71,后部顶点值为0.5,左侧顶点值为1.41。注意沿中间向中央轴的峰值。
12.当定向传播向前时的后部矩阵元
89年专利中的后部矩阵元(除了我们已经介绍了用0.71标度以显示标准定标过程的效果)有下式给出:
对于左前象限
LRL=0.71*(1-G(lr))                              ...(13a)
LRR=0.71*(-1)                                   ...(13b)
对于左后象限
LRL=0.71*(1-G(lr)+.41*G(-cs))                   ...(13c)
LRR=-0.71*(1+0.41*G(-cs))                       ...(13d)
(该平面的右半部是相同的,但是变换为LRL和LRR)
杜比全向逻辑中的后部矩阵元为(在经过类似标定之后):
对于左前象限
LRL=1-G(lr)                                     ...(14a)
LRR=-1                                          ...(14b)
对于左后象限
LRL=1-G(lr)                                     ...(14c)
LRR=-1                                          ...(14d)
(该平面的右半部是相同的,但是调换了LRL和LRR)
应当指出,杜比矩阵元与89年专利中的矩阵元经过标定,当cs=-45度时在左后象限中是相等的。
13.对于杜比全向逻辑中环绕声电平的简述
杜比矩阵元与我们89年专利中的矩阵元相似,但是没有在后部依赖于cs的增值函数关系。这个差别事实上是十分重要的,因为在经过标准标定过程之后,这个矩阵元对于非定向传播信号具有完全不同的值。一般来说,我们对于矩阵元的描述不考虑对于这些解码器的标定过程。我们用相对任何的标度导出所有矩阵元。在大部分情况下,这些矩阵元按照最大值为1.41进行标度。事实上,出于技术原因,这些矩阵元最终都按照最大值小于1来进行标度。此外,当所说解码器最终投入使用时,需要调节每个扬声器输出的增益。为了调节增益,需要播放已经在四个主要方向上,即左、中央、右和环绕编码的、具有相等声音功率的一个信号,调节每个输出的增益,直到在听众所在位置的声音功率相等为止。在实践中,这意味着矩阵元的实际电平标度为在完全定向传播条件下解码器的四个输出是相等的。在以上关于后部矩阵元的方程中我们已经明确地包含了这种标定作用。
在向前定向传播和非定向条件下矩阵元的3dB差值并非不重要。在非定向条件下,在非定向传播条件下,89年专利的矩阵元的值为0.71,这些矩阵元平方和的值为1。而杜比矩阵元在标定时不是如此。LRL的非定向值为1,平方和值为2,或比89年专利中高3dB。应当指出,这种标定过程所生成的矩阵在矩阵为非定向时不对应于“杜比环绕”无源矩阵。杜比环绕无源矩阵规定后部输出的值应当为0.71*(Ain-Bin),而所说全向逻辑矩阵不满足这个规则。结果是当A和B输入为去相关的信号时,所说后部输出比其它输出强3dB。如果有两个扬声器共用所说后部输出,则将每个输出调节到比单个的后部扬声器弱3dB,这将使得当所说解码器输入去相关时,全部5个扬声器都具有近似相等的声音功率。如果使用89年专利中的矩阵元,同样的标定过程将使得当解码器输入为去相关时后部声音功率低3dB。
当所说输入为去相关信号时,后部声道响度如何实质上只是一个感觉问题。当播放环绕编码的录音时,听众可以愿意再现录制者在将录音混声时所听到的平衡效果。达到这种平衡是我们的解码器与编码器组合的设计目标。但是,对于标准立体声信号,目标是再现原始录音中的功率平衡,同时产生优雅而不张扬的环绕声。杜比矩阵元的问题是该矩阵没有保持常规的2声道录音中的功率平衡。环绕声道太强,而中央声道太弱。
为了认识这个问题的重要性,考虑当我们将包含三个分量,即一个去相关左左声道分量和右声道分量和一个独立的去相关中央分量施加到解码器中的情况下会发生什么。
Ain=Lin+.71*Cin                           ...(15a)
Bin=Rin+.71*Cin                           ...(15b)
当借助于一个常规的立体声系统播放Ain和Bin时,房间中的声音功率正比于Lin 2+Rin 2+Cin 2。如果三个分量全都具有基本相等的幅值,则中央分量与左分量加右分量的功率比值为1∶2。
我们希望我们的解码器能够以与立体声基本相同的功率比在房间中再现声音功率,而不考虑Cin与Lin和Rin的功率比值。我们可以用数学方程表示这些。如果其它矩阵元都取给定值,这个相等功率比值要求实质上相当于规定了中央矩阵元沿cs轴的函数形式。如果我们假设杜比矩阵元经过标定使得当所说矩阵完全是定向矩阵时后部声音功率比其它三个声道输出低3dB,即比标准标定值低3dB,则中央矩阵元应具有图16所示的形状。对于标准标定我们也可以这样做,其结果如图17所示。
在图16中,假设解码器输出中的功率比应与立体声中的功率比相同,并且后部杜比矩阵元经过标定后的电平比通常使用的矩阵元低3dB,注意虽然实际值对于非定向信号和完全定向信号给出了合理的结果,但是它们在中部低大约为1.5dB。
在图17中,假设具有与立体声相等的功率比,给出所说矩阵元和在杜比全向逻辑中实际使用的标定(点线),注意对于所有cs值,这些实际值都要低3dB以上。
这两个附图表示了混声工程师常常意识到的一些内容,就是说为在一个杜比全向逻辑系统中播放而制作的混声信号可能需要比为在立体声系统中播放而制作的混声信号具有更大的中央响度。相反,为在立体声系统中播放而制作的混声信号在全向逻辑解码器中播放时声音清晰度会降低。不过,无源杜比环绕解码器不是如此。当我们讨论中央矩阵元时将再次触及这个问题。
14.生成两个独立的后部输出
89年专利中矩阵元和杜比矩阵元中都存在的主要问题是只有一个后部输出。91年专利公开了生成两个独立的侧面声道输出的一种方法,该专利中的数学方程应用于1996年的参考文献[1]和申请No.08/742460中的左前象限。这个象限中矩阵元的作用是消除从左向中央定向传播信号的输出,同时保留左后声道中同时存在的非定向信号的某些输出。为了实现这个目的,我们假设LRL矩阵元具有下列形式:
对于左前象限
LRL=1-GS(lr)-0.5*G(cs)                      ...(16a)
LRR=-0.5*G(cs)-G(lr)                        ...(16b)
如能够看到的,这些矩阵元与89年专利中的矩阵元非常相似,但是在LRR方程中增加了G(lr)项,在LRL方程中增加了GS项。增加G(lr)项是为了将解码器B输入声道的信号添加到左后输出中,从而当去除定向传播信号时提供一定的非定向信号功率。然后我们求解函数GS(lr),规则是对于一个从左向中央移动的完全定向信号应当没有信号输出。GS(lr)的方程变为等于G2(lr),尽管在91年专利中给出了该方程更为复杂的表示形式。可以证明这两个表示式是等效的。
在参考文献[1]中,通过给定增值(sin(cs)+cos(cs))校正这些矩阵元,使之对于非定向信号更加接近恒定响度。虽然在右前象限中是完全成功的,但是在左前象限中不是非常成功的。参见图18。(对于右前象限,这些矩阵元与89年专利中的LRL和LRR矩阵元是相同的。)
在图18中,注意在左前象限中沿着从中间至左侧顶点的直线有3dB的下降,而沿左侧与中央之间的边界电平增值大约3dB。下面讨论后部象限中的“山脉”状部分。这个附图中已经去掉了V1.11中的“tv矩阵”校正,以便能够更好地在图20中与本发明进行比较。
图18表示关于声音功率的几个问题。首先考虑沿cs=0轴平方和的下降。之所以存在这种下降是由于LRR中G(lr)的函数形状不是最佳的。G(lr)的选择是任意的-在早期设计中在解码器中已经使用了这个函数,用模拟电路来实现它是很容易的。
理论上,我们希望在这个方程中包含函数GR(lr),并以这样的方式选择GS(lr)和GR(lr),以使LRL和LRR的平方和沿cs=0轴保持恒定,和使所说输出沿左侧与中央之间的边界保持为零。这可以实现。
我们还希望所说矩阵元与右前象限中沿lr=0轴的矩阵元相同。因此,
我们假设:
LRL=cos(cs)-GS(lr)                            ...(17a)
LRR=-sin(cs)-GR(lr)                           ...(17b)
我们想要所说平方和沿cs=0轴等于1,
(1-GS(lr))2+(GR(lr))2=1                       ...(18)
和所说输出对于定向信号,或者当t从0变化到45度时为零,
LRL*cos(t)+LRR*sin(t)=0                       ...(19)
方程(18)和(19)构成GR和GS的混合二次方程,用数值方法求解,并表示在图19中。使用如图所示的GS和GR导致对功率和沿cs=0轴的较大改进,如预期的一样。但是,保留了沿左侧与中央之间边界的平方和的峰值。
在实际的设计中,补偿这种误差可能不是非常重要的,但是我们决定采取下述策略试探性地这样做。我们将两个矩阵元都除以一个系数,该系数依赖于根据lr和cs组合的一个新变量。这个新变量称为xymin。(实际上,我们不采用除法,而是乘以下述系数的倒数。)
按照Matlab符号表示法:
%找出x或y的最小值
xymin=x;
if(xymin>y)
  xymin=y;
end
if(xymin>23)
  xymin=23
end
%注意xymin在0到22.5度间变化
然后我们利用xymin求得对于沿边界的矩阵元的校正。
在左前象限中
LRL=(cos(cs)-GS(lr))/(1+.29*sin(4*xymin))                    ...(20a)
LRR=(-sin(cs)-GR(lr))/(1+.29*sin(4*xymin))                   ..(20b)
在右前象限中
LRL=cos(cs)                                                  ...(20c)
LRR=-sin(cs)                                                 ...(20d)
在参考文献[2]中,还将这些矩阵元乘以“tv矩阵”校正系数。本申请的图20表示了没有“tv矩阵”校正的矩阵元。在本申请中这种校正是采用设置在矩阵之后的频率相关电路实现的,在下文中对其进行介绍。
应当指出,在图20中所说平方和接近1,并且除了在后部有意增大电平之外,都是连续的。
15.在向后定向传播时的后部矩阵元
在91年专利中给出的后部矩阵元不适合于5声道解码器,在我们的CP-3产品中试探性地加以改进。参考文献[1]和美国专利申请No.08/742460公开了获得沿左后象限边界的这些矩阵元的一种数学方法。该方法在所说边界比较奏效,但是其结果沿lr=0轴和沿cs=0轴是不连续的。在1997年3月的专利中,这些通过对这些矩阵元进行附加校正修复(大部分)了这些不连续点,所说矩阵元保持了它们沿定向传播边界上的特性。
对于在本申请中所述的矩阵元,已经通过内插法校正了这些误差。第一内插修复了LRL沿cs=0边界的不连续点。经过内插处理使得所说值在cs为零时与GS(lr)的值匹配,并且使得所说值随着cs向后负向增大而平滑地增大到由前述数学方法给出的值。第二内插使得LRR沿cs=0轴内插到GR(lr)的值中。
16.在从右至右后的向后定向传播时的左侧/后部输出
首先考虑当定向传播方向不确定或者朝向完全右侧或右后之间任何方向时的左后左矩阵元和左后右矩阵元。就是说,lr可以从0变化至-45度,并且cs可以从0变化至-22.5度。
在这些条件下,应当将输入信号的定向传播分量从左侧输出中去除,当定向传播向右或向右后时左后声道中应当没有输出。
在91年专利中给出的矩阵元实现了这个目的。它们与4声道解码器中的后部矩阵元基本相同,对于非定向响度增加了sin(cs)+cos(cs)校正。如果这样做的话,所说矩阵元都是简单的正弦和余弦:
LRL=cos(-cs)=sri(-cs)                       ...(21a)
LRR=sin(-cs)=sric(-cs)                      ...(21b)
注意,我们已经定义了新函数sric(x)和sri(x),前者等于0至22.5度范围内的sin(x),后者等于cox(x)。在定义存在向左定向传播信号时的左后矩阵元过程中我们将再次使用这些函数。
17.在从右后至后部的向后定向传播时的左侧/后部输出
现在考虑当cs大于-22.5度时的相同矩阵元。如我们在参考文献[1]和两个专利申请中所说,LRL在该范围上应当增大到1或者大于1,LRR应当减小到0。简单的函数就满足这个要求(记住在这些方程中cs是负值,并从-22.5变化到-45):
LRL=(cos(45+cs)+rboost(-cs))=(sri(-cs)+rboost(-cs))    ...(22a)
LRR=sin(45+cs)=sric(-cs)                               ...(22b)
Rboost(cs)是在参考文献[1]和申请No.08/742460中定义的。它与以前矩阵元中的函数0.41*G(cs)是基本等价的,不同之处在于在0>cs>-22.5范围内rboost(cs)为零,而当cs从-22.5度变化到-45度时它从0变化到0.41。其精确的函数形状是根据当声音从左后向正后方平移时保持后部输出的响度恒定的要求确定的。
现在完成了对于在向右定向传播时的左后矩阵元的校正。
18.在定向传播为从左向左后方向时的左后矩阵元
左后左和左后右矩阵元的变化特性要复杂得多。当lr从4.5减小到22.5或减小到0时,所说左后左矩阵元必须从0快速增大到接近最大值。在参考文献[1]中给出的矩阵元做到了这一点,但是正如我们在前面所述,在cs=0边界存在连续性问题。
1997年3月版解码器公开了一种解决方案,该方法使用了一个变量和若干条件的多个函数。在参考文献[1]中,之所以出现cs=0边界上的问题,是因为在边界的前侧(cs≥0)LRL矩阵元是由GS(lr)给出的。在后侧(cs<0)参考文献[1]中给出的这个函数具有相同的端点,但是当lr不等于0或45度时是不同的。
参考文献[1]中的数学方法提供了在22.55<lr<45范围内左后矩阵元的下列方程:
LRL=cos(45-lr)*sin(4*(45-lr))-sin(45-lr)*cos(4*(45-lr))
    =sra(lr)                                             ...(23a)
LRR=-(sin(45-lr).*sin(4*(45-lr))+cos(45-lr).*cos(4*(45-lr)))
    =-srac(lr)                                           ...(23b)
应当指出,我们定义了在这个范围内的两个新函数,sra(lr)和srac(lr)。
如果cs≥22.5,lr仍然可以从0变化到45。参考文献[1]将LRL和LRR(当lr的范围为0<lr<22.5时)(参见参考文献[1]中的
图6)定义为:
LRL=cos(lr)=sra(lr)                                     ...(23c)
LRR=-sin(lr)=-srac(lr)                                  ...(23d)
现在定义了在0<lr<45范围内的两个函数sra(x)和srac(x)。
19.1997年3月版
1997年3月版使用内插方法校正沿所说边界的LRR。其中存在两个不连续点。沿所说的cs=0边界,后部的LRR必须与向前方向的LRR匹配,它表明沿cs=0边界LRR=-G(lr)。
在1997年3月版中所选择的方式是根据0至15度范围的cs值施加一个内插值,尽管这种方式计算量较大。换句话说,当cs=0时,我们应用G(lr)求解LRR。当cs增大到15度时,我们内插srac(lr)的值。
沿lr=0轴也可能存在不连续点。在1997年3月版中,通过在LRR中增加一项校正(一定程度上)了这种不连续性,这是利用一个新变量,cs_bounded实现的。所说校正项简单地变为sric(cs_bounded)。这一项保证了在lr=0轴上的连续性。
下面首先用Matlab符号定义cs_bounded:
  cs_bounded=lr-cs:

  if(cs_bounded<1)%这限制了最大值

      cs_bounded=0;

  end

  if(45-|lr|<cs_boundad)%使用两个值中的较小值

      cs_bounded=45-lr;

  end

  for cs=0 to 15

      LRR=(-(srac(lr)+(srac(lr)-G(lr))*(15-cs)/15)+sric(cs_bounded));

  for cs=15to 22.5

    LRR=(-srac(lr)-sric(cs_bounded));
20.如97年8月版一样在逻辑7中实施的LRL
在本发明中,LRL是采用内插法计算的,与LRR一样。按照Mlatlab符号表示法:
for cs=0 to 15
  LRL=((sra(lr)÷(sra(lr-GS(lr))*(15-cs)/15)+sri(-cs));
for cs=15to 22.5
  LRL=(sra(lr)+sri(-cs));
21.在定向传播从左后向正后方时的后部输出
当定向传播方向从左后变化到正后方时,所说矩阵元按照参考文献[1]中给出的方程变化,只是增加了对于后部响度的校正。按照Matlab符号表示法,
For cs>22.5,lr<22.5
  LRL=(sra(lr)-sri(cs)+rboost(cs))
  LRR=-srac(lr)-sric(cs_bounded)
这样完成了在定向传播向左时的LRL和LRR矩阵元。将定义中左右互换就可以求得向右定向传播时的矩阵元值。
22.中央矩阵元
89年专利和杜比全向逻辑都包含下列矩阵元:对于向前定向传播:
CL=1-G(lr)+0.41*G(cs)                              ...(24a)
CR=1+0.41*G(cs)                                    ...(24b)
对于向后定向传播:
CL=1-G(lr)                                         ...(24c)
CR=1                                               ...(24d)
因为这些矩阵元相对于左右轴具有对称性,所以通过将CLCR互换可以求得向右定向传播时的CL和CR值。参见图21,该图为这个矩阵元的曲线表示。
在图21中,曲线的中间,左侧和后部顶点的值都为1。中央顶点的值为1.41。在实践中,将这个矩阵元标定使该最大值为1。
在申请No.08/742460和参考文献[1]中,用正弦和余弦代替了这些矩阵元。
对于向前定向传播:
CL=cos(45-lr)*sin(2*(45-lr))-sin(45-lr)*cos(2*(45-lr))+0.41*G(cs)
                                                           ...(25a)
CR=sin(45-lr)*sin(2*(45-lr))+cos(45-lr)*cos(2*(45-lr))+0.41*G(cs)
                                                           ...(25b)
这些方程从未实施。1997年3月版的产品使用的是89年专利中的矩阵元,但是采用不同的标度,和不同于G(cs)的一个增值函数。我们发现减小中央输出中非定向分量电平是重要的,并选择比全向逻辑电平低4.5dB的一个值。该增值函数(0.41*G(cs))被改变为当cs向中央增大时使矩阵元的值增大回复到全向逻辑值。通过试听测验试探性地选择1997年3月版中的增值函数。
在1997年3月版中,cs的增值函数与以前一样从0开始,并随着cs以这样的方式增大,使得当cs从0变为22.5度时CL和CR增大4.5dB。对于cs每增大1dB,这个增大量是一个固定dB数。然后所说增值函数斜度,使得在下一个20度,所说矩阵元又增大3dB,然后保持恒定。因此,当定向传播方向为“半向前”时(8dB或23度),新矩阵元等于旧矩阵元的中间值。当定向传播方向继续向前移动时,新矩阵元和旧矩阵元变为相等。因此当定向传播方向不确定时中央声道的输出比旧输出小4.5dB,但是当定向传播方向完全朝向中央时增大到旧值。参见图22,该图表示这个矩阵元的三维曲线图。
应当指出,在图22中所说中间值和右侧顶点和后部顶点已经减小4.5dB。当cs增大时,中央输出以两个斜率增大到1.41值。
我们已经发现在1997年3月版中使用的中央矩阵元不是最佳的。实践中解码器的大量实验已经证明,当你在立体声(2声道)再现与通过矩阵再现之间转换时,可能会丢失流行音乐录音的中央部分、和某些影片中的对话。此外,当中央声道的电平改变时,与前部扬声器距离不等的听众会注意到中央声音移动的视在位置。在开发这里所述的新中央矩阵元过程中充分考虑了这个问题。如我们后面将要看到的,当信号沿边界从左侧向中央或从右侧向中央平移时,也存在问题。当平移只及于其间时,申请No.08/742460中的矩阵元给出的中央扬声器的输出太低。
23.新设计中的中央声道
虽然有可能利用矩阵技术从中央声道输出中消除强定向传播信号,只要定向传播方向朝前但是不偏左或偏右,中央声道就必须以一定的增益系数再现A和B输入之和。换句话说,不可能从中央声道中消除去相关的左声道和右声道素材信号。我们唯一的选择是调整中央扬声器的响度。然而,它应当有多响?
这个问题取决于左声道和右声道主输出的特性。上述的矩阵值LFL和LFR用于当定向传播变为向前时消除输入信号中的中央分量。我们可以证明,如果输入信号已经利用一个交叉混声器,例如立体声频宽控制器编码为来自朝前的方向,则上述的矩阵元(89年专利中的矩阵元、1996年AES论文矩阵元、1997年3月版中的矩阵元、和在本文中先前所述的矩阵元)全都完全恢复初始的分离度。
但是,如果解码器的输入包括去相关的左声道和右声道,并且其中增加了不相关的中央声道,即
Ain=Lin+.71*Cin                                  ...(26a)
Bin=Rin+.71*Cin                                  ...(26b)
则当Cin的电平相对于Lin和Rin增加时,解码器的左前输出和右前输出中的C分量不能完全消除,除非Cin相对于Lin和Rin较大。一般来说,在左前输出和右前输出中会残留一些Cin。那么,听众听到了什么?
有两种方式可以计算出听众听到了什么。如果一个听众与左扬声器、右扬声器和中央扬声器的距离是精确相等的,则他们听到的是来自各个扬声器的声压之和。这相当于三个前部输出相加。在这些条件下,很容易证明左扬声器和右扬声器中中央分量的任何减少都会导致中央分量声压的净损失,而不论中央扬声器的幅值多大。这是因为中央扬声器输出总是从A和B输入之和获得的,并且当其幅值增大时,Lin和Rin信号的幅值必然跟随Cin信号的幅值一起增大。
但是,如果听众与每个扬声器的距离不等,则该听众很可能听到各个扬声器的声压之和,其相当于三个前部输出的平方和。事实上,仔细试听已经证明所有扬声器的功率和实际上最为重要的,所以我们必须考虑所有解码器输出,包括后部输出的平方和。
如果我们想要设计矩阵,使得当在立体声再现与矩阵再现之间转换时能够保持Lin、Rin和Cin的幅值,中央输出中Cin分量声功率的增大必须正比于它在左右输出中声功率的减小和它在后部输出中的减小。较为复杂的是如上所述左前输出和右前输出的电平增大3dB。这样就要求中央输出提高响度以保持该比值恒定。我们可以将这个要求写成一组声功率方程。可以求解这些方程以获得我们需要的中央扬声器的增益函数。
我们以前给出了表示杜比全向逻辑解码器在各种条件下的能量关系的曲线图。这种全向逻辑解码器不是最佳的。用我们的新解码器可以实现同样的功能。
图23表示当定向传播向前增大时如果要保持前部三个声道中输入信号中央分量的能量所需的中央增益(实线)。如图所示,所需的中央声道电平增大是十分陡峭的,即定向传播值每变化一个dB,中央声道幅值会增大许多dB。图中还表示了标准解码器的增益(点线)。
如上所述,对于这个问题有两种解决方案。我们首先介绍“影片”解决方案。该方案并不完全是数学方案。在实践中我们发现图23所示的函数上升过快。中央声道电平的变化太明显。我们决定略微放松功率要求,即中央声道电平比理想情况低大约1dB。如果我们重新计算所说中央值,我们会得到在图24中实线所示结果。实际上,我们可以用直线上升代替该曲线的前一部分,如图24中虚线所示。事实上具有这些中央值的结果对于影片来说已经是很优异的了。
参见图24,事实上该实线上升过快。虚线所示的线性斜率工作特性良好。
音乐需要一种不同的解决方案。图23和图24中所示的中央衰减是在假设以前给出的LFL和LFR矩阵元的前提下导出的。如果我们使用不同的矩阵元会怎么样?具体地说,我们确实需要积极地从左前输出和右前输出中去除中央分量吗?
试听测试表明过去的左前和右前矩阵元在播放音乐时无需去除中央分量。从声学意义上讲没有这样做的必要。从左前和右前输出中去除的能量必须提供给中央扬声器,如果我们不从左前和右前扬声器中去除这个能量,中央扬声器就无需增强。房间中的声功率是一样的。其技巧在于将恰好足够的能量输入中央扬声器中以对于不在轴线位置上的听众产生令人信服的前部声象,同时使对于与左前和右前扬声器相等距离的听众来说立体声宽度的减小最小化。
正如我们在申请No.08/742460中所作的那样,我们通过试错法可以找到最佳的中央响度。于是我们可以求得为保持房间中Cin分量功率所需的左前和右前矩阵元。与以前一样,我们假设中央声道的电平减小到比89年专利中低4.5dB,或者达到-7.5dB的总衰减。-7.5dB等于0.42。中央矩阵元可以乘以这个系数,从而可以定义一个新的中央增值函数(GQ)。
对于向前定向传播
CL=0.42*(1-G(lr))+GC(cs)                            ...(27a)
CR=0.42+GC(cs)                                      ...(27b)
对于后部定向传播
CL=0.42*(1-G(lr))                                   ...(27c)
CR=0.42                                             ...(27d)
对于GC(cs)尝试了多个函数。下面给出的一个可能不是最佳的,但是已足够好。它将角度cs用度来表示,并且是通过多次试验获得的。
用Matlab符号表示:
  center_max=0.65;

  center_rate=0.75;

  center_max2=1;

  cenrer_rate2=0.3;

  center_rate3=0.1;

  If(cs<12)

     gc(cs-1)=0.42*10(db*center_rate/(20));

     tmp=gc(cs+1);

  elseif(cs<30)

     gc(cs÷1)=tmp*10^((cs-11)*center_rate3/(20));

     if(gc(cs-1)>center_max)

        gc(cs÷1)=center_max;

     end

  else

     gc(cs÷1)=center_max*10^((cs-29)*center_rate2/(20));

  if(gc(cs÷1)>center_max2)

     gc(cs÷1)=center max2;

  end
end
在图25中绘出了函数(0.42+GC(cs))。注意从0.42(比杜比环绕低45dB)开始快速上升,其后为平缓上升,最后急剧上升到值1。
如果我们假定LFL、LRL和LRR的函数,我们就可以求解所需的LFR的函数。我们想要求得在左右输出中Cin分量应当具有的减小速率,然后设计能够提供这个减小速率的矩阵元。这些矩阵元还应当使Lin和Rin分量有所增大,并且在左至中央边界,以及右至中央边界应当具有目前的形状。
我们假设:
LFL=GP(cs)                                   ...(28a)
LFR=GF(cs)                                   ...(28b)
CL=0.42*(1-G(lr)+GC(cs)                      ...(28c)
CR=0.42+GC(cs)                               ...(28d)
然后可以按照下列方式计算左前和右前输出功率:
PLR=(GP2+GF2)*(Lin+Rin)+(GP-GF)2*Cin 2        ...(29a)
中央功率为:
PC=GC2*(Lin 2+Rin 2)+2*GC2*Cin 2                ...(29b)
后部功率依赖于我们所使用的矩阵元。我们假设在定向传播向前时后部声道衰减3dB,和LRL为cos(cs),LRR为sin(cs)。对于一个扬声器,
PREAR=(0.71*(cos(cs)*(Lin+0.71*Rin)-sin(cs)*(Rin+0.71*Cin)))2
                                                            ...(29c)
如果我们假定Lin 2≈Rin 2,则对于两个扬声器,
PREAR=0.5*Cin 2*((cos(cs)-sin(cs))2)+Lin 2                   ...(29d)
所有三个扬声器的总功率为PLR+PC+PREAR:
PT=(GP2+GF2+GC2)*(Lin 2+Rin 2)+((GP-GF)2+2*GC2)*Ci n2
    +PREAR                                            ...(30)
Cin功率与Lin和Rin音质的比值为:(假定Lin 2=Rin 2)
RATIO=(((GP(cs)-GF(cs))2+2*(GC(cs)2+0.5*(cos(cs)-sin(cs))2))
       *Cin 2/((2*(GP(cs)2+GC(cs)2+GF(cs)2)+1)*Lin 2
...(31a)
RATIO=(Cin 2/Lin 2)*((GP(cs)-GF(cs))2+2*(GC(cs)2)+0.5*(cos(cs)
     -sin(cs))2/(2*(GP(cs)2+GC(cs)2+GF(cs)2+1)...(31b)
对于常规立体声,GC=0,GP=1,GF=0。于是,中央与LR功率比值为:
RATIO=(Cin 2/Lin 2)*0.5                                 ...(32)
如果不论我们的有源矩阵中(Cin 2/Lin 2)值为多少,这个比值都是恒定的,则
((GP(cs)-GF(cs))2+2*(GC(cs)2+0.5*(cos(cs)-sin(cs))2)
          =((GP(cs)2+GC(cs)2+GF(cs)2+0.5)             ...(33)
上述方程可以用数值方法求解。如果我们与以前一样假设上述的GC,并且GP=LFL,则可以看到图26中所示的结果。
在图26中,实线表示使用新的“音乐”中央衰减函数GC保持恒定能量比值所需的GF的曲线。虚线表示1997年3月版中的LFR矩阵元sin(cs)*corr1。点线表示sin(cs),即不含校正项corr1的LFR矩阵元。应当指出,在cs达到30度以前,GF一直接近0,然后急剧增大。我们已经发现最好将cs的值限制在大约33度。实际上从这些曲线导出的LFR具有负号。
GF给出了当cs从0向中央增大时LFR矩阵元沿lr=0轴的形状。我们需要能够将这种特性与以前LFR矩阵元特性结合的一种方法,以前的LFR矩阵元在沿左与中央之间的边界,以及右与中央之间的边界上的特性是必须保持的。当cs≤22.5度时实现这个目的的一种方法是定义GF与sin(cs)之间的一个差值函数。我们可以用多种方式限定这个函数。用Matlab符号表示法:
  gf_diff=sin(cs)-gf(cs):

  for cs=0∶45;

    if(gf_diff(cs)>sin(cs))

     gf_diff(cs)=sin(cs);

  end

  if(gf_diff(cs)<0)

  gf_diff(cs)=0:
  end
end
%找有界的c/s
  if(y<24)

  bcs=y-(x-1);

  if(bcs<1)%它限制了最大值

     bcs=1;

  end
  else

  bcs=47-y-(x-1);

  if(bcs<1)%>46)

    bcs=1;%46;

  end
  end
现在可以用Matlab符号表示法将LFR矩阵元表示为:
%这一技巧对边界进行内插
%代价当然是分界!!!
if(y<23)%这是一半该区域的较易途径
  lfr3d(47-x,47-y)=-sin_tbl(y)+gf_diff(bcs);
else
  tmp=((47-y-x)/(47-y))*gf_diff(y);
  lfr3d(47-x,47-y)=-sin_tbl(y)+tmp;
end
应当指出,上述方程中gf_diff的符号的正号。因此,gf_diff抵消了sin(cs)的值,将沿lr=0轴第一部分的矩阵元值减小到0。参见图27。
应当指出,在图27中,该平面中部(没有定向传播)所说值为零,并且在cs沿lr=0轴增大到~30度过程中保持为零。然后所说值减小以与沿从左至中央和从右至中央边界的过去值匹配。
24.中央输出中的平移误差
如果我们将新的中央函数写成:
CL=0.42*(1-G(lr))+GC(cs)                            ...(34a)
CR=0.42+GC(cs)                                      ...(34b)
则该函数沿lr=0轴工作良好,但是沿从左至中央和从右至中央之间边界产生平移误差。在1996年的参考文献[1](它从未实施过)给出了一个沿左侧边界的平滑函数cos(2*cs)。这些值使得在左侧与中央之间平滑平移。我们希望新的中央函数沿这个边界具有同样的特性。
我们可以通过增加一个附加函数xymin对用于实现这个特性的矩阵元进行校正,所说附加函数用Matlab符号表示为:
center_fix_tbl=.8*(corr1-1);
      于是,
CL=0.42-0.42*G(lr)+GC(cs)+center_fix_table(xymin)  ...(35a)
CR=0.42+GC(cs)+center_fix_table(xymin)             ...(35b)
参见图28所示的CL矩阵元的三维表示。虽然不是完美的,但是这种校正在实践中作用极佳。
在图28中,注意对于沿左侧与中央之间边界平移的校正,它是相当平滑的。
在图29中,表示了左前输出(点线)和中央输出(实线)的曲线,注意向中央定向传播位于曲线图的左侧,而完全向左定向传播表示在右侧。按照“音乐”策略,我们目前将cs值限制在大约33度,(在轴上标度为大约13的位置)在这个位置所说中央输出比左侧输出大约强6dB。
25.编码器的技术细节
逻辑7编码器具有两个主要目的。首先,它应当能够以这样的方式编码5.1声道的音带,使得能够用逻辑71解码器解码所说编码信号,并且使主观变化最小。其次,所说编码输出应当是与立体声兼容的,就是说,它听起来应当尽可能接近相同素材信号的人工2声道混声效果。这种立体声兼容性的一个重要因素应当是当在一个标准立体声系统中播放时编码器的输出对于初始5声道混声中的每个声源都给出同样的听觉响度。在立体声中声源的视在位置应当尽可能接近在5声道初始信号中的视在位置。
在与慕尼黑的广播技术研究院(IRT)讨论时,我们清楚了上述立体声信号的立体声兼容性的目标利用无源编码器是无法实现的。所有声道都具有同等显著重要性的5声道录音必须按照上述方式编码。这种编码要求以保持能量不变的方式将环绕声道混合到编码器输出中。就是说,编码器输出的总能量应当相同,而不论驱动的是哪一个输入。这种恒定能量设置对于大部分影片声源和5声道音乐声源来说都是必需的,在后一种情况下乐器已经均衡地分配到全部5个扬声器。尽管这种音乐声源在目前不是很普遍,但是作者认为将来它们会变得很普遍。其中前台乐器设置在前部三个声道的音乐录音,以及后部声道中的初始混响需要不同的编码。
经过一系列测试(在IRT和其它地方)发现,如果将环绕声道以比其它声道低3dB的方式混合,可以用立体声兼容方式对这种类型的音乐录音成功地进行编码。在欧洲已经将这个-3dB电平作为环绕声编码的标准,但是该标准规定为了特殊的目的也可以采用其它环绕声电平值。新编码器中包含用于检测环绕声道中强信号的有源电路。当偶尔出现这种信号时,该编码器使用全环绕声电平。如果环绕声输入比前部声道相比持续为-6dB或更低,则环绕声增益逐渐降低3dB,以符合欧洲标准。
在申请No.08/742460中的编码器中也包含这些有源电路。但是,通过在慕尼黑的广播技术研究院对早期编码器的测试,我发现对某些声源的方向的编码不正确。为此开发了一种新的结构用于解决这些问题。新编码器性能优越之处在于它适用于多种难以处理的素材信号。原来的编码器最初设计为一种无源编码器。新编码器也可以在无源模式下工作,但是主要用于在有源模式下工作。所说的有源电路校正了在所说设计中固有的一些小的错误。但是,即使没有这种有源校正,其性能也好于以前的编码器。
通过仔细试听,发现了第一版编码器中的其它一些小问题。这些问题中的许多(但不是全部)在新编码器中得到了解决。例如,当将立体声信号同时施加到该编码器的前部和后部端子时,所得的编码器输出过分偏向前部。新编码器通过略微增大向后偏移补偿这种效应。同样,我们还发现当对主要为环绕声的影片进行编码时,有时可能丢失对话。通过如上所述对于功率平衡的改变基本克服了这个问题,但是该编码器还是为了与标准(杜比)解码器结合使用。新编码器通过在这些条件下略微增大编码器的中央声道输入来补偿这种效应。
26.对于设计的解释
新编码器采用与以前的设计和杜比编码器一样的方式处理左声道、中央声道和右声道信号,其中央衰减函数等于0.71,或-3dB。
环绕声道看起来比它们更加复杂。函数fc()和fs()使得环绕声道信号进入相对于前部声道具有90度相移的一个路径,或者进入没有相移的一个路径。在编码器的基本工作模式下fc等于1,fs等于0,就是说,只有产生90度相移的路径才是有源的。
crx值通常为0.38。它控制每个环绕声道负交叉馈入的量。同以前的编码器一样,当一个环绕声道只有一个输入时,A和B输出的幅值比为-0.38/0.91,该比值导致定向传播角度为22.5度至后侧。同样,两个输出声道的总功率为单位值,就是说0.91和0.38的平方和为1。
虽然在只驱动一个声道时该编码器的输出相对简单,但是当同时驱动两个环绕声输入时就会出现问题。如果我们用相同的信号驱动LS和RS输入端(在影片中经常出现),在加法节点的所有信号是同相的,所以每个输出声道的总电平为0.38+0.91或1.29。这个输出的倍增系数为1.29,或2.2dB,有些太强了。当两个环绕声道的电平和相位相近时,在该编码器中包含的有源电路就将函数fc的值减小2.2dB。
当两个环绕声道电平相同而相位相反时产生另一个问题。在这种情况下两个衰减系数相减,所以A和B输出具有相等的幅值和相位,电平为0.91-0.38,或0.53。这个信号将解码为一个中央方向信号。这个错误是严重的。以前的编码器设计在这些条件下产生一个非定向传播信号,这是合理的。施加到后部输入端的信号产生一个中央取向信号是不合理的。因此当两个后部声道电平相近而相位相反时,使用有源电路增大fs的值。后部声道的实际路径与相移路径混合的结果是在输出声道A和B之间产生90度的相差。这样就产生一个非定向信号,它正是我们所想要的。
如上所述,在慕尼黑IRT的讨论中我知道有一种欧洲标准环绕声编码器。这种编码器简单地将两个环绕声道衰减3dB,并将它们加入前部声道。因此,左后声道被衰减并加入左前声道中。当用于编码多声道电影声音或具有设置在环绕声道中的特殊乐器的录音时,这种编码器有许多缺点。这些乐器的响度和方向都被不正确地编码。但是,这种编码器对于古典音乐工作性能相当好,其中两个环绕声道基本是交混回响的。所说的3dB衰减是通过试听为产生立体声兼容编码而精心选择的。我决定当对固定音乐进行编码时我们的编码器应当包含这种3dB衰减,通过比较该编码器中的前部声道与环绕声道的相对电平,可以检测到这种状态。
函数fc在环绕声道中的主要作用是当环绕声道比前部声道弱得多时将输出混声中环绕声道的电平减小3dB。设置有电路用于比较前部和后部电平,并且当后部电平减小3dB时,fc的值最多减小3dB。当后部声道比前部声道弱8dB时达到最大衰减。这个有源电路看起来工作良好。它使得新编码器在处理古典音乐时与欧洲标准编码器兼容。有源电路的工作使得对于预期在后部声道中较强的乐器以全电平编码。
环绕声道的实数系数混声路径fs具有另一种功能。当一个声音信号从左前输入移动到左后输入时有源电路检测到这两个输入电平相近并且同相。在这些条件下,fc减小到零,fs增大到1。这种在编码过程中实数系数的改变导致对于这种类型的信号平移更加精确的解码。实际上这种功能或许不是必需的,但是它似乎是更优雅的改进。
有一种附加有源电路,目前还没有在产品中使用。电平检测电路检测中央声道与左前和右前声道之间的相位关系。一些流行音乐录音使用5声道将声音混合到全部三个前部声道中。当在全部三个输入中存在一个强信号时,该编码器输出具有过大的声功率,因为这三个前部声道将相同加和。当这种情况出现时,有源电路将中央声道的衰减增大3dB,以恢复编码器输出中的功率平衡。
归纳而言,有源电路用于:
1、当两个声道同相时将环绕声道的电平减小2.2dB。
2、当两个后部声道不同相时有效地增大后部声道的实数系数混合路径,以产生一种非定向传播状态。
3、当环绕声电平比前部电平小得多时,最大可将环绕声道电平减小3dB。
4、当它们的电平与前部声道相近时增大后部声道的电平和负相位。
5、当一个声源从一个前部输入平移到对应的后部输入时,使环绕声道混声使用实数系数。
当中央声道电平与前部和环绕声道输入电平基本相等时增大编码器中中央声道的电平。
当在全部三个前部输入中存在一个共有信号时,减小编码器中中央声道的电平。
将来对于编码器的改进可能包含与上述前部声道的特征2相似的特征。在目前的编码器中,当两个前部声道不同相时,其编码将使得解码器将声音置后。我们想要检测这种状态,并使所得输出为非定向信号。
27.解码器中的频率相关电路
图2表示在一种5声道解码器中设置在矩阵之后的频率相关电路的方框图。其中包括三个部分:一个可变低通滤波器、一个可变备用滤波器、和一个HRTF(头部相关传递函数)滤波器。所说HRTF滤波器根据后部定向传播电压c/s的值改变其特征。前两种滤波器响应用于表示在两个强定向传播信号之间间歇期间解码器输入信号的平均方向的一个信号而改变它们的特征。这个信号被称为背景控制信号。
28.背景控制信号
目前解码器的一个主要目标是能够从普通的2声道立体声信号最佳地产生一个5声道环绕声信号。另一个重要目标是该解码器应当能够将利用作为本申请一部分技术内容记载的编码器编码为2声道录音重构为5声道环绕声。这两种应用的区别在于感觉环绕声道的方式不同。利用普通的立体声输入,大部分声音需要产生在听众的前部。环绕声扬声器应当贡献一种令人愉悦的包络和环境感,而不是吸引他们的注意力。经过编码的环绕声录音需要环绕声扬声器更强和更有活力。
为了无需使用者调整而能够最佳地播放两种类型的输入,有必要甄别2声道录音和经过编码的5声道录音。所说的背景控制信号(BCS)就是用于进行这种甄别的。所说背景控制信号(BCS)与后部定向传播信号cs相似,并且是由其获得的。BCS表示cs的负峰值。就是说,当cs是比BCS更小的负值时,就使BCS等于cs。当cs是比BCS更大的正值时,BCS的值缓慢衰减。但是,BCS的衰减包含其它运算。
许多类型的音乐包含一系列的强前奏音符,或者在歌曲的情况下包含歌词。在前奏音符之间有背景音。这种背景音可以由其它乐器演奏的音符构成,或者可以由混声构成。用于获得所说BCS信号的电路保持了前奏音符峰值电平的轨迹。当目前的电平比前奏音符峰值电平低~7dB时,测量cs的电平。在前奏音峰值之间的间隙期间使用cs的值控制BCS的衰减。如果音符之间间隙中的信号为混声信号,则在通过对5声道初始信号编码获得的录音中可能有一个净向后偏置。这是因为在初始向后声道上的混声信号将编码为向后偏置。普通2声道录音中的这种混响不具有净的向后偏置。为实现这种偏置cs为零,或者略微向前。
按照这种方式获得的BCS用于反映录音的类型。只要存在明显的向后定向传播信号,BCS就总是为很强的负值。但是,如果录音的混声具有净向后偏置,即使没有强的向后定向传播信号,BCS也可能是负值。我们可以使用BCS调整这些滤波器,以使解码器在立体声与环绕输入的解码中最佳化。
29.频率相关电路:5声道版
图2中所示滤波器中的的第一个是一个简单的每倍频程6dB低通滤波器,其具有可调的截止频率。当BCS是一个正值或为零时,这个滤波器被设定为使用者可以调节的一个值,但是一般约为4kHz。当BCS变为负值时,所说截止频率升高,直到当BCS比22度更向后时为止,该滤波器不是有源的。在播放普通的立体声信号时,这个低频滤波器使得后部输出不突出。至少从V1.11版以来这个滤波器就是解码器的一部分,但是在早期的解码器中它是用cs,而不是BCS控制的。
第二个滤波器是一个可变备用(shelf)滤波器。该滤波器的低频部分(顶点)是固定的,为500Hz。其高频部分(零点)依赖于使用者的调整和BCS变化。这个滤波器实现了在目前的解码器中的“声舞台”控制。在申请No.08/742460中,“声舞台”是借助于矩阵元使用“tv矩阵”校正实现的。当定向传播方向不确定或者向前时,基于这种工作原理的早期解码器减小了后部声道的总电平。在本申请所述的新解码器中,所说矩阵元不包括“tv矩阵”校正。
在新解码器中,当声舞台控制被设定为“向后”时,所说备用滤波器的高频部分被设定等于低频部分,换句话说,该备用滤波器没有衰减,并且具有均匀频率响应。
当所说声舞台控制被设定为“不确定”时,所说高频零点的设定值改变。当BCS为正值或为零时,所说零点移动到710Hz,从而使高频衰减3dB。对于高频,其结果与早期解码器相同。当定向传播方向不确定或者前向时有3dB的衰减。但是,低频部分不衰减。它们以全电平来自房间的侧面。其结果是使低频成份更加丰富和更具包络性,而不会减少后部输出的高频成份。当BCS变为负值时,所说高频零点向极点移动,从而当BCS约为22度至后部时,所说备用衰减器没有衰减。
当将声舞台设定为“向前”时,工作方式是类似的,但是当BCS为零或负值时所说零点移动到1kHz。这使得高频成份衰减6dB。而当BCS变为负值时衰减又消失。
第三个滤波器是用c/s,而不是BCS控制的。这个滤波器用于模仿当声源位于听众前部大约150度方位时人头部和外耳的频率响应。这种类型的频率响应曲线被称为“头部相关传递函数”或HRTF。已经对于许多不同的人在多个角度测量了这些频率响应函数。一般来说,当一个声源与前部成大约150度时,在大约5kHz频率处频率响应存在一个强的陷波。当声源位于听众前方时存在一个类似的陷波,只在这种情况下所说陷波位于大约8kHz。位于听众侧面的声源不产生这些陷波。人脑利用5kHz陷波的存在作为检测声源位于听者背后的方式之一。
目前的5声道声音再现标准推荐将两个后部扬声器略向后放置在听众后面,即与前部+/-110或120度处。这个扬声器位置在低频范围内具有良好的包络性。但是来自听众侧面的声音不会象完全位于听众后面的声音那样产生相同的刺激度。电影导演常常希望产生声音来自听众背后,而不是来自侧面的效果。
通常,收听房间不具有适合放置完全位于听众背后的扬声器的大小和形状,侧面的位置是能够实现的最好位置。
解码器中的HRTF增加了后部声源的频率陷波,从而一个听者可以听到似乎比扬声器实际位置更远的声音。这个滤波器随cs变化。当cs为正值或零值时,该滤波器值最大。这使得环境声音和混响似乎在听者背后更远的地方。当cs变为负值时,该滤波器值减小。当cs大约为-15度时,该滤波器完全消失,声源似乎完全来自侧面。当cs变成更小的负值时,该滤波器再次被应用,从而使声源似乎移动到听众背后。当cs完全变为后部时,该滤波器被稍微改变以响应完全向后的声音的HRTF函数。
30.频率相关电路:7声道版
图3表示7声道解码器中的频率相关电路。图中所示电路包含三个部分,尽管在实际实施时次要的两个部分可能结合成一个电路。
前两个部分与5声道解码器相同,并且执行相同的功能。第三个部分是7声道解码器独有的。在V1.11版解码器和申请No.08/742460中,侧面和后部声道具有独立的矩阵元。矩阵元的特性是这样的,当cs为正值或不确定时,所说侧面和后部输出除延迟以外都是相同的。在cs变为比22度更小的负值之前,这两个输出一直保持相同。当定向传播方向进一步向后移动时,所说侧面输出衰减6dB,而后部输出增值2dB。这使得所说声音似乎从听者的侧面移动到听者的后面。
在本解码器中是利用侧面输出中的一个可变备用滤波器实现侧面输出与后部输出之间的甄别的。当cs向前或为零时图3所示的第三备用滤波器没有衰减。当cs变为比22度更小的负值时,该备用滤波器的零点迅速向1100Hz移动,导致高频衰减大约7dB。虽然是将这个备用滤波器作为与提供“声舞台”功能的备用滤波器不同的一个独立滤波器进行的介绍,但是这两个备用滤波器的运行可以借助于适合的控制电路结合在一个备用滤波器中。
尽管已经介绍和图示了本发明的优选实施例,但是还存在许多其它可能的实施例,在不脱离本发明构思的前提下,这些和其它改进及变化对于本领域技术人员都是显然的。

Claims (24)

1、一种环绕声解码器,其用于将包含定向编码分量和非定向分量的一对左声道和右声道音频输入信号重新分配到多个输出声道中以通过环绕一个收听区域的多个扬声器进行再现,包括用于确定所说左声道和右声道音频信号中的定向分量并由此产生至少一个左-右定向传播信号和中央-环绕定向传播信号的装置,所说解码器还包括:
左输入端和右输入端,它们用于接收所说相应的左和右音频输入信号;
左延迟装置和右延迟装置,用于从所说的左和右音频输入信号产生经过延迟的左和右音频信号;
多个乘法器,其数目等于所说多个输出声道数目的两倍,成对配置,每对中的一个第一单元接收所说经过延迟的左音频信号,一个第二单元接收所说经过延迟的右音频信号,每个所说的乘法器将其输入音频信号乘以一个可变矩阵系数以产生一个输出信号;
所说可变矩阵系数由所说定向传播信号中的一个或两个控制;和
多个加法器,每个加法器对应于所说多个输出声道中的一个,每个所说加法器接收一对所说乘法器的输出信号,并在其输出端产生所说多个输出信号之一,
所说解码器具有这样构成的所说可变矩阵值,使得能够减少在预定方向再现时不直接包含在输出中的定向编码音频分量,增强在预定方向再现时直接包含在输出中的定向编码音频分量,从而保持这些信号的总功率不变,同时与所说定向传播信号无关地保持所说非定向信号的左声道分量与右声道分量之间的高分离度,并保持响度,所说响度定义为有效恒定的非定向信号的总音频功率电平,其与是否存在定向编码信号,或者如果存在与其预定方向无关。
2、如权利要求1所述的解码器,其特征在于所说多个输出声道为5个,标记为左前声道、中央声道、右前声道、左环绕声道和右环绕声道。
3、如权利要求2所述的解码器,其特征在于它还包括设置在所说左环绕声道输出和右环绕声道输出之后的频率相关可变滤波器,从而以预定方式改变所说输出的频率响应和相位响应,所说变化由多个控制信号控制,所说控制信号响应在所说左和右音频输入信号中检测到的环绕声或背景环境分量的存在而产生。
4、如权利要求2所述的解码器,其特征在于它还包括设置在所说左和右环绕声输出之后的频率相关滤波器和附加延迟器,以从每个所说环绕声输出产生一个侧面和一个后部输出声道,从而以预定方式改变所说多个输出的频率响应和相位响应,所说变化由多个控制信号控制,所说控制信号响应在所说左和右音频输入信号中检测到的环绕声或背景环境分量的存在而产生。
5、如权利要求3或4所述的解码器,其特征在于所说控制信号为:
一个中央-环绕声控制信号,其响应包含在所说左和右音频输入信号中的同相中央信号分量与环绕声或反相信号分量的比值而产生;
一个背景控制信号,其响应包含在没有强定向传播信号存在期间在所说左和右音频输入信号中包含的反相信号分量的存在而产生。
6、如权利要求1至4中任何一项权利要求所述的解码器,其特征在于至少具有两种不同的工作模式,其中所说矩阵系数由所说不同工作模式中的定向传播信号以不同方式控制。
7、如权利要求6所述的解码器,其特征在于一种影片工作模式对于再现从影片声迹和其它视频源获得的环绕声编码的音频信号是最佳的,而一种音乐工作模式对于再现音乐录音或广播是最佳的。
8、如权利要求7所述的解码器,其特征在于为了解码影片声源,所说左前和右前输出的矩阵元是这样构成的,以尽可能多地消除输入信号中的中央分量,而中央输出矩阵元这样构成,使得中央输出的衰减从比以前的标准解码器至少大4dB电平开始,并且当所说中央/环绕声定向传播信号变为更大的正值时迅速减小,中间的矩阵值按照保持输入信号中的中央分量与去相关分量的功率比值和在解码器输出端的相同的要求确定。
9、如权利要求7所述的解码器,其特征在于为了解码音乐声源,中央输出的矩阵值这样构成,使得中央输出的衰减从比标准解码器至少大4dB电平开始,并逐渐减小到标准解码器的最大值,即当中央/环绕声定向信号值大约为20度时达到的一个值,然后当定向传播值增大时所说衰减保持相对不变,其中左前和右前矩阵元这样构成,使得输入信号的中央分量不会最大程度地从这些输出中去除,而是有意地调节以在解码器输出中保持输入信号的中央分量与去相关分量的功率比值,中央矩阵元和左前及右前矩阵元的变化特性还受到中央/环绕定向传播值的限制,从而导致中央输出与左前或右前输出电平之间存在大约6dB的差值。
10、如权利要求1所述的解码器,其特征在于所说左前和右前矩阵元这样构成,使得将一个输入信号编码为向后输出,从而该方向位于左后方向与右后方向之间,前部输出中不产生输出信号。
11、如权利要求1所述的解码器,其特征在于所说左前和右前矩阵元这样构成,使得不含有净左/右分量,但是具有大约为22度的中央/环绕定向传播值的信号电平增值大约3dB,当所说中央/环绕定向传播值减小到零,增大到45度时,或者当所说左/右定向传播值从零增大至+-45度时所说电平增值减小到零。
12、如权利要求4所述的解码器,其特征在于它还包括附加电路,所说电路通过检测输入素材信号中音符或音节之间背景音的方向生成一个背景控制信号,当所说中央-环绕定向传播信号为负值时,所说背景控制信号被迅速设定到所说中央环绕定向传播信号的值,当音符与音节之间背景音的方向为向前方向时所说背景控制信号被缓慢设定为正值,当播放环绕声编码素材信号时所说背景控制信号倾向于保持负值,当播放2声道素材时所说背景控制信号倾向于保持正值或零值。
13、如权利要求12所述的解码器,其特征在于所说背景控制信号用于控制前部和后部输出的相对响度,使得当音符之间的背景音方向不确定或为正值时减小后部输出的响度。
14、如权利要求12所述的解码器,其特征在于所说背景控制信号控制后部输出中的一个可变低通滤波器,使得当背景方向信号为正值或零值时将截止频率设定为一个使用者可调值,当背景方向信号为负值时上升到一个高值,从而使得当播放普通的2声道素材信号时环绕声输出不会突出。
15、如权利要求12所述的解码器,其特征在于所说背景控制信号控制一个可变备用滤波器,使得当所说背景控制信号为正值或零值时,后部输出中500Hz以上的频率衰减一个使用者可调值,当所说背景控制信号为负值时,所说衰减减小到零,从而使得当播放普通2声道素材信号时环绕声输出不会突出,
16、如权利要求5所述的解码器,其特征在于所说矩阵的后部输出分为一个侧面输出和一个后部输出,其办法是在后部输出中结合附加延迟,在侧面输出中结合可变低通滤波器,当所说中央-环绕定向传播信号比-22度更正时,所说低通滤波器被设定为一个高频率,而当所说中央-环绕定向传播信号变为比-22度更负时,所说低通频率迅速减小,当中央-环绕定向传播信号达到其-45度的最小值时,所说低通频率减小到终值500Hz。
17、如权利要求4所述的解码器,其特征在于5声道解码器的左环绕和右环绕输出还配置有一个可变滤波器,该滤波器模仿人头部/外耳系统对于与前部超过150度方位的声源的频率响应,使得当所说中央-环绕定向传播信号为零或正值时该滤波器具有其最大效果,当中央-环绕定向传播信号从零变化到-15度时该滤波器效果减小到零,当中央-环绕定向传播变为更负的值时,该滤波器效果再次变为最大,然后当中央-环绕定向传播信号达到其最小值-45度时,其自身略微修正以对应于人头部-外耳系统对于完全向后声源的频率响应。
18、如权利要求5所述的解码器,其特征在于它还包括附加电路,所说电路通过检测输入素材信号中音符或音节之间背景音的方向生成一个背景控制信号,当所说中央-环绕定向传播信号为负值时,所说背景控制信号被迅速设定到所说中央环绕定向传播信号的值,当音符与音节之间背景音的方向为向前方向时所说背景控制信号被缓慢设定为正值,当播放环绕声编码素材信号时所说背景控制信号倾向于保持负值,当播放2声道素材时所说背景控制信号倾向于保持正值或零值。
19、一种编码器电路,其用于自动将5声道音频输入信号混合到2个输出信号声道,使得在输出信号中保持输入信号中的能量比值,输入信号的方向保持在输出信号的不同分量的相位和幅值关系中,并且当输入信号从任意输入声道平移到其它任意输入声道时,所说输出信号的相位/幅值关系借助于权利要求1所述的解码器解码为尽可能接近初始方向,而且尽可能接近利用标准影片解码器解码时的初始方向,所说编码器包括:
5个输入端,用于接收分别标记为左、中央、右、左环绕和右环绕的所说5个音频输入信号;
2个输出端,每个输出端分别用于将所说两个输出信号之一与外部设备相连;
用于确定所说5个音频输入信号中的子集之间幅值/相位关系、并由此产生控制信号的装置;和
用于将每个所说输入信号的固定或可变比例混合到所说两个输出信号之一中的装置,所说可变比例响应所说控制信号而确定。
20、如权利要求19所述的编码器电路,其特征在于所说电路包括用于以有源方式校正每个所说输入信号的比例的装置,从而当将同相或反相的相同信号施加到环绕输入声道时可以使输出信号的能量与输入信号的能量匹配。
21、如权利要求19所述的编码器电路,其特征在于所说电路包括用于以有源方式校正每个所说输入信号的比例的装置,从而当将反相的相同信号施加到环绕输入声道时,所说编码器的输出信号具有90度的相对相位,以向解码器指示一种非定向传播状态。
22、如权利要求19所述的编码器电路,其特征在于所说电路包括用于当一个输入信号在所说左、中央、或右输入声道之一与同一侧的一个环绕输入声道之间,例如从左输入声道平移到左环绕输入声道时,以有源方式消除环绕声道中相移网路的装置。
23、如权利要求19所述的编码器电路,其特征在于所说电路包括用于以有源方式确定在所说左、中央、和右输入声道中一个共用信号的存在,并调节中央输入声道的电平以保持在所说输出声道的共用信号的总功率的装置。
24、如权利要求19所述的编码器电路,其特征在于所说电路包括用于将环绕输入声道电平与左、中央、和右输入声道电平进行比较的装置,当所说环绕输入声道的电平小于左、中央、和右输入声道的电平时,所说有源电路将环绕输入声道的电平最大减小3个分贝,该电路使得当环绕声道主要包含混响信号时所说编码器能够最佳地对音乐信号编码。
CNB988109131A 1997-09-05 1998-09-03 5-2-5矩阵编码器和解码器系统 Expired - Lifetime CN1214690C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US5816997P 1997-09-05 1997-09-05
US60/058,169 1997-09-05
US09/146,442 1998-09-03
US09/146,442 US6697491B1 (en) 1996-07-19 1998-09-03 5-2-5 matrix encoder and decoder system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2005100635227A Division CN1691841B (zh) 1997-09-05 1998-09-03 5-2-5矩阵编码器和解码器系统

Publications (2)

Publication Number Publication Date
CN1278996A CN1278996A (zh) 2001-01-03
CN1214690C true CN1214690C (zh) 2005-08-10

Family

ID=26737320

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB988109131A Expired - Lifetime CN1214690C (zh) 1997-09-05 1998-09-03 5-2-5矩阵编码器和解码器系统

Country Status (6)

Country Link
EP (1) EP1013140B1 (zh)
JP (2) JP2004507904A (zh)
CN (1) CN1214690C (zh)
AU (1) AU750877C (zh)
PL (1) PL338988A1 (zh)
WO (1) WO1999012386A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6154660A (en) * 1998-07-21 2000-11-28 Ericsson Inc. Callee-based telephone line preselection
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
KR100923297B1 (ko) * 2002-12-14 2009-10-23 삼성전자주식회사 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치
KR101049751B1 (ko) * 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
JP3915804B2 (ja) * 2004-08-26 2007-05-16 ヤマハ株式会社 オーディオ再生装置
TWI397903B (zh) * 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
KR101251426B1 (ko) * 2005-06-03 2013-04-05 돌비 레버러토리즈 라이쎈싱 코오포레이션 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법
WO2007013784A1 (en) * 2005-07-29 2007-02-01 Lg Electronics Inc. Method for generating encoded audio signal amd method for processing audio signal
CN101278598B (zh) 2005-10-07 2011-05-25 松下电器产业株式会社 音频信号处理装置以及音频信号处理方法
TWI420918B (zh) * 2005-12-02 2013-12-21 Dolby Lab Licensing Corp 低複雜度音訊矩陣解碼器
CN101361122B (zh) * 2006-04-03 2012-12-19 Lg电子株式会社 处理媒体信号的装置及其方法
TWI517562B (zh) * 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
US8660280B2 (en) 2007-11-28 2014-02-25 Qualcomm Incorporated Methods and apparatus for providing a distinct perceptual location for an audio source within an audio mixture
US8515106B2 (en) 2007-11-28 2013-08-20 Qualcomm Incorporated Methods and apparatus for providing an interface to a processing engine that utilizes intelligent audio mixing techniques
EP2373067B1 (en) 2008-04-18 2013-04-17 Dolby Laboratories Licensing Corporation Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
EP2154677B1 (en) * 2008-08-13 2013-07-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a converted spatial audio signal
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
CN103000179B (zh) * 2011-09-16 2014-11-12 中国科学院声学研究所 一种多通道音频编解码系统及其方法
EP2817802B1 (en) * 2012-02-24 2016-12-07 Dolby International AB Audio processing
CN108206021B (zh) * 2016-12-16 2020-12-18 南京青衿信息科技有限公司 一种后向兼容式三维声编码器、解码器及其编解码方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4152542A (en) * 1971-10-06 1979-05-01 Cooper Duane P Multichannel matrix logic and encoding systems
JPS5248001B2 (zh) * 1973-08-20 1977-12-07
US4862502A (en) * 1988-01-06 1989-08-29 Lexicon, Inc. Sound reproduction
JP2647991B2 (ja) * 1990-04-26 1997-08-27 三洋電機株式会社 方向性強調を有するオーディオ信号処理装置
US5504819A (en) * 1990-06-08 1996-04-02 Harman International Industries, Inc. Surround sound processor with improved control voltage generator
US5172415A (en) * 1990-06-08 1992-12-15 Fosgate James W Surround processor
US5136650A (en) * 1991-01-09 1992-08-04 Lexicon, Inc. Sound reproduction
GB9103207D0 (en) * 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
JPH0560098U (ja) * 1992-01-09 1993-08-06 三洋電機株式会社 音声信号処理装置
US5796844A (en) * 1996-07-19 1998-08-18 Lexicon Multichannel active matrix sound reproduction with maximum lateral separation

Also Published As

Publication number Publication date
WO1999012386A9 (en) 2004-10-21
EP1013140B1 (en) 2012-12-05
AU750877C (en) 2004-04-29
JP2006238498A (ja) 2006-09-07
EP1013140A1 (en) 2000-06-28
CN1278996A (zh) 2001-01-03
AU9302698A (en) 1999-03-22
EP1013140A4 (en) 2003-05-07
AU750877B2 (en) 2002-08-01
WO1999012386A1 (en) 1999-03-11
JP2004507904A (ja) 2004-03-11
JP4782614B2 (ja) 2011-09-28
PL338988A1 (en) 2000-12-04

Similar Documents

Publication Publication Date Title
CN1214690C (zh) 5-2-5矩阵编码器和解码器系统
CN1116785C (zh) 具有最大横向分离度的多声道主动型矩阵音响重放
CN1116737C (zh) 用户可调节的适应听力的音量控制
CN1281098C (zh) 环绕处理系统、环绕处理装置和环绕处理方法
CN1926607A (zh) 多信道音频编码
CN1254153C (zh) 声校正装置和声校正的方法
CN1197351C (zh) 图像合成装置
CN1541501A (zh) 音频矩阵解码设备的方法
CN101039536A (zh) 音频信号处理设备、音频信号处理方法及程序
CN1605225A (zh) 产生声场的方法和装置
CN1248223C (zh) 信息信号再现设备
CN1257639A (zh) 音频信道混合
CN1643982A (zh) 用于控制声场再现单元的方法和器件
CN1065382C (zh) 编码方法、译码方法、以及编码装置
CN1672464A (zh) 音频声道空间转换
CN1402952A (zh) 定向声音的方法和设备
CN1750000A (zh) 信息处理装置和方法、记录介质、程序和信息处理系统
CN1627862A (zh) 多个扬声器的音响系统以及自动控制方法
CN1529419A (zh) 用于视听设备的声象定位装置和方法
CN1756446A (zh) 音频信号处理装置及用于其的方法
CN1541456A (zh) 多通道回声消除方法、多通道声音传送方法、立体回声消除器、立体声音传送装置和传递函数计算装置
CN1495705A (zh) 多通道声码器
CN1160703C (zh) 语音编码方法和装置以及声音信号编码方法和装置
CN1427987A (zh) 在数字音频产生过程中用于适应主要内容音频和次要内容剩余音频能力的方法和设备
CN101048649A (zh) 可扩展解码装置及可扩展编码装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20050810

CX01 Expiry of patent term