CN1018790B - 声音成象的方法和装置 - Google Patents

声音成象的方法和装置

Info

Publication number
CN1018790B
CN1018790B CN 89109165 CN89109165A CN1018790B CN 1018790 B CN1018790 B CN 1018790B CN 89109165 CN89109165 CN 89109165 CN 89109165 A CN89109165 A CN 89109165A CN 1018790 B CN1018790 B CN 1018790B
Authority
CN
China
Prior art keywords
sound
signal
amplitude
acoustic image
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
CN 89109165
Other languages
English (en)
Other versions
CN1050119A (zh
Inventor
丹尼·D·洛
约翰·W·李斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qsound Ltd
Original Assignee
Qsound Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qsound Ltd filed Critical Qsound Ltd
Publication of CN1050119A publication Critical patent/CN1050119A/zh
Publication of CN1018790B publication Critical patent/CN1018790B/zh
Expired legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

两个普通隔离的扬声器可产生一种声象,这种声象使得收听者在感觉上似乎合成声音并非发自扬声器的实际位置。本发明的声音处理涉及将每一单耳或单声道信号分成两个信号,然后,根据相关频率基准凭经验取得的传递函数调整双声道的差值相位和幅度。如果适当取得这种传递函数,即可视需要设置明显的声源位置。

Description

本发明一般涉及用于处理声频信号的方法及装置,并且,更准确地说,涉及使得在收听者看来似乎合成声音并非发自扬声器的实际位置的处理声频信号的方法及装置。
人们能容易地判断声源的方向及距离。当收听者周围空间分布有多重声源时,都可以独立并同时感觉出每个声源的位置。虽然多年来对此作过许多和不断的研究,但尚未研究出满意的理论来说明一般听众的全部感觉能力。
测量一单点处声波的压力或速度、并将该声音有效复制在一单点处的方法,将保持语言可懂度和音乐的大致相同性。然而,这种系统去掉了探测声音所在空间位置所需的全部信息。因此,由这种系统重放的管弦乐队演奏使人感觉到似乎全部乐器都是在重放的单点处演奏的。
为此,努力着眼于保持住在传送或录音和重放期间声音中所本来包含的方向性信号。在1937年9月授予Alan·D·Blumlein的美国专利第2,093,540号中,提出了有关这种双声道系统的大致细节。详细说明了立体声声道之间差异的仿真加重作为扩大立体声声象的方法,这就是许多现有立体声增强技术的基础。
一些已知的立体声增强系统都多方设法依赖于使立体声声道交叉耦合,以加强在立体声录音时所含空间位置的现有提示信号。交叉耦合及其相对物串音抵消两者都取决于扬声器及收听区域的几何形状,因此,对各自情况必须个别予以调整。
虽然,对立体声系统所作的尝试性改进并未在当前广泛应用于 文娱活动的系统中得到重大的改善。实际听众喜欢轻松地坐下来,移动或转头,并适应室内布置的方便和配合其他家俱而安置他们的扬声器。
因而,本发明的目的是提供一种用于处理声频信号的方法及装置,使得当将它再现于两个声频变换器上时,可以适当控制声源的视在位置,以致在收听者看来似乎声源的位置与变换器或扬声器的位置是分开的。
本发明基于如下发现而发明的,即采用两个独立声道和两个扬声器的非立体音声频再现可在不同位置产生显著清晰度的高度局部化声象。在录音室专业化条件下,发明者们对这种现象的观察导致欲产生这种声音幻觉所需条件的系统化调查研究。若干年来的工作已对所述效应获得了实质性的了解,并显示出始终如一地并任意地将它重放的能力。
按照本发明,产生听觉幻觉,其特征在于将一声源安置在收听者周围三维空间中任何位置而不致为扬声器位置强加各种约束。采用同样两个声道可同时重放多面声象而对其数目没有已知的限制,这些声象有独立的声源并处于独立的位置。重放仅仅需要两个独立声道和两个扬声器,并可在广大限度内改变扬声器的分离距离或旋转而不致破坏幻觉。收听者的头部在任何平面内的转动,例如“注视”该声象,都不会干扰该声象。
按照本发明的声频信号处理,其特征在于处理单一声道的声频信号,以产生一个双声道信号,其中,在整个声音频谱根据相关频率的基准调整两个信号之间的不同相位和幅度。实现这种处理的方法是将单音输入信号分成两个信号,然后将该信号之一或两者通过 一种其幅度和相位一般为不均匀频率函数的传递函数。该传递函数可涉及信号反相及与频率有关的延迟。此外,就发明者所知,用于本发明处理的传递函数并非由任何现有的已知理论可以推导出来的。它们的特征在于必须依靠经验方法。每项处理传递函数将一声象置于由传递函数特征所决定的一单独位置处。因而,声源位置由传递函数唯一地加以决定。
对于一给定位置来说,可能有若干不同的传递函数,其中每一函数都足以将声象一般地置于特定位置。
若需要移动声象时,可通过从一种传递函数连续平滑地改变为另一种传递函数来产生。因此,处理信号所需要的适当可变通的处理过程不局限于产生静态声象。
经处理后可直接重放按照本发明处理的声频信号,或者由传统立体声录音技术将其录制在诸如光盘、磁带、唱片或光学声迹等不同媒介物上,或者由诸如无线电或电缆等任何传统立体声传送技术将其传送,而不致对本发明所提供的听觉声象有任何不利的影响。
亦可递归地应用本发明的成象方法。例如,若将一常规立体声信号的每一声道当作单声道信号,并将各声道成象在收听者所处空间中两个不同位置时,将会沿着各声道声象位置的连线感受到一种完整的传统立体声声象。此外,当将立体声记录带或盘记录在多声迹磁带时,例如,具有二十四声道磁带上,通过一传递函数处理器可馈给每一声道,因而,录音工程师可把不同仪器和话音随意定位,以形成一种专业化录音室。这样做的结果仍为可在一般重放设备上放唱的双声道声频信号,但它却包含本发明的听觉成象能力。
图1为表示用于定义声象位置参数的收听几何形状的平面图。
图2为与图1相对应的侧面图。
图3为表示用于定义收听者位置参数的收听几何形状的平面图。
图4是与图3相对应的立视图。
图5a-5k为在扬声器位置相应变化情况下各自收听状况的平面图,而图5m为对于三间收听室的临界尺寸表。
图6为在两间隔室中完成一项声象转换实验的平面图。
图7为本发明与先有技术作法相关联的处理方框图。
图8为按照本发明一实施例的一种声音成象系统的方框图形式示意图。
图9为按照本发明一实施例的工作站立体表示法。
图10描绘用于控制本发明的计算机绘图显示透视图。
图11描绘用于控制本发明的三个正交图的计算机绘图显示。
图12为表示由本发明所形成的虚声源的示意图,图上显示出三个隔离室的平面图。
图13为用于展示本发明设备的方框图形式示意图。
图14为以电压对时间关系画出的一试验信号的波形图。
图15为按照本发明一实施例列表表示传递函数的数据。
图16为按照本发明一实施例的声象配置系统的方框图形式示意图。
图17A和17B为图16声音处理器中所用典型传递函数的曲线图。
图18A-18C为实施本发明的电路方框示意图;以及
图19为进一步实施本发明的附加电路的方框示意图。
为了定义各名词术语使按照本发明的听觉成象过程能够明确进 行说明起见,图1-4示出涉及的某些尺寸和角度。
图1为一种立体声收听状况的平面图,分别示出左方和右方扬声器101和102,一个收听者103,以及对收听者103来说显而易见的声象位置104。仅为解说起见,使图示收听者位于垂直于扬声器101和102连线106、并直立在其中点处的直线105上。这个收听者位置称之为基准收听者位置,但在本发明的情况下,收听者并不限制在该位置上。根据基准收听者位置,逆时针方向测量自直线105到收听者103与声象位置104之间的直线107的声象方位角(a)。同样地,将声象斜线距离(r)定义为从收听者103至声象位置104的距离。该距离为三维空间中所测定的实际距离,而并非在平面图或其他正交图上所测定的投影距离。
在本发明中,声象可能显著地出现在越出各扬声器的平面。因此,图2中为声象定义了仰角(b)。收听者位置201与图1中位置103相当,两声象位置202与图1中声象位置104相当。从一水平直线203向上通过收听者201的头部至收听者的头部到声象位置202的连线204而测定声象仰角(b)。应当指出,扬声器101、102不一定放在直线203上。
在定义有关基准收听位形的声象位置参数后,继续进行定义在所述收听位形方面可能变化的各种参数。参照图3,扬声器301和302,以及直线304和305分别对应于图1中的项目101、102、106和105。沿直线304测量扬声器的间隔距离(S),并沿直线305测量收听距离(d)。如果将收听者安排在平行于直线304、沿直线306至位置307之处,就定义沿直线306所 测定的横向位移(e)。对每个扬声器301和302来说,从通过扬声器301、302的直线,并垂直于各扬声器连线的直线,朝着收听者方向按照逆时针方向测定,定义为相应的方位角(p)和(q)。同样地,对收听者来说,从正面对着收听者方向的直线305,按逆时针方向定义方位角(m)。
图4中,从通过收听者303头部的水平线401向上至扬声器302的垂直中心线测量扬声器高度(h)。
所定义的各参数使一种给定的几何形状允许具有几种描述方法。举例来说,可将一声象位置描述为具有完全等值的(180,0,X)或(0,180,X)。
在惯用的立体声的重放中,将声象限于沿图1中直线106的位置,而本发明所产生的声象则可自由地安置于空间中:方位角(a)可分布在从0-360度的范围内,距离(r)并不局限于与(s)或(d)相当的距离。可将一声象以几分之一的(d)形成在非常靠近收听者、或远离好几倍(d)的距离处,并且可同时在任何方位角(a)处而不参照扬声器所对着的方位角。此外,本发明还能使声象定位在任何仰角(b)处。收听者距离(d)可自0.5m至30M或往远处变化,并在变化期间处于空间中的声象具有明显的静止状态。
采用相同信号驱动各个距离上的扬声器,在扬声器距离为0.2m至8m的情况下获得良好的声象形成。在很大范围内,各扬声器的方位角(p)和(q)可以独立地改变,而对声象没有影响。
本发明的特征在于:适度改变扬声器高度(h)不会影响收听者所感觉的声象仰角(b)。这点对(h)为正负值,也就是说,扬声器位置高于或低于收听者头部高度的两种情况下都是正确的位置。
由于所形成的声象极为逼真,所以收听者自然会转过来“注视”声象,也就是说,直接面向所述声象。当声象形成,仍保持稳定;对于至少从+120至-120度的角度(m)范围内来说,收听者的方位角(m)对声象的空间位置没有可感觉到的影响。一局部化声源的印象是如此强大,以致使听众在“注视”声指向声象时没有困难;一群听众将会报告同一声象位置。
图5a-5k示出一组共十分收听几何形状,并已在其中测试了声象的稳定度。图5a中,示出收听几何形状的平面图。左方和右方扬声器501和502分别为收听者503重放声音,产生声象504。子图5a直至5k示出扬声器定向方面的变化,而且一般与子图5a类似。
曾将所有十个几何形状在具有不同数值的扬声器间距(s)和收听者距离(d)(如在图5M表中所列)的三间不同收听室内作过试验。试验室1是含有大量设备的一间小播音室控制区,试验室2是几乎完全空着的一间大型录音室,而试验室3则是三面墙上设有吸音材料的一间小实验室。
要求收听者对每项试验指出两种情况的感觉声象位置;收听者的头部角度(m)为零,头部转过来面对着视在声象位置。每项试验都请三个不同听众重复进行。因此,声象的稳定度是以总数为180种位形来试验的。这180种位形的每一种都给扬声器提供同一输入信号。就每次情况而论,都感觉声象方位角(a)为负60度。
图6中,示出一种声象转换实验,其中声象601由按照本发明所处理的信号形成,所述信号在第一试验室604中激励扬声器602和603。在德国专利1927401号中作为实例示出的 一仿真头605,在其耳朵模型中载有左和右传声器606和607。来自传声器606、607线路608和609上的电信号由放大器610和611分别进行放大,接着,在第二试验室614中各自激励左和右扬声器612和613。一收听者615位于与第一试验室隔声的第二试验室中,将会感觉到有一个与第一试验室中声象601相符的清晰第二声象616。
图7中示出本发明声音处理器与已知系统相关联的一个实例,其中,可能是磁带重放机的一个或多个多声迹信号源701,将多个由多声源中得出的单耳信号702馈给一演播室混合控制台703。可使用该控制台来修改各信号,例如,以任何合意方式来改变电平和平衡频率容量。
将控制台703所产生的许多修改过的单耳信号704连接到按照本发明的声象处理系统705的输入端。在该系统之内,对每一输入声道都赋予一声象位置,并将来自每一单独输入信号704加上传递函数处理以产生双声道信号。将全部双声道信号进行混合以产生最后信号对706、707,然后,又将该对信号返回到混合控制台708。应当明了,本发明所产生的双声道信号并非真正的左方及右方立体声信号,然而,这种含义却提供了一种称呼这些信号的简易方法。因此,当混合全部双声道信号时,将全部左方信号组合成一个信号而将全部右方信号组合成一个信号。实际上,控制台703和控制台708可以是同一控制台的分隔开的两部分。利用控制台设施即可将经处理过的信号应用于激励扬声器709、710,以供监听之用。经任何需要的修改和电平设定以后,再将主立体声信号711和712引向主立体声录音机713,后者可 以是一台双声道磁带录音机。图中项目705以后的项目都是先有技术中众所周知的。
图8中更详细地示出声象处理系统705,其中,输入信号801相当于图7的信号704,而输出信号807、808分别相当于图7的信号711、712。每一单耳输入信号馈给一单独的信号处理器802。
这些处理器802都独立运行、不附带声频信号的互相耦合。每一信号处理器运行,用来产生具有按照频率基准而调整的微分相位和幅度的双声道信号。以下将对这些传递函数进行详细的说明。可在时域描述为实时脉冲响应或等效地在频域描述为复频率响应或幅度与相位响应的传递函数,仅表征输入信号准备投射所要求的声象位置。
将各信号处理器所产生的一对或多对处理过的信号对803加到立体声混合器804的输入端。并可将其一部分或全部加到一存储系统805的输入端。该系统能存储完整的、经处理过的立体声声频信号,并能同时出现在输出端806重放它们。一般说来,这种存储系统可具有不同数目的成对输入声道和成对输出声道。将来自存储系统的若干输出806再加到立体声混合器804的另外各输入端。立体声混合器804将全部左方输入相加以产生左方输出807,并将全部右方输入相加以产生右方输出808,在相加前合理地修正每个输入信号的幅度。在混合器中不会发生左和右声道的相互作用或耦合。
一位操作人员809可借助于人机接口装置810控制该系统的运行,以指定要赋予每一输入声道所要求的声象位置。
以数字方式实现信号处理器802,或许是特别有利的,可因而对声象的位置、轨迹或移动速度不加以限制。
这些根据相关频率基准提供相位和幅度必要差分调整的数字声音处理器将在下面作更详细的说明。在这种数字执行过程中,要提供实时信号处理,虽然这种操作是可行的,但不一定总是经济的。如果不提供实时信号处理,则应将输出803连接到存储系统805,后者能够缓慢录音并实时重放。反之,如果提供足够数量的实时信号处理器802,则可省略存储系统805。
图9中,操作员901控制装备有左和右立体声监控扬声器903、904的混合控制台902。虽然最终处理的声象稳定度在扬声器间距(s)即使小到0.2m时仍是良好的,但对混合操作员来说,最好将装备的扬声器安置于至少离开0.5m之处。采用这种间距时,更容易获得精确的声象位置。提供了一台计算机绘图显示装置905、一台多轴控制器906,以及键盘907。为支持它们的运行,配有适当的计算及存储设备。
计算机绘图显示装置905可提供如图10和11所示、能反映空间中声象的位置或轨迹特征的曲线。图10表示一种收听状况的显示1001,其中与代表移动图象屏幕1004和透视空间提示信号1005、1006一起,呈现一典型收听者1002和一声象轨迹1003。
在显示屏面的底部是有关操作声音径迹细节部分的项目菜单1007,包括录音、时间同步和编辑信息。可由键盘907,即通过将光标1008移到所述项目,应用多轴控制器906来选择菜单项目。所选择项目可利用键盘907加以修正,或利用多轴控 制器906上的按钮予以跳过,来调用系统作用。特别地,菜单项目1009使操作只能借助软件连接多轴控制器906,以控制从其投影透视图的观察点,或控制目前声象的位置/轨迹。另一菜单项目1010则容许选择图11所示的另一种显示。
在图11的显示中,在图10中示出的实质上全屏幕透视图1001已被一组同一景色的三个正交图,即:一顶视图1101,一正视图1102,及一侧视图1103所取代。为有助于说明,其余屏幕象限则被透视图1001的一种缩小而较粗略的型式1104所占用。再一个基本上类似于在1007示出并具有类似功能的菜单1105占有屏幕的底部。一个特殊的菜单项目1106容许跳回到图10的显示。
图12中,第一室1204中的声源1201、1202和1203由分别产生右和左立体声信号的两个传声器1205和1206加以探测,所述立体声信号是利用普通立体声录音设备1207录制的。如果在普通立体声重放设备1208上重放,当来自传声器1205、1206的信号、分别激励右和左扬声器1209、1210,则在第二室1215中的收听者1214将会感觉到分别与声源1201、1202、1203相应的普通立体声声象1211、1212、1213。这些声象将处于与传声器1205、1206有关的各声源横向位置的扬声器1209、1210连线上投影的各位置处。
如将两对立体声信号利用声音处理器1216加以如上详细处理和组合,并由普通立体声重放设备1217复制在第三室1220中的右方和左方扬声器1218、1219上时,则声源清脆的空 间局部化声象对于处于与扬声器1218、1219的实际位置无关位置处的收听者1226来说是显然的。让我们假定这样处理:将原来右声道信号的声象形成在位置1224处,将原来左声道信号的声象形成在1225处。这些声象中的每一个都表现得似乎它是一个真的扬声器;我们可将这种声象视为“虚的扬声器”。
要将一单耳声频信号的声象投影到一给定位置时需要一个传递函数,其中,将一双声道信号的差分幅度和微分相位两者都在跨越整个声频频带上按照相关频率基准关系进行调整。就规定每一项这种响应的一般应用而言,为达到最佳的声象稳定性和相干性,在整个声频频谱范围内独立地对双声道中的每一声道必须以不超过40H2的间隔规定幅度和相位的差值。对那些不需要高品质和声象位置的应用而言,可将频率间隔予以扩展。因此,这种响应的规格需要大约1000个实数(或等效地,500个复数)。基于主观测量,有关听觉空间位置的人类感觉差异稍欠明确,但在一真正三维空间内,大于1000个明显位置的情况则可由一个普通收听者分辨清楚。因而,有关全部可能位置的全部响应的广泛表征构成巨量数据,它包含总数超过一百万个实数,其收集工作正在进行之中。
应当指出的是,在按照本发明的声音处理中,提供双声道之间差分调整的传递函数是在声音频谱范围内就每项40H2间隔由追踪及误差试验逐点建立起来的。此外,有如下文将说明的,声音处理器中的每项传递函数只把与两个分开变换器有关的声音定位在一个位置,也就是说,定位一个方法、高度及深度。
然而,实际上无需明白表示全部传递函数响应,因为,镜象对称性通常存在于所述右和左声道之间。如将修改声道的响应互换时,会使声象方位角 (a)反相,而仰角(b)和距离(r)仍保持不变。
利用普通设备及通过使用简化信号展示本发明的过程及听力幻觉是可能的。如将处于已知频率状态的正弦波“群”以较长时间间隔平滑地选通和截断时,则此频域的一段极狭频带即被合成信号所占用。实际上,信信号将以单一频率抽样所需要的响应。因此,把所需要的响应(亦即,传递函数)简化为在取决于频率的基础上、左右声道间差值幅度和相位(即延迟)的简单控制。从而人们会理解,通过在声频频谱范围内、就每项选定的频率间隔进行微分相位和幅度调整,可凭经验建立起供一特定声音位置用的传递函数。根据FOURIER定律,可将任何信号表示为一系列的正弦波之和,因此,所用信号完全是一般性的。
图13中示出用于论证本发明系统的一项实例,其中,由计算机1301(Hewlett-Packard,型号330M)控制声音合成器1302(Hewlett-Packard多功能合成器,型号8904A),以产生馈给声频延迟线1305(Eventide    Precision    Delay型号PD860)的双声道输入端1303、1304的单耳声频信号。自延迟线1305起,右方声道信号通往可开关的反相器1306,然后,左右信号通过各自的可变衰减器1307、1308,并通往两个功率放大器1309、1310,以分别激励左右扬声器1311、1312。
合成器1302产生任何要求的试验频率、并采用图14所示包络线的平滑选通的正弦波“群”1401。用20毫秒持续时间的第一线性斜波1402选通正弦波,以恒定幅度1403停留45毫秒,然后,用20毫秒持续时间的第二线性斜波1404截 断正弦波。以大约1至5秒的间隔1405重复正弦波“群”。
此外,应用图13的系统和图14的波形,本发明可在声音频谱范围内、通过在延迟线1305中调整时延并由衰减器1307、1308调整幅度建立一传递函数。收听者会完成该调整,收听声音位置并决定其位置是否正确。若是正确的,则检验下一频率间隔。若不正确时,那么就进行进一步调整并重复收听过程。以这种方式就可建立在声音频谱范围内的传递函数。
图15是待用来构成传递函数的实用数据表,所述传递函数适于远离扬声器的方向使若干正弦波频率的声象复制。恰如上文所述,此表可用试凑法产生。曾经发现这些声象全部都是稳定的,并可在图5中详述的全部三个收听室内重复进行,以供包括直接面对声象的各式各样的听众头部姿态及各类听众之用。
我们可将以上详述狭窄频带信号的位置如此加以概括,使容许代表诸如演讲及音乐等复杂声源的宽频带信号得以成象。如果就整个声频范围内的全部频率来规定由单独输入信号得到的双声道的差分幅度及相移时,也就规定了完全的传递函数。实际上,只需要明确指定所关心的频带中的若干频率用的差分幅度和延迟。那么就可由内插法求出处于那些经指定频带之间的任何中间频率状态的幅度和延迟。倘若所指定响应的频率相隔不太宽,并考虑到所代表的实际响应的平滑度或变化率时,则内插法就不太关键性了。
在图15所列表中,将幅度和延迟加到每一声道中的信号上,并将此大体上示于图16中,其中,提供独立的声音处理器1500、1501。将此单声道声音信号在1502处馈入,并馈给两个声音处理器1500、1501,在这里根据相关频率基准调整幅度 与相位,因而在左右声道分别输出1503、1504处的差值如上文所说明的是凭经验确定的正确数量。在线路1505上所馈入的控制参数会改变微分相位和幅度调整,因而,可使声象处于一种不同的、要求的位置上。例如,在数字式实现过程中,声音处理器可以是有限脉冲响应(FIR)滤波器,其系数是由控制参数信号改变的,藉此提供不同的有效传递函数。
如下列分析所示,可将图16的系统加以简化。首先,只有双声道延迟之间的差异即差值是重要的。假定左右声道的延迟分别为t(l)和t′(r)。通过加上任何固定延迟t(a)来定义新延迟t′(l)和t′(r),因而:
t′(l)=t(l)+t(a)    (1)
t′(r)=t(r)+t(a)    (2)
其结果是,在一段时间t(a)以后或如式中t(a)为负时更早听到全部效应。这种一般表达式在t(a)=-t(r)特定情况下仍可适用。代入下式:
t′(l)=t(l)-t(r)    (3)
t′(r)=t(r)-t(r)=0    (4)
藉此种变换,我们总可以使一个声道中的延迟减小为零。在实际实施中,我们必须小心减去较小的延迟,使得永不需要出现一个负的延迟。最好是在一声道中留下一个固定的剩余延迟并改变另一声道中的延迟来避免这一问题。若此固定剩余延迟足够大时,则可变延迟就有必要是负的。
其次,我们不必独立控制声道幅度。音响工程上的一种普遍作法是通过或者放大或者衰减来改变信号幅度。因此,只要两个立体 声声道都以同一比率进行改变,所载位置信息即无变化。重要且必须予以保持的就是幅度的比率或差值。只要保持这种差值,在本说明中的全部效应和幻觉就完全与重放的全部声音电平无关。据此,借助类似于上文所述用于定时或相位控制的一种操作,我们即可将全部幅度控制置于一个声道中,而将另一声道保留在一种固定的幅度状态下。再者,给一声道加一固定的剩余衰减可能是方便的,因而,使全部必要比率均可由另一声道的衰减而达到。于是,仅在一声道中应用可变衰减器就可得到充分控制。
因此,我们可通过把微分衰减和延迟确定作为一单声道的频率函数,来规定全部必要的信息。可为第二声道确定一个固定的、与频率无关的衰减和延迟;如留下这些未指定时,我们即假定增益为一,而延迟为零。
从而,就任一声象位置、也即任一左/右传递函数而言,可将微分相位和幅度调整(滤波),全部组织在一个声道或另一声道或两声道之间的任何组合中。可将声音处理器1500、1501中的一个简化为不超过一可变阻抗或简化为仅为一条金属直线。但不能是一条开路。假定仅在一个声道中完成相位和幅度调整,以提供双声道之间必要的差值,那么,传递函数就会如图17A和17B所表示的那样。
图17A表示双声道不同相位的一种典型传递函数,其中,左声道未予改变,而右声道则在声音频谱范围内根据相关频率基准进行相位调整。同样,图17B一般表示双声道差动幅度的一种典型传递函数,其中,左声道的幅度未予改变,而右声道则在声音频谱范围内根据相关频率基准受到衰减。
下面指出图16的声音位置控制器1500、1501,举例来说,可以是模拟或数字式的,并可包含下列电路元件中的一些或全部元件:它们是滤波器,延迟线,反相器,放大器,以及移相器等。可将这些功能性电路元件用任何方式组织,来得到传递函数。
该信息的若干等效表示法都是可能的,并且都普遍应用于相关技术中。
例如,可采用各种等值、将延迟规定为以任何给定频率状态下的相位改变:
相位(度数)=360×(延迟时间)×频率
相位(弧度)=2π×(延迟时间)×频率
应用这种等值时必需小心,因为它不足于确定相位的主要值;若上述等值成立,则需要全相位。
电子工程界所普遍采用的一种方便的表示法是复合S平面表示法。采用实时模拟元件(不是任意多的),可实现的全部滤波器特性规定为LAPLACE复频变数S中的两个多项比值。其一般形式为:
T(s)= (Ein(s))/(Eout(s)) = (N(s))/(D(s)) (5)
式中T(s)是S平面中的传递函数,Ein(s)和Eout(s)分别是输入和输出信号是S的函数,而分子和分母函数N(s)和D(s)为下列形式:
N(s)=a0+a1s+a2s2+a3s3+…ans11(6)
D(s)=b0+b1s+b2s2+b3s3+…bns11(7)
这种标志法的吸引力是它可以非常紧凑。要完全地指定所有频 率情况下的函数,无需内插法,而只需要指定n+1个系数a以及n+1个系数b。具有这些指定的系数,在任何频率情况下,都可利用众所周知的方法方便地得到传递函数的幅度和相位。这种标志法的另外吸引力是,它是最容易从一种模拟电路的分析中推导的形式,因此,作为指定这种电路的传递函数的最自然,最紧凑和被充分接受的方法。
还有另一种用于说明本发明的方便表示法是Z平面表示法。在本发明的最佳实施例中,为了取得灵活性的优点,信号处理器将起数字滤波器的作用。因为可以用一种传递函数定义每个声象位置,故需要一种形式的滤波器,在滤波器中,用最小的限制可以容易并迅速地实现传递功能,而在可达成该种功能时具有最小的限制。一种全可编程数字滤波器适合于满足这种需求。
这种数字滤波器可在频域内工作,在该情况下,首先要将信号作FOURIER变换,以便将它自时域表示转移到频域表示。然后,将上述方法之一所决定的滤波器幅度和相位响应通过复数乘法加到该信号频域表达式。最后,应用反FOURIER变换,把该信号恢复到时域,以供数字至模拟转换之用。
另一方面,可将在时域的响应直接规定为一种实时脉冲响应。这种响应数学上等效于频域的幅度及相位响应,并可应用反FOURIER变换而从其获得。通过用时域的信号表达式将其进行褶合,可将该脉冲响应直接应用在时域。可以证明,时域中的褶合运算与频域中的乘法运算数学上是等同的,因此,所述直接褶合完全等效于在前段中详述的频域运算。
由于全部数字计算都是断续的而不是连续的,所以最好用断续 表示而不用连续表示。根据系数直接规定响应是很方便的,将这些系数应用在一种递归直接褶合数字滤波器中,而采用与S平面符号平行的Z平面符号这是易于做到的。因此,若T(z)为等效于频域T(s)的S时域响应时,则:
T(z)= (N(z))/(D(z)) (8)
式中N(z)和D(z)的形式为:
N(z)=c0+c1z-1+c2z-2+…+cnz-n(9)
D(z)=d0+d1z-1+d2z-2+…dma-m(10)
在这种标志法中,系数c和d如系数a和b在s一平面中一样足以规定函数,因此,可能达到相等的紧密度。如将运算数z解释为如下时,则可直接执行z平面滤波器:
Z-1为n个抽样间隔的延迟。
于是,规定系数在执行过程中直接为倍增系数。我们必须限制本说明书只采用Z的负次幂,因为这些响应相当于正延迟。Z的正次幂则相当于负延迟,亦即,加上激励之前的响应。
根据手头这些标志法,我们便可以说明设备,给出宽频带响应声象和诸如演讲及音乐等声音的位置。为这些目的,本发明的声音处理器,例如,图8的处理器802,可将其实施为如图18A所示的,具有可变路径耦合衰减器的一种可变双路模拟滤波器。
图18A中,将单声道或单耳输入信号1601输入到两个滤波器1610、1630,同时也输入到两个电位器1651、1652。将来自滤波器1610、1630的输出连接到电位器1653、1654。将四个电位器1651-1654配置成一 种所谓的多向声象移动器使得它们差动作用。一个多向声象移动器轴控制电位器1651、1652;例如,当其一移动时,以越过其输入与输出之比的较大比例通到其输出,则使另一电位器机械地颠倒过来将其输入的较小比例通到其输出。电位器1653、1654根据第二个独立的多向声象移动器轴类似地操作。来自电位器1653、1654的输出信号分别通往单位增益缓冲器1655、1656,后者依次分别激励被耦合而一起作用的电位器1657、1658;它们同步增加或减少通往输出的输入比例。来自电位器1657、1658的输出信号通往一倒向开关1659,该开关容许将滤波器信号直接或互换馈给相加元件1660、1670的第一输入。
每个响应的相加元件1660、1670在其第二输入端接受来自电位器1651、1652的输出。相加元件1670激励反相器1690,而开关1691容许选择直接或反相信号以激励衰减器1689的输入1684。衰减器1689的输出就是所谓的右声道信号。同样,相加元件1660激励反相器1681,而开关1682容许在点1683处选择直接或反相信号。开关1685容许选择信号1683或输入信号1601作为给衰减器1686的激励以产生左声道输出1688。
滤波器1610、1630是相同的,并在图18B中详细示出一个。单位增益缓冲器1611接受输入信号1601并经由电容器1612作电容性耦合以激励滤波器元件1613。将类似的滤波器1614至1618进行级联,并经由电容器1619和单位增益缓冲器1620耦合最后的滤波器元件1618,以激励反 相器1621。开关1622容许在滤波器输出1623处选择缓冲器1620或反相器1621的输出。
滤波器元件1613直至1618是相同的,并在图18C中详细示出。它们只在其各自的电容器1631的数值上有所不同。将输入1632连接到电容器1631和电阻器1633,而将电阻器1633耦合到运算放大器1634的反相输入端,输出端1636就是滤波器元件输出端。反馈电阻器1635以习惯方式连接到运算放大器1634。从电容器1631和开关1643所选择的电阻器1637至1642中之一的接点,激励运算放大器1634的非反相输入端。这种滤波器是具有相移的全通滤波器,所述相移根据开关1643的设定的频率而变化。
表1列出用在每一滤波器元件1613-1618中电容器1631的数值,而表2列出开关1642所选择的电阻器数值;这些电阻器数值对全部滤波器元件1613-1618都是相同的。
图18D中示出相加元件1660、1670的一个实施例,其中,供运算放大器1663中相加用的两个输入1661、1662产生单一输出1664。由电阻器1665、1667和反馈电阻器1666决定从输入至输出的增益。在两种情况下,分别由来自开关1659的信号激励输入1662,由来自多向声象移动器电位器1651、1652的信号激励输入1661。
作为声象位置实例,表3示出各项设定和相应的声象位置,以使声象“飞行”。这是相应于远高出包括扬声器和收听者所在平面的位置处一架直升机的声象。为要获得按照本发明用于处理的所需要的单声道信号,曾将音效盘上的立体声径迹相加起来。在列表所 示配置设备的情况下,在空间以这种方式,即收听者感觉到在表列位置处有一架直升机,投影出逼真的声象。
表1
滤波器号码    1    2    3    4    5    6
电容器1631的数值    100    47    33    15    10    4.7
(毫微法拉)
表2
开关1642    1    2    3    4    5
的位置号码
电阻器号码    1637    1638    1639    1640    1641
电阻器数值    4700    1000    470    390    120
(欧姆)
表3
滤波器1630元件1开关位置    5    5
滤波器1630元件2开关位置    5    5
滤波器1630元件3开关位置    5    5
滤波器1630元件4开关位置    5    5
滤波器1630元件5开关位置    5    5
滤波器1630倒相开关1622    正常    正常
电位器1652之比值    0.046    0.054
电位器1654之比值    0.90    0.76
电位器1658之比值    0.77    0.77
倒相开关1691位置    反相    反相
选择器开关1685位置    1601    1601
输出衰减器1686之比值    0.23    0.23
输出衰减器1687之比值    1.0    1.0
声象方位角a(度数)    -45    -30
声象仰角b(度数)    +21    +17
声象距离r    遥远    遥远
表3注:两种情况中倒向开关的设定如下:即来自元件1657的信号激励元件1660,而来自元件1658的信号激励元件1670。
通过对上述电路增加两个额外元件,就会提供收听区域横向移位的特别方便。然而,应当理解,这对于声象之产生并非必不可少的。图19中示出所述额外元件,其中,可分别由图16的信号处理器的输出1688、1689供给左方和右方信号1701、1702。在每一声道中,分别插入延迟1703、1704,而来自延迟1703、1704的输出信号就成为声音处理器的输出1705、1706。
由这种外加设备引进各声道的延迟与频率无关。因此,单个实数完全可确定它们各自的特征。设定左声道延迟为t(l),右声道延迟为t(r)。如在上述情况下,只有延迟间的差值是有意义的,而我们可完全通过规定延迟间的差值而控制该设备。在执行过程中,我们将对每一声道加一固定延迟,以确保为达到所需差值至少不会要求负延迟。把差值延迟t(d)定义为:
t(d)=t(r)-t(l)    (11)
若t(d)为零,所产生的效应根本不受外加设备的影响。若t(d)为正,将使收听区域的中心沿图3的尺寸e横移向右方。t(d)为正值相当(e)为正值,意味着向右位移。同样,向左位移相当(e)为负值,可借助于t(d)为负值来获得。用这种方法,在听众感觉到幻觉的整个收听区域内,可以横向投影到扬声器之间或之外的任何点上。空间尺寸(e)可容易地超过空间尺寸S的一半,并曾在超出极端位移之外即空间尺寸(e)为空间尺寸(s)的83%时获得过良好的效果。这不可能是该项技术的极限,但代表了当前实验的极限。

Claims (9)

1、用于产生并定位视在声源的方法,该声源由电信号所选择,该电信号相当于包含收听者的三维空间内任何地方,经预定和局部化位置中所选定的声音,其特征在于:该方法包括以下各步骤:
将所述电信号分成相应第一和第二声道信号;
对于跨越声音频谱的相继的断续的频带,改变所述第一和第二声道信号的幅度及移动其相位,并且每一相继的相对于0°的相移是与前一相移不同的,而且二者均是以一个预定的相关频率为基准按照一个凭经验得到的传递函数进行的,因而产生一个第一声道和第二声道修正的信号,并形成两声道修正信号之间的差值相位和幅度;
随着改变幅度和移动相位的步骤,使所述第一声道修正信号与第二声道修正信号保持分离;以及
将所述第一和第二声道修正信号分别加到位于三维空间内并与收听者空间隔开的第一和第二声音变换器装置上,以产生显然起源于三维空间中某一预定位置处的声音,该位置可以与所述声音变换器装置的位置不同。
2、根据权利要求1的方法,其特征在于进一步包括以下步骤:将所述第一和第二声道信号加到各自的全通滤波器上,每个所述滤波器都具有预定的频率响应和拓扑,其特征为具有对LAPLACE复频变数(s)凭经验得出的传递函数T(s)。
3、根据权利要求2的方法,其特征在于,所述将信号加到各自的全通滤波器上的步骤还包括将所述信号中的每一个加到一串联成列的滤波器上的步骤。
4、根据权利要求1的方法,其特征在于进一步包括以下步骤:将所述第一和第二声道信号以及自其中取得的修正信号储存在一种能够按以后选定时间再生所述存储信号的介质中。
5、根据权利要求1的方法,其特征在于,所述改变幅度和移动相位的步骤包括:分别使所述第一和第二声道信号通过第一和第二声音处理器,这两个声音处理器具有各自的预定的凭经验得出的相位传递函数,以产生所述差值相移,因而其相位以一个穿越声音频谱的相关频率为基准被移动,其中每一相移均与前一相移不同,并且还具有凭经验得出的预定的幅度传递函数,以产生所述差值幅度的改变。
6、根据权利要求5的方法,其特征在于:根据穿越声音频谱的频率为40Hz间隔的一个相关频率编制预定的相位和幅度传递函数。
7、一种应用两个设置于自由空间中的变换器,使信号达到所要求状态的系统,该信号用于产生并定位视在声源的听觉幻觉,该视在声源从相应于所选声音的一种电信号产生和定位,为设置在包括收听者的三维空间内预定的局部化位置处的至少一种选定声音,其特征在于该系统包括:两者都接受所述电信号的第一和第二声道装置,该第一和第二声道装置均包括各自的第一和第二声音处理器装置,其中每一个都在跨越声音频谱的相继的断续的频带间隔中以相关频率为基准按照凭经验得到的传递函数来改变相应电信号的幅度和移动其相位角,以便自其中产生相应的修正信号,其中,就声音频谱中每一频率间隔而言,在两个声道之间发生的幅度改变的差值和相位角移动的差值为各自的预定值,而所述声音处理器装置使相位角这样移动,即使得每一个相继的相位角相对于0°的移动不同于前一个相位角的移动,并且与其无关;以及所述第一和第二声道在馈给两个变换器之前保持分离。
8、根扰权利要求7的系统,其特征在于进一步包括连接到所述声音处理器装置的存储装置,用于把所述修正信号储存在一种介质中,该介质能够按以后选定的时间再生所述的存储信号。
9、根据权利要求8的系统,其特征在于:所述第一和第二声音处理器装置工作所依据的相关频率的基准是由跨越声音频谱的40Hz的各个间隔组成的。
CN 89109165 1989-08-28 1989-12-05 声音成象的方法和装置 Expired CN1018790B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US39898889A 1989-08-28 1989-08-28
US298,988 1989-08-28

Publications (2)

Publication Number Publication Date
CN1050119A CN1050119A (zh) 1991-03-20
CN1018790B true CN1018790B (zh) 1992-10-21

Family

ID=23577651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 89109165 Expired CN1018790B (zh) 1989-08-28 1989-12-05 声音成象的方法和装置

Country Status (1)

Country Link
CN (1) CN1018790B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1732713B (zh) * 2002-12-30 2012-05-30 皇家飞利浦电子股份有限公司 音频再现装置、反馈系统和方法
JP5866883B2 (ja) * 2011-08-31 2016-02-24 ヤマハ株式会社 スピーカ装置

Also Published As

Publication number Publication date
CN1050119A (zh) 1991-03-20

Similar Documents

Publication Publication Date Title
CN1275498C (zh) 声道转换方法
KR930002147B1 (ko) 음상 묘사 방법 및 장치
Spors et al. Spatial sound with loudspeakers and its perception: A review of the current state
US5208860A (en) Sound imaging method and apparatus
US5105462A (en) Sound imaging method and apparatus
US7680288B2 (en) Apparatus and method for generating, storing, or editing an audio representation of an audio scene
Farina et al. Ambiophonic principles for the recording and reproduction of surround sound for music
US9716948B2 (en) Audio mixing method and system
CN107835483A (zh) 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
JP6246922B2 (ja) 音響信号処理方法
WO2007119058A1 (en) Processing audio input signals
US20050157894A1 (en) Sound feature positioner
CA3008214A1 (en) Synthesis of signals for immersive audio playback
KR20050018806A (ko) 음향 장 재생용 유닛의 제어 방법 및 장치
US20190394596A1 (en) Transaural synthesis method for sound spatialization
CN1091889A (zh) 用于声象增强的立体声控制装置和方法
Silzle et al. IKA-SIM: A system to generate auditory virtual environments
US4672569A (en) Method and apparatus for simulating outer ear free field transfer function
CN1018790B (zh) 声音成象的方法和装置
Gierlich et al. Processing artificial-head recordings
Brereton et al. A loudspeaker-based room acoustics simulation for real-time musical performance
Ellis-Geiger Music production for Dolby atmos and auro 3D
JPH06133399A (ja) 音像定位制御装置
JP2006515126A (ja) マルチスピーカ・サウンド・イメージング・システム
Ackermann et al. Recordings of a loudspeaker orchestra with multichannel microphone arrays for the evaluation of spatial audio methods

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C13 Decision
GR02 Examined patent application
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CX01 Expiry of patent term

Granted publication date: 19930721