CN1953620B - 一种5.1通路虚拟环绕声信号处理方法 - Google Patents

一种5.1通路虚拟环绕声信号处理方法 Download PDF

Info

Publication number
CN1953620B
CN1953620B CN200610037495.0A CN200610037495A CN1953620B CN 1953620 B CN1953620 B CN 1953620B CN 200610037495 A CN200610037495 A CN 200610037495A CN 1953620 B CN1953620 B CN 1953620B
Authority
CN
China
Prior art keywords
signal
sigma
beta
alpha
transfer function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200610037495.0A
Other languages
English (en)
Other versions
CN1953620A (zh
Inventor
谢菠荪
张林山
管善群
张承云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Beijing University of Posts and Telecommunications
Original Assignee
South China University of Technology SCUT
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT, Beijing University of Posts and Telecommunications filed Critical South China University of Technology SCUT
Priority to CN200610037495.0A priority Critical patent/CN1953620B/zh
Publication of CN1953620A publication Critical patent/CN1953620A/zh
Application granted granted Critical
Publication of CN1953620B publication Critical patent/CN1953620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

本发明公开了一种5.1通路虚拟环绕声信号处理方法。该方法包括以下步骤:首先输入原始的5.1通路环绕声时域信号l0、r0、c0、ls0、rs0、lfe0;然后对左、右信号l0、r0和左、右环绕信号ls0、rs0分别进行和差运算,并对它们进行虚拟处理,得到信号m11、s11、m22和s22;再对信号作进一步的混合相加处理、和差运算,并乘以标度因子0.707,得到所需信号l’和r’,将它们馈给左右扬声器重发,产生虚拟环绕声的效果。本发明将虚拟环绕声信号处理的脉冲响应长度减少到128点或64点(48kHz采样频率),使信号处理得到简化,可直接采用时域FIR滤波器实现实时处理。

Description

一种5.1通路虚拟环绕声信号处理方法
技术领域
本发明涉及电声技术领域,具体是涉及一种简化的两扬声器虚拟5.1通路环绕声的信号处理方法。
背景技术
5.1通路系统已被推荐为环绕声的国际标准,并已被广泛应用于家用声重发。它采用前方左L0、中C0、右R0以及左环绕LS0、右环绕RS0共五个独立的全频带通路及扬声器,再加上一路可选择的低频效果通路LFE0,从而重发出环绕倾听者的声音听觉效果。按国际电信联盟(ITU)推荐的标准,各扬声器的方位角分别为(水平面内坐标选取为-180°<θ≤180°,θ=0°为正前方,θ=90°为正左方):θL=30°θR=-30°θC=0°θLS=110°θRS=-110°,在实际应用中,可以将两个环绕扬声器前移到两侧,即取θLs=90°,θRs=-90°。但是5.1通路系统需要多个独立的扬声器,较为复杂,对于电视及多媒体计算机等应用,以及室内条件的限制,有时并不一定适合布置环绕声的多个扬声器。
近年,国外也提出了5.1通路环绕声的两扬声器虚拟重发系统,其基本原理是:将(来自DVD等的)5.1通路信号经过头相关传输函数(HRTF)进行信号处理和混合后,变成两通路信号,再利用一对布置在前方±30°的真实左、右扬声器进行重发,从而得到类似于多通路环绕声的效果,达到简化多通路环绕声的目的。这类系统的专利技术和产品(如SRS、Qsurround,Dolby等),普遍存在一定的缺陷,特别是听音区域较窄、重放音色改变等。
作为改进,在国家发明专利(ZL02134415.9)提出了两扬声器虚拟5.1通路环绕声的信号处理方法。在所提出的方法中,一对真实的重发扬声器布置在前方±15°,张角为30°,较传统的60°张角为窄,这一方面可提高声像的稳定性,扩大听音区域,另一方面,在电视机和多媒体计算机等的实际应用中,张角本来就达不到60°的标准,因而非常有现实意义的,同时还引入了音色均衡信号处理,可以减少重发中的音色改变,使效果得到改善。但是,由于扬声器虚拟声信号处理所包含的递归型滤波器结构,使得滤波器的有效脉冲响应长度至少在5到10ms的量级,在48kHz(或44.1kHz)的采样频率下,大约相当于256到1024点,这样的脉冲响应长度使直接采用时域FIR滤波器实时处理较为困难。在实际中通常是采用频域快速傅立叶变换(FFT)实现虚拟处理,以提高处理效率,但这会引起输出延时;也可以采用IIR滤波器实现虚拟处理,但这容易出现稳定性问题,且所需的硬件结构比较复杂。由于5.1通路环绕声的虚拟发需要同时对多路信号进行实时的虚拟处理,滤波器简化问题就变得尤为突出。
发明内容
本发明的目的在于克服了现有技术的不足,提供了一种新型的两扬声器虚拟5.1通路环绕声的简化信号处理方法。该方法可采用时域FIR滤波器实时实现,其信号处理效率高,所需硬件结构也比较简单。
本发明目的通过如下技术方案实现。一种5.1通路虚拟环绕声信号处理方法,它包括如下步骤和处理条件:
第一步输入原始的5.1通路环绕声时域信号l0、r0、c0、ls0、rs0、lfe0
第二步将左、右信号l0、r0进行和差运算,得到信号m1=l0+r0和s1=l0-r0,分别对信号m1和s1进行虚拟处理,得到信号m11和s11
第三步将左、右环绕信号ls0、rs0进行和差运算,得到信号m2=ls0+rs0和s2=ls0-rs0,分别对信号m2和s2进行虚拟处理,得到信号m22和s22
第四步将信号m11、m22、c0、lfe0混合相加,得到信号m=m11+m22+c0+lfe0;将信号s11和s22混合相加,得到信号s=s11+s22
第五步将信号m和s进行和差运算,并乘以标度因子0.707,得到信号l’=0.707·(m+s)和r’=0.707·(m-s),将它们馈给布置在前方±15°的全频带扬声器重发。
所述第二步分别对信号m1和s1进行虚拟处理就是分别将信号m1和s1经由水平面30°头相关传输函数得到脉冲响应为σ1和δ1的128点或64点时域FIR滤波器进行滤波,得到信号m11和s11
所述第三步分别对信号m2和s2进行虚拟处理就是分别将信号m2和s2经由水平面90°头相关传输函数得到脉冲响应为σ2和δ2的128点或64点时域FIR滤波器进行滤波,得到信号m22和s22
本发明的原理是:在两扬声器虚拟5.1通路环绕声的信号处理中,采用无耳壳、封闭耳道的头相关传输函数,并引入功率均衡的信号处理,不但可以减少声重发的音色改变,还可抵消信号处理函数的极点和零点,从而减少脉冲响应的长度,使信号处理得到简化,在48kHz(或44.1kHz)的采样频率下,直接采用64点或128点的时域FIR滤波器即可实现实时处理。
相对于现有技术,本发明的有益效果是:
1.本发明对来自DVD等的5.1通路环绕声的5+1个独立原始(也可以是Dolby Surround的四路)信号进行处理后,用前方一对真实的全频带左、右扬声器进行重发,可产生整个前半平面的环绕声效果;
2.本发明在虚拟环绕声信号处理中采用无耳壳、封闭耳道的头相关传输函数,并抵消了信号处理函数的接近Z平面单位园的极点和零点,从而将脉冲响应长度减少到128点或64点(48kHz采样频率),可直接采用时域FIR滤波器实现实时处理,不必进行多次的快速傅立叶变换(或逆傅立叶变换),信号处理的方法简单;
3.本发明特别适用于通用DSP硬件电路或专用的集成电路实现,也可采用算法语言(如VC++)编制的软件在多媒体计算机上实现;
4.本发明可作为专用硬件电路而用在DVD、电视(包括DTV)、家庭影院等方面的声音重发,也可作为硬件或软件用在多媒体计算机的声音重发。
附图说明
图1是本发明的原理方框图;
图2是扬声器虚拟声源的原理图;
图3是1024点信号处理的脉冲响应σ1(n)示意图;
图4是脉冲响应σ1(n)的幅频特性示意图;
图5是信号处理的时域FIR滤波器实现方法原理框图;
图6是信号处理软件的流程框图。
具体实施方式
下面结合附图和实施例对本发明做进一步的说明,但本发明要求保护的范围并不局限于实施例表示的范围。
图1是本发明原理方框图,如图1所示,先输入原始的5.1通路环绕声时域信号l0、r0、c0、ls0、rs0、lfe0。随后,将5.1通路环绕声原始的时域信号l0和r0进行和差运算后,分别得到信号m1=l0+r0和s1=l0-r0,分别对信号m1和s1进行虚拟处理,得到信号m11和s11;这里的虚拟处理是指信号m1和s1分别经由水平面30°头相关传输函数得到脉冲响应为σ1和δ1的128点或64点时域FIR滤波器进行滤波;
将5.1通路环绕声原始的时域信号ls0和rs0进行和差运算后,分别得到信号m2=ls0+rs0和s2=ls0-rs0,分别对信号m2和s2进行虚拟处理,得到信号m22和s22;对信号m2和s2进行虚拟处理就是分别将信号m2和s2经由水平面90°头相关传输函数得到脉冲响应为σ2和δ2的128点或64点时域FIR滤波器进行滤波;
将5.1通路环绕声原始的时域信号c0、lfe0和m11、m22信号混合,得到信号m=m11+m22+c0+lfe0;将信号s11和s22混合相加,得到信号s=s11+s22
将信号m和s进行和差运算,并乘以标度因子0.707,得到信号l’=0.707·(m+s)和r’=0.707·(m-s),将它们馈给布置在前方±15°的全频带扬声器重发。
本发明是根据封闭耳道法在无耳廓的工头测量得到HRTF,从而得到四个虚拟声信号处理脉冲响应σ1、δ1、σ2和δ2。在不影响主观听觉效果的前提下,采用矩形时间窗对上述四个脉冲响应进行截取,使其有效长度减少到128点或64点(在48kHz或44.1kHz的采样频率下),从而可直接采用时域FIR滤波器实时处理,不必用FFT变换到频域处理,使硬件结构得到简化。
为一般化,与原始的5.1通路环绕声时域信号l0、r0、c0、ls0、rs0、lfe0对应的频域信号分别表示为L、R、C、LS、RS、LFE,信号处理如下:
L′=A′(θL,ω)L+A′(θR,ω)R+0.707C+A′(θLS,ω)LS+A′(θRS,ω)RS+0.707LFE
R′=B′(θL,ω)L+B′(θR,ω)R+0.707C+B′(θLS,ω)LS+B′(θRS,ω)RS+0.707LFE    (1)
经处理的信号再馈给一对布置在±15°的左、右扬声器重发,即可得到虚拟环绕声的效果。其中,虚拟声信号处理函数由下式给出:
A ' ( θ , ω ) = α H L - β H R | α H L - β H R | 2 + | - β H L + α H R | 2 | α 2 - β 2 | α 2 - β 2
B ' ( θ , ω ) = - β H L + α H R | α H L - β H L | 2 + | - β H L + α H R | 2 | α 2 - β 2 | α 2 - β 2
                                                        (2)
如图2所示,HL、HR为方向θ的声源到左和右耳的频域传输函数(HRTF),HLL、HLR、HRL和HRR为布置在±15°的左、右扬声器到双耳的四个频域传输函数,对左右对称的情况,设HLL=HRR=α,HLR=HRL=β,θ L=30°和θR=-30°为原始的5.1通路环绕声的左右扬声器方位角,而取虚拟环绕扬声器的方位角θLS=90°,θRS=-90°。可以看出,(2)式的信号处理函数可实现零极点抵消,因而其脉冲响应长度可以减少,从而为简化信号处理提供了基础。
由左、右对称性,我们有A’(θL,ω)=B’(θR,ω),A’(θR,ω)=B’(θL,ω),A’(θLS,ω)=B’(θRS,ω),A’(θRS,ω)=B’(θLS,ω),(1)信号处理是和下式等价:
L ' R ' = 0.707 1 1 1 - 1 { 1 0 ( C 0 + LFE 0 ) + Σ 1 0 0 Δ 1 1 1 1 - 1 L 0 R 0 + Σ 2 0 0 Δ 2 1 1 1 - 1 LS 0 RS 0 } - - - ( 3 )
其中四个虚拟声信号处理函数为:
1=0.707[A′(θL,ω)+A′(θR,ω)] Δ1=0.707[A′(θL,ω)-A′(θR,ω)]
2=0.707[A′(θLS,ω)+A′(θRS,ω)] Δ2=0.707[A′(θLS,ω)-A′(θRS,ω)]
                                                           (4)
采用傅立叶变换,能够证明(3)式的频域信号处理是和(5)式的时域信号处理等价的:
l ' r ' = 0.707 1 1 1 - 1 { 1 0 ( c 0 + lf e 0 ) + σ 1 0 0 δ 1 * 1 - 1 1 - 1 l 0 r 0 + σ 2 0 0 δ 2 * 1 1 1 - 1 ls 0 rs 0 } - - - ( 5 )
其中,“*”表示时域卷积。
采用无耳廓、封闭耳道的HRTF可有效地减少信号处理函数的谷点。原始的HRIR(HRTF的时域形式)数据的采样频率是44.1kHz,16bit量化,长度512点。为了适应DVD等实际应用,用插值的方法将原始的HRIR的采样频率变为48kHz,并采用时域补零的方法,按(4)式计算得到四个滤波器的频域1024点传输函数∑1,Δ1,∑2,Δ2。进行逆傅立叶变换后,得到采样频率48kHz,长度1024点(约21.3 ms)的四个滤波器的原始脉冲响应,分别记为σ1(n),δ1(n),σ2(n),δ2(n),n=0,1......1023,并以此作为参考滤波器设计。
为了简化滤波器的设计,采用矩形时间窗对四个脉冲响应σ1(n)、δ1(n)、σ2(n)和δ2(n)进行截取。以σ1(n)为例,计算得到的1024点脉冲响应如图3所示。可以看出,脉冲响应的主体部份长度大约只有几十个采样,起始部分和后面部分的幅度都很小。这是由于(2)至(4)式的信号处理抵消了滤波器的极点,从而减少了滤波器的脉冲响应的长度。设截取的时间窗为:
W ( n ) = 1 N 1 ≤ n ≤ N 2 0 other - - - ( 6 )
截取带来的相对(能量)误差是:
Err = 10log 10 Σ n = 0 N 1 - 1 σ 1 2 ( n ) + Σ N 2 + 1 1023 σ 1 2 ( n ) Σ n = 0 1023 σ 1 2 ( n ) ( dB ) - - - ( 7 )
采用两个不同宽度(128点和64点)的时间窗截取,并选取N1和N2,使(7)式的误差最小,可以得到:
(1)128点矩形时间窗(N1=501,N2=628);
(2)64点矩形时间窗(N1=527,N2=590);
对其它三个脉冲响应δ1(n),σ2(n),δ2(n)也作类似的截取,并按(7)式计算得到的相对误差如表1所示。可以看出,128点截取带来的相对误差在-18.3dB以下,64点截取带来的相对误差在-13.9dB以下。
        表1  脉冲响应截取带来的误差
 Err(dB)  δ1(n)  δ1(n)  σ2(n)  δ2(n)
 128point  -18.3  -21.5  -18.3  -19.1
 64point  -14.8  -19.5  -13.9  -15.7
用时间窗对脉冲响应进行截取降低了频率分辩率。图4给出了参考1024点和经过截取的128点、64点σ1(n)的幅频特性(对不足1024点的情况,在采用FFT计算幅频特性前,已对它们补零成为1024点),对脉冲响应进行截取同时起到频域的平滑作用。由于听觉系统对高频的分辨能力本来就不高,而1024点σ1(n)的幅频特性在低频本来就比较平缓,因而平滑处理对听觉效果影响不大,对其它三个滤波器也有类似结果。
当滤波器的脉冲响应长度简化到128点甚至64点后,就不必用FFT变换到频域处理,完全可以直接采用时域FIR滤波器实时实现,给信号处理带来方便。以信号处理函数σ1(n)为例,采用FIR滤波器实现的方块图如图5所示。对信号处理函数δ1(n),σ2(n),δ2(n)也可用类似的方法实现。对于脉冲响应长度为N点的FIR滤波器,对每个输入采样共需要进行N次信号的乘法和N-1加法运算。而实现图1的完整的虚拟声处理每个输入共需要4N+2次信号乘法,4(N-1)+10次加(减)法运算,当采样频率为48kHz而N=128或64时,每秒分别需要24576002(或12288002)次信号乘法,24864000(或12576000)次信号加(减)法,这样的运算量在通常的音频信号处理(DSP)芯片就可以实现。
本发明可以利用通用的信号处理芯片所做成的硬件电路实现,也可以设计成专用的集成电路芯片实现,还可以设计成软件在多媒体计算机上实现。本发明可用于DVD、电视、家庭影院、多媒体计算机等方面。
实施例一  DVD与电视的应用
将DVD解码输出或从数字电视广播得到的5.1通路环绕声(数字)信号按图1的方法进行虚拟处理后,得到两路信号l’和r’,然后分别馈给一对前方±15°的全频带扬声器,重发出环绕声的效果。其中,虚拟信号处理可作为DVD机内的一部分硬件电路,也可作为电视机的一部分硬件电路。
实施例二  家庭影院的应用
将DVD解码输出的5.1通路环绕声(数字)信号馈给家庭影院的放大器,图1的虚拟信号处理是作为放大器内的一部分功能电路。得到两路信号l’和r’,然后分别馈给外接的全频带左、右扬声器进行重发。
实施例三  多媒体计算机的应用
由计算机的DVD-ROM读取,并经解码得到5.1通路环绕声(数字)信号,然后用计算机软件实行图1的虚拟信号处理(也可以在计算机的声卡上用专用的硬件电路实现),得到两路信号l’和r’,由声卡输出到外接的全频带左、右扬声器进行重发。
本发明具体介绍用软件在多媒体计算机上的实现:首先用上面所述的方法得到采样频率48kHz,长度1024点(约21.3ms)的四个滤波器的脉冲响应σ1(n),δ1(n),σ2(n),δ2(n),n=0,1…1023,并以此作为参考滤波器设计。采用矩形时间窗将四个脉冲响应截取成128点或64点后,就可以用简单的FIR滤波器实现。
如图6所示,事实上信号处理过程就是(从DVD-ROM或硬盘)读入原始的5.1通路环绕声信号,在对它进行虚拟处理后,馈给扬声器重发。假定5.1通路环绕声的原始信号是时域的数字信号:
第一步:在DVD-ROM中读入原始的5.1通路时域信号,记为l0、r0、c0、ls0、rs0、lfe0
第二步:将原始的左、右信号l0、r0进行加减(和差)运算,得到信号m1=l0+r0和s1=l0-r0
第三步:将原始的左、右环绕信号ls0、rs0进行加减(和差)运算,得到信号m2=ls0+rs0和s2=ls0-rs0
第四步:将信号m1经过脉冲响应为σ1的128点或64点时域FIR滤波器进行滤波,得到信号m11
第五步将s1信号经过脉冲响应为δ1的128点或64点时域FIR滤波器进行滤波,得到信号s11
第六步:将信号m2经过脉冲响应为σ2的128点或64点时域FIR滤波器进行滤波,得到信号m22
第七步:将s2信号经过脉冲响应为δ2的128点或64点时域FIR滤波器进行滤波,得到信号s22
第八步将信号m11、m22、c0、lfe0混合相加,得到信号m=m11+m22+c0+lfe0;信号s11和s22混合相加,得到信号s=s11+s22
第九步:将信号m和s进行加减(和差)运算并乘以标度因子0.707,得到信号l’=0.707(m+s)和r’=0.707(m-s),并经D/A变换为模拟信号,将它们馈给左右全频带扬声器。
如上所述,即可较好地实现本发明。
评价5.1通路环绕声虚拟重放的关键是虚拟扬声器的效果,也就是各虚拟扬声器的感知方向和音质。因而可依次在(5)式的信号处理中只保留l0、r0、ls0、rs0其中之一个原始的输入信号,而令其它的输入信号为零,从而分别评价各虚拟扬声器的感知方向和音质。由于原始c0信号是通过衰减-3dB后同时馈给左右扬声器重放的,其原理是和传统的立体声混合(down mixing)一样的,结果是公知的,不需要重新对其效果进行验证。而根据左、右对称性假设,可只对r0和rs0通路及相应的虚拟扬声器进行评价。
实验是在一间混响时间0.15s的听音室进行。一对Genelic 1032A有源监听扬声器系统布置在半径为2.0m的圆周上,±15°的方位角。倾听者位于园心,双耳高度与扬声器齐平。将单路的声频信号作为原始r0或rs0输入信号,在计算机用软件按(5)式处理后得到l’和r’信号,经声卡(Echo Layla 24)和前置放大后再馈给扬声器系统。
原始的实验信号共九种,包括中心频率为125Hz、250Hz、500Hz、1kHz、2kHz、4kHz、8kHz的1/3倍频程信号,语言信号(普通话男声),音乐信号(管弦乐:约翰.斯特劳施、蓝色的多瑙河片段)。
为了评价简化滤波器的效果,采用三段信号强制选择(3AFC)的主观评价实验方法,也就是对特定的虚拟扬声器(如θR=-30°)和特定的信号类型,采用长度1024点的脉冲响应进行虚拟处理,并以此作为参考处理。而采用截取简化的64点脉冲响应(并用时域FIR滤波器实现)作为比较处理。每段实验信号包括三部分,第一部分为参考处理信号,第二部份和第三部分别是参考和比较处理信号,次序有两种,即“参考-参考-比较”或“参考-比较-参考”。
实验时,首先只重放参考处理信号,倾听者判断虚拟扬声器(声像)的方向。然后连续重放整段三部份信号,倾听者在第二和第三部分中,根据与第一部分的参考信号在听觉上的区别(包括声像方向与音色等),选择出比较处理信号的次序。如果不能分别出,就按随机的方法选择。对两种次序的信号,以随机的方法每个次序重放两次,每个倾听者有四次判断。共八个倾听者参加实验,因而对特定的虚拟扬声器和特定的信号共有32次判断。
对R和RS虚拟扬声器,所有九种信号都完成主观评价实验后,对所得的结果进行统计分析。包括计算虚拟扬声器的平均方向及标准差,以及3AFC实验中选择比较信号的正确率,统计结果如表2所示。其中对于2kHz,4kHz及8kHz的信号,虚拟扬声器的方向随倾听者的头部位置变化较大,表中没有给出对这三种信号的虚拟扬声器方向的统计结果。这是由于高频的声波的波长较短,头部位置的微少改变可导致双耳声压(特别是相位)的明显改变,这也是扬声器虚拟声重放的普遍缺陷。由表2可以看出:
                 表2  三段信号强制选择的主观评价实验的统计结果
(1)对于理想方向为θR=-30°的右虚拟扬声器,给出的六种信号的平均感知方向都在-30°附近,与理想方向差别很少。且除了125Hz的信号外,标准差也不大。125Hz信号标准差的增加可能是由于对听觉系统对低频信号的方向定位能力相对差些所致。
(2)对于理想方向为θR=-90°的右环绕虚拟扬声器,给出的六种信号的平均感知方向与理想方向有一定的差别。特别是对于语言和音乐信号,平均感知方向大约在-70°左右,较理想方向有一定的前移,且标准差也较大。这一方面是由于语言和音乐信号含有一定的2kHz以上的频谱成份,高频虚拟扬声器的方向随倾听者的头部位置变化较大。另一方面是由于信号处理中采用的是非个性化(KEMAR人工头)的HRTF,实际倾听者的头部尺寸与KEMAR的尺寸有差别时,会引起侧向虚拟扬声器的方向畸变。若采用个性化的HRTF进行信号处理效果应该会得到改善。
(3)采用数理统计的U检验表明,在0.05的水平下,当3AFC实验中选择比较处理信号的正确率大于0.65时,比较处理信号与参考处理信号有显著差别。对θR=-30°的右虚拟扬声器,有八种信号的正确率都在0.65以下。而对于1kHz信号,正确率为0.66。但通过仔细询问每个倾听者,结果表明他们实际上并不能从听觉中选择比较处理信号,只是按随机的方式选择答案。因而0.66的正确率可能只是统计涨落的结果。
(4)但是对θR=-90°的虚拟扬声器,250Hz,500Hz和语言信号,3AFC实验中选择正确率都在0.65以上。特别是语言信号,正确率达0.91。事实上,语言信号有相当的能量是分布在250Hz到500Hz的频带范围,因而在250Hz和500Hz的频带范围内,比较处理的主观效果是和参考处理有区别的。通过仔细询问每个倾听者,普遍反映比较处理的虚拟扬声器方向较参考处理略为前移,大约在5°的量级。
从上面的结果可以看出,当虚拟扬声器处理的脉冲响应长度减少到64点时,主要对θR=-90°的虚拟扬声器,250Hz,500Hz和语言信号的主观听觉效果有影响。为了比较,我们补充对θR=-90°的虚拟扬声器,250Hz、500Hz和语言信号的3AFC实验内容,只是将比较处理的FIR滤波器的脉冲响应长度改为128点,其它条件同前。统计结果表明,三种信号的选择正确率分别是0.59、0.50和0.59,都少于0.65。
由此可见,当采用脉冲响应长度128点的FIR滤波器进行虚拟处理时,其主观听觉效果是和采用长度为1024点的脉冲响应的参考虚拟处理一致的,听觉上不能察觉出它们之间的差别。当采用长度64点的截取脉冲响应进行虚拟处理时,对θR=-90°虚拟扬声器,部分(主要是250Hz,500Hz)信号的主观听觉效果和参考处理有一定的区别,主要是虚拟扬声器方向略为前移,当然这实际中仍然可用。
本发明的研究得到《国家自然科学基金,编号:10374031》和《广州市科技计划项目,编号:2005Z3-D0071》的资助。

Claims (1)

1.一种5.1通路虚拟环绕声信号处理方法,其特征在于,它包括如下步骤和处理条件:
第一步输入原始的5.1通路环绕声时域信号l0、r0、c0、ls0、rs0、lfe0
第二步将左、右信号l0、r0进行和差运算,得到信号m1=l0+r0和s1=l0-r0,分别将信号m1和s1经由水平面30°无耳廓、封闭耳道的头相关传输函数和零极点抵消算法得到的脉冲响应为σ1和δ1的简化128点或64点时域FIR滤波器进行滤波,得到信号m11和S11
其中计算σ1和δ1和简化为128点或64点滤波器的方法如下:
用插值的方法将原始HRIR的时域形式的采样频率变为48kHz,并采用时域补零的方法,按(4)式计算得到两个滤波器的频域1024点传输函数∑1,Δ1,进行逆傅立叶变换后,得到采样频率48kHz,长度1024点的两个滤波器的原始脉冲响应,分别记为σ1(n),δ1(n),n=0,1......1023;
两个滤波器的传输函数为:
1=0.707[A′(θL,ω)+A′(θR,ω)]Δ1=0.707[A′(θL,ω)-A′(θR,ω)]    (4)
其中A’(θL,ω)和A’(θR,ω)是在如下公式中分别取θ=θL=30°,θ=θR=-30°得到:
A ′ ( θ , ω ) = αH L - βH R | αH L - βH R | 2 + | - β H L + αH R | 2 | α 2 - β 2 | α 2 - β 2
HL=HL(θ,ω)和HR=HR(θ,ω)为方向θ的声源到左和右耳的频域头相关传输函数,α=HLL=HRR、β=HLR=HRL为布置在±15°的左、右扬声器到双耳的频域头相关传输函数;
然后选择上述脉冲响应数据的主要部分,按下式确定N1、N2值,使得Err值最小,其中N2至N1点数宽度为128或64;
Err = 10 log 10 Σ n = 0 N 1 - 1 σ 1 2 ( n ) + Σ N 2 + 1 1023 σ 1 2 ( n ) Σ n = 0 1023 σ 1 2 ( n ) ( dB )
从而得到矩形时间窗:
W ( n ) = 1 N 1 ≤ n ≤ N 2 0 other
用W(n)乘以σ1或δ1,即得到128或64点的FIR滤波器;
第三步将左、右环绕信号1s0、rs0进行和差运算,得到信号m2=ls0+rs0和s2=ls0-rs0,分别将信号m2和s2经由水平面90°无耳廓、封闭耳道的头相关传输函数和零极点抵消算法得到的脉冲响应为σ2和δ2的简化128点或64点时域FIR滤波器进行滤波,得到信号m22和S22
计算σ2和δ2并简化为128点或64点滤波器的方法与上述σ1或δ1的方法一致,它们对应的频域函数为:
2=0.707[A′(θLS,ω)+A′(θRS,ω)]Δ2=0.707[A′(θLS,ω)-A′(θRS,ω)]
其中A’(θLS,ω)和A’(θRS,ω)是在下面公式中分别取θ=θLS=90°,θ=θR=-90°得到:
A ′ ( θ , ω ) = αH L - βH R | αH L - βH R | 2 + | - β H L + αH R | 2 | α 2 - β 2 | α 2 - β 2
HL=HL(θ,ω)和HR=HR(θ,ω)为方向θ的声源到左和右耳的频域传输函数,α=HLL=HRR、β=HLR=HRL为布置在±15°的左、右扬声器到双耳的频域传输函数;
然后选择上述脉冲响应σ2和δ2数据的主要部分,按下式确定N1、N2值,使得Err值最小,其中N2至N1点数宽度为128或64;
Err = 10 log 10 Σ n = 0 N 1 - 1 σ 1 2 ( n ) + Σ N 2 + 1 1023 σ 1 2 ( n ) Σ n = 0 1023 σ 1 2 ( n ) ( dB )
从而得到矩形时间窗:
W ( n ) = 1 N 1 ≤ n ≤ N 2 0 other
用W(n)乘以σ2或δ2,即得到128或64点的FIR滤波器;
第四步将信号m11、m22、c0、lfe0混合相加,得到信号m=m11+m22+c0+lfe0;将信号s11和s22混合相加,得到信号s=s11+s22
第五步将信号m和s进行和差运算,并乘以标度因子0.707,得到信号l'=0.707·(m+s)和r’=0.707·(m-s),将它们馈给布置在前方±15°的全频带扬声器重发。
CN200610037495.0A 2006-09-05 2006-09-05 一种5.1通路虚拟环绕声信号处理方法 Active CN1953620B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200610037495.0A CN1953620B (zh) 2006-09-05 2006-09-05 一种5.1通路虚拟环绕声信号处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610037495.0A CN1953620B (zh) 2006-09-05 2006-09-05 一种5.1通路虚拟环绕声信号处理方法

Publications (2)

Publication Number Publication Date
CN1953620A CN1953620A (zh) 2007-04-25
CN1953620B true CN1953620B (zh) 2014-04-02

Family

ID=38059664

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610037495.0A Active CN1953620B (zh) 2006-09-05 2006-09-05 一种5.1通路虚拟环绕声信号处理方法

Country Status (1)

Country Link
CN (1) CN1953620B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103237287B (zh) * 2013-03-29 2015-03-11 华南理工大学 具定制功能的5.1通路环绕声耳机重放信号处理方法
CN105981412B (zh) * 2014-03-21 2019-05-24 华为技术有限公司 一种估计总体混合时间的装置和方法
CN105792090B (zh) * 2016-04-27 2018-06-26 华为技术有限公司 一种增加混响的方法与装置
GB201609089D0 (en) * 2016-05-24 2016-07-06 Smyth Stephen M F Improving the sound quality of virtualisation
CN109379694B (zh) 2018-11-01 2020-08-18 华南理工大学 一种多通路三维空间环绕声的虚拟重放方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XIE Bosun et al.Virtual reproducing system for 5.1 channel surround sound.《Chinese Journal of Acoustics》.2005,第24卷(第1期),76-88. *
何璞等.虚拟声音色均衡信号处理方法的主客观分析.《应用声学》.2006,第25卷(第1期),4-12. *
何璞等.采用无耳壳头相关传输函数的虚拟声信号处理.《2005年声频工程学术交流会论文集》.2005,76-80. *

Also Published As

Publication number Publication date
CN1953620A (zh) 2007-04-25

Similar Documents

Publication Publication Date Title
KR100608025B1 (ko) 2채널 헤드폰용 입체 음향 생성 방법 및 장치
US6449368B1 (en) Multidirectional audio decoding
US8194898B2 (en) Sound reproducing system and sound reproducing method
US7567845B1 (en) Ambience generation for stereo signals
JP5964311B2 (ja) ステレオイメージ拡張システム
KR100677629B1 (ko) 다채널 음향 신호에 대한 2채널 입체 음향 생성 방법 및장치
US7613305B2 (en) Method for treating an electric sound signal
CN101112120A (zh) 处理多声道音频输入信号以从其中产生至少两个声道输出信号的装置和方法、以及包括执行该方法的可执行代码的计算机可读介质
US20100303245A1 (en) Diffusing acoustical crosstalk
WO2010076850A1 (ja) 音場制御装置及び音場制御方法
JP2002159100A (ja) 2チャネル・ステレオ・フォーマットの左及び右のチャネル入力信号を左及び右のチャネル出力信号に変換する方法及び信号処理装置
EP3895451A1 (en) Method and apparatus for processing a stereo signal
US20120155650A1 (en) Speaker array for virtual surround rendering
CN1953620B (zh) 一种5.1通路虚拟环绕声信号处理方法
CN111556425A (zh) 一种扬声器虚拟声重放的音色均衡方法
US10440495B2 (en) Virtual localization of sound
US20180192185A1 (en) Method and System for implementing Stereo Dimensional Array signal processing in a Compact Single Enclosure Active Loudspeaker Product
CN105357624A (zh) 扬声器重放的双声道信号处理方法、装置及系统
CN109379694B (zh) 一种多通路三维空间环绕声的虚拟重放方法
KR100849030B1 (ko) 복수 채널 스피커 환경에서 가상 스피커 기술을 사용한입체음향 재생 장치
JP2002291100A (ja) オーディオ信号再生方法、及びパッケージメディア
KR100802339B1 (ko) 스테레오 스피커 환경에서 가상 스피커 기술을 사용한입체음향 재생 장치 및 방법
JP2005341208A (ja) 音像定位装置
KR20050060552A (ko) 입체 음향 시스템 및 입체 음향 구현 방법
Tsujita et al. Influence of listener's head in stereo reproduction using parametric loudspeakers

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant