立体声之人声消除方法及相关装置
技术领域
发明提供一种在人声消除时增加立体声感的方法及相关装置,特别是指一种分别对不同声道信号各自进行人声消除以增加立体声感的方法及相关装置。
背景技术
随着信息、电子技术的进步与普及,在现代社会中,娱乐的形态也越趋多样化。举例来说,有卡拉OK之称的伴唱系统,就能够播放歌曲的背景配乐,让使用者不需乐团的伴奏,就能随背景配乐歌唱,享受专业级的娱乐环境。不过,一般来说,娱乐业者推出的歌曲中都包含有配唱的人声(vocal);因此,为了适应伴唱系统的需要,现代的信息业者也发展出了人声消除的技术,设法将歌曲中的配唱人声减抑消除,留下背景配乐,供伴唱系统使用。
请参考图1。图1为一播放器10以公知技术进行人声消除时相关功能方块配置的示意图。一般来说,现代的播放系统都能播放两声道(或更多声道)的立体人声效果,以播放器中不同的扬声器模块来分别播放不同声道的信号,让使用者能听到更具临场感的音乐播放效果。而播放器10中即设有一个能提供两声道信号(像是左右声道)的音源电路12、一个用来进行人声消除的信号模块14、以及两个用来播放立体人声效果的扬声器模块16A、16B。音源电路12可以是一光盘读取机构,能利用读取头18存取一光盘片20上的歌曲数据,并加以解析(例如适当地解调、解码)。对应于立体人声效果的展现,现代的娱乐业者在提供娱乐资源媒体(例如是储存有歌曲的光盘片媒体)时,也都会在其中记录有不同声道的信号。而音源电路12在存取光盘片20的数据后,即可解读出两立体声之声道信号PLi、PRi。信号模块14即用来对声道信号PLi、PRi进行人声消除,以分别产生出输出信号PLo、PRo。扬声器模块16A、16B可分别设有各自的数字/模拟转换器、功率放大器、扬声器等电路,以分别将输出信号PLo、PRo转换为声波播放出来。
为了进行人声消除,公知的信号模块14中设有两高通模块26A、26B、一低通模块28及一人声消除模块22。高通模块26A、26B分别用来对声道信号PLi、PRi进行高通滤波,以产生对应的高通信号PLh、PRh;低通模块28用来对一信号Ps进行低通滤波,产生对应的低通信号Pl。而人声消除模块22则是将两声道信号PLi、PRi相减以产生一人声消除后的中介信号PVC。将对应于声道信号PLi的高通信号PLh、低通信号Pl以及中介信号PVC混音相加后,就能产生输出信号PLo;将对应于声道信号的高通信号PRh、低通信号Pl及中介信号PVC相加混音后,即为输出信号PRo。
为了说明上述公知技术人声消除的原理,请先参考图2(并一并参考图1)。图2为立体人声效果中各声道信号及相关信号典型频谱(spectrum)的示意图。图2中各信号频谱的横轴为频率,纵轴则为频谱的大小(像是绝对值的大小)。
一般来说,如熟习技术人士所知,在娱乐业者所提供的歌曲中,是在不同的声道信号中混入不同的背景配乐信号来营造立体人声效果;而配唱之人声信号则当作是主要的信号,通常会以均等的强度混入在各声道的信号中。这样一来,当使用者以播放器的相异扬声器模块来播放不同声道的信号时,就能感觉到配唱的人声彷佛在面前(因其在两声道中成份相等),而不同声道的不同背景配乐则会让使用者感受到立体音效果,彷佛背景音乐的音源是环绕在使用者四周。在图2中,频谱Vf即代表配唱之人声信号的频谱,相异之频谱Lmf、Rmf则分别代表不同背景配乐信号的频谱。如上所述,将背景配乐的频谱Lmf与人声频谱Vf相加,就组成为立体声中一个声道信号之频谱Lf;而将背景配乐之频谱Rmf与人声频谱Vf相加,则成为立体声中另一声道信号之频谱Rf。像是在图1中由音源电路12取得的声道信号PLi、PRi,其信号之频谱就可以像是频谱Lf、Rf所示。由于人发声机制的生理限制,使人声不能太低频或超过一定的高频,故人声信号之频谱通常也限定于一定的频带范围中。而图2中标出的频率fl、fh,就分别代表了人声信号的频率下限及上限;而人声信号之频谱Vf即集中于频率fl至fh间的中频频带BM中。相对于局限于中频频带BM的人声频谱Vf,背景配乐中由各种乐器加总起来的频谱就能延伸至较广的频率范围;就如图2中所示,即使在低于频率fl的低频频带BL及高于频率fh的高频频带BH中,都会有背景配乐的频谱Lmf、Rmf分布。连带地,除了人声信号频谱所在的中频频带BM,各声道信号的频谱Lf、Rf也都会延伸到低频频带BL及高频频带BH。
由于人声信号在各声道信号中的成份相等,公知的信号模块14(请见图1)即是在人声消除模块22中将两声道信号PLi、PRi相减,以减去两声道中共有的人声信号,产生人声消除后的中介信号PVC。不过,在将声道信号PLi、PRi相减的过程中,声道信号PLi、PRi中位于低频频带BL及高频频带BH的信号成份也会被相减;而人声消除的原意当然还是要保留背景配乐延伸于低频频带BL及高频频带BH的成份。故信号模块14中还要以高通模块26A、26B以及低通模块28来进行高频补偿及低频补偿。其中,高通模块26A可将声道信号PLi中属于高频频带BH的成份取出,成为高通信号PLh。而低通模块28的信号来源Ps可以是声道信号PLi、PRi其中之一,低通模块28将信号Ps位于低频频带BL的成份取出成为低通信号Pl,就相当于将声道信号的低频成份取出于低通信号Pl。在将高通信号PLh、低通信号Pl与中介信号PVC混音相加后,就能补偿中介信号PVC在人声消除过程中损失的高频及低频成份,成为输出信号PLo。
同理,高通模块26B在将声道信号PRi的高频成份取出为高通信号PRh后,信号模块14就能以高通信号PRh、低通信号Pl来对中介信号PVC进行高频、低频的补偿,产生输出信号PRo。一般来说,各声道信号中属于低频频带BL的成份比较不具有指向性,两声道信号PRi、PLi在低频成份的差异比较难以营造出立体音效果,故信号模块14都是以相同的低频信号Pl来对输出信号PLo、PRo进行低频补偿。相对地,在声道信号PRi、PLi中属于高频频带BH的成份就会比较富有指向性,两声道信号在高频频带的差异能够让使用者较为显着地体会到立体声的效果,故信号模块14是分别以两声道信号PRi、PLi高通滤波后之高通信号PRh、PLh做高通补偿,以利用输出信号PRo、PLo在高频成份的差异展现立体人声效果。总结来说,公知信号模块14在接收两声道的声道信号PLi、PRi后,再统一以人声消除模块22产生的中介信号PVC作为两声道人声消除的基本结果,再以低通信号Pl及高通信号PLh及PRh作为低频及高频补偿,分别产生出两声道的输出信号PLo、PRo,当作声道信号PLi、PRi人声消除后的结果。习知信号模块14即以此种方式减抑两声道的声道信号PLi、PRi中人声的部份,并试图在两声道的输出信号PLo、PRo中保留背景配乐的立体人声效果。
请参考图3。图3是图1中信号模块14在运作时相关信号频谱的示意图。延续图2中的频谱示意例,若图1中声道信号PLi、PRi的频谱分别是图2中的频谱Lf、Rf,则在信号模块14运作后,输出信号PLo、PRo的频谱就分别如图3中的频谱PLof、PRof所示;图3各频谱的横轴亦为频率,纵轴为频谱大小(如绝对值的大小)。而图3中标出的频率fl、fh及低频频带BL、中频频带BM与高频频带BH,其意义就如图2及相关说明中相同。为了比较两频谱PLof与PRof的差异,图3中也将频谱PRof以虚线方式与实线的频谱PLof绘示于同一坐标系下。
由于图1中公知的信号模块14所产生的输出信号PLo及PRo都包含有相同的中介信号PVC、低通信号Pl,差异仅在于此两输出信号是以不同的高通信号PLh、PRh做高频补偿,故由图3中可比较出,输出信号PLo、PRo的频谱PLof、PRof,两者主要的差异集中于高频频带BH;至于两频谱PLof、PRof于中频频带BM、低频频带BL的成份,则几乎是完全相同的。虽然信号中高频的成份较具有立体音效中的指向性,但由于频谱PLof、PRof的信号能量大部分还是集中于中频、低频频带BM及BL,分布于高频频带BH的信号能量较少,故频谱PLof、PRof的整体差异其实不大。当播放器10将输出信号PLo、PRo播放出来时,由于两者间的差异不大,故其所能展现出来的立体音效也就大打折扣。而这也就是公知技术的缺点之一。换句话说,在图1的公知信号模块14中,由于两声道的输出信号PLo、PRo皆以同一中介信号PVC作为人声消除后的基本信号,仅使用了相异的高通信号PLh、PRh做高频补偿,故此两声道之输出信号PLo、PRo的差异仅集中于高频、能量较少的部份,无法从原来的声道信号PLi、PRi中撷取出足够的差异来产生较为明显的立体人声效果;这也使得两声道信号PLi、PRi在进行人声消除后,其所能展现出来的立体人声效果大打折扣,无法让使用者享受到具有环场音效的伴唱配乐。
发明内容
因此,本发明之目的,即在于提出一种较佳的人声消除方法及相关装置,使得不同声道的声道信号在经过人声消除后,还能维持相当程度的信号差异,产生较佳的立体人声效果,克服公知技术的缺点。
在公知技术中,是以两声道的声道信号产生出一个中介信号作为人声消除的主要信号;以此中介信号为主,在进行低频及相异的高频补偿后即产生两声道之输出信号。由于此两声道之输出信号皆基于相同的中介信号,两者间的差异仅局限于高频成份,故此两声道的输出信号无法展现出较佳的立体人声效。
在本发明中,则是以两声道信号之平均产生出一个单声道信号,再以各声道信号与此单声道信号间的差异作为各声道信号在人声消除后对应的中介信号;在对各声道信号对应的中介信号做低频及对应的高频补偿后,产生各声道信号对应的输出信号。在上述方法中,由于各声道信号对应的中介信号是由各声道的信号与该单声道信号间的差异所产生,故各声道输出信号对应之中介信号也各不相同。这样一来,即使在人声消除后,各声道信号在低频、中频频带的差异还是会有相当程度的保留,也使得各声道的输出信号得以展现出较佳的立体人声效果,让使用者得以享受具有显著环场音效的伴唱配乐。
附图说明
图1为一个公知播放器进行人声消除相关功能方块之示意图。
图2为立体声各声道信号及相关信号典型频谱之示意图。
图3为图1中播放器进行人声消除后相关输出信号之频谱示意图。
图4为本发明在一个播放器中实现人声消除之相关功能方块的示意图。
图5为图4中播放器进行人声消除后相关输出信号之频谱示意图。
图6为图4中信号模块之功能以一程序代码实现的示意图。
附图符号说明
10、30: 播放器;
12、32: 音源电路;
14、34: 信号模块;
16A-16B、36A-36B: 扬声器模块;
18、38: 读取头;
20、40: 光盘片;
22、42A-42B: 人声消除模块;
26A-26B、46A-46B: 高通模块;
28、48: 低通模块;
50: 单声道处理模块;
52A、52B: 混音单元;
100: 程序代码;
PRi、PLi、Ri、Li: 声道信号;
PVC、LVC、RVC: 中介信号;
PLh、PRh、Lh、Rh: 高通信号;
Pl、Sl: 低通信号;
PLo、Pro、Lo、Ro: 输出信号;
Ps、S: 信号;
M: 单声道信号;
Lmf、Rmf、Vf、Lf、Rf、PLof、Prof: 频谱;
BL、BM、BH: 频带;
fl、fh: 频率。
实施方式
请参考图4。图4为本发明之技术在一个播放器30中实现人声消除相关功能方块之示意图。播放器30中设有一个音源电路32、一个信号模块34以及用来播放立体人声效的扬声器模块36A、36B。音源电路32可以是一个光盘读取机构,以利用一读取头38从一光盘片40上读取歌曲的信号数据,并解析出立体人声效果中的各个声道信号Li、Ri。信号模块34则用来实现本发明人声消除的功能,以根据两声道信号Li、Ri产生人声消除后的两声道输出信号Lo、Ro。其中,信号模块34设有一个单声道处理模块50、一低通模块48;配合两声道的声道信号Li、Ri,信号模块34中也对应地设有两个人声消除模块42A、42B以及高通模块46A、46B。扬声器模块36A、36B中可分别设有数字/模拟转换器、功率放大器及扬声器等等,以分别将输出信号Lo、Ro转换为声波播放出来。
本发明以信号模块34进行人声消除的情形可描述如下。信号模块34中的单声道处理模块50可计算两声道信号Li、Ri的平均,产生一个单声道(monochannel)信号M;换句话说,即M=(Li+Ri)/2。而本发明即利用此单声道信号M,分别针对各个声道信号进行各自的人声消除。在对应于声道信号Li的人声消除模块42A中,声道信号Li会和单声道信号M相减,以声道信号Li及单声道信号M之间的差异形成中介信号LVC(即LVC=Li-M)。在对应于人声消除模块42B中,则是以声道信号Ri及单声道信号M间的差异形成中介信号RVC(即RVC=Ri-M)。
如图2及相关说明中讨论过的,在立体声的各声道信号中,人声配唱的部份通常是以相等的大小强度混音至各声道信号中,故本发明中以两声道信号Li、Ri之平均所产生出来的单声道信号M,应该也和各声道信号一样包括有相等的人声部份。而本发明即是利用与各声道信号对应的人声消除模块将各声道信号与此单声道信号间相减,以分别对各声道信号进行人声消除,减抑各声道信号中人声的部份。与公知技术不同的是,本发明是针对各声道信号各自进行人声消除,所以不同的声道信号在各自进行人声消除后所产生出来的对应中介信号,自然也会有所差异。就如图4中的实施例,声道信号Li在人声消除后产生的中介信号LVC等于(Li-M),另一声道信号Ri人声消除后的中介信号RVC等于(Ri-M),自然就和中介信号LVC不同。如前面讨论过的,立体人声效果是以各声道信号间的信号差异来展现的;而在本发明中,原先在两声道信号Li、Ri间形成立体人声效的信号差异,还是会保留于人声消除后的中介信号LVC与RVC中。而本发明主要即是利用中介信号LVC、RVC间的信号差异,于人声消除后展现更胜于公知技术、更丰富的立体人声效果。请注意,如图1中所示,在公知的人声消除技术中,即使是不同声道的声道信号,还是以同一人声消除模块进行人声消除,以同一个中介信号作为人声消除的基本结果。相较之下,本发明是分别针对不同声道的声道信号进行各自的人声消除,产生出不同的中介信号,更能保留原来在各声道信号中用来展现立体人声效的信号差异。
如图4所示,在根据各声道信号Li、Ri分别产生中介信号LVC、RVC后,信号模块34就可针对中介信号LVC、RVC进行高频及低频的补偿,产生输出信号Lo、Ro。其中,高通模块46A可将声道信号Li中属于高频频带的部份(主要是高于人声中频频带的部份,请参考图2及相关说明)取出,成为高通信号Lh;低通模块48则能将信号S中属于低频频带的部份取出成为低通信号Sl。此信号S可以是声道信号Li、Ri其中之一,或是单声道信号M。以混音单元52A将声道信号Li对应的高通信号Lh、中介信号LVC以及低通信号Sl混音相加,等效上就是对中介信号LVC进行高频及低频补偿,并产生出对应于声道信号Li的输出信号Lo(即Lo=LVC+Sl+Lh)。同理,高通模块46B能将声道信号Ri中属于高频频带的部份取出为高通信号Rh,来对中介信号RVC做高频补偿。以混音单元52B将声道信号Ri对应的中介信号RVC、高通信号Rh以及低通信号Sl相加,就能对中介信号RVC进行高频及低频补偿,形成输出信号Ro(即Ro=RVC+Sl+Rh)。
请继续参考图5(并一并参考图4)。图5即为图4中本发明信号模块34运作后产生出来的输出信号Lo、Ro之频谱示意图;图5之横轴为频率,纵轴为频谱大小。延续图2中的例子,假设图4中的声道信号Li、Ri其频谱分别如图2中的频谱Lf、Rf所示,则本发明输出信号Lo、Ro的频谱就分别如图5中的频谱Lof、Rof所示(为了比较方便,图5中亦以虚线将频谱Rof与实线的频谱Lof绘于同一坐标系中;图2中的频率fl、fh与频带BL、BM及BH亦一并标示于图5中)。由图5中可看出,由于本发明是针对不同的声道信号分别进行人声消除,故原本各声道信号间分布于低频频带BL、中频频带BM的信号差异,也会保留于输出信号Lo、Ro之间,使得本发明之输出信号Lo、Ro不仅在高频频带BH有所差异,也会在低频、中频频带有所差异。这样一来,当本发明之播放器30以扬声器模块36A、36B分别将各声道之输出信号Lo、Ro播放出来时,使用者就能听到比公知技术更丰富、更具立体人声效的配乐,享受更好的伴唱环境。
本发明于图4中信号模块34的各个功能方块,能分别以硬件电路或韧体、软件的形式来实现。举例来说,一般的播放器都设有可程序的信号处理电路,而本发明就可以用韧体的方式来实现,将实现本发明技术之程序代码储存于播放器的内存(例如是非易失性内存)中;当信号处理电路执行程序代码时,就能实现本发明人声消除的功能。另外,例如计算机中常会使用播放程序配合适当的外围装置(例如声卡、光驱)播放歌曲音乐,本发明也可以软件的方式实现于此类播放程序中,以消除人声,提供伴唱的背景配乐。请参考图6(并一并参考图4)。图6中的程序代码100即是用来实现本发明人声消除的功能;其中,数组型态的变量x_L、x_R即是用来代表不同声道的声道信号Li、Ri(如图4),数组变量Mono代表单声道信号M,子程序Hi_Pass用来实现高通滤波模块的功能,Low_Pass则用来实现低通模块的功能;数组变量h_L、h_R分别代表高通信号Lh、Rh,数组变量low代表低通信号Sl,而数组变量L_out、R_out也就分别代表了输出信号Lo及Ro。程序代码100中的整数指标j则用来代表一数组变量第j个元素之值,也就是该数组变量对应之信号于第j个时点的取样值。如程序代码100所示,变量Mono代表的单声道信号为各声道信号对应变量x_L、x_R之平均,变量x_L、x_R高通滤波的结果分别储存于变量h_L、h_R。以变量x_R代表的声道信号Ri作为图4中的信号S,而低通滤波所产生低通信号Sl,也就由变量low来代表。最后,中介信号LVC、PVC就分别由程序代码100中的运算x_L[j]-Mono[j]、x_R[j]-Mono[j]来实现,再加上低频补偿的变量low、高频补偿的变量h_L、h_R,就能产生本发明人声消除后的输出信号,分别储存于变量L_out、R_out中。
在公知的人声消除技术中,由于不同声道之输出信号都是以相同的中介信号作为人声消除的主要结果,除了高频补偿所引入的信号差异外,输出信号在低频、中频频带皆没有明显的信号差异,故习知技术所产生出来的各声道输出信号无法展现出较佳的立体人声效果。相较之下,本发明则是针对不同声道的信号各自进行对应的人声消除,故得以在各声道的输出信号中较为完整地保留原来各声道信号间的信号差异;当不同声道的输出信号由不同的扬声器模块播放出来后,就能展现胜于习知技术的立体人声效,让使用者得以在伴唱系统中享受到更好的立体声配乐。本发明之技术除了可以运用于图4中的光盘播放器之外,还可以应用于其它种类的播放器;举例来说,图4中的音源电路可以是一网络模块,能透过有线或无线网络取得歌曲数据信号,解析出各声道信号。
以上所述仅为本发明之较佳实施例,凡依本发明申请专利范围所做之均等变化与修饰,皆应属本发明专利之涵盖范围。