CN113473352A

CN113473352A - 双声道音频后处理的方法和装置

Info

Publication number: CN113473352A
Application number: CN202110761810.9A
Authority: CN
Inventors: 范欣悦; 初钧晗; 吴珈旻; 张晨; 郑羲光
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-07-06
Filing date: 2021-07-06
Publication date: 2021-10-01
Anticipated expiration: 2041-07-06
Also published as: CN113473352B

Abstract

公开了一种双声道音频后处理的方法和装置。所述双声道音频后处理的方法包括：将左声道分成左声道低频部分和左声道中高频部分，将右声道分成右声道低频部分和右声道中高频部分；分别对左声道中高频部分和右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分；以及将拓宽后的左声道中高频部分与所述左声道低频部分进行叠加，并且将拓宽后的右声道中高频部分与所述右声道低频部分进行叠加以得到拓宽后的双声道音频。

Description

双声道音频后处理的方法和装置

技术领域

本公开涉及音频技术领域，更具体地说，涉及一种双声道音频后处理的方法和装置。

背景技术

对与大多数流媒体平台，能直接获取到的只有双声道，因此如何利用双声道营造立体环绕声的感觉、扩展声场、提升听感、吸引用户注意力成为当前音频技术领域关注的问题。

现有技术中通常通过将声音从立体声转成中间两边(MS，Middle&side) 格式，即，将声音转换为中间的声音和两边的声音。可以通过调整中间信号 M和两边信号S的比例来控制立体声的宽度。

M＝(L+R)/2 (1)

S＝(L-R)/2 (2)

然而这种方法对于左右两声道相似的音频无法实现显著的声场拓宽。

发明内容

本公开的目的在于提供一种双声道音频后处理的方法和装置，以便通过对左右两声道进行不同的处理来达到声场明显展开的效果。

根据本公开的实施例的第一方面，提供一种双声道音频后处理的方法，所述方法包括：将左声道分成左声道低频部分和左声道中高频部分，将右声道分成右声道低频部分和右声道中高频部分；分别对左声道中高频部分和右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分；以及将拓宽后的左声道中高频部分与左声道低频部分进行叠加，将拓宽后的右声道中高频部分与右声道低频部分进行叠加以得到拓宽后的双声道音频。

可选地，所述分别对左声道中高频部分和右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分的步骤可以包括：对左声道中高频部分和右声道中高频部分应用不同的滤波频响曲线来进行均衡以使均衡后的左声道中高频部分和均衡后的右声道中高频部分之间的差异变大；以及对均衡后的左声道中高频部分和均衡后的右声道中高频部分进行增益补偿以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分，并使得拓宽后的左声道中高频部分的与左声道中高频部分的音量相同，拓宽后的右声道中高频部分的音量与右声道中高频部分的音量相同。

可选地，所述方法还可以包括：对拓宽后的双声道音频进行二次拓宽处理。

可选地，所述对拓宽后的双声道音频进行二次拓宽处理的步骤可以包括：对拓宽后的双声道音频的左声道和右声道分别进行短时傅里叶变换；基于短时傅里叶变换获得的频域计算与每帧的每个频率对应的幅值和相位；基于幅值计算方位角；对方位角进行调整以使调整后的方位角拓宽；基于调整后的方位角计算调整后的幅值；以及基于调整后的幅值和对应的相位进行短时傅里叶逆变换以获得二次拓宽的双声道音频。

可选地，所述将左声道分成左声道低频部分和左声道中高频部分，将右声道分成右声道低频部分和右声道中高频部分的步骤可以包括：将左声道通过交叉滤波器以获得左声道低频部分和左声道中高频部分，将右声道通过交叉滤波器以获得右声道低频部分和右声道中高频部分。

可选地，左声道低频部分和左声道中高频部分的分频点以及右声道低频部分和右声道中高频部分的分频点可以为200Hz。

可选地，所述滤波频响曲线可以使用梳状滤波器来生成。

可选地，所述对方位角进行调整以使调整后的方位角拓宽的步骤可以包括：将调整后的方位角置为原方位角的p倍，且在原方位角大于90/p度时将调整后的方位角置为90度，其中，p为大于1的实数。

可选地，所述对拓宽后的双声道音频进行二次拓宽处理的步骤还可以包括：对二次拓宽的双声道音频的低频部分进行增强。

根据本公开的实施例的第二方面，提供一种双声道音频后处理的装置，所述装置包括：分频单元，被配置为将左声道分成左声道低频部分和左声道中高频部分，将右声道分成右声道低频部分和右声道中高频部分；中高频声场拓宽单元，被配置为分别对所述左声道中高频部分和所述右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分；以及叠加单元，被配置为将拓宽后的左声道中高频部分与左声道低频部分进行叠加，并且将拓宽后的右声道中高频部分与右声道低频部分进行叠加以得到拓宽后的双声道音频。

可选地，中高频声场拓宽单元可以被配置为执行以下步骤：对左声道中高频部分和右声道中高频部分应用不同的滤波频响曲线来进行均衡以使均衡后的左声道中高频部分和均衡后的右声道中高频部分之间的差异变大；以及对均衡后的左声道中高频部分和均衡后的右声道中高频部分进行增益补偿以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分，并使得拓宽后的左声道中高频部分的音量与左声道中高频部分的音量相同，拓宽后的右声道中高频部分的音量与右声道中高频部分的音量相同。

可选地，所述装置还可以包括：二次拓宽单元，所述二次拓宽单元被配置为对拓宽后的双声道音频进行二次拓宽处理。

可选地，二次拓宽单元可以被配置为执行以下步骤：对拓宽后的双声道音频的左声道和右声道分别进行短时傅里叶变换；基于短时傅里叶变换获得的频域计算与每帧的每个频率对应的幅值和相位；基于幅值计算方位角；对方位角进行调整以使调整后的方位角拓宽；基于调整后的方位角计算调整后的幅值；以及基于调整后的幅值和对应的相位进行短时傅里叶逆变换以获得二次拓宽的双声道音频。

可选地，分频单元可以被配置为将左声道通过交叉滤波器以获得左声道低频部分和左声道中高频部分，将右声道通过交叉滤波器以获得右声道低频部分和右声道中高频部分。

可选地，中高频声场拓宽单元可以被配置为使用梳状滤波器生成滤波频响曲线。

可选地，二次拓宽单元可以被配置为将调整后的方位角置为原方位角的 p倍，且在原方位角大于90/p度时将调整后的方位角置为90度，其中，p为大于1的实数。

可选地，二次拓宽单元还可以被配置为对二次拓宽的双声道音频的低频部分进行增强。

根据本公开的实施例的第三方面，提供一种电子设备，其特征在于，所述电子设备包括：至少一个处理器；至少一个存储计算机可执行指令的存储器，其中，所述计算机可执行指令在被所述至少一个处理器运行时，促使所述至少一个处理器执行根据本公开的双声道音频后处理的方法。

根据本公开的实施例的第四方面，提供一种计算机可读存储介质，其特征在于，当存储在所述计算机可读存储介质中的指令被至少一个处理器运行时，促使所述至少一个处理器执行根据本公开的双声道音频后处理的方法。

根据本公开的实施例的第五方面，提供一种计算机程序产品，包括计算机指令，其特征在于，当所述计算机指令被至少一个处理器执行时实现根据本公开的双声道音频后处理的方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

采用交叉滤波器将双声道中的左右声道分离为低频和中高频，且仅对左右声道的中高频通过不同的滤波来达到声场拓宽的效果。因为低频一般都在正中间，所以尽可能不改变低频的声场。此外，在由短时傅里叶变换获得的频域对声场进行二次处理，计算方位角，改变声源定位，以此营造环绕声的效果。从而实现双声道音频的声场拓宽、模拟环绕声的效果、提升声音的现场感和听众的沉浸感，使得声场狭窄得以改善并实现音频美化。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是示出根据本公开的双声道音频后处理的方法和装置的应用场景图；

图2是示出根据一示例性实施例的双声道音频后处理的方法的流程图；

图3是示出根据一示例性实施例的交叉滤波器的示例；

图4是示出根据一示例性实施例的对中高频部分进行声场拓宽的流程图；

图5是示出根据一示例性实施例的对左声道中高频部分和右声道中高频部分应用的不同的滤波频响曲线的示例；

图6是示出根据一示例性实施例的梳状滤波器的电路图；

图7是示出根据一示例性实施例的梳状滤波器的频响示意图；

图8是示出根据一示例性实施例的对拓宽后的双声道音频进行二次拓宽处理的流程图；

图9是示出根据一示例性实施例的对双声道音频进行拓宽处理的整体流程的示例；

图10是示出根据一示例性实施例的双声道音频后处理的装置的框图；以及

图11是示出根据本公开的实施例的电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

针对前面背景技术中所提及的问题，例如，在对于左右两声道相似的音频是无法实现显著的声场拓宽下，本公开提供了一种双声道音频后处理的方法，更具体地，采用交叉滤波器将双声道中的左右声道分离为低频和中高频，且仅对左右声道的中高频通过不同的滤波来达到声场拓宽的效果。此外，在由短时傅里叶变换获得的频域对声场进行二次处理，计算方位角，改变声源定位，以此营造环绕声的效果。

图1是示出根据本公开的双声道音频后处理的方法和装置的应用场景图。

音频源端101可通过网络将其音频资源上传到服务器102。这里，音频源端101可以是音频资源的发布端或发送端，例如，个人博主、新闻网站、文献网站、UP主的用户终端等。服务器102可以是获取音频资源的接收方，例如，音频播客平台。用户终端(例如，手机103_1、笔计本电脑103_2、平板电脑103_3等)可通过应用客户端经由网络从服务器102获取到音频资源。由于客观条件限制，通常由音频源端101上传的音频资源存在着声场狭窄、音频受损等问题。并且服务器102也在将用户请求的音频资源随着相应音频一起发送到用户终端103_1、103_2或103_3时，用户通过用户终端103_1、 103_2或103_3的应用客户端来收听音频资源时也会遇到同样的声场狭窄、音频受损等问题。将根据本公开的双声道音频后处理的方法和装置应用于这个场景，例如，可以将本公开的双声道音频后处理的方法和装置应用于音频源端101、服务器102和用户终端中的至少一者中，从而使得即使音频源端101将存在着声场狭窄、音频受损等问题音频资源上传至服务器102的情况下，用户均可以获得经声场拓宽的效果和/或音频美化效果的音频资源。

图2是示出根据一示例性实施例的双声道音频后处理的方法的流程图。

参照图2，在步骤S100中，将左声道分成左声道低频部分和左声道中高频部分，将右声道分成右声道低频部分和右声道中高频部分。根据本公开的示例性实施例，考虑到在双声道音频的情况下，低频部分的方向性不强，例如，底鼓和bass以及人声通常都在声场正中间，因此不对低频部分进行声场拓宽的处理。在这种情况下，可以将双声道的原始音频分成方向性不强的低频部分和方向性相对较强的中高频部分。

根据本公开的示例性实施例，可以将左声道通过交叉滤波器以获得左声道低频部分和左声道中高频部分，可以将右声道通过交叉滤波器以获得右声道低频部分和右声道中高频部分。在示例实施例中，可以将左声道低频部分和左声道中高频部分的分频点以及右声道低频部分和右声道中高频部分的分频点可以被设定为200Hz。需要说明的是，为了表述方便，在说明书中采用交叉滤波器进行分频，并将分频点设定为200Hz。然而，分频的方法和分频点可以根据音频资源的需求进行设定。交叉滤波器的示例将参照图3进行进一步的描述。

在步骤S200中，分别对左声道中高频部分和右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分。将在下面参照图4和图5对步骤S200进行详细描述。

在步骤S300中，将拓宽后的中高频部分与对应的低频部分进行叠加以得到拓宽后的双声道音频。例如，可以将拓宽后的左声道中高频部分和左声道低频部分进行叠加以获得拓宽后的左声道音频；可以将拓宽后的右声道中高频部分和右声道低频部分进行叠加以获得拓宽后的右声道音频。

根据本公开提供的双声道音频后处理的方法，由于采用交叉滤波器将双声道中的左右声道分离为低频和中高频，且仅对左右声道的中高频应用不同的滤波频响曲线来达到声场拓宽的效果。因此，即使对于左右两声道相似的音频也能够达到显著的声场拓宽效果。

图3是示出根据一示例性实施例的交叉滤波器的示例。

根据本公开的示例性实施例，可以将原始信号(例如，左声道原始信号或右声道原始信号中的一者)通过交叉滤波器(Crossover Filter)，从而将音频信号分割成低频部分和中高频部分。交叉滤波器是多段滤波器，其整体幅值频率相应是平坦的。参照图3，低频部分由虚线示出，中高频部分由点划线示出。为了便于描述，图3中选择200Hz作为分频点(低频部分的曲线与中高频部分的曲线的交点)，通过该分频点将信号分成低频部分、中高频部分两个频带。低频部分不予进行声场拓宽处理，中高频部分将在参照图2中示出的步骤S200中的进行声场拓宽。

图4是示出根据一示例性实施例的对中高频部分进行声场拓宽的流程图。图5是示出根据一示例性实施例的对左声道中高频部分和右声道中高频部分应用的不同的滤波频响曲线的示例。图6是示出根据一示例性实施例的梳状滤波器的电路图。图7是示出根据一示例性实施例的梳状滤波器的频响示意图。

参照图2和图4，步骤S200可以包括步骤S210和步骤S220。

在步骤S210中，对左声道中高频部分和右声道中高频部分应用不同的滤波频响曲线来进行均衡以使均衡后的左声道中高频部分和均衡后的右声道中高频部分之间的差异变大。

根据本公开的示例性实施例，参照图5，对左声道中高频部分和右声道中高频部分应用不同的滤波频响曲线来进行均衡使得左右耳差别变大。例如，左声道对2000Hz附近的频率做衰减，而右声道对相同的频率进行增益，从而使得降低两耳接收的声波的相似度。相似度越低则人耳感受到的声场越宽。

根据本公开的示例性实施例，所述滤波频响曲线可以使用梳状滤波器来生成。

根据本公开的示例性实施例，参照图6，梳状滤波器是通过将信号的延迟版本添加到自身而实现的，通过相长和相消干扰而实现的滤波器。梳状滤波器的频率响应由一系列规则间隔的凹口组成，从而呈现出梳状的外观。

梳状滤波公式如下：

y[n]＝x[n]+αx[n-K] (3)，

其中x[n]为输入音频信号，K为延迟采样数，α是应用于延迟信号的比例因子。可以控制α大小还调整滤波幅度。

参照图7，可以考虑使用简单的梳状滤波器来对左声道和右声道进行处理。例如，针对左声道和右声道设计错开预定频率的梳状滤波器。为了示出方便，图7中示出了K为19，α为1的示例。例如，应用图7中示出的梳状滤波器的情况下，可以为左声道和右声道设计错开0.05弧度/样本均一化频率的梳状滤波器。

返回参照图4，在步骤S220中，对均衡后的左声道中高频部分和均衡后的右声道中高频部分进行增益补偿以获得所述拓宽后的左声道中高频部分和所述拓宽后的右声道中高频部分，并使得拓宽后的左声道中高频部分的音量与左声道中高频部分的音量相同，拓宽后的右声道中高频部分的音量与右声道中高频部分的音量相同。也就是说，拓宽后的左声道和拓宽后的右声道的音量保持原音量不变。

图8是示出根据一示例性实施例的对拓宽后的双声道音频进行二次拓宽处理的流程图。

参照图8，所述方法还包括步骤S400，在步骤S400中，对拓宽后的双声道音频进行二次拓宽处理。

在步骤S410中，对所述拓宽后的双声道音频的左声道和右声道分别进行短时傅里叶变换以将双声道音频转换至频域。

在步骤S420中，基于短时傅里叶变换获得的频域计算与每帧的每个频率对应的幅值和相位。

在步骤S430中，基于幅值计算方位角。

在步骤S440中，对方位角进行调整以使调整后的方位角拓宽。

在步骤S450中，基于调整后的方位角计算调整后的幅值。

在步骤S460中，基于调整后的幅值和对应的相位进行短时傅里叶逆变换以获得二次拓宽的双声道音频以达到环绕声的效果。

尽管未示出，对拓宽后的双声道音频进行二次拓宽处理的步骤还可以对二次拓宽的双声道音频的低频部分进行增强的步骤以增强鼓和bass和以及部分人声基频。例如，可以用均衡器(EQ)对整体的低频部分(例如，100Hz 附近)做一定的提升(例如，提升3dB)。

图9是示出根据一示例性实施例的对双声道音频进行拓宽处理的整体流程的示例。

参照图2和图9，在步骤S100中，输入信号为左声道的时域信号L(t)和右声道的时域信号R(t)。经过交叉滤波器进行分频从而得到左声道低频部分和左声道中高频部分，以及右声道低频部分和右声道中高频部分。例如，

L_low(t)，L_high(t)＝crossfilter(L(t)) (4)，

R_low(t)，R_high(t)＝crossfilter(R(t)) (5)，

其中，L_low(t)，L_high(t)分别表示左声道低频部分和左声道中高频部分， R_low(t)，R_high(t)分别表示右声道低频部分和右声道中高频部分。

在步骤S200中，对左右声道高频进行不同的均衡处理：

L_{high_eq}(t)＝EQ₁(L_high(t)) (6)，

R_{high_eq}(t)＝EQ₂(R_high(t)) (7)，

其中，L_{high_eq}(t)和R_{high_eq}(t)分别表示均衡后的左声道高频部分和均衡后的右声道的高频部分。尽管未示出，步骤S200还可以包括对均衡后的左声道高频部分和均衡后的右声道的高频部分进行增益补偿的步骤，以使得它们的音量保持不变。

在步骤S300中，将均衡后的左声道高频部分L_{high_eq}(t)与未处理的左声道低频L_low(t)叠加，并且将均衡后的右声道高频部分R_{high_eq}(t)与未处理的右声道低频R_low(t)叠加得到拓宽后的双声道音频(L₁(t)和R₁(t))：

L₁(t)＝L_{high_eq}(t)+L_low(t) (8)，

R₁(t)＝R_{high_eq}(t)+R_low(t) (9)。

在步骤S400中，对拓宽后的双声道音频(L₁(t)和R₁(t))进行二次拓宽处理。

参照图6和图9，在步骤S410中，对所述拓宽后的双声道音频的左声道和右声道分别进行短时傅里叶变换(STFT)：

L₁(n，k)＝STFT(L₁(t)) (10)，

R₁(n，k)＝STFT(R₁(t)) (11)，

其中，n表示第n帧信号，可以用n表示帧序列，0＜n≤N，(N为总帧数)；k为中心频率序列0＜k≤K；(K为总频点数)。经过短时傅里叶变换可以得到左声道的频域信号L₁(n，k)和右声道的频域信号R₁(n，k)。

在步骤S420中，基于短时傅里叶变换获得的频域计算与每帧的每个频率对应的幅值和相位：

L_Mag(n，k)＝abs(L₁(n，k)) (12)，

R_Mag(n，k)＝abs(R₁(n，k)) (13)，

L_Phase(n，k)＝angle(L₁(n，k)) (14)，

R_Phase(n，k)＝angle(R₁(n，k)) (15)，

其中，L_Mag(n，k)和R_Mag(n，k)分别表示左声道的幅值和右声道的幅值， L_Phase(n，k)和R_Phase(n，k)分别表示左声道的相位和右声道的相位。函数abs 表示计算幅值的函数，函数angle表示计算相位的函数。函数abs和函数angle 可以具有本领域技术人员通常使用的形式，在此不做具体限制。本公开的示例不限于具体的函数形式，只要能够获得左声道和右声道的幅值和相位即可。作为示例，函数angle可以具有arctan的形式。例如，

L_Phase(n，k)＝arctan(Imag(L₁(n，k))/Real(L₁(n，k))) (16)，

R_Phase(n，k)＝arctan(Imag(R₁(n，k))/Real(R₁(n，k))) (17)，

其中，Imag(L₁(n，k))和Imag(R₁(n，k))分别表示左声道和右声道的虚部， Real(L₁(n，k))和Real(R₁(n，k))分别表示左声道和右声道的实部。

在步骤S430中，基于幅值计算方位角。例如，

θ(n，k)＝Azimuth(L_Mag(n，k)，R_Mag(n，k)) (18)。

方位角函数Azimuth可以具有本领域技术人员通常使用的形式，在此不做具体限制。本公开的示例不限于具体的函数形式，只要能够获得方位角即可。作为示例，方位角函数Azimuth可以具有arctan的形式。例如，

其中，

可以为30度角。

在步骤S440中，对方位角进行调整以使调整后的方位角拓宽。例如，

θ_out(n，k)＝f(θ(n，k)) (20)。

根据本公开的示例性实施例，方位角调整函数f可以具有各种形式。在示例中，方位角调整函数f可以被配置为将调整后的方位角置为原方位角的p 倍，且在原方位角大于90/p度时将调整后的方位角置为90度，其中，p为大于1的实数。例如，p可以为1.5，当原方位角为30度时，调整后的方位角为45度。又例如，原方位角为61度(即，大于90/1.5)时，其与p的乘积将超过90度，则将调整后的方位角置为90度。

在步骤S450中，基于调整后的方位角计算调整后的幅值。例如，

L_{Mag_out}(n，k)，R_{Mag_out}(n，k)＝

IAzimuth(θ_out(n，k)，L_Mag(n，k)，R_Mag(n，k)) (21)，

其中，L_{Mag_out}(n，k)和R_{Mag_out}(n，k)分别表示调整后的左声道的幅值和调整后的右声道的幅值。

根据本公开的示例性实施例，方位角计算函数IAzimuth可以具有各种形式。在示例中，方位角计算函数IAzimuth可以被表示为

其中，

在步骤S460中，基于调整后的幅值和对应的相位进行短时傅里叶逆变换以获得二次拓宽的双声道音频。例如，

L_out(n，k)＝ISTFT(L_{Mag_out}(n，k)，L_Phase(n，k)) (24)，

R_out(n，k)＝ISTFT(R_{Mag_out}(n，k)，R_Phase(n，k)) (25)。

结合之前保存的左声道相位和右声道相位，进行ISTFT(短时傅立叶反变换)得到时域结果。

尽管未示出，对拓宽后的双声道音频进行二次拓宽处理的步骤还可以将模拟环绕声效果整体进行音量提升，低频增强，获得更震撼的效果。例如，可以用均衡器(EQ)对整体的低频部分(例如，100Hz附近)提升3dB。

根据本公开提供的双声道音频后处理的方法，由于采用交叉滤波器将双声道中的左右声道分离为低频和中高频，且仅对左右声道的中高频应用不同的滤波频响曲线来达到声场拓宽的效果。因此，即使对于左右两声道相似的音频也能够达到显著的声场拓宽效果。此外，在由短时傅里叶变换获得的频域对声场进行二次处理，计算方位角，改变声源定位，以此营造环绕声的效果。在这种情况下，可以在不影响原方位角的情况下进一步的拓宽声场，达到环绕声的效果。通过二次拓宽处理中对方位角和幅值的调整。

图10是示出根据一示例性实施例的双声道音频后处理的装置10的框图。

作为示例，可由图10所示的装置10来执行图2以及图4和图5所示的方法。

如图10所示，装置10可以是用来双声道音频后处理的装置。

所述装置10包括：分频单元110、中高频声场拓宽单元120、以及叠加单元130。

分频单元110被配置为将左声道和右声道分别分成低频部分和中高频部分，其中，所述中高频部分包括左声道中高频部分和右声道中高频部分。分频单元110可以被配置为用来执行参照图2中的步骤S100描述的方法。

中高频声场拓宽单元120被配置为分别对所述左声道中高频部分和所述右声道中高频部分进行声场拓宽以获得拓宽后的中高频部分。中高频声场拓宽单元120可以被配置为用来执行参照图2中的步骤S200和图4中的步骤 S210和S220描述的方法。

叠加单元130被配置为将拓宽后的中高频部分与对应的低频部分进行叠加以得到拓宽后的双声道音频。叠加单元130可以被配置为用来执行参照图 2中的步骤S300描述的方法。

根据本公开的示例性实施例，装置10还可以包括二次拓宽单元140。二次拓宽单元140被配置为对拓宽后的双声道音频进行二次拓宽处理。二次拓宽单元140可以被配置为用来执行参照图6中的步骤S400描述的方法。

关于上述实施例中的装置，其中各个模块/单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图11是示出根据本公开的实施例的电子设备的框图。

参照图11，电子设备400包括至少一个存储器401和至少一个处理器402，所述至少一个存储器401存储计算机可执行指令，当计算机可执行指令被至少一个处理器402执行时，促使至少一个处理器402执行根据本公开的实施例的双声道音频后处理的方法。

作为示例，电子设备400可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令的装置。这里，电子设备400并非必须是单个电子设备，还可以是任何能够单独或联合执行上述指令(或指令集) 的装置或电路的集合体。电子设备400还可以是集成控制系统或系统管理器的一部分，或者可被配置为与本地或远程(例如，经由无线传输)以接口互联的便携式电子设备。

在电子设备400中，处理器402可包括中央处理器(CPU)、图形处理器 (GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制，处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。

处理器402可运行存储在存储器401中的指令或代码，其中，存储器401 还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收，其中，网络接口装置可采用任何已知的传输协议。

存储器401可与处理器402集成为一体，例如，将RAM或闪存布置在集成电路微处理器等之内。此外，存储器401可包括独立的装置，诸如，外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器401 和处理器402可在操作上进行耦合，或者可例如通过I/O端口、网络连接等互相通信，使得处理器402能够读取存储在存储器中的文件。

此外，电子设备400还可包括视频显示器(诸如，液晶显示器)和用户交互接口(诸如，键盘、鼠标、触摸输入装置等)。电子设备400的所有组件可经由总线和/或网络而彼此连接。

根据本公开的实施例，还可提供一种计算机可读存储介质，其中，当存储在计算机可读存储介质中的指令被至少一个处理器运行时，促使至少一个处理器执行根据本公开的实施例的双声道音频后处理的方法。这里的计算机可读存储介质的示例包括：只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、 DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、 BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如，多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置，所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行，此外，在一个示例中，计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上，使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。

根据本公开的实施例，还可提供一种计算机程序产品，包括计算机指令，当所述计算机指令被至少一个处理器执行时实现根据本公开的实施例的双声道音频后处理的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种双声道音频后处理的方法，所述方法包括：

将左声道分成左声道低频部分和左声道中高频部分，将右声道分成右声道低频部分和右声道中高频部分；

分别对所述左声道中高频部分和所述右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分；以及

将所述拓宽后的左声道中高频部分与所述左声道低频部分进行叠加，并且将所述拓宽后的右声道中高频部分与所述右声道低频部分进行叠加以得到拓宽后的双声道音频。

2.根据权利要求1所述的方法，其中，所述分别对所述左声道中高频部分和所述右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分的步骤包括：

对所述左声道中高频部分和所述右声道中高频部分应用不同的滤波频响曲线来进行均衡以使均衡后的左声道中高频部分和均衡后的右声道中高频部分之间的差异变大；以及

对均衡后的左声道中高频部分和均衡后的右声道中高频部分进行增益补偿以获得所述拓宽后的左声道中高频部分和所述拓宽后的右声道中高频部分，并使得所述拓宽后的左声道中高频部分的音量与所述左声道中高频部分的音量相同，所述拓宽后的右声道中高频部分的音量与所述右声道中高频部分的音量相同。

3.根据权利要求1所述的方法，所述方法还包括：对拓宽后的双声道音频进行二次拓宽处理。

4.根据权利要求3所述的方法，其中，所述对拓宽后的双声道音频进行二次拓宽处理的步骤包括：

对所述拓宽后的双声道音频的左声道和右声道分别进行短时傅里叶变换；

基于短时傅里叶变换获得的频域计算与每帧的每个频率对应的幅值和相位；

基于所述幅值计算方位角；

对所述方位角进行调整以使调整后的方位角拓宽；

基于调整后的方位角计算调整后的幅值；以及

基于调整后的幅值和对应的相位进行短时傅里叶逆变换以获得二次拓宽的双声道音频。

5.根据权利要求1所述的方法，其中，所述将左声道分成左声道低频部分和左声道中高频部分，将右声道分成右声道低频部分和右声道中高频部分的步骤包括：将所述左声道通过交叉滤波器以获得所述左声道低频部分和所述左声道中高频部分，将所述右声道通过所述交叉滤波器以获得所述右声道低频部分和所述右声道中高频部分。

6.根据权利要求1所述的方法，其中，所述左声道低频部分和所述左声道中高频部分的分频点以及所述右声道低频部分和所述右声道中高频部分的分频点为200Hz。

7.一种双声道音频后处理的装置，所述装置包括：

分频单元，被配置为将左声道分成左声道低频部分和左声道中高频部分，将右声道分成右声道低频部分和右声道中高频部分；

中高频声场拓宽单元，被配置为分别对所述左声道中高频部分和所述右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分；以及

叠加单元，被配置为将所述拓宽后的左声道中高频部分与所述左声道低频部分进行叠加，并且将所述拓宽后的右声道中高频部分与所述右声道低频部分进行叠加以得到拓宽后的双声道音频。

8.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；

至少一个存储计算机可执行指令的存储器，

其中，所述计算机可执行指令在被所述至少一个处理器运行时，促使所述至少一个处理器执行如权利要求1-6中任意一项所述的双声道音频后处理的方法。

9.一种计算机可读存储介质，其特征在于，当存储在所述计算机可读存储介质中的指令被至少一个处理器运行时，促使所述至少一个处理器执行如权利要求1-6中任意一项所述的双声道音频后处理的方法。

10.一种计算机程序产品，包括计算机指令，其特征在于，当所述计算机指令被至少一个处理器执行时实现如权利要求1-6中任意一项所述的双声道音频后处理的方法。