CN113473352A - 双声道音频后处理的方法和装置 - Google Patents

双声道音频后处理的方法和装置 Download PDF

Info

Publication number
CN113473352A
CN113473352A CN202110761810.9A CN202110761810A CN113473352A CN 113473352 A CN113473352 A CN 113473352A CN 202110761810 A CN202110761810 A CN 202110761810A CN 113473352 A CN113473352 A CN 113473352A
Authority
CN
China
Prior art keywords
channel
high frequency
frequency part
widened
right channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110761810.9A
Other languages
English (en)
Other versions
CN113473352B (zh
Inventor
范欣悦
初钧晗
吴珈旻
张晨
郑羲光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110761810.9A priority Critical patent/CN113473352B/zh
Publication of CN113473352A publication Critical patent/CN113473352A/zh
Application granted granted Critical
Publication of CN113473352B publication Critical patent/CN113473352B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/141Discrete Fourier transforms
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/06Non-recursive filters
    • H03H17/0621Non-recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing
    • H03H17/0635Non-recursive filters with input-sampling frequency and output-delivery frequency which differ, e.g. extrapolation; Anti-aliasing characterized by the ratio between the input-sampling and output-delivery frequencies
    • H03H17/0671Cascaded integrator-comb [CIC] filters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control

Abstract

公开了一种双声道音频后处理的方法和装置。所述双声道音频后处理的方法包括:将左声道分成左声道低频部分和左声道中高频部分,将右声道分成右声道低频部分和右声道中高频部分;分别对左声道中高频部分和右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分;以及将拓宽后的左声道中高频部分与所述左声道低频部分进行叠加,并且将拓宽后的右声道中高频部分与所述右声道低频部分进行叠加以得到拓宽后的双声道音频。

Description

双声道音频后处理的方法和装置
技术领域
本公开涉及音频技术领域,更具体地说,涉及一种双声道音频后处理的 方法和装置。
背景技术
对与大多数流媒体平台,能直接获取到的只有双声道,因此如何利用双 声道营造立体环绕声的感觉、扩展声场、提升听感、吸引用户注意力成为当 前音频技术领域关注的问题。
现有技术中通常通过将声音从立体声转成中间两边(MS,Middle&side) 格式,即,将声音转换为中间的声音和两边的声音。可以通过调整中间信号 M和两边信号S的比例来控制立体声的宽度。
M=(L+R)/2 (1)
S=(L-R)/2 (2)
然而这种方法对于左右两声道相似的音频无法实现显著的声场拓宽。
发明内容
本公开的目的在于提供一种双声道音频后处理的方法和装置,以便通过 对左右两声道进行不同的处理来达到声场明显展开的效果。
根据本公开的实施例的第一方面,提供一种双声道音频后处理的方法, 所述方法包括:将左声道分成左声道低频部分和左声道中高频部分,将右声 道分成右声道低频部分和右声道中高频部分;分别对左声道中高频部分和右 声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的 右声道中高频部分;以及将拓宽后的左声道中高频部分与左声道低频部分进 行叠加,将拓宽后的右声道中高频部分与右声道低频部分进行叠加以得到拓 宽后的双声道音频。
可选地,所述分别对左声道中高频部分和右声道中高频部分进行声场拓 宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分的步骤可 以包括:对左声道中高频部分和右声道中高频部分应用不同的滤波频响曲线 来进行均衡以使均衡后的左声道中高频部分和均衡后的右声道中高频部分之 间的差异变大;以及对均衡后的左声道中高频部分和均衡后的右声道中高频 部分进行增益补偿以获得拓宽后的左声道中高频部分和拓宽后的右声道中高 频部分,并使得拓宽后的左声道中高频部分的与左声道中高频部分的音量相 同,拓宽后的右声道中高频部分的音量与右声道中高频部分的音量相同。
可选地,所述方法还可以包括:对拓宽后的双声道音频进行二次拓宽处 理。
可选地,所述对拓宽后的双声道音频进行二次拓宽处理的步骤可以包括: 对拓宽后的双声道音频的左声道和右声道分别进行短时傅里叶变换;基于短 时傅里叶变换获得的频域计算与每帧的每个频率对应的幅值和相位;基于幅 值计算方位角;对方位角进行调整以使调整后的方位角拓宽;基于调整后的 方位角计算调整后的幅值;以及基于调整后的幅值和对应的相位进行短时傅 里叶逆变换以获得二次拓宽的双声道音频。
可选地,所述将左声道分成左声道低频部分和左声道中高频部分,将右 声道分成右声道低频部分和右声道中高频部分的步骤可以包括:将左声道通 过交叉滤波器以获得左声道低频部分和左声道中高频部分,将右声道通过交 叉滤波器以获得右声道低频部分和右声道中高频部分。
可选地,左声道低频部分和左声道中高频部分的分频点以及右声道低频 部分和右声道中高频部分的分频点可以为200Hz。
可选地,所述滤波频响曲线可以使用梳状滤波器来生成。
可选地,所述对方位角进行调整以使调整后的方位角拓宽的步骤可以包 括:将调整后的方位角置为原方位角的p倍,且在原方位角大于90/p度时将 调整后的方位角置为90度,其中,p为大于1的实数。
可选地,所述对拓宽后的双声道音频进行二次拓宽处理的步骤还可以包 括:对二次拓宽的双声道音频的低频部分进行增强。
根据本公开的实施例的第二方面,提供一种双声道音频后处理的装置, 所述装置包括:分频单元,被配置为将左声道分成左声道低频部分和左声道 中高频部分,将右声道分成右声道低频部分和右声道中高频部分;中高频声 场拓宽单元,被配置为分别对所述左声道中高频部分和所述右声道中高频部 分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频 部分;以及叠加单元,被配置为将拓宽后的左声道中高频部分与左声道低频 部分进行叠加,并且将拓宽后的右声道中高频部分与右声道低频部分进行叠 加以得到拓宽后的双声道音频。
可选地,中高频声场拓宽单元可以被配置为执行以下步骤:对左声道中 高频部分和右声道中高频部分应用不同的滤波频响曲线来进行均衡以使均衡 后的左声道中高频部分和均衡后的右声道中高频部分之间的差异变大;以及 对均衡后的左声道中高频部分和均衡后的右声道中高频部分进行增益补偿以 获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分,并使得拓宽 后的左声道中高频部分的音量与左声道中高频部分的音量相同,拓宽后的右 声道中高频部分的音量与右声道中高频部分的音量相同。
可选地,所述装置还可以包括:二次拓宽单元,所述二次拓宽单元被配 置为对拓宽后的双声道音频进行二次拓宽处理。
可选地,二次拓宽单元可以被配置为执行以下步骤:对拓宽后的双声道 音频的左声道和右声道分别进行短时傅里叶变换;基于短时傅里叶变换获得 的频域计算与每帧的每个频率对应的幅值和相位;基于幅值计算方位角;对 方位角进行调整以使调整后的方位角拓宽;基于调整后的方位角计算调整后 的幅值;以及基于调整后的幅值和对应的相位进行短时傅里叶逆变换以获得 二次拓宽的双声道音频。
可选地,分频单元可以被配置为将左声道通过交叉滤波器以获得左声道 低频部分和左声道中高频部分,将右声道通过交叉滤波器以获得右声道低频 部分和右声道中高频部分。
可选地,左声道低频部分和左声道中高频部分的分频点以及右声道低频 部分和右声道中高频部分的分频点可以为200Hz。
可选地,中高频声场拓宽单元可以被配置为使用梳状滤波器生成滤波频 响曲线。
可选地,二次拓宽单元可以被配置为将调整后的方位角置为原方位角的 p倍,且在原方位角大于90/p度时将调整后的方位角置为90度,其中,p为 大于1的实数。
可选地,二次拓宽单元还可以被配置为对二次拓宽的双声道音频的低频 部分进行增强。
根据本公开的实施例的第三方面,提供一种电子设备,其特征在于,所 述电子设备包括:至少一个处理器;至少一个存储计算机可执行指令的存储 器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所 述至少一个处理器执行根据本公开的双声道音频后处理的方法。
根据本公开的实施例的第四方面,提供一种计算机可读存储介质,其特 征在于,当存储在所述计算机可读存储介质中的指令被至少一个处理器运行 时,促使所述至少一个处理器执行根据本公开的双声道音频后处理的方法。
根据本公开的实施例的第五方面,提供一种计算机程序产品,包括计算 机指令,其特征在于,当所述计算机指令被至少一个处理器执行时实现根据 本公开的双声道音频后处理的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
采用交叉滤波器将双声道中的左右声道分离为低频和中高频,且仅对左 右声道的中高频通过不同的滤波来达到声场拓宽的效果。因为低频一般都在 正中间,所以尽可能不改变低频的声场。此外,在由短时傅里叶变换获得的 频域对声场进行二次处理,计算方位角,改变声源定位,以此营造环绕声的 效果。从而实现双声道音频的声场拓宽、模拟环绕声的效果、提升声音的现 场感和听众的沉浸感,使得声场狭窄得以改善并实现音频美化。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性 的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公 开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的 不当限定。
图1是示出根据本公开的双声道音频后处理的方法和装置的应用场景图;
图2是示出根据一示例性实施例的双声道音频后处理的方法的流程图;
图3是示出根据一示例性实施例的交叉滤波器的示例;
图4是示出根据一示例性实施例的对中高频部分进行声场拓宽的流程图;
图5是示出根据一示例性实施例的对左声道中高频部分和右声道中高频 部分应用的不同的滤波频响曲线的示例;
图6是示出根据一示例性实施例的梳状滤波器的电路图;
图7是示出根据一示例性实施例的梳状滤波器的频响示意图;
图8是示出根据一示例性实施例的对拓宽后的双声道音频进行二次拓宽 处理的流程图;
图9是示出根据一示例性实施例的对双声道音频进行拓宽处理的整体流 程的示例;
图10是示出根据一示例性实施例的双声道音频后处理的装置的框图;以 及
图11是示出根据本公开的实施例的电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图, 对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第 一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后 次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本 公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示 例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。 相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致 的装置和方法的例子。
针对前面背景技术中所提及的问题,例如,在对于左右两声道相似的音 频是无法实现显著的声场拓宽下,本公开提供了一种双声道音频后处理的方 法,更具体地,采用交叉滤波器将双声道中的左右声道分离为低频和中高频, 且仅对左右声道的中高频通过不同的滤波来达到声场拓宽的效果。此外,在 由短时傅里叶变换获得的频域对声场进行二次处理,计算方位角,改变声源 定位,以此营造环绕声的效果。
图1是示出根据本公开的双声道音频后处理的方法和装置的应用场景图。
音频源端101可通过网络将其音频资源上传到服务器102。这里,音频 源端101可以是音频资源的发布端或发送端,例如,个人博主、新闻网站、 文献网站、UP主的用户终端等。服务器102可以是获取音频资源的接收方, 例如,音频播客平台。用户终端(例如,手机103_1、笔计本电脑103_2、平 板电脑103_3等)可通过应用客户端经由网络从服务器102获取到音频资源。 由于客观条件限制,通常由音频源端101上传的音频资源存在着声场狭窄、音频受损等问题。并且服务器102也在将用户请求的音频资源随着相应音频 一起发送到用户终端103_1、103_2或103_3时,用户通过用户终端103_1、 103_2或103_3的应用客户端来收听音频资源时也会遇到同样的声场狭窄、 音频受损等问题。将根据本公开的双声道音频后处理的方法和装置应用于这 个场景,例如,可以将本公开的双声道音频后处理的方法和装置应用于音频 源端101、服务器102和用户终端中的至少一者中,从而使得即使音频源端101将存在着声场狭窄、音频受损等问题音频资源上传至服务器102的情况 下,用户均可以获得经声场拓宽的效果和/或音频美化效果的音频资源。
图2是示出根据一示例性实施例的双声道音频后处理的方法的流程图。
参照图2,在步骤S100中,将左声道分成左声道低频部分和左声道中高 频部分,将右声道分成右声道低频部分和右声道中高频部分。根据本公开的 示例性实施例,考虑到在双声道音频的情况下,低频部分的方向性不强,例 如,底鼓和bass以及人声通常都在声场正中间,因此不对低频部分进行声场 拓宽的处理。在这种情况下,可以将双声道的原始音频分成方向性不强的低 频部分和方向性相对较强的中高频部分。
根据本公开的示例性实施例,可以将左声道通过交叉滤波器以获得左声 道低频部分和左声道中高频部分,可以将右声道通过交叉滤波器以获得右声 道低频部分和右声道中高频部分。在示例实施例中,可以将左声道低频部分 和左声道中高频部分的分频点以及右声道低频部分和右声道中高频部分的分 频点可以被设定为200Hz。需要说明的是,为了表述方便,在说明书中采用 交叉滤波器进行分频,并将分频点设定为200Hz。然而,分频的方法和分频 点可以根据音频资源的需求进行设定。交叉滤波器的示例将参照图3进行进一步的描述。
在步骤S200中,分别对左声道中高频部分和右声道中高频部分进行声场 拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分。将在 下面参照图4和图5对步骤S200进行详细描述。
在步骤S300中,将拓宽后的中高频部分与对应的低频部分进行叠加以得 到拓宽后的双声道音频。例如,可以将拓宽后的左声道中高频部分和左声道 低频部分进行叠加以获得拓宽后的左声道音频;可以将拓宽后的右声道中高 频部分和右声道低频部分进行叠加以获得拓宽后的右声道音频。
根据本公开提供的双声道音频后处理的方法,由于采用交叉滤波器将双 声道中的左右声道分离为低频和中高频,且仅对左右声道的中高频应用不同 的滤波频响曲线来达到声场拓宽的效果。因此,即使对于左右两声道相似的 音频也能够达到显著的声场拓宽效果。
图3是示出根据一示例性实施例的交叉滤波器的示例。
根据本公开的示例性实施例,可以将原始信号(例如,左声道原始信号 或右声道原始信号中的一者)通过交叉滤波器(Crossover Filter),从而将音 频信号分割成低频部分和中高频部分。交叉滤波器是多段滤波器,其整体幅 值频率相应是平坦的。参照图3,低频部分由虚线示出,中高频部分由点划 线示出。为了便于描述,图3中选择200Hz作为分频点(低频部分的曲线与 中高频部分的曲线的交点),通过该分频点将信号分成低频部分、中高频部分 两个频带。低频部分不予进行声场拓宽处理,中高频部分将在参照图2中示 出的步骤S200中的进行声场拓宽。
图4是示出根据一示例性实施例的对中高频部分进行声场拓宽的流程图。 图5是示出根据一示例性实施例的对左声道中高频部分和右声道中高频部分 应用的不同的滤波频响曲线的示例。图6是示出根据一示例性实施例的梳状 滤波器的电路图。图7是示出根据一示例性实施例的梳状滤波器的频响示意 图。
参照图2和图4,步骤S200可以包括步骤S210和步骤S220。
在步骤S210中,对左声道中高频部分和右声道中高频部分应用不同的滤 波频响曲线来进行均衡以使均衡后的左声道中高频部分和均衡后的右声道中 高频部分之间的差异变大。
根据本公开的示例性实施例,参照图5,对左声道中高频部分和右声道 中高频部分应用不同的滤波频响曲线来进行均衡使得左右耳差别变大。例如, 左声道对2000Hz附近的频率做衰减,而右声道对相同的频率进行增益,从而 使得降低两耳接收的声波的相似度。相似度越低则人耳感受到的声场越宽。
根据本公开的示例性实施例,所述滤波频响曲线可以使用梳状滤波器来 生成。
根据本公开的示例性实施例,参照图6,梳状滤波器是通过将信号的延 迟版本添加到自身而实现的,通过相长和相消干扰而实现的滤波器。梳状滤 波器的频率响应由一系列规则间隔的凹口组成,从而呈现出梳状的外观。
梳状滤波公式如下:
y[n]=x[n]+αx[n-K] (3),
其中x[n]为输入音频信号,K为延迟采样数,α是应用于延迟信号的比 例因子。可以控制α大小还调整滤波幅度。
参照图7,可以考虑使用简单的梳状滤波器来对左声道和右声道进行处 理。例如,针对左声道和右声道设计错开预定频率的梳状滤波器。为了示出 方便,图7中示出了K为19,α为1的示例。例如,应用图7中示出的梳状 滤波器的情况下,可以为左声道和右声道设计错开0.05弧度/样本均一化频率 的梳状滤波器。
返回参照图4,在步骤S220中,对均衡后的左声道中高频部分和均衡后 的右声道中高频部分进行增益补偿以获得所述拓宽后的左声道中高频部分和 所述拓宽后的右声道中高频部分,并使得拓宽后的左声道中高频部分的音量 与左声道中高频部分的音量相同,拓宽后的右声道中高频部分的音量与右声 道中高频部分的音量相同。也就是说,拓宽后的左声道和拓宽后的右声道的 音量保持原音量不变。
图8是示出根据一示例性实施例的对拓宽后的双声道音频进行二次拓宽 处理的流程图。
参照图8,所述方法还包括步骤S400,在步骤S400中,对拓宽后的双 声道音频进行二次拓宽处理。
在步骤S410中,对所述拓宽后的双声道音频的左声道和右声道分别进行 短时傅里叶变换以将双声道音频转换至频域。
在步骤S420中,基于短时傅里叶变换获得的频域计算与每帧的每个频率 对应的幅值和相位。
在步骤S430中,基于幅值计算方位角。
在步骤S440中,对方位角进行调整以使调整后的方位角拓宽。
在步骤S450中,基于调整后的方位角计算调整后的幅值。
在步骤S460中,基于调整后的幅值和对应的相位进行短时傅里叶逆变换 以获得二次拓宽的双声道音频以达到环绕声的效果。
尽管未示出,对拓宽后的双声道音频进行二次拓宽处理的步骤还可以对 二次拓宽的双声道音频的低频部分进行增强的步骤以增强鼓和bass和以及部 分人声基频。例如,可以用均衡器(EQ)对整体的低频部分(例如,100Hz 附近)做一定的提升(例如,提升3dB)。
图9是示出根据一示例性实施例的对双声道音频进行拓宽处理的整体流 程的示例。
参照图2和图9,在步骤S100中,输入信号为左声道的时域信号L(t)和 右声道的时域信号R(t)。经过交叉滤波器进行分频从而得到左声道低频部分 和左声道中高频部分,以及右声道低频部分和右声道中高频部分。例如,
Llow(t),Lhigh(t)=crossfilter(L(t)) (4),
Rlow(t),Rhigh(t)=crossfilter(R(t)) (5),
其中,Llow(t),Lhigh(t)分别表示左声道低频部分和左声道中高频部分, Rlow(t),Rhigh(t)分别表示右声道低频部分和右声道中高频部分。
在步骤S200中,对左右声道高频进行不同的均衡处理:
Lhigh_eq(t)=EQ1(Lhigh(t)) (6),
Rhigh_eq(t)=EQ2(Rhigh(t)) (7),
其中,Lhigh_eq(t)和Rhigh_eq(t)分别表示均衡后的左声道高频部分和均衡 后的右声道的高频部分。尽管未示出,步骤S200还可以包括对均衡后的左声 道高频部分和均衡后的右声道的高频部分进行增益补偿的步骤,以使得它们 的音量保持不变。
在步骤S300中,将均衡后的左声道高频部分Lhigh_eq(t)与未处理的左声 道低频Llow(t)叠加,并且将均衡后的右声道高频部分Rhigh_eq(t)与未处理的右 声道低频Rlow(t)叠加得到拓宽后的双声道音频(L1(t)和R1(t)):
L1(t)=Lhigh_eq(t)+Llow(t) (8),
R1(t)=Rhigh_eq(t)+Rlow(t) (9)。
在步骤S400中,对拓宽后的双声道音频(L1(t)和R1(t))进行二次拓宽 处理。
参照图6和图9,在步骤S410中,对所述拓宽后的双声道音频的左声道 和右声道分别进行短时傅里叶变换(STFT):
L1(n,k)=STFT(L1(t)) (10),
R1(n,k)=STFT(R1(t)) (11),
其中,n表示第n帧信号,可以用n表示帧序列,0<n≤N,(N为总帧 数);k为中心频率序列0<k≤K;(K为总频点数)。经过短时傅里叶变换可 以得到左声道的频域信号L1(n,k)和右声道的频域信号R1(n,k)。
在步骤S420中,基于短时傅里叶变换获得的频域计算与每帧的每个频率 对应的幅值和相位:
LMag(n,k)=abs(L1(n,k)) (12),
RMag(n,k)=abs(R1(n,k)) (13),
LPhase(n,k)=angle(L1(n,k)) (14),
RPhase(n,k)=angle(R1(n,k)) (15),
其中,LMag(n,k)和RMag(n,k)分别表示左声道的幅值和右声道的幅值, LPhase(n,k)和RPhase(n,k)分别表示左声道的相位和右声道的相位。函数abs 表示计算幅值的函数,函数angle表示计算相位的函数。函数abs和函数angle 可以具有本领域技术人员通常使用的形式,在此不做具体限制。本公开的示 例不限于具体的函数形式,只要能够获得左声道和右声道的幅值和相位即可。 作为示例,函数angle可以具有arctan的形式。例如,
LPhase(n,k)=arctan(Imag(L1(n,k))/Real(L1(n,k))) (16),
RPhase(n,k)=arctan(Imag(R1(n,k))/Real(R1(n,k))) (17),
其中,Imag(L1(n,k))和Imag(R1(n,k))分别表示左声道和右声道的虚部, Real(L1(n,k))和Real(R1(n,k))分别表示左声道和右声道的实部。
在步骤S430中,基于幅值计算方位角。例如,
θ(n,k)=Azimuth(LMag(n,k),RMag(n,k)) (18)。
方位角函数Azimuth可以具有本领域技术人员通常使用的形式,在此不 做具体限制。本公开的示例不限于具体的函数形式,只要能够获得方位角即 可。作为示例,方位角函数Azimuth可以具有arctan的形式。例如,
Figure BDA0003150192540000101
其中,
Figure BDA0003150192540000102
可以为30度角。
在步骤S440中,对方位角进行调整以使调整后的方位角拓宽。例如,
θout(n,k)=f(θ(n,k)) (20)。
根据本公开的示例性实施例,方位角调整函数f可以具有各种形式。在 示例中,方位角调整函数f可以被配置为将调整后的方位角置为原方位角的p 倍,且在原方位角大于90/p度时将调整后的方位角置为90度,其中,p为大 于1的实数。例如,p可以为1.5,当原方位角为30度时,调整后的方位角 为45度。又例如,原方位角为61度(即,大于90/1.5)时,其与p的乘积 将超过90度,则将调整后的方位角置为90度。
在步骤S450中,基于调整后的方位角计算调整后的幅值。例如,
LMag_out(n,k),RMag_out(n,k)=
IAzimuth(θout(n,k),LMag(n,k),RMag(n,k)) (21),
其中,LMag_out(n,k)和RMag_out(n,k)分别表示调整后的左声道的幅值和调 整后的右声道的幅值。
根据本公开的示例性实施例,方位角计算函数IAzimuth可以具有各种形 式。在示例中,方位角计算函数IAzimuth可以被表示为
Figure BDA0003150192540000111
Figure BDA0003150192540000112
其中,
Figure BDA0003150192540000113
在步骤S460中,基于调整后的幅值和对应的相位进行短时傅里叶逆变换 以获得二次拓宽的双声道音频。例如,
Lout(n,k)=ISTFT(LMag_out(n,k),LPhase(n,k)) (24),
Rout(n,k)=ISTFT(RMag_out(n,k),RPhase(n,k)) (25)。
结合之前保存的左声道相位和右声道相位,进行ISTFT(短时傅立叶反 变换)得到时域结果。
尽管未示出,对拓宽后的双声道音频进行二次拓宽处理的步骤还可以将 模拟环绕声效果整体进行音量提升,低频增强,获得更震撼的效果。例如, 可以用均衡器(EQ)对整体的低频部分(例如,100Hz附近)提升3dB。
根据本公开提供的双声道音频后处理的方法,由于采用交叉滤波器将双 声道中的左右声道分离为低频和中高频,且仅对左右声道的中高频应用不同 的滤波频响曲线来达到声场拓宽的效果。因此,即使对于左右两声道相似的 音频也能够达到显著的声场拓宽效果。此外,在由短时傅里叶变换获得的频 域对声场进行二次处理,计算方位角,改变声源定位,以此营造环绕声的效 果。在这种情况下,可以在不影响原方位角的情况下进一步的拓宽声场,达 到环绕声的效果。通过二次拓宽处理中对方位角和幅值的调整。
图10是示出根据一示例性实施例的双声道音频后处理的装置10的框图。
作为示例,可由图10所示的装置10来执行图2以及图4和图5所示的 方法。
如图10所示,装置10可以是用来双声道音频后处理的装置。
所述装置10包括:分频单元110、中高频声场拓宽单元120、以及叠加 单元130。
分频单元110被配置为将左声道和右声道分别分成低频部分和中高频部 分,其中,所述中高频部分包括左声道中高频部分和右声道中高频部分。分 频单元110可以被配置为用来执行参照图2中的步骤S100描述的方法。
中高频声场拓宽单元120被配置为分别对所述左声道中高频部分和所述 右声道中高频部分进行声场拓宽以获得拓宽后的中高频部分。中高频声场拓 宽单元120可以被配置为用来执行参照图2中的步骤S200和图4中的步骤 S210和S220描述的方法。
叠加单元130被配置为将拓宽后的中高频部分与对应的低频部分进行叠 加以得到拓宽后的双声道音频。叠加单元130可以被配置为用来执行参照图 2中的步骤S300描述的方法。
根据本公开的示例性实施例,装置10还可以包括二次拓宽单元140。二 次拓宽单元140被配置为对拓宽后的双声道音频进行二次拓宽处理。二次拓 宽单元140可以被配置为用来执行参照图6中的步骤S400描述的方法。
关于上述实施例中的装置,其中各个模块/单元执行操作的具体方式已经 在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图11是示出根据本公开的实施例的电子设备的框图。
参照图11,电子设备400包括至少一个存储器401和至少一个处理器402, 所述至少一个存储器401存储计算机可执行指令,当计算机可执行指令被至 少一个处理器402执行时,促使至少一个处理器402执行根据本公开的实施 例的双声道音频后处理的方法。
作为示例,电子设备400可以是PC计算机、平板装置、个人数字助理、 智能手机、或其他能够执行上述指令的装置。这里,电子设备400并非必须 是单个电子设备,还可以是任何能够单独或联合执行上述指令(或指令集) 的装置或电路的集合体。电子设备400还可以是集成控制系统或系统管理器 的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互 联的便携式电子设备。
在电子设备400中,处理器402可包括中央处理器(CPU)、图形处理器 (GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示 例而非限制,处理器还可包括模拟处理器、数字处理器、微处理器、多核处 理器、处理器阵列、网络处理器等。
处理器402可运行存储在存储器401中的指令或代码,其中,存储器401 还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接 收,其中,网络接口装置可采用任何已知的传输协议。
存储器401可与处理器402集成为一体,例如,将RAM或闪存布置在 集成电路微处理器等之内。此外,存储器401可包括独立的装置,诸如,外 部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器401 和处理器402可在操作上进行耦合,或者可例如通过I/O端口、网络连接等 互相通信,使得处理器402能够读取存储在存储器中的文件。
此外,电子设备400还可包括视频显示器(诸如,液晶显示器)和用户 交互接口(诸如,键盘、鼠标、触摸输入装置等)。电子设备400的所有组件 可经由总线和/或网络而彼此连接。
根据本公开的实施例,还可提供一种计算机可读存储介质,其中,当存 储在计算机可读存储介质中的指令被至少一个处理器运行时,促使至少一个 处理器执行根据本公开的实施例的双声道音频后处理的方法。这里的计算机 可读存储介质的示例包括:只读存储器(ROM)、随机存取可编程只读存储 器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、 动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、 DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、 BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、 卡式存储器(诸如,多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、 磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任 何其他装置,所述任何其他装置被配置为以非暂时性方式存储计算机程序以 及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相 关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算 机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸 如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,此 外,在一个示例中,计算机程序以及任何相关联的数据、数据文件和数据结 构分布在联网的计算机系统上,使得计算机程序以及任何相关联的数据、数 据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问 和执行。
根据本公开的实施例,还可提供一种计算机程序产品,包括计算机指令, 当所述计算机指令被至少一个处理器执行时实现根据本公开的实施例的双声 道音频后处理的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本 公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性 变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公 开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被 视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确 结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所 附的权利要求来限制。

Claims (10)

1.一种双声道音频后处理的方法,所述方法包括:
将左声道分成左声道低频部分和左声道中高频部分,将右声道分成右声道低频部分和右声道中高频部分;
分别对所述左声道中高频部分和所述右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分;以及
将所述拓宽后的左声道中高频部分与所述左声道低频部分进行叠加,并且将所述拓宽后的右声道中高频部分与所述右声道低频部分进行叠加以得到拓宽后的双声道音频。
2.根据权利要求1所述的方法,其中,所述分别对所述左声道中高频部分和所述右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分的步骤包括:
对所述左声道中高频部分和所述右声道中高频部分应用不同的滤波频响曲线来进行均衡以使均衡后的左声道中高频部分和均衡后的右声道中高频部分之间的差异变大;以及
对均衡后的左声道中高频部分和均衡后的右声道中高频部分进行增益补偿以获得所述拓宽后的左声道中高频部分和所述拓宽后的右声道中高频部分,并使得所述拓宽后的左声道中高频部分的音量与所述左声道中高频部分的音量相同,所述拓宽后的右声道中高频部分的音量与所述右声道中高频部分的音量相同。
3.根据权利要求1所述的方法,所述方法还包括:对拓宽后的双声道音频进行二次拓宽处理。
4.根据权利要求3所述的方法,其中,所述对拓宽后的双声道音频进行二次拓宽处理的步骤包括:
对所述拓宽后的双声道音频的左声道和右声道分别进行短时傅里叶变换;
基于短时傅里叶变换获得的频域计算与每帧的每个频率对应的幅值和相位;
基于所述幅值计算方位角;
对所述方位角进行调整以使调整后的方位角拓宽;
基于调整后的方位角计算调整后的幅值;以及
基于调整后的幅值和对应的相位进行短时傅里叶逆变换以获得二次拓宽的双声道音频。
5.根据权利要求1所述的方法,其中,所述将左声道分成左声道低频部分和左声道中高频部分,将右声道分成右声道低频部分和右声道中高频部分的步骤包括:将所述左声道通过交叉滤波器以获得所述左声道低频部分和所述左声道中高频部分,将所述右声道通过所述交叉滤波器以获得所述右声道低频部分和所述右声道中高频部分。
6.根据权利要求1所述的方法,其中,所述左声道低频部分和所述左声道中高频部分的分频点以及所述右声道低频部分和所述右声道中高频部分的分频点为200Hz。
7.一种双声道音频后处理的装置,所述装置包括:
分频单元,被配置为将左声道分成左声道低频部分和左声道中高频部分,将右声道分成右声道低频部分和右声道中高频部分;
中高频声场拓宽单元,被配置为分别对所述左声道中高频部分和所述右声道中高频部分进行声场拓宽以获得拓宽后的左声道中高频部分和拓宽后的右声道中高频部分;以及
叠加单元,被配置为将所述拓宽后的左声道中高频部分与所述左声道低频部分进行叠加,并且将所述拓宽后的右声道中高频部分与所述右声道低频部分进行叠加以得到拓宽后的双声道音频。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;
至少一个存储计算机可执行指令的存储器,
其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1-6中任意一项所述的双声道音频后处理的方法。
9.一种计算机可读存储介质,其特征在于,当存储在所述计算机可读存储介质中的指令被至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1-6中任意一项所述的双声道音频后处理的方法。
10.一种计算机程序产品,包括计算机指令,其特征在于,当所述计算机指令被至少一个处理器执行时实现如权利要求1-6中任意一项所述的双声道音频后处理的方法。
CN202110761810.9A 2021-07-06 2021-07-06 双声道音频后处理的方法和装置 Active CN113473352B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110761810.9A CN113473352B (zh) 2021-07-06 2021-07-06 双声道音频后处理的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110761810.9A CN113473352B (zh) 2021-07-06 2021-07-06 双声道音频后处理的方法和装置

Publications (2)

Publication Number Publication Date
CN113473352A true CN113473352A (zh) 2021-10-01
CN113473352B CN113473352B (zh) 2023-06-20

Family

ID=77878483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110761810.9A Active CN113473352B (zh) 2021-07-06 2021-07-06 双声道音频后处理的方法和装置

Country Status (1)

Country Link
CN (1) CN113473352B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05207597A (ja) * 1992-01-30 1993-08-13 Matsushita Electric Ind Co Ltd 音場再生装置
CN1402956A (zh) * 1999-10-04 2003-03-12 Srs实验室公司 声校正装置
US6614910B1 (en) * 1996-11-01 2003-09-02 Central Research Laboratories Limited Stereo sound expander
US20060062395A1 (en) * 1995-07-28 2006-03-23 Klayman Arnold I Acoustic correction apparatus
CN102970640A (zh) * 2011-08-31 2013-03-13 雅马哈株式会社 扬声器装置
US20140177845A1 (en) * 2012-10-05 2014-06-26 Nokia Corporation Method, apparatus, and computer program product for categorical spatial analysis-synthesis on spectrum of multichannel audio signals
CN104335606A (zh) * 2012-05-29 2015-02-04 创新科技有限公司 任意配置的扬声器的立体声拓宽
US9668081B1 (en) * 2016-03-23 2017-05-30 Htc Corporation Frequency response compensation method, electronic device, and computer readable medium using the same
CN110139206A (zh) * 2019-04-28 2019-08-16 北京雷石天地电子技术有限公司 一种立体声音频的处理方法及系统
CN112019993A (zh) * 2019-05-29 2020-12-01 诺基亚技术有限公司 音频处理

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05207597A (ja) * 1992-01-30 1993-08-13 Matsushita Electric Ind Co Ltd 音場再生装置
US20060062395A1 (en) * 1995-07-28 2006-03-23 Klayman Arnold I Acoustic correction apparatus
US6614910B1 (en) * 1996-11-01 2003-09-02 Central Research Laboratories Limited Stereo sound expander
CN1402956A (zh) * 1999-10-04 2003-03-12 Srs实验室公司 声校正装置
CN102970640A (zh) * 2011-08-31 2013-03-13 雅马哈株式会社 扬声器装置
CN104335606A (zh) * 2012-05-29 2015-02-04 创新科技有限公司 任意配置的扬声器的立体声拓宽
US20140177845A1 (en) * 2012-10-05 2014-06-26 Nokia Corporation Method, apparatus, and computer program product for categorical spatial analysis-synthesis on spectrum of multichannel audio signals
US9668081B1 (en) * 2016-03-23 2017-05-30 Htc Corporation Frequency response compensation method, electronic device, and computer readable medium using the same
CN110139206A (zh) * 2019-04-28 2019-08-16 北京雷石天地电子技术有限公司 一种立体声音频的处理方法及系统
CN112019993A (zh) * 2019-05-29 2020-12-01 诺基亚技术有限公司 音频处理

Also Published As

Publication number Publication date
CN113473352B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
US10142763B2 (en) Audio signal processing
US7970144B1 (en) Extracting and modifying a panned source for enhancement and upmix of audio signals
EP3175445B1 (en) Apparatus and method for enhancing an audio signal, sound enhancing system
KR20120036303A (ko) 라우드스피커 또는 헤드폰 재생을 위한 가상 오디오 처리
CA2931105A1 (en) Systems and methods for acoustic processing of recorded sounds
KR20180075610A (ko) 사운드 스테이지 향상을 위한 장치 및 방법
CA2835463A1 (en) Apparatus and method for generating an output signal employing a decomposer
JP2008517317A (ja) オーディオデータ処理システム、方法、プログラム要素、及びコンピュータ読み取り可能媒体
US9966081B2 (en) Method and apparatus for synthesizing separated sound source
WO2023221559A1 (zh) K歌音频处理方法、装置及计算机可读存储介质
CN114830693A (zh) 频谱正交音频分量处理
US20140072124A1 (en) Apparatus and method and computer program for generating a stereo output signal for proviing additional output channels
CN113273225B (zh) 音频处理
US9905246B2 (en) Apparatus and method of creating multilingual audio content based on stereo audio signal
TW201317984A (zh) 信號處理設備,信號處理方法及程式
CN114067827A (zh) 一种音频处理方法、装置及存储介质
CN113473352B (zh) 双声道音频后处理的方法和装置
US20220101821A1 (en) Device, method and computer program for blind source separation and remixing
US20120020483A1 (en) System and method for robust audio spatialization using frequency separation
JPWO2011052226A1 (ja) 音響信号処理装置および音響信号処理方法
JP2023024295A (ja) 動的音声強調のための方法及びシステム
US10904690B1 (en) Energy and phase correlated audio channels mixer
US9414177B2 (en) Audio signal processing method and audio signal processing device
JPH09233597A (ja) 中央サウンドイメージ回路をもつステレオ効果増強装置
CN115346542A (zh) 音频信号处理方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant