CN106973355A - 环绕立体声实现方法和装置 - Google Patents

环绕立体声实现方法和装置 Download PDF

Info

Publication number
CN106973355A
CN106973355A CN201610025695.8A CN201610025695A CN106973355A CN 106973355 A CN106973355 A CN 106973355A CN 201610025695 A CN201610025695 A CN 201610025695A CN 106973355 A CN106973355 A CN 106973355A
Authority
CN
China
Prior art keywords
value
sound
audio data
voice data
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610025695.8A
Other languages
English (en)
Other versions
CN106973355B (zh
Inventor
杨将
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201610025695.8A priority Critical patent/CN106973355B/zh
Priority to PCT/CN2016/113113 priority patent/WO2017121245A1/zh
Publication of CN106973355A publication Critical patent/CN106973355A/zh
Application granted granted Critical
Publication of CN106973355B publication Critical patent/CN106973355B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

本发明涉及一种环绕立体声实现方法和装置,所述方法包括:获取第一声道音频数据;获取相较于所述第一声道音频数据具有固定延时的第二声道音频数据;调整所述第一声道音频数据和/或所述第二声道音频数据的振幅值,以使所述第一声道音频数据的振幅值小于所述第二声道音频数据的振幅值;以及分别通过不同的发声单元输出所述第一声道音频数据和所述第二声道音频数据。本发明提供的环绕立体声实现方法和装置,拓宽了声场,在实现环绕立体声的同时避免偏音现象,且具有较强普适性。

Description

环绕立体声实现方法和装置
技术领域
本发明涉及音频技术领域,特别是涉及一种环绕立体声实现方法和装置。
背景技术
环绕立体声是一种特殊的音响效果,环绕立体声所产生的重放声场,保留着原信号的声源方向感,使听者有着较强的空间感,可以逼真地再现演出厅的空间混响过程,具有更为动人的临场感。目前实现环绕立体声,一般需要在录音时采用仿真人头录音方式,仿真人头录音方式就是把两个微型全指向性话筒安置在一个与真人头基本一致的仿真人头的耳道内(接近人耳鼓膜的位置),模拟人耳进行录音的整个过程。
然而,目前仿真人头录音方式录制过程复杂,成本高;而且仿真人头录音方式是在录制时采取的特殊处理,而普通的音频数据由于没有采用仿真人头录音方式,就无法通过这种方式来实现环绕立体声,普适性差。
发明内容
基于此,有必要针对目前通过仿真人头录音方式实现环绕立体声普适性差的问题,提供一种环绕立体声实现方法和装置。
一种环绕立体声实现方法,所述方法包括:
获取第一声道音频数据;
获取相较于所述第一声道音频数据具有固定延时的第二声道音频数据;
调整所述第一声道音频数据和/或所述第二声道音频数据的振幅值,以使所述第一声道音频数据的振幅值小于所述第二声道音频数据的振幅值;以及
分别通过不同的发声单元输出所述第一声道音频数据和所述第二声道音频数据。
一种环绕立体声实现装置,所述装置包括:
第一获取模块,用于获取第一声道音频数据;
第二获取模块,用于获取相较于所述第一声道音频数据具有固定延时的第二声道音频数据;
振幅值调整模块,用于调整所述第一声道音频数据和/或所述第二声道音频数据的振幅值,以使所述第一声道音频数据的振幅值小于所述第二声道音频数据的振幅值;
输出模块,用于分别通过不同的发声单元输出所述第一声道音频数据和所述第二声道音频数据。
上述环绕立体声实现方法和装置,第二声道音频数据相较于第一声道音频数据具有固定延时,通过该固定延时可分裂声像,使得人耳所感知的声源多余一个,拓宽了声场。而且,固定延时会产生偏音现象,通过调整第一声道音频数据和/或第二声道音频数据的振幅值,使得第一声道音频数据的振幅值小于第二声道音频数据的振幅值。这样延时的第二声道音频数据的振幅值相较于未延时的第一声道音频数据的振幅值得以增强,延时造成的偏音通过振幅值的变化来弥补,在实现环绕立体声的同时避免偏音现象。不需要通过仿真人头录音方式,普通音频数据通过计算机程序处理便可以实现,具有较强的普适性。
附图说明
图1为一个实施例中用于实现环绕立体声实现方法的电子设备的结构及应用环境图;
图2为一个实施例中环绕立体声实现方法的流程示意图;
图3为一个实施例中当两耳时间差变化时人脑中声像位置变化示意图;
图4为一个实施例中对第一声道音频数据和第二声道音频数据进行声像分裂处理的示意图;
图5为一个实施例中对声像分裂处理后的第一声道音频数据和第二声道音频数据进行加权增强处理的等效电路示意图;
图6为一个实施例中将第一声道音频数据和第二声道音频数据的振幅值压限到有效振幅值范围内的步骤的流程示意图;
图7为一个实施例中环绕立体声实现装置的结构框图;
图8为一个实施例中振幅值调整模块的结构框图;
图9为另一个实施例中环绕立体声实现装置的结构框图;
图10为再一个实施例中环绕立体声实现装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,在一个实施例中,提供了一种电子设备,包括通过系统总线连接的处理器、非易失性存储介质、内存储器和音频输出接口。其中处理器具有计算功能和控制电子设备工作的功能,该处理器被配置为执行一种环绕立体声实现方法。非易失性存储介质包括磁存储介质、光存储介质和闪存式存储介质中的至少一种,非易失性存储介质存储有操作系统和环绕立体声实现装置,该环绕立体声实现装置用于实现一种环绕立体声实现方法。音频输出接口用于输出音频数据的模拟信号,可通过与音频输出接口连接的发声单元将模拟信号转化为声波,使人耳可以听到音频数据所记录的声音内容。电子设备可以是手机、平板电脑、音乐播放器或者个人数字助理(PDA)等移动终端,也可以是台式计算机。
在一个实施例中,提供了一种环绕立体声实现方法,本实施例以该方法应用于上述图1中的电子设备来举例说明。如图2所示,该方法具体包括如下步骤:
步骤202,获取第一声道音频数据。
具体地,电子设备从音频数据源获取第一声道音频数据,音频数据源可以存储在电子设备本地,即终端可从电子设备本地获取第一声道音频数据;音频数据源也可以存储在网络中,电子设备可通过网络从音频数据源获取第一声道音频数据。音频数据源可以采用MP3(Moving Picture Experts Group Audio LayerIII,动态影像专家压缩标准音频层面3)、WMA(Windows Media Audio,微软音频格式)或者APE(一种无损音频格式)等音频格式。
步骤204,获取相较于第一声道音频数据具有固定延时的第二声道音频数据。
其中,第一声道音频数据和第二声道音频数据用于区分不同声道的音频数据。若第一声道音频数据为左声道音频数据,第二声道音频数据可以是右声道音频数据;或者,若第一声道音频数据为右声道音频数据,第二声道音频数据可以是左声道音频数据。
获取的第二声道音频数据比第一声道音频数据延迟了固定延时,该固定延时为ITD(Interaural Time Difference,两耳时间差),固定延时用于拓宽声场,具体用于通过分裂声像来拓宽声场。声像是人的感知声源,固定延时用于分裂声像,是指若将该第一声道音频数据和具有固定延时的第二声道音频数据分别转换为声波输出到人两耳,人会感知到自己头部存在两个声音内容相同或相似但位置不同的声源。
参照图3,当将两耳时间差从0到0.6ms(毫秒)变化时,声像位置从人脑中心沿两耳间的轴向移动。当两耳时间差从0.6ms到10ms变化时,声像位置不再沿两耳间的轴向移动,而是形状发生变化,导致声像拓宽,且变化幅度随着两耳时间差的上升而不断增加。当两耳时间差继续增大到特定数值时,人脑中产生的拓宽的声像被分裂成两个对称且未拓宽的声像。这里的特定数值一般在15ms到50ms之间,具体的值还与音频数据源特性相关,比如音频数据源本身存在的声道差异。固定延时可取15ms到50ms之间的值。
步骤206,调整第一声道音频数据和/或第二声道音频数据的振幅值,以使第一声道音频数据的振幅值小于第二声道音频数据的振幅值。
具体地,电子设备可调整第一声道音频数据的振幅值,或者调整第二声道音频数据的振幅值,或者同时调整第一声道音频数据的振幅值和第二声道音频数据的振幅值。这里的振幅值是指时域振幅值。经过调整后,第一声道音频数据的振幅值小于相应的第二声道音频数据的振幅值。
步骤208,分别通过不同的发声单元输出第一声道音频数据和第二声道音频数据。
具体地,电子设备可连接两个发声单元,即第一发声单元和第二发声单元,两个发声单元可以分别是耳机的左耳发声单元和右耳发声单元。电子设备可将第一声道音频数据转化为模拟信号后通过第一发声单元输出声波,将第二声道音频数据转化为模拟信号后通过第二发声单元发出声波。
上述环绕立体声实现方法,第二声道音频数据相较于第一声道音频数据具有固定延时,通过该固定延时可分裂声像,使得人耳所感知的声源多余一个,拓宽了声场。而且,固定延时会产生偏音现象,通过调整第一声道音频数据和/或第二声道音频数据的振幅值,使得第一声道音频数据的振幅值小于第二声道音频数据的振幅值。这样延时的第二声道音频数据的振幅值相较于未延时的第一声道音频数据的振幅值得以增强,延时造成的偏音通过振幅值的变化来弥补,在实现环绕立体声的同时避免偏音现象。不需要通过仿真人头录音方式,普通音频数据通过计算机程序处理便可以实现,具有较强的普适性。
在一个实施例中,步骤204具体包括:获取与第一声道音频数据时间同步的第二声道音频数据,在时间同步的第二声道音频数据中插入一帧音频数据。
具体地,电子设备可直接从音频数据源中获取与第一声道音频数据时间同步的第二声道音频数据,若音频数据源本身没有声道的区分,则可以从音频数据源获取两路相同的音频数据分别作为时间同步的第一声道音频数据和第二声道音频数据。
一帧音频数据的时间长度一般在固定延时可取的15ms到50ms之间,比如MP3音频格式中一帧音频数据为26ms,这样通过在第二音频数据中插入一帧音频数据可以快速地实现声像分裂,而且不会对原本的音频数据造成太大影响,高效而且准确。此时固定延时为一帧音频数据的时间长度。
参照图4,假设获取的时间同步的第一声道音频数据Li和第二声道音频数据Ri,通过声像分裂处理后输出的第一声道音频数据为Lo,输出的第二声道音频数据为Ro。则存在以下公式(1):
Lo=Li
Ro=z-TRi 公式(1)
其中,z表示进行Z变换(z-transformation),可将时域信号(即:离散时间序列)变换为在复频域的表达式。T表示固定延时,Ro=z-TRi表示Ro相较于Ri延迟固定延时T。
插入的音频数据可根据插入点处的前一帧音频数据和后一帧音频数据生成,使得前一帧音频数据平滑过渡到插入的一帧音频数据,并且插入的一帧音频数据平滑过渡到后一帧音频数据。插入的音频数据可根据插入点处的前一帧音频数据和后一帧音频数据生成,具体可根据前一帧音频数据的最后一个采样点值和后一帧音频数据中第一个采样点值生成。这样可防止因插入一帧音频数据而产生噪声。
在一个实施例中,步骤204具体包括:获取与第一声道音频数据时间同步的第二声道音频数据,在第一声道音频数据中删除一帧音频数据。
具体地,电子设备不仅可以在第二声道音频数据中插入一帧音频数据,也可以从第一声道音频数据中删除一帧音频数据,以使得第二声道音频数据相较于第一声道音频数据具有固定延时。此时固定延时为一帧音频数据的时间长度。
一帧音频数据的时间长度一般在固定延时可取的15ms到50ms之间,比如MP3音频格式中一帧音频数据为26ms,这样通过在第一声道音频数据中删除一帧音频数据可以快速地实现声像分裂,而且不会对原本的音频数据造成太大影响,高效而且准确。
删除一帧音频数据后,删除的一帧音频数据的前一帧音频数据和后一帧音频数据平滑过渡。具体在删除一帧音频数据时,删除的音频数据的第一个采样点值和最后一个采样点值相等或者相差满足最小化条件;或者,也可以将删除的一帧音频数据的前一帧音频数据和后一帧音频数据进行处理,使得前一帧音频数据和后一帧音频数据平滑过渡。这样可防止因删除一帧音频数据而产生噪声。
在一个实施例中,步骤206具体包括:将第一声道音频数据附加第一声道中置增益值,第一声道中置增益值为第一声道音频数据与第二声道音频数据的和再乘以第一中置系数;将第二声道音频数据附加第二声道中置增益值,第二声道中置增益值为第一声道音频数据与第二声道音频数据的和再乘以第二中置系数;第一中置系数小于第二中置系数。
具体地,参照图5,需要对声像分裂处理后的第一声道音频数据和第二声道音频数据进行加权增强处理,图5中Li为经过声像分裂处理后的第一声道音频数据,Ri为经过声像分裂处理后的第二声道音频数据,Lo为经过加权增强处理后的第一声道音频数据,Ro为经过加权增强处理后的第二声道音频数据。“-”表示将输入的信号作差,“+”表示将输入的信号求和,反相器用于将通过的信号的相位反转。n表示中置系数,p表示空间感增益参数,HRTF全称Head RelatedTransfer Function,中文表示头相关变换函数,是一种音效定位算法。
对经过声像分裂处理后的第一声道音频数据Li和第二声道音频数据Ri进行加权增强处理可采用如下公式(2):
公式(2)
其中,Lo表示将第一声道音频数据Li经过加权增强处理后输出的第一声道音频数据,Ro表示将第二声道音频数据Ri经过加权增强处理后输出的第二声道音频数据。nL表示第一中置系数,nR表示第二中置系数。表示求取卷积。
经过声像分裂的处理后,声像被分裂为两个:原始声像和后声像,同时声场被拉至两耳,头部中剩下较少声场。通过加权增强处理后,两耳处的声像声场会向四周扩散,因而增加了头部中的声场分布;同时,在计算时给予非延迟声道较小的n值,可以减弱偏音效果。
在一个实施例中,在步骤206之后,还包括:对第一声道音频数据和第二声道音频数据进行高通滤波和低通滤波。其中电子设备可采用先低通滤波再高通滤波的顺序过滤,也可以采用先高通滤波再低通滤波的顺序过滤。高通滤波和低通滤波均可以通过计算机程序调用相应的函数来实现。
本实施例中,根据人耳听觉特性,音频中极低频率部分和极高频率部分不会对声音感知造成影响,这里对两个声道的音频数据进行高低切处理,减少高频音和低频音对有限振幅值的影响,并且不影响原有的音频音质。
举例说明,电子设备可先采用低通滤波函数过滤第一声道音频数据和第二声道音频数据,再采用高通滤波函数过滤第一声道音频数据和第二声道音频数据。可以用以下公式(3)表示:
Lo=HP(LP(Li))
Ro=HP(LP(Ri)) 公式(3)
其中,Li表示进行高通滤波和低通滤波之前的第一声道音频数据,Ri表示进行高通滤波和低通滤波之前的第二声道音频数据。LP()表示低通滤波函数,HP()表示高通滤波函数。Lo表示经过高通滤波和低通滤波之后的第一声道音频数据,Ro表示进行高通滤波和低通滤波之后的第二声道音频数据。
在一个实施例中,步骤206之后,还包括将第一声道音频数据和第二声道音频数据的振幅值压限到有效振幅值范围内的步骤,参照图6,具体包括如下步骤:
步骤602,当第一声道音频数据或者第二声道音频数据的相应振幅值超过有效振幅值范围时,则将相应振幅值按照有效振幅值范围的最大有效振幅值,获得分段值序列。
具体地,有效振幅值范围可表示为[-A,A],其中A表示最大有效振幅值,A可以取1。按照最大有效振幅值进行分段,是指以最大有效振幅值为单位进行切分,获得的分段值按照分段的顺序构成分段值序列。举例说明,假设最大有效振幅值为1,相应振幅值的绝对值为3.2,那么按照最大有效振幅值进行分段获得的分段值序列为1,1,1,0.2。
步骤604,获取分段值序列中各个分段值的权重,获取的权重的值依次递减且获取的权重的和小于等于1。
具体地,电子设备获取为分段值序列中的每个分段值分配的权重,获取的权重按照分段值序列的顺序依次递减,并且分段值序列中所有分段值的权重的和小于等于1。这里权重的和小于等于1是需要权重满足该条件,并不意味着要计算权重的和。举例说明,假设分段值序列为1,1,1,0.2;则权重可以依次为0.5,0.25,0.1,0.08,这些权重呈递减趋势,且相加和为0.93,满足权重和小于1的条件。
步骤606,根据获取的权重计算分段值序列的加权和。
举例说明,假设分段值序列为1,1,1,0.2,则计算加权和为1*0.5+1*0.25+1*0.1+0.2*0.08=0.866。
步骤608,根据加权和重置相应振幅值。
具体地,重置的振幅值应当与相应振幅值的正负符号相同。若相应振幅值原本为正值,则将相应振幅值重置为加权和;若相应振幅值原本为负值,则将相应振幅值重置为加权和的相反值。
上述步骤604至步骤608,将相应振幅值未超过有效振幅值范围的部分和超过有效振幅值范围的部分分别进行不同压缩比例的压缩,使得压缩后相应振幅值属于有效振幅值范围之内。其中超过有效振幅值范围的部分的压缩比例大于未超过有效振幅值范围的部分的压缩比例。
通过高通滤波和低通滤波,可将过高的振幅值和过低的振幅值切掉,但不能对所有超过有效振幅值范围都进行一刀切的处理,否则会导致音频失真。本实施例中,当相应振幅值超过有效振幅值范围时,将相应振幅值压限到有效振幅值范围之内,可以尽可能准确地保留相应振幅值原本的振幅值大小特性,尽量避免音频失真。
在一个实施例中,步骤604具体包括:获取大于1的权重参数K;按照以1-1/K为首项且以1/K为公比的等比数列依次为分段值序列中的各个分段值分配权重。
其中,权重参数K是一个用来控制权重分配策略的控制参数,通过调整K的大小,可以控制分段值序列中各个分段值的权重的分配比例。K大于1,因此1-1/K大于0,1/K大于0,构成的等比数列中均为正值。
对上述等比数列求和可采用以下公式(4):
Sn=(1-1/K)*(1-1/Kn)(1-1/K)=1-1/Kn 公式(4)
根据公式(4),Sn=1-1/Kn的极限为1,就是说该等比数列的和小于1,按照该等比数列依次为分段值序列中的各个分段值分配权重,可以保证权重的和小于1,可快速地为分段值序列中的各个分段值分配合适的权重,非常高效。
在一个实施例中,按照以1-1/K为首项且以1/K为公比的等比数列依次为分段值序列中的各个分段值分配权重,具体可以从等比数列的任意位置起(比如从首项起),连续或者间隔地取等比数列中的值以为分段值序列中的各个分段值分配权重,分配的权重必然满足依次递减且权重的和小于等于1的条件。
如图7所示,在一个实施例中,提供了一种环绕立体声实现装置700,包括第一获取模块701、第二获取模块702、振幅值调整模块703和输出模块704。
第一获取模块701,用于获取第一声道音频数据。
具体地,第一获取模块701可用于从电子设备本地获取第一声道音频数据,还可以用于从网络上的音频数据源获取第一声道音频数据。
第二获取模块702,用于获取相较于第一声道音频数据具有固定延时的第二声道音频数据。
获取的第二声道音频数据比第一声道音频数据延迟了固定延时,该固定延时为ITD,固定延时用于拓宽声场,具体用于通过分裂声像来拓宽声场。声像是人的感知声源,固定延时用于分裂声像,是指若将该第一声道音频数据和具有固定延时的第二声道音频数据分别转换为声波输出到人两耳,人会感知到自己头部存在两个声音内容相同或相似但位置不同的声源。
振幅值调整模块703,用于调整第一声道音频数据和/或第二声道音频数据的振幅值,以使第一声道音频数据的振幅值小于第二声道音频数据的振幅值。
具体地,振幅值调整模块703可用于调整第一声道音频数据的振幅值,或者调整第二声道音频数据的振幅值,或者同时调整第一声道音频数据的振幅值和第二声道音频数据的振幅值。这里的振幅值是指时域振幅值。经过调整后,第一声道音频数据的振幅值小于相应的第二声道音频数据的振幅值。
输出模块704,用于分别通过不同的发声单元输出第一声道音频数据和第二声道音频数据。
具体地,输出模块704可永不将第一声道音频数据转化为模拟信号后通过第一发声单元输出声波,将第二声道音频数据转化为模拟信号后通过第二发声单元发出声波。
上述环绕立体声实现装置700,第二声道音频数据相较于第一声道音频数据具有固定延时,通过该固定延时可分裂声像,使得人耳所感知的声源多余一个,拓宽了声场。而且,固定延时会产生偏音现象,通过调整第一声道音频数据和/或第二声道音频数据的振幅值,使得第一声道音频数据的振幅值小于第二声道音频数据的振幅值。这样延时的第二声道音频数据的振幅值相较于未延时的第一声道音频数据的振幅值得以增强,延时造成的偏音通过振幅值的变化来弥补,在实现环绕立体声的同时避免偏音现象。不需要通过仿真人头录音方式,普通音频数据通过计算机程序处理便可以实现,具有较强的普适性。
在一个实施例中,第二获取模块702还用于获取与第一声道音频数据时间同步的第二声道音频数据,在时间同步的第二声道音频数据中插入一帧音频数据。
具体地,第二获取模块702可用于直接从音频数据源中获取与第一声道音频数据时间同步的第二声道音频数据。若音频数据源本身没有声道的区分,则可以第一获取模块701和第二获取模块702可分别从音频数据源获取两路相同的音频数据,以分别作为时间同步的第一声道音频数据和第二声道音频数据。
一帧音频数据的时间长度一般在固定延时可取的15ms到50ms之间,比如MP3音频格式中一帧音频数据为26ms,这样通过在第二音频数据中插入一帧音频数据可以快速地实现声像分裂,而且不会对原本的音频数据造成太大影响,高效而且准确。此时固定延时为一帧音频数据的时间长度。
插入的音频数据可根据插入点处的前一帧音频数据和后一帧音频数据生成,使得前一帧音频数据平滑过渡到插入的一帧音频数据,并且插入的一帧音频数据平滑过渡到后一帧音频数据。插入的音频数据可根据插入点处的前一帧音频数据和后一帧音频数据生成,具体可根据前一帧音频数据的最后一个采样点值和后一帧音频数据中第一个采样点值生成。这样可防止因插入一帧音频数据而产生噪声。
在一个实施例中,第二获取模块702还用于获取与第一声道音频数据时间同步的第二声道音频数据,第一获取模块701还用于在第一声道音频数据中删除一帧音频数据。
一帧音频数据的时间长度一般在固定延时可取的15ms到50ms之间,比如MP3音频格式中一帧音频数据为26ms,这样通过在第一声道音频数据中删除一帧音频数据可以快速地实现声像分裂,而且不会对原本的音频数据造成太大影响,高效而且准确。
其中,删除一帧音频数据后,删除的一帧音频数据的前一帧音频数据和后一帧音频数据平滑过渡。具体在删除一帧音频数据时,删除的音频数据的第一个采样点值和最后一个采样点值相等或者相差满足最小化条件;或者,也可以将删除的一帧音频数据的前一帧音频数据和后一帧音频数据进行处理,使得前一帧音频数据和后一帧音频数据平滑过渡。这样可防止因删除一帧音频数据而产生噪声。
如图8所示,在一个实施例中,振幅值调整模块703包括:第一声道振幅值调整模块703a和第二声道振幅值调整模块703b。
第一声道振幅值调整模块703a,用于将第一声道音频数据附加第一声道中置增益值,第一声道中置增益值为第一声道音频数据与第二声道音频数据的和再乘以第一中置系数。
第二声道振幅值调整模块703b,用于将第二声道音频数据附加第二声道中置增益值,第二声道中置增益值为第一声道音频数据与第二声道音频数据的和再乘以第二中置系数;第一中置系数小于第二中置系数。
经过声像分裂的处理后,声像被分裂为两个:原始声像和后声像,同时声场被拉至两耳,头部中剩下较少声场。通过加权增强处理后,两耳处的声像声场会向四周扩散,因而增加了头部中的声场分布;同时,在计算时给予非延迟声道较小的n值,可以减弱偏音效果。
如图9所示,在一个实施例中,环绕立体声实现装置700还包括高通滤波模块705和低通滤波模块706。高通滤波模块705用于对第一声道音频数据和第二声道音频数据进行高通滤波,低通滤波模块706用于对第一声道音频数据和第二声道音频数据进行低通滤波。
本实施例中,根据人耳听觉特性,音频中极低频率部分和极高频率部分不会对声音感知造成影响,这里对两个声道的音频数据进行高低切处理,减少高频音和低频音对有限振幅值的影响,并且不影响原有的音频音质。
如图10所示,在一个实施例中,环绕立体声实现装置700还包括:分段模块707、权重获取模块708和振幅值赋值模块709。
分段模块707,用于当第一声道音频数据或者第二声道音频数据的相应振幅值超过有效振幅值范围时,将相应振幅值按照有效振幅值范围的最大有效振幅值,获得分段值序列。
权重获取模块708,用于获取分段值序列中各个分段值的权重,获取的权重的值依次递减且获取的权重的和小于等于1。
振幅值赋值模块709,用于根据获取的权重计算分段值序列的加权和;根据加权和重置相应振幅值。
上述权重获取模块708和振幅值赋值模块709可以包括于振幅值压限模块(图中未示出),用于将相应振幅值未超过有效振幅值范围的部分和超过有效振幅值范围的部分分别进行不同压缩比例的压缩,使得压缩后相应振幅值属于有效振幅值范围之内。其中超过有效振幅值范围的部分的压缩比例大于未超过有效振幅值范围的部分的压缩比例
通过高通滤波和低通滤波,可将过高的振幅值和过低的振幅值切掉,但不能对所有超过有效振幅值范围都进行一刀切的处理,否则会导致音频失真。本实施例中,当相应振幅值超过有效振幅值范围时,将相应振幅值压限到有效振幅值范围之内,可以尽可能准确地保留相应振幅值原本的振幅值大小特性,尽量避免音频失真。
在一个实施例中,权重获取模块708还用于获取大于1的权重参数K;按照以1-1/K为首项且以1/K为公比的等比数列依次为分段值序列中的各个分段值分配权重。
其中,权重参数K是一个用来控制权重分配策略的控制参数,通过调整K的大小,可以控制分段值序列中各个分段值的权重的分配比例。K大于1,因此1-1/K大于0,1/K大于0,构成的等比数列中均为正值。
根据公式(4),等比数列的和Sn=1-1/Kn的极限为1,就是说该等比数列的和小于1,按照该等比数列依次为分段值序列中的各个分段值分配权重,可以保证权重的和小于1,可快速地为分段值序列中的各个分段值分配合适的权重,非常高效。
在一个实施例中,权重获取模块708按照以1-1/K为首项且以1/K为公比的等比数列依次为分段值序列中的各个分段值分配权重,具体可以从等比数列的任意位置起,连续或者间隔地取等比数列中的值以为分段值序列中的各个分段值分配权重,分配的权重必然满足依次递减且权重的和小于等于1的条件。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种环绕立体声实现方法,所述方法包括:
获取第一声道音频数据;
获取相较于所述第一声道音频数据具有固定延时的第二声道音频数据;
调整所述第一声道音频数据和/或所述第二声道音频数据的振幅值,以使所述第一声道音频数据的振幅值小于所述第二声道音频数据的振幅值;以及
分别通过不同的发声单元输出所述第一声道音频数据和所述第二声道音频数据。
2.根据权利要求1所述的方法,其特征在于,所述获取相较于所述第一声道音频数据具有固定延时的第二声道音频数据,包括:
获取与所述第一声道音频数据时间同步的第二声道音频数据,在时间同步的第二声道音频数据中插入一帧音频数据;或者,
获取与所述第一声道音频数据时间同步的第二声道音频数据,在所述第一声道音频数据中删除一帧音频数据。
3.根据权利要求1所述的方法,其特征在于,所述调整所述第一声道音频数据和/或所述第二声道音频数据的振幅值,以使所述第一声道音频数据的振幅值小于所述第二声道音频数据的振幅值,包括:
将所述第一声道音频数据附加第一声道中置增益值,所述第一声道中置增益值为所述第一声道音频数据与所述第二声道音频数据的和再乘以第一中置系数;
将所述第二声道音频数据附加第二声道中置增益值,所述第二声道中置增益值为所述第一声道音频数据与所述第二声道音频数据的和再乘以第二中置系数;所述第一中置系数小于所述第二中置系数。
4.根据权利要求1所述的方法,其特征在于,所述调整所述第一声道音频数据和/或所述第二声道音频数据的振幅值,以使所述第一声道音频数据的振幅值小于所述第二声道音频数据的振幅值之后,还包括:
当所述第一声道音频数据或者所述第二声道音频数据的相应振幅值超过有效振幅值范围时,则
将所述相应振幅值按照所述有效振幅值范围的最大有效振幅值,获得分段值序列;
获取所述分段值序列中各个分段值的权重,获取的权重的值依次递减且获取的权重的和小于等于1;
根据获取的权重计算所述分段值序列的加权和;
根据所述加权和重置所述相应振幅值。
5.根据权利要求4所述的方法,其特征在于,所述获取所述分段值序列中各个分段值的权重,包括:
获取大于1的权重参数K;
按照以1-1/K为首项且以1/K为公比的等比数列依次为所述分段值序列中的各个分段值分配权重。
6.一种环绕立体声实现装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一声道音频数据;
第二获取模块,用于获取相较于所述第一声道音频数据具有固定延时的第二声道音频数据;
振幅值调整模块,用于调整所述第一声道音频数据和/或所述第二声道音频数据的振幅值,以使所述第一声道音频数据的振幅值小于所述第二声道音频数据的振幅值;
输出模块,用于分别通过不同的发声单元输出所述第一声道音频数据和所述第二声道音频数据。
7.根据权利要求6所述的装置,其特征在于,所述第二获取模块还用于获取与所述第一声道音频数据时间同步的第二声道音频数据,在时间同步的第二声道音频数据中插入一帧音频数据;或者,
所述第二获取模块还用于获取与所述第一声道音频数据时间同步的第二声道音频数据,所述第一获取模块还用于在所述第一声道音频数据中删除一帧音频数据。
8.根据权利要求6所述的装置,其特征在于,所述振幅值调整模块包括:
第一声道振幅值调整模块,用于将所述第一声道音频数据附加第一声道中置增益值,所述第一声道中置增益值为所述第一声道音频数据与所述第二声道音频数据的和再乘以第一中置系数;
第二声道振幅值调整模块,用于将所述第二声道音频数据附加第二声道中置增益值,所述第二声道中置增益值为所述第一声道音频数据与所述第二声道音频数据的和再乘以第二中置系数;所述第一中置系数小于所述第二中置系数。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
分段模块,用于当所述第一声道音频数据或者所述第二声道音频数据的相应振幅值超过有效振幅值范围时,将所述相应振幅值按照所述有效振幅值范围的最大有效振幅值,获得分段值序列;
权重获取模块,用于获取所述分段值序列中各个分段值的权重,获取的权重的值依次递减且获取的权重的和小于等于1;
振幅值赋值模块,用于根据获取的权重计算所述分段值序列的加权和;根据所述加权和重置所述相应振幅值。
10.根据权利要求9所述的装置,其特征在于,所述权重获取模块还用于获取大于1的权重参数K;按照以1-1/K为首项且以1/K为公比的等比数列依次为所述分段值序列中的各个分段值分配权重。
CN201610025695.8A 2016-01-14 2016-01-14 环绕立体声实现方法和装置 Active CN106973355B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610025695.8A CN106973355B (zh) 2016-01-14 2016-01-14 环绕立体声实现方法和装置
PCT/CN2016/113113 WO2017121245A1 (zh) 2016-01-14 2016-12-29 环绕立体声实现方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610025695.8A CN106973355B (zh) 2016-01-14 2016-01-14 环绕立体声实现方法和装置

Publications (2)

Publication Number Publication Date
CN106973355A true CN106973355A (zh) 2017-07-21
CN106973355B CN106973355B (zh) 2019-07-02

Family

ID=59310755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610025695.8A Active CN106973355B (zh) 2016-01-14 2016-01-14 环绕立体声实现方法和装置

Country Status (2)

Country Link
CN (1) CN106973355B (zh)
WO (1) WO2017121245A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032038A (zh) * 2018-09-04 2018-12-18 南宁学院 一种基于强化学习的污水处理控制系统
CN113514148A (zh) * 2021-07-09 2021-10-19 西安因联信息科技有限公司 基于低延迟数据平滑的设备振动预警方法及系统
WO2021212287A1 (zh) * 2020-04-20 2021-10-28 深圳市大疆创新科技有限公司 音频信号处理方法、音频处理装置及录音设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101155440A (zh) * 2007-09-17 2008-04-02 昊迪移通(北京)技术有限公司 针对双声道音频信号的三维环绕音效技术
CN100586231C (zh) * 2006-09-22 2010-01-27 索尼株式会社 声音再现系统和声音再现方法
CN1961511B (zh) * 2004-06-02 2010-06-09 松下电器产业株式会社 声音数据接收装置及声音数据接收方法
CN101924317A (zh) * 2009-06-12 2010-12-22 扬智科技股份有限公司 双声道处理装置及其方法与声音播放系统
CN102160113A (zh) * 2008-08-11 2011-08-17 诺基亚公司 多声道音频编码器和解码器
CN101257740B (zh) * 2007-03-02 2012-02-08 三星电子株式会社 在多声道扬声器系统中再现多声道音频信号的方法和设备
CN103796150A (zh) * 2012-10-30 2014-05-14 华为技术有限公司 音频信号的处理方法、装置及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102157150B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声解码方法及装置
CN104967965B (zh) * 2015-06-29 2017-06-30 北京芝视界科技有限公司 一种音频播放控制方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1961511B (zh) * 2004-06-02 2010-06-09 松下电器产业株式会社 声音数据接收装置及声音数据接收方法
CN100586231C (zh) * 2006-09-22 2010-01-27 索尼株式会社 声音再现系统和声音再现方法
CN101257740B (zh) * 2007-03-02 2012-02-08 三星电子株式会社 在多声道扬声器系统中再现多声道音频信号的方法和设备
CN101155440A (zh) * 2007-09-17 2008-04-02 昊迪移通(北京)技术有限公司 针对双声道音频信号的三维环绕音效技术
CN102160113A (zh) * 2008-08-11 2011-08-17 诺基亚公司 多声道音频编码器和解码器
CN101924317A (zh) * 2009-06-12 2010-12-22 扬智科技股份有限公司 双声道处理装置及其方法与声音播放系统
CN103796150A (zh) * 2012-10-30 2014-05-14 华为技术有限公司 音频信号的处理方法、装置及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032038A (zh) * 2018-09-04 2018-12-18 南宁学院 一种基于强化学习的污水处理控制系统
WO2021212287A1 (zh) * 2020-04-20 2021-10-28 深圳市大疆创新科技有限公司 音频信号处理方法、音频处理装置及录音设备
CN113875265A (zh) * 2020-04-20 2021-12-31 深圳市大疆创新科技有限公司 音频信号处理方法、音频处理装置及录音设备
CN113514148A (zh) * 2021-07-09 2021-10-19 西安因联信息科技有限公司 基于低延迟数据平滑的设备振动预警方法及系统
CN113514148B (zh) * 2021-07-09 2023-06-27 西安因联信息科技有限公司 基于低延迟数据平滑的设备振动预警方法及系统

Also Published As

Publication number Publication date
CN106973355B (zh) 2019-07-02
WO2017121245A1 (zh) 2017-07-20

Similar Documents

Publication Publication Date Title
JP4921470B2 (ja) 頭部伝達関数を表すパラメータを生成及び処理する方法及び装置
JP5499513B2 (ja) 音響処理装置、音像定位処理方法および音像定位処理プログラム
CN102972047B (zh) 用于再现立体声的方法和设备
EP1635611B1 (en) Audio signal processing apparatus and method
US5946400A (en) Three-dimensional sound processing system
EP3613219B1 (en) Stereo virtual bass enhancement
JP2005500768A (ja) スピーカ周波数特性補償ツール
CN111970627B (zh) 音频信号的增强方法、装置、存储介质和处理器
US11221820B2 (en) System and method for processing audio between multiple audio spaces
CN1929698B (zh) 声音再现设备和增强低频分量的方法
CN106973355A (zh) 环绕立体声实现方法和装置
KR20220076518A (ko) 스펙트럼적 직교 오디오 성분 처리
CN114299976A (zh) 音频数据处理方法及电子设备
US10313820B2 (en) Sub-band spatial audio enhancement
CN109923877B (zh) 对立体声音频信号进行加权的装置和方法
CN113645531A (zh) 一种耳机虚拟空间声回放方法、装置、存储介质及耳机
JP2755081B2 (ja) 音像定位制御方法
CN115346544A (zh) 音频信号处理方法、装置、存储介质和程序产品
WO2021214380A1 (en) Apparatus, methods and computer programs for enabling rendering of spatial audio signals
CN113194400B (zh) 音频信号的处理方法、装置、设备及存储介质
JP7332745B2 (ja) 音声処理方法及び音声処理装置
CN118301535A (zh) 音频上混算法处理方法、装置、电子设备和存储介质
KR20030022332A (ko) 스테레오 시스템을 위한 좌측 조절된 및 우측 조절된오디오 신호를 발생시키는 방법
JP2008048372A (ja) 音響信号の明瞭度、弁別性能向上技術
EP4264962A1 (en) Stereo headphone psychoacoustic sound localization system and method for reconstructing stereo psychoacoustic sound signals using same

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant