CN103854650A - 立体声音频编码的方法及装置 - Google Patents

立体声音频编码的方法及装置 Download PDF

Info

Publication number
CN103854650A
CN103854650A CN201210504521.1A CN201210504521A CN103854650A CN 103854650 A CN103854650 A CN 103854650A CN 201210504521 A CN201210504521 A CN 201210504521A CN 103854650 A CN103854650 A CN 103854650A
Authority
CN
China
Prior art keywords
channel
frequency signal
signal
characteristic
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210504521.1A
Other languages
English (en)
Inventor
王杨忠
白雪
袁浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201210504521.1A priority Critical patent/CN103854650A/zh
Publication of CN103854650A publication Critical patent/CN103854650A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

本发明公开了一种立体声音频编码的方法及装置,其中,该方法包括:获取立体声信号;根据上述立体声信号的相关性特征选择立体声压缩编码的输入信号;对上述输入信号进行编码。通过本发明,采用根据立体声信号的相关性特征选择立体声压缩编码的输入信号,对选择的输入信号进行编码,提高了立体声压缩编码的效率。

Description

立体声音频编码的方法及装置
技术领域
本发明涉及通信领域,具体而言,涉及一种立体声音频编码的方法及装置。
背景技术
近年来,随着通讯网络的宽带化,人们越来越需要具有亲临其境的现场感的通信语音,以及高质量的音乐。为了对应该需求,基于立体声的编码技术逐步应用于通讯系统中。
和差立体声编码(Mid-Side Coding)是对立体声进行编码的常用技术,该技术不是直接编码立体声的左右声道信号,而是先将左右声道信号变换成和差声道信号再进行编码,这样如果左右声道相关性很强,则可以非常有效地去除左右声道信号间的冗余以提高编码效率。
然而,即使左右声道信号的主分量(主要频率成分)相同,在声源激励位置不同的情况下,相同时刻的左右声道信号间相关性也较低。此时如果也简单地采用和差立体声编码,在声源激励位置差异很大的情况下,和差立体声编码方式反而会降低编码的效率。
针对相关技术中立体声压缩编码的效率低的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中立体声压缩编码效率低的问题,本发明提供了一种立体声音频编码的方法及装置,以至少解决上述问题。
根据本发明的一个方面,提供了一种立体声音频编码的方法,包括:获取立体声信号;根据所述立体声信号的相关性特征选择立体声压缩编码的输入信号;对所述输入信号进行编码。
优选地,根据所述立体声信号的相关性特征选择所述立体声压缩编码的输入信号,包括:将所述立体声信号划分为高频信号和低频信号,其中,所述高频信号的频率大于等于第一预设值,所述低频信号的频率小于所述第一预设值;选择所述低频信号的和声道信号与差声道信号作为所述输入信号的低频部分;根据所述高频信号的相关性特征选择所述输入信号的高频部分;利用所述低频部分和所述高频部分合成所述输入信号。
优选地,根据所述高频信号的相关性特征选择所述输入信号的高频部分,包括:确定所述高频信号的相关性特征,其中,所述相关性特征包括两个或两个以上的特征参数;根据所述高频信号的相关性特征,判断并选择所述输入信号的所述高频部分;如果所述特征参数满足预设条件,选择高频信号的左声道和右声道作为所述输入信号的高频部分;如果所述特征参数不满足所述预设条件,选择高频信号的和声道与差声道作为所述输入信号的高频部分。
优选地,确定所述高频信号的所述相关性特征,包括:确定所述高频信号的左声道和右声道的互相关系数以及第一特征,其中,所述第一特征为所述高频信号的左声道和右声道的能量中的最大值,与所述高频信号的左声道和右声道的能量中的最小值的比值;根据所述高频信号的相关性特征选择所述输入信号的高频部分,包括:如果所述互相关系数小于第二预设值且所述第一特征大于第三预设值,则选择所述高频信号的左声道和右声道作为所述输入信号的高频部分;否则,选择所述高频信号的和声道与差声道作为所述输入信号的高频部分。
优选地,确定所述高频信号的所述相关性特征,还包括:确定所述高频信号的左声道和右声道的互相关系数、第一特征以及第二特征,其中,所述第一特征为所述高频信号的左声道和右声道的能量中的最大值,与所述高频信号的左声道和右声道的能量中的最小值的比值;所述第二特征为所述高频信号的左声道信号与右声道信号的能量中的最小值,与所述高频信号的和声道信号和差声道信号的能量中的最小值的比值;根据所述高频信号的相关性特征选择所述输入信号的高频部分,包括:如果所述互相关系数小于第二预设值且所述第一特征大于第三预设值,或者所述第二特征小于第四预设值,选择所述高频信号的左声道和右声道作为所述输入信号的高频部分;否则,选择所述高频信号的和声道与差声道作为所述输入信号的高频部分。
根据本发明的另一个方面,提供了一种立体声音频编码的装置,包括:获取模块,用于获取立体声信号;选择模块,用于根据所述立体声信号的相关性特征选择立体声压缩编码的输入信号;编码模块,用于对所述输入信号进行编码。
优选地,所述选择模块包括:划分单元,用于将所述立体声信号划分为高频信号和低频信号,其中,所述高频信号的频率大于等于第一预设值,所述低频信号的频率小于所述第一预设值;低频输出单元,用于输出所述低频信号的和声道信号与差声道信号作为所述输入信号的低频部分;高频输出单元,用于根据所述高频信号的相关性特征选择并输出所述输入信号的高频部分;数据合成单元,用于利用所述输入信号的低频部分和高频部分,合成所述输入信号。
优选地,所述高频输出单元包括:特征计算单元,用于确定所述高频信号的所述相关性特征,其中,所述相关性特征包括两个或两个以上的特征参数;判断单元,根据所述高频信号的相关性特征,判断并选择所述输入信号的所述高频部分;第一输出单元,用于在所述特征参数满足预设条件的情况下,输出所述高频信号的左声道和右声道作为所述输入信号的高频部分;第二输出单元,用于在所述特征参数不满足所述预设条件的情况下,输出所述高频信号的和声道与差声道作为所述输入信号的高频部分。
优选地,所述特征计算单元,用于确定所述高频信号的左声道和右声道的互相关系数以及第一特征,其中,所述第一特征为所述高频信号的左声道和右声道的能量中的最大值,与所述高频信号的左声道和右声道的能量中的最小值的比值;所述判断单元,用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值的情况下,选择所述第一输出单元;否则,选择所述第二输出单元。
优选地,所述特征计算单元,还用于确定所述高频信号的左声道和右声道的互相关系数、第一特征以及第二特征,其中,所述第一特征为所述高频信号的左声道和右声道的能量中的最大值,与所述高频信号的左声道和右声道的能量中的最小值的比值;所述第二特征为所述高频信号的左声道和右声道的能量中的最小值,与所述高频信号的和声道与差声道的能量中的最小值的比值;所述判断单元,还用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值,或者所述第二特征小于第四预设值的情况下,选择所述第一输出单元;否则,选择所述第二输出单元。
通过本发明,采用获取立体声信号,根据立体声信号的相关性特征选择立体声压缩编码的输入信号,对选择的输入信号进行编码的技术方案,解决了相关技术中立体声压缩编码的效率低的问题,进而达到了提高立体声压缩编码效率的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的立体声音频编码装置的结构框图;
图2是根据本发明实施例优选的选择模块的结构框图;
图3是根据本发明实施例优选的高频输出单元的结构框图;
图4是根据本发明实施例的立体声音频编码方法的流程图;
图5是根据本发明实施例实施方式一输入信号确定方法的流程图;以及
图6是根据本发明实施例实施方式二输入信号确定方法的流程图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
根据本发明实施例,提供了一种可根据立体声的左右声道信号间的相关性特征来动态判决和选择更合适于立体声压缩编码的输入数据的装置及其方法,在立体声左右两个声道相关性较低的情况下,通过选择冗余性少的线性变换的信号,提高立体声压缩编码效率,获得高质量的立体声音质。
在本发明实施例中,以立体声信号的采样率是48kHz,编码码率是64kbps,编码帧长为20ms为例,分别对本发明实施例的装置和方法进行描述。
图1是根据本发明实施例的立体声音频编码的装置的结构框图。如图1所示,该装置主要包括:获取模块10、选择模块20和编码模块30。
获取模块10,用于获取立体声信号;
选择模块20,与获取模块10相连接,用于根据立体声信号的相关性特征选择立体声压缩编码的输入信号;
编码模块30,与选择模块20相连接,用于对选择的输入信号进行编码。
通过本发明实施例,根据立体声信号的相关性特征动态选择立体声压缩编码的输入信号,提高了立体声信号压缩编码的效率。
图2是根据本发明实施例优选的选择模块的结构框图。如图2所示,选择模块20主要包括:
划分单元202,用于将立体声信号划分为高频信号和低频信号,其中,高频信号的频率大于等于第一预设值,低频信号的频率小于第一预设值。优选地,本实施例中的高低频划分界限是2kHz,即第一预设值取值为2kHz。在实际应用中,还可以将所述输入信号的高频频段进行扩展到全频带,即第一预设值取零值的情况。此时,全频带的信号均根据所述相关性特征来选择所述输入信号。
在本发明实施例中,以改进离散余弦变换(Modified Discrete Cosine Transform,简称为MDCT)域的划分为例进行说明,每个声道信号按照统一规则划分为低频和高频两个频带,分别将左声道频域信号表示为XL,右声道频域信号表示为XR,高频信号的左声道表示为
Figure BDA00002501908500041
低频信号的左声道表示为
Figure BDA00002501908500042
高频信号的右声道表示为
Figure BDA00002501908500043
低频信号的右声道表示为
Figure BDA00002501908500044
其中, X L = X l L X h L , X R = X l R X h R .
进一步地对 X l L , X h L , X l R , X h R 的定义如下: X l L = { X li L | 0 < i &le; 80 } , X l R = { X li R | 0 < i &le; 80 } ; X h L = { X hi L | 80 < i &le; 960 } , X h R = { X hi R | 80 < i &le; 960 } , 其中,下标i表示MDCT系数的序号。
进一步地定义和声道信号XM=XL+XR,差声道信号XS=XL-XR
优选地,和差声道也按照划分单元202进行频带划分,划分为高频信号的和声道
Figure BDA000025019085000412
与低频信号的和声道
Figure BDA000025019085000413
高频信号的差声道
Figure BDA000025019085000414
与低频信号的差声道
Figure BDA000025019085000415
X M = X l M X h M , X S = X l S X h S .
低频输出单元204,与划分单元202相连接,用于输出低频信号的和声道与低频信号的差声道作为输入信号的低频部分;
高频输出单元206,与划分单元202相连接,用于根据高频信号的相关性特征选择并输出输入信号的高频部分。
数据合成单元208,与低频输出单元204和高频输出单元206相连接,用于利用所述输入信号的低频部分和高频部分,合成所述输入信号。
图3是根据本发明实施例优选的高频输出单元的结构框图,如图3所示,高频输出单元206可以包括:
特征计算单元2062,用于确定所述高频信号的所述相关性特征,其中,所述相关性特征包括两个或两个以上的特征参数;
判断单元2064,与特征计算单元2062相连接,用于根据所述高频信号的相关性特征,判断并选择输入信号的高频部分;
第一输出单元2066,与判断单元2064相连接,用于在所述特征参数满足预设条件的情况下,输出所述高频信号的左声道和右声道作为所述输入信号的高频部分;
第二输出单元2068,与判断单元2064相连接,用于在所述特征参数不满足所述预设条件的情况下,输出所述高频信号的和声道与差声道作为所述输入信号的高频部分。
通过本优选实施方式,对于相关性大的立体声信号,选择高频信号的和声道与高频信号的差声道作为立体声压缩编码的输入信号的高频部分,可以降低输入信号的冗余性,对于相关性小的立体声信号,选择高频信号的左声道和高频信号的右声道作为立体声压缩编码的输入信号的高频部分,避免了采用和差编码时编码效率低的问题。
下面对根据不同特征参数确定相关性来选择输入信号的实施方式进行描述。
方式一
在本发明实施例实施方式一中,特征计算单元2062,用于确定高频信号的左声道和右声道的互相关系数以及第一特征,其中,第一特征为高频信号的左声道和右声道的能量比值,在本发明实施例中可以是能量的最大值与最小值的比值;判断单元2064,用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值的情况下,选择第一输出单元2066;否则,选择第二输出单元2068。
在本发明实施例实施方式一中,优选地,第二预设值取0.7,第三预设值取0.9。
优选地,特征计算单元2062可以按照以下方式确定高频信号的左声道的能量和高频信号的右声道的能量:
高频信号的左声道的能量
Figure BDA00002501908500051
高频信号的右声道的能量
Figure BDA00002501908500052
其中,i为MDCT系数的序号;
并按照以下方式确定上述互相关系数:互相关系数
Figure BDA00002501908500053
同时,可以得到第一特征为 ratio 1 = max ( P h L , P h R ) min ( P h L , P h R ) .
方式二
在本发明实施例实施方式二中,特征计算单元2062,用于确定高频信号的左声道和右声道的互相关系数、第一特征以及第二特征,其中,第二特征为高频信号的左声道和右声道的能量中的最小值与和声道信号与差声道信号的能量中的最小值的比值;判断单元2064,还用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值,或者所述第二特征小于第四预设值的情况下,选择第一输出单元2066;否则,选择第二输出单元2068。
在本发明实施例实施方式二中,优选地,第二预设值取0.7,第三预设值取0.9,第四预设值取0.9。
在本发明实施例的中,特征计算单元2062可以按照以下方式确定高频信号的和声道的能量与高频信号的差声道的能量:
高频信号的和声道的能量高频信号的差声道的能量
Figure BDA00002501908500062
其中,i为MDCT系数的序号,
Figure BDA00002501908500063
为和声道序号为i的高频MDCT系数,
Figure BDA00002501908500064
为差声道序号为i的高频MDCT系数;
并按照以下方式确定第二特征:第二特征
Figure BDA00002501908500065
在本优选实施例中提供了一种处理器,该处理器配置成可执行存储在存储器中的程序单元,这些程序单元包括的模块可以为以上任意一个实施方式中所提到的模块。
根据本发明实施例,还提供了一种立体声音频编码的方法,可以在本发明实施例提供的上述装置中实现根据立体声信号的相关性特征对立体声输入信号动态选择,以提高立体声压缩编码的效率。
图4是根据本发明实施例的立体声音频编码的方法的流程图,如图4所示,该方法主要包括步骤S402至步骤S406。
步骤S402,获取立体声信号。
步骤S404,根据立体声信号的相关性特征选择立体声压缩编码的输入信号。
步骤S406,对选择的输入信号进行编码。
通过本发明实施例,采用根据立体声信号的相关性特征选择立体声压缩编码的输入信号,对选择的输入信号进行编码,提高了立体声压缩编码的效率。
在本发明实施例中,由于立体声信号中的低频部分信号相关性较大,因此,对于低频信号可以直接选择和声道信号与差声道信号作为立体声压缩编码的输入信号,对于立体声信号的高频部分,可以根据高频信号的相关性特征选择输入信号。下面对实现该过程的方法进行描述。
根据立体声信号的相关性特征选择立体声压缩编码的输入信号时,将立体声信号划分为高频信号和低频信号,其中,高频信号的频率大于等于第一预设值,低频信号的频率小于第一预设值;选择低频信号的和声道与低频信号的差声道作为输入信号的低频部分;根据高频信号的相关性特征选择输入信号的高频部分。优选地,本实施例中的高低频划分界限是2kHz,即第一预设值取值为2kHz。在实际应用中,还可以将所述输入信号的高频频段进行扩展到全频带,即第一预设值取零值的情况。此时,全频带的信号均根据所述相关性特征来选择所述输入信号。
在本发明实施例中,根据高频信号的相关性特征选择立体声压缩编码的输入信号,其中,相关性特征包括两个或两个以上的特征参数;如果特征参数满足预设条件,选择高频信号的左声道和右声道作为上述高频部分;如果特征参数不满足所述预设条件,选择高频信号的和声道与差声道作为上述高频部分。通过本优选实施方式,对于相关性大的高频信号,选择高频信号的和声道与差声道作为立体声压缩编码的高频部分,可以降低输入信号的冗余性,对于相关性小的立体声信号,选择高频信号的左声道和右声道作为立体声压缩编码的高频部分,避免了采用和差编码时编码效率低的问题。
下面对根据不同特征参数确定相关性和选择输入信号的实施方式进行描述。
方式一
在方式一中,可以利用高频信号的左声道和右声道的互相关系数以及第一特征来衡量高频信号的相关性,其中,第一特征即高频信号的左声道和右声道的能量的比值,左声道信号与右声道信号的能量相差越大,左声道信号与右声道信号的相关性越小。下面对该实施方式进行描述。
确定高频信号的左声道和右声道的互相关系数以及第一特征,其中,第一特征为高频信号的左声道和右声道的能量比值,在本发明实施例中为上述能量的最大值与最小值的比值;根据高频信号的相关性特征选择输入信号的高频部分,包括:根据互相关系数和第一特征选择输入信号的高频部分,其中,如果互相关系数小于第二预设值且第一特征大于第三预设值,则选择高频信号的左声道和右声道作为所述输入信号的高频部分;否则,则选择高频信号的和声道与差声道作为所述输入信号的高频部分。
在本发明实施例中,确定高频信号的左声道和右声道的互相关系数时,可以根据高频信号的左声道和右声道的能量来确定互相关系数。下面对具体的实施方式进行描述。
确定高频信号的左声道和右声道的互相关系数,包括:确定高频信号的左声道的能量和高频信号的右声道的能量;根据高频信号的左声道的能量和高频信号的右声道的能量确定互相关系数。
优选地,可以按照以下方式确定高频信号的左声道的能量和高频信号的右声道的能量:高频信号的左声道的能量
Figure BDA00002501908500071
高频信号的右声道的能量
Figure BDA00002501908500072
其中,i为MDCT系数的序号;并按照以下方式确定互相关系数:互相关系数 C h LR = | &Sigma; i X hi L &times; X hi R | P h L &times; P h R .
同时,可以得到第一特征为
Figure BDA00002501908500074
(以最大值与最小值的比值为例进行说明)。
图5是根据本发明实施例实施方式一的输入信号确定方法的流程图,如图5所示,该方法可以包括步骤S502至步骤S510。
步骤S502,输入相关特征数据;
步骤S504,判断是否 ratio 1 = max ( P h L , P h R ) min ( P h L , P h R ) 大于T1(第三预设值),且 C h LR = | &Sigma; i X hi L &times; X hi R | P h L &times; P h R 小于T2(第二预设值),如果是,进入步骤S506,否则,进入步骤S508;优选地,T1=0.7,T2=0.9;
步骤S506,选择高频信号的左声道和右声道作为所述输入信号的高频部分;
步骤S508,选择高频信号的和声道与差声道作为所述输入信号的高频部分;
步骤S510,输出选择的编码输入数据的高频信号。
方式二
在方式二中,可以利用高频信号的左声道和右声道的互相关系数,以及高频信号的左声道、高频信号的右声道以及高频信号的和声道与高频信号的差声道的相关性特征来衡量立体声信号的相关性。下面对该实施方式进行描述。
确定高频信号的左声道和右声道的互相关系数、第一特征以及第二特征,其中,第二特征为高频信号的左声道和右声道的能量中的最小值与高频信号的和声道与差声道的能量中的最小值的比值;并根据互相关系数、第一特征和第二特征选择输入信号的高频部分,其中,如果互相关系数小于第二预设值且第一特征大于第三预设值,或者第二特征小于第四预设值,选择高频信号的左声道和右声道作为所述输入信号的高频部分;否则,选择高频信号的和声道与差声道作为所述输入信号的高频部分。
在本发明实施例的一个实施方式中,确定第二特征,包括:确定高频信号的和声道与差声道;确定高频信号的和声道的能量和高频信号的差声道的能量;根据高频信号的和声道的能量和高频信号的差声道的能量确定第二特征。
优选地,可以按照以下方式确定立体声信号的和声道信号与差声道信号:和声道信号XM=XL+XR,差声道信号XS=XL-XR;并按照以下方式确定高频信号的和声道的能量和高频信号的差声道的能量:高频信号的和声道的能量
Figure BDA00002501908500083
高频信号的差声道的能量
Figure BDA00002501908500084
其中,i为MDCT系数的序号,
Figure BDA00002501908500085
为和声道序号为i的高频MDCT系数,
Figure BDA00002501908500086
为差声道序号为i的高频MDCT系数;按照以下方式确定第二特征:第二特征 ratio 2 = min ( P h L , P h R ) min ( P h S , P h M ) .
图6是根据本发明实施例实施方式二的输入信号确定方法的流程图,如图6所示,该方法可以包括步骤S602至步骤S612。
步骤S602:输入相关特征数据;
步骤S604:如果
Figure BDA00002501908500091
(第三预设值)且同时
Figure BDA00002501908500092
(第二预设置),执行步骤S608,否则执行步骤S606;优选地,T1=0.7,T2=0.9;
步骤S606:如果
Figure BDA00002501908500093
(第四预设值),执行步骤S608,否则执行步骤S610,优选地,T3=0.9;
步骤S608:选择高频信号的左声道和右声道作为所述输入信号的高频部分。
步骤S610:选择高频信号的和声道与差声道作为所述输入信号的高频部分。
步骤S612:输出选择的编码输入数据的高频信号。
本发明实施例提供的立体声编码的装置及方法可用于解决实时通信如无线、IP会议电视和实时广播业务的IPTV、移动流媒体、手机电视等领域的立体声压缩编码问题,以满足不同情况下的需求。
从以上的描述中可以看出,本发明实现了如下技术效果:采用根据立体声两个声道间相关性的强弱变化来动态选择立体声编码数据的方法,来提高基于和差立体声编码技术的编码音质。可以解决立体声左右两个声道在相关性较弱条件下的和差立体声编码噪声过大的问题,以及噪声在左右两个声道相互串扰的问题。同时,本发明还具有结构简单,复杂度低,延时小,能满足实时通信中低延时、低复杂度、稳定的需求。
显然,本领域的技术人员应该明白,本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种立体声音频编码的方法,其特征在于,包括:
获取立体声信号;
根据所述立体声信号的相关性特征选择立体声压缩编码的输入信号;
对所述输入信号进行编码。
2.根据权利要求1所述的方法,其特征在于,根据所述立体声信号的相关性特征选择所述立体声压缩编码的输入信号,包括:
将所述立体声信号划分为高频信号和低频信号,其中,所述高频信号的频率大于等于第一预设值,所述低频信号的频率小于所述第一预设值;
选择所述低频信号的和声道信号与差声道信号作为所述输入信号的低频部分;
根据所述高频信号的相关性特征选择所述输入信号的高频部分;
利用所述低频部分和所述高频部分合成所述输入信号。
3.根据权利要求2所述的方法,其特征在于,根据所述高频信号的相关性特征选择所述输入信号的高频部分,包括:
确定所述高频信号的相关性特征,其中,所述相关性特征包括两个或两个以上的特征参数;
根据所述高频信号的相关性特征,判断并选择所述输入信号的所述高频部分;
如果所述特征参数满足预设条件,选择高频信号的左声道和右声道作为所述输入信号的高频部分;
如果所述特征参数不满足所述预设条件,选择高频信号的和声道与差声道作为所述输入信号的高频部分。
4.根据权利要求3所述的方法,其特征在于,
确定所述高频信号的所述相关性特征,包括:确定所述高频信号的左声道和右声道的互相关系数以及第一特征,其中,所述第一特征为所述高频信号的左声道和右声道的能量中的最大值,与所述高频信号的左声道和右声道的能量中的最小值的比值;
根据所述高频信号的相关性特征选择所述输入信号的高频部分,包括:如果所述互相关系数小于第二预设值且所述第一特征大于第三预设值,则选择所述高频信号的左声道和右声道作为所述输入信号的高频部分;否则,选择所述高频信号的和声道与差声道作为所述输入信号的高频部分。
5.根据权利要求3所述的方法,其特征在于,
确定所述高频信号的所述相关性特征,还包括:确定所述高频信号的左声道和右声道的互相关系数、第一特征以及第二特征,其中,所述第一特征为所述高频信号的左声道和右声道的能量中的最大值,与所述高频信号的左声道和右声道的能量中的最小值的比值;所述第二特征为所述高频信号的左声道信号与右声道信号的能量中的最小值,与所述高频信号的和声道信号和差声道信号的能量中的最小值的比值;
根据所述高频信号的相关性特征选择所述输入信号的高频部分,包括:如果所述互相关系数小于第二预设值且所述第一特征大于第三预设值,或者所述第二特征小于第四预设值,选择所述高频信号的左声道和右声道作为所述输入信号的高频部分;否则,选择所述高频信号的和声道与差声道作为所述输入信号的高频部分。
6.一种立体声音频编码的装置,其特征在于,包括:
获取模块,用于获取立体声信号;
选择模块,用于根据所述立体声信号的相关性特征选择立体声压缩编码的输入信号;
编码模块,用于对所述输入信号进行编码。
7.根据权利要求6所述的装置,其特征在于,所述选择模块包括:
划分单元,用于将所述立体声信号划分为高频信号和低频信号,其中,所述高频信号的频率大于等于第一预设值,所述低频信号的频率小于所述第一预设值;
低频输出单元,用于输出所述低频信号的和声道信号与差声道信号作为所述输入信号的低频部分;
高频输出单元,用于根据所述高频信号的相关性特征选择并输出所述输入信号的高频部分;
数据合成单元,用于利用所述输入信号的低频部分和高频部分,合成所述输入信号。
8.根据权利要求7所述的装置,其特征在于,所述高频输出单元包括:
特征计算单元,用于确定所述高频信号的所述相关性特征,其中,所述相关性特征包括两个或两个以上的特征参数;
判断单元,根据所述高频信号的相关性特征,判断并选择所述输入信号的所述高频部分;
第一输出单元,用于在所述特征参数满足预设条件的情况下,输出所述高频信号的左声道和右声道作为所述输入信号的高频部分;
第二输出单元,用于在所述特征参数不满足所述预设条件的情况下,输出所述高频信号的和声道与差声道作为所述输入信号的高频部分。
9.根据权利要求8所述的装置,其特征在于,
所述特征计算单元,用于确定所述高频信号的左声道和右声道的互相关系数以及第一特征,其中,所述第一特征为所述高频信号的左声道和右声道的能量中的最大值,与所述高频信号的左声道和右声道的能量中的最小值的比值;
所述判断单元,用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值的情况下,选择所述第一输出单元;否则,选择所述第二输出单元。
10.根据权利要求8所述的装置,其特征在于,
所述特征计算单元,用于确定所述高频信号的左声道和右声道的互相关系数、第一特征以及第二特征,其中,所述第一特征为所述高频信号的左声道和右声道的能量中的最大值,与所述高频信号的左声道和右声道的能量中的最小值的比值;所述第二特征为所述高频信号的左声道和右声道的能量中的最小值,与所述高频信号的和声道与差声道的能量中的最小值的比值;
所述判断单元,还用于在所述互相关系数小于第二预设值且所述第一特征大于第三预设值,或者所述第二特征小于第四预设值的情况下,选择所述第一输出单元;否则,选择所述第二输出单元。
CN201210504521.1A 2012-11-30 2012-11-30 立体声音频编码的方法及装置 Pending CN103854650A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210504521.1A CN103854650A (zh) 2012-11-30 2012-11-30 立体声音频编码的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210504521.1A CN103854650A (zh) 2012-11-30 2012-11-30 立体声音频编码的方法及装置

Publications (1)

Publication Number Publication Date
CN103854650A true CN103854650A (zh) 2014-06-11

Family

ID=50862221

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210504521.1A Pending CN103854650A (zh) 2012-11-30 2012-11-30 立体声音频编码的方法及装置

Country Status (1)

Country Link
CN (1) CN103854650A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681664A (zh) * 2020-07-24 2020-09-18 北京百瑞互联技术有限公司 一种降低音频编码码率的方法、系统、存储介质及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276587A (zh) * 2007-03-27 2008-10-01 北京天籁传音数字技术有限公司 声音编码装置及其方法和声音解码装置及其方法
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
CN101572088A (zh) * 2008-04-30 2009-11-04 北京工业大学 立体声编解码方法、编解码器及编解码系统
US20100153119A1 (en) * 2006-12-08 2010-06-17 Electronics And Telecommunications Research Institute Apparatus and method for coding audio data based on input signal distribution characteristics of each channel
JP2013508743A (ja) * 2009-10-15 2013-03-07 フランス・テレコム 最適化された低スループットパラメトリック符号化/復号化

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100153119A1 (en) * 2006-12-08 2010-06-17 Electronics And Telecommunications Research Institute Apparatus and method for coding audio data based on input signal distribution characteristics of each channel
CN101276587A (zh) * 2007-03-27 2008-10-01 北京天籁传音数字技术有限公司 声音编码装置及其方法和声音解码装置及其方法
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
CN101572088A (zh) * 2008-04-30 2009-11-04 北京工业大学 立体声编解码方法、编解码器及编解码系统
JP2013508743A (ja) * 2009-10-15 2013-03-07 フランス・テレコム 最適化された低スループットパラメトリック符号化/復号化

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681664A (zh) * 2020-07-24 2020-09-18 北京百瑞互联技术有限公司 一种降低音频编码码率的方法、系统、存储介质及设备

Similar Documents

Publication Publication Date Title
US20200374644A1 (en) Audio signal processing method and apparatus
CN1647156B (zh) 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备
US8861739B2 (en) Apparatus and method for generating a multichannel signal
CN101253557B (zh) 立体声编码装置及立体声编码方法
CN102652337B (zh) 用于声通信的设备和方法
CN104285390B (zh) 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置
CN100559465C (zh) 保真度优化的可变帧长编码
CN103262159B (zh) 用于对多声道音频信号进行编码/解码的方法和装置
KR102126449B1 (ko) 잡음 감소를 위한 다채널 hoa 오디오 신호를 인코딩하는 방법 및 장치와, 잡음 감소를 위한 다채널 hoa 오디오 신호를 디코딩하는 방법 및 장치
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
CN1758337B (zh) 用于低比特率音频编码应用的高效可标度参数立体声编码
KR20220133311A (ko) DirAC 기반 공간 오디오 코딩과 관련된 인코딩, 디코딩, 장면 처리, 및 다른 절차를 위한 장치, 방법, 및 컴퓨터 프로그램
CN102138176B (zh) 信号分析装置、信号控制装置及其方法
CN101010725A (zh) 多信道信号编码装置以及多信道信号解码装置
CN101485094A (zh) 最大熵意义下的后向兼容多通道音频编码与解码方法和系统
CN102027535A (zh) 信号处理
CN103700372A (zh) 一种基于正交解相关技术的参数立体声编码、解码方法
KR20210102300A (ko) 낮은 차수, 중간 차수 및 높은 차수 컴포넌트 생성기를 사용하는 DirAC 기반 공간 오디오 코딩과 관련된 인코딩, 디코딩, 장면 처리 및 기타 절차를 위한 장치, 방법 및 컴퓨터 프로그램
CN102737635B (zh) 一种音频编码方法以及音频编码设备
CN114299967A (zh) 音频编解码方法和装置
KR20210005320A (ko) 고차 앰비소닉스 신호에 동적 범위 압축을 적용하는 방법 및 디바이스
RU2769789C2 (ru) Способ и устройство кодирования параметра межканальной разности фаз
CN1969318B (zh) 音频编码装置、解码装置以及方法
US9311925B2 (en) Method, apparatus and computer program for processing multi-channel signals
CN101981616A (zh) 立体声信号变换装置、立体声信号逆变换装置及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140611