CN101350197B - 立体声音频编/解码方法及编/解码器 - Google Patents

立体声音频编/解码方法及编/解码器 Download PDF

Info

Publication number
CN101350197B
CN101350197B CN2007101358339A CN200710135833A CN101350197B CN 101350197 B CN101350197 B CN 101350197B CN 2007101358339 A CN2007101358339 A CN 2007101358339A CN 200710135833 A CN200710135833 A CN 200710135833A CN 101350197 B CN101350197 B CN 101350197B
Authority
CN
China
Prior art keywords
vector
rotational transform
stereo audio
coding
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007101358339A
Other languages
English (en)
Other versions
CN101350197A (zh
Inventor
张树华
窦维蓓
张斌
侯欢
郭利斌
王庭红
肖玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Huawei Technologies Co Ltd
Original Assignee
Tsinghua University
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Huawei Technologies Co Ltd filed Critical Tsinghua University
Priority to CN2007101358339A priority Critical patent/CN101350197B/zh
Publication of CN101350197A publication Critical patent/CN101350197A/zh
Application granted granted Critical
Publication of CN101350197B publication Critical patent/CN101350197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种立体声音频编码方法,对左右声道的矢量语音信号进行旋转正交变换,提高两个矢量之间的相关度。本发明还提供相应的立体声音频解码方法以及立体声音频编/解码器。由于变换后的两个矢量具有较好的相关性,本发明使得后续的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传统方法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更低的码率。

Description

立体声音频编/解码方法及编/解码器
技术领域
本发明涉及音频处理技术领域,具体涉及数字立体声音频编/解码方法及编/解码器。
背景技术
立体声是指能使听者有声源在空间分布的感觉的声音信号。立体声音频在录制时通常被分配到两个独立的声道:左声道和右声道,在重放时人耳通过分辨来自左右声道的音频信号的强度差、延时等产生听觉的空间感。
通常立体声信号主要有两个来源:一是采用双麦克风或多麦克风自然录音,此时左右声道音频来自同一音频场景,除了由于麦克风摆位造成的时间差、强度差等不同,他们记录的音频信息基本一致;一是采用音频工作室人工混音,由于在大多数情况下力求营造具有真实感的音频场景,因此这种方式下左右声道间一般也具有较强的相关性。
在处理立体声音频信号时,一般先对左右声道进行模/数(A/D:Analog/Digital)采样得到数字立体声信号,本文中将左右声道的对应的数字信号表示为两个矢量语音信号:XL和XR,矢量的维数与采样数据点数相关;然后对XL和XR进行编码。如何在尽可能低的编码码率下获得尽可能好的重现音质是始终追求的目标之一。目前主要有两种立体声音频编码方法:
一、和差立体声(Sum-difference Stereo)
如图1所示,该方法将XL和XR在频域对应频率处进行相加和相减处理,分别得到和矢量信号XS与差矢量信号XD,然后分别对XS和XD进行量化编码。由图1可以看出,在较为理想的情况下,由于XL和XR差别不大,使得XD能量非0但明显小于XS。因此可对与XL和XR类似的XS以常规的码率进行编码,而对XD则以较小的码率进行编码。
二、强度立体声(Intensity Stereo)
为了使码率进一步下降,在强度立体声方法中引入心理声学以去除声道间的主观冗余。该方法中只编码一个声道的信号,例如XL或XR,以及另一个声道与之的能量比。在解码端重现出一个声道的信号,以及仅体现能量差异的另一个信号。
在对现有技术的研究和实践过程中,发明人发现实际的立体声信号由于受环境噪音,墙体、地面的多次反射、折射和吸收,以及多声源的影响,在很多时候并不接近图1所示的模型,而是表现为图2所示的情况,即差矢量信号XD的能量并不明显小于原始的矢量语音信号XL和XR。此时,现有和差立体声编码方法无法带来码率降低的效果,而强度立体声编码方法则会引入明显的失真。
发明内容
本发明提供一种能够有效提高编码增益的立体声音频编码方法以及相应的解码方法和编/解码器。
一种立体声音频编码方法,包括:获取分别属于左声道和右声道的两个对应的矢量语音信号;对所述两个矢量语音信号进行正交旋转变换,获得两个旋转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度;对所述旋转矢量信号进行编码;在编码结果中放入所述正交旋转变换的旋转角度的信息。
一种立体声音频解码方法,包括:获取立体声音频编码码流;从所述编码码流中获取旋转角度的信息;从所述编码码流中获取两个旋转矢量信号;按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,获得两个矢量语音信号。
一种立体声音频编码器,包括:信号分析单元,用于输出分别属于左声道和右声道的两个对应的矢量语音信号;旋转变换单元,用于对所述两个矢量语音信号进行正交旋转变换,输出两个旋转矢量信号以及所述正交旋转变换的旋转角度;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度;编码单元,用于对输入的两个矢量信号进行编码,输出编码结果;当输入的矢量信号为所述旋转变换单元输出的旋转矢量信号时,在输出的编码结果中放入所述旋转变换单元输出的旋转角度的信息。
一种立体声音频解码器,包括:码流接收单元,用于获取立体声音频编码码流;解码单元,用于从所述编码码流中获取旋转角度的信息以及两个旋转矢量信号并输出;反旋转变换单元,用于按照所述解码单元输出的旋转角度的信息对所述解码单元输出的两个旋转矢量信号进行反向正交旋转变换,输出两个矢量语音信号。
本发明实施例采用对左右声道的矢量语音信号进行旋转正交变换,提高两个矢量之间的相关度的方法;由于变换后的两个矢量具有较好的相关性,使得后续的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传统方法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更低的码率。
附图说明
图1是一种现有左右声道矢量声音信号和差示意图;
图2是另一种现有左右声道矢量声音信号和差示意图;
图3是本发明实施例一立体声音频编码方法流程示意图;
图4是本发明实施例一中正交旋转变换示意图;
图5是本发明实施例二立体声音频解码方法流程示意图;
图6是本发明实施例三立体声音频编码方法流程示意图;
图7是本发明实施例四立体声音频编码方法流程示意图;
图8是本发明实施例五立体声音频编码方法流程示意图;
图9是本发明实施例六立体声音频解码方法流程示意图;
图10是本发明实施例七立体声音频编码器逻辑结构示意图;
图11是本发明实施例八立体声音频解码器逻辑结构示意图;
图12是本发明实施例九立体声音频编码器逻辑结构示意图;
图13是本发明实施例十立体声音频编码器逻辑结构示意图;
图14是本发明实施例十一立体声音频编码器逻辑结构示意图;
图15是本发明实施例十二立体声音频解码器逻辑结构示意图。
具体实施方式
本发明实施例提供了一种立体声音频编码方法,对左右声道的矢量语音信号进行旋转正交变换,提高两个矢量之间的相关度。本发明实施例还提供相应的立体声音频解码方法和立体声音频编/解码器。以下分别进行详细说明。
实施例一、一种立体声音频编码方法,如图3所示,包括:
A1、获取分别属于左声道和右声道的两个对应的矢量语音信号。
对左右声道矢量语音信号的采集可参照现有方式进行。基于人耳的听觉特性,可将左声道和右声道按频率划分为若干子带,获取分别属于左声道和右声道的相同子带的两个矢量语音信号作为对应的矢量语音信号。以子带为单位进行立体声音频处理的依据在于:
人的听觉可以用一个非均匀带宽的滤波器组描述,每个滤波器组通道被称为一个子带。子带的带宽与人的听觉特性匹配,人耳对立体声的空间感主要来自左右声道对应子带信号的整体特性,如强度差、延时等,而对子带信号的细节不敏感。从低频到高频,子带的带宽不断增大,在理想的情况下与心理声学中的关键带(Critical Band)或等效矩形带宽(Equivalent Rectangular Bandwidth,ERB)一致。因此根据心理声学,子带是最小的听觉单位,每个子带可以作为一个独立的听觉单元,即可以以子带为单位进行立体声音频处理操作。
获取子带的矢量语音信号可采用两类方法:1、基于可重建滤波器组,如滤波器多相滤波器组(PQMF:Polyphase Quadrature Mirror Filterbank);2、基于时频变换,如快速傅立叶变换(FFT:Fast Fourier Transform)、离散余弦变换(DCT:Discrete Cosine Transform)和修正离散余弦变换(MDCT:ModifiedDiscrete Cosine Transform)等。将左右声道相同子带的采样数据按时间(基于滤波器组)或频率(基于时频变换)排列形成矢量语音信号对XL和XR。例如,若左右声道划分为4个子带,每个子带包含12个数据点,则有4组12维的XL和XR向量对,每个向量对均可按照本实施例后续提供的方法进行处理。
A2、对所述两个矢量语音信号进行正交旋转变换,获得两个旋转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度。
对矢量语音信号XL和XR执行的正交旋转变换如图4所示,可用公式表示为:
Y 0 Y 1 = cos θ sin θ - sin θ cos θ X L X R - - - ( 1 )
其中,XL和XR表示左右声道相同子带的两个矢量语音信号;Y0和Y1表示变换后的两个旋转语音信号;θ表示旋转角度。本实施例中仅要求θ是使得相关度增大的旋转角度,对其带来的相关度增量以及获取方式不作限定,例如可在[-π/2,π/2]中随机或按某种规律搜索获取。由于矢量对的相关度越高后续的编码过程就可能获得更大的编码增益,因此使得相关度极大化的旋转角度是希望被采用的。
下面给出极大化相关度旋转角的推理过程:
由(1)式得到旋转语音信号Y0和Y1的代数表达式为,
Y 0 = cos θX L + sin θX R Y 1 = - sin θX L + cos θX R - - - ( 2 )
假定矢量对a、b的相关度corr(a,b)采用如下归一化的度量计算方式,
corr ( a , b ) = ⟨ a , b ⟩ | a | | b | ,
其中<x1,x2>表示矢量x1和x2的标量积;||表示矢量的模。则由(2)式,相关度corr(Y0,Y1)可以表示为,
corr ( Y 0 , Y 1 ) = &lang; Y 0 , Y 1 &rang; | Y 0 | | Y 1 |
= sin 2 &theta; ( &lang; X R , X R &rang; - &lang; X L , X L &rang; 2 ) + cos 2 &theta; &lang; X L , X R &rang; | Y 0 | | Y 1 | - - - ( 3 )
&theta; 0 = 1 2 arctan &lang; X R , X R &rang; - &lang; X L , X L &rang; 2 &lang; X L , X R &rang; - - - ( 4 )
则使(3)式corr(Y0,Y1)有最大值的旋转角度θ的值在[-π/2,π/2]之间表示为,
&theta; = &theta; 0 , &lang; X L , X R &rang; &GreaterEqual; 0 &theta; 0 - &pi; / 2 , &lang; X L , X R &rang; < 0 , &theta; 0 &GreaterEqual; 0 &theta; 0 + &pi; / 2 , &lang; X L , X R &rang; < 0 , &theta; 0 < 0 - - - ( 5 )
此时,旋转语音信号Y0和Y1有最大的相关度,
corr ( Y 0 , Y 1 ) = ( E XL - E XR ) 2 ( E XL + E XR ) 2 [ 1 - corr ( X L , X R ) 2 ] + corr ( X L , X R ) 2
&GreaterEqual; | corr ( X L , X R ) | - - - ( 6 )
其中,EXL和EXR分别为XL和XR的能量,等于其模的平方。
由于采用正交旋转变换,变换前后矢量能量之和不变。在极大化相关度的旋转变换下,Y0和Y1的能量EY0和EY1有下述重要而简单的关系,
E Y 0 = E Y 1 = 1 2 ( E XL + E XR ) - - - ( 7 )
图4中Y0和Y1的差矢量信号YD=(Y0-Y1)/2的能量EYD,与XL和XR的差矢量信号XD=(XL-XR)/2的能量EXD关系如下,
E YD = E XD - 2 ( &lang; X L , X R &rang; 2 - ( E XL - E XR ) 2 / 4 - &lang; X L , X R &rang; )
&le; E XD - - - ( 8 )
A3、对所述旋转矢量信号进行编码。
对Y0和Y1编码的过程可参照现有方式进行,例如采用现有的和差立体声或强度立体声编码方式。
1、采用和差立体声方式。编码步骤包括:计算两个旋转矢量信号Y0和Y1的和与差,获得和矢量信号YS=(Y0+Y1)/2与差矢量信号YD=(Y0-Y1)/2;
对所述和矢量信号YS与差矢量信号YD分别进行量化编码,一般对YS采用通常的编码方式,对YD则可根据码率、频带和信号特性等采用不同精度的编码方式。在采用极大化相关度旋转变换的情况下,由(8)式可以看出变换后的差矢量信号YD的能量EYD小于原差矢量信号XD的能量EXD,因此和差立体声编码的效率将提高。
2、采用强度立体声方式。编码步骤包括:对两个旋转矢量信号Y0和Y1中的任意一个进行量化编码。在采用极大化相关度旋转变换的情况下,由(7)式可以看出,Y0和Y1的能量比例因子恒为1,因此不需要在码流中记录这个参数。由于Y0和Y1的相关度corr(Y0,Y1)大于XL和XR的相关度corr(XL,XR),因此强度立体声编码引入的失真将减小。
A4、在编码结果中放入所述正交旋转变换的旋转角度的信息。
为使解码端能根据Y0和Y1重建原始的矢量语音信号XL和XR,需要将正交旋转变换的旋转角度θ放入编码结果中,具体放置的字段以及码流成型格式等可根据实际应用需要确定,本实施例中不予限定。
本实施例采用对左右声道的矢量语音信号进行旋转正交变换,提高两个矢量之间的相关度的方法;由于变换后的两个矢量具有较好的相关性,使得后续的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传统方法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更低的码率。本实施例还进一步给出计算极大化相关度旋转角的方法,可获得具有最大相关度的旋转语音信号,使得后续编码过程能够获得更高的编码增益。
实施例二、一种立体声音频解码方法,提供与实施例一编码方法相应的解码方法,流程如图5所示,包括:
B1、获取立体声音频编码码流。
该编码码流为采用实施例一编码方法获得的编码码流。
B2、从所述编码码流中获取旋转角度的信息。
解码方可按照与编码方共同采用的约定,从某个字段中读取并解码出旋转角度θ。
B3、从所述编码码流中获取两个旋转矢量信号;
解码得到两个旋转矢量信号Y0和Y1的过程,可对应于Y0和Y1的编码方式进行。
B4、按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,获得两个矢量语音信号。
即相当于对Y0和Y1进行旋转角度为-θ的正交旋转变换,从而重建原始左右声道的矢量语音信号XL和XR
实施例三、一种立体声音频编码方法,本实施例方法与实施例一的区别之处在于在进行正交旋转变换前,增加了对该变换的编码增益进行评估判断的过程。方法流程如图6所示,包括:
C1、获取分别属于左声道和右声道的两个对应的矢量语音信号。
此步骤可参照实施例一中的步骤A1进行。
C2、判断需要对所述两个矢量语音信号进行正交旋转变换。
由于进行正交旋转变换的目的是为了提高矢量的相关度,因此可以利用当前矢量语音信号的相关度作为判断的依据,例如可以计算所述两个矢量语音信号的相关度,当相关度小于设定阈值时,确定需要进行所述正交旋转变换。
当然,若相关度大于设定阈值,说明当前矢量语音信号具有良好的相关性,则可直接按照现有方式进行编码,不在本实施例讨论之列。
C3、对所述两个矢量语音信号进行正交旋转变换,获得相关度增加的两个旋转矢量信号。
C4、对所述旋转矢量信号进行编码。
上述步骤C3、C4可参照实施例一中的步骤A2、A3进行。
C5、在编码结果中放入所述正交旋转变换的旋转角度的信息,并且在所述编码结果中设置已进行正交旋转变换的标识;这两个操作的执行不分先后。
为使得解码端能够识别编码码流是否采用了旋转正交变换,可以在码流中放入一个标志位,用来标识是否进行了正交旋转变换。在进行了正交旋转变换的情况下,需要将该标志位设置成已进行正交旋转变换的标识,例如设置为1。
本实施例在进行正交旋转变换前,增加了对该变换的编码增益进行评估判断的过程,使得正交旋转变换的应用更加有效,提高了编码的效率。
实施例四、一种立体声音频编码方法,本实施例方法与实施例一的区别之处在于在进行正交旋转变换后,增加了对该变换的编码增益进行评估判断的过程。方法流程如图7所示,包括:
D1、获取分别属于左声道和右声道的两个对应的矢量语音信号。
D2、对所述两个矢量语音信号进行正交旋转变换,获得相关度增加的两个旋转矢量信号。
上述步骤D1、D2可参照实施例一中的步骤A1、A2进行。
D3、比较所述两个旋转矢量信号之间的相关度相对所述两个矢量语音信号之间的相关度的增加量,根据所述增加量判断需要对所述旋转矢量信号进行后续的编码操作。
由于进行正交旋转变换的目的是为了提高矢量的相关度,因此可以通过变换前后相关度的增加量来判断变换是否有效,例如可设置相关度增加量的阈值,当相关度增加量超过阈值时,认为所进行的正交旋转变换是有效的,确定需要对旋转矢量信号进行后续的编码操作。
当然,若相关度增加量未达到阈值,则可认为正交旋转变换效果不大,可直接对原始的矢量语音信号按照现有方式进行编码,不在本实施例讨论之列。
D4、对所述旋转矢量信号进行编码。
此步骤可参照实施例一中的步骤A3进行。
D5、在编码结果中放入所述正交旋转变换的旋转角度的信息,并且在所述编码结果中设置已进行正交旋转变换的标识;这两个操作的执行不分先后。
本实施例在进行正交旋转变换后,增加了对该变换的编码增益进行评估判断的过程,在评估通过时才对正交旋转变换的结果进行编码,使得正交旋转变换的应用更加有效,提高了编码的效率。
实施例五、一种立体声音频编码方法,本实施例方法与实施例一的区别之处在于在对正交旋转变换的结果进行编码后,增加了对该编码结果的编码增益进行评估判断的过程。方法流程如图8所示,包括:
E1、获取分别属于左声道和右声道的两个对应的矢量语音信号。
E2、对所述两个矢量语音信号进行正交旋转变换,获得相关度增加的两个旋转矢量信号。
E3、对所述旋转矢量信号进行编码。
上述步骤E1、E2、E3可参照实施例一中的步骤A1、A2、A3进行。
E4、将在未采用所述正交旋转变换的情况下对所述两个矢量语音信号进行编码的结果,与所述对旋转矢量信号进行编码的结果进行比较,根据比较结果判断需要采用所述对旋转矢量信号进行编码的结果。
此步骤综合评价不进行和进行正交旋转变换的编码结果,通常可选择码流长度、失真度等作为评价参数,注意在考虑码流长度时需要加上旋转角度对应的编码长度。例如可设置编码长度减少量的阈值,当采用正交旋转变换的编码结果带来的编码长度减少量超过阈值时,确定需要采用所述对旋转矢量信号进行编码的结果。
当然,若通过编码结果的比较评价确定选择不进行正交旋转变换的编码结果,则可直接采用对原始的矢量语音信号进行编码的结果。
E5、在编码结果中放入所述正交旋转变换的旋转角度的信息,并且在所述编码结果中设置已进行正交旋转变换的标识;这两个操作的执行不分先后。
本实施例在对正交旋转变换的结果进行编码后,增加了对该编码结果的编码增益进行评估判断的过程,使得正交旋转变换的应用更加有效,确保编码结果的最优性。
实施例六、一种立体声音频解码方法,提供与实施例三~五编码方法相应的解码方法,流程如图9所示,包括:
F1、获取立体声音频编码码流。
该编码码流为采用实施例三~五编码方法获得的编码码流。
F2、判断所述编码码流中包括已进行正交旋转变换的标识。
例如解码方可按照与编码方共同采用的约定,读取作为标识的某个标志位的值,然后根据该值判断当前编码码流是否已进行正交旋转变换,若确定已进行正交旋转变换则按下述解码过程执行,若判断未进行正交旋转变换则可按照现有解码方式进行解码操作,不在本实施例讨论之列。
F3、从所述编码码流中获取旋转角度的信息。
F4、从所述编码码流中获取两个旋转矢量信号;
F5、按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,获得两个矢量语音信号。
上述步骤F3、F4、F5可参照实施例二中的步骤B2、B3、B4进行。
应当理解,实现本发明立体声音频编码方法和解码方法的软件可以存储于计算机可读介质中。该软件的编码方法在执行时,包括如下步骤:获取分别属于左声道和右声道的两个对应的矢量语音信号;对所述两个矢量语音信号进行正交旋转变换,获得两个旋转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度;对所述旋转矢量信号进行编码;在编码结果中放入所述正交旋转变换的旋转角度的信息。该软件的解码方法在执行时,包括如下步骤:获取立体声音频编码码流;从所述编码码流中获取旋转角度的信息;从所述编码码流中获取两个旋转矢量信号;按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,获得两个矢量语音信号。所述的可读介质,如:ROM/RAM、磁碟、光盘等。
为更好的理解上述实施例,以下给出实施例一编码方法的一个数据应用例。
1、假定左右声道矢量语音信号的获取采用MDCT变换方式,变换后左右声道的每个语音帧分别包含32个频谱数据。根据人耳的非线性频率分辨率将频谱数据从低到高分成4个子带:子带1,谱线1~谱线4;子带2,谱线5~谱线8;子带3,谱线9~谱线20;子带4,谱线21~谱线32。以子带1为例,假定子带1对应的4维矢量语音信号对为,
XL=(-0.4513,-0.0091,-0.5363,-0.3011),
XR=(0.1739,0.3309,0.9390,-0.7371),
可得,XL的能量EXL=0.5821,XR的能量EXR=1.5646;XL和XR的标量积为<XL,XR>=-0.3632,归一化相关度为,
corr(XL,XR)=-0.3632/(0.5821×1.5646)0.5=-0.3806
2、由(4)、(5)两式可计算得到此时的极大化相关度旋转角θ(弧度)
θ=θ0+π/2=0.5×arctan[(1.5646-0.5821)/(2×-0.3632)]+1.5708=1.1037
cosθ=0.4503,sinθ=0.8929
再由(1)、(2)两式得到极大化相关度正交旋转变换后的旋转语音信号,
Y0=0.4503XL+0.8929XR=(-0.0480,0.2914,0.5968,-0.7937),
Y1=-0.8929XL+0.4503XR=(0.4813,0.1571,0.9017,-0.0630),
可得,Y0和Y1的能量EY0=EY1=1.0734;Y0和Y1的标量积为<Y0,Y1>=0.6109,归一化相关度为,
corr(Y0,Y1)=0.6109/1.0734=0.5691
显然变换后相关度由-0.3806提高到0.5691。
3、对Y0和Y1采用和差或强度立体声的方式进行编码,并在编码结果中放入旋转角度θ=1.1037。
对于左右声道的其他子带,可以同样方式进行处理。
下面对本发明实施例的立体声音频编/解码器进行详细说明。
实施例七、一种立体声音频编码器10,如图10所示,包括:
信号分析单元11,用于输出分别属于左声道和右声道的两个对应的矢量语音信号XL和XR
旋转变换单元12,用于对信号分析单元11输出的两个矢量语音信号XL和XR进行正交旋转变换,输出两个旋转矢量信号Y0和Y1以及所述正交旋转变换的旋转角度θ;所述两个旋转矢量信号Y0和Y1之间的相关度大于或等于所述两个矢量语音信号XL和XR之间的相关度。
编码单元13,用于对输入的两个矢量信号进行编码,输出编码结果;当输入的矢量信号为旋转变换单元12输出的旋转矢量信号Y0和Y1时,在输出的编码结果中放入旋转变换单元12输出的旋转角度θ的信息。
本实施例立体声音频编码器可用于执行实施例一中描述的立体声音频编码方法。
实施例八、一种立体声音频解码器20,如图11所示,包括:
码流接收单元21,用于获取立体声音频编码码流。
解码单元22,用于从码流接收单元21获取的编码码流中获取旋转角度θ的信息以及两个旋转矢量信号Y0和Y1并输出。
反旋转变换单元23,用于按照解码单元22输出的旋转角度θ的信息对解码单元22输出的两个旋转矢量信号Y0和Y1进行反向正交旋转变换,输出两个矢量语音信号XL和XR
本实施例立体声音频解码器可用于执行实施例二中描述的立体声音频解码方法。
实施例九、一种立体声音频编码器30,如图12所示,包括:
信号分析单元31,用于输出分别属于左声道和右声道的两个对应的矢量语音信号XL和XR
第一判断单元32,用于判断信号分析单元3 1输出的两个矢量语音信号XL和XR是否需要进行正交旋转变换;若是,则将所述两个矢量语音信号XL和XR输出到旋转变换单元32,若否,则将所述两个矢量语音信号XL和XR输出到编码单元34。
旋转变换单元33,用于对第一判断单元32输出的两个矢量语音信号XL和XR进行正交旋转变换,输出两个旋转矢量信号Y0和Y1以及所述正交旋转变换的旋转角度θ;所述两个旋转矢量信号Y0和Y1之间的相关度大于或等于所述两个矢量语音信号XL和XR之间的相关度。
编码单元34,用于对输入的两个矢量信号(XL、XR或者Y0、Y1)进行编码,输出编码结果;当输入的矢量信号为旋转变换单元33输出的旋转矢量信号Y0和Y1时,在输出的编码结果中放入旋转变换单元33输出的旋转角度θ的信息。
第一填充单元35,用于根据第一判断单元32的判断结果,在编码单元34输出的编码结果中设置已进行或未进行正交旋转变换的标识。
本实施例立体声音频编码器可用于执行实施例三中描述的立体声音频编码方法。
实施例十、一种立体声音频编码器40,如图13所示,包括:
信号分析单元41,用于输出分别属于左声道和右声道的两个对应的矢量语音信号XL和XR
旋转变换单元42,用于对信号分析单元41输出的两个矢量语音信号XL和XR进行正交旋转变换,输出两个旋转矢量信号Y0和Y1以及所述正交旋转变换的旋转角度θ;所述两个旋转矢量信号Y0和Y1之间的相关度大于或等于所述两个矢量语音信号XL和XR之间的相关度。
第二判断单元43,用于比较旋转变换单元42输出的两个旋转矢量信号Y0和Y1之间的相关度,相对信号分析单元41输出的两个矢量语音信号XL和XR之间的相关度的增加量,根据所述增加量判断是否需要对所述旋转矢量信号Y0和Y1进行后续的编码操作;若是,则将所述两个旋转矢量信号Y0和Y1输出到编码单元44,若否,则将所述两个矢量语音信号XL和XR输出到编码单元44。
编码单元44,用于对第二判断单元43输入的两个矢量信号(XL、XR或者Y0、Y1)进行编码,输出编码结果;当输入的矢量信号为旋转矢量信号Y0和Y1时,在输出的编码结果中放入旋转变换单元42输出的旋转角度θ的信息。
第二填充单元45,用于根据第二判断单元43的判断结果,在编码单元44输出的编码结果中设置已进行或未进行正交旋转变换的标识。
本实施例立体声音频编码器可用于执行实施例四中描述的立体声音频编码方法。
实施例十一、一种立体声音频编码器50,如图14所示,包括:
信号分析单元51,用于输出分别属于左声道和右声道的两个对应的矢量语音信号XL和XR
旋转变换单元52,用于对信号分析单元51输出的两个矢量语音信号XL和XR进行正交旋转变换,输出两个旋转矢量信号Y0和Y1以及所述正交旋转变换的旋转角度θ;所述两个旋转矢量信号Y0和Y1之间的相关度大于或等于所述两个矢量语音信号XL和XR之间的相关度。
编码单元53,用于分别对信号分析单元51和旋转变换单元52输入的两个矢量信号(XL、XR和Y0、Y1)进行编码,输出编码结果;当输入的矢量信号为旋转矢量信号Y0和Y1时,在输出的编码结果中放入旋转变换单元52输出的旋转角度θ的信息。
第三判断单元54,用于对编码单元53输出的两种编码结果进行比较,根据比较结果选择输出所述两种编码结果之一;
第三填充单元55,用于根据第三判断单元54的选择,在第三判断单元54选择的编码结果中设置已进行或未进行正交旋转变换的标识。
本实施例立体声音频编码器可用于执行实施例五中描述的立体声音频编码方法。
实施例十二、一种立体声音频解码器60,如图15所示,包括:
码流接收单元61,用于获取立体声音频编码码流。
第四判断单元62,用于判断码流接收单元61获取的编码码流中包括已进行正交旋转变换的标识,触发解码单元62的操作。
解码单元63,用于从码流接收单元61获取的编码码流中获取旋转角度θ的信息以及两个旋转矢量信号Y0和Y1并输出。
反旋转变换单元64,用于按照解码单元63输出的旋转角度θ的信息对解码单元63输出的两个旋转矢量信号Y0和Y1进行反向正交旋转变换,输出两个矢量语音信号XL和XR
本实施例立体声音频解码器可用于执行实施例六中描述的立体声音频解码方法。
通过上述实施例可以看出,本发明实施例采用对左右声道的矢量语音信号进行旋转正交变换,提高两个矢量之间的相关度的方法;由于变换后的两个矢量具有较好的相关性,使得后续的编码过程能够以低码率实现较高的音质,确保了编码增益的提高。与传统方法相比,能够在相同的码率下获得更高的音质,或者在同等音质下实现更低的码率。采用本发明实施例进一步给出的计算极大化相关度旋转角的方法,可获得具有最大相关度的旋转语音信号,使得后续编码过程能够获得更高的编码增益。并且若进一步增加对正交旋转变换的编码增益进行评估判断的过程,能够使得正交旋转变换的应用更加有效,确保编码结果的优选性。
以上对本发明实施例所提供的立体声音频编/解码方法及编/解码器进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (17)

1.一种立体声音频编码方法,其特征在于,包括:
获取分别属于左声道和右声道的两个对应的矢量语音信号;
对所述两个矢量语音信号进行正交旋转变换,获得两个旋转矢量信号;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度;
对所述旋转矢量信号进行编码;
在编码结果中放入所述正交旋转变换的旋转角度的信息。
2.根据权利要求1所述的立体声音频编码方法,其特征在于,所述左声道和右声道的频率范围划分为若干子带,所述获取分别属于左声道和右声道的两个对应的矢量语音信号的步骤具体为:获取分别属于左声道和右声道的相同子带的两个矢量语音信号。
3.根据权利要求1所述的立体声音频编码方法,其特征在于,在所述对两个矢量语音信号进行正交旋转变换的步骤之前还包括:判断需要对所述两个矢量语音信号进行正交旋转变换;
在所述对旋转矢量信号进行编码的步骤之后还包括:在所述编码结果中设置已进行正交旋转变换的标识。
4.根据权利要求3所述的立体声音频编码方法,其特征在于,所述判断需要对两个矢量语音信号进行正交旋转变换的步骤具体为:计算所述两个矢量语音信号的相关度,当相关度小于设定阈值时,确定需要进行所述正交旋转变换。
5.根据权利要求1所述的立体声音频编码方法,其特征在于,在所述对两个矢量语音信号进行正交旋转变换的步骤之后还包括:比较所述两个旋转矢量信号之间的相关度相对所述两个矢量语音信号之间的相关度的增加量,根据所述增加量判断需要对所述旋转矢量信号进行后续的编码操作;
在所述对旋转矢量信号进行编码的步骤之后还包括:在所述编码结果中设置已进行正交旋转变换的标识。
6.根据权利要求1所述的立体声音频编码方法,其特征在于,在所述对旋转矢量信号进行编码的步骤之后还包括:
将在未采用所述正交旋转变换的情况下对所述两个矢量语音信号进行编 码的结果,与所述对旋转矢量信号进行编码的结果进行比较,根据比较结果判断需要采用所述对旋转矢量信号进行编码的结果;
在所采用的编码结果中设置已进行正交旋转变换的标识。
7.根据权利要求1~6任意一项所述的立体声音频编码方法,其特征在于,所述对两个矢量语音信号进行正交旋转变换的步骤具体为:按照旋转角度θ执行所述正交旋转变换,
其中,θ的值在[-π/2,π/2]之间表示为,
Figure F071D5833920070725C000022
Figure F071D5833920070725C000023
XL和XR表示所述两个矢量语音信号;Y0和Y1表示所述两个旋转语音信号;<x1,x2>表示矢量x1和x2的标量积。
8.根据权利要求7所述的立体声音频编码方法,其特征在于,所述对旋转矢量信号进行编码的步骤包括:
计算所述两个旋转矢量信号的和与差,获得和矢量信号与差矢量信号;
对所述和矢量信号与差矢量信号分别进行量化编码。
9.根据权利要求7所述的立体声音频编码方法,其特征在于,所述对旋转矢量信号进行编码的步骤具体为:对所述两个旋转矢量信号中的任意一个进行量化编码。
10.一种立体声音频解码方法,其特征在于,包括:
获取立体声音频编码码流;
从所述编码码流中获取旋转角度的信息;
从所述编码码流中获取两个旋转矢量信号;
按照所述旋转角度对所述两个旋转矢量信号进行反向正交旋转变换,获得两个矢量语音信号。
11.根据权利要求10所述的立体声音频解码方法,其特征在于,在所述从 编码码流中获取旋转角度的信息的步骤之前还包括:判断所述编码码流中包括已进行正交旋转变换的标识。
12.一种立体声音频编码器,其特征在于,包括:
信号分析单元,用于输出分别属于左声道和右声道的两个对应的矢量语音信号;
旋转变换单元,用于对所述两个矢量语音信号进行正交旋转变换,输出两个旋转矢量信号以及所述正交旋转变换的旋转角度;所述两个旋转矢量信号之间的相关度大于或等于所述两个矢量语音信号之间的相关度;
编码单元,用于对输入的两个矢量信号进行编码,输出编码结果;当输入的矢量信号为所述旋转变换单元输出的旋转矢量信号时,在输出的编码结果中放入所述旋转变换单元输出的旋转角度的信息。
13.根据权利要求12所述的立体声音频编码器,其特征在于,还包括:
第一判断单元,用于判断所述信号分析单元输出的两个矢量语音信号是否需要进行正交旋转变换;若是,则将所述两个矢量语音信号输出到所述旋转变换单元,若否,则将所述两个矢量语音信号输出到所述编码单元;
第一填充单元,用于根据所述第一判断单元的判断结果,在所述编码单元输出的编码结果中设置已进行或未进行正交旋转变换的标识。
14.根据权利要求12所述的立体声音频编码器,其特征在于,还包括:
第二判断单元,用于比较所述旋转变换单元输出的两个旋转矢量信号之间的相关度,相对所述信号分析单元输出的两个矢量语音信号之间的相关度的增加量,根据所述相关度的增加量判断是否需要对所述旋转矢量信号进行后续的编码操作;若是,则将所述两个旋转矢量信号输出到所述编码单元,若否,则将所述两个矢量语音信号输出到所述编码单元;
第二填充单元,用于根据所述第二判断单元的判断结果,在所述编码单元输出的编码结果中设置已进行或未进行正交旋转变换的标识。
15.根据权利要求12所述的立体声音频编码器,其特征在于,所述编码单元分别对所述信号分析单元和旋转变换单元的输出进行编码;所述编码器还包括: 
第三判断单元,用于对所述编码单元输出的两种编码结果进行比较,根据比较结果选择输出所述两种编码结果之一;
第三填充单元,用于根据所述第三判断单元的选择,在所述第三判断单元选择的编码结果中设置已进行或未进行正交旋转变换的标识。
16.一种立体声音频解码器,其特征在于,包括:
码流接收单元,用于获取立体声音频编码码流;
解码单元,用于从所述编码码流中获取旋转角度的信息以及两个旋转矢量信号并输出;
反旋转变换单元,用于按照所述解码单元输出的旋转角度的信息对所述解码单元输出的两个旋转矢量信号进行反向正交旋转变换,输出两个矢量语音信号。
17.根据权利要求16所述的立体声音频解码器,其特征在于,还包括:
第四判断单元,用于判断所述编码码流中包括已进行正交旋转变换的标识,触发所述解码单元的操作。 
CN2007101358339A 2007-07-16 2007-07-16 立体声音频编/解码方法及编/解码器 Active CN101350197B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007101358339A CN101350197B (zh) 2007-07-16 2007-07-16 立体声音频编/解码方法及编/解码器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101358339A CN101350197B (zh) 2007-07-16 2007-07-16 立体声音频编/解码方法及编/解码器

Publications (2)

Publication Number Publication Date
CN101350197A CN101350197A (zh) 2009-01-21
CN101350197B true CN101350197B (zh) 2011-05-11

Family

ID=40268954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101358339A Active CN101350197B (zh) 2007-07-16 2007-07-16 立体声音频编/解码方法及编/解码器

Country Status (1)

Country Link
CN (1) CN101350197B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202043B (zh) * 2007-12-28 2011-06-15 清华大学 音频信号的编码方法和装置与解码方法和装置
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
KR101450414B1 (ko) * 2009-12-16 2014-10-14 노키아 코포레이션 멀티-채널 오디오 프로세싱
CN108182947B (zh) * 2016-12-08 2020-12-15 武汉斗鱼网络科技有限公司 一种声道混合处理方法及装置
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1224523A (zh) * 1997-05-15 1999-07-28 松下电器产业株式会社 音频信号编码装置和译码装置以及音频信号编码和译码方法
CN1230823A (zh) * 1997-12-20 1999-10-06 德国汤姆逊-布朗特公司 视频或音频信号分段编码方法
JP2002152046A (ja) * 2000-11-09 2002-05-24 Hudson Soft Co Ltd データ符号化方法、およびそのプログラムを記憶した記憶媒体
EP1688917A1 (en) * 2003-12-26 2006-08-09 Matsushita Electric Industries Co. Ltd. Voice/musical sound encoding device and voice/musical sound encoding method
JP2006323314A (ja) * 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd マルチチャネル音声信号をバイノーラルキュー符号化する装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1224523A (zh) * 1997-05-15 1999-07-28 松下电器产业株式会社 音频信号编码装置和译码装置以及音频信号编码和译码方法
CN1230823A (zh) * 1997-12-20 1999-10-06 德国汤姆逊-布朗特公司 视频或音频信号分段编码方法
JP2002152046A (ja) * 2000-11-09 2002-05-24 Hudson Soft Co Ltd データ符号化方法、およびそのプログラムを記憶した記憶媒体
EP1688917A1 (en) * 2003-12-26 2006-08-09 Matsushita Electric Industries Co. Ltd. Voice/musical sound encoding device and voice/musical sound encoding method
JP2006323314A (ja) * 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd マルチチャネル音声信号をバイノーラルキュー符号化する装置

Also Published As

Publication number Publication date
CN101350197A (zh) 2009-01-21

Similar Documents

Publication Publication Date Title
CN1307612C (zh) 声频信号的编码解码方法、编码器、解码器及相关设备
TWI752281B (zh) 用以使用量化及熵寫碼來編碼或解碼方向性音訊寫碼參數之設備及方法
Parvaix et al. A watermarking-based method for informed source separation of audio signals with a single sensor
CN102270452B (zh) 近透明或透明的多声道编码器/解码器方案
CN101390443B (zh) 音频编码和解码
CN102282612B (zh) 叉积增强的谐波转置
CN101223577B (zh) 对低比特率音频信号进行编码/解码的方法和设备
CN101350197B (zh) 立体声音频编/解码方法及编/解码器
EP1934973B1 (en) Temporal and spatial shaping of multi-channel audio signals
CN101202043B (zh) 音频信号的编码方法和装置与解码方法和装置
CN101933086B (zh) 处理音频信号的方法和设备
CN1822508B (zh) 对数字信号进行编码和解码的方法和设备
CN104011793A (zh) 帧错误隐藏方法和设备以及音频解码方法和设备
CN103959375A (zh) 增强的从音频编解码器的色度提取
CN101484936A (zh) 音频解码
CN105103225A (zh) 立体声音频编码器和解码器
CN111316353B (zh) 确定空间音频参数编码和相关联的解码
CN101894559B (zh) 音频处理方法及其装置
MX2007011995A (es) Codificacion y decodificacion de audio.
TWI689210B (zh) 時域身歷聲編解碼方法和相關產品
CN105280190A (zh) 带宽扩展编码和解码方法以及装置
CN101162904A (zh) 一种空间参数立体声编解码方法及其装置
CN103413553B (zh) 音频编码方法、音频解码方法、编码端、解码端和系统
Xue et al. Robust speech steganography using differential SVD
CN103700372A (zh) 一种基于正交解相关技术的参数立体声编码、解码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant