CN101604524B - 立体声编码方法及其装置、立体声解码方法及其装置 - Google Patents
立体声编码方法及其装置、立体声解码方法及其装置 Download PDFInfo
- Publication number
- CN101604524B CN101604524B CN2008101147525A CN200810114752A CN101604524B CN 101604524 B CN101604524 B CN 101604524B CN 2008101147525 A CN2008101147525 A CN 2008101147525A CN 200810114752 A CN200810114752 A CN 200810114752A CN 101604524 B CN101604524 B CN 101604524B
- Authority
- CN
- China
- Prior art keywords
- channel
- mrow
- spectrum
- stereo
- frequency spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000001228 spectrum Methods 0.000 claims abstract description 332
- 238000000605 extraction Methods 0.000 claims description 22
- 238000011084 recovery Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 14
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 17
- 230000008569 process Effects 0.000 abstract description 8
- 230000014509 gene expression Effects 0.000 description 18
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000000695 excitation spectrum Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Landscapes
- Stereophonic System (AREA)
Abstract
本发明公开了一种立体声编码方法,该方法包括:提取表征立体声中第一声道频谱与第二声道频谱的能量比的第一立体声参数,表征第一声道和第二声道的加权差频谱与加权和频谱能量比的第二立体声参数,并获取第一声道和第二声道的加权和频谱;其中,所述加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;对所述加权和频谱、第一立体声参数和第二立体声参数进行编码,向解码端发送。本发明还公开了一种针对于该编码方法的解码方法,以及一种立体声编码装置和一种立体声解码装置。使用本发明能够实现低码率下对立体声的高质量编码。解码过程也无需任何的角度计算,降低了解码复杂度。
Description
技术领域
本发明涉及编解码技术,具体涉及立体声编码方法及装置、立体声解码方法及其装置。
背景技术
在低码率的声音编解码应用中,为了尽量减少传输数据量,提高低码率条件下的传输效率,可以只传输单声道信号。但是,单声道信号给听者的感觉是从头部内产生声音,如果收听时间较长则会产生不舒服的感觉,因此希望能在低码率条件下引入立体声的效果。其中,低码率是指单位时间内传输较少的比特位。
目前的立体声编解码方案有:纯粹的后处理方案、和差立体声方案和扩展的宽带自适应多速率(AMR-WB+,Extended AdaptiveMulti-Rate-Wideband)立体声编解码方案。
其中,单纯的后处理方案是在解码器端向所接收的单声道信号中添加一个延时信号,从而构建出双声道立体声信号,以建立立体声感觉。这种方法的优点是只需传输单声道信号,占用码率空间小。但是,后处理方案不能区分原始信号是单声道信号还是立体声信号,即使原始信号为单纯的单声道信号,也将被盲目的转换成立体声信号,此时,听者会感觉到不舒服,而且这种情况经常发生在语音信号的录音中。此外,这种后处理的方案仅能建立类似立体声的感觉,并不能准确恢复出原始信号声像的位置。
和差立体声方案利用原始信号左右声道的相关性,分别对左右声道的和信号 和差信号 进行波形编码,其中, 为左声道信号, 为右声道信号, 为和信号, 为差信号; 和 都是具有长度和方向的向量。但是,和差立体声方案需要传输和信号和差信号,因此在低码率编码应用中需占用较多的码率空间,因此传输效率不高。只有原始信号左右声道极其相似的情况下,差信号所需比特数才有所减少,此时才能体现出高效率。而在很多情况下,例如左右声道分别录制不同的乐器,或者左右声道声像较偏、左右声道信号能量相差很大的情况下,这种同时传输差信号的处理就无法在低码率的条件下达到较好的效果。因此,和差立体声方案在低码率的条件下并不能达到较好的效果。
扩展的宽带自适应多速率(AMR-WB+,Extended Adaptive Multi-Rate-Wideband)立体声编解码方案,是目前较为有效的立体声编码技术。但是,该方案中的立体声编码技术采用时域滤波方法实现,其分辨率不高,解码后生成的立体声声音质量也比较低,不能更好的接近原始立体声。
因此,研究一种低码率下对立体声的高质量编码是亟待解决的问题。
发明内容
有鉴于此,本发明提供了一种立体声编码方法,能够实现低码率下对立体声的高质量编码。
该方法包括:
A、编码端提取表征立体声中第一声道频谱与第二声道频谱的能量比的第一立体声参数,表征第一声道和第二声道的加权差频谱与加权和频谱能量比的第二立体声参数,并获取第一声道和第二声道的加权和频谱;
所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的;
所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的;
其中,加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
B、对所述加权和频谱、第一立体声参数和第二立体声参数进行编码,向解码端发送。
本发明还提供了一种立体声解码方法,能够实现低码率下对立体声的高 质量编码。
该方法包括:
A、解码端接收立体声第一声道与第二声道的加权和频谱,以及第一立体声参数和第二立体声参数;所述第一立体声参数表征第一声道频谱和第二声道频谱的能量比,所述第二立体声参数表征第一声道和第二声道的加权差频谱与加权和频谱的能量比;
所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的;
所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的;
其中,加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
B、利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱;
C、根据所述加权和频谱、加权差频谱以及第一立体声参数,恢复第一声道频谱和第二声道频谱。
本发明还提供了一种立体声编码装置,能够实现低码率下对立体声的高质量编码。
该装置包括第一参数提取单元、第二参数提取单元、加权单元和发送单元;
所述第一参数提取单元,用于提取表征立体声第一声道频谱和第二声道频谱的能量比的第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
所述加权单元,用于获取每个频点上第一声道和第二声道的加权和频谱,加权的权值为所述第一立体声参数;
所述第二参数提取单元,用于提取表征第一声道和第二声道加权差频谱与所述加权和频谱之间能量比的第二立体声参数;
所述发送单元,用于向解码端发送从第一参数提取单元获取的第一立体声参数、从第二参数提取单元获取的第二立体声参数和从加权单元获取的加权和频谱;
所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的;
所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的。
本发明还提供了一种立体声解码装置,能够实现低码率下对立体声的高质量编码。
该装置包括接收单元、中间参数求取单元和恢复单元;
所述接收单元,用于接收立体声第一声道与第二声道的加权和频谱,以及第一立体声参数和第二立体声参数;所述第一立体声参数表征第一声道频谱和第二声道频谱之间的能量比,所述第二立体声参数表征第一声道和第二声道的加权差频谱和加权和频谱的能量比;加权的权值为第一立体声参数;
所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的;
所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的;
其中,加权的权值为第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
所述中间参数求取单元,用于利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱;
所述恢复单元,用于根据所述加权和频谱、加权差频谱以及第一立体声参数,恢复第一声道频谱和第二声道频谱。
根据以上技术方案可见,本发明采用频域编码方法实现,其分辨率较高,解码后生成的立体声声音质量也相对较高,能够较好的接近原始立体声,提高了立体声编解码质量。而且,经编码,只需传输加权和声道频谱以及两个立体声参数,有效地提高了低码率条件下的传输效率。
在解码端,利用左右声道的加权和以及加权差近似垂直这一隐含参数,得到加权差,并采用加权和、加权差以及作为加权权值的第一立体声参数恢复得到左右声道频谱,整个恢复过程没有进行正弦、余弦等角度计算,因此大大降低了解码端的解码复杂度,从而减小了解码时间。
较佳地,当根据最小均方差准则对加权和以及两个立体声参数的求取进行优化后,令加权和以及两个立体声参数的取值能够使得左右声道均方差之和最小,则,恢复出的立体声解码信号更加接近原始信号,进一步提高了立体声编解码质量。
附图说明
图1为本发明实施例中立体声编码方法的流程图。
图2为本发明实施例中立体声编码模式模型图。
图3为本发明实施例中立体声解码方法的流程图。
图4为本发明实施例中立体声编码装置的结构示意图。
图5为本发明实施例中立体声解码装置的结构示意图。
具体实施方式
本发明实施例所提供的立体声编解码方案属于参数立体声方案,其基本思想为:编码端提取表征立体声信号特征的立体声参数,只传输左右声道的加权和频谱以及所提取的参数,从而减少所传输数据数量,以达到低码率条件下较好的传输效率。所提取的立体声参数分别是表征左右声道能量比的第一立体声参数,和表征左右声道加权差和加权和能量比的第二立体声参数。
加权和频谱的求取方式是:将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加,得到的加权和频谱。
加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的。
由于未缩放第一声道和缩放后的第二声道能量相等,因此加权和频谱与加权差频谱之间的角度关系是垂直的。那么当通过第二立体声参数对加权差进行缩放,就可以得到缩放后的加权差频谱,该缩放后的加权差频谱与加权和频谱垂直且等长。
那么,在解码端,当接收到加权和频谱时,能够获取其等幅垂直的缩放后加权差频谱,然后利用第二立体声参数进行缩放,得到原始的加权差频谱。然后利用加权和频谱以及加权差频谱,得到左声道和缩放后的右声道,最后利用第一立体声参数对缩放后的右声道进行缩放,从而获得原始右声道频谱。
从以上所述可以看到,本发明解码端恢复立体声所利用的数据不仅包括所传输的加权和频谱以及两个立体声参数,还包括加权和频谱与缩放后的加权差频谱具有等幅垂直这一特点,实际上这一特点是解码时所利用的必不可少的隐性参数。该隐性参数不必在码流中传输,减少了传输码流的比特数, 提高了低码流下的传输效率,而且,利用该隐性参数只需将加权和频谱进行等幅垂直的变换处理,而频谱信号是由实部和虚部组成的,所谓等幅垂直处理就是对加权和的虚部取负,然后将实部数值和取负后的虚部数值进行实虚部的调换,得到缩放后的加权差频谱。然后再利用第一立体声参数和第二立体声参数进行乘除运算,得到第一声道频谱和第二声道频谱。整个计算过程无需任何的角度计算,降低了解码复杂度,从而减少了解码端的解码时间。
下面,结合附图并举实施例,对本发明进行详细描述。
图1为本发明实施例中立体声编码方法的流程图。该实施例以第一声道为左声道,第二声道为右声道为例,进行描述。如图1所示,该方法包括以下步骤:
步骤100:分别对立体声的左声道信号和右声道信道进行离散傅立叶变换(DFT)变换,得到DFT变换域上的左声道频谱和右声道频谱。
步骤101:分别将立体声的左声道频谱和右声道频谱划分为K个子频带,K为正整数。
本步骤中,第一立体声参数为左声道频谱的能量与右声道频谱的能量之间的比值,其计算方法可以采用以下公式:
其中,EL(k)和ER(k)分别为子频带k的左声道能量和右声道能量。子频带k内的声道能量是对该子频带声道向量取模的平方。计算声道能量的方式为已知技术手段,这里就不再详述。
如图2所示,经步骤103的缩放后,左声道频谱 的能量与缩放后右声道频谱 的能量近似相等,根据 和 获得的加权和频谱 和加权差频谱 也近似垂直,但是长度并不相等。那么如何在解码端根据 以及垂直关系得到 呢?从图2中可以看到,如果根据 计算其等幅垂直的正交频谱 ,那么将 乘以一个长度系数,就可以得到 以下步骤105就是计算这个长度系数,即第二立体声参数gd(k)的具体方式。
较佳地,在本步骤中,由于 与 等幅,因此二者能量相等。而且考虑到在编码端求取出来的正交频谱 并实质上的作用,因此本步骤可以直接求取加权差频谱 和加权和频谱 的能量比,作为gd(k)。gd(k)的计算方法可以采用以下公式:
至此,本流程结束。
需要说明的是,以上求取 gr(k)和gd(k)都是在各子频带内完成的。每个子频带都具有对应的 gr(k)和gd(k)。在恢复时,也是采用各子频带对应的 gr(k)和gd(k)恢复得到各子频带的左右声道频谱,经逆DFT变换后,求出合成立体声信号。
以下图3示出的流程就是本发明实施例中立体声解码方法的流程图。如图3所示,该方法包括以下步骤:
步骤301:将从码流中获取的数据进行逆量化解码后,得到加权和频谱 以及每个子频带的 和gd(k)。当然如果编码端传输的是gr(k),解码端只需要对其进行倒数运算,即可得到第一立体声参数 传输gr(k)还是 是由编码端和解码端预先约定的。
若,
则,
其中,xm和ym分别为加权和频谱的实部和虚部;
本步骤中,具体恢复过程包括以下步骤:
在实际恢复过程中,步骤302和303可以简化为如下两个步骤:
步骤304:对立体声信号的频谱进行逆DFT变换,得到合成的立体声信号。
至此,本流程结束。
从以上实施例中的编码方法和解码方法来看,本发明采用频域编码方法实现立体声的编解码,其分辨率较高,解码后生成的立体声声音质量也相对较高,能够较好的接近原始立体声,提高了立体声编解码质量。而且,经本发明实施例中的编码,只需要传输加权和声道频谱以及两个立体声参数,有效地提高了低码率条件下的传输效率。
在解码端,利用左右声道的加权和以及加权差近似垂直这一隐含参数, 得到加权差,并采用加权和、加权差以及作为加权参数的第一立体声参数恢复得到左右声道频谱,整个恢复过程没有进行正弦、余弦等角度计算,因此大大降低了解码端的解码复杂度,从而减小了解码时间。
为了能够进一步提高立体声编解码质量,令恢复的立体声解码信号更加接近原始信号,减少恢复信号与原始信号之间的误差,本发明在上述实施例的基础上,根据最小均方差准则对 gr(k)和gd(k)的求取进行优化,令优化后的 gr(k)和gd(k)的取值能够使得左右声道均方差之和最小。
首先,建立求取子频带k内左右声道均方差加权和的表达式:
其中,i∈band(k)是指i取子频带k内的频率点;εl(k)为左声道均方差之和,εr(k)右声道均方差之和, 为解码端接收到的左声道频谱, 为解码端编码前的原始左声道频谱, 为解码端接收到的右声道频谱, 为解码端编码前的原始右声道频谱;g(k)为重要度因子,反映了编码误差在左右声道的分配程度。在实际应用中,g(k)可以为常数1,也可以为左右声道信号的能量比。当g(k)为能量比时,右声道能量越弱,g(k)的值越大;右声道能量越强,g(k)的值越小。
表达式(13)中的 和 为解码端接收到的左右声道频谱,因此将解码端用于恢复左右声道频谱的公式(11)和(12)代入表达式(13),并采用表达式 表示表达式(13)中 和 得到如下变形后的左右声道均方差加权和的表达式(14):
(14)
其中,xl、yl、xr、yr、xm和ym的意义已经在前面进行了注释。
第二步,为了使ε(k)的取值最小,对于每一个频率点i都要满足加权均方差ε(k)最小,因此对于加权和频谱 每个频率点来说都需要满足 和
那么,本步骤中分别对xm和ym求偏导,得到:
i∈band(k) (15)
通过表达式(15)求得的xm和ym就是令ε(k)取值最小的xm和ym。
其中,
第四步,求优化后的gd(k)。
对表达式(16)求gd(k)的偏导,由 可以得到:
最后,求优化后的gr(k)。
对表达式(16)求gr(k)的偏导,由 可以得到:
其中,
那么,编码端进行编码的步骤就可以为:分别采用公式(17)和(18)计算gr(k)和gd(k),再将得到的gr(k)和gd(k),以及重要度因子g(k)代入表达式(15),求出每个频率点i上的加权和频谱 然后将求得的数据 gr(k)和gd(k)进行编码并发给解码端。
如果不考虑编码误差在左右声道的分配程度,将公式表达式(15)、(17)和(18)中的g(k)取1即可。
需要说明的是,以上实施例都是以第一声道为左声道,第二声道为右声道为例进行描述。可以理解,如果第一声道为右声道,第二声道为左声道,仍可以根据本发明原理得到一套编码公式和解码公式。编解码原理本质上是一样的,只是推导出来的公式可能在形式上有所区别。
而且,以上实施例只对DFT变换后的左右声道频谱进行子带划分和立体声参数的计算,实际上该方法还适用于进行其它类型时频转换后的左右声道频谱。此外,还可以对立体声信号的左、右声道分别进行子带分解,得到 左、右声道的低频子带域信号,然后对左、右声道的低频子带域信号进行预测分析和时频变换,以获取左、右声道的低频子带域激励谱,此时将左、右声道的激励谱作为左、右声道频谱,并采用本发明实施例的立体声编解码方法进行编解码处理。
此外,以上实施例中划分子带的原因是:各个频带的特征不同,编码阶段得到的立体声参数也不同,因为为了在解码端更好的恢复立体声,在编码时进行子带划分,并针对每个子带进行加权和以及立体声参数的求取。
为了实现以上立体声编解码方法,本发明还提供了立体声编码装置和解码装置。
图4为本发明实施例中立体声编码装置的结构示意图。如图4所示,该立体声编码装置400包括子带划分单元410、第一参数提取单元420、第二参数提取单元430、加权单元440和发送单元450;
所述子带划分单元410,用于分别将立体声的第一声道和第二声道频谱划分为K个子频带,K为正整数;其中,第一声道和第二声道为所述立体声中左声道和右声道中的一个和另一个;本实施例以第一声道为左声道,第二声道为右声道为例。当然,为了获取频谱,本单元还需要在子带划分之前对立体声的左声道信号和右声道信道进行DFT,得到DFT变换域上的左声道频谱和右声道频谱,然后再进行子带划分处理。
该第一参数提取单元420在提取 时,可以直接将第一声道频谱的能量与第二声道频谱的能量之间的比值作为 的值;或者,利用优化过的gr(k)表达式(18)计算gr(k)的值,使得 的值不仅表征第一声道和第二声道的能量比,而且能够令左右声道的均方差加权和最小。
加权单元440,用于采用接收的 作为权值,获取左右声道的加权和频谱 。在计算 时,为了获得最优的 ,可以利用优化过的 表达式(15)计算各频点i的 。在计算过程中需要代入gd(k)和gr(k)的值,这些值可以从第一参数提取单元420和第二参数提取单元430中获取。
第二参数提取单元430,用于在每个子频带k内,分别提取表征 和 之间能量比的第二立体声参数gd(k)。或者,利用优化过的gd(k)表达式(17)计算gd(k)的值,使得gd(k)的值不仅表征左右声道加权差和加权和的能量比,而且能够令左右声道的均方差加权和最小。
图5为本发明实施例中立体声解码装置的结构示意图。如图5所示,该装置500包括接收单元510、中间参数求取单元520以及恢复单元530。
中间参数求取单元520,用于利用加权和频谱 与采用gd(k)作为缩放比的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱 。该中间参数求取单元520具体包括正交模块和缩放模块,其中正交模块产生与 等幅垂直的正交频谱 ,作为缩放后加权差频谱;缩放模块根据 与 方向相同且长度之比为gd(k)的特点,利用gd(k)将 进行缩放,得到
恢复单元530,用于根据所接收的 以及从中间参数求取单元520获得的 恢复左、右声道频谱。该恢复单元530具体包括:左声道恢 复模块和右声道恢复模块,其中左声道恢复模块,将 与 相加,得到; 右声道恢复模块,利用 和 得到缩放后右声道频谱,即 ,然后采用 对 进行缩放,得到
在实际中,中间参数求取单元520可以只求取正交频谱 ,然后由缩放模块将 和gd(k)输出给恢复单元530即可。恢复单元530中的左声道恢复模块存储公式(11),即 右声道恢复模块存储公式(12),即 那么左声道恢复模块和右声道恢复模块只需要获取相应参数并代入公式计算就可以了。
由以上所述可以看出,本发明所提供的立体声编解码方法,能实现低码率下对立体声的高质量编码。解码过程也无需任何的角度计算,降低了解码复杂度,从而减少了解码端的解码时间。当采用优化公式进行编码运算时,还能够进一步提高编解码质量。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (20)
1.一种立体声编码方法,其特征在于,该方法包括:
A、编码端提取表征立体声中第一声道频谱与第二声道频谱的能量比的第一立体声参数,表征第一声道和第二声道的加权差频谱与加权和频谱能量比的第二立体声参数,并获取第一声道和第二声道的加权和频谱;
所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的;
所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的;
其中,加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
B、对所述加权和频谱、第一立体声参数和第二立体声参数进行编码,向解码端发送。
2.如权利要求1所述的方法,其特征在于,步骤A之前进一步包括:
A0、分别将立体声的第一声道频谱和第二声道频谱划分为K个子频带,K为正整数;
所述步骤A为:分别提取各子频带k内的第一立体声参数和第二立体声参数,以及以第一立体声参数为加权权值的加权和频谱;k=1、2...K;
所述步骤B为:对所述各子频带的加权和频谱、第一立体声参数和第二立体声参数进行编码,向解码端发送。
3.如权利要求1或2所述的方法,其特征在于,所述第一立体声参数为:第一声道频谱的能量值与第二声道频谱的能量值之间的比值;
所述第二立体声参数为:加权差频谱的能量值与加权和频谱的能量值之间的比值。
4.如权利要求2所述的方法,其特征在于,所述第一立体声参数、第二立体声参数和加权和频谱都是根据令第一声道的均方差与第二声道的均方差的加权和最小准则获取的。
6.如权利要求5所述的方法,其特征在于,所述g(k)取1。
7.如权利要求5所述的方法,其特征在于,所述g(k)为表征编码误差在第一声道和第二声道分配程度的重要度因子。
8.如权利要求7所述的方法,其特征在于,所述重要度因子为:第一声道频谱与第二声道频谱的能量比。
9.一种立体声解码方法,其特征在于,该方法包括:
A、解码端接收立体声第一声道与第二声道的加权和频谱,以及第一立体声参数和第二立体声参数;所述第一立体声参数表征第一声道频谱和第二声道频谱的能量比,所述第二立体声参数表征第一声道和第二声道的加权差频谱与加权和频谱的能量比;
所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的;
所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的;
其中,加权的权值为所述第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
B、利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱;
C、根据所述加权和频谱、加权差频谱以及第一立体声参数,恢复第一声道频谱和第二声道频谱。
10.如权利要求9所述的方法,其特征在于,所述步骤A接收的所述加权和频谱、第一立体声参数和第二立体声参数是各子频带的加权和频谱、第一立体声参数和第二立体声参数;
所述步骤B为:利用各子频带对应的加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,分别计算各子频带的加权差频谱;
所述步骤C为:根据各子频带对应的所述加权和频谱、加权差频谱以及第一立体声参数,恢复各子频带的第一声道频谱和第二声道频谱。
11.如权利要求9所述的方法,其特征在于,所述步骤B包括:
b1、产生与所述加权和频谱等幅垂直的正交频谱,作为缩放后加权差频谱;
b2、利用所述第二立体声参数对所述缩放后加权差频谱进行缩放,得到加权差频谱。
12.如权利要求9所述的方法,其特征在于,所述步骤C包括:
c1、将所述加权和频谱与所述加权差频谱相加,得到左声道频谱;
c2、根据加权和频谱和左声道频谱,得到缩放后右声道频谱;
c3、利用所述第一立体声参数对得到的缩放后右声道频谱进行缩放,得到右声道频谱。
13.一种立体声编码装置,其特征在于,该装置包括第一参数提取单元、第二参数提取单元、加权单元和发送单元;
所述第一参数提取单元,用于提取表征立体声第一声道频谱和第二声道频谱的能量比的第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
所述加权单元,用于获取每个频点上第一声道和第二声道的加权和频谱,加权的权值为所述第一立体声参数;
所述第二参数提取单元,用于提取表征第一声道和第二声道加权差频谱与所述加权和频谱之间能量比的第二立体声参数;
所述发送单元,用于向解码端发送从第一参数提取单元获取的第一立体声参数、从第二参数提取单元获取的第二立体声参数和从加权单元获取的加权和频谱;
所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的;
所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的。
14.如权利要求13所述的编码装置,其特征在于,该编码装置进一步包括子带划分单元,用于分别将立体声的第一声道频谱和第二声道频谱划分为K个子频带,K为正整数;
所述第一参数提取单元、第二参数提取单元和加权单元分别对各子频带执行自身处理功能。
15.如权利要求13所述的编码装置,其特征在于,所述第一参数提取单元将所述第一声道频谱的能量值与所述第二声道频谱的能量值之间的比值作为第一立体声参数;
所述第二参数提取单元将所述加权差频谱的能量值与所述加权和频谱的能量值之间的比值作为第二立体声参数。
16.如权利要求13所述的编码装置,其特征在于,所述第一参数提取单元进一步用于,根据令第一声道的均方差与第二声道的均方差的加权和最小准则获取所述第一立体声参数;
所述第二参数提取单元进一步用于,根据令第一声道的均方差与第二声道的均方差加权和最小的准则获取所述第二立体声参数;
所述加权单元进一步用于,根据第一声道的均方差与第二声道的均方差加权和最小准则获取所述加权和频谱。
17.一种立体声解码装置,其特征在于,该装置包括接收单元、中间参数求取单元和恢复单元;
所述接收单元,用于接收立体声第一声道与第二声道的加权和频谱,以及第一立体声参数和第二立体声参数;所述第一立体声参数表征第一声道频谱和第二声道频谱之间的能量比,所述第二立体声参数表征第一声道和第二声道的加权差频谱和加权和频谱的能量比;加权的权值为第一立体声参数;
所述加权和频谱是将左右声道中的第二声道频谱进行长度缩放,使得缩放后第二声道频谱与未缩放的第一声道频谱能量相等,然后将未缩放第一声道频谱和缩放后第二声道频谱进行向量相加得到的;
所述加权差频谱是将上述未缩放第一声道频谱和缩放后第二声道频谱相减得到的;
其中,加权的权值为第一立体声参数;所述第一声道和第二声道分别为所述立体声中左声道和右声道中的一个和另一个;
所述中间参数求取单元,用于利用加权和频谱与采用第二立体声参数进行缩放的缩放后加权差频谱具有等幅垂直的特点,计算加权差频谱;
所述恢复单元,用于根据所述加权和频谱、加权差频谱以及第一立体声参数,恢复第一声道频谱和第二声道频谱。
18.如权利要求17所述的解码装置,其特征在于,所述接收单元接收的所述加权和频谱、第一立体声参数和第二立体声参数是各子频带的加权和频谱、第一立体声参数和第二立体声参数;
中间参数求取单元和恢复单元分别对各子频带执行自身处理功能。
19.如权利要求17所述的解码装置,其特征在于,所述中间参数求取单元包括正交模块和缩放模块;
所述正交模块,用于产生与所述加权和频谱等幅垂直的正交频谱,作为缩放后加权差频谱;
所述缩放模块,用于利用所述第二立体声参数对所述缩放后加权差频谱进行缩放,得到加权差频谱。
20.如权利要求19所述的解码装置,其特征在于,所述恢复单元包括左声道恢复模块和右声道恢复模块;
所述左声道恢复模块,用于将所述加权和频谱与所述加权差频谱相加,得到左声道频谱;
所述右声道恢复模块,用于根据加权和频谱和左声道频谱,得到缩放后的右声道频谱,利用所述第一立体声参数对得到的缩放后右声道频谱进行缩放,得到右声道频谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101147525A CN101604524B (zh) | 2008-06-11 | 2008-06-11 | 立体声编码方法及其装置、立体声解码方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101147525A CN101604524B (zh) | 2008-06-11 | 2008-06-11 | 立体声编码方法及其装置、立体声解码方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101604524A CN101604524A (zh) | 2009-12-16 |
CN101604524B true CN101604524B (zh) | 2012-01-11 |
Family
ID=41470230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101147525A Active CN101604524B (zh) | 2008-06-11 | 2008-06-11 | 立体声编码方法及其装置、立体声解码方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101604524B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102280107B (zh) * | 2010-06-10 | 2013-01-23 | 华为技术有限公司 | 边带残差信号生成方法及装置 |
WO2019035622A1 (ko) * | 2017-08-17 | 2019-02-21 | 가우디오디오랩 주식회사 | 앰비소닉 신호를 사용하는 오디오 신호 처리 방법 및 장치 |
CN108550369B (zh) * | 2018-04-14 | 2020-08-11 | 全景声科技南京有限公司 | 一种可变长度的全景声信号编解码方法 |
CN109036456B (zh) * | 2018-09-19 | 2022-10-14 | 电子科技大学 | 用于立体声的源分量环境分量提取方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1199202A (zh) * | 1997-05-13 | 1998-11-18 | 索尼株式会社 | 编码方法和设备以及记录介质 |
CN1973320A (zh) * | 2004-04-05 | 2007-05-30 | 皇家飞利浦电子股份有限公司 | 立体声编码和解码的方法及其设备 |
CN101067931A (zh) * | 2007-05-10 | 2007-11-07 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
CN101071570A (zh) * | 2007-06-21 | 2007-11-14 | 北京中星微电子有限公司 | 耦合声道的编、解码处理方法、音频编码装置及解码装置 |
-
2008
- 2008-06-11 CN CN2008101147525A patent/CN101604524B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1199202A (zh) * | 1997-05-13 | 1998-11-18 | 索尼株式会社 | 编码方法和设备以及记录介质 |
CN1973320A (zh) * | 2004-04-05 | 2007-05-30 | 皇家飞利浦电子股份有限公司 | 立体声编码和解码的方法及其设备 |
CN101067931A (zh) * | 2007-05-10 | 2007-11-07 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
CN101071570A (zh) * | 2007-06-21 | 2007-11-14 | 北京中星微电子有限公司 | 耦合声道的编、解码处理方法、音频编码装置及解码装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101604524A (zh) | 2009-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101183527B (zh) | 用于对高频信号进行编码和解码的方法和设备 | |
CN101770776B (zh) | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 | |
CN101083076B (zh) | 使用带宽扩展技术对信号编码和解码的方法和设备 | |
CN102834863B (zh) | 用于包括通用音频和语音帧的音频信号的解码器 | |
CN101067931B (zh) | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 | |
CN101297356B (zh) | 用于音频压缩的方法和设备 | |
CN110047496B (zh) | 立体声音频编码器和解码器 | |
CN1914668B (zh) | 用于信号时间标度的方法及设备 | |
CN101140759B (zh) | 语音或音频信号的带宽扩展方法及系统 | |
CN101276587B (zh) | 声音编码装置及其方法和声音解码装置及其方法 | |
CN101223821B (zh) | 音频解码器 | |
CN102272832B (zh) | 基于峰值检测的选择性缩放掩码计算 | |
CN101662288B (zh) | 音频编码、解码方法及装置、系统 | |
JP5193070B2 (ja) | 主成分分析に基づくマルチチャネルオーディオ信号の段階的な符号化のための装置および方法 | |
KR20190072647A (ko) | 위상 보상을 이용하여 멀티 채널 신호를 다운믹싱 또는 업믹싱하는 장치 및 방법 | |
US7805314B2 (en) | Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data | |
CN101682333B (zh) | 对音频信号编码和解码的方法和设备 | |
CN103366749B (zh) | 一种声音编解码装置及其方法 | |
CN105280190B (zh) | 带宽扩展编码和解码方法以及装置 | |
CN103366750B (zh) | 一种声音编解码装置及其方法 | |
UA123426C2 (uk) | Зворотно сумісна інтеграція методів високочастотного відновлення для аудіосигналів | |
CN104718570A (zh) | 帧丢失恢复方法,和音频解码方法以及使用其的设备 | |
CN101604524B (zh) | 立体声编码方法及其装置、立体声解码方法及其装置 | |
CN112424861A (zh) | 多声道音频编码 | |
CN103366751B (zh) | 一种声音编解码装置及其方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20091216 Assignee: Pan Xingde Assignor: Beijing Tianlai Chuanyin Digital Technology Co., Ltd. Contract record no.: 2013990000772 Denomination of invention: Stereo coding method, stereo coding device, stereo decoding method and stereo decoding device Granted publication date: 20120111 License type: Common License Record date: 20131119 |
|
LICC | Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model |