CN101202043A - 音频信号的编码方法和系统与解码方法和系统 - Google Patents
音频信号的编码方法和系统与解码方法和系统 Download PDFInfo
- Publication number
- CN101202043A CN101202043A CNA2007103044868A CN200710304486A CN101202043A CN 101202043 A CN101202043 A CN 101202043A CN A2007103044868 A CNA2007103044868 A CN A2007103044868A CN 200710304486 A CN200710304486 A CN 200710304486A CN 101202043 A CN101202043 A CN 101202043A
- Authority
- CN
- China
- Prior art keywords
- unit
- coding
- sound signal
- frequency
- acoustic channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 271
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000006243 chemical reaction Methods 0.000 claims description 31
- 238000013139 quantization Methods 0.000 claims description 25
- 238000001228 spectrum Methods 0.000 claims description 21
- 230000009466 transformation Effects 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 10
- 238000011002 quantification Methods 0.000 claims description 8
- 230000006835 compression Effects 0.000 abstract description 10
- 238000007906 compression Methods 0.000 abstract description 10
- 238000012545 processing Methods 0.000 abstract description 3
- 230000001131 transforming effect Effects 0.000 abstract 4
- 238000010586 diagram Methods 0.000 description 10
- 230000007423 decrease Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种音频信号的编码方法和系统与解码方法和系统,属于多媒体信号处理和信源编码领域。编码方法包括:对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换;对经过正交旋转变换的左右声道的音频信号进行编码。解码方法包括:对接收到的码流数据进行解码输出经过解码的音频信号;对经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换。编码系统包括:极大相关度旋转变换模块和编码模块。解码系统包括:解码模块和极大相关度逆旋转变换模块。本发明通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
Description
技术领域
本发明涉及多媒体信号处理和信源编码领域,特别涉及一种音频信号的编码方法和系统与解码方法和系统。
背景技术
立体声信号有两个主要来源,一个是采用双麦克风或多麦克自然录音,另一个是音频工作室人工混音。前者各通道音频来自同一个音频场景,除了由于麦克风摆位造成的时间差、强度差等不同,他们记录音频信息基本一致,因此有很强的相关性。后者在大多数情况下力求营造具有真实感的音频场景,因此声道间也具有很强的相关性。
利用这种相关性降低立体声编码的码率是音频编码领域一个重要的研究课题。较早提出的是和差立体声(Sum-difference Stereo)。该方法将原始立体声信号中的左声道L与右声道R在频域对应频率处进行相加和相减处理,分别得到和声道S与差声道D。在理想的情况下,L等于R,那么D就为0。通常L与R有明显的相关但不会严格一致,因此多数情况下D的能量非0但明显小于R,可以用较小的比特率进行编码。由于仍需要对变换后的两个声道S与D独立编码,码率下降有限。该方法用于MP3(MPEG-1 Layer III)和AAC(Advanced Audio Coding)立体声编码。
为了使码率进一步下降,需要引入心理声学以去除声道间的主观冗余。人的听觉可以用一个非均匀带宽的滤波器组描述,每个滤波器组通道被称为一个子带,它是最小的听觉单位,空间感主要来自左右声道对应子带信号的整体特性,如强度差、延时、相关度,而对子带信号的细节不敏感。基于上面的心理声学原理,MP3和AAC中还采用了强度立体声(IntensityStereo)。该方法在每个子带,只将其中一个声道的信号,以及另一个声道与之的能量比传送给解码器。解码器根据和信号与能量比,恢复出和原始立体声信号能量相等但有细节差异的立体声信号。该方法使码率有明显下降,但由于不能重建频谱细节,它也带来一定的音质损失,因此主要用于人耳不敏感的较高频率子带。
发明内容
为了进一步降低立体声编码的码率,本发明提供了一种音频信号的编解码方法和系统。所述技术方案如下:
一种音频信号的编码方法,所述方法包括:
步骤A:对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换;
步骤B:对经过所述正交旋转变换的左右声道的音频信号进行编码,形成码流数据。
所述步骤A具体包括:
步骤A1:对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号;
步骤A2:提取所述左右声道的频域音频信号的极大相关度旋转角;
步骤A3:对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。
所述步骤B具体包括:
步骤B1:对经过所述正交旋转变换的左右声道的音频信号进行和差立体声编码,形成和差音频码流;
步骤B2:对旋转角进行量化熵编码,形成参数码流;
步骤B3:对所述和差音频码流进行量化和熵编码;
步骤B4:将经过量化和熵编码的所述和差音频码流和参数码流组合成编码码流。
所述步骤B具体包括:
步骤B1:对经过所述正交旋转变换的左右声道的音频信号进行强度立体声编码,形成强度音频码流;
步骤B2:对旋转角进行量化熵编码,形成参数码流;
步骤B3:对所述强度音频码流进行量化和熵编码;
步骤B4:将经过量化和熵编码的所述强度音频码流和参数码流组合成编码码流。
所述步骤A1具体为:
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号。
所述步骤A1具体为:
对左右声道的时域音频信号进行快速傅里叶变换输出左右声道的频域音频信号。
所述步骤A具体包括:
步骤A1:对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号;
步骤A2:将所述左右声道的频域音频信号划分为连续无重叠的子带信号;
步骤A3:提取所述左右声道的子带信号的极大相关度旋转角;
步骤A4:对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。
所述步骤B具体包括:
步骤B1:将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音频信号;
步骤B2:对下混声道的音频信号进行编码,形成编码码流。
所述步骤A1具体为:
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号;
所述步骤A2具体为:
将所述左右声道的频域音频信号按照等效矩形带宽划分为连续无重叠的子带信号。
所述步骤A1具体为:
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号;
所述步骤A2具体为:
将所述左右声道的频域音频信号按照临界带宽划分为连续无重叠的子带信号。
一种音频信号的解码方法,所述方法包括:
步骤A:对接收到的码流数据进行解码输出经过解码的音频信号;
步骤B:对所述经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换,输出左右声道的音频信号。
所述步骤A具体为:
步骤A1:将码流分解成音频码流和参数码流;
步骤A2:将音频码流和参数码流分别进行熵解码和反量化得到频谱数据以及旋转角度;
步骤A3:根据编码的模式对所述频谱数据进行解码得到两路音频信号。
所述步骤B具体为:
步骤B1:对所述解码得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换;
步骤B2:对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
所述步骤B2具体为:
对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时域音频信号。
所述步骤B2具体为:
对经过所述正交逆旋转变换的两路音频信号进行快速傅里叶逆变换输出左右声道的时域音频信号。
所述步骤A具体为:
步骤A1:对所述编码码流进行解码得到下混声道的音频信号;
步骤A2:对下混声道的音频信号进行子带划分,输出连续无重叠的子带;
步骤A3:将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路子带信号;
相应的,所述步骤B具体包括:
步骤B1:对所述经过正交旋转变换的两路子带信号以极大相关度旋转角为旋转角进行正交逆旋转变换;
步骤B2:对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
所述步骤B2具体为:
对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时域音频信号。
所述步骤A2具体为:
对下混声道的音频信号按照等效矩形带宽进行子带划分,输出连续无重叠的子带。
所述步骤A2具体为:
对下混声道的音频信号按照临界带宽进行子带划分,输出连续无重叠的子带。
一种音频信号的编码系统,包括极大相关度旋转变换模块、编码模块;
所述极大相关度旋转变换模块,用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换;
所述编码模块,用于对所述经过正交旋转变换的音频信号进行编码形成编码码流。
所述极大相关度旋转变换模块具体包括时频分析单元、极大相关度旋转变换单元;
所述时频分析单元,用于对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号;
所述极大相关度旋转变换单元,用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换;
所述编码模块具体包括编码单元、量化熵编码单元、码流成型单元;
所述编码单元,用于对经过所述正交旋转变换的左右声道的音频信号进行编码,形成码流;
所述量化熵编码单元,用于对所述音频码流和参数码流分别进行量化和熵编码,去除信号的主观冗余;
码流成型单元,用于将经过量化和熵编码的所述码流和参数码流组合成编码码流。
所述时频分析单元具体为具体为快速傅里叶变换单元。
所述时频分析单元具体为具体为多相滤波器组变换单元。
所述极大相关度旋转变换模块具体包括快速傅里叶变换单元、极大相关度旋转变换单元;
所述快速傅里叶变换单元,用于对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号;
所述极大相关度旋转变换单元,用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换;
所述编码模块具体包括下混单元、快速傅里叶逆变换单元、编码单元、矢量量化单元、复用单元;
所述下混单元,用于将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音频信号;
所述快速傅里叶逆变换单元,用于将下混后一路音频信号进行快速傅里叶逆变换为时域的音频信号;
所述编码单元,用于对经过所述正交旋转变换的左右声道的音频信号进行编码,形成音频码流;
所述矢量量化单元,用于形成量化指标数码流,以便进一步去除旋转角参数的客观冗余,降低参数码率;
所述复用单元,用于将形成的音频码流和量化指标数码流封装成给定格式的编码码流。
一种音频信号的解码系统,包括解码模块、极大相关度逆旋转变换模块;
所述解码模块,用于对接收到的码流数据进行解码,输出经过解码的音频信号;
所述极大相关度逆旋转变换模块,用于对所述经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换,输出左右声道的音频信号。
所述解码模块具体包括码流解析单元、熵解码反量化单元、解码单元;
所述码流解析单元,用于将码流分解成音频码流和参数码流;
所述熵解码反量化单元,用于将音频码流进行熵解码和反量化得到频谱数据以及旋转角度;
所述解码单元,用于根据编码的模式对所述频谱数据进行解码得到两路音频信号;
所述极大相关度逆旋转变换模块,具体包括极大相关度逆旋转变换单元、时频综合单元;
所述极大相关度逆旋转变换单元,用于对所述解码得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换;
所述时频综合单元,用于对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
所述时频综合单元具体为快速傅里叶逆变换单元。
所述时频综合单元具体为多相滤波器组逆变换单元。
所述解码模块具体包括解码单元、快速傅里叶变换单元、上混单元、反矢量量化单元;
所述解码单元,用于根据编码的模式对所述频谱数据进行解码得到两路音频信号;
所述快速傅里叶变换单元,用于将解码单元输出的的音频信号进行快速傅里叶变换输出频域的音频信号;
所述上混单元,用于将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路音频信号;
所述反矢量量化单元,用于从量化指标数查找出对应的旋转角参数,以便解码端进行相应的逆旋转变换;
所述极大相关度逆旋转变换模块,具体包括极大相关度逆旋转变换单元、快速傅里叶逆变换单元;
所述极大相关度逆旋转变换单元,用于对所述上混得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换;
所述快速傅里叶逆变换单元,用于对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
本发明通过对左右声道的音频信号进行极大相关度旋转变换,然后将两路音频信号进行编码,解码后再对两路音频信号进行极大相关度逆旋转变换,还原出左右声道的音频信号。由于对音频信号进行极大相关度旋转与逆旋转变换,改善了信号质量,所以与传统的只对两路音频信号进行编解码操作的编解码方法与系统相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
附图说明
图1是本发明实施例1提供的音频信号的编码方法的流程图;
图2是本发明实施例2提供的音频信号的解码方法的流程图;
图3是本发明实施例3提供的音频信号的编码系统的结构示意图;
图4是本发明实施例4提供的音频信号的解码系统的结构示意图;
图5是本发明实施例1提供的音频信号的编码方法中适于和差立体声或强度立体声编码的两路子带信号示意图;
图6是本发明实施例1提供的音频信号的编码方法中不适于和差立体声或强度立体声编码的两路子带信号示意图;
图7是本发明实施例1提供的音频信号的编码方法中极大相关度正交旋转对子带信号的作用示意图;
图8是本发明实施例1提供的音频信号的编码方法中极大相关度正交旋转的空间心理声学意义示意图;
图9是本发明实施例5提供的音频信号的编码方法的流程图;
图10是本发明实施例6提供的音频信号的解码方法的流程图;
图11是本发明实施例7提供的音频信号的编码系统的结构图;
图12是本发明实施例8提供的音频信号的解码系统的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
参见图1,本发明实施例提供了一种音频信号的编码方法,具体包括以下步骤:
步骤101:对左右声道时域音频信号进行时频变换;
输入为左右声道时域音频信号,输出为左右声道频域音频信号,这里可以采用FFT(FastFlourier Transform,快速傅里叶变换),MDCT(Modified Discrete Cosine Transform,修正离散余弦变换),或是PQMF(Polyphase Quadrature Mirror Filterbank,多相滤波器组)来实现。
步骤102:划分子带;
将左右声道的频域音频信号输出为按照一定带宽划分的连续无重叠的子带,子带的带宽与人的听觉特性匹配,从低频到高频,带宽不断增大,在理想的情况下与心理声学中的关键带(Critical Band)或等效矩形带宽(Equivalent Rectangular Bandwidth,ERB)一致。
步骤103:提取两路子带的极大相关度旋转角度;
相对于原始时域音频信号,按照心理声学划分的子带信号的有两个重要特点:首先原始信号中包含的各个声源在子带信号域有一定的分离,而分离声源的子带信号具有相对简单的空间心理声学描述,即单一的空间位置感;其次,其根据心理声学,每个子带可以作为一个独立的听觉单元,即便子带包含多个声源,主观听觉是多个声源的整体作用的结果,而不再区分单独的声源,此时即便不能精确重建信号中各个声源,只要重建整体作用的结果,也可以达到与原始信号相同的听觉效果。
理想的情况下,立体声左右声道的子带信号是相应频带内某一声源经不同路径直达左右麦克风,并被采集的相关但是不完全相同的两路信号。声源本身的信息体现在子带的波形(滤波器组)或频谱(时频变换);而声源的位置则主要体现为左右两路子带信号的强度差和时间差上。将左右声道的子带信号按时间(滤波器组)或频率(时频变换)排列分别形成向量Xl和Xr,维数等于子带的数据点数。上面的关系可以表示为对一般的立体声信号,有较大的概率相关度Re{corr(Xl,Xr)}=Re{<Xl,Xr>}/|Xl||Xr|≈1,幅度|Xl|≈|Xr|,且|Xl-Xr|<<min{|Xl|,|Xr|},如图5所示,其中<·,·>是标量积,|·|是向量的模或长度。此时和信号Xs=(Xl+Xr)/2≈Xl≈Xr,差信号Xd=(Xl-Xr)/2≈0,和信号的编码比特数与原来左右声道子带信号基本一致,差信号可以用较少的比特数进行编码,和差立体声有较高的编码增益。同时由于Re{corr(Xl,Xr)}接近1,Xl与Xr的夹角接近0,二者主要相差一个比例因子,因此强度立体声引入的失真较小,编码增益高。
然而实际的立体声信号由于环境噪音,墙体、地面的多次反射、折射和吸收,以及多声源的影响,左右子带信号的相关性大大降低,甚至出现负相关,如图6所示。由于Xd的长度并不明显小于原始左右信号,和差立体声编码增益不明显;强度立体声重建的左右子带信号方向相同,在Xl和Xr其中之一的方向上,而Xl与Xr的夹角较大,因而引入明显的失真。
从上面的分析可以看出,相关度是与和差立体声或强度立体声的编码效率密切相关:相关度越大,编码增益就越大。本发明提出如下正交旋转变换可以提高原始左右子带信号的相关度,因而可以提高立体声编码的效率:
其中θ是使Re{corr(Y0,Y1)}有最大值旋转角度,不大于-π/2且不小于π/2。将变换后的子带信号以代数式表示有
进一步,相关度corr(Y0,Y1)可以表示为
令
则使Re{corr(Y0,Y1)}有最大值且不超过±π/2的θ可以表示为
在这个特定旋转角度变换下,子带信号Y0和Y1的能量EY0和EY1有下述重要而简单的关系
而子带信号Y0和Y1有最大的相关度
其中EXl和EXr分别为Xl和Xr的能量。差信号Yd=(Y0-Y1)/2的能量EYd与原差信号Xd=(Xl-Xr)/2的能量EXd有下面的关系
步骤104:对两路子带信号进行极大相关度旋转变换,获得具有正交旋转变换下最大相关度的两路子带信号;
图7是这种特定的正交旋转变换的示意图。由于采用正交旋转变换,变换前后子带能量之和不变,即EY0+EY1=EXl+EXr,并且从(6)式看出,变换后的子带信号Y0和Y1的能量EY0和EY1恒等。对典型的立体声信号,从(7)式看出,变换的两路子带信号Y0和Y1的相关度Re{corr(Y0,Y1)}大于原信号Xl和Xr的相关度Re{corr(Xl,Xr)};从(8)看出,变换后的差信号Yd的能量EYd小于原差信号Xd的能量EXd。如果采用和差立体声处理,由于差信号能量降低,立体声编码的效率将提高;如果采用强度立体声,首先由于相关度的增加,编码引入的失真将减小,此外子带能量比例因子恒为1,因此不需要在码流中记录这个参数。
进行这种特定的正交旋转变换,编码器需要向解码器每个子带传送一个旋转角度参数θ。如果对某一子带,这种变换的立体声编码增益远大于传送旋转角度θ的编码码流比特数增加,那么在当前子带应用这种变换的总体编码效率是增加的;否则可以不在当前带进行这种变换。这样,编码器在大多数情况下,立体声编码的效率将有明显提高,并且在所有情况下,不会导致立体声编码效率的下降。
图8是极大正交旋转角度与声像空间位置关系的示意图。当旋转角度θ=0时,此时声源的空间位置是正前方;当旋转角度θ从0逐渐变大时,对应的声源空间位置逐渐右移:当θ=π/4时,声源处于正右方,当θ=π/2时,声源处于正后方;当旋转角度θ从0逐渐变小时,对应的声源位置逐渐左移:当θ=-π/4时,声源出于正左方,当θ=-π/2时,声源处于正后方。同时,当-π/4≤θ≤π/4时,左右声道的信号是同相的,当-π/2≤θ<-π/4和π/4≤θ<π/2时,左右声道的信号是反相的。
步骤105:根据码率及两路子带信号特性,选择和差或强度立体声进行编码;
形成和差音频码流或强度音频码流。
步骤106:将输出的信号及旋转角度分别进行量化和熵编码,进一步去除信号的主客观冗余;
对旋转角进行量化熵编码,形成参数码流。
步骤107:将输出的信号按照给定的格式组合成编码码流。
本实施例通过对左右声道的音频信号进行极大相关度旋转变换,然后将两路音频信号进行编码。由于对音频信号进行极大相关度旋转变换,改善了信号质量,所以与传统的只对两路音频信号进行编码操作的编码方法相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
实施例2
参见图2,本发明实施例提供了一种音频信号的解码方法,具体包括以下步骤:
步骤111:将编码码流分解成音频码流和参数码流。
步骤112:将音频码流和参数码流分别进行熵解码和反量化得到频谱数据以及旋转角度。
步骤113:根据立体声编码的模式,进行相应的和差或强度立体声解码得到两路相关子带信号。
步骤114:对两路子带信号进行极大相关度逆旋转输出左右子带信号。
步骤115:将左右子带信号进行时频综合,重建时域左右声道数字音频信号。
本实施例通过对解码后的两路音频信号进行极大相关度逆旋转变换,还原出左右声道的音频信号。由于对音频信号进行极大相关度逆旋转变换,改善了信号质量,所以与传统的只对两路音频信号进行解码操作的解码方法相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
另外,实施例1与实施例2可以结合起来,组成一种音频信号的编解码方法。
实施例3
参见图3,本发明实施例提供了一种音频信号的编码系统,包括时频分析单元501和502,极大相关度旋转变换单元503、和差或强度立体声编码单元504、量化熵编码单元505和506、以及码流成型模块单元507。
时频分析单元501和502,用于分别对左右声道的信号进行时频变换,这里可以是FFT,MDCT,或是多相滤波器组;
极大相关度旋转变换单元503是核心单元,通过(3)式所述变换,并且旋转角度由(5)式决定,获得具有正交旋转变换下最大相关度的两路子带信号;
和差或强度立体声编码单元504根据码率及两路子带信号特性,选择和差或强度立体声进行编码;
量化熵编码单元505和506将和差或强度立体声编码单元504的输出及旋转角度分别进行量化和熵编码,进一步去除信号的主客观冗余并对旋转角进行量化熵编码,形成参数码流;
码流成型模块单元507将量化熵编码单元505和506的输出按照给定的格式组合成编码码流。
本实施例通过对左右声道的音频信号进行极大相关度旋转变换,然后将两路音频信号进行编码。由于对音频信号进行极大相关度旋转变换,改善了信号质量,所以与传统的只对两路音频信号进行编码操作的编码系统相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
实施例4
参见图4,本发明实施例提供了一种音频信号的解码系统,具体包括码流解析单元601、熵解码及反量化单元602和603、和差或强度立体声解码单元604、极大相关度逆旋转单元605、以及时频综合单元606和607。
码流解析单元601,用于将编码码流分解成后续模块需要音频码流和参数码流;
熵解码及反量化单元602和603,用于将音频码流和参数码流分别进行熵解码和反量化,得到频谱数据以及旋转角度;
和差或强度立体声解码单元604,用于根据立体声编码的模式,进行相应的和差或强度立体声解码,得到两路相关子带信号;
极大相关度逆旋转单元605,用于对这两路子带信号进行极大相关度逆旋转,输出左右子带信号;
时频综合单元606和607,用于分别将左右子带信号进行时频综合,重建时域左右声道数字音频信号。
本实施例通过对解码后的两路音频信号进行极大相关度逆旋转变换,还原出左右声道的音频信号。由于对音频信号进行极大相关度逆旋转变换,改善了信号质量,所以与传统的只对两路音频信号进行解码操作的解码系统相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
另外,实施例3与实施例4可以结合起来,组成一种音频信号的编解码系统。
实施例5
参见图9,本发明实施例提供了一种音频信号的编码方法,具体包括以下步骤:
步骤301:对左右声道时域信号进行MDCT,输出左右声道的MDCT频谱;
步骤302:将左右声道的MDCT频谱输出为按照等效矩形带宽ERB或临界带宽划分的连续无重叠的子带;
步骤303:提取两路子带信号的极大相关度旋转角度;
输入为左右声道的MDCT域子带信号,输出为子带信号的极大相关度旋转角度,由于MDCT是实变换,旋转角度由下列公式计算:
其中
这里Xl和Xr分别表示MDCT域左右声道的子带信号向量;
步骤304:对两路子带信号进行极大相关度旋转,输出变换后的两路子带信号;
按下面的公式计算:
其中Y0和Y1是变换后的两路子带信号;
步骤305:对变换后的两路子带信号进行下混,输出子带信号的平均值,这些子带信号按频率排列就是下混声道的MDCT频谱;
步骤306:对下混声道的MDCT频谱进行编码形成码流。
本实施例通过对左右声道的音频信号进行极大相关度旋转变换,然后下混,将两路音频信号变为一路音频信号后再进行编码。由于对音频信号进行极大相关度旋转与逆旋转变换,改善了信号质量,所以与传统的只对一路音频信号进行编码操作的编码方法相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
实施例6
参见图10,本发明实施例提供了一种音频信号的解码方法,具体包括以下步骤:
步骤311:对码流进行解码输出下混声道的MDCT频谱;
步骤312:将下混声道的MDCT频谱输出为无重叠的MDCT域的一路子带;
步骤313:将MDCT域的一路子带信号进行上混,输出MDCT域的两路子带信号,这两路信号都是输入子带信号的复制;
步骤314:对MDCT域的两路子带信号进行极大相关度逆旋转,输出左右声道的两路子带信号;
输入为上混得到的MDCT域的两路子带信号,输出为逆旋转得到的对应左右声道的两路子带信号Xl和Xr,按下面的公式计算:
其中θ是编码端计算得到的极大相关旋转角;
步骤315:对左右声道的两路子带信号进行IMDCT(Inverse Modified Discrete CosineTransform,修正离散余弦逆变换),输出左右声道时域信号,是步骤301的逆变换。
本实施例通过对解码后的音频信号进行上混,将一路音频信号还原为两路音频信号,再对两路音频信号进行极大相关度逆旋转变换,还原出左右声道的音频信号。由于对音频信号进行极大相关度逆旋转变换,改善了信号质量,所以与传统的只对一路音频信号进行解码操作的解码方法相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
另外,实施例5与实施例6可以结合起来,组成一种音频信号的编解码方法。
实施例7
参见图11,本发明实施例提供了一种音频信号的编码系统,包括FFT单元、极大相关度旋转变换单元、矢量量化单元、下混单元、IFFT(Inverse Fast Flourier Transform,快速傅里叶逆变换)单元、编码单元以及MUX(Multiplexer,复用)单元。编码的输入是左右两路时域信号,分别经FFT后的两路FFT频谱经极大相关度旋转变换,得到各个子带的旋转角度并进行矢量量化,输出码字,同时输出两路极大相关变换的子带信号,经下混得到一路FFT域子带信号,经IFFT得到时域下混信号,最后由编码单元进行编码,输出编码码字,将矢量量化单元输出的码字与编码单元输出的编码码字一同输入MUX单元,封装成给定格式的码流。
对于极大相关度旋转变换单元,由于FFT是复变换,特别的可以采用每个子带提取一个参数的模式提取旋转角度,如下所示:
其中
相应的旋转变换为
也可以采用每个子带提取两个参数的模式提取旋转角度,分别对应实部和虚部,如下所示:
θr和θi分别表示实部和虚部的旋转角度,其中θr0和θi0由下面的公式得到
相应的实部和虚部的旋转变换为
也可以采用将谱线的幅度和相位分别处理的方式,如下所示
θA和θp分别表示幅度和相位的旋转角度,其中θA0和θp0由下面的公式得到
本实施例通过对左右声道的音频信号进行极大相关度旋转变换,然后下混,将两路音频信号变为一路音频信号后再进行编码。由于对音频信号进行极大相关度旋转与逆旋转变换,改善了信号质量,所以与传统的只对一路音频信号进行编码操作的编码系统相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
实施例8
参见图12,本发明实施例提供了一种音频信号的解码系统,包括:解码单元、FFT单元、上混单元、反矢量量化单元、极大相关度逆旋转变换单元、IFFT单元以及MUX单元。解码的输入是MUX单元输出的下混声道的编码码字和各子带旋转角度的矢量量化码字;首先解码单元根据编码码字解码得到时域下混声道,经FFT得到频域下混信号,上混后成为两路相关的频域信号,反矢量量化单元,用于从量化指标数查找出对应的旋转角参数,以便解码端进行相应的逆旋转变换,极大相关解码单元根据这个旋转角度将上混的频域信号按子带进行逆向旋转,得到两路分别对应左右声道频域信号,最后通过IFFT得到左右两路时域音频信号。
对于极大相关度逆旋转变换单元,与音频编码器对应的,当只提取一个参数时,按照下面的式子进行逆旋转变换:
当实部和虚部分别处理,提取两个参数时,按照下面的式子进行逆旋转变换:
当幅度和相位分别处理时,按照下面的式子进行逆旋转变换:
本实施例通过对解码后的音频信号进行上混,将一路音频信号还原为两路音频信号,再对两路音频信号进行极大相关度逆旋转变换,还原出左右声道的音频信号。由于对音频信号进行极大相关度逆旋转变换,改善了信号质量,所以与传统的只对一路音频信号进行解码操作的解码系统相比,通过少量的极大相关度旋转角参数记录立体声信息,可以用很低的码率实现立体声音频信号的高保真压缩。
另外,实施例7与实施例8可以结合起来,组成一种音频信号的编解码系统。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (29)
1.一种音频信号的编码方法,其特征在于,所述方法包括:
步骤A:对左右声道的音频信号以极大相关度旋转角为旋转角进行正交旋转变换;
步骤B:对经过所述正交旋转变换的左右声道的音频信号进行编码,形成码流数据。
2.根据权利要求1所述的一种音频信号的编码方法,其特征在于,所述步骤A具体包括:
步骤A1:对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号;
步骤A2:提取所述左右声道的频域音频信号的极大相关度旋转角;
步骤A3:对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。
3.根据权利要求2所述的一种音频信号的编码方法,其特征在于,所述步骤B具体包括:
步骤B1:对经过所述正交旋转变换的左右声道的音频信号进行和差立体声编码,形成和差音频码流;
步骤B2:对旋转角进行量化熵编码,形成参数码流;
步骤B3:对所述和差音频码流进行量化和熵编码;
步骤B4:将经过量化和熵编码的所述和差音频码流和参数码流组合成编码码流。
4.根据权利要求2所述的一种音频信号的编码方法,其特征在于,所述步骤B具体包括:
步骤B1:对经过所述正交旋转变换的左右声道的音频信号进行强度立体声编码,形成强度音频码流;
步骤B2:对旋转角进行量化熵编码,形成参数码流;
步骤B3:对所述强度音频码流进行量化和熵编码;
步骤B4:将经过量化和熵编码的所述强度音频码流和参数码流组合成编码码流。
5.根据权利要求3或4所述的一种音频信号的编码方法,其特征在于,所述步骤A1具体为:
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号。
6.根据权利要求3或4所述的一种音频信号的编码方法,其特征在于,所述步骤A1具体为:
对左右声道的时域音频信号进行快速傅里叶变换输出左右声道的频域音频信号。
7.根据权利要求1所述的一种音频信号的编码方法,其特征在于,所述步骤A具体包括:
步骤A1:对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号;
步骤A2:将所述左右声道的频域音频信号划分为连续无重叠的子带信号;
步骤A3:提取所述左右声道的子带信号的极大相关度旋转角;
步骤A4:对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换。
8.根据权利要求7所述的一种音频信号的编码方法,其特征在于,所述步骤B具体包括:
步骤B1:将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音频信号;
步骤B2:对下混声道的音频信号进行编码,形成编码码流。
9.根据权利要求8所述的一种音频信号的编码方法,其特征在于,所述步骤A1具体为:
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号;
所述步骤A2具体为:
将所述左右声道的频域音频信号按照等效矩形带宽划分为连续无重叠的子带信号。
10.根据权利要求8所述的一种音频信号的编码方法,其特征在于,所述步骤A1具体为:
对左右声道的时域音频信号进行多相滤波器组变换输出左右声道的频域音频信号;
所述步骤A2具体为:
将所述左右声道的频域音频信号按照临界带宽划分为连续无重叠的子带信号。
11.一种音频信号的解码方法,其特征在于,所述方法包括:
步骤A:对接收到的码流数据进行解码输出经过解码的音频信号;
步骤B:对所述经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换,输出左右声道的音频信号。
12.根据权利要求11所述的一种音频信号的解码方法,其特征在于,所述步骤A具体为:
步骤A1:将编码码流分解成音频码流和参数码流;
步骤A2:将音频码流和参数码流分别进行熵解码和反量化得到频谱数据以及旋转角度;
步骤A3:根据编码的模式对所述频谱数据进行解码得到两路音频信号。
13.根据权利要求12所述的一种音频信号的解码方法,其特征在于,所述步骤B具体为:
步骤B1:对所述解码得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换;
步骤B2:对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
14.根据权利要求13所述的一种音频信号的解码方法,其特征在于,所述步骤B2具体为:
对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时域音频信号。
15.根据权利要求13所述的一种音频信号的解码方法,其特征在于,所述步骤B2具体为:
对经过所述正交逆旋转变换的两路音频信号进行快速傅里叶逆变换输出左右声道的时域音频信号。
16.根据权利要求11所述的一种音频信号的解码方法,其特征在于,所述步骤A具体为:
步骤A1:对所述编码码流进行解码得到下混声道的音频信号;
步骤A2:对下混声道的音频信号进行子带划分,输出连续无重叠的子带;
步骤A3:将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路子带信号;
相应的,所述步骤B具体包括:
步骤B1:对所述经过正交旋转变换的两路子带信号以极大相关度旋转角为旋转角进行正交逆旋转变换;
步骤B2:对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
17.根据权利要求16所述的一种音频信号的解码方法,其特征在于,所述步骤B2具体为:
对经过所述正交逆旋转变换的两路音频信号进行多相滤波器组逆变换输出左右声道的时域音频信号。
18.根据权利要求17所述的一种音频信号的解码方法,其特征在于,所述步骤A2具体为:
对下混声道的音频信号按照等效矩形带宽进行子带划分,输出连续无重叠的子带。
19.根据权利要求18所述的一种音频信号的解码方法,其特征在于,所述步骤A2具体为:
对下混声道的音频信号按照临界带宽进行子带划分,输出连续无重叠的子带。
20.一种音频信号的编码系统,其特征在于,包括极大相关度旋转变换模块、编码模块;
所述极大相关度旋转变换模块,用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换;
所述编码模块,用于对所述经过正交旋转变换的音频信号进行编码形成编码码流。
21.根据权利要求20所述的一种音频信号的编码系统,其特征在于,所述极大相关度旋转变换模块具体包括时频分析单元、极大相关度旋转变换单元;
所述时频分析单元,用于对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号;
所述极大相关度旋转变换单元,用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换;
所述编码模块具体包括编码单元、量化熵编码单元、码流成型单元;
所述编码单元,用于对经过所述正交旋转变换的左右声道的音频信号进行编码,形成音频码流;
所述量化熵编码单元,用于对所述音频码流和参数码流分别进行量化和熵编码,去除信号的主观冗余;
码流成型单元,用于将经过量化和熵编码的所述音频码流和参数码流组合成编码码流。
22.根据权利要求21所述的一种音频信号的编码系统,其特征在于,所述时频分析单元具体为具体为快速傅里叶变换单元。
23.根据权利要求21所述的一种音频信号的编码系统,其特征在于,所述时频分析单元具体为具体为多相滤波器组变换单元。
24.根据权利要求20所述的一种音频信号的编码系统,其特征在于,所述极大相关度旋转变换模块具体包括快速傅里叶变换单元、极大相关度旋转变换单元;
所述快速傅里叶变换单元,用于对左右声道的时域音频信号进行时频变换输出左右声道的频域音频信号;
所述极大相关度旋转变换单元,用于对所述左右声道的频域音频信号以极大相关度旋转角为旋转角进行正交旋转变换;
所述编码模块具体包括下混单元、快速傅里叶逆变换单元、编码单元、矢量量化单元、复用单元;
所述下混单元,用于将所述经过正交旋转变换的两路音频信号下混为一路下混声道的音频信号;
所述快速傅里叶逆变换单元,用于将下混后一路音频信号进行快速傅里叶逆变换为时域的音频信号;
所述编码单元,用于对经过所述正交旋转变换的左右声道的音频信号进行编码,形成音频码流;
所述矢量量化单元,用于形成量化指标数码流,以便进一步去除旋转角参数的客观冗余,降低参数码率;
所述复用单元,用于将形成的音频码流和量化指标数码流封装成给定格式的编码码流。
25.一种音频信号的解码系统,其特征在于,包括解码模块、极大相关度逆旋转变换模块;
所述解码模块,用于对接收到的码流数据进行解码,输出经过解码的音频信号;
所述极大相关度逆旋转变换模块,用于对所述经过解码的音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换,输出左右声道的音频信号。
26.根据权利要求25所述的一种音频信号的解码系统,其特征在于,所述解码模块具体包括码流解析单元、熵解码反量化单元、解码单元;
所述码流解析单元,用于将码流分解成音频码流和参数码流;
所述熵解码反量化单元,用于将音频码流进行熵解码和反量化得到频谱数据以及旋转角度;
所述解码单元,用于根据编码的模式对所述频谱数据进行解码得到两路音频信号;
所述极大相关度逆旋转变换模块,具体包括极大相关度逆旋转变换单元、时频综合单元;
所述极大相关度逆旋转变换单元,用于对所述解码得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换;
所述时频综合单元,用于对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
27.根据权利要求26所述的一种音频信号的解码系统,其特征在于,所述时频综合单元具体为快速傅里叶逆变换单元。
28.根据权利要求26所述的一种音频信号的解码系统,其特征在于,所述时频综合单元具体为多相滤波器组逆变换单元。
29.根据权利要求25所述的一种音频信号的解码系统,其特征在于,所述解码模块具体包括解码单元、快速傅里叶变换单元、上混单元、反矢量量化单元;
所述解码单元,用于根据编码的模式对所述频谱数据进行解码得到两路音频信号;
所述快速傅里叶变换单元,用于将解码单元输出的的音频信号进行快速傅里叶变换输出频域的音频信号;
所述上混单元,用于将下混声道的音频信号进行上混输出所述经过正交旋转变换的两路音频信号;
所述反矢量量化单元,用于从量化指标数查找出对应的旋转角参数,以便解码端进行相应的逆旋转变换;
所述极大相关度逆旋转变换模块,具体包括极大相关度逆旋转变换单元、快速傅里叶逆变换单元;
所述极大相关度逆旋转变换单元,用于对所述上混得到的两路音频信号以极大相关度旋转角为旋转角进行正交逆旋转变换;
所述快速傅里叶逆变换单元,用于对经过所述正交逆旋转变换的两路音频信号进行时频逆变换输出左右声道的时域音频信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007103044868A CN101202043B (zh) | 2007-12-28 | 2007-12-28 | 音频信号的编码方法和装置与解码方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007103044868A CN101202043B (zh) | 2007-12-28 | 2007-12-28 | 音频信号的编码方法和装置与解码方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101202043A true CN101202043A (zh) | 2008-06-18 |
CN101202043B CN101202043B (zh) | 2011-06-15 |
Family
ID=39517177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007103044868A Expired - Fee Related CN101202043B (zh) | 2007-12-28 | 2007-12-28 | 音频信号的编码方法和装置与解码方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101202043B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102592601A (zh) * | 2011-01-10 | 2012-07-18 | 华为技术有限公司 | 一种信号处理方法和装置 |
CN103119647A (zh) * | 2010-04-09 | 2013-05-22 | 杜比国际公司 | 基于改进型离散余弦变换的复数预测立体声编码 |
CN104285390A (zh) * | 2012-05-14 | 2015-01-14 | 汤姆逊许可公司 | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 |
CN104347077A (zh) * | 2014-10-23 | 2015-02-11 | 清华大学 | 一种立体声编解码方法 |
CN107219991A (zh) * | 2017-05-19 | 2017-09-29 | 北京酷我科技有限公司 | 一种音频频谱动画柔和展现算法 |
CN108141685A (zh) * | 2015-08-25 | 2018-06-08 | 杜比国际公司 | 使用呈现变换参数的音频编码和解码 |
CN108769874A (zh) * | 2018-06-13 | 2018-11-06 | 广州国音科技有限公司 | 一种实时分离音频的方法和装置 |
WO2020034779A1 (zh) * | 2018-08-14 | 2020-02-20 | Oppo广东移动通信有限公司 | 音频处理方法、存储介质及电子设备 |
CN106463132B (zh) * | 2014-07-02 | 2021-02-02 | 杜比国际公司 | 对压缩的hoa表示编码和解码的方法和装置 |
CN106663432B (zh) * | 2014-07-02 | 2021-02-02 | 杜比国际公司 | 对压缩的hoa表示编码和解码的方法和装置 |
WO2023241254A1 (zh) * | 2022-06-15 | 2023-12-21 | 腾讯科技(深圳)有限公司 | 音频编解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101350197B (zh) * | 2007-07-16 | 2011-05-11 | 华为技术有限公司 | 立体声音频编/解码方法及编/解码器 |
-
2007
- 2007-12-28 CN CN2007103044868A patent/CN101202043B/zh not_active Expired - Fee Related
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9761233B2 (en) | 2010-04-09 | 2017-09-12 | Dolby International Ab | MDCT-based complex prediction stereo coding |
US10360920B2 (en) | 2010-04-09 | 2019-07-23 | Dolby International Ab | Audio upmixer operable in prediction or non-prediction mode |
US10475460B2 (en) | 2010-04-09 | 2019-11-12 | Dolby International Ab | Audio downmixer operable in prediction or non-prediction mode |
US11810582B2 (en) | 2010-04-09 | 2023-11-07 | Dolby International Ab | MDCT-based complex prediction stereo coding |
US11264038B2 (en) | 2010-04-09 | 2022-03-01 | Dolby International Ab | MDCT-based complex prediction stereo coding |
US9111530B2 (en) | 2010-04-09 | 2015-08-18 | Dolby International Ab | MDCT-based complex prediction stereo coding |
CN103119647B (zh) * | 2010-04-09 | 2015-08-19 | 杜比国际公司 | 基于改进型离散余弦变换的复数预测立体声编码 |
US9159326B2 (en) | 2010-04-09 | 2015-10-13 | Dolby International Ab | MDCT-based complex prediction stereo coding |
CN105023578A (zh) * | 2010-04-09 | 2015-11-04 | 杜比国际公司 | 解码器系统和解码方法 |
US9378745B2 (en) | 2010-04-09 | 2016-06-28 | Dolby International Ab | MDCT-based complex prediction stereo coding |
US11217259B2 (en) | 2010-04-09 | 2022-01-04 | Dolby International Ab | Audio upmixer operable in prediction or non-prediction mode |
US10347260B2 (en) | 2010-04-09 | 2019-07-09 | Dolby International Ab | MDCT-based complex prediction stereo coding |
CN103119647A (zh) * | 2010-04-09 | 2013-05-22 | 杜比国际公司 | 基于改进型离散余弦变换的复数预测立体声编码 |
US10283127B2 (en) | 2010-04-09 | 2019-05-07 | Dolby International Ab | MDCT-based complex prediction stereo coding |
US10475459B2 (en) | 2010-04-09 | 2019-11-12 | Dolby International Ab | Audio upmixer operable in prediction or non-prediction mode |
US10734002B2 (en) | 2010-04-09 | 2020-08-04 | Dolby International Ab | Audio upmixer operable in prediction or non-prediction mode |
US9892736B2 (en) | 2010-04-09 | 2018-02-13 | Dolby International Ab | MDCT-based complex prediction stereo coding |
US10586545B2 (en) | 2010-04-09 | 2020-03-10 | Dolby International Ab | MDCT-based complex prediction stereo coding |
US10553226B2 (en) | 2010-04-09 | 2020-02-04 | Dolby International Ab | Audio encoder operable in prediction or non-prediction mode |
US10283126B2 (en) | 2010-04-09 | 2019-05-07 | Dolby International Ab | MDCT-based complex prediction stereo coding |
CN105023578B (zh) * | 2010-04-09 | 2018-10-19 | 杜比国际公司 | 解码器系统和解码方法 |
US10276174B2 (en) | 2010-04-09 | 2019-04-30 | Dolby International Ab | MDCT-based complex prediction stereo coding |
US9792257B2 (en) | 2011-01-10 | 2017-10-17 | Huawei Technologies Co., Ltd. | Audio signal processing method and encoder |
US9996503B2 (en) | 2011-01-10 | 2018-06-12 | Huawei Technologies Co., Ltd. | Signal processing method and device |
WO2012094952A1 (zh) * | 2011-01-10 | 2012-07-19 | 华为技术有限公司 | 一种信号处理方法和装置 |
CN102592601A (zh) * | 2011-01-10 | 2012-07-18 | 华为技术有限公司 | 一种信号处理方法和装置 |
US9519619B2 (en) | 2011-01-10 | 2016-12-13 | Huawei Technologies Co., Ltd. | Data processing method and device for processing speech signal or audio signal |
CN104285390B (zh) * | 2012-05-14 | 2017-06-09 | 杜比国际公司 | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 |
US11234091B2 (en) | 2012-05-14 | 2022-01-25 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
CN104285390A (zh) * | 2012-05-14 | 2015-01-14 | 汤姆逊许可公司 | 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置 |
US11792591B2 (en) | 2012-05-14 | 2023-10-17 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order Ambisonics signal representation |
US10390164B2 (en) | 2012-05-14 | 2019-08-20 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics signal representation |
US9980073B2 (en) | 2012-05-14 | 2018-05-22 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics signal representation |
CN106463132B (zh) * | 2014-07-02 | 2021-02-02 | 杜比国际公司 | 对压缩的hoa表示编码和解码的方法和装置 |
CN106663432B (zh) * | 2014-07-02 | 2021-02-02 | 杜比国际公司 | 对压缩的hoa表示编码和解码的方法和装置 |
CN104347077A (zh) * | 2014-10-23 | 2015-02-11 | 清华大学 | 一种立体声编解码方法 |
CN104347077B (zh) * | 2014-10-23 | 2018-01-16 | 清华大学 | 一种立体声编解码方法 |
CN108141685A (zh) * | 2015-08-25 | 2018-06-08 | 杜比国际公司 | 使用呈现变换参数的音频编码和解码 |
US10978079B2 (en) | 2015-08-25 | 2021-04-13 | Dolby Laboratories Licensing Corporation | Audio encoding and decoding using presentation transform parameters |
CN108141685B (zh) * | 2015-08-25 | 2021-03-02 | 杜比国际公司 | 使用呈现变换参数的音频编码和解码 |
US11798567B2 (en) | 2015-08-25 | 2023-10-24 | Dolby Laboratories Licensing Corporation | Audio encoding and decoding using presentation transform parameters |
CN107219991A (zh) * | 2017-05-19 | 2017-09-29 | 北京酷我科技有限公司 | 一种音频频谱动画柔和展现算法 |
CN107219991B (zh) * | 2017-05-19 | 2020-06-05 | 北京酷我科技有限公司 | 一种音频频谱动画柔和展现方法 |
CN108769874A (zh) * | 2018-06-13 | 2018-11-06 | 广州国音科技有限公司 | 一种实时分离音频的方法和装置 |
WO2020034779A1 (zh) * | 2018-08-14 | 2020-02-20 | Oppo广东移动通信有限公司 | 音频处理方法、存储介质及电子设备 |
WO2023241254A1 (zh) * | 2022-06-15 | 2023-12-21 | 腾讯科技(深圳)有限公司 | 音频编解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN101202043B (zh) | 2011-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101202043B (zh) | 音频信号的编码方法和装置与解码方法和装置 | |
CN101297356B (zh) | 用于音频压缩的方法和设备 | |
CN101836250B (zh) | 用于处理信号的方法及装置 | |
CN1809872B (zh) | 编码音频信号的设备和方法及解码已编码音频信号的设备和方法 | |
CN1878001B (zh) | 对音频数据编码及解码的设备及方法 | |
CN1973319B (zh) | 编码和解码多通道音频信号的方法和设备 | |
CN102282612B (zh) | 叉积增强的谐波转置 | |
CN101401152B (zh) | 通过多通道音频信号的主分量分析进行编码的设备和方法 | |
JP6019266B2 (ja) | ステレオ・オーディオ・エンコーダおよびデコーダ | |
CN101276587B (zh) | 声音编码装置及其方法和声音解码装置及其方法 | |
CN101556799B (zh) | 一种音频解码方法和音频解码器 | |
CN102272832B (zh) | 基于峰值检测的选择性缩放掩码计算 | |
MX2007009887A (es) | Esquema de codificador/descodificador de multicanal casi transparente o transparente. | |
CN101887726A (zh) | 立体声编码和解码的方法及其设备 | |
CN1264533A (zh) | 多声道低比特率编码解码方法和设备 | |
CN101896968A (zh) | 音频编码装置及其方法 | |
CN107610710B (zh) | 一种面向多音频对象的音频编码及解码方法 | |
CN110739000B (zh) | 一种适应于个性化交互系统的音频对象编码方法 | |
CN106373583A (zh) | 基于理想软阈值掩模irm的多音频对象编、解码方法 | |
CN110660401B (zh) | 一种基于高低频域分辨率切换的音频对象编解码方法 | |
CN101436406B (zh) | 音频编解码器 | |
CN101350197B (zh) | 立体声音频编/解码方法及编/解码器 | |
CN1901043B (zh) | 立体声音频编码方法及装置,音频流解码方法及装置 | |
JP2006003580A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
WO2013189030A1 (zh) | 对单声道或立体声进行编码的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110615 |