CN101685637B - 音频编码方法及装置和音频解码方法及装置 - Google Patents

音频编码方法及装置和音频解码方法及装置 Download PDF

Info

Publication number
CN101685637B
CN101685637B CN2008102234446A CN200810223444A CN101685637B CN 101685637 B CN101685637 B CN 101685637B CN 2008102234446 A CN2008102234446 A CN 2008102234446A CN 200810223444 A CN200810223444 A CN 200810223444A CN 101685637 B CN101685637 B CN 101685637B
Authority
CN
China
Prior art keywords
frequency
coefficient
frequency domain
code stream
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008102234446A
Other languages
English (en)
Other versions
CN101685637A (zh
Inventor
陈龙吟
肖玮
苗磊
刘泽新
胡晨
张清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGZHOU YIHENG TECHNOLOGY CO.,LTD.
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2008102234446A priority Critical patent/CN101685637B/zh
Publication of CN101685637A publication Critical patent/CN101685637A/zh
Application granted granted Critical
Publication of CN101685637B publication Critical patent/CN101685637B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供一种音频编码方法及装置和音频解码方法及装置,其中,音频编码方法包括:对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含经时频变换后的频域参数信息;利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对时频变换后的频域系数进行频域系数编码输出第三码流;将第一码流、第二码流和第三码流进行复用输出码流。上述音频编码方法及装置和音频解码方法及装置,通过使用自适应的伸缩系数,对频域系数进行伸缩或去伸缩处理,并将伸缩或去伸缩后的频域系数作为格形矢量量化的输入量进行适当精度编码或解码,从而避免了在超宽带扩展部分连续的子带被量化成零和子带精度过低的情况出现。

Description

音频编码方法及装置和音频解码方法及装置
技术领域
本发明涉及编解码技术领域,尤其涉及一种音频编码方法及装置和音频解码方法及装置。 
背景技术
随着编解码技术的不断发展,变换域编解码成为语音频编码中的一种常用编码技术,所谓变换域编解码就是将输入的信号经过时-频变换从时域转换到频域,得到一组频域系数,对频域系数进行量化编码并传递到解码端;解码端解码出这些频域系数的量化值,并通过频-时变换得到原信号的近似表示。在语音频编解码领域使用最为广泛的变换方法是修正的离散余弦变换(Modified Discrete Cosine Transform,MDCT)。采用MDCT变换,输入信号经过MDCT变换后得到一组MDCT系数,受传输速率的影响,不可能对每个系数分配多个比特进行编码。因此,一般处理方法是将连续的多个MDCT系数合并成一个矢量(如8维矢量),进行矢量量化。 
随着通信技术的发展,语音频编解码器的标准化活动的趋势由几年前的由窄带扩展为宽带,由宽带扩展为超宽带甚至全带。基于格形矢量量化(Lattice Vector Quantization,LVQ)的编码方法是一种比较适合超宽带或全带扩展需求的编码方式。然而,超宽带以上的信号特征较窄带、宽带差别很大,如:超宽带以上信号存在大量的能量相对较小的频率成份,这些频率成份的存在能够让声音更加自然、饱满。 
 在现有的语音频编解码器中,应用比较广泛的方法是将连续多个MDCT系数合并成一个矢量,进行矢量量化,LVQ对于码本空间进行规则的划分,若采用LVQ,系统只需存贮少量的码本(在LVQ技术中称为绝对引导项),通过绝对引导项的位置和各分量中符号位的排列组合可以衍生出多个矢量。编码端仅需将当前被量化的MDCT系数矢量的量化索引值(该索引值记录了绝对引导项的排列组合信息)传递出去;解码接收到该索引值就可以恢复出矢量的量化值,完成解码。在LVQ量化前,编码器需要对输入的MDCT系数矢量除以归一化因子,以方便后续的处理流程;在AMR WB+中,首先在频域计算一个统一的增益值,然后每个MDCT系数矢量均除以该增益值完成归一化流程。在宽带编码器中,这种方法也是比较适用的。 
但是发明人在实施上述技术方案的过程中发现:上述方案存在一些缺陷,例如在超宽带扩展部分,处理的对象都是些小能量MDCT系数矢量。若采用AMR WB+中的统一增益处理方式,会出现两种情况:(1)使用较大的统一增益值,可以保证编码效率,但出现大量的小能量MDCT系数被直接量化成零;即使未全被置为零,也仅仅是少数几种脉冲的排列组合,量化精度不高。(2)使用较小的统一增益值,可以保证精度,但会出现编码效率较低,且如果高频带能量集中于某一连续的频域,仍会造成其他能量较小的连续频域的系数全部量化为零,会影响所有码率的音质。 
发明内容
本发明实施例提供一种音频编码方法和装置及音频解码方法和装置,以保证编解码效率和编解码精度,从而避免在超宽带扩展部分连续的子带被量化成零和子带精度过低的情况出现。 
本发明实施例提供一种音频编码方法,该音频编码方法包括: 
对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含频域参数信息,所述频域参数信息是将从编码端输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的; 
利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对所述输入的信号经时频变换后的频域系数进行频域系数编码输出第三码流; 
将所述第一码流、第二码流和第三码流进行复用输出码流。 
本发明实施例提供一种音频编码装置,该音频编码装置包括: 
处理单元,用于对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含频域参数信息,所述频域参数信息是将从编码端输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的; 
编码单元,用于利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对所述输入的信号经时频变换后的频域系数进行频域系数编码输出第三码流; 
复用单元,用于将所述第一码流、第二码流和第三码流进行复用输出码流。 
本发明实施例提供一种音频解码方法,该音频解码方法包括: 
对输入的码流进行解复用,分离出第一码流、第二码流和第三码流; 
对第一码流和第二码流进行处理后输出低带信号和高带信号,其中,第二码流包含频域参数信息,所述频域参数信息是将从编码端输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的; 
利用第二码流包含的频域参数信息计算伸缩系数,第三码流使用所述伸缩系数和频域参数信息进行频域系数解码、频时变换和时域包络调整后输出高带信号; 
将所述低带信号和高带信号进行频带合成输出音频信号。 
本发明实施例提供一种音频解码装置,该音频解码装置包括: 
解复用单元,用于对输入的码流进行解复用,分离出第一码流、第二码流和第三码流; 
处理单元,用于对第一码流和第二码流进行处理后输出低带信号和高带信号,其中,第二码流包含频域参数信息,所述频域参数信息是将从编码端输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的; 
解码单元,用于利用第二码流包含的频域参数信息计算伸缩系数,第三码流使用所述伸缩系数和频域参数信息进行频域系数解码、频时变换和时域包络调整后输出高带信号; 
合成单元,用于将所述低带信号和高带信号进行频带合成,输出音频信号。
上述音频编码方法及音频编码装置,通过使用自适应的伸缩系数,对频域系数进行伸缩处理,并将伸缩后的频域系数作为格形矢量量化的输入量进行适当精度编码,从而避免在超宽带扩展部分连续的子带被量化成零和子带精度过低的情况出现,既保证了编码精度又保证了码率的质量;上述音频解码方法及音频解码装置,通过使用自适应的伸缩系数进行去量化解码,然后对频域系数进行去伸缩处理,较好地保证了解码精度又保证了音频信号质量。 
附图说明
图1为本发明音频编码方法实施例的流程图; 
图2为本发明伸缩系数调整方法实施例一的流程图; 
图3为本发明伸缩系数调整方法实施例二的流程图; 
图4为本发明音频编码装置实施例的结构示意图; 
图5为本发明音频解码方法实施例的流程图; 
图6为本发明音频解码装置实施例的结构示意图。 
具体实施方式
下面结合附图和具体实施例进一步说明本发明实施例的技术方案。 
本发明实施例音频编码方法包括: 
对输入音频信号进行频带分离; 
对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含经时频变换后的频域参数信息; 
利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对时频变换后的频域系数进行频域系数编码输出第三码流; 
将所述第一码流、第二码流和第三码流进行复用输出码流。 
如图1所示,为本发明音频编码方法实施例的流程图,该音频编码方法 包括: 
步骤101、对输入的音频信号进行频带分离; 
采用正交镜像滤波器(Quadrature Mirror Filter,QMF)对输入的音频信号进行频带分离,分离出低带信号和高带信号,此处低带信号为0-8kHz,高带信号为8-16kHz;由于低带信号和高带信号是相对概念,所以实际应用中上述低带信号和高带信号的值可根据需要进行调整; 
步骤102、将分离出的低带信号经核心编码器处理后输出第一码流; 
此处采用的核心编码器为G.729.1,G.729.1是一个具有嵌入式结构的编码器,可提供12种码率,最低码率为8kbps,最高码率为32kbps;上述0-8kHz的低带信号经过核心编码器G.729.1处理后输出0-7kHz的信息;当然也可以采用其他核心编码器,对于其他核心编码器可提供的码率等信息都是现有的,在此不赘述; 
步骤103、将分离出的高带信号经时频变换和频带扩展编码后输出第二码流; 
8-16kHz的高带信号以及低带信号7-8kHz组合在一起,合并成超宽带信号统一进行处理;当且仅当系统完成了G.729.1全码率编码的情况下,即当前码率大于32kbps时,进行频带扩展(BWE)编码。本发明音频编码方法涉及5种超宽带扩展码率,分别为36、40、48、56、64kbps。在36kbps时,即每帧数据使用80bits,经时频变换和频带扩展编码后可实现一个相对低质量的7-14kHz的扩展,因而上述音频编码方法可以提供0-14kHz的信号输出; 
其中,该步骤103具体可以包括:将分离出的高带信号进行时域参数编码;将分离出的高带信号进行时频转换后进行频域参数编码;将进行时域参数编码和频域参数编码后的码流进行复用输出第二码流; 
步骤104、利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对时频变换后的频域系数进行频域系数编码输出第三码流;
上述第二码流包含的频域参数信息中包含能量信息等,利用上述频域参数信息计算伸缩系数;超宽带扩展部分在中、高码率,即在40、48、56和64kbps码率时,使用上述伸缩系数对输入信号进行量化和编码,具体地,就是在BWE处理的基础上,对输入信号进行MDCT变换,然后逐段地对MDCT系数矢量进行LVQ量化编码;随着所使用比特的增加,更多的MDCT系数矢量渐近地进行了处理,输出信号的音质也渐近地得到了提高,因而经时频变换、频带扩展编码和使用自适应伸缩系数进行频域系数编码后可实现一个高质量的7-14kHz的扩展; 
其中,上述利用频域参数信息和伸缩系数对时频变换后的频域系数进行频域系数编码输出第三码流可以包括:根据频域能量信息分别对该频域所包含的各子带的权重进行判断,此处的频域能量信息属于频域参数信息的一种;根据权重判断结果对上述伸缩系数与子带能量信息进行加权,获得频域系数伸缩因子;根据上述伸缩因子对频域系数进行频域系数伸缩;对加权后的子带能量信息进行感知排序;将伸缩后的频域系数作为输入值,将排序后的感知顺序作为输入参数,对伸缩后频域系数进行量化编码,输出第三码流。另外,上述频域参数信息还可以包括波形信息和帧类型信息等; 
需要说明的是,该实施例描述的仅仅是本发明部分实施例,而不是全部的实施例。对于本发明而言,只要实施例中采用LVQ量化编码,上述步骤101-104都要执行,只是个别细节需要改变,但这些改变对本领域普通技术人员而言都是公知常识,因而,基于上述情况,对本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明要保护的范围; 
步骤105、将上述第一码流、第二码流和第三码流进行复用输出码流。 
最后将上述第一码流、第二码流和第三码流进行复用输出最终的码流。 
另外,上述步骤104中利用第二码流包含的频域参数信息计算伸缩系数有多种,可以整合各子带的一种或多种信息计算伸缩系数,计算伸缩系数 的过程即为伸缩系数的调整过程,下面介绍两种伸缩系数调整方法,如图2所示,为本发明伸缩系数调整方法实施例一的流程图,该方法包括: 
步骤201、根据频域能量信息计算第一全局增益和第二全局增益,并提供当前子带能量信息; 
上述第一全局增益和第二全局增益可以是基于当前子带与相邻子带的能量信息,或者全部所有的子带的能量信息,或者某一频段的所有子带的能量信息得到的,例如可以是所有子带能量相加后求得的平均值,或各子带最大能量值相加后求得的平均值,或者当前子带与相邻子带能量的加权平均值等等; 
步骤202、判断当前子带能量信息是否大于第一全局增益,若是,执行步骤203,否则执行步骤204; 
步骤203、伸缩系数等于第一全局增益,结束; 
步骤204、判断当前子带能量信息是否大于第二全局增益,若是,执行步骤205,否则执行步骤206; 
该实施例中第一全局增益大于第二全局增益; 
步骤205、伸缩系数等于子带平均能量,结束; 
步骤206、伸缩系数为子带平均能量的n倍。 
此处的n可以为任意正数,例如此处为1.1。 
在进行完上述步骤后可以根据获得的伸缩系数对频域系数进行自适应调整,同时,对加权后的子带能量信息进行感知排序,将伸缩后的频域系数作为量化器的输入信号,将排序后的感知顺序作为量化器的输入参数,对伸缩后的频域系数进行量化编码,输出码流。 
其中,伸缩系数的调整方法是根据频域系数的重要性和量化器的特性等来定的,但总的遵循一个原则:较重要的子带,对伸缩系数的调整方向是:使调整后的伸缩系数与频域系数加权后,得到的伸缩后的频域系数经量化器量化,能够获得较好的量化精度。例如:如果大能量的子带重要性较高,且 伸缩调整部分是利用频域系数除以该子带伸缩因子,且量化器使用LVQ,则对大能量的子带,将伸缩系数向小于初始值的方向调整,比如此实施例中,对于子带平均能量大于第一全局增益的子带,没有将伸缩系数设为该子带平均能量,而是设为第一全局增益。 
第二种伸缩系数调整方法实施例的流程图如图3所示,该方法包括: 
步骤301、根据所有子带能量信息计算平均能量信息,并提供当前子带能量信息、波形信息和谐波伸缩系数; 
上述平均能量信息属于全局能量参数的一种,上述子带能量信息、波形信息和谐波伸缩系数都属于子带能量参数; 
步骤302、判断当前子带能量信息是否小于平均能量信息,若是,执行步骤303,否则执行步骤304; 
步骤303、伸缩系数初始化,转向步骤305; 
步骤304、伸缩系数等于平均能量信息与当前子带能量信息的比值; 
步骤305、根据波形信息判断谐波与否,若是,执行步骤306;否则,执行步骤307; 
步骤306、伸缩系数等于初始化的伸缩系数与谐波伸缩系数之积; 
上述伸缩系数正是基于全局能量参数和各子带能量参数之间的关系及波形信息获得的; 
步骤307、进行后续操作。 
在完成上述步骤后,将伸缩系数与当前子带能量信息进行加权可获得伸缩因子,并根据上述伸缩因子对频域系数进行伸缩调整,同时对加权后的子带的能量值进行感知排序,对排序后的感知顺序和调整后的频域系数进行量化编码,输出码流。 
上述两种伸缩系数调整方法,可以较好地将频域所包含的子带的能量信息、子带波形信息、子带感知重要性信息、帧类型信息的一种或多种进行自适应伸缩调整,得到一个较好的伸缩系数。
上述音频编码方法,通过使用自适应的伸缩系数,对频域系数进行伸缩处理,并将伸缩后的频域系数作为格形矢量量化的输入量进行适当精度编码,从而避免在超宽带扩展部分连续的子带被量化成零和子带精度过低的情况出现,既保证了编码精度又保证了码率的质量。 
如图4所示,为本发明音频编码装置实施例的结构示意图,该音频编码装置包括:处理单元11,用于对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含经时频变换后的频域参数信息;编码单元12,用于利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对时频变换后的频域系数进行频域系数编码输出第三码流;复用单元13,用于将所述第一码流、第二码流和第三码流进行复用输出码流。 
其中,上述编码单元12可以包括判断模块121、获取模块122、伸缩模块123、排序模块124和量化编码模块125;其中,判断模块121用于根据频域参数信息分别对该频域所包含的各子带的权重进行判断;获取模块122用于根根据判断模块的权重判断结果对伸缩系数与子带能量信息进行加权,获得频域系数伸缩因子;伸缩模块123用于根据所述伸缩因子对频域系数进行频域系数伸缩;排序模块124用于对加权后的子带能量信息进行感知排序;量化编码模块125用于将伸缩后的频域系数作为输入值,将排序后的感知顺序作为输入参数,对伸缩模块输出的频域系数进行量化编码,并将编码后的码流发送至复用单元13。 
其中,利用处理单元对输入的信号进行处理的过程包括:输入信号经过QMF滤波,各子带信号20ms帧长,共包含320样本点,对子带信号进行MDCT变换,得到320个MDCT系数; 
Y ( k ) = Σ n = 0 639 y ( n ) h k ( n ) ,  k=0,1,…,319 
其中,hk(n)是MDCT正变换的基函数,  h k ( n ) = ω ( n ) 2 320 cos ( ( 2 n + 320 + 1 ) ( 2 k + 1 ) π 1280 ) , 此处,选择正弦窗
ω ( n ) = sin ( ( n + 0.5 ) π 640 ) ;
超宽带扩展部分的MDCT系数包括三部分:0-7kHz范围内在G.729.1中未被增强的MDCT系数;7-8kHz范围内40个MDCT系数;8-14kHz范围内240个MDCT系数。其中,0-7kHz未增强的MDCT系数的数量不定。 
每连续16个MDCT系数需要计算1个频率谱包络。例如,8-14kHz的谱包络可由下式求得 
FEnv [ k ] = Σ j = 0 j = 15 Y ( 16 × k + j ) · Y ( 16 × k + j ) 16 , k=0,1,…,14 
需要说明的是,以上频率谱包络均在G.729.1编码器以及编码单元进行编码,编码单元在进行后续处理前已获得频率谱包络的量化值。 
每8个MDCT系数合并成一个矢量,以矢量为单位使用LVQ量化编码。因此,7-8kHz以及8-14kHz分别包含5和30个8维矢量。0-7kHz未获增强的MDCT系数矢量以及7-14kHz的MDCT系数矢量采用统一排序。本发明延用LVQ的量化技术,具体的索引化过程与现有技术相同,不再赘述。 
另外,当上述频域参数信息包含频域能量信息时,上述编码单元还可以包括:计算模块,用于根据频域能量信息计算至少一个全局增益;分类模块,用于根据所述全局增益和当前子带能量信息之间的关系对当前子带进行分类;调整模块,用于对不同类的子带,调整相应的伸缩系数。当上述频域参数信息包含频域能量信息和波形信息时,上述编码单元还可以包括:第一获取模块,用于根据频域能量信息计算全局能量参数,根据各子带能量信息计算各子带能量参数;第二获取模块,用于根据全局能量参数和各子带能量参数之间的关系及波形信息,得到各子带的伸缩系数。 
上述音频编码装置,通过获取模块获得自适应伸缩系数,并根据上述伸缩系数对频域系数进行伸缩处理,然后将伸缩后的频域系数和排序模块的输出量作为量化编码模块的输入量进行适当精度编码,从而避免在超宽带扩展 部分连续的子带被量化成零和子带精度过低的情况出现,既保证了编码精度又保证了码率的质量。 
本发明实施例音频解码方法包括: 
对输入的码流进行解复用,分离出第一码流、第二码流和第三码流; 
对第一码流和第二码流进行处理后输出低带信号和高带信号,其中,第二码流包含根据时频变换后的频域系数得到的频域参数信息; 
利用第二码流包含的频域参数信息计算伸缩系数,第三码流使用上述伸缩系数和频域参数信息进行频域系数解码、频时变换和时域包络调整后输出高带信号; 
将上述低带信号和高带信号进行频带合成输出音频信号。 
如图5所示,为本发明音频解码方法实施例的流程图,该音频解码方法包括: 
步骤401、对输入的码流进行解复用,分离出第一码流、第二码流和第三码流; 
解码端在接收到编码端发送的码流后,对该码流进行解复用,分离出第一码流、第二码流和第三码流; 
步骤402、将第一码流经核心解码单元处理后输出低带信号; 
步骤403、将第二码流进行频带扩展解码、频时变换和时域包络调整后输出高带信号; 
该步骤具体包括:第二码流经解复用后分别进行频域参数解码和时域参数解码;经频域参数解码后的信号根据核心解码单元解码后的低带频域系数进行频域系数调整;然后对频域系数调整后的信号进行频时变换和时域包络调整;同时对经时域参数解码后的信号进行时域包络调整,并输出高带信号; 
上述第二码流包含根据时频变换后的频域系数得到的频域参数信息; 
步骤404、利用第二码流包含的频域参数信息计算伸缩系数,第三码流使用上述伸缩系数和频域参数信息进行频域系数解码、频时变换和时域 包络调整后输出高带信号; 
其中,第三码流使用上述伸缩系数和频域参数信息进行频域系数解码、频时变换和时域包络调整后输出高带信号具体包括:根据频域参数信息分别对该频域所包含的各子带的权重进行判断;根据权重判断结果对伸缩系数与各子带能量信息进行加权,获得各子带的伸缩因子;将第三码流去量化,并采用与编码时相同的感知顺序为参数,对去量化后的频域系数进行排序;根据排序后的频域系数与上述频域系数所对应的子带的伸缩因子,进行频域系数去伸缩,得到频域系数。利用第二码流包含的频域参数信息计算伸缩系数方法同本发明音频编码方法实施例中的伸缩系数调整方法相同,在此不赘述; 
步骤405、将上述低带信号和高带信号进行频带合成输出音频信号。 
最后将上述低带信号和高带信号进行频带合成输出音频信号。 
上述音频解码方法,通过使用与音频编码方法时相对应的自适应的伸缩系数进行去量化解码,然后对频域系数进行去伸缩处理,较好地保证了解码精度又保证了音频信号质量。 
如图6所示,为本发明音频解码装置实施例的结构示意图,该音频解码装置包括:解复用单元21,用于对输入的码流进行解复用,分离出第一码流、第二码流和第三码流;处理单元22,用于对第一码流和第二码流进行处理后输出低带信号和高带信号,其中,第二码流包含根据时频变换后的频域系数得到的频域参数信息;解码单元23,用于利用第二码流包含的频域参数信息计算伸缩系数,第三码流使用所述伸缩系数和频域参数信息进行频域系数解码、频时变换和时域包络调整后输出高带信号;合成单元24,用于对时域包络调整单元输出的信号进行频带合成,输出音频信号。 
其中,上述频域参数信息可以包含频域能量信息,上述解码单元23可以包括判断模块231、获取模块232、排序模块233、去量化模块234和去伸缩模块235;上述判断模块231用于根据频域参数信息分别对该频域所包含的 各子带的权重进行判断;获取模块232用于根据权重判断结果对伸缩系数与各子带能量信息进行加权,获得各子带的伸缩因子;排序模块233用于对加权后的子带能量信息进行排序;去量化模块234用于根据排序后的感知顺序对第三码流进行去量化;去伸缩模块235用于根据去量化后的码流和上述伸缩因子对频域系数进行去伸缩,得到频域系数,并对上述频域系数进行频域系数调整、频时变换和时域包络调整后发送至合成单元24。 
另外,当上述频域参数信息包含频域能量信息时,上述解码单元还可以包括:计算模块,用于根据频域能量信息计算至少一个全局增益;分类模块,用于根据所述全局增益和当前子带能量信息之间的关系对当前子带进行分类;调整模块,用于对不同类的子带,调整相应的伸缩系数。当上述频域参数信息包含频域能量信息和波形信息时,上述解码单元还可以包括:第一获取模块,用于根据频域能量信息计算全局能量参数,根据各子带能量信息计算各子带能量参数;第二获取模块,用于根据全局能量参数和各子带能量参数之间的关系及波形信息,得到各子带的伸缩系数。 
上述音频解码装置,通过使用与音频解码装置相同的自适应伸缩系数进行去量化解码,然后对频域系数进行去伸缩处理,较好地保证了解码精度又保证了音频信号的质量。 
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (16)

1.一种音频编码方法,其特征在于包括:
对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含频域参数信息,所述频域参数信息是将从所述输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的;
利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对所述输入的信号经时频变换后的频域系数进行频域系数编码输出第三码流;
将所述第一码流、第二码流和第三码流进行复用输出码流。
2.根据权利要求1所述的音频编码方法,其特征在于所述利用频域参数信息和伸缩系数对所述输入的信号经时频变换后的频域系数进行频域系数编码输出第三码流包括:
根据频域参数信息分别对该频域所包含的各子带的权重进行判断;
根据权重判断结果对所述伸缩系数与子带能量信息进行加权,获得频域系数伸缩因子;
根据所述伸缩因子对频域系数进行频域系数伸缩;
对加权后的子带能量信息进行感知排序;
将伸缩后的频域系数作为输入值,将排序后的感知顺序作为输入参数,对伸缩后频域系数进行量化编码,输出第三码流。
3.根据权利要求1或2所述的音频编码方法,其特征在于所述频域参数信息包含频域能量信息,所述利用第二码流包含的频域参数信息计算伸缩系数包括:
根据频域能量信息计算至少一个全局增益;
根据全局增益和当前子带能量信息之间的关系对当前子带进行分类;
对不同类的子带,调整相应的伸缩系数。
4.根据权利要求1或2所述的音频编码方法,其特征在于所述频域参 数信息包含频域能量信息和波形信息,所述利用第二码流包含的频域参数信息计算伸缩系数包括:
根据频域能量信息计算全局能量参数,根据各子带能量信息计算各子带能量参数;
根据全局能量参数和各子带能量参数之间的关系及波形信息,得到各子带的伸缩系数。
5.一种音频编码装置,其特征在于包括:
处理单元,用于对输入的信号进行处理,依次输出第一码流和第二码流,其中,第二码流包含频域参数信息,所述频域参数信息是将从所述输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的;
编码单元,用于利用第二码流包含的频域参数信息计算伸缩系数,并利用频域参数信息和伸缩系数对所述输入的信号经时频变换后的频域系数进行频域系数编码输出第三码流;
复用单元,用于将所述第一码流、第二码流和第三码流进行复用输出码流。
6.根据权利要求5所述的音频编码装置,其特征在于所述编码单元包括:
判断模块,用于根据频域参数信息分别对该频域所包含的各子带的权重进行判断;
获取模块,用于根据判断模块的权重判断结果对伸缩系数与子带能量信息进行加权,获得频域系数伸缩因子;
伸缩模块,用于根据所述伸缩因子对频域系数进行频域系数伸缩;
排序模块,用于对加权后的子带能量信息进行感知排序;
量化编码模块,用于将伸缩后的频域系数作为输入值,将排序后的感知顺序作为输入参数,对伸缩模块输出的频域系数进行量化编码,并将编码后的码流发送至复用单元。 
7.根据权利要求5或6所述的音频编码装置,其特征在于所述频域参数信息包含频域能量信息,所述编码单元还包括:
计算模块,用于根据频域能量信息计算至少一个全局增益;
分类模块,用于根据所述全局增益和当前子带能量信息之间的关系对当前子带进行分类;
调整模块,用于对不同类的子带,调整相应的伸缩系数。
8.根据权利要求5或6所述的音频编码装置,其特征在于所述频域参数信息包含频域能量信息和波形信息,所述编码单元还包括:
第一获取模块,用于根据频域能量信息计算全局能量参数,根据各子带能量信息计算各子带能量参数;
第二获取模块,用于根据全局能量参数和各子带能量参数之间的关系及波形信息,得到各子带的伸缩系数。
9.一种音频解码方法,其特征在于包括:
对输入的码流进行解复用,分离出第一码流、第二码流和第三码流;
对第一码流和第二码流进行处理后输出低带信号和高带信号,其中,第二码流包含频域参数信息,所述频域参数信息是将从编码端输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的;
利用第二码流包含的频域参数信息计算伸缩系数,第三码流使用所述伸缩系数和频域参数信息进行频域系数解码、频时变换和时域包络调整后输出高带信号;
将所述低带信号和高带信号进行频带合成输出音频信号。
10.根据权利要求9所述的音频解码方法,其特征在于所述频域参数信息包含频域能量信息,所述第三码流使用所述伸缩系数和频域参数信息进行频域系数解码、频时变换和时域包络调整后输出高带信号包括:
根据频域参数信息分别对该频域所包含的各子带的权重进行判断;
根据权重判断结果对伸缩系数与各子带能量信息进行加权,获得各子带 的伸缩因子;
将第三码流去量化,并采用与编码时相同的感知顺序为参数,对去量化后的频域系数进行排序;
根据排序后的频域系数与所述频域系数所对应的子带的伸缩因子,进行频域系数去伸缩,得到频域系数。
11.根据权利要求9或10所述的音频解码方法,其特征在于所述频域参数信息包含频域能量信息,所述利用第二码流包含的频域参数信息计算伸缩系数包括:
根据频域所包含的各子带能量信息计算至少一个全局增益;
根据全局增益和当前子带能量信息之间的关系对当前子带进行分类;
对不同类的子带,调整相应的伸缩系数。
12.根据权利要求9或10所述的音频解码方法,其特征在于所述频域参数信息包含频域能量信息和波形信息,所述利用第二码流包含的频域参数信息计算伸缩系数包括:
根据频域能量信息计算全局能量参数,根据各子带能量信息计算各子带能量参数;
根据全局能量参数和各子带能量参数之间的关系及波形信息,得到各子带的伸缩系数。
13.一种音频解码装置,其特征在于包括:
解复用单元,用于对输入的码流进行解复用,分离出第一码流、第二码流和第三码流;
处理单元,用于对第一码流和第二码流进行处理后输出低带信号和高带信号,其中,第二码流包含频域参数信息,所述频域参数信息是将从编码端输入的信号中分离出的高带信号进行时频转换后进行频带扩展编码获取的;
解码单元,用于利用第二码流包含的频域参数信息计算伸缩系数,第三码流使用所述伸缩系数和频域参数信息进行频域系数解码、频时变换和 时域包络调整后输出高带信号;
合成单元,用于将所述低带信号和高带信号进行频带合成,输出音频信号。
14.根据权利要求13所述的音频解码装置,其特征在于所述频域参数信息包含频域能量信息,所述解码单元包括:
判断模块,用于根据频域参数信息分别对该频域所包含的各子带的权重进行判断;
获取模块,用于根据权重判断结果对伸缩系数与各子带能量信息进行加权,获得各子带的伸缩因子;
排序模块,用于对加权后的子带能量信息进行排序;
去量化模块,用于根据排序后的感知顺序对第三码流进行去量化;
去伸缩模块,用于根据去量化后的码流和所述伸缩因子对频域系数进行去伸缩,得到频域系数,并对所述频域系数进行频域系数调整、频时变换和时域包络调整后发送至所述合成单元。
15.根据权利要求13或14所述的音频解码装置,其特征在于所述频域参数信息包含频域能量信息,所述解码单元还包括:
计算模块,用于根据频域所包含的各子带能量信息计算至少一个全局增益;
分类模块,用于根据全局增益和当前子带能量信息之间的关系对当前子带进行分类;
调整模块,用于对不同类的子带,调整相应的伸缩系数。
16.根据权利要求13或14所述的音频解码装置,其特征在于所述频域参数信息包含频域能量信息和波形信息,所述解码单元还包括:
第一获取模块,用于根据频域能量信息计算全局能量参数,根据各子带能量信息计算各子带能量参数;
第二获取模块,用于根据全局能量参数和各子带能量参数之间的关系及波形信息,得到各子带的伸缩系数。 
CN2008102234446A 2008-09-27 2008-09-27 音频编码方法及装置和音频解码方法及装置 Expired - Fee Related CN101685637B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008102234446A CN101685637B (zh) 2008-09-27 2008-09-27 音频编码方法及装置和音频解码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008102234446A CN101685637B (zh) 2008-09-27 2008-09-27 音频编码方法及装置和音频解码方法及装置

Publications (2)

Publication Number Publication Date
CN101685637A CN101685637A (zh) 2010-03-31
CN101685637B true CN101685637B (zh) 2012-07-25

Family

ID=42048757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008102234446A Expired - Fee Related CN101685637B (zh) 2008-09-27 2008-09-27 音频编码方法及装置和音频解码方法及装置

Country Status (1)

Country Link
CN (1) CN101685637B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
CN112885364B (zh) * 2021-01-21 2023-10-13 维沃移动通信有限公司 音频编码方法和解码方法、音频编码装置和解码装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1357136A (zh) * 1999-06-21 2002-07-03 数字剧场系统股份有限公司 不损失译码器兼容性下低比特率音频编码系统的音质提高
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法
CN1650348A (zh) * 2002-04-26 2005-08-03 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1357136A (zh) * 1999-06-21 2002-07-03 数字剧场系统股份有限公司 不损失译码器兼容性下低比特率音频编码系统的音质提高
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法
CN1650348A (zh) * 2002-04-26 2005-08-03 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
党辰.高频重建技术SBR 的研究与实现.《电子学报》.2004,第32卷(第12A期),189-191. *

Also Published As

Publication number Publication date
CN101685637A (zh) 2010-03-31

Similar Documents

Publication Publication Date Title
JP4950210B2 (ja) オーディオ圧縮
CN101527138B (zh) 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
CN101903945B (zh) 编码装置、解码装置以及编码方法
CN101283407B (zh) 变换编码装置和变换编码方法
CN101542599B (zh) 用于编码和解码宽带语音信号的方法、装置和系统
CN102511062B (zh) 用于改进数字音频信号的分级编码/解码的增强编码/解码中的比特分配
CN101471072B (zh) 高频重建方法、编码装置和解码装置
CN102576536B (zh) 数字音频信号的增强的编码/解码方法和装置
CN103366755A (zh) 对音频信号进行编码和解码的方法和设备
US11594236B2 (en) Audio encoding/decoding based on an efficient representation of auto-regressive coefficients
CN111968655B (zh) 信号编码方法和装置以及信号解码方法和装置
US11393484B2 (en) Audio classification based on perceptual quality for low or medium bit rates
CN104025189A (zh) 编码语音信号的方法、解码语音信号的方法,及使用其的装置
CN101430880A (zh) 一种背景噪声的编解码方法和装置
CN105280190A (zh) 带宽扩展编码和解码方法以及装置
EP2814028B1 (en) Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech
WO2012004998A1 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
CN101874266A (zh) 用于处理信号的方法和装置
US9830919B2 (en) Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method
Geiser et al. Candidate proposal for ITU-T super-wideband speech and audio coding
CN101685637B (zh) 音频编码方法及装置和音频解码方法及装置
CN101562015A (zh) 音频处理方法及装置
CN108198564B (zh) 信号编码和解码方法以及设备
CN102982807A (zh) 用于对语音信号lpc系数进行多级矢量量化的方法和系统
CN105957533B (zh) 语音压缩方法、语音解压方法及音频编码器、音频解码器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: Chen Longyin

Inventor after: Xiao Wei

Inventor after: Miao Lei

Inventor after: Liu Zexin

Inventor after: Hu Chen

Inventor after: Zhang Qing

Inventor before: Chen Longyin

Inventor before: Xiao Wei

Inventor before: Miao Lei

Inventor before: Liu Zexin

Inventor before: Hu Chen

Inventor before: Harvey Michel Tadi

Inventor before: Zhang Qing

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: CHEN LONGYIN XIAO WEI MIAO LEI LIU ZEXIN HU CHEN TATI HARVEY MYHILL ZHANG QING TO: CHEN LONGYIN XIAO WEI MIAO LEI LIU ZEXIN HU CHEN ZHANG QING

C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171207

Address after: 221300 Pizhou Economic Development Zone, Xuzhou City, Jiangsu, on the north side of the North Road and the east side of Hongqi Road

Patentee after: Huang Shaowei

Address before: 510640 Guangdong City, Tianhe District Province, No. five, road, public education building, unit 371-1, unit 2401

Patentee before: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Effective date of registration: 20171207

Address after: 510640 Guangdong City, Tianhe District Province, No. five, road, public education building, unit 371-1, unit 2401

Patentee after: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181029

Address after: 510640 2414-2416 of the main building 371, five mountain road, Tianhe District, Guangzhou, Guangdong.

Patentee after: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

Address before: 221300 Jiangsu Xuzhou Pizhou Economic Development Zone north of Ring Road North, Hongqi Road east side.

Patentee before: Huang Shaowei

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181116

Address after: 221300 the first street of new town, Pizhou, Xuzhou, Jiangsu

Patentee after: Pizhou Eurasia import and export trade Co.,Ltd.

Address before: 510640 2414-2416 of the main building 371, five mountain road, Tianhe District, Guangzhou, Guangdong.

Patentee before: GUANGDONG GAOHANG INTELLECTUAL PROPERTY OPERATION Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190701

Address after: 510000 F08-D45, 5th floor, Venus Building, No. 1 Hanjing Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee after: GUANGZHOU YIHENG TECHNOLOGY CO.,LTD.

Address before: 221300 the first street of new town, Pizhou, Xuzhou, Jiangsu

Patentee before: Pizhou Eurasia import and export trade Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120725

Termination date: 20180927