CN101071570A - 耦合声道的编、解码处理方法、音频编码装置及解码装置 - Google Patents
耦合声道的编、解码处理方法、音频编码装置及解码装置 Download PDFInfo
- Publication number
- CN101071570A CN101071570A CNA200710117699XA CN200710117699A CN101071570A CN 101071570 A CN101071570 A CN 101071570A CN A200710117699X A CNA200710117699X A CN A200710117699XA CN 200710117699 A CN200710117699 A CN 200710117699A CN 101071570 A CN101071570 A CN 101071570A
- Authority
- CN
- China
- Prior art keywords
- sound channel
- main sound
- ratio
- coupling track
- relation parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 230000008878 coupling Effects 0.000 title claims description 94
- 238000010168 coupling process Methods 0.000 title claims description 94
- 238000005859 coupling reaction Methods 0.000 title claims description 94
- 238000013139 quantization Methods 0.000 claims abstract description 57
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 claims description 44
- 230000008569 process Effects 0.000 claims description 29
- 230000001143 conditioned effect Effects 0.000 claims description 7
- 238000011002 quantification Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 13
- 238000013507 mapping Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种耦合声道的编码处理方法,包括:在耦合声道当前帧变换域信号的每个编码单位内,确定其中一个声道作为主声道,并计算另一个声道与所述主声道的关系参数;对所述主声道及所述关系参数进行量化及编码处理。本发明还公开了一种耦合声道的解码处理方法,包括:对反量化后得到的变换域信号,根据主声道及另一个声道与所述主声道的关系参数,恢复出耦合声道。此外,本发明还公开了一种音频编码装置和音频解码装置。本发明所提供的方法及装置,可以有效降低编解码冗余率,提高编码效率。
Description
技术领域
本发明涉及音频编码技术,尤其涉及耦合声道的编码处理方法、解码处理方法、音频编码装置及音频解码装置。
背景技术
目前,音频编码装置的一种结构示意图如图1所示,包括:滤波器组、心理声学模型、量化模块和编码模块。
其中,滤波器组用于进行时变换域映射,将输入的音频信号由时域映射为变换域,并将所映射的变换域信号输出。其中,变换域或者说频域泛指各种为了信号处理的方便采用的变换方法得到的信号表示结果,这些变换方法包括:傅立叶变换(FFT),修正离散余弦变换(MDCT)和小波变换(wavelet)等。
心理声学模型用于对输入信号进行分析,根据人耳的听觉模型确定输入信号中哪些分量可以不进行编码,哪些分量可以用比较低的精度进行编码等,并生成控制信号输出给量化模块。
量化模块用于根据来自心理声学模型的控制信号中的掩噪比及感知熵等信息,对变换域信号进行量化,将量化后的音频样本信号输出给编码模块。
编码模块用于对量化模块输出的音频样本信号进行熵编码,并连同一些解码所需的边信息生成符合规范的码流。
此外,音频解码装置的一种结构示意图如图2所示,包括:解码模块、反量化模块、滤波器组及多声道解码模块。
其中,解码模块用于对所接收的码流进行解码,将解码后的音频样本信号输出给反量化模块。
反量化模块用于对来自解码模块的音频样本信号进行反量化等操作,将反量化后的变换域信号输出。
滤波器组用于将所接收的变换域信号反映射为时域信号输出。
当存在多个声道时,上述编解码装置对每个声道都进行相同的处理,因此对于耦合声道来说,当声道之间具有较强的相关性时,上述编解码过程会存在较大的编解码冗余。
发明内容
有鉴于此,本发明实施例中一方面提供一种耦合声道的编码处理方法、解码处理方法;另一方面提供一种音频编码装置及音频解码装置,以便消除声道之间的冗余编解码。
本发明实施例中提供的耦合声道的编码处理方法,包括:
A、在耦合声道当前帧变换域信号的每个编码单位内,选择其中一个声道作为主声道,并计算另一个声道与所述主声道的关系参数;
B、对所述主声道及所述关系参数进行量化及编码处理。
其中,步骤A中所述选择其中一个声道作为主声道为:在低频部分基于耦合声道对应频点的绝对值的大小,选择主声道,在高频部分基于耦合声道对应子带的能量大小或基于耦合声道对应频点的绝对值的大小,选择主声道;
所述计算另一个声道与所述主声道的关系参数为:在低频部分将两个声道对应频点的比值或该比值的反正切函数值作为关系参数;在高频部分将两个声道对应子带的能量比值或该比值的开方值作为关系参数,或者将两个声道对应频点的比值或该比值的反正切函数值作为关系参数。
其中,所述步骤A为:在耦合声道变换域信号的每个频点内,将耦合声道对应频点的绝对值进行比较,确定其中绝对值较大的频点的声道作为主声道,计算另一个声道与所述主声道对应频点的比值,将所述比值作为另一个声道与所述主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数。
或者,所述步骤A为:在耦合声道变换域信号的每个子带内,将该子带内耦合声道的所有对应频点的绝对值进行比较,确定其中绝对值较大的频点占半数以上的声道作为主声道,计算该子带内另一个声道与所述主声道所有对应频点的比值,将所述比值作为另一个声道与所述主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数。
或者,所述步骤A为:在耦合声道变换域信号低频部分的每个频点内,将耦合声道对应频点的绝对值进行比较,确定其中绝对值较大的频点的声道作为主声道,计算另一个声道与所述主声道对应频点的比值,将所述比值作为另一个声道与所述主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数;
在耦合声道变换域信号高频部分的每个子带内,将耦合声道对应子带的能量进行比较,确定其中能量较大的子带的声道作为主声道,计算另一个声道与所述主声道能量的比值,将所述比值或所述比值的开方值作为另一个声道与所述主声道的关系参数。
或者,所述步骤A为:在耦合声道变换域信号低频部分的每个子带内,将该子带内耦合声道的所有对应频点的绝对值进行比较,确定其中绝对值较大的频点占半数以上的声道作为主声道,计算该子带内另一个声道与所述主声道所有对应频点的比值,将所述比值作为另一个声道与所述主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数;
在耦合声道变换域信号高频部分的每个子带内,将耦合声道对应子带的能量进行比较,确定其中能量较大的子带的声道作为主声道,计算另一个声道与所述主声道能量的比值,将所述比值或所述比值的开方值作为另一个声道与所述主声道的关系参数。
较佳地,步骤A之前进一步包括:对耦合声道当前帧的变换域信号相关性进行计算,若所述计算得到的相关性值满足预设条件,则执行所述步骤A。
步骤B中所述编码处理包括:对所述主声道及所述关系参数量化后输出的音频样本信号进行熵编码,并连同解码所需的包括主声道选取信息在内的边信息生成符合规范的码流。
本发明实施例中提供的耦合声道的解码处理方法,包括:对反量化后得到的变换域信号,根据主声道及另一个声道与所述主声道的关系参数,恢复出耦合声道。
本发明实施例中提供的音频编码装置,包括:滤波器组、心理声学模块、量化模块和编码模块,此外,该装置还包括:声道编码模块,用于接收来自滤波器组的耦合声道当前帧的变换域信号,在所述变换域信号的每个编码单位内,选择其中一个声道作为主声道,并计算另一个声道与所述主声道的关系参数,将所述主声道及所述关系参数信号输出给量化模块。
较佳地,该装置进一步包括:相关性计算模块,用于对耦合声道当前帧的变换域信号相关性进行计算,若所述计算得到的相关性值满足预设条件,则控制滤波器组的输出端与所述声道编码模块的输入端相连,否则,控制滤波器组的输出端与所述量化模块相连。
本发明实施例中提供的音频解码装置,包括:解码模块、反量化模块和滤波器组,其特征在于,该装置还包括:声道解码模块,用于对来自反量化模块的变换域信号,根据主声道及另一个声道与所述主声道的关系参数,恢复出耦合声道输出给滤波器组。
从上述方案可以看出,本发明实施例中在耦合声道当前帧变换域信号的每个编码单位内,确定其中一个声道作为主声道,并计算另一个声道与该主声道的关系参数,之后对主声道及关系参数进行量化及编码处理。相应地,在解码端只需要根据主声道及另一个声道与主声道的关系参数便可还原出耦合声道。可见,该方案很大程度上降低了编码的比特率,并且充分考虑了耦合声道之间的相关性,利用两个声道之间的关系参数及主声道进行编解码,降低了编解码冗余。
附图说明
图1为现有技术中一种音频编码装置的一种结构示意图;
图2为现有技术中一种音频解码装置的一种结构示意图;
图3为本发明实施例中耦合声道的编码处理方法的流程图;
图4为图3所示流程中主声道与另一个声道的一种关系示意图;
图5(a)和图5(b)为本发明实施例中一种音频编码装置的两个结构示意图;
图6(a)和图6(b)为本发明实施例中一种音频解码装置的两个结构示意图。
具体实施方式
本发明的基本思想是:编码时,在耦合声道当前帧变换域信号的每个编码单位内,确定其中一个声道作为主声道,并计算另一个声道与该主声道的关系参数;对主声道及关系参数进行量化及编码处理。解码时,对反量化后得到的变换域信号,在每个编码单位内,根据主声道及另一个声道与该主声道的关系参数,恢复出耦合声道。从而降低编解码冗余度。其中,本发明中所述的声道指声道所对应的信号。
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明进一步详细说明。
参见图3,图3为本发明实施例中耦合声道的编码处理方法的流程图。如图3所示,该流程包括如下步骤:
步骤301,对耦合声道当前帧的变换域信号相关性进行计算。
本步骤中,对耦合声道当前帧的变换域信号相关性进行计算的方法可以有多种,下面仅列举其中一种对相关性计算进行说明。
假设耦合声道为左声道l和右声道r,l(i)为左声道当前帧变换域信号的每个频点值,r(i)为右声道当前帧变换域信号的每个频点值,则左声道l和右声道r的相关性R(l,r)的计算过程如下述式(1)所示:
步骤302,判断步骤301中计算得到的相关性值是否满足预设条件,如果是,则执行步骤303;否则,执行现有技术中的量化编码过程,结束本流程。
本实施例中,可设置开关阈值Tr的取值,如设置Tr=0.85等,则本步骤中,当判断步骤301中计算得到的R(l,r)≥Tr时,则满足预设条件。
步骤303,在耦合声道当前帧变换域信号的每个编码单位内,选择其中一个声道作为主声道,并计算另一个声道与主声道的关系参数。
本步骤的具体实现过程可有多种,下面仅列举其中几种方式,对本发明实施例的具体实现进行详细描述。
方式一:将耦合声道当前帧变换域信号的每个频点作为编码单位,则该实现方式中,在耦合声道变换域信号的每个频点内,将耦合声道对应频点的绝对值进行比较,选择其中绝对值较大的频点的声道作为主声道,计算另一个声道与主声道对应频点的比值,将该比值作为另一个声道与主声道的关系参数,或者将该比值的反正切函数值作为另一个声道与主声道的关系参数。
其中,仍假设耦合声道为左声道l和右声道r,l(i)为左声道当前帧变换域信号的每个频点值,r(i)为右声道当前帧变换域信号的每个频点值,并假设主声道用main表示,另一个声道用sub表示,编码参数矩阵中,主声道main记为M,关系参数记为α,且关系参数为另一个声道与主声道对应频点的比值,则变换矩阵可如下述式(2)和式(3)所示:
该方式中,将耦合声道对应频点的绝对值进行比较,将绝对值较大的频点对应的声道作为主声道,这样则有-1.0≤α≤1.0。即α的范围可知,此时,可用较少的比特数表示α。
其中,若将main和sub进行归一化,则main、sub和α的取值如图4所示,其中,θ为两个声道间的正切角,且θ=ctanα,可以看出,-45°≤θ≤45°。
因此,相关参数也可以为另一个声道与主声道对应频点的比值的反正切函数值θ。
实际应用中,可根据需要选取α或θ作为相关参数。
方式二:对耦合声道当前帧变换域信号进行子带划分,然后将耦合声道当前帧变换域信号的每个子带作为编码单位,则该实现方式中,在耦合声道变换域信号的每个子带内,将该子带内耦合声道的所有对应频点的绝对值进行比较,选择其中绝对值较大的频点占半数以上的声道作为主声道,计算该子带内另一个声道与主声道所有对应频点的比值,将该比值作为另一个声道与主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数。
其中,子带的划分可以是现有技术中的尺度因子带的划分,也可以是根据实际需要进行的其它子带划分,如低频带、中频带和高频带等。
不同于方式一,该方式中以子带为单位确定主声道,而方式一中以频点为单位确定主声道,该方式中可以减少主声道选取信息的信息量,但α的取值区间要比[-1,1]大。该方式下可以使用θ作为关系系数,可以得到该方式下θ的取值区间为(-90°,90°)
上述两个方式中,对当前帧内的各个频点进行多声道编码实际上是对当前帧内的谱线进行编码。但人耳对于各个频点分量的感知是不同的,有研究表明,在高频的时候,人耳能够感受到的主要是声道之间的能量比例,而不是各个频点分量的细节和相位。所以在这个时候可只需将高频部分多个频点的能量比作为关系参数进行编码,例如,可划分子带,然后将整个子带的能量比作为关系参数进行编码。
对能量比进行编码的过程与谱线编码类似。先选择子带的主声道,然后计算该子带内两个声道的能量比,则该子带只需要编码一个声道的数据,另一个声道只需要编码一个比例系数。此时,相当于该子带内各个谱线的α都相同。此时,若用Emain表示主声道的能力,用Esub表示另一个声道的能力,则α可以取下述式(4)中的值:
其中,子带内声道的能量等于该子带内各频点幅值的平方和。
有鉴于此,结合方式一和方式二,分别有如下两种实现方式:
方式三:将耦合声道当前帧变换域信号低频部分的每个频点作为编码单位,高频部分的每个子带作为编码单位(通常可将高频部分划分为一个子带,当然也可划分为多个子带)。
该方式中,在耦合声道变换域信号低频部分的每个频点内,将耦合声道对应频点的绝对值进行比较,选择其中绝对值较大的频点的声道作为主声道,计算另一个声道与该主声道对应频点的比值,将所计算的比值作为另一个声道与主声道的关系参数,或者将该比值的反正切函数值作为另一个声道与主声道的关系参数。在耦合声道变换域信号高频部分的每个子带内,将耦合声道对应子带的能量进行比较,选择其中能量较大的子带的声道作为主声道,计算另一个声道与该主声道能量的比值,将所计算的比值或所述比值的开方值作为另一个声道与所述主声道的关系参数。
方式四:对耦合声道当前帧变换域信号进行子带划分,然后将耦合声道当前帧变换域信号的每个子带作为编码单位(通常可将高频部分划分为一个子带,当然也可划分为多个子带)。
该方式中,在耦合声道变换域信号低频部分的每个子带内,将该子带内耦合声道的所有对应频点的绝对值进行比较,选择其中绝对值较大的频点占半数以上的声道作为主声道,计算该子带内另一个声道与主声道所有对应频点的比值,将所计算的比值作为另一个声道与主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数。
在耦合声道变换域信号高频部分的每个子带内,将耦合声道对应子带的能量进行比较,选择其中能量较大的子带的声道作为主声道,计算另一个声道与主声道能量的比值,将所计算的比值或该比值的开方值作为另一个声道与主声道的关系参数。
上述方式一至方式四中,在低频部分主要是基于耦合声道对应频点的绝对值的大小,选择主声道;并将两个声道对应频点的比值或者该比值的反正切函数值作为关系参数。在高频部分则可以基于耦合声道对应子带的能量大小,选择主声道,或者也可以基于耦合声道对应频点的绝对值的大小,选择主声道;并相应地在高频部分将两个声道对应子带的能量比值或该比值的开方值作为关系参数,或将两个声道对应频点的比值或者该比值的反正切函数值作为关系参数。
上述各方式中,均以绝对值较大的频点或子带能量对应的声道作为主声道的情况为例进行的描述,实际应用中,也可选用绝对值较小的频点或子带能量对应的声道作为主声道,或者直接将耦合声道中的一个声道作为主声道,计算另一个声道与该主声道的关系参数,对所确定的主声道及关系参数进行后续量化及编码处理。
本步骤中的主声道选取信息需要作为边信息加入码流中。
步骤304,对所确定的主声道及主声道对应的关系参数进行量化及编码处理。
本步骤中,进行量化及编码的过程可与现有技术中的处理方法一致。只是本实施例中的量化及编码对象为:所确定的主声道和其对应的关系参数。
上述流程为本发明中的优选实施例,其中,对耦合声道每帧信号的相关性都进行计算,这样的话,当耦合声道的某个时间段各自存在不同音源时,可通过计算相关性,得知相关性不强,此时对耦合声道进行主声道与相关参数处理的话并不一定能提高编码率,因此,可直接执行现有技术中的编码处理即可。当然,实际应用中,上述流程中的步骤301和步骤302也可省略,而直接对耦合声道执行步骤303至步骤304,即无需判断耦合声道每帧信号的相关性,此时,虽然对于某一帧相关性不强的信号来说,编码率不一定提高,到对于耦合声道的一系列信号来说,仍然可以大大降低编码冗余率,提高编码效率。
相应地,由于声道解码过程为声道编码过程的逆过程,因此与其它编解码技术类似,对采用上述声道编码处理方法进行量化编码生成的码流,在解码端可包括如下过程:对所接收的码流进行解码,对解码后的音频样本信号进行反量化,对反量化得到的变换域信号,根据主声道及另一个声道与主声道的关系参数,恢复出耦合声道。
其中,声道解码所需的主声道选取信息可从码流中解码出的边信息中获取。
以上对本发明实施例中耦合声道的编码处理方法和解码处理方法进行了详细描述,下面将对本发明实施例中的编码装置和解码装置进行详细描述。
参见图5(a)和图5(b),图5(a)和图5(b)为本发明实施例中音频编码装置的两个结构示意图。
如图5(a)所示,该装置包括:滤波器组、心理声学模型、声道编码模块、量化模块和编码模块。
滤波器组用于进行时变换域映射,将输入的音频信号由时域映射为变换域,并将所映射的变换域信号输出。
声道编码模块,用于接收来自滤波器组的耦合声道当前帧的变换域信号,在所述变换域信号的每个编码单位内,选择其中一个声道作为主声道,并计算另一个声道与所述主声道的关系参数,将所述主声道及所述关系参数信号输出给量化模块,并且将主声道选取信息作为边信息提供给编码模块。其中,具体实现过程可以与图3所示方法流程中的描述一致。
心理声学模型用于对输入信号进行分析,根据人耳的听觉模型确定输入信号中哪些分量可以不进行编码,哪些分量可以用比较低的精度进行编码等,并生成控制信号输出给量化模块。
量化模块用于根据来自心理声学模型的控制信号中的掩噪比及感知熵等信息,对所接收的变换域信号进行量化,将量化后的音频样本信号输出给编码模块。其中的变换域信号包括:来自声道编码模块的主声道及主声道对应的关系参数信号。
编码模块用于对量化模块输出的音频样本信号进行熵编码,并连同一些解码所需的边信息生成符合规范的码流。其中,边信息包括主声道选取信息。
图5(a)所示装置为耦合声道专用处理装置,即该装置直接对耦合声道进行声道编码处理。
进一步地,如图5(b)所示,可将耦合声道处理装置和现有音频编码装置集成在一起,则对于耦合声道,滤波器组可将映射后的变换域信号输出给声道编码模块,声道编码模块将得到的主声道及所述关系参数信号输出给量化模块,量化模块对所接收的来自声道编码模块的主声道及主声道对应的关系参数信号执行量化处理。对于非耦合声道,按现有编码流程进行处理,即滤波器组将映射后的变换域信号输出给量化模块,量化模块对来自滤波器组的变换域信号执行量化处理。
此外,该装置还可进一步包括:相关性计算模块,用于对耦合声道当前帧的变换域信号相关性进行计算,若所述计算得到的相关性值满足预设条件,则控制滤波器组的输出端与声道编码模块的输入端相连;否则,控制滤波器组的输出端与量化模块相连。
当滤波器组的输出端与声道编码模块的输入端相连时,滤波器组将映射后的变换域信号输出给声道编码模块,声道编码模块将得到的主声道及所述关系参数信号输出给量化模块,量化模块对所接收的来自声道编码模块的主声道及主声道对应的关系参数信号执行量化处理。当滤波器组的输出端与量化模块的输入端相连时,滤波器组将映射后的变换域信号输出给量化模块,量化模块对来自滤波器组的变换域信号执行量化处理。
即图5(b)所示编码装置中,声道编码模块仅在符合某个条件的时候才使用,比如本实施例中的相关性要求等。之后,经多声道编码模块变换后的声道进行后续的量化编码等处理。
相应地,与图5(a)所示音频编码装置相对应的音频解码装置,如图6(a)所示,包括:解码模块、反量化模块、声道解码模块和滤波器组。
其中,解码模块用于对所接收的码流进行解码,将解码后的音频样本信号输出给反量化模块。
反量化模块用于对来自解码模块的音频样本信号进行反量化等操作,将反量化后的变换域信号输出。
声道解码模块,用于对来自反量化模块的变换域信号,根据主声道及另一个声道与主声道的关系参数,恢复出耦合声道输出给滤波器组。其中,声道解码所需的主声道选取信息可从解码模块解码出的边信息中获取。
滤波器组用于接收来自声道解码模块的变换域信号,将所接收的变换域信号反映射为时域信号输出。
与图5(b)所示音频编码装置相对应的音频解码装置,如图6(b)所示,当编码端进行了多声道编码处理,则解码端的反量化模块将反量化后的信号输出给声道解码模块,声道解码模块对反量化模块输出的信号进行多声道解码处理后,将恢复出的耦合声道的变换域信号输出给滤波器组,滤波器组对来自声道解码模块的信号进行时域映射。当编码端未进行多声道编码处理,而是按现有技术进行的编码处理,则解码端的反量化模块将反量化后的信号输出给滤波器组,滤波器组对来自反量化模块的信号进行时域映射。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,因为音频编解码装置及编解码方法在实际应用中,根据具体情况会略有差别,甚至模块名称及分类也略有不同,如有些编码装置中,将编码模块称为比特流格式化模块等,有些编码装置中将量化模块和编码模块集成在一个模块中等,因此,所应理解的是,对于其它种类的音频编解码装置或音频编解码方式,本发明实施例中的技术方案同样适用,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1、一种耦合声道的编码处理方法,其特征在于,该方法包括:
A、在耦合声道当前帧变换域信号的每个编码单位内,选择其中一个声道作为主声道,并计算另一个声道与所述主声道的关系参数;
B、对所述主声道及所述关系参数进行量化及编码处理。
2、如权利要求1所述的方法,其特征在于,步骤A中所述选择其中一个声道作为主声道为:在低频部分基于耦合声道对应频点的绝对值的大小,选择主声道,在高频部分基于耦合声道对应子带的能量大小或基于耦合声道对应频点的绝对值的大小,选择主声道;
所述计算另一个声道与所述主声道的关系参数为:在低频部分将两个声道对应频点的比值或该比值的反正切函数值作为关系参数;在高频部分将两个声道对应子带的能量比值或该比值的开方值作为关系参数,或者将两个声道对应频点的比值或该比值的反正切函数值作为关系参数。
3、如权利要求2所述的方法,其特征在于,所述步骤A为:在耦合声道变换域信号的每个频点内,将耦合声道对应频点的绝对值进行比较,确定其中绝对值较大的频点的声道作为主声道,计算另一个声道与所述主声道对应频点的比值,将所述比值作为另一个声道与所述主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数。
4、如权利要求2所述的方法,其特征在于,所述步骤A为:在耦合声道变换域信号的每个子带内,将该子带内耦合声道的所有对应频点的绝对值进行比较,确定其中绝对值较大的频点占半数以上的声道作为主声道,计算该子带内另一个声道与所述主声道所有对应频点的比值,将所述比值作为另一个声道与所述主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数。
5、如权利要求2所述的方法,其特征在于,所述步骤A为:在耦合声道变换域信号低频部分的每个频点内,将耦合声道对应频点的绝对值进行比较,确定其中绝对值较大的频点的声道作为主声道,计算另一个声道与所述主声道对应频点的比值,将所述比值作为另一个声道与所述主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数;
在耦合声道变换域信号高频部分的每个子带内,将耦合声道对应子带的能量进行比较,确定其中能量较大的子带的声道作为主声道,计算另一个声道与所述主声道能量的比值,将所述比值或所述比值的开方值作为另一个声道与所述主声道的关系参数。
6、如权利要求2所述的方法,其特征在于,所述步骤A为:在耦合声道变换域信号低频部分的每个子带内,将该子带内耦合声道的所有对应频点的绝对值进行比较,确定其中绝对值较大的频点占半数以上的声道作为主声道,计算该子带内另一个声道与所述主声道所有对应频点的比值,将所述比值作为另一个声道与所述主声道的关系参数,或者将所述比值的反正切函数值作为另一个声道与所述主声道的关系参数;
在耦合声道变换域信号高频部分的每个子带内,将耦合声道对应子带的能量进行比较,确定其中能量较大的子带的声道作为主声道,计算另一个声道与所述主声道能量的比值,将所述比值或所述比值的开方值作为另一个声道与所述主声道的关系参数。
7、如权利要求1至6中任一项所述的方法,其特征在于,步骤A之前进一步包括:对耦合声道当前帧的变换域信号相关性进行计算,若所述计算得到的相关性值满足预设条件,则执行所述步骤A。
8、如权利要求1至6中任一项所述的方法,其特征在于,步骤B中所述编码处理包括:对所述主声道及所述关系参数量化后输出的音频样本信号进行熵编码,并连同解码所需的包括主声道选取信息在内的边信息生成符合规范的码流。
9、一种耦合声道的解码处理方法,其特征在于,该方法包括:
对反量化后得到的变换域信号,根据主声道及另一个声道与所述主声道的关系参数,恢复出耦合声道。
10、一种音频编码装置,包括:滤波器组、心理声学模块、量化模块和编码模块,其特征在于,该装置还包括:声道编码模块,用于接收来自滤波器组的耦合声道当前帧的变换域信号,在所述变换域信号的每个编码单位内,选择其中一个声道作为主声道,并计算另一个声道与所述主声道的关系参数,将所述主声道及所述关系参数信号输出给量化模块。
11、如权利要求10所述的装置,其特征在于,该装置进一步包括:相关性计算模块,用于对耦合声道当前帧的变换域信号相关性进行计算,若所述计算得到的相关性值满足预设条件,则控制滤波器组的输出端与所述声道编码模块的输入端相连,否则,控制滤波器组的输出端与所述量化模块相连。
12、一种音频解码装置,包括:解码模块、反量化模块和滤波器组,其特征在于,该装置还包括:声道解码模块,用于对来自反量化模块的变换域信号,根据主声道及另一个声道与所述主声道的关系参数,恢复出耦合声道输出给滤波器组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710117699XA CN101071570B (zh) | 2007-06-21 | 2007-06-21 | 耦合声道的编、解码处理方法、音频编码装置及解码装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710117699XA CN101071570B (zh) | 2007-06-21 | 2007-06-21 | 耦合声道的编、解码处理方法、音频编码装置及解码装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101071570A true CN101071570A (zh) | 2007-11-14 |
CN101071570B CN101071570B (zh) | 2011-02-16 |
Family
ID=38898762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200710117699XA Expired - Fee Related CN101071570B (zh) | 2007-06-21 | 2007-06-21 | 耦合声道的编、解码处理方法、音频编码装置及解码装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101071570B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101604524B (zh) * | 2008-06-11 | 2012-01-11 | 北京天籁传音数字技术有限公司 | 立体声编码方法及其装置、立体声解码方法及其装置 |
CN105593931A (zh) * | 2013-07-22 | 2016-05-18 | 弗劳恩霍夫应用研究促进协会 | 使用联合编码残余信号的音频编码器、音频解码器、方法及计算机程序 |
CN110534120A (zh) * | 2019-08-31 | 2019-12-03 | 刘秀萍 | 一种移动网络环境下的环绕声误码修复方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
US7437299B2 (en) * | 2002-04-10 | 2008-10-14 | Koninklijke Philips Electronics N.V. | Coding of stereo signals |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US7630396B2 (en) * | 2004-08-26 | 2009-12-08 | Panasonic Corporation | Multichannel signal coding equipment and multichannel signal decoding equipment |
-
2007
- 2007-06-21 CN CN200710117699XA patent/CN101071570B/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101604524B (zh) * | 2008-06-11 | 2012-01-11 | 北京天籁传音数字技术有限公司 | 立体声编码方法及其装置、立体声解码方法及其装置 |
CN105593931A (zh) * | 2013-07-22 | 2016-05-18 | 弗劳恩霍夫应用研究促进协会 | 使用联合编码残余信号的音频编码器、音频解码器、方法及计算机程序 |
CN110534120A (zh) * | 2019-08-31 | 2019-12-03 | 刘秀萍 | 一种移动网络环境下的环绕声误码修复方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101071570B (zh) | 2011-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2186087B1 (en) | Improved transform coding of speech and audio signals | |
KR100958144B1 (ko) | 오디오 압축 | |
US7620554B2 (en) | Multichannel audio extension | |
CN101325060B (zh) | 频谱域中利用自适应切换的时间分辨率对音频信号编解码的方法和设备 | |
CN103106902B (zh) | 低比特率音频信号解码方法 | |
US7343287B2 (en) | Method and apparatus for scalable encoding and method and apparatus for scalable decoding | |
CN100454389C (zh) | 声音编码设备和声音编码方法 | |
US20160254005A1 (en) | Method and apparatus to encode and decode an audio/speech signal | |
CN101583994B (zh) | 对音频和/或语音信号进行编码和/或解码的方法和设备 | |
US7181404B2 (en) | Method and apparatus for audio compression | |
CN100539437C (zh) | 一种音频编解码器的实现方法 | |
CN1787383B (zh) | 变换、编码、逆变换和解码音频信号的方法和设备 | |
CN102272832B (zh) | 基于峰值检测的选择性缩放掩码计算 | |
CN102436819B (zh) | 无线音频压缩、解压缩方法及音频编码器和音频解码器 | |
WO1998000837A1 (fr) | Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio | |
CN101878504A (zh) | 使用时间分辨率能选择的低复杂性频谱分析/合成 | |
WO2005027094A1 (fr) | Procede et dispositif de quantification de vecteur multi-resolution multiple pour codage et decodage audio | |
CN101527138A (zh) | 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统 | |
CN103366755A (zh) | 对音频信号进行编码和解码的方法和设备 | |
US9240192B2 (en) | Device and method for efficiently encoding quantization parameters of spectral coefficient coding | |
CN101436406B (zh) | 音频编解码器 | |
CN101105940A (zh) | 音频编解码的量化方法、反变换方法及音频编解码装置 | |
CN101071570B (zh) | 耦合声道的编、解码处理方法、音频编码装置及解码装置 | |
CN101290774A (zh) | 音频编码和解码系统 | |
CN116114016A (zh) | 音频量化器和音频去量化器以及相关方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110216 Termination date: 20120621 |