CN101673545A - 一种编解码方法及装置 - Google Patents
一种编解码方法及装置 Download PDFInfo
- Publication number
- CN101673545A CN101673545A CN200810149581A CN200810149581A CN101673545A CN 101673545 A CN101673545 A CN 101673545A CN 200810149581 A CN200810149581 A CN 200810149581A CN 200810149581 A CN200810149581 A CN 200810149581A CN 101673545 A CN101673545 A CN 101673545A
- Authority
- CN
- China
- Prior art keywords
- sound channel
- block signal
- estimated
- channel block
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供了一种编解码方法及装置,涉及音频编码技术领域,为降低多声道压缩编解的复杂度、减少延时而发明。其中,编码方法包括:获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号;利用估计声道分段信号和被估计声道分段信号,确定估计声道分段信号中与被估计声道分段信号的各分段具有相关度的至少一个分段;利用估计声道分段信号中具有相关度的分段,对被估计声道分段信号进行估计,获得被估计声道分段信号的估计参数;将具有相关度的分段所对应的起始位置参数和估计参数进行编码形成估计参数码流;将估计声道分段信号进行编码,形成估计声道信号码流。本发明主要应用于多声道编解码技术中。
Description
技术领域
本发明涉及音频编码技术领域,尤其涉及一种编解码方法及装置。
背景技术
获得立体声信号的途径主要有以下两种:一是采用双麦克风或多麦克风自然录音获得立体声信号,另一个是通过音频工作室人工混音获得立体声信号。其中,在第一个途径中,各声道音频来自同一个音频场景,除了由于麦克风放置方向不同而造成的时间差、强度差等不同,各麦克风所记录的音频信息基本一致,因此各声道音频之间具有很强的相关性。而在第二个途径中,在大多数情况下都是力求营造具有真实感的音频场景,因此各声道音频间也具有很强的相关性。因此,利用上述的相关性降低多声道编码的码率的相关技术已成为音频编码领域中的一个重要课题。
其中,较早提出的是和差立体声(Sum-difference Stereo)方法。该方法将原始立体声信号中的左声道L与右声道R在频域对应频率处进行相加和相减处理,分别得到和声道S与差声道D。该方法可以用较小的码率进行编码。但是,在该方法中,由于仍需要对变换后的两个声道的和声道S与差声道D独立进行编码,因而码率的下降有限。
为了使码率进一步下降,引入了心理声学以去除声道间的主观冗余的技术。人的听觉可以用一个非均匀带宽的滤波器组描述,每个滤波器组通道被称为一个子带,它是最小的听觉单位。空间感主要来自左、右声道对应子带信号的整体特性,如强度差、延时、相关度,而对子带信号的细节不敏感。该方法使码率有明显下降,但由于不能重建频谱细节,它也带来一定的音质损失,因此主要用于人耳不敏感的较高频率子带。
基于空间心理声学的空间音频编码包括双耳线索编码,参数立体声技术和MPEG环绕声技术。该方法的基本原理是:通过在频域逐子带提取对应声道间的时间差,强度差和相关度参数来记录声道间的空间信息,而不对每个声道进行独立的编码,因而有很低的码率,同时还可以保证较高的立体声或环绕声音质。但是空间音频编码的一个突出问题就是编解码延时的增加。
2005年,3GPP(3rd Generation Partnership Project,第三代移动通信合作组织)提出的AMR-WB+(Adaptive Multi Rate Wide Band Plus,宽带自适应多率编码器)采用了基于时域声道间预测的技术,即将和声道和右声道经LPC(linear predictive coding线性预测编码)滤波,分别得到和声道残差信号和右声道残差信号;然后再通过一个预测滤波器,由和声道残差信号预测左、右声道的残差信号,最后向解码器传送滤波器系数以及左右声道的增益。
eAAC+技术采用了参数立体声技术。这种方法的原理是:将立体声信号在混合正交镜像滤波器域(Hybrid Quadrature Mirror Filter,HQMF)中逐子带提取空间参数,包括相位差(对应于时间差)、强度差、和相关度;然后将立体声信号下混成一路信号并反变换到时域进行感知音频编码,解码器根据下混声道的编码数据以及空间参数重建立体声信号。
在实现本发明的过程中,发明人发现:时域声道间预测技术的预测有效性依赖于左、右声道的相关度,对于立体声信息丰富的信号还原失真较大。而参数立体声技术由于是在频域进行音频编码,需要进行复杂的傅里叶变换等操作,因而在参数立体声技术中最突出的问题是引入了附加延时,并且解码的复杂较高。
发明内容
本发明实施例提供了一种编解码方法及装置,以降低多声道压缩编解的复杂度,并减少延时。
本发明实施例编码方法采用以下技术方案:
获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号;
利用所述估计声道分段信号和被估计声道分段信号,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段;
利用估计声道分段信号中所述具有相关度的分段,对所述被估计声道分段信号进行估计,获得所述被估计声道分段信号的估计参数;
将所述具有相关度的分段所对应的起始位置参数和所述估计参数进行编码形成估计参数码流;
将所述估计声道分段信号进行编码,形成估计声道信号码流。
本发明实施例解码方法采用以下技术方案:
解析码流获得估计参数码流以及估计声道信号码流;
将所述估计声道信号码流进行解码,获得估计声道分段信号;
将所述估计参数码流进行解码,获得起始位置参数和估计参数,其中所述起始位置参数为所述估计声道分段信号中与被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数;
利用所述起始位置参数、估计参数以及所述估计声道分段信号,获得被估计声道分段信号。
本发明实施例编码装置采用以下技术方案:
分段信号获取单元,用于获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号;
位置确定单元,用于利用所述估计声道分段信号和被估计声道分段信号,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段;
估计参数计算单元,用于利用估计声道分段信号中所述具有相关度的分段,对所述被估计声道分段信号进行估计,获得所述被估计声道分段信号的估计参数;
参数编码单元,用于将所述最大相关度的分段所对应的起始位置参数和所述估计参数进行编码形成估计参数码流;
信号编码单元,用于将所述估计声道分段信号进行编码,形成估计声道信号码流。
本发明实施例解码装置采用以下技术方案:
码流解析单元,用于解析码流,获得估计参数码流以及估计声道信号码流;
信号解码单元,用于将所述估计声道信号码流进行解码,获得估计声道分段信号;
参数码流解码单元,用于将所述估计参数码流进行解码,获得起始位置参数和估计参数,,其中所述起始位置参数为所述估计声道分段信号中与被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数;
信号获取单元,用于利用所述起始位置参数、估计参数以及所述估计声道分段信号,获得被估计声道分段信号。
通过以上描述的本发明实施例的技术方案可以看出,在编码端,首先通过对时域的估计、被估计声道信号进行加窗处理而得到估计、被估计声道分段信号;然后,再通过估计声道分段信号对被估计声道信号进行估计,得到估计参数;最后将估计声道分段信号以及估计参数进行编码并形成编码码流。在解码端,首先解析编码码流得到估计参数码流以及估计声道信号码流,并利用估计参数以及对估计声道信号码流解码后得到的估计声道分段信号,重构被估计声道分段信号。
因此,相较于现有技术中的方案,本发明实施例的技术方案是在时域中对估计、被估计声道信号进行处理,因此避免了复杂的频域变换中的操作,降低了多声道编解码的复杂度。
附图说明
图1为本发明实施例一编码方法的流程图;
图2为本发明实施例三解码方法的流程图;
图3为本发明实施例五编码装置的示意图;
图4为本发明实施例五编码装置的结构图;
图5为本发明实施例六解码装置的示意图;
图6为本发明实施例六解码装置的结构图。
具体实施方式
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
为降低多声道编码的复杂度并减少延时,本发明实施例提供了一种编码方法。本发明实施例所描述的编码方法,既可以应用在双声道的编码技术中,也可以对多声道输入信号的编码技术中。下面我们分别结合当需进行编码的是双声道信号,以及多路(大于两路)声道信号为例描述本发明实施例编码方法的实现过程。
实施例一需进行编码的声道为两路输入声道信号
如图1所示,本发明实施例一所述的编码方法包括如下步骤:
步骤11、获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号。
在本发明的实施例中,估计、被估计声道信号是一个相对的概念。在实际应用中,若将左声道信号作为估计声道信号,则右声道信号就成为被估计声道信号;同样,若将右声道信号作为估计声道信号,则左声道信号就成为被估计声道信号。并且,在本发明实施例中,对左右声道信号中哪个声道的信号作为估计声道信号不做限制。
在此步骤中,主要是通过分别对估计声道信号、被估计声道信号进行加窗处理,得到估计声道分段信号、被估计声道分段信号。分别对时域的估计、被估计声道信号进行加窗处理的过程具体为:利用一定的帧长,对所述估计、被估计声道信号进行分帧截断,得到估计、被估计声道分段信号。例如,可利用矩形窗、正弦窗、余弦窗等,将估计、被估计声道信号进行分帧截断操作。当然,还可以采用其他的方式。
步骤12、利用所述估计声道分段信号和被估计声道分段信号,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段。
具有相关度的至少一个分段是指,在对被估计声道分段信号进行估计的过程中,在被估计声道分段信号中,只要是与被估计声道分段信号的各分段具有相关度的分段都能用来对被估计声道分段信号进行估计。只是相关度的大小不同,带来的估计效果不同。在实际应用中,为了达到更好的估计效果,一般采用具有最大相关度的分段。
在此步骤中,具体可通过利用被估计声道分段信号,在估计声道分段信号的前后相邻三帧中,利用定长滑动窗技术计算估计、被估计声道分段信号中各对应分段之间的相关度。
下面简要介绍一下最大相关度段的选取方法。以估计声道信号为左声道信号,被估计声道信号为右声道信号为例,对于被估计的第i帧右声道信号,从与它对齐的第i帧左声道信号以及第i-1帧和第i+1帧左声道信号这连续三帧左声道信号中,寻找与它具有最大相关度的一段长度等于帧长的信号,作为所述第i帧右声道信号的估计信号。也就是说,在左声道相邻的三帧中有一个窗在滑动,以寻找与右声道的这帧信号具有最大相关度的一段来估计右声道。这时需要记录滑动窗的位置或极大相关度段的起始位置参数t。
具体可以这样搜索最大相关度段:被估计的右声道信号R恰为一个窗长共16点,记为R[0:15],L的相邻三个窗长段记为L[-16:31],具有相同序号的时间窗点在时间上是对齐的。滑动窗从L[-16]起始,逐点滑动,计算与R[0:15]的线性相关系数,这样会得到33个线性相关系数r[0:32],即计算向量L[j-16:j-1]与向量R[0:15]的线性相关系数的平方,其计算公式如公式(1)所示
其中,j=0,1,...,32。
然后获取r2[j]值中最大的值,该最大值所对应的序号j就可认为是极大相关度段起始位置参数t。
步骤13、利用所述估计声道分段信号中具有相关度的分段,对所述被估计声道分段信号进行估计,获得所述被估计声道分段信号的估计参数。
在此需要说明的是,利用估计声道分段信号中具有相关度的分段,对所述被估计声道分段信号进行估计可以采用一阶线性回归估计,高阶线性回归估计或者线性预测等估计方法。但是,利用一阶线性回归估计方法进行估计的话,计算量较小,且可降低编码的复杂度。
当采用一阶线性回归估计时,所述的回归参数相应的称为线性回归估计参数。其中所述线性回归估计参数可包括第一线性回归估计参数k和第二线性回归估计参数b。k和b的计算公式如公式(2)和公式(3)所示:
k=∑(xi-x)(yi-y)/∑(xi-x)2 (2)
b=y-kx (3)
其中,用k表示第一线性回归估计参数,用b表示第二线性回归估计参数,xi,yi分别是估计声道分段信号和被估计声道分段信号的第i个分量,x,y分别为估计声道分段信号和被估计声道分段信号的平均值。
上述两个线性回归估计参数是在最小均方误差和能量守恒两个约束条件下计算得到的。因此,在解码时,可通过此线性回归估计参数,起始位置参数以及估计声道分段信号,最大相似的还原出被估计声道分段信号。
步骤14、将所述估计参数进行量化编码,得到估计参数码流。
在对估计参数进行量化编码的过程中,量化阶梯可由均匀信噪比原则得到。然后,再将量化后的整数进行编码,例如利用霍夫曼(Huffman)编码技术进行编码。其中在进行霍夫曼编码的过程中,Huffman码表按照标准的码表构造方法,根据上述量化得到的整数的分布而生成。
步骤15、对所述估计声道分段信号进行编码,形成估计声道信号码流。
在对估计声道分段信号进行编码的过程中,可以利用例如ACELP(AlgebraicCode exci ted Linear Prediction,代数码激励线性预测)编码器,感知音频编码器如MPEG-2/4 AAC,对所述估计声道分段信号进行编码。
最后再将所述估计声道信号码流以及所述估计参数码流复接形成编码码流。
实施例二需进行编码的声道为多路(大于两路)输入声道
在实施例二中,以输入声道信号为四路信号为例进行描述,并分别设这四路输入声道信号分别为A,B,C,D。并且,在此实施例中,同样以利用估计声道分段信号中,与被估计声道分段信号的各分段具有最大相关度的分段为例,并以线性回归估计为例进行描述。
首先,需从这四路输入声道信号中任选一路输入声道信号作为估计声道信号,那么其他三路输入声道信号则作为被估计声道信号。在此,选择输入声道信号A作为估计声道信号,B,C,D则同为被估计声道信号。具体过程如下:
步骤11a、与实施例一中描述的相同,首先分别对这四路输入声道信号进行加窗处理,得到相应的输入分段信号。
步骤12a、利用分段声道信号A和分段声道信号B,C和D,分别确定分段声道信号A中与分段声道信号B,C和D的各分段具有最大相关度的分段的起始位置参数t1,t2,和t3。确定所述起始位置参数的过程与实施例一中所描述的相同。
步骤13a、分别利用所述分段声道信号A中具有最大相关度的分段,对所述分段声道信号B,C,D进行线性回归估计,获得所述分段声道信号B,C,D相应的线性回归参数。
步骤14a、分别将分段声道信号B,C,D所对应的线性回归估计参数和相应的起始位置参数进行编码,分别形成与各分段声道信号B,C,D相应的估计参数码流。
步骤15a、将分段声道信号A进行编码,形成估计声道信号码流。
步骤16a、最后再将上述估计参数码流和估计声道信号码流进行复接形成编码码流。
当然,在多声道输入信号时,还可有其他实现编码的方式。但其利用一路输入声道信号对另一路输入声道进行估计的原理相同,最终形成编码码流的过程也相同。
此外,在形成所述编码码流后,还可以将所述编码码流存储或发送到解码器,以方便解码端的操作。
通过此步骤可以看出,在本发明第一实施例和第二实施例的技术方案中,利用估计声道分段信号对被估计声道分段信号进行线性回归估计,而在编码的时候并不利用被估计声道分段信号。因此,本发明实施例所述的编码方法,只是利用了估计声道信号,以及估计声道信号与被估计声道信号之间的线性相关度进行编码,因此编码的结果只与其中的一个声道信号有关。
并且,本发明实施例所述的编码方法在时域中对估计、被估计声道信号进行处理,因此避免了复杂的频域变换中的操作,降低了多声道编码的复杂度,提高了编码效率和灵活性;同时,在进行编码的过程中,只是对估计、被估计声道信号进行一次加窗处理,因此本发明实施例的技术方案减小了多声道编码中的延时。
与本发明实施例一编码方法相对应,本发明实施例三提供了一种解码方法。
如图2所示,本发明实施例三解码方法包括如下步骤:
步骤21、解析码流获得估计参数码流以及估计声道信号码流。
根据编码端将估计参数码流以及估计声道信号码流进行编码的规则,从所述编码码流中解析得出估计参数码流以及估计声道信号码流。
步骤22、利用与编码端的编码方法相对应的解码方法,将所述估计声道信号码流进行解码,获得估计声道分段信号。
步骤23、将所述估计参数码流进行解码,将所述估计参数码流进行解码,获得起始位置参数和估计参数。其中所述起始位置参数为所述估计声道分段信号中与被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数。
步骤24、利用所述起始位置参数、估计参数以及所述估计声道分段信号,获得被估计声道分段信号。
在此步骤中,可根据所述起始位置参数,确定估计声道分段信号中具有所述起始位置参数的分段,其中该分段为与被估计声道分段信号的各分段具有相关度的分段。然后再利用所述估计参数,以及估计声道分段信号中具有所述起始位置参数的分段,进行估计,获得被估计声道分段信号。
同时,根据实施例一和二所描述的编码方法可知,可利用估计声道分段信号中与被估计声道分段信号中具有最大相关度的分段,对被估计声道分段信号进行线性回归估计,以达到最好的估计效果,并降低编码的复杂度。因此,在上述步骤23中所获得的估计参数相应为线性回归估计参数,并且包括第一线性回归估计参数k和第二线性回归估计参数b。
因此,在步骤24中,可首先根据所述起始位置参数,确定估计声道分段信号中具有所述起始位置参数的分段,其中该分段为具有与被估计声道分段信号最大相关度的分段;利用所述线性回归估计参数,以及估计声道分段信号中具有所述起始位置参数的分段,进行线性回归估计,获得被估计声道分段信号。
在此步骤中,可通过建立被估计声道信号和估计声道信号之间的线性关系来获得被估计声道信号。例如,上述线性关系可表示成公式(4)所示的形式:
Y=kX+b, (4)
其中k为第一线性回归估计参数,b为第二线性回归估计参数,X为解码得到的估计声道分段信号中具有最大相关度的分段信号,Y为还原出的被估计声道分段信号。
由实施例一可以看出,由于k和b的获取是在最小均方误差和能量守恒两个约束条件下计算得到的,并且在还原被估计声道分段信号时是利用的估计声道分段信号中具有最大相关度的分段,因此,利用上述方法还原出的被估计声道分段信号与编码端输入的估计声道信号具有最大的相似度。
此外,为便于重建估计、被估计声道分段信号,本发明实施例三在步骤22后,所述的方法还包括对所述估计声道分段信号进行加窗处理。
当编码端的估计声道信号和被估计声道信号的个数超过两路时,在解码端进行解码时,与实施例三中不同的是,在解析码流时获得的是至少一路估计声道信号码流。在对所述估计参数码流进行解码后得到的线性回归估计参数中,包括的线性回归估计参数是多路被估计声道分段信号所对应的,而起始位置参数是多路估计声道分段信号所对应的。
那么在获取每一路被估计声道信号时,都要利用其相应的线性回归估计参数,相应的估计声道分段信号及起始位置参数。在获取过程中的具体方式与实施例三中所描述的相同。
另外,在还原估计声道分段信号、被估计声道分段信号后,可以根据不同应用场合的要求,例如对估计声道分段信号、被估计声道分段信号进行提高声音效果的处理等等。
通过实施例编码方法和解码方法的技术方案可以看出,在编码端,首先通过对时域的估计、被估计声道信号进行加窗处理而得到估计、被估计声道分段信号;然后,再通过估计声道分段信号对被估计声道信号进行线性回归估计,得到估计参数;最后将估计声道分段信号以及估计参数进行编码并形成编码码流。在解码端,首先解析编码码流得到估计参数码流以及估计声道信号码流,并利用估计参数以及对估计声道信号码流解码后得到的估计声道分段信号,重构被估计声道分段信号。
因此,相较于现有技术中的方案,本发明实施例的技术方案是在时域中对估计、被估计声道信号进行处理,因此避免了复杂的频域变换中的操作,降低了多声道编解码的复杂度;同时,在进行编码的过程中,只是对估计、被估计声道信号进行一次加窗处理,因此本发明实施例的技术方案减小了多声道编码技术中的延时。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
此外,本发明实施例五还提供了一种编码装置。如图3所示,本发明实施例所述的编码装置包括:分段信号获取单元31,位置确定单元32,估计参数计算单元33,参数编码单元34,信号编码单元35。
其中,所述分段信号获取单元31,用于获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号;起始位置参数计算单元32,用于利用所述估计声道分段信号和被估计声道分段信号,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段;估计参数计算单元33,用于利用估计声道分段信号中所述具有相关度的分段,对所述被估计声道分段信号进行估计,获得所述被估计声道分段信号的估计参数;参数编码单元34,用于将所述最大相关度的分段所对应的起始位置参数和所述估计参数进行编码形成估计参数码流;信号编码单元35,用于将所述估计声道分段信号进行编码,形成估计声道信号码流。
最后,还可将参数编码单元34和信号编码单元35所分别得到的估计参数码流和估计声道信号码流复接形成编码码流,以便于发送或存储。
其中,如图4所示,所述位置确定单元32包括:相关度计算模块321,用于计算所述估计声道分段信号和被估计声道分段信号中对应分段之间的相关度;分段定位模块322,用于在所述估计声道分段信号中,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数。
同样,在此实施例中,也可利用估计声道分段信号中具有最大相关度的分段对被估计声道分段信号进行估计,以最大程度上的估计被估计声道分段信号。其原理与实施例一和实施例二中所描述的原理相同,在此不再赘述。
本发明实施例编码装置的技术方案是在时域中对估计、被估计声道信号进行相应的处理,因此避免了复杂的频域变换中的操作,降低了音频编码的复杂度;同时,在进行编码的过程中,只是对估计、被估计声道信号进行以此加窗处理,因此本发明实施例的技术方案减小了多声道编码中的延时。
与本发明实施例编码装置相对应,本发明实施例六提供了一种解码装置。如图5所示,本发明实施例解码装置包括:码流解析单元51,信号解码单元52,参数码流解码单元53,以及信号获取单元54。
其中,码流解析单元51,用于解析码流,获得估计参数码流以及估计声道信号码流。信号解码单元52,用于将所述估计声道信号码流进行解码,获得估计声道分段信号。参数码流解码单元53,用于将所述估计参数码流进行解码,获得起始位置参数和估计参数;其中所述起始位置参数为所述估计声道分段信号中与被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数。信号获取单元54,用于利用所述起始位置参数、估计参数以及所述估计声道分段信号,获得被估计声道分段信号。
其中,如图6所示,为便于重建估计、被估计声道信号,所述解码装置还可包括第二分段信号获取单元55,用于对所述估计声道分段信号进行加窗处理。操作单元56,用于对对所述估计声道分段信号、被估计声道分段信号进行再处理,得到估计声道信号和被估计声道信号。
如图6所示,所述信号获取单元54包括:分段确定模块541,用于根据所述起始位置参数,确定估计声道分段信号中具有所述起始位置参数的分段,其中该分段为与被估计声道分段信号的各分段具有相关度的分段;被估计声道分段信号获取模块542,用于利用所述估计参数,以及估计声道分段信号中具有所述起始位置参数的分段,进行估计,获得被估计声道分段信号。
当编码端是利用估计声道分段信号中具有最大相关度的分段对被估计声道分段信号进行线性回归估计的时候,参数码流解码单元53所获得的估计参数相应的为线性回归估计参数;所述分段确定模块541所确定的分段相应的为估计声道分段信号中具有最大相关度的分段,因此被估计声道分段信号获取模块542,用于利用所述线性回归估计参数,以及估计声道分段信号中具有最大相关度的分段,进行估计,获得被估计声道分段信号。其获得被估计声道分段信号的原理与实施例三和实施例四中描述的相同。
综上所述,相较于现有技术中的方案,本发明实施例的技术方案是在时域中对估计、被估计声道信号进行相应的处理,因此避免了复杂的频域变换中的操作,降低了音频编码的复杂度;同时,在进行编码的过程中,只是对估计、被估计声道信号进行以此加窗处理,因此本发明实施例的技术方案减小了延时。
而且,本发明实施例所述的装置可以作为单声道编码系统的预处理子系统,使其扩展成一个多声道编解码系统,并可以提供高保真的单声道信号,通过灵活使用编码端提取的估计参数,可以实现多种后处理效果。
此外,现有技术中的其他多声道编码方案中都是传送下混声道,即“和声道”或“差声道”。虽然在将各声道下混之前已经提取了各声道间的差异性信息,但是,用于重建立体声的参考信号并不是原始用于提取差异性信息的参考信号,所以无法近似恢复原声的声像位置。同时由于使用的参考信号是下混信号,在下混处理过程中,如“和声道”处理,参考信号的声像位置已经向两声道中心偏移,必然导致声道间距离变窄,即声场变窄。而本发明只是将估计声道信号进行编码,因此,利用本发明实施例改善了声场宽度。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (14)
1、一种编码方法,其特征在于,所述方法包括如下步骤:
获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号;
利用所述估计声道分段信号和被估计声道分段信号,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段;
利用估计声道分段信号中所述具有相关度的分段,对所述被估计声道分段信号进行估计,获得所述被估计声道分段信号的估计参数;
将所述具有相关度的分段所对应的起始位置参数和所述估计参数进行编码形成估计参数码流;
将所述估计声道分段信号进行编码,形成估计声道信号码流。
2、根据权利要求1所述的编码方法,其特征在于,获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号的步骤具体为:
利用一定的帧长,对所述估计声道信号、被估计声道信号进行分帧截断,得到估计声道分段信号、被估计声道分段信号。
3、根据权利要求1所述的编码方法,其特征在于,利用所述估计声道分段信号和被估计声道分段信号,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段的步骤具体为:
计算所述估计声道分段信号和被估计声道分段信号中对应分段之间的相关度;
在所述估计声道分段信号中,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数。
4、根据权利要求1所述的编码方法,其特征在于,所述估计参数包括第一估计参数和第二估计参数;
在利用估计声道分段信号中所述具有相关度的分段,对所述被估计声道分段信号进行估计,获得所述被估计声道分段信号的估计参数的步骤中,
第一估计参数的计算公式为:k=∑(xi-x)(yi-y)/∑(xi-x)2;
第二估计参数的计算公式为:b=y-kx;
其中,用k表示第一估计参数,用b表示第二估计参数,xi,yi分别是估计声道分段信号和被估计声道分段信号的第i个分量,x,y分别为估计声道分段信号和被估计声道分段信号的平均值。
5、一种解码方法,其特征在于,所述方法包括如下步骤:
解析码流获得估计参数码流以及估计声道信号码流;
将所述估计声道信号码流进行解码,获得估计声道分段信号;
将所述估计参数码流进行解码,获得起始位置参数和估计参数,其中所述起始位置参数为所述估计声道分段信号中与被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数;
利用所述起始位置参数、估计参数以及所述估计声道分段信号,获得被估计声道分段信号。
6、根据权利要求5所述的解码方法,其特征在于,将所述估计声道信号码流进行解码,获得估计声道分段信号的步骤后还包括:
对所述估计声道分段信号进行加窗处理。
7、根据权利要求5或6所述的解码方法,其特征在于,利用所述起始位置参数、估计参数以及所述估计声道分段信号,获得被估计声道分段信号的步骤具体为:
根据所述起始位置参数,确定估计声道分段信号中具有所述起始位置参数的分段,其中该分段为与被估计声道分段信号的各分段具有相关度的分段;
利用所述估计参数,以及估计声道分段信号中具有所述起始位置参数的分段,进行估计,获得被估计声道分段信号。
8、根据权利要求7所述的解码方法,其特征在于,所述方法还包括:
对所述估计声道分段信号、被估计声道分段信号进行再处理,得到估计声道信号和被估计声道信号。
9、一种编码装置,其特征在于,所述装置包括:
分段信号获取单元,用于获取估计声道信号的估计声道分段信号和被估计声道信号的被估计声道分段信号;
位置确定单元,用于利用所述估计声道分段信号和被估计声道分段信号,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段;
估计参数计算单元,用于利用估计声道分段信号中所述具有相关度的分段,对所述被估计声道分段信号进行估计,获得所述被估计声道分段信号的估计参数;
参数编码单元,用于将所述最大相关度的分段所对应的起始位置参数和所述估计参数进行编码形成估计参数码流;
信号编码单元,用于将所述估计声道分段信号进行编码,形成估计声道信号码流。
10、根据权利要求9所述的编码装置,其特征在于,所述位置确定单元包括:
相关度计算模块,用于计算所述估计声道分段信号和被估计声道分段信号中对应分段之间的相关度;
分段定位模块,用于在所述估计声道分段信号中,确定所述估计声道分段信号中与所述被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数。
11、一种解码装置,其特征在于,所述装置包括:
码流解析单元,用于解析码流,获得估计参数码流以及估计声道信号码流;
信号解码单元,用于将所述估计声道信号码流进行解码,获得估计声道分段信号;
参数码流解码单元,用于将所述估计参数码流进行解码,获得起始位置参数和估计参数,其中所述起始位置参数为所述估计声道分段信号中与被估计声道分段信号的各分段具有相关度的至少一个分段所对应的起始位置参数;
信号获取单元,用于利用所述起始位置参数、估计参数以及所述估计声道分段信号,获得被估计声道分段信号。
12、根据权利要求11所述的解码装置,其特征在于,所述信号获取单元包括:
分段确定模块,用于根据所述起始位置参数,确定估计声道分段信号中具有所述起始位置参数的分段,其中该分段为与被估计声道分段信号的各分段具有相关度的分段;
被估计声道分段信号获取模块,用于利用所述估计参数,以及估计声道分段信号中具有所述起始位置参数的分段,进行估计,获得被估计声道分段信号。
13、根据权利要求11或12所述的解码装置,其特征在于,所述装置还包括:
第二分段信号获取单元,用于对所述估计声道分段信号进行加窗处理。
14、根据权利要求13所述的解码装置,其特征在于,所述装置还包括:
操作单元,用于对对所述估计声道分段信号、被估计声道分段信号进行再处理,得到估计声道信号和被估计声道信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810149581XA CN101673545B (zh) | 2008-09-12 | 2008-09-12 | 一种编解码方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810149581XA CN101673545B (zh) | 2008-09-12 | 2008-09-12 | 一种编解码方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101673545A true CN101673545A (zh) | 2010-03-17 |
CN101673545B CN101673545B (zh) | 2011-11-16 |
Family
ID=42020735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810149581XA Active CN101673545B (zh) | 2008-09-12 | 2008-09-12 | 一种编解码方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101673545B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104240712A (zh) * | 2014-09-30 | 2014-12-24 | 武汉大学深圳研究院 | 一种三维音频多声道分组聚类编码方法及系统 |
US8976971B2 (en) | 2009-04-20 | 2015-03-10 | Huawei Technologies Co., Ltd. | Method and apparatus for adjusting channel delay parameter of multi-channel signal |
CN108292505A (zh) * | 2015-11-20 | 2018-07-17 | 高通股份有限公司 | 多重音频信号的编码 |
CN108766435A (zh) * | 2018-05-17 | 2018-11-06 | 东莞市华睿电子科技有限公司 | 一种基于非触控式的空间机器人控制方法 |
CN108847228A (zh) * | 2018-05-17 | 2018-11-20 | 东莞市华睿电子科技有限公司 | 一种基于双人发声的空间机器人控制方法 |
WO2018209942A1 (zh) * | 2017-05-16 | 2018-11-22 | 华为技术有限公司 | 一种立体声信号处理方法及装置 |
CN108881168A (zh) * | 2018-05-17 | 2018-11-23 | 东莞市华睿电子科技有限公司 | 一种家电设备的验证登录方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2131242C (en) * | 1994-08-31 | 1999-02-16 | Masao Ikekawa | Apparatus for error-correct decoding in a digital data communications system |
CN1860526B (zh) * | 2003-09-29 | 2010-06-16 | 皇家飞利浦电子股份有限公司 | 音频信号编码 |
TWI393120B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式 |
BRPI0613734B1 (pt) * | 2005-07-19 | 2019-10-22 | Agere Systems | decodificador, método e receptor para gerar um sinal de áudio de multi-canais, unidade legível por computador, sistema de transmissão, método para transmitir e receber um sinal de áudio, e, dispositivo de reprodução de áudio |
EP2000001B1 (en) * | 2006-03-28 | 2011-12-21 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for a decoder for multi-channel surround sound |
-
2008
- 2008-09-12 CN CN200810149581XA patent/CN101673545B/zh active Active
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8976971B2 (en) | 2009-04-20 | 2015-03-10 | Huawei Technologies Co., Ltd. | Method and apparatus for adjusting channel delay parameter of multi-channel signal |
CN104240712A (zh) * | 2014-09-30 | 2014-12-24 | 武汉大学深圳研究院 | 一种三维音频多声道分组聚类编码方法及系统 |
CN104240712B (zh) * | 2014-09-30 | 2018-02-02 | 武汉大学深圳研究院 | 一种三维音频多声道分组聚类编码方法及系统 |
CN108292505A (zh) * | 2015-11-20 | 2018-07-17 | 高通股份有限公司 | 多重音频信号的编码 |
WO2018209942A1 (zh) * | 2017-05-16 | 2018-11-22 | 华为技术有限公司 | 一种立体声信号处理方法及装置 |
US11200907B2 (en) | 2017-05-16 | 2021-12-14 | Huawei Technologies Co., Ltd. | Stereo signal processing method and apparatus |
US11763825B2 (en) | 2017-05-16 | 2023-09-19 | Huawei Technologies Co., Ltd. | Stereo signal processing method and apparatus |
CN108766435A (zh) * | 2018-05-17 | 2018-11-06 | 东莞市华睿电子科技有限公司 | 一种基于非触控式的空间机器人控制方法 |
CN108847228A (zh) * | 2018-05-17 | 2018-11-20 | 东莞市华睿电子科技有限公司 | 一种基于双人发声的空间机器人控制方法 |
CN108881168A (zh) * | 2018-05-17 | 2018-11-23 | 东莞市华睿电子科技有限公司 | 一种家电设备的验证登录方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101673545B (zh) | 2011-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2693648C2 (ru) | Устройство и способ для кодирования или декодирования многоканального сигнала с использованием повторной дискретизации спектральной области | |
CN101673545B (zh) | 一种编解码方法及装置 | |
KR101183862B1 (ko) | 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템 | |
CN103329197B (zh) | 用于反相声道的改进的立体声参数编码/解码 | |
CN103119647B (zh) | 基于改进型离散余弦变换的复数预测立体声编码 | |
CN101128867B (zh) | 多声道音频编码和/或解码中改进的滤波器平滑 | |
CN103559884B (zh) | 多声道信号的编码/解码装置及方法 | |
RU2665214C1 (ru) | Стереофонический кодер и декодер аудиосигналов | |
CN101933086B (zh) | 处理音频信号的方法和设备 | |
TWI404429B (zh) | 用於將多頻道音訊信號編碼/解碼之方法與裝置 | |
US20070239442A1 (en) | Multi-Channel Encoder | |
CN101118747A (zh) | 保真度优化的预回声抑制编码 | |
CN104981981A (zh) | 数字音频信号中的前回声的有效衰减 | |
US20230395083A1 (en) | Stereo Signal Processing Method and Apparatus | |
CN103700372A (zh) | 一种基于正交解相关技术的参数立体声编码、解码方法 | |
Lindblom et al. | Flexible sum-difference stereo coding based on time-aligned signal components | |
Gorlow et al. | Multichannel object-based audio coding with controllable quality | |
RU2803142C1 (ru) | Устройство повышающего микширования звука, выполненное с возможностью работы в режиме с предсказанием или в режиме без предсказания | |
EP1639580B1 (en) | Coding of multi-channel signals | |
CN104205211A (zh) | 多声道音频编码器以及用于对多声道音频信号进行编码的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |