CN101521012A - Mdct域信号能量与相位补偿方法及其装置 - Google Patents
Mdct域信号能量与相位补偿方法及其装置 Download PDFInfo
- Publication number
- CN101521012A CN101521012A CN200910061439A CN200910061439A CN101521012A CN 101521012 A CN101521012 A CN 101521012A CN 200910061439 A CN200910061439 A CN 200910061439A CN 200910061439 A CN200910061439 A CN 200910061439A CN 101521012 A CN101521012 A CN 101521012A
- Authority
- CN
- China
- Prior art keywords
- mdct
- spectrum
- matrix
- mdst
- energy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
本发明提出了MDCT域信号能量与相位补偿方法及其装置,通过分析MDCT变换基和MDST变换基之间的关系,利用稀疏化近似矩阵,提取并简化MDCT至MDST的转换矩阵;利用转换矩阵实现MDCT谱至MDST谱的转换,并联合两者构造具有恒定能量及线性相位的MDFT谱;依据MDFT谱提取空间参数。本发明有效解决了信号在MDCT域的能量抖动及相位缺失问题,实现了在空间音频编码系统中低复杂度的MDCT域空间参数提取合成。
Description
技术领域
本发明属于空间音频技术领域,特别是涉及MDCT域信号能量与相位补偿方法及其装置。
背景技术
传统音频编码技术是对每个声道独立进行编码,适合单声道编码。在多声道立体声编码中,利用传统音频编码技术,会导致码率随声道数成线性增长。
空间音频编码技术是针对传统音频编码的问题而出现的,现有空间音频编解码系统结构如附图1所示:首先在编码端将输入信号进行声源分离和下混。空间参数提取模块针对分离出来的单一声源,提取声场空间信息。然后,由空间参数编码器将提取出来的声场空间信息进行量化编码。下混模块将左右声道混合成单声道信号送入传统编码器;在解码端空间参数解码器将空间参数解码,还原声场空间信息。传统解码器将经过编码的下混信号解码,并输出给上混模块。上混模块通过去相关等技术获得两路信号。结合还原出来的声场空间信息和获得的两路信号由合成模块重建原始音频信号,得到输出信号。
空间信息是通过空间参数来表征的,也就是说,通过度量空间参数的信息来表达信号的空间信息量。信号的能量能反应信号所含信息量的大小,空间参数的能量也反应了其表达的空间信息量大小。空间参数主要描述信号的方位信息和声像宽度。心理声学研究结果表明,声源定位最重要的依据是两耳之间声音信号的差别,通常用耳间时间差(Interaural Time Difference,ITD)和耳间声级差(Interaural Level Difference,ILD)两个参数来描述两耳之间声音信号的差别;另一个描述人耳接收声音信号特性的是双耳接听信号的相似度,用耳间相关性(Interaural Coherence,IC)来表示,主要反应了人耳对听觉事件声场宽度的感知。其他的一些空间参数还包括确定声源远近的距离信息和确定声源垂直位置的高度角信息等。
空间心理声学所指的空间参数都是针对单一声源的,而通常的立体声信号在同一时刻包含多个声源,这就需要进行声源分离。附图1中的声源分离模块正是为空间参数提取模块服务的。现有空间音频编解码系统中,声源分离模块通常是综合考虑信号的短时特性和人耳的非线性频率感知特性,采用独立的时频划分技术来实现虚拟声源的分离。主要的时频划分工具有混合镜像滤波器组HQMF,短时DFT、以及人工耳蜗滤波器CFB。传统编码器主要是利用通过降低声道内的冗余和消除主观冗余来提高编码效率,主要采用的是基于MDCT域的感知编码。
时频分析是编码系统中复杂度较高的部分,一个编码系统存在两种不同的时频变换更加提高了编码系统的复杂度。若传统编码器和声源分离模块都采用相同的时频分析工具,便能较大幅度降低编码系统的复杂度。
CFB、HQMF以及短时DFT由于复杂度、与心理声学的匹配性等原因不适合用于传统编码。而传统编码器的时频分析工具主要是MDCT(修正离散余弦变换)。所以在MDCT域进行声源分离,提取空间参数,降低编码系统复杂度是当前研究的热点。
MDCT是实变换,基于MDCT域的立体声空间参数提取,存在着两大困难:第一,通过MDCT变换后,存在能量抖动,导致变换前后空间参数能量不一致。例如记录了左右声道能量信息的ILD,若输入信号经过MDCT变换后产生能量抖动,那么ILD就不能正确反映左右声道信号间的能量差异。第二,MDCT谱线不存在直接的相位信息,导致提取带有相位的空间参数很困难。例如记录了具有最大互相关的时间偏移的ITD,若输入信号经过MDCT变换后不存在相位信息,那么就不能获得左右声道信号间的时间差异。
发明内容
本发明目的在于针对现有技术的不足,提供MDCT域信号能量与相位补偿方法及其装置,以统一编码系统中的时频分析工具,降低空间音频编解码系统的复杂度。
本发明的技术方案包含以下步骤:
步骤1,对输入信号进行MDCT变换,获得每一帧信号的MDCT谱Xi、前一帧MDCT谱Xi-1,以及后一帧MDCT谱Xi+1;
利用MDCT和MDST的变换基特性以及相互关系,从MDCT和MDST的矩阵定义式出发,得到MDCT到MDST的转换矩阵,所述转换矩阵包括和矩阵T+及差矩阵T-, 其中C0、C1分别为MDCT的变换基的前半部分和后半部分的子向量,S0、S1分别为MDST的变换基的前半部分和后半部分的子向量,MDCT和MDST的变换基为2N×N的矩阵,MDCT和MDST分别的前半部分和后半部分的子向量均为N×N的矩阵;对和矩阵T+进行稀疏近似化,得到近似化和矩阵Tm;
步骤4,由信号的MDCT谱和MDST谱,构造MDFT谱,MDFT谱的构造方式为将MDCT谱作为实部,MDST谱作为虚部,即
Z(k)=X(k)-jY(k)
其中X(k)为输入信号的MDCT谱,Y(k)为输入信号的MDST谱,Z(k)为输入信号的MDFT谱;j表示虚部;k=0,1,...,N-1;
步骤5,利用步骤4所获输入信号的MDFT谱Z(k),在MDCT域上提取能量信息,提取方式为依据如下公式求取信号MDFT谱能量Em
其中Et表示输入信号的时域信号能量Et;
其中k=0,1,...,N-1,exp表示指数运算,j表示虚部;
步骤6,结合步骤5所提取的能量信息和相位信息,在MDCT域上提取空间参数。
而且,步骤2中,将MDCT的变换基ck和MDST的变换基sk分解为N维列向量表示,即
其中, k=0,1,...,N-1,n=0,1,...,2N-1,上标“T”表示转置,上标“0”和“1”分别用于标识变换基的前半部分和后半部分的子向量;
从而得到以下四个N×N矩阵形式的子向量
所述提取MDCT到MDST的转换矩阵,包括和矩阵T+和差矩阵T-,通过将上述四个子向量带入下列公式求得
而且,所述步骤2中,对和矩阵T+进行稀疏近似化,得到近似化和矩阵Tm的具体实施方式如下,
(1)和矩阵T+的表达式:
其中,θ=π/(2N),k,1分别表示行列标号,Re表示实部,odd表示奇数,even表示偶数;
(2)保留以上表达式呈现的稀疏对角阵中绝对值最大的2m个元素值,m取小于N×N/2的任意自然数,其它元素均置为0,从而实现对和矩阵T+稀疏近似化,得到近似化和矩阵Tm。
而且,所述步骤5中,在MDCT域上提取能量信息的具体方式如下,
(1)提取时域输入信号与变换域的对应关系,
对于时域输入信号x(n),n=0,1,...,2N-1,
有对应关系如式
其中, k=0,1,...,N-1,X(k)为输入信号的MDCT谱,Y(k)为输入信号的MDST谱;
(2)根据时域输入信号与变换域之间的对应关系,通过计算能量,找到时域信号能量Et与信号MDFT谱能量Em之间对应的关系,具体方式如下
根据上式得到与时域信号能量Et相应的MDCT域上的能量信息,即信号MDFT谱能量Em。
而且,所述步骤6中,结合步骤5所提取的能量信息和相位信息,在MDCT域上提取空间参数的具体方式如下,
若提取代表左右声道能量差异的空间参数,则利用时域和MDCT域的能量关系 在MDCT域上提取与时域等价的空间参数。
本发明还提供了实现上述MDCT域信号能量与相位补偿方法的相应装置,包含以下部分:
包含以下部分,
MDCT变换模块,用于对输入信号进行MDCT变换,获得信号的MDCT谱;
MDST转换模块,用于获取MDCT到MDST的转换矩阵,得到MDST谱;
MDFT构造模块,用于根据信号的MDCT谱和MDST谱,构造MDFT谱;
能量提取模块,用于提取能量信息;
相位提取模块,用于提取相位信息;
空间参数提取模块,用于根据能量信息和相位信息,在MDCT域上提取空间参数;
其中,MDCT变换模块将输入信号的MDCT谱输出到谱运算模块和MDFT构造模块,谱运算模块输出差矩阵系数、和矩阵系数到MDST转换模块,MDST转换模块输出MDST谱到MDFT构造模块;MDFT构造模块输出MDFT谱到能量提取模块和相位提取模块;能量提取模块输出的能量信息、相位提取模块输出的相位信息接入空间参数提取模块。
本发明的技术方案通过引入MDST(修正离散正弦变换)谱,并提出MDCT谱到MDST谱的转换矩阵,最后构成MDFT(修正离散傅立叶变换)谱。达到引入MDST谱同时不增加系统复杂度的目的,从而可以补偿信号在MDCT域的能量抖动,并解决相位缺失问题。
附图说明
图1为现有空间音频编解码系统结构图;
图2为本发明的方法流程图;
图3为本发明的装置结构图
图4本发明在空间音频编解码系统中的应用示意图。
具体实施方式
参见附图2,本发明提供的MDCT域信号能量与相位补偿方法完成了低复杂度下MDCT谱到MDST谱的转换。并且,通过引入MDST谱,结合MDCT谱,构造了具有恒定能量和线性相位的MDFT谱。最终完成在MDCT域上,提取与时域信号等价的空间参数。MDCT域信号能量与相位补偿方法包括以下步骤:
步骤1,对输入信号进行MDCT变换,获得每一帧信号的MDCT谱Xi、前一帧MDCT谱Xi-1,以及后一帧MDCT谱Xi+1。在音频信号处理中,总是分帧进行处理,当前帧为第i帧时,前一帧就是第i-1帧,后一帧就是第i+1帧。具体实施时,根据MDCT定义求取Xi、Xi-1、Xi+1即可。MDCT是一种2N点到N点的实变换,具体定义如下:
其中xi(n)表示立体声输入信号的第i帧信号,Xi(k)代表xi(n)的MDCT谱线,n=0,1,...,2N-1。
利用MDCT和MDST的变换基特性以及相互关系,从MDCT和MDST的矩阵定义式出发,得到MDCT到MDST的转换矩阵,所述转换矩阵包括和矩阵T+及差矩阵T-, 其中C0、C1分别为MDCT的变换基的前半部分和后半部分的子向量,S0、S1分别为MDST的变换基的前半部分和后半部分的子向量,MDCT和MDST的变换基为2N×N的矩阵,MDCT和MDST分别的前半部分和后半部分的子向量均为N×N的矩阵;对和矩阵,T+进行稀疏近似化,得到近似化和矩阵Tm。
具体实施时,可以按以下子流程逐步完成步骤2:
其中Xi-1为前一帧MDCT谱,Xi+1为后一帧MDCT谱。
步骤2.2,利用步骤1的MDCT谱Xi+1和Xi-1,计算和矩阵系数计算公式为:
其中Xi-1为前一帧MDCT谱,Xi+1为后一帧MDCT谱。
步骤2.3,利用MDCT和MDST的变换基特性以及相互关系,从MDCT和MDST的矩阵定义式出发,得到取得MDCT到MDST的转换矩阵。可以从对称性和正交性两个方面,考究MDCT的变换基ck和MDST的变换基sk之间的关系,具体方式如下:
1)将MDCT的变换基ck和MDST的变换基sk分解为N维列向量表示。即
(1.4)
其中, k=0,1,...,N-1,n=0,1,...,2N-1,上标“T”表示转置,上标“0”和“1”分别表示基向量的前半部分和后半部分的子向量。于是,得到四个N×N的矩阵:
2)关注MDCT的基函数ck和MDST的基函数sk分解后的向量的正交性。具体过程如下:
其中<,>代表内积操作,是狄拉克符号,当且仅当i=j时, 其余为0。对MDCT的基函数ck和MDST的基函数sk分别进行内积操作后会发现,ck和sk各自在k取不同值(采用下标ki和kj表示)时是互相正交的,符合公式1.6和1.7所描述的。以ck和sk为参数进行内积操作后,发现ck和sk也是互相正交。
3)关注MDCT的基函数ck和MDST的基函数sk分解后的向量的对称性,具体过程如下:
JC0=-C0,JC1=C1 (1.9)
JS0=S0,JS1=-S1 (1.10)
4)找到MDCT和MDST的基函数之间的关系。具体计算过程如下:
同理,
sk(n+N)=(-1)kck(n) (1.12)
其中ck(n+N)为延时N点的ck,sk(n+N)为延时N点的sk。ck和sk分别为MDCT和MDST的基函数。用矩阵表示它们之间的关系如下:
S0=-C1P (1.13)
S1=C0P
其中,P是N×N的符号单位阵,其仅在对角线上有数值+1,-1,+1,-1,....。
5)对比MDCT和MDST的矩阵定义式,根据变换基的基本性质,以及它们之间的关系,实现MDCT向MDST谱的转换,具体过程如下:
A.用矩阵形式表示MDCT的定义式。
公式1.14利用了MDCT的重叠相加特性,用矩阵表示了MDCT的定义式。即对于第i帧2N点的时域信号,可通过第i-1帧MDCT谱线Xi-1、第i帧MDCT谱线Xi,以及第i+1帧MDCT谱线Xi+1完美重建。其中,和分别为时域信号的前N点和后N点组成的N维列向量。
B.利用1.9、1.10以及反对角单位阵J的性质JTJ=JJ=I,有
,(1.15)
根据1.15,以及1.8所示ck和sk的正交性,有
C.将MDST谱线的定义式用矩阵形式表示,同时将1.14、1.15和1.16代入化简有:
D,根据公式1.17,提取MDCT到MDST的转换矩阵。即和矩阵T+和差矩阵T-,即:
以上过程在具体实施时可以简化,直接根据MDCT的变换基ck和MDST的变换基sk代入结果公式,而不需重复考究关系的整个过程。因此,本发明提供进一步技术方案为:步骤2中,将MDCT的变换基ck和MDST的变换基sk分解为N维列向量表示,即
其中, k=0,1,...,N-1,n=0,1,...,2N-1,上标“T”表示转置,上标“0”和“1”分别用于标识变换基的前半部分和后半部分的子向量;
从而得到以下四个N×N矩阵形式的子向量
所述提取MDCT到MDST的转换矩阵,包括和矩阵T+和差矩阵T-,通过将上述四个子向量带入下列公式求得
步骤2.4,将和矩阵T+进行稀疏近似化。
首先,得到和矩阵T+的表达式,如下所示:
其中,θ=π/(2N),分子仅是一个正负1的变化,k,1分别表示行列标号,odd表示奇数,even表示偶数。
其次,保留公式1.20所示稀疏对角阵中绝对值最大的2m个元素值,其它元素均置为0值,即忽略矩阵元素的顺序、符号和非0值元素,稀疏近似化和矩阵T+,得到近似化矩阵Tm。矩阵Tm的任意行或列中组成如下序列,
………,………
其中,稀疏对角阵中保留的元素值可以根据具体实施需要设定,因此m可取小于N×N/2的任意自然数。
步骤3,结合步骤2.1,步骤2.2,步骤2.3和步骤2.4所得结果,由MDCT谱合成MDST谱,合成公式为
步骤4,由信号的MDCT谱和MDST谱,构造MDFT谱。可将MDCT看作实部,MDST看作虚部,构造MDFT,具体构造式如下:
Z(k)=X(k)-jY(k) (1.23)
其中X(k)为输入信号的MDCT谱,Y(k)为输入信号的MDST谱,Z(k)为输入信号的MDFT谱;j表示虚部;k=0,1,...,N-1。
步骤5,利用步骤4获得的MDFT谱,在MDCT域上提取能量信息和相位信息。可分以下两个步骤实现:
步骤5.1,根据构造的MDFT谱,对比输入信号在时域的能量Et(称为时域信号能量)和MDFT谱包含的能量Em(称为信号MDFT谱能量),找到它们之间的对应关系 然后根据对应关系计算出信号MDFT谱能量Em,作为MDCT域上的能量信息。具体过程可参见如下:
1.记Z2N为原2N维空间,ck展成的N维空间为CN,sk展成的N维空间为SN,根据线性空间理论,以及公式1.6、1.7、1.8描述的正交性。找到时域输入信号与变换域的对应关系:
对于时域输入信号x(n),n=0,1,...,2N-1,有对应关系如式
其中, k=0,1,...,N-1;ck和sk、k=0,1,...,N-1为构成的一组完备正交基。X(k)为信号的MDCT谱,Y(k)为信号的MDST谱。
2.根据信号之间的关系,相应计算能量,找到Et和Em之间对应的关系,具体计算过程如下:
其中X(k)为信号的MDCT谱,Y(k)为信号的MDST谱。x(n)为时域输入信号。k=0,1,...,N-1。
步骤5.2,将输入信号延时d个采样点,将MDFT谱延时d个采样点,得到线性相位,即 其中k=0,1,...,N-1,exp表示指数运算,j表示虚部。通过得到延时信号的MDCT谱和MDST谱,然后得到延时信号的MDFT谱,找到延时前后MDFT谱的关系,即可得到线性相位,作为相位信息。具体过程可参见如下:
1.延时MDCT谱,关注延时后的MDCT谱的变化。
(1.26)
其中X′(k)为延时d个样点后的MDCT谱,x(n)为原输入信号。d为延时的样点。k=0,1,...,N-1。
2.延时MDST谱,关注延时后的MDST谱的变化。
(1.27)
其中Y′(k)为延时d个样点后MDST谱,x(n)为原输入信号。d为延时的样点。k=0,1,...,N-1。
3.结合公式1.26和1.27,计算延时后MDFT谱的变化。
其中Z′(k)为延时d个样点后MDFT谱,X′(k)为延时d个样点后MDCT谱,Y′(k)为延时d个样点后MDST谱,Z(k)为原MDFT谱。d为延时的样点。k=0,1,...,N-1。
根据公式1.28可以看出,延时前后的MDFT谱只有一个线性相位的差别,并且此线性相位只与延时点数d有关。通过调节延时的点数可以提取需要的相位信息。即:
其中d为延时的样点数,k=0,1,...,N-1。具体实施时直接采用公式1.29即可提取相位信息。
步骤6,结合步骤5.1所得能量信息和步骤5.2所得相位信息,在MDCT域上提取空间参数。具体实施时一般用多个空间参数来衡量空间信息的,有代表空间相位信息的,有代表空间能量信息的。若提取代表左右声道能量差异的空间参数,则利用时域和MDCT域的能量关系 在MDCT域上提取与时域等价的空间参数。若提取代表左右声道相位差异的空间参数,则利用时域到MDCT域产生的线性相位,在MDCT域上提取与时域等价的空间参数。
为了具体说明空间参数的提取,本步骤以双耳线索ILD,ITD为例具体说明。具体实施方式为:
1、在MDCT域提取ILD信息。
其中βl为ILD在时域的值,βml为在MDCT域提取的ILD的值。xl(t)和xr(t)分别是左右声道输入信号,xl和xr分别表示左右接收的信号能量,l和r分别表示左右耳。ILD记录了左右声道信号的能量比。Zl和Zr分别代表左右声道的MDFT谱线。
2、在MDCT域提取ITD信息。
其中βt为ITD在时域的值,βml为在MDCT域提取的ITD的值。通过计算左右声道输入信号MDFT谱线Zl(k)和Zr(k)相位差的群延时提取MDCT域的ITD值。为Zr(k)的共轭。xl(t)和xr(t)分别是左右声道输入信号。ITD记录了最大互相关的时间偏移τ。k=0,1,...,N-1。arg为取相角操作。
具体实施时,除了以软件方式通过计算机实现上述MDCT域信号能量与相位补偿方法,还可以模块化方式提供MDCT域信号能量与相位补偿装置。如附图3所示,所述包含以下部分:
MDCT变换模块,用于对输入信号进行MDCT变换,获得信号的MDCT谱;
MDST转换模块,用于获取MDCT到MDST的转换矩阵,得到MDST谱;
MDFT构造模块,用于根据信号的MDCT谱和MDST谱,构造MDFT谱;
能量提取模块,用于提取能量信息;
相位提取模块,用于提取相位信息;
空间参数提取模块,用于根据能量信息和相位信息,在MDCT域上提取空间参数;
其中,MDCT变换模块将输入信号的MDCT谱输出到谱运算模块和MDFT构造模块,谱运算模块输出差矩阵系数、和矩阵系数到MDST转换模块,MDST转换模块输出MDST谱到MDFT构造模块;MDFT构造模块输出MDFT谱到能量提取模块和相位提取模块;能量提取模块输出的能量信息、相位提取模块输出的相位信息接入空间参数提取模块。具体实施时,转换矩阵模块可分C/S矩阵形成单元和稀疏近似化单元两部分实现,其中C/S矩阵形成单元获得转换矩阵,由稀疏近似化单元对和矩阵T+进行稀疏近似化。
本发明通过在MDCT域上提取空间参数,与传统编码器采用统一的时频分析工具,达到降低编码系统复杂度的目的。由于MDCT是实变换,所以在MDCT域上提取空间参数存在两大困难,第一,通过MDCT变换后,存在能量抖动,导致变换前后空间参数能量不一致。第二,MDCT谱线不存在直接的相位信息,导致提取带有相位的空间参数很困难。本发明提供了引入MDST谱的方法,来解决能量抖动和相位缺失的问题。如果直接引用MDST变换获取MDST谱,又会增加一种变换,使系统复杂度增加,失去意义。因此本发明提供了不经过MDST变换,直接从MDCT谱转换到MDST谱的方法,最终达到在MDCT域成功提取空间参数,同时达到降低系统复杂度的目的。
附图4将应用本发明前后的空间音频编解码系统进行对比。附图4上方是现有的空间音频编码系统,其中的空间参数提取模块和传统编码器需要运用独立的MDCT时频分析工具,传统编码器中包括了MDCT变换部分和量化编码部分。附图4下方是基于本发明的空间音频编解码系统,其中的空间参数提取模块按照本发明提供方案实现,不仅有原有的空间参数提取模块,还在前扩展了MDCT变换模块、谱运算模块、MDST转换模块、MDFT构造模块、能量提取模块和相位提取模块;新的空间参数提取模块和传统编码器共享MDCT时频变换,传统编码器中只设量化编码部分即可。统一时频变换工具后,整个编码端只需进行一次MDCT时频变换,较大幅度降低了编码系统的复杂度。
Claims (5)
1.一种MDCT域信号能量与相位补偿方法,其特征在于,包含以下步骤:步骤1,对输入信号进行MDCT变换,获得每一帧信号的MDCT谱Xi、前一帧MDCT谱Xi-1,以及后一帧MDCT谱Xi+1;
利用MDCT和MDST的变换基特性以及相互关系,从MDCT和MDST的矩阵定义式出发,得到MDCT到MDST的转换矩阵,所述转换矩阵包括和矩阵T+及差矩阵T-, 其中C0、C1分别为MDCT的变换基的前半部分和后半部分的子向量,S0、S1分别为MDST的变换基的前半部分和后半部分的子向量,MDCT和MDST的变换基为2N×N的矩阵,MDCT和MDST分别的前半部分和后半部分的子向量均为N×N的矩阵;对和矩阵T+进行稀疏近似化,得到近似化和矩阵Tm;
步骤4,由信号的MDCT谱和MDST谱,构造MDFT谱,MDFT谱的构造方式为将MDCT谱作为实部,MDST谱作为虚部,即
Z(k)=X(k)-jY(k)
其中X(k)为输入信号的MDCT谱,Y(k)为输入信号的MDST谱,Z(k)为输入信号的MDFT谱;j表示虚部;k=0,1,...,N-1;
步骤5,利用步骤4所获输入信号的MDFT谱Z(k),在MDCT域上提取能量信息,提取方式为依据如下公式求取信号MDFT谱能量Em
其中Et表示输入信号的时域信号能量Et;
其中k=0,1,...,N-1,exp表示指数运算,j表示虚部;步骤6,结合步骤5所提取的能量信息和相位信息,在MDCT域上提取空间参数。
2.根据权利要求书1所述的MDCT域能量与相位补偿方法,其特征在于:步骤2中,将MDCT的变换基ck和MDST的变换基sk分解为N维列向量表示,即
其中, k=0,1,...,N-1,n=0,1,...,2N-1,上标“T”表示转置,上标“0”和“1”分别用于标识变换基的前半部分和后半部分的子向量;
从而得到以下四个N×N矩阵形式的子向量
所述提取MDCT到MDST的转换矩阵,包括和矩阵T+和差矩阵T-,通过将上述四个子向量带入下列公式求得
3.根据权利要求书2所述的MDCT域能量与相位补偿方法,其特征在于:所述步骤2中,对和矩阵T+进行稀疏近似化,得到近似化和矩阵Tm的具体实施方式如下,
(1)和矩阵T+的表达式:
其中,θ=π/(2N),k,l分别表示行列标号,Re表示实部,odd表示奇数,even表示偶数;
(2)保留以上表达式呈现的稀疏对角阵中绝对值最大的2m个元素值,m取小于N×N/2的任意自然数,其它元素均置为0,从而实现对和矩阵T+稀疏近似化,得到近似化和矩阵Tm。
4、根据权利要求书1所述的MDCT域信号能量和相位补偿方法,其特征在于:所述步骤5中,在MDCT域上提取能量信息的具体方式如下,
(1)提取时域输入信号与变换域的对应关系,
对于时域输入信号x(n),n=0,1,...,2N-1,
有对应关系如式
其中, k=0,1,...,N-1,X(k)为输入信号的MDCT谱,Y(k)为输入信号的MDST谱;
(2)根据时域输入信号与变换域之间的对应关系,通过计算能量,找到时域信号能量Et与信号MDFT谱能量Em之间对应的关系,具体方式如下
根据上式得到与时域信号能量Et相应的MDCT域上的能量信息,即信号MDFT谱能量Em。
5、根据权利要求书1所述的MDCT域信号能量与相位补偿方法中,其特征在于:所述步骤6中,结合步骤5所提取的能量信息和相位信息,在MDCT域上提取空间参数的具体方式如下,
若提取代表左右声道能量差异的空间参数,则利用时域和MDCT域的能量关系 在MDCT域上提取与时域等价的空间参数;
若提取代表左右声道相位差异的空间参数,则利用时域到MDCT域产生的线性相位在MDCT域上提取与时域等价的空间参数。
6、一种用于实现权利要求1或2或3或4或5所述MDCT域信号能量与相位补偿方法的装置,其特征在于:包含以下部分,
MDCT变换模块,用于对输入信号进行MDCT变换,获得信号的MDCT谱;
谱运算模块,用于计算差矩阵系数和矩阵系数
MDST转换模块,用于获取MDCT到MDST的转换矩阵,得到MDST谱;
MDFT构造模块,用于根据信号的MDCT谱和MDST谱,构造MDFT谱;
能量提取模块,用于提取能量信息;
相位提取模块,用于提取相位信息;
空间参数提取模块,用于根据能量信息和相位信息,在MDCT域上提取空间参数;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100614394A CN101521012B (zh) | 2009-04-08 | 2009-04-08 | Mdct域信号能量与相位补偿方法及其装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009100614394A CN101521012B (zh) | 2009-04-08 | 2009-04-08 | Mdct域信号能量与相位补偿方法及其装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101521012A true CN101521012A (zh) | 2009-09-02 |
CN101521012B CN101521012B (zh) | 2011-12-28 |
Family
ID=41081564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009100614394A Expired - Fee Related CN101521012B (zh) | 2009-04-08 | 2009-04-08 | Mdct域信号能量与相位补偿方法及其装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101521012B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103366750A (zh) * | 2012-03-28 | 2013-10-23 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366749A (zh) * | 2012-03-28 | 2013-10-23 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN111627451A (zh) * | 2013-06-21 | 2020-09-04 | 弗朗霍夫应用科学研究促进协会 | 用于获取音频信号的替换帧的频谱系数的方法及相关产品 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR0154387B1 (ko) * | 1995-04-01 | 1998-11-16 | 김주용 | 음성다중 시스템을 적용한 디지탈 오디오 부호화기 |
EP1611772A1 (en) * | 2003-03-04 | 2006-01-04 | Nokia Corporation | Support of a multichannel audio extension |
US8654983B2 (en) * | 2005-09-13 | 2014-02-18 | Koninklijke Philips N.V. | Audio coding |
-
2009
- 2009-04-08 CN CN2009100614394A patent/CN101521012B/zh not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103366750A (zh) * | 2012-03-28 | 2013-10-23 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366749A (zh) * | 2012-03-28 | 2013-10-23 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366750B (zh) * | 2012-03-28 | 2015-10-21 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366749B (zh) * | 2012-03-28 | 2016-01-27 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN111627451A (zh) * | 2013-06-21 | 2020-09-04 | 弗朗霍夫应用科学研究促进协会 | 用于获取音频信号的替换帧的频谱系数的方法及相关产品 |
CN111627451B (zh) * | 2013-06-21 | 2023-11-03 | 弗朗霍夫应用科学研究促进协会 | 用于获取音频信号的替换帧的频谱系数的方法及相关产品 |
Also Published As
Publication number | Publication date |
---|---|
CN101521012B (zh) | 2011-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102037507B (zh) | 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器 | |
CN102883257B (zh) | 用于编码多对象音频信号的设备和方法 | |
CN101036183B (zh) | 用于立体声兼容的多声道音频编码/解码的方法和设备 | |
CN101410890B (zh) | 用于导出上混参数的参数计算器和方法以及包括该参数计算器的声道重构器和音频接收机 | |
CN102577384B (zh) | 用相位信息和残差信息进行编码/解码的设备和方法 | |
CN101512899B (zh) | 滤波器压缩器以及用于产生压缩子带滤波器冲激响应的方法 | |
CN101390443B (zh) | 音频编码和解码 | |
CN101484936B (zh) | 音频解码 | |
CN100571043C (zh) | 一种空间参数立体声编解码方法及其装置 | |
CN101253807B (zh) | 用于编码和解码音频信号的装置及其方法 | |
CN102270452A (zh) | 近透明或透明的多声道编码器/解码器方案 | |
CN103354090A (zh) | 用于可伸缩声道解码的方法、介质和设备 | |
CN101202043B (zh) | 音频信号的编码方法和装置与解码方法和装置 | |
CN103534753B (zh) | 用于信道间差估计的方法和空间音频编码装置 | |
CN101401151A (zh) | 根据主分量分析的多通道音频信号的可分级编码的设备和方法 | |
CN104240712A (zh) | 一种三维音频多声道分组聚类编码方法及系统 | |
CN101521012B (zh) | Mdct域信号能量与相位补偿方法及其装置 | |
CN101552006B (zh) | 加窗信号mdct域的能量及相位调整方法及其装置 | |
CN101604983B (zh) | 编解码装置、系统及其方法 | |
CN101185118A (zh) | 解码音频信号的方法和装置 | |
CN101582259B (zh) | 立体声信号编解码方法、装置及编解码系统 | |
Wu et al. | Low bitrates audio object coding using convolutional auto-encoder and densenet mixture model | |
Wang et al. | A multi-frame PCA-based stereo audio coding method | |
Sheng et al. | Research of Spatial Parameter Codec in MDCT Domain | |
Dubey et al. | A Novel Very Low Bit Rate Multi-Channel Audio Coding Scheme Using Accurate Temporal Envelope Coding and Signal Synthesis Tools |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111228 Termination date: 20150408 |
|
EXPY | Termination of patent right or utility model |