CN100520765C - 确定给定变换函数的变换元素的过程和设备,数字信号变换方法和设备及计算机可读介质 - Google Patents
确定给定变换函数的变换元素的过程和设备,数字信号变换方法和设备及计算机可读介质 Download PDFInfo
- Publication number
- CN100520765C CN100520765C CNB2004800340760A CN200480034076A CN100520765C CN 100520765 C CN100520765 C CN 100520765C CN B2004800340760 A CNB2004800340760 A CN B2004800340760A CN 200480034076 A CN200480034076 A CN 200480034076A CN 100520765 C CN100520765 C CN 100520765C
- Authority
- CN
- China
- Prior art keywords
- matrix
- overbar
- lifting
- transformation
- digital signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Abstract
根据用于确定给定变换函数的变换元素的过程,该变换函数包括变换矩阵且对应于数字信号从时域到频域或从频域到时域的变换,所述变换矩阵被分解为旋转矩阵(306)和辅助矩阵(307),当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘。此外,所述旋转矩阵(306)和所述辅助矩阵(307)的每个都被分解为多个提升矩阵(308)。另外,所述变换元素被确定为包括与所述提升矩阵(308)对应的多个提升级(309)。本发明还提供一种方法,用于根据由上述过程确定的变换元素,将数字信号从时域变换到频域。
Description
相关申请的交叉引用
本申请要求2003年9月29日提交的美国临时申请No.60/507,210以及2003年9月29日提交的美国临时申请No.60/507,440的优先权,在此将每个的内容全文引入作为参考,以用于所有目的。
此外,下述共同拥有的申请一起同时提交,在此全文引入:
“Method for Performing a Domain Transformation of a DigitalSignal from the Time Domain into the Frequency Domain and vice Versa”,代理案卷号No.P100442,以及
“Method for Transforming a Digital Signal from the Time Domaininto the Frequency Domain and Vice Versa”,代理案卷号No.P100444。
技术领域
本发明涉及用于确定给定变换函数的变换元素的过程和设备,用于将数字信号从时域变换到频域以及从频域变换到时域的方法和设备,以及计算机可读介质。
背景技术
域变换,例如离散余弦变换(DCT),被广泛地应用于当今信号处理工业。近年来,因为其在无损编码应用中的重要角色,称为整数DCT的DCT的变形已经吸引了许多研究兴趣。术语“无损”意味着解码器可以根据已编码的比特流产生源信号的确切复制。
所述DCT是实值块变换。即使所述输入块仅仅包括整数,所述DCT的输出块可以包括非整数分量。为了简便,所述输入块被称为输入向量,而输出块被称为输出向量。如果向量仅仅包括整数分量,则该向量被称为整数向量。对照于DCT,所述整数DCT根据整数输入向量产生整数输出向量。对于同一整数输入向量,整数DCT的整数输出向量很近似于DCT的实输出向量。因此,整数DCT在频谱分析时保持所述DCT的所有良好的特性。
所述整数DCT的重要特性是可逆性。可逆性意味着存在整数离散余弦反变换(IDCT),使得如果所述整数DCT根据输入向量x产生输出向量y,则所述整数IDCT可以根据向量y恢复出向量x。有时整数DCT也被称为正向变换,整数IDCT被称为反向变换或反变换。
称为整数改进离散余弦变换(IntMDCT)的变换近年被提出且被用于ISO/IEC MPEG-4音频压缩中。所述IntMDCT源于其原型-改进离散余弦变换(MDCT)。在[1]中,Malvar给出了通过将DCT-IV块级联多个Givens旋转来有效地实现MDCT的方法。已经熟知的是,Givens旋转可以被分解为三个提升步骤,用于将整数映射为整数,参见例子[2]。
因此,IntMDCT的实现依赖于整数DCT-IV的有效实施。
通过利用三个提升步骤替换每个Givens旋转,可以从整数变换的原型直接转换为整数变换。由于在每个提升步骤中存在一个四舍五入操作,整数变换的总四舍五入次数是原型变换的Givens旋转次数的3倍。对于离散三角变换(例如离散傅立叶变换(DFT)或离散余弦变换(DCT)),所涉及的Givens旋转的次数通常为Nlog2N量级,其中N是所述块的大小,即所述数字信号被划分的每个块中包括的数据符号的量。因此,对于直接转换的整数变换的同族变换,所述总四舍五入总次数也为Nlog2N量级。由于所述四舍五入,整数变换仅仅近似其浮点原型。所述近似误差随着四舍五入的次数的增加而增加。
发明内容
本发明解决下述问题,即确定给定变换函数的变换元素,该变换函数包括变换矩阵且对应于数字信号从时域到频域或从频域到时域的变换,使得由所述变换元素包括的四舍五入的次数显著地减少。本发明还提供一种方法,用于根据所述确定的变换元素,将数字信号从时域变换到频域或从频域变换到时域。
利用符合独立权利要求的特征,通过用于确定给定变换函数的变换元素的过程和设备,用于将数字信号从时域变换到频域以及从频域变换到时域的方法和设备,以及计算机可读介质来解决所述问题。
根据本发明,提供一个用于确定给定变换函数的变换元素的过程,该变换函数包括变换矩阵且对应于数字信号从时域到频域或从频域到时域的变换,其中所述变换矩阵被分解为旋转矩阵和辅助矩阵,当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘,所述旋转矩阵和所述辅助矩阵的每个都被分解为多个提升矩阵;并且所述变换元素被确定为包括与所述提升矩阵对应的多个提升级。
此外,根据本发明,提供一种适用于执行上述过程的设备。
此外,根据本发明,提供一种用于使用变换元素将数字信号从时域变换到频域或从频域变换到时域的方法,其中所述变换元素对应于给定变换函数,该变换函数包括变换矩阵,其中所述变换元素是由一个过程确定的,该过程包括将所述变换矩阵分解为旋转矩阵和辅助矩阵,当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘;将所述旋转矩阵和所述辅助矩阵的每个分解为多个提升矩阵;以及确定所述变换元素包括与所述提升矩阵对应的多个提升级;其中每个提升级包括利用辅助变换和四舍五入单元对所述数字信号的子块进行的处理。
此外,根据本发明,提供一种适合于执行上述方法的设备。
此外,根据本发明,提供一种计算机可读介质,该计算机可读介质具有记录于其上的程序,其中所述程序适合于使计算机执行用于确定给定变换函数的变换元素的过程,该变换函数包括变换矩阵且对应于数字信号从时域到频域或从频域到时域的变换,其中所述变换矩阵被分解为旋转矩阵和辅助矩阵,当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘;所述旋转矩阵和所述辅助矩阵的每个都被分解为多个提升矩阵;并且所述变换元素被确定为包括与所述提升矩阵对应的多个提升级。
此外,根据本发明,提供一种算机可读介质,该计算机可读介质具有记录于其上的程序,其中所述程序适合于使计算机执行用于使用变换元素将数字信号从时域变换到频域或从频域变换到时域的方法,其中所述变换元素对应于给定变换函数,该变换函数包括变换矩阵,其中所述变换元素是由一个过程确定的,该过程包括:将所述变换矩阵分解为旋转矩阵和辅助矩阵,当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘,将所述旋转矩阵和所述辅助矩阵的每个分解为多个提升矩阵;以及确定所述变换元素包括与所述提升矩阵对应的多个提升级;其中每个提升级包括利用辅助变换和四舍五入单元对所述数字信号的子块进行处理。
在一个优选实施例中,本发明提供了一种用于实现整数IV型DCT变换的过程和方法。与现有技术的方法相比,根据本发明的方法需要的四舍五入操作的次数显著减少。结果是,所述近似误差被显著减少,在DCT-IV的情况下,其从通常的Nlog2N量级减少到如2.5N一样低,其中N表示数字信号的块大小。根据本发明的方法在计算复杂度上低且在结构上是模块化的。
根据本发明的方法和设备可以用于任何类型的数字信号,比如音频、图像或视频信号。作为被数字化的信号的数字信号对应于可物理测量的信号,其可以通过扫描相应模拟信号的至少一个特有特征(例如,视频信号的亮度值和色度值,来自传感器的模拟声音信号的幅度,或模拟感测信号的幅度)而产生。所述数字信号包括多个数据符号。所述数字信号的数据符号被分组为多个块,其中每个块基于所述相应模拟信号的采样速率,具有相同的预定数目的数据符号。
根据本发明的方法可用于将是整数值的输入数字信号变换为也是整数值的输出信号。根据本发明的变换方法是可逆的。可以通过执行根据本发明的变换方法将所述输出信号变换回原始输入信号。根据本发明的方法的变换的此种可逆性可以用于其中输出信号应该与原始输入信号等同的无损编码中。
根据本发明的信号的此种整数变换可以用于许多应用和系统中,比如MPEG音频、图像和视频压缩、JPEG2000或谱分析(用于分析红外、紫外或核磁辐射信号)。它可以在不考虑比如在实值信号变换的情况下的上溢的因素的情况下,以比如固定点数字信号处理器(DSP)的硬件系统来容易地实现。
根据本发明的方法,利用变换元素将所述数字信号变换到频域,该变换元素是根据本发明的过程为给定变换函数确定的。
优选地,所述变换元素包括多个提升级。
所述变换元素可以基于提升阶梯的模型来进行例示。所述提升阶梯模型具有两个侧面部件(piece),每个部件用于接收两组数据符号中的一组。在所述两个侧面部件之间设置两个或多个级联提升级。每个提升级在一端(输入端)接收信号,并且经由相加单元在另一端(输出端)输出信号。四舍五入单元被安排在输出端。以交替的方式将所述提升级安排在所述侧面部件之间,使得相邻提升级的输出(或输入)端连接到不同的侧面部件。
应该注意的是,虽然以提升阶梯模型的形式来描述变换元素,但是仅仅例示所述变换元素的变换路径。然而,本发明并不应该限于所述阶梯模型。
所述变换元素的提升级的数目是由提升矩阵的数目定义的,该提升矩阵的数目是由根据本发明的过程来确定的。
离散余弦变换、离散正弦变换、离散傅立叶变换或离散W变换是可用作根据本发明的变换函数的变换函数的实例。取决于用于确定各个变换函数的变换元素的根据本发明的过程的结果,所述变换元素的提升级的数目可以不同。
附图说明
下面参照附图来说明本发明的例示性实施例,其中:
图1示出了根据本发明的实施例的音频编码器的体系结构;
图2示出了根据本发明的实施例的音频解码器的体系结构,其对应于图1中示出的音频编码器;
图3例示了根据本发明的过程的实施例,其中所述变换函数是DCT-IV变换函数;
图4示出了根据本发明的方法的实施例的流程图;
图5例示了使用DCT-IV作为变换函数的根据本发明的方法的实施例;
图6例示了用于根据图5中例示的本发明的方法的实施例的反变换的算法;
图7示出了根据本发明的实施例的图像归档系统的体系结构;
图8例示了使用DWT-IV作为变换函数的根据本发明的方法的实施例;
图9例示了用于根据图8中例示的本发明的方法的实施例的反变换的算法。
具体实施方式
图1示出了根据本发明的实施例的音频编码器100的结构。
所述音频编码器100包括基于改进离散余弦变换(MDCT)的常规感知基本层编码器和基于整数改进离散余弦变换(IntMDCT)的无损增强编码器。
例如,将由麦克风110提供且由模/数转换器111进行数字化的音频信号109提供给音频编码器100。所述音频信号109包括多个数据符号。所述音频信号109被分为多个块,其中每个块包括数字信号的多个数据符号,并且由改进离散余弦变换(MDCT)设备101对每个块进行变换。由MDCT设备101提供的所述MDCT系数由量化器103借助于感知模型102来进行量化。所述感知模型按照这样一种方式控制所述量化器103,使得由量化误差产生的声音失真低。随后由比特流编码器104对量化器103的输出进行编码,该比特流编码器104产生有损的感知编码的输出比特流112。所述比特流编码器104利用诸如Huffman编码或游程(Run-Length)编码的标准方法无损地压缩其输入以产生一输出,该输出的平均比特率要低于的其输入的平均比特率。所述输入音频信号109也被输送到产生IntMDCT系数的IntMDCT设备105中。作为量化器103的输出的已量化MDCT系数被用于预测所述IntMDCT系数。所述已量化MDCT系数被输送到逆-量化器106,并且逆-量化器106所述输出被输送到四舍五入单元107,所述四舍五入单元将所述逆-量化器106所述输出四舍五入为整数值,并且残余IntMDCT系数由熵编码器108对残余的IntMDCT系数进行熵编码,所述残余的IntMDCT系数是四舍五入单元107的输出和IntMDCT系数之差。所述熵编码器(类似于比特流编码器104)108无损地减少其输入的平均比特率,并且产生无损增强比特流113。所述无损增强比特流113和感知编码比特流112一起承载精确重构输入音频信号109必需的信息。
图2示出了包括本发明的实施例的音频解码器200的体系结构,其对应于图1中示出的音频编码器100。
所述感知编码比特流207由比特流解码器201解码,该比特流解码器201执行图1的比特流编码器104的操作的逆操作。所述已解码的比特流被提供给逆-量化器202。在其输出端,通过改进离散余弦反变换设备(反MDCT)203施加反MDCT。因此,获得重构的感知编码音频信号209。所述无损增强比特流208由熵解码器204解码,该熵解码器204执行图1中的熵编码器108的操作的逆操作,产生相应的残余IntMDCT系数。由四舍五入设备205对逆-量化器202的输出进行四舍五入,然后加到所述残余IntMDCT系数,由此产生所述IntMDCT系数。最后,由所述整数改进的离散余弦反变换设备206对所述IntMDCT系数进行所述整数改进离散余弦反变换,以产生所述重构的无损编码音频信号210。
如上所述,在[2]中示出了IntMDCT的核心是整数DCT-IV,该核心在无损音频编码中扮演重要角色,并且用于图1和2中例示的本发明的实施例中。
图3例示了根据本发明的过程的实施例的流程图,其中所述变换函数是DCT-IV变换函数。
在下面,说明了用于确定DCT-IV变换函数的变换元素的本发明的过程的实施例。所述确定的变换元素用于图1中示出的编码器来实施IntMDCT,而相应的反变换元素用于图2中示出的解码器中以实施反IntMDCT。对于如何利用DCT-IV实施IntMDCT和反IntMDCT的描述,参见[2]。
具有N点实输入序列x(n)的DCT-IV变换函数被如下定义(参见[2]):
为了清楚起见,N被假设为偶数。
所述过程开始于步骤300。
在步骤301中,变换函数的偶数索引项与奇数索引项分开:
因此,
其中具有分量x1(n)=x(2n), 的x 1 是包括所有具有偶数索引的x(n)的向量,而具有分量x2(n)=x(2n+1), 的x 2 是包括所有具有奇数索引的x(n)的向量。
使用下述两个简略式:
利用等式(4)和(5),等式(3)可以写成:
在步骤302中,应用下述两个余弦的加法定理:
cos(αm,n-βm)=cosαm,n·cosβm+sinαm,n·sinβm (7)
cos(αm,n+βm)=cosαm,n·cosβm-sinαm,n·sinβm (8)
利用等式(7)和(8),等式(6)可以写成
对于简略式,两个N/2大小的向量x 1 和x 2 被定义为包括下述分量:
利用(10)和(11),等式(9)被简化为
在步骤303中,向量
被划分为两个部分y 0 和y 1 ,其中
向量y 1 的分量y1(m)满足下述等式:
在 的情况下,
注意对于
这是按照下述方式来实现的:
对于 下述等式成立:
此外,
对于 下述等式成立:
此外,
cosαN-1-m,n=cos(2πn+π-αm,n)=cos(π-αm,n)=-cosαm,n (22)
sinαN-1-m,n=sin(2πn+π-αm,n)=sin(π-αm,n)=sinαm,n (23)
利用等式(19)、(20)、(22)和(23),等式(15)可以被写为
由于另一等式(12)得出
根据(24)和(25)可以形成y 0和y 1的表达式:
按照下述方式两个等式(26)和(27)可以表示为单个等式:
(28)
和
可以看出
其可被简略为
下述等式成立:
等式(34)可被简略为
此外,假设P eo 是偶奇矩阵,即,置换矩阵,其通过将对应于偶索引的分量与对应于奇索引的分量分开来重新排序所述向量x的分量,其中
使得下式成立
或简写为
通过将等式(28)和等式(31)、(34)和(36)合并,可以得出
(38)
利用上述简略式和下面的简略式
和
等式(38)可以被简写为
利用等式(42),等式(41)可以写成
在步骤306,计算N×N旋转矩阵R po ,该旋转矩阵包括等式(44)中的开始三个矩阵:
进行等式(45)中的三个矩阵的乘法,得到
(46)
在步骤307中,计算辅助矩阵,当所述辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘。
所述辅助矩阵包括等式(44)的第四和第五矩阵:
注意
即T与自身相乘等于置换矩阵与整数对角矩阵相乘。
利用等式(46)和(47),等式(44)可简化为
在步骤308中,R po 和T的每个都被因式分解为提升矩阵的乘积。按照下述对T进行因式分解:
其中
以及根据下述等式来因式分解R po :
其中
和
等式(49)可以被进一步写为
在步骤309,尽可能地将提升矩阵归并在一起。矩阵S被定义为R 3 和T 1 的乘积,即
由于S也是提升矩阵,所以这种归并是可能的。
根据(57)和(58),获得的DCT-IV矩阵的最后的因式分解的公式为
等式(59)表示根据本发明的整数DCT-IV变换的变换元素包括五个提升级。
由于最后的因式分解公式被确定,所以在步骤S310,所述过程停止。
图4示出了根据本发明的方法的实施例的流程图400,该方法使用五个提升级,第一提升级401、第二提升级402、第三提升级403、第四提升级404以及第五提升级405。这种方法优选用于图1的IntMDCT设备105和图2的反InrMDCT设备206中,以分别实现IntMDCT和反IntMDCT。在图4中,x 1 和x 2 分别是数字信号的第一和第二块,z 1 、z 2 和z 3 是中间信号,y 1 和y 2 分别是与所述数字信号的第一和第二块对应的输出信号。
图5示出了根据本发明的方法的实施例的流程图,其中所述变换函数是DCT-IV变换函数。在这个实施例中使用的变换元素对应于等式(59),即,其是由图3中例示的过程的实施例确定的变换元素。
所述变换元素包括五个提升级,该五个提升级对应于等式(59)的五个提升矩阵。
此外,所述变换元素包括与所述置换矩阵P eo 对应的数据重组(shuffling)级。
在图5中,第一提升级的输入是数字信号的两个块x 1 和x 2 ,z 1 、z 2 和z 3 是中间信号,y 1 和y 2 分别是与所述数字信号的第一和第二块对应的输出信号。
所述变换元素的输入x和所述变换元素的第一提升级的两个输入块x 1 和x 2 满足等式
(与等式(37)一致)。
在下面,解释第一提升级501,其是与提升矩阵T 3 对应的提升级。
假设 是在没有四舍五入到整数值时的第一提升级的输出向量,即
使用由等式(50)提供的T 3 的定义,等式(61)可以被改写为
由于在提供了用于整数DCT-IV的可逆算法的这个实施例中,包括到整数值的四舍五入。因此,根据等式(62),在第一提升级501的第一步506中,x 1 与K 3 相乘。在步骤507中,这个乘法的结果被四舍五入为整数值。在步骤508,经过四舍五入后的值随后被加到x 2 。因此,中间信号z 1 满足等式:
由于图5中例示的变换元素的分别对应于矩阵T 2 、S、R 2 和R 1 的其余四个提升级502、503、504和505,具有与第一提升级501相同的结构,所以省略其描述。仅仅应该注意的是,在第二提升级502的相加步骤509中,根据T 2 的定义,x 1 与-D N/2 相乘。
在下面,参照图6描述反变换的变换元素的提升级。
图6例示了图5中例示的变换的反变换的变换元素的提升级。
在图6中,第一提升级的输入是数字信号的两个块y 1 和y 2 ,z 1 、z 2 和z 3 是中间信号,x 1 和x 2 分别是与所述数字信号的第一和第二块对应的输出信号。
图6中例示的最后提升级605与图5中例示的第一提升级501相逆。因此,在最后提升级605的第一步606中,x 1 与K 3 相乘。在步骤607中,这个乘法的结果被四舍五入为整数值。随后在步骤608,从z 1 中减去经过四舍五入后的值。因此,信号x 2 满足等式:
由于图6中例示的变换元素的其余四个分别是提升级505、504、503和502的逆的提升级601、602、603和604,具有与最后提升级605相同的结构,所以省略其描述。仅仅应该注意的是,在第四提升级604的相加步骤609后,相加步骤609的结果与-D N/2 相乘以产生x 1 。
可以看出,图6中的提升级605、604、603、602和601分别是图5中的提升级501到505的逆。由于与矩阵P eo 对应的输入信号的置换也可逆且所述反变换元素包括相应的数据重组级,所以所提供的方法是可逆的。因此,如果在图1和图2中例示的音频编码器100和音频解码器200中使用,就得到了用于无损音频编码的方法和装置。
在本发明的说明书的结尾给出在这个实施例中使用的四舍五入的次数的分析。
图7示出了根据本发明的实施例的图像归档系统的体系结构。
在图7中,图像源701,例如照相机,提供模拟图像信号。由模/数转换器702来对该图像信号进行处理,以提供相应的数字图像信号。由无损图像编码器703对该数字图像信号进行无损编码,其包括从时域到频域的变换。在这个实施例中,时域对应于所述图像的坐标空间。所述无损编码后的图像信号被存储在存储设备704中,例如硬盘或DVD。当需要所述图像时,从所述存储设备704中取出所述无损编码后的图像信号,并且将其提供给无损图像解码器705,该无损图像解码器705对无损编码后的图像信号进行解码,并且重构所述原始图像信号而不会出现数据丢失。
例如,在所述图像是半导体晶片的误差图且必须被存储以用于以后分析的情况下,图像信号的此种无损归档是重要的。
在下面,对根据本发明的用于将数字信号从时域变换到频域和从频域变换到时域的方法的又一实施例进行说明。这个实施例优选在图7中例示的图像归档系统的无损图像编码器703和无损图像解码器705中使用。
图8例示了根据本发明的方法的实施例,其使用DWT-IV作为变换函数。
N点实输入序列x(n)的DWT-IV如下定义:
根据本发明的过程,所述DWT-IV矩阵被因式分解为下述形式:
R N 是如下定义的N×N的旋转矩阵:
I N/2 是N/2阶的单位矩阵(与等式(29)一致)。J N/2 是N/2阶的反单位矩阵(与等式(30)一致)。
P N 是N×N的置换矩阵
T是如下定义的N×N的矩阵:
D N/2 是如下给出的N/2阶的对角矩阵
根据本发明的过程,R N 和T可以被进一步被因式分解为提升矩阵的积:
其中,
和
其中
和
因此,等式(67)可以被写为如下形式
根据本发明的过程,尽可能地归并提升步骤。
在这个实施例中,提升矩阵R 3 和T 1 可以被归并为提升矩阵S:
根据(77)和(78),可以得到DWT-IV矩阵的下述因式分解公式:
等式(79)表示根据本发明的整数DWT-IV变换的变换元素包括五个提升级。
此外,所述变换元素包括与所述置换矩阵P N 对应的数据重组级。所述数据重组级重新安排每个输入数据块中的分量次序。根据P N ,按照下述方式来重新安排输入数据向量:向量的第一半部分保持不变,而向量的第二半部分上下颠倒,即
在图8中,第一提升级的输入是数字信号的两个块x 1 和x 2 ,z 1 、z 2 和z 3 是中间信号,y 1 和y 2 分别是与所述数字信号的第一和第二块对应的输出信号。
所述变换元素的输入x和所述变换元素的第一提升级的两个输入块x 1 和x 2 满足等式
在下面,解释第一提升级801,其是与提升矩阵T 3 对应的提升级。
假设 是在没有四舍五入到整数值时的第一提升级的输出向量,即
使用有等式(73)提供的T 3 的定义,等式(82)可以被改写为
由于在这个实施例中提供的用于整数DCT-IV的可逆算法中,包括到整数值的四舍五入。因此,根据等式(83),在第一提升级801的第一步806中,x 1 与K 3 相乘。在步骤807中,这个乘法的结果被四舍五入为整数值。在步骤808,经过四舍五入后的值随后被加到x 1 。因此,中间信号z 1 满足等式:
由于图8中例示的变换元素的其余四个提升级802、803、804和805分别对应于矩阵T 2 、S、R 2 和R 1 ,其具有与第一提升级801相同的结构,所以省略其描述。仅仅应该注意的是,在第二提升级802的相加步骤809中,根据T 2 的定义,x 1 与D N/2 相乘。
在下面,参照图9描述反变换的变换元素的提升级。
图9例示了图8中例示的变换的反变换的变换元素的提升级。
在图9中,第一提升级的输入是数字信号的两个块y 1 和y 2 ,z 1 、z 2 和z 3 是中间信号,x 1 和x 2 分别是与所述数字信号的第一和第二块对应的输出信号。
图9中例示的最后提升级905与图8中例示的第一提升级801相逆。因此,在最后提升级905的第一步906中,x与K 3 相乘。在步骤907中,这个乘法的结果被四舍五入为整数值。随后在步骤908,从z中减去经过四舍五入后的值。因此,信号x满足等式:
由于图9中例示的变换元素的其余四个分别是提升级805、804、803和802的逆的提升级901、902、903和904,具有与最后提升级905相同的结构,所以省略其描述。仅仅应该注意的是,在第四提升级904的相加步骤909后,相加步骤909的结果与D N/2 相乘以产生x 1 。
可以看出,图9中的提升级905、904、903、902和901分别是图8中的提升级801到805的逆。由于与矩阵P N 对应的输入信号的置换也可逆且所述反变换元素包括相应的数据重组级,所以所提供的方法是可逆的。因此,如果在图7中例示的无损图像编码器703和无损图像解码器705中使用,那么就得到了用于无损图像编码的方法和装置。
虽然在所述说明的实施例中,根据本发明的DCT-IV的方法被用于音频编码,而根据本发明的DWT-IV的方法被用于图像编码,但是根据本发明的DCT-IV的方法同样可以用于图像编码,而根据本发明的DWT-IV的方法同样可用于音频编码,并且这两种方法都可以用于其他数字信号的编码,比如视频信号。
考虑等式(63)和(64),可以看出,在每个提升级中存在N/2次四舍五入。因此,考虑等式(59),可以看出,根据本发明的DCT-IV算法的变换元素的总四舍五入次数为N/2的五倍,也就是2.5N,其显著低于根据现有技术的Nlog2N。
再次考虑等式(59),可以看出,当N是大值时,例如N=1024,主要的计算量用在对应于与的乘法的四个N/2点DCT-IV子程序上。因为可以根据等式(47)和(49),使用两个半长度DCT-IV加上前旋转和后旋转来计算浮点DCT-IV,所以所述提出的整数DCT-IV的算法复杂度可以被粗略地估计为浮点DCT-IV的算法复杂度的两倍。
可以为整数DWT-IV变换函数得到类似的结论。
在下面,对使用离散傅立叶变换的又一实施例进行说明。
作为N阶归一化FFT的变换矩阵的变换矩阵F v 如下给出:
m,n=0,1,…,N-1
其中变换大小N是偶数。
遵循基-2(radix-2)时间抽取FFT算法,可以按照下述方式来分解F N :
其中,如上所述,P eo 是偶奇矩阵,即,置换矩阵,其通过将对应于偶索引的分量与对应于奇索引的分量分开来重新排序向量x的分量,其中
使得
假设F N/2 是阶数为N/2的归一化FFT的变换矩阵。
假设W是如下给出的对角矩阵
其中WN=e-j2π/N。
如上,I N/2表示阶数N/2的单位矩阵。
在等式(87)中,左边第一个矩阵是偶奇矩阵P eo,其仅仅重新排序输入向量中的分量。
在等式(87)中,左边第二个矩阵可被按照下述方式因式分解为三个提升矩阵:
其中Q是如下给出的阶数为N/2的置换矩阵
以及J N/2-1是N/2-1阶的反索引矩阵。
在等式(87)中,左边第三个矩阵是反对角矩阵,其仅仅将输入向量中的一半分量与在单位圆上的复数相乘。
这被解释为复平面上的旋转。
假设x=xr+jxi为输入向量中的这样一个分量。
结果是 这等于x在复平面上反时针旋转2kπ/N弧度。此种旋转可以被如下因式分解为三个提升步骤:
在等式(87)中,右边第四个矩阵被按照下述方式因式分解为三个提升矩阵:
基-2频率抽取FFT算法仅仅是等式(87)中的基-2时间抽取FFT算法的转置。
因此,上述过程也可以应用来因式分解按频率抽取方式的FFT矩阵F N。
在提升矩阵中使用等式(87)中的右手侧的因式分解,通过产生对应于每个提升矩阵的提升级,确定变换元素。
由于在上面已经对如何根据提升矩阵产生提升级进行了详细描述,并且在这个实施例中,这方面的内容与上述内容相似。因此,在这里省略了说明。
在本说明书中通过参考在这里引入下述文献:
H.S.Malvar,“Signal Processing With Lapped Transforms”ArtechHouse,1992;
R.Geiger,T.Sporer,J.Koller,K.Brandenburg,“AudioCoding basedon Integer Transforms”AFS 111th Convention,New York,USA,Sept,2001.
Claims (8)
1、一个用于确定给定变换函数的变换元素的方法,该变换函数包括变换矩阵且对应于数字信号从时域到频域或从频域到时域的变换,其中
-所述变换矩阵被分解为旋转矩阵和辅助矩阵,当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘;
-所述旋转矩阵和所述辅助矩阵的每个都被分解为多个提升矩阵,其中,所述提升矩阵中的每个是在一个对角上具有两个可逆整数矩阵的块三角矩阵;
-所述变换元素被确定为包括与所述提升矩阵对应的多个提升级。
2、如权利要求1所述的方法,其中,所述变换函数是DCT-I变换函数、DCT-IV变换函数、DST-I变换函数、DST-IV变换函数、DFT-I变换函数、DFT-IV变换函数、DWT-I变换函数或DWT-IV变换函数。
3、如权利要求1或2所述的方法,其中,每个提升矩阵中的所述可逆整数矩阵是单位矩阵或负单位矩阵。
4、如权利要求1或2所述的方法,其中,所述变换元素包括五个提升级。
5、如权利要求1或2所述的方法,其中,音频信号或视频信号被用作所述数字信号。
6、一个用于确定给定变换函数的变换元素的设备,该变换函数包括变换矩阵且对应于数字信号从时域到频域或从频域到时域的变换,所述设备包括:
-第一分解单元,用于将所述变换矩阵分解为旋转矩阵和辅助矩阵,当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘;
-第二分解单元,用于将所述旋转矩阵和所述辅助矩阵的每个分解为多个提升矩阵,其中,所述提升矩阵中的每个是在一个对角上具有两个可逆整数矩阵的块三角矩阵;
-确定单元,用于将所述变换元素确定为包括与所述提升矩阵对应的多个提升级。
7、一种用于使用变换元素将数字信号从时域变换到频域或从频域变换到时域的方法,其中:
所述变换元素对应于给定变换函数,该变换函数包括变换矩阵,其中所述变换元素是由一个过程确定的,该过程包括
-将所述变换矩阵分解为旋转矩阵和辅助矩阵,当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘;
-将所述旋转矩阵和所述辅助矩阵的每个分解为多个提升矩阵,其中,所述提升矩阵中的每个是在一个对角上具有两个可逆整数矩阵的块三角矩阵;
-确定所述变换元素包括与所述提升矩阵对应的多个提升级;
-每个提升级包括利用辅助变换和四舍五入单元对所述数字信号的子块进行处理,其中,所述数字信号的子块是通过将所述数字信号分组成多个子块来确定的。
8、一种用于将数字信号从时域变换到频域或从频域变换到时域的设备,包括变换单元,该变换单元利用变换元素来变换所述数字信号,其中
-所述变换元素对应于给定变换函数,该变换函数包括变换矩阵,其中该设备包括变换元素确定单元,该变换元素确定单元包括,
-第一分解单元,用于将所述变换矩阵分解为旋转矩阵和辅助矩阵,当该辅助矩阵与自身相乘时,等于置换矩阵与整数对角矩阵相乘,
-第二分解单元,用于将所述旋转矩阵和所述辅助矩阵的每个分解为多个提升矩阵,其中,所述提升矩阵中的每个是在一个对角上具有两个可逆整数矩阵的块三角矩阵;
-确定单元,用于确定所述变换元素包括与所述提升矩阵对应的多个提升级;
-对于每个提升级该设备包括对所述数字信号的子块进行处理的辅助变换单元,和对所述数字信号的子块进行处理的四舍五入单元,其中,所述数字信号的子块是通过将所述数字信号分组成多个子块来确定的。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US50744003P | 2003-09-29 | 2003-09-29 | |
US60/507,210 | 2003-09-29 | ||
US60/507,440 | 2003-09-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1882938A CN1882938A (zh) | 2006-12-20 |
CN100520765C true CN100520765C (zh) | 2009-07-29 |
Family
ID=37520233
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800350103A Expired - Fee Related CN100570597C (zh) | 2003-09-29 | 2004-05-06 | 将数字信号从时间域变换到频率域及其反向变换的方法 |
CNB2004800340760A Expired - Fee Related CN100520765C (zh) | 2003-09-29 | 2004-05-06 | 确定给定变换函数的变换元素的过程和设备,数字信号变换方法和设备及计算机可读介质 |
CNB2004800350550A Expired - Fee Related CN100517298C (zh) | 2003-09-29 | 2004-05-06 | 将数字信号从时域变换到频域及其反向变换的方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800350103A Expired - Fee Related CN100570597C (zh) | 2003-09-29 | 2004-05-06 | 将数字信号从时间域变换到频率域及其反向变换的方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800350550A Expired - Fee Related CN100517298C (zh) | 2003-09-29 | 2004-05-06 | 将数字信号从时域变换到频域及其反向变换的方法 |
Country Status (1)
Country | Link |
---|---|
CN (3) | CN100570597C (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8538763B2 (en) * | 2007-09-12 | 2013-09-17 | Dolby Laboratories Licensing Corporation | Speech enhancement with noise level estimation adjustment |
US8631060B2 (en) * | 2007-12-13 | 2014-01-14 | Qualcomm Incorporated | Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures |
WO2011072882A1 (en) * | 2009-12-14 | 2011-06-23 | Tomtom Polska Sp.Z.O.O. | Method and apparatus for evaluating an attribute of a point of interest |
CN103946777A (zh) | 2011-09-30 | 2014-07-23 | 英特尔公司 | 用于解释对在计算装置处的传感器衬垫上的衬垫盖的触摸的机制 |
CN104318926B (zh) * | 2014-09-29 | 2018-08-31 | 四川九洲电器集团有限责任公司 | 基于IntMDCT的无损音频编码方法、解码方法 |
CN105163130B (zh) * | 2015-08-25 | 2019-05-31 | 重庆邮电大学 | 一种基于离散Tchebichef正交多项式的图像无损压缩方法 |
CN107911122A (zh) * | 2017-11-13 | 2018-04-13 | 南京大学 | 基于分解压缩的分布式光纤振动传感数据无损压缩方法 |
-
2004
- 2004-05-06 CN CNB2004800350103A patent/CN100570597C/zh not_active Expired - Fee Related
- 2004-05-06 CN CNB2004800340760A patent/CN100520765C/zh not_active Expired - Fee Related
- 2004-05-06 CN CNB2004800350550A patent/CN100517298C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN100517298C (zh) | 2009-07-22 |
CN1882938A (zh) | 2006-12-20 |
CN100570597C (zh) | 2009-12-16 |
CN1918562A (zh) | 2007-02-21 |
CN1886737A (zh) | 2006-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4942793B2 (ja) | 時間ドメインから周波数ドメインへ及びそれとは逆にデジタル信号を変換する方法 | |
US8195730B2 (en) | Apparatus and method for conversion into a transformed representation or for inverse conversion of the transformed representation | |
EP1359546B1 (en) | 2-D transforms for image and video coding | |
JP5265682B2 (ja) | デジタルコンテンツの符号化および/または復号 | |
CN102150207B (zh) | 通过二维变换压缩音频比例因子 | |
CN101796506B (zh) | 具有比例缩放式和非比例缩放式接口的变换设计 | |
TWI395203B (zh) | 用於多重描述編碼系統之改良式相關與解相關變換技術 | |
TWI712034B (zh) | 用於解碼高階保真立體音響表示之方法、裝置及非暫態電腦可讀取儲存媒體 | |
US7634148B2 (en) | Image signal transforming and inverse-transforming method and computer program product with pre-encoding filtering features | |
RU2323469C2 (ru) | Устройство и способ для обработки, по меньшей мере, двух входных значений | |
EP1596309A2 (en) | Fast video codec transform implementations | |
KR20060069254A (ko) | 손실 및 무손실 2차원 데이터 압축을 위한 가역 변환 | |
JP2010537245A5 (zh) | ||
CA2482427A1 (en) | Apparatus and method for coding a time-discrete audio signal and apparatus and method for decoding coded audio data | |
JP3814611B2 (ja) | 時間離散オーディオサンプル値を処理する方法と装置 | |
CN100520765C (zh) | 确定给定变换函数的变换元素的过程和设备,数字信号变换方法和设备及计算机可读介质 | |
CN102036075A (zh) | 一种图像及数字视频编码及解码方法 | |
CN102572426A (zh) | 一种数据处理的方法和装置 | |
Bhatnagar et al. | Image compression using dct based compressive sensing and vector quantization | |
Annalakshmi | Lossy image compression techniques | |
Raut et al. | Analyzing image compression with efficient transforms & multistage vector quantization using radial basis function neural network | |
Oraintara et al. | The integer MDCT and its application in the MPEG layer III audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090729 Termination date: 20110506 |