CN100339852C - 数据处理方法和系统 - Google Patents
数据处理方法和系统 Download PDFInfo
- Publication number
- CN100339852C CN100339852C CNB991234251A CN99123425A CN100339852C CN 100339852 C CN100339852 C CN 100339852C CN B991234251 A CNB991234251 A CN B991234251A CN 99123425 A CN99123425 A CN 99123425A CN 100339852 C CN100339852 C CN 100339852C
- Authority
- CN
- China
- Prior art keywords
- data
- degrees
- transform
- precision number
- transition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
- H04N19/45—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本发明解决了数字处理中采用误差恶化的数据的问题。它提供了新颖的变换编码数据的误差减少的处理的方法、系统和设备。在变换数据的反向变换之后,高精度数受到操作。转换为整数和至允许范围的修剪步骤在操作中的任何阶段执行,以获得反向变换的数据的整数表示,诸如用于该数据的显示。然而,包括回到变换域的正向变换的进一步的处理是在高精度数上执行的。因此,舍入和修剪误差不出现在处理的数据中。
Description
技术领域
本发明涉及以下申请:美国申请第09/186,245号,标题为“变换数字数据的误差减少的处理”,发明人J.Mitchell等人;以及,美国申请第09/186,249号,标题为“变换数字数据的误差减少”,发明人M.Bright等人;这些申请在此被作为参考文献。
本发明涉及数字数据的变换编码,更具体地说是涉及变换数据的实域处理。更具体地说,本发明涉及受到再变换的反向变换数据的误差减少的数字处理。
背景技术
变换编码指的是范围很宽的一类数据编码,其中所要编码的各个数据块在得到进一步处理之前借助某些数学函数而得到变换。一个数据块可以是所要编码的数据对象的一部分,也可以是整个的数据对象。该数据通常代表某种现象,例如可以是频谱分析、图象、音频修剪、视频修剪等。变换功能的选择,通常反映了所编码的现象的某些性质;例如,在音频、静止图象和运动图象编码中,可以采用付立叶变换或离散余弦变换(DCT),以把数据变换成频率项或系数,从而进行分析。如果所要编码的现象给定,通常信息都集中在少数几个频率系数中。因此,变换的数据经常能够得到比原来的数据更为经济的编码或压缩。这意味着变换编码可被用来压缩一定类型的数据,以减小存储空间或在通信线路上的传送时间。
变换编码的一个使用例子,是用于静止图象压缩的联合专家组(JPEG)国际标准,它由ITU-T Rec T.81(1992)|ISO/IEC 10918-1:1994,“信息技术-连续色调静止图象的数字压缩和编码,部分1:要求和指导”所定义。另一个例子是用于运动图象压缩的运动图象专家组(MPEG)国际标准,由ISO/IEC 11172:1993,“信息技术-用于以至约1.5Mbits/s的速率进行数字存储介质的运动图象和相关音频的编码”所定义。这种MPEG-1标准同时定义了视频压缩(标准的部分2)和音频压缩(部分3)的系统。一种更近的MPEG视频标准(MPEG-2)由ITU-T Rec H.262|ISO/IEC 13818-2:1996,“信息技术-运动图象和相关音频的类属编码-部分2:视频”所定义。一种更新的音频标准是ISO/IEC 13818-3:1996“信息技术-运动图象和相关音频的类属编码-部分3:音频”所定义。所有三种图象国际数据压缩标准都采用了对抽样的8×8块进行DCT以实现图象压缩。图象的DCT压缩在此被用来对以下给出的一般概念进行说明;一种完整的说明可见于W.B.Pennebaker和J.L.Mitchell在JPEG:静止图象数据压缩标准,VanNostrand Reinhold:纽约,(1993)上的″离散余弦变换(DCT)″第四章。
子波编码是另一种形式的变换编码。专门的局部化的基函数使子波编码能够保存边缘和小的细节。变换的数据通常被量化以进行压缩。子波编码被用于FBI的指纹识别。子波编码是更一般的子频带编码技术的一个子类。子频带编码采用了滤波器组以把数据分解到具体的频带上。压缩是通过对频率较低的频带进行比频率较高的频带更细的量化并同时对频率较低的频带进行比频率较高的频带更粗的取样而实现的。子波、DCT和其他变换编码的一个概述,可见于RoyHoffman,数字系统的数据压缩,Chapman与Hall:纽约,(1997)″扩散数据的压缩算法″第五章。
在数字数据所代表的任何现象和任何技术中,变换之前的数据被称为“处于实域”。在变换进行之后,新的数据通常被称为“变换数据”或“变换系数”,且被称为是“处于变换域”。用于把数据从实域变换到变换域的过程被称为“正向变换”。把数据从变换域变换到实域的与正向变换反向的数学过程被称为相应的“反向变换”。
一般地,正向变换将产生实值数据,不一定是整数。为了实现数据压缩,变换系数通过量化处理而被转换成整数。假定(λi)是从一个数据单位的正向变换产生的一组实值变换系数。注意一个单位的数据可以是一维或两维的数据抽样块或者是整个数据。“量化值”(qi)是编码处理的参数。“量化变换系数”或“变换编码数据”是由量化函数Q定义的一系列的值(ai):
其中|x|表示小于等于x的最大整数。所产生的整数随后被进一步编码或压缩,并随后被存储或发送。为了译码该数据,量化系数被乘以量化值,以给出新的由以下公式给定的“去量化系数”
λ’i=qiai (2)
去量化(也称为逆量化)之后的量化处理因而可被描述为“舍入到qi的最近倍数”。该量化值被适当选择,从而使量化步骤中的信息的损失处于某种指定的范围内。例如,对于音频或图象数据,一种量化级通常是可观测的数据的最小改变。正是量化使得变换编码能够实现良好的数据压缩比。好的变换选择使得量化值的选择能够显著地减小所要编码的数据量。例如,为图象压缩选择DCT,因为所产生的频率分量产生对于人的视觉系统来说几乎是独立的响应。这意味着与视觉系统不敏感的分量有关的系数即高频分量可用大的量化值进行量化而不损失图象质量。与视觉系统更敏感的分量有关的系数即低频分量,则用较小的量化值进行量化。
这种反向变换还通常产生非整数的数据。通常译码数据需要是整数形式的。例如,用于音频数据重放或图象数据显示的系统通常接受整数形式的输入。因此,变换译码器通常包括把来自反向变换的非整数数据借助截断或舍入到最近的整数而转换成整数数据的步骤。
对于从译码处理输出的整数数据的范围通常也有限制,以使该数据能够以给定的位数得到存储。因此,译码器还经常包括一个“修剪”阶段,它保证输出数据处于一个可接受的范围中。如果该可接受的范围是[a,b],则小于a的所有值都被改变为a,且所有大于b的值都被改变成b。
这些舍入和修剪处理经常被认为是译码器的整数部分,且正是这些造成了译码数据特别是当译码数据被再编码时的不准确。例如,JPEG标准(部分1)规定源图象抽样被定义为精确P位的整数,其值可在0至2*P-1的范围内。译码器应该从逆DCT(IDCT)以指定的精度重组该输出。对于基本JPEG编码P被定义为8;对于其他基于DCT的编码P可以是8或12。MPEG-2视频标准在附件A(离散余弦变换)中规定“至正向变换的输入和从反向变换的输出由9位表示”。
对于JPEG,符合的编码器源图象测试数据和译码器基准测试数据是8位/抽样整数。即使舍入到整数是典型的,某些程序语言通过截断进行从浮点转换为整数。在软件中实施接受这种通过截断进行转换为整数,把较大的误差引入了从反向变换输出的实域整数中。
术语“高精度”在此指的是存储至比当以整数的形式存储值时所用的精度更精确的精度的数字。高精度值的例子是数字的浮点或固定点表示。
发明内容
本发明提供一种用于对代表一种现象的变换数据进行数字处理的方法,该方法包括:将所述变换数据反向变换至实域,从而形成高精度数;以及在对所述高精度数进行转换之前直接操作所述高精度数以产生一种效果。
本发明提供一种用于在实域中对代表一种现象的变换数据进行数字处理的方法,该方法包括:将所述变换数据反向变换至实域,从而形成高精度数;以及在对所述高精度数进行转换之前直接对所述高精度数进行正向变换。
本发明提供一种用于对代表一种现象的变换编码数据进行数字处理的方法,该方法包括:对所述变换编码数据进行逆量化,从而形成变换数据;将所述变换数据反向变换至实域,从而形成高精度数;以及在对所述高精度数进行转换之前直接对所述高精度数进行操作,以产生一种效果。
本发明提供一种用于对代表一种现象的变换编码数据进行数字处理的方法,该方法包括:对变换编码数据进行逆量化,以形成变换数据;对所述变换数据反向变换至实域,以形成高精度数;在对所述高精度数进行转换之前直接对所述高精度数进行一种正向变换,以形成正向变换数据;以及对所述正向变换的数据进行量化以形成量化数据。
本发明提供一种用于在代表现象的实域中对第一级的变换编码数据进行数字处理的系统,该系统包括:第一逆量化器,用于从所述变换编码数据产生变换数据;第一反向变换器,用于产生所述变换数据至实域的一种反向变换,从而形成高精度数;第一正向变换器,用于在对所述高精度数进行转换之前直接对所述高精度数进行正向变换,从而形成正向变换数据;以及第一量化器,用于量化所述正向变换数据以形成量化数据。
本发明提供一种用于对代表现象的变换数据进行数字处理的系统,该系统包括:反向变换器,用于将该变换数据反向变换到使用高精度数的实域;以及操作器,用于在对所述高精度数进行转换之前直接对该高精度数进行操作以产生一种效果。
本发明提供一种用于对代表一种现象的变换编码数据进行数字处理的系统,该系统包括:逆量化器,用于对所述变换编码数据进行逆量化以形成变换数据;反向变换器,用于对所述变换数据进行至实域的反向变换,以形成高精度数;以及操作器,用于在对所述高精度数进行转换之前直接操作高精度数以产生一种效果。
本发明提供一种用于在实域中对代表一种现象的变换数据进行数字处理的系统,该系统包括:反向变换器,用于将变换数据反向变换至实域,以形成高精度数;以及正向变换器,用于在对所述高精度数进行转换之前直接对高精度数进行正向变换。
考虑到上述有关由于数字处理技术和诸如变换数据的反向变换之后的舍入和修剪而造成的不准确性的问题,本发明的一个方面提供了一种方法,用于处理实域中的变换数据。这种方法减少了再变换的数据中由于诸如舍入到整数和在反向变换之后修剪到允许的范围的操作所产生的不希望的误差。在一个实施例中,这种方法包括:进行变换数据的反向变换,从而使所产生的实域数据具有高度精确的值的形式;对这些高精度的值进行处理;只在处理阶段完成之后才把这种高精度的值转换成整数并修剪到一个允许的范围。
本发明的另一个方面,是提供一种方法,用于处理实域中的变换编码数据,它减少了在反向变换之后转换为整数和至允许范围的修剪所产生的不希望的数据误差。在一个实施例中,该方法包括:对变换编码数据进行逆量化;对如此产生的变换数据进行反向变换,从而使所产生的实域数据具有高精度的值的形式;处理这些高精度的值;并只在处理阶段完成之后才将处理之后的高精度的值转换成整数并修剪到一个允许范围。
本发明的再一个方面,是提供一种方法,用于处理实域中的变换编码数据以产生新的变换编码数据,它减少了在反向变换转换为整数和至一个允许范围的修剪所产生的误差。在一个实施例中,该方法包括:进行变换编码数据的逆量化;对如此产生的变换数据进行反向变换,从而使所产生的实域数据具有高精度的值的形式;处理这些高精度的值;对产生的高精度的值进行正向变换;以及,对新的变换数据进行量化。如果在正向和反向变换中和在处理中的误差足够地小,在新的量化变换域数据中不会产生不希望的误差。
对于在此描述的方法,其输入数据不要求是来自单个的数据源。因此,本发明不限于来自单个源的数据的实域处理,而是可应用于来自多个源的数据的实域处理,诸如图象或音频数据的合并。
在背景部分中描述的量化是在诸如JPEG和MPEG的国际图象数据压缩标准中采用的线性量化。该量化未被要求是线性的。以确定的方式减小变换数据级数目的所有变换都可被用于本发明。该量化步骤已经借助公式(1)而以数学的方式进行了描述。实际的实施例可采用查询表或比较序列来实现类似的结果。
本发明的进一步的一个方面是提供一种设备、一种计算机产品和制造品—它包括了体现在其中的具有计算机可读取程序码装置的可用介质,用于使计算机执行本发明的方法。
附图说明
从以下结合附图对本发明所进行的详细描述,本发明的这些和其他的目的、特征、优点将变得显而易见。在附图中:
图1(a)是显示用于执行反向变换的一种方法的框图;
图1(b)是显示用于执行一种反向变换的一种系统的框图;
图2(a)是显示用于译码变换编码数据的一种方法的框图;
图2(b)是显示用于译码变换编码数据的一种系统的框图;
图3是显示用于变换数据的实域处理的一种方法的框图;
图4是框图,显示了用于进行随后进行有正向变换的反向变换的一种方法并显示了多重产生的问题;
图5是显示变换编码数据的译码和再编码的一种方法的框图,并显示了多重产生的问题;
图6是框图,显示了用于进行反向变换、实域数据操作和一种正向变换的一种方法,并显示了多重产生的问题;
图7(a)是框图,显示了用于进行JPEGDCT编码图象数据的实域处理的一种方法,它呈现了多重产生的问题;
图7(b)是框图,显示了用于进行JPEGDCT编码图象数据的实域处理的系统,它呈现了多重产生的问题;
图8(a)给出了JPEG例子的光度量化矩阵;
图8(b)给出了JPEG例子的色度量化矩阵;
图8(c)是实域舍入如何能够造成8×8块DCT编码数据中的显著误差的数值例子;
图8(d)是实域截断如何能够造成8×8块DCT编码数据中的显著误差的数值例子;
图8(e)是一系列的曲线图,显示了实域修剪如何能造成一维离散余弦变换编码数据中的误差;
图8(f)和图8(g)是实域修剪如何能够造成8×8块DCT编码数据中的显著误差的一个数值例子;
图9是框图,显示了用于执行图5描述的处理的多此重复的一种方法,且它呈现了多重产生的问题;
图10是框图,显示了进行实域操作的多次重复的一种方法,且它呈现了多重产生的问题;
图11(a)是框图,显示了根据本发明的用于变换数据的减少误差处理的方法的一个例子;
图11(b)是框图,显示了根据本发明的用于变换数据的减少误差处理的系统的一个例子;
图12(a)是框图,显示了根据本发明的用于进行随后跟随有正向变换的反向变换从而使第三处理无损失的方法的一个例子;
图12(b)是框图,显示了根据本发明的用于进行随后跟随有正向变换的反向变换从而使第三处理无损失的系统的一个例子;
图13(a)是框图,显示了根据本发明的跟随有正向变换的用于以减少的误差对变换数据进行实域操作的一种方法的一个例子;
图13(b)是框图,显示了根据本发明的跟随有正向变换的用于以减少的误差对变换数据进行实域操作的一种系统的一个例子;
图14(a)是框图,显示了根据本发明的用于对变换编码数据进行误差减少的处理的一种方法的一个例子;
图14(b)是框图,显示了根据本发明的用于对变换编码数据进行误差减少的处理的一种系统的一个例子;
图15(a)是框图,显示了根据本发明的用于译码和再编码变换编码数据从而使这种处理无损失的一种方法的一个例子;
图15(b)是框图,显示了根据本发明的用于译码和再编码变换编码数据从而使这种处理无损失的一种系统的一个例子;
图16(a)是框图,显示了根据本发明的用于以较少的误差对变换编码数据进行实域操作的一种方法的一个例子;
图16(b)是框图,显示了根据本发明的用于以较少的误差对变换编码数据进行实域操作的一种系统的一个例子;
图17(a)是框图,显示了根据本发明的一种方法的一个实施例,其中该方法用于进行JPEG编码的图象数据的实域处理从而使新的变换编码数据中的不希望的误差得到减少或消除;
图17(b)是框图,显示了根据本发明的一种系统的一个实施例,其中该系统用于进行JPEG编码的图象数据的实域处理从而使新的变换编码数据中的不希望的误差得到减少或消除;
图18(a)是显示了根据本发明的一种方法的一个例子的框图,其中该方法用于以较少的误差对变换编码数据的实域操作进行多次重复,其中每次重复都如图16(a)中所描述的;
图18(b)是显示了根据本发明的一种系统的一个例子的框图,其中该系统用于以较少的误差对变换编码数据的实域操作进行多次重复,其中每次重复都如图16(b)中所描述的;
图19(a)显示了图8(c)的相同的8×8块数值起点,其中采用了高精度数而不是舍入数作为至正向变换的输入;
图19(b)显示了图8(d)的相同的8×8块数值起点,其中采用了高精度数而不是舍入数作为至正向变换的输入;
图19(c)显示了与图8(f)相同的8×8块数值步骤;
图19(d)显示了在量化之后当采用舍入的逆DCT的输出在修剪之前被输入到正向变换的数值结果。
具体实施方式
由参考数据处理所引起的问题
本发明提供了减少或消除数字数据的处理而引起的误差的方法、系统和计算机产品。首先,误差源得到分析和描述。随后说明本发明的用于误差减少和消除的概念。特别应该注意的是,以前采用的数字技术的数据操作和/或处理,使得数字处理的各种实施持续引入误差。这些多年来采用的技术,使得随着进行更多的处理而不能保持原来数据的精度和代表现象的数据的持续恶化。这在处理包含了以前的处理所产生的误差的数据的情况下是特别有害的。这导致了数据的继续损坏,从而使数据随着对其的处理的增加而变得越来越无用。
本发明人所理解的这种问题的严重性,已经在上面进行了描述。应该注意的是,在这里所给出的附图中,可选的步骤经常以虚线和/或框来表示。
应该注意的是,本发明的概念在几乎所有的数字处理技术中都是有用的。然而,随后的描述多涉及的是图象数据。这是由于全世界采用的图象数据压缩标准的一般可获得性和持续使用。这些标准要求把将要描述的误差引入数字数据和连续地采用和处理包含误差的数据。这些标准的教导基本上说是与本发明相背离的。因此图象技术是描述本发明的一个非常好的例子。
图1(a)显示了一种反向变换方法100。变换域数据A 110受到反向变换120的作用,从而产生了高精度的实值数据130。该高精度数据130被转换成整数并被修剪140,以产生整数实域数据150。在某些情况下,该整数值数据被可选地送到一个输出装置160。
图1(b)是一种反向变换系统105。变换域数据A 115受到反向变换器125的作用,而反向变换器125产生高精度实值数据135。高精度数据135被输入整数转换器和修剪器145,以产生整数实域数据155。在某些情况下,整数值数据可选地被输入诸如显示监视器、电视机、或音频播放机的输出装置165。
图2(a)显示了译码变换编码(即量化)数据的方法200。整数变换编码数据B 210用如上述公式(2)的量化值进行了逆量化220(即去量化)。这种去量化步骤的结果可随后作为输入而通过反向变换器120,且译码如图1(a)所示地进行。
图2(b)显示了用于译码变换编码(即量化)数据的系统205。整数变换编码数据B215以如上述公式(2)的量化值被输入逆量化器225。去量化步骤的结果作为输入通过反向变换器125,且译码如图1(b)所示地进行。
本发明的一个方面,涉及变换数据和变换编码数据的操作。术语“操作”和“处理”的使用在这里是可互换的。操作可以是为了实现很多不同的结果。例如,图象数据经常要在打印之前通过缩放和/或转动而进行处理。来自两个源的数据可被合并,如在图象的彩色图象组合或音频数据的混频中所进行的。数据的相互操作通常是编辑或颜色校正所需要的。这种变换数据操作通常是对从图1(a)和/或图2(a)的变换译码产生的整数实域数据进行的。
图3显示了对变换数据300的一种处理。整数数据150经历了某种形式的操作310。如果这种操作310不产生整数输出,操作输出340再次被转换成整数并被修剪320。所产生的整数数据330可被存储、发送、和/或可选地送到输出装置160。由于至整数140的修剪转换的存储是在接受整数输入150的操作之前进行的,所产生的误差使来自操作340的数据输出包含至少小的不准确。
应该注意的是,在上述的数据操作处理中没有要求输入数据完全来自一个源。例如,很多类型的数据操作涉及到来自两或更多源的数据的合并。这包括了诸如音频数据的混频或图象的合并。图中显示且一般地描述的处理同样适用于这些类型的操作。因此用于所述的任何处理的“输入数据”实际上可以来自一个以上的输入源。
操作之后的数据通常需要被再编码到变换域。所希望的是,当对实域数据不进行操作时,译码和再编码处理应该是无损失的。即,当正向变换操作采用了与反向变换变换操作相同的变换类型时,数据应该产生与初始提供的完全相同的变换域数据。然而,转换为整数和修剪至允许范围引入了误差,如图4中所示。图4显示了用作至正向变换装置410的输入的整数数据150,它接受整数值数据作为输入。所产生的变换数据A1 420不同于输入到反向变换的原来的变换数据A 110。这是由于转换为整数和修剪处理140已经引入了误差到处理中。在该过程中在每次重复之后数据的改变所引起的问题,或“产生”的问题,在此被称为“多重产生问题”。
这种多重产生问题也在图5中就变换编码数据进行了说明。在此新的变换域数据420被量化510,以产生新的变换编码数据B1 520。重要的是认识到量化数据只在产生的误差大于量化阶段的一半的情况下才能产生:
Q(λi+ε)=Q(λi)若|ε|<0.5qi (3)
其中ε是在这种变换系数中产生的误差。这是由于λi每一个都已经是量化值的倍数,因为它们已经是通过如公式(2)的去量化而产生的。因此,有利的是控制这些误差,从而使它们足够地小。当误差足够小时,新的变换编码数据将与原来的变换编码数据完全相同。通过舍入而转换到整数的最大可能的误差,是通过转换期间的截断而引入的误差的一半。
图6显示了其中图象操作是在数据上进行且所产生的修正数据随后再被变换回变换域的情况。整数数据150如图3所示地得到操作,以产生新的整数值数据610。这些新的整数值数据610被用作至正向变换410的输入,以产生新的变换数据A2 620。上述的没有任何操作过程的处理在变换数据110中改变这一事实,显示出当操作被进行时在变换数据110中有除了从所希望的操作产生的改变之外的不希望的改变。
体现图6所示的处理的一种方法的一个例子,被显示在图7(a)中。所示的方法700对诸如JPEG编码图象数据的编码数据进行了实域操作。编码数据C 710受到熵译码720,它在JPEG标准中被定义为JPEG编码数据。熵译码步骤720把该数据解压缩成了量化的DCT系数。这些量化系数得到逆量化730并通过反向变换—它在该系统中是两维8×8逆DCT 740。所产生的实值图象数据被舍入成整数并被修剪750到允许范围(例如[0,255]),以在该允许范围中产生整数值的图象数据754。
如果需要在操作之前显示数据,例如当图象操作是一种交互过程,图象能够可选地被送到一个显示装置758。该图象随后得到操作762,以产生某些所希望的改变。如果操作的结果是非整数数据,则该图象数据可被转换成整数并被修剪到例如[0,255]的范围768。以此方式,图象数据772可再次被显示758。新的实域图象数据772可被传送到正向DCT 776且产生的DCT系数得到量化780,以产生新的量化DCT系数784。这些系数784随后被熵编码788,以产生新的编码数据C1792-它们不同于原来的编码数据C 710。现在新的编码数据C1 792不仅包含所希望的图象操作762对图象的改变,而且还包括从转换和修剪阶段750和768所产生的误差。消除或减小这些误差将是有利的。
体现图6所示的处理的一种系统的一个例子,被显示在图7(b)中。系统705对编码数据进行实域操作。编码数据C 715被输入熵译码器725,后者是在JPEG标准中为JPEG编码数据定义的。熵译码器725把数据解压缩成量化DCT系数。这些量化系数被输入逆量化器735且其输出被传送到反向变换器,在此系统中是两维8×8逆DCT器745。所产生的实值图象数据被舍入成整数并被修剪755(例如至范围[0,255]),以产生允许范围内的整数值图象数据759。
如果需要在操作之前显示该数据,例如当图象操作是一种交互过程时,该图象能够可选地被送到一个显示器763。图象受到操作器767的作用,以产生某些所希望的改变。如果操作的结果是非整数数据则该图象数据可被传送到另一整数转换器和修剪器773。以此方式图象数据777可再次得到显示763。新的实域图象数据777被传送到正向DCT器781,且产生的DCT系数被输入量化器785,以产生新的量化DCT系数789。这些系数789随后被输入熵编码器793,以产生新的编码数据C797,它们不同于原来的编码数据C715。现在新的编码数据C1 797不仅包含了所希望的由图象操作器767进行的图象改变,而且还包含了从整数转换器和修剪器755和773产生的误差。
图8(a)显示了JPEG例子的8×8DCT亮度块的亮度量化矩阵804。图8(b)给出了8×8DCT色度块的JPEG例子的色度量化矩阵814。图8(a)中的最小的量化值是10。图8(b)中的最小的量化值是17。由于对64个抽样来说舍入的最大可能的误差是0.5,对于JPEG来自通过舍入转换为整数的未量化的正向变换系数是4(图8(c)中所示)。对于图8(a)和8(b)中显示的量化矩阵,这种大小的误差小于所有值的一半且将在量化期间消失。然而,对于诸如高质量打印或数字工作室编辑的高质量应用,量化矩阵值要小得多。在某些情况下,DC(左上角)项小到1,以保存最大的质量。此时这些舍入误差就是显著的。
来自截断的最大可能误差对于各个抽样来说刚好在1以下。这几乎是未量化的正向变换系数中的误差的两倍。对于图8(a)中的量化矩阵,八个量化值对于这种误差来说小得足够潜在地改变变换编码数据。
图8(c)中给出了显示这种多重产生问题的一个数值例子。在此例中,所用的变换是如在JPEG静止图象压缩标准中使用的8×8DCT。其中只有一个(常数或DC项)不为零的一组变换域系数822,受到反向变换作用,以产生实域数据824。在此情况下,数据由都等于128.5的64个值组成。注意8位数据的128JPEG电平的移动已经被施加。实域数据被舍入到最近的整数826,这在此情况下意味着各个值被舍入到129。正向变换随后被施加,以产生新的变换域系数828。可见所产生的新的变换系数828与初始的变换系数822有显著的不同。这是一种非常不希望的结果。
如果DC量化值被置于1、2或4,则这种例子也适用于变换编码数据。此时变换系数822将分别从变换编码值4、2、或1产生。新的变换系数828的量化将所产生的DC量化值分别改变至2、4、或8。
图8(d)中给出了显示这种多重产生问题的另一个数值例子。同样所用的变换是8×8DCT,如在JPEG静止图象压缩标准中采用的。其中只有一个(常数或DC项)不为零的一组变换域系数832,受到反向变换作用,以产生实域数据834。在此情况下,数据由都等于128.875的64个值组成。注意8位数据的128的JPEG电平的移动已经被施加。实域数据被截断到最近的整数836,这在此情况下意味着各个值被减小到128。正向变换随后被施加,以产生新的变换域系数838。可见所产生的新的变换系数838与初始的变换系数832有显著的不同。这是一种非常不希望的结果。
在显示了在转换为整数时进行实域舍入或截断所导致误差之后,我们现在显示实域修剪如何产生误差。图8(e)显示了实域修剪850的一个例子。这种例子采用了一维DCT以说明问题。图8(d)显示了一个直方图854,它显示了构成八个抽样的一个数据块。显示的该数据只有两个频率分量:一个是恒定的或DC分量,它由虚线表示;另一个是交变的或AC分量,它给出了相对虚线对称的交变波形。这些分量的幅度即各个DCT系数是高精度的值。当进行量化时,这些DCT系数被舍入到最近的量化电平。直方图858中显示了变换域量化之后的数据。在所示的例子中,DC系数具有小的量化值因而量化不会显著地改变DC电平。所示的AC系数具有大的量化值,因而受到量化的显著改变。这种例子显示了,AC分量的幅度由于量化几乎增加了一倍。这些量化值反映了例如当压缩色度图象数据时采用的值。因此量化之后代表的数据具有带有负值的部分。这显示了在反向变换之后给出实域负值的变换域数据能够由不包含负值的原来实域数据产生。
直方图862显示了在实域修剪之后从图表858中的数据产生的数据。实数据的这些负的部分已经被改变为0。这产生了数据增大的DC系数因而导致了误差的引入。由于DC系数的量化值通常都小,这种误差大得足以造成量化如公式(3)给出的数据的改变。
为了进一步说明实域修剪引入的误差的可能性,在图8(f)和8(g)中给出了一个数值例子870。该例子采用了图5中说明的系统。该例子采用了两维8×8DCT,就象用于图象的变换编码以说明上述问题时一样。初始的量化DCT系数在矩阵874中显示。除了两个系数之外的所有系数都是0;这两个非零系数是DC系数和一个高频系数。这些系数,在利用图8(a)所示的量化矩阵进行量化之后,被显示在矩阵878中,当对这些变换数据进行反向DCT且被加上128的电平移动时,实数据得到产生,如矩阵882所示。矩阵882中所示的该数据已经被舍入到了整数,但还未被修剪到一个允许范围。可见这些实数据包括几个负值。在修剪之后,实数据882产生了修剪的实数据,如矩阵886中所示。这些数据与882相同,只是各个负值已经被0所代替。随后对该实域数据进行正向DCT,以给出新的舍入变换数据890。可见新的变换数据与前面的变换数据878有显著不同。当量化是利用图8(a)所示的量化矩阵进行时,新的变换编码数据894得到产生。变换数据中产生的改变大得足以在量化之后的变换编码数据中产生改变。这是一种非常不希望的结果。
在很多情况下,数据的译码、操作和再编码处理都需要进行多次。在这些情况下,这种处理的每一次重复都被称为“产生”。上述的由于转换为整数和修剪到实域中的一个允许范围而产生的误差,随着多次的重复的进行而累积,并可导致数据的显著恶化。应该理解的是,以上描述的只是舍入(或截断)和/或修剪所引入的误差的代表性的例子。其他的例子所可能产生的误差或多或少。
在如图9所示的译码和再编码的多次产生之后,这种问题通常更为严重。初始的变换编码数据D0 910被去量化和反向变换920,转换成整数并被修剪到允许范围930,以产生整数值的实域数据940。这种实域数据940经过正向变换和量化950,以给出新的变换编码数据D1 960。这种整个过程被重复几次,且在重复次数为某一数目n之后,最后的变换编码数据Dn 970得到产生。由于各个步骤中的误差,最后的数据Dn 970可能与原来数据非常不同了。
图10中显示了一种情况,它显示出由于变换编码数据的实域操作的多次产生而使这种问题显著地恶化了。除了图9所示的步骤之外,对实域数据进行了某些形式的操作310,随后是转换为整数和修剪320。在正向变换和量化之后,所产生的量化变换系数101包含了某些误差,象图5中那样。在n次产生之后,最后的变换量化系数1020可能具有相当大的不希望的误差。
图11(a)中显示了以较少的误差处理变换数据的一种方法的一个示例性实施例。变换数据A 110通过一个反向变换120以产生高精度实域数据130,如图1(a)所示。如果需要使实域数据通过一个取整数值输入的输出装置160,或者在由于任何其他的原因的操作之前产生整数值数据,则转换成整数并修剪至允许范围140的步骤在操作之前进行,而不会影响高精度实域数据。实域数据的所希望的操作1110是利用一种方法进行的,该方法接受高精度数据作为其输入并产生作为输出的高精度数据1120。这种操作方法1110对数据进行的处理在原理上与上述图3中描述的对整数310进行的操作是相同的,但却是对高精度数据进行的。如果需要使操作的实域数据被传送到取整数值输入的输出装置160,或者需要在操作之后由于任何原因而产生整数值数据,则转换至整数并修剪到一个允许范围140的步骤在操作之后进行,而不会影响处理的数据的高精度。
图11(b)中描述了根据本发明的以较少的误差1105处理变换数据的一种系统的一个示例性实施例。变换数据A 115通过一个反向变换器125,以产生高精度实域数据135,如图1(b)所示。如果需要使实域数据通过一个取整数值输入的输出装置165,或者由于任何其他原因而需要在操作之前产生整数值数据,整数转换器和修剪器145在操作之前进行操作,而不会影响高精度实域数据。操作器1115对实域数据进行操作,并接受作为输入的高精度数据和产生作为输出的高精度数据1125。这种操作器1115对数据的操作在原理上与文件中描述的对整数310的操作是相同的,但却是操作在高精度数据上。如果需要使操作的实域数据被传送到取整数值输入的一个输出装置165,或者由于任何其他原因而需要在操作之后产生整数值数据,整数转换器和修剪器145在操作之后进行工作,而不会对处理的数据的高精度有任何影响。
图12(a)中显示了本发明的一个实施例的一个例子,其中采用了一种方法来进行跟随有正向变换步骤1200的反向变换。变换数据A 110通过一个反向变换120以产生高精度实域数据130,如图1(a)所示。如果需要使实域数据通过取整数值输入的输出装置160,或者由于任何其他原因而需要产生整数值数据,则转换至整数并修剪至允许范围140的步骤得到执行,而不会影响高精度实域数据。高精度数据130被用作至正向变换1210的输入,该正向变换接收实值数据作为输入。如果正向变换1210是反向变换的转置,则所产生的变换数据A3 1220与作为至反向变换120的输入的原来变换数据A 110相同,因为来自舍入和修剪的误差未出现在变换数据A3中。当采用不同的正向变换时,正向变换1210将产生不同的变换数据A3 1220。这使得能够在正向变换输入中不出现来自舍入和修剪的误差的情况下进行变换之间的转换。
图12(b)中显示了本发明的一个实施例的一个例子,其中采用了一种系统,该系统具有跟随有正向变换器1200的反向变换器。变换数据A 115通过一个反向变换器125以产生高精度实域数据135,如图1(b)所示。如果需要使实域数据通过取整数值输入的输出装置165,或者由于任何其他原因而需要产生整数值数据,则整数转换器和修剪器145在不影响高精度实域数据135的情况下进行工作。高精度数据135被用作至正向变换器1215的输入,该正向变换器接收实值数据作为输入。如果正向变换起1215实施了反向变换的移项,则所产生的变换数据A3 1225与作为至反向变换器125的输入的原来变换数据A 115相同,因为来自舍入和修剪的误差未出现在变换数据A3中。当采用不同的正向变换器时,正向变换器1215将产生不同的变换数据A3 1225。
图13(a)显示了用于以较少的误差1300进行变换数据的实域操作的一种方法。这种方法是通过扩展图11(a)中描述的方法1100而形成的。在此情况下,高精度数据1120作为输入被传送到一个正向变换1210-它接受作为输入的高精度数据,以在没有舍入和/或修剪误差的情况下产生新的变换数据A4 1310。
图13(b)显示了用于以较少的误差1305进行变换数据的实域操作的一种系统。这种系统是通过扩展图11(b)中描述的系统1105而形成的。在此情况下,高精度数据1125作为输入被传送到一个正向变换器1215-它接受作为输入的高精度数据,以在没有舍入和/或修剪误差的情况下产生新的变换数据A4 1315。
图14(a)中显示了用于以较少误差进行变换编码数据的实域操作的一种方法。图14(a)显示,整数变换编码数据B 210被去量化220,且输出通过一个反向变换120以产生高精度实域数据130,象图2(a)中一样。如果需要使实域数据130通过一个取整数值输入的输出装置160,或者由于任何其他原因而需要在操作之前产生整数值数据150,转换至整数并修剪至允许范围140的步骤在操作之前进行,而不会影响高精度实域数据130。随后利用一种方法进行实域数据的所希望的操作1110,该方法接受高精度数据作为输入并产生作为高精度数据1410作为输出。对数据进行这种操作1110的原理与上述图3中描述的对整数310的操作相同,但却是在高精度数据上进行的。如果需要把经过操作的实域数据送到取整数值输入的输出装置160,或者由于任何其他的原因而在操作之后产生整数值数据,则转换到整数并修剪到允许范围140的步骤在操作1110之后进行,而不影响处理的数据1410的高精度。
图14(b)中显示了用于以较少误差进行变换编码数据的实域操作的一种系统。图14(b)显示,整数变换编码数据B 215被输入去量化器225,且输出通过一个反向变换器125以产生高精度实域数据135,象图2(b)中一样。如果需要使实域数据135通过一个取整数值输入的输出装置165,或者由于任何其他原因而需要在操作之前产生整数值数据155,整数转换器和修剪器145在操作之前对数据进行运算,而不会影响高精度实域数据135。随后利用一种操作器1115进行实域数据的所希望的操作,该操作器接受高精度数据作为输入并产生作为高精度数据1415作为输出。该操作器1115的原理与上述图3中描述的对整数310的操作相同,但却是在高精度数据上进行的。如果需要把经过操作的实域数据送到取整数值输入的输出装置165,或者由于任何其他的原因而在操作之后产生整数值数据,则整数转换器和修剪器145在操作器1115之后对非整数数据1415进行运算,而不影响处理的数据1415的高精度。
图15(a)中显示了变换编码数据1500的实域转换的一种方法的一个示例性实施例。高精度数据130被用作正向变换1210的输入,而正向变换1210接受实值数据作为其输入。正向变换1210的输出被量化1510。根据所希望的系统实施,正向变换操作1210可采用不同于反向变换操作120中采用的变换。例如,反向变换120可采用逆DCT变换,而正向变换1210可采用付立叶变换。如果正向变换操作1210是反向变换操作120的反向变换且用在逆量化步骤220和量化步骤1510中的量化值是相同的,所产生的整数变换数据B2 1520与作为至逆量化步骤220的输入的原来的反向变换数据B 210相同。应该注意的是,当采用不同的正向变换时,正向变换1210将产生不同的整数变换数据B2。类似地,在逆量化220和量化1510中采用不同的量化值也产生了不同的整数变换数据1520。这种方法因而允许在没有来自舍入和修剪的误差出现在正向变换1210输入130中的情况下在变换与量化矩阵之间进行转换。
量化矩阵之间的转换可以是粗和细量化。为了从JPEG国际标准向MPEG国际标准转换数据,量化可能是粗的。在编辑处理中需要更高质量的JPEG独立图象。较粗、更可压缩的MPEG图象被用于实现所希望的带宽目的。另一方面,在显著的手动编辑之后的再压缩JPEG图象中,量化可以是较细的,以保存改变。
图15(b)中显示了根据本发明的变换编码数据1505的实域转换的一种系统的一个示例性实施例。高精度数据135被用作正向变换器1215的输入,而正向变换器1215接受实值数据作为其输入。正向变换器1215的输出被量化1515。根据所希望的系统实施,正向变换操作器1215可采用不同于反向变换操作器125中采用的变换。例如,反向变换器125可采用逆DCT变换,而正向变换器1215可采用付立叶变换。如果正向变换操作器1215产生反向变换操作器125的反向操作和用在逆量化器225和量化器1515中的量化值是相同的,所产生的整数变换数据B2 1525与作为至逆量化器225的输入的原来的反向变换数据B 215相同。应该注意的是,当采用不同的正向变换时,正向变换器1215将产生不同的整数变换数据B2。类似地,在逆量化器225和量化器1515中采用不同的量化值也产生了不同的整数变换数据1525。这种方法因而允许在没有来自舍入和修剪的误差出现在正向变换器1215输入135中的情况下在变换与量化矩阵之间进行转换。
通过把图14(a)描述的方法1400扩展成如图图16(a)中显示的形式,可以形成一种用于以减少的误差1600对变换编码数据进行实域操作的方法。高精度数据1410作为输入被传送到一个正向变换1210,该正向变换1210接受高精度数据作为输入。来自正向变换的输出值被量化1510,以产生新的变换编码数据B3 1610。
通过把图14(b)描述的方法1405扩展成如图图16(b)中显示的形式,可以形成一种用于以减少的误差1605对变换编码数据进行实域操作的系统。高精度数据1415作为输入被传送到一个正向变换器1215,该正向变换器1215接受高精度数据作为输入。来自正向变换器的输出值被量化1515,以产生新的变换编码数据B3 1615。
图17(a)显示了以减少的误差1700对变换编码数据进行实域操作的一种方法的示例性实施例。选定的实施例是用于JPEG编码图象的实域操作的方法,它利用DCT而得到变换编码。JPEG编码的图象数据C 710通过一个无损失熵译码步骤720而得到译码,以产生量化的DCT系数。这些系数被去量化730,并被传送通过一个逆DCT 740以产生高精度实域数据1710。如果需要在操作之前把该图象传送到一个取整数值输入的显示装置758,或者在操作之前由于任何其他的原因而产生整数值数据754,转换至整数并修剪至一个允许范围750的步骤在操作1720之前进行,而不会影响高精度实域图象数据1710。图象的所希望的操作1720随后利用接受高精度数据作为输入并产生作为输出的高精度数据1730的方法进行。如果需要使操作的图象数据被传送到取整数值输入的一个显示器758,或者由于任何其他的原因而在操作之后产生整数值图象数据1750,转换至整数并修剪至允许范围1740的步骤在操作1720之后进行,而不会影响处理的图象数据1730的高精度。高精度图象数据1730作为输入被传送到一个正向DCT 1760,该正向DCT接受高精度数据作为输入。来自正向变换1760的输出值被量化780,以产生新的逆DCT系数1770。这些系数1770通过一个无损失熵编码步骤788而得到编码,以产生新的JPEG编码数据C2 1780。如果正向和反向变换和该操作系统足够地准确因而所引入的误差小于量化步骤的一半,如上述公式(3)所述的,则完全不会有误差被引入DCT系数。
图17(b)显示了以减少的误差1705对变换编码数据进行实域操作的一种系统的示例性实施例。选定的实施例是用于JPEG编码图象的实域操作的方法,它利用DCT而得到变换编码。JPEG编码的图象数据C 715通过一个无损失熵译码器725而得到译码,以产生量化的DCT系数。这些系数被送到去量化器735,并被传送通过一个逆DCT器745以产生高精度实域数据1715。如果需要在操作之前把该图象传送到一个取整数值输入的显示装置763,或者在操作之前由于任何其他的原因而产生整数值数据759,转换至整数并修剪至一个允许范围755的步骤在操作1725之前进行,而不会影响高精度实域图象数据1715。执行图象的所希望的操作的操作器1725接受高精度数据作为输入并产生作为输出的高精度数据1735。如果需要使操作的图象数据被传送到取整数值输入的一个显示器763,或者由于任何其他的原因而在操作之后产生整数值图象数据1755,可选的整数转换器和修剪器1745在操作器1725的操作之后产生整数值数据1755,而不会影响处理的图象数据1735的高精度。高精度图象数据1735作为输入被传送到一个正向DCT器1765,该正向DCT器接受高精度数据作为输入。来自正向DCT器1765的输出值被量化785,以产生新的逆DCT系数1775。这些系数1775通过一个无损失熵编码步骤793而得到编码,以产生新的JPEG编码数据C2 1785。如果正向和反向变换和该操作系统足够地准确因而所引入的误差小于量化步骤的一半,如上述公式(3)所述的,则完全不会有误差被引入DCT系数。
图18(a)中显示了用于在多个步骤1800中以减少的误差进行变换的转换数据的实域操作的方法,其中操作步骤与正向变换和量化步骤和反向变换和量化步骤是交替进行的。一般地,各个操作对数据进行其他的运算。例如,对于数字工作室编辑,第一种操作可能是对图象进行颜色校正。第二种操作可能是。第二个操作可能是利用彩色图象组合方法来把彩色校正的图象与背景合并。第三个操作可能是把强调加到图象上。第四个操作可能是把图象的宽高比从16∶9变成电视的宽高比4∶3。对于图象的打印,第一个操作可能是把图象转动90度,以使图象向着打印方向。第二个操作可能是把几个独立的图象合并成一个复合图象。第三个操作可能是进行颜色转换。
如图18(a)所示,变换编码数据D0 910被去量化和通过一个反向变换920,以产生高精度实域数据1810。如果由于任何的原因而需要产生整数值数据,高精度数据1810可被转换成整数并修剪到一个允许范围1820,而不会影响实域数据1810的高精度。实域数据的所希望的操作1110随后利用一种方法来进行,该方法接受高精度数据1810作为输入并产生作为输出的高精度数据1840。如果希望产生整数值的这种输出数据,高精度数据1810可被转换至整数并修剪到一个允许范围1830,而不会影响输出数据的高精度。高精度输出数据作为输入被送到一个正向变换器和量化器1850,以产生新的变换编码数据F1 1860。逆量化和反向变换、操作和正向变换和量化可被重复多次,而操作1870在每次重复都不同。在多个步骤之后,产生最后的变换编码数据Fn 1880,其舍入和/或修剪误差都得到减少或消除。从和转换至整数并修剪步骤产生的输出都可借助或不借助一个多路复用器而被送到一个输出装置1890。
图18(b)中显示了用于以减少的误差在多个阶段1805进行变换编码数据的实域操作的本发明系统的一个示例性实施例,其中操作器的操作是与正向变换器和量化器的操作和逆量化器和反向变换器的操作交替进行的。变换编码数据D0 1815被提供到一个逆量化器和反向变换器1819,以产生高精度实域数据1823。如果由于任何理由而需要产生整数值数据,高精度数据1823可受到整数转换器和修剪器1827的作用,而不会对实域数据1823的高精度有影响。操作器1115随后作用在实域数据1823上,以产生所希望的操作并产生作为输出的高精度数据1845。如果希望产生整数值的这种输出数据,高精度数据1845可被输入到整数转换器和修剪器1835,而不会影响输出数据的高精度。高精度输出数据作为输入被送到一个正向变换器和量化器1855,以产生新的变换编码数据F1 1865。逆量化和反向变换的、操作和正向变换和量化的步骤可被重复多次,而操作器1875在每次重复中都不同。在多次重复之后,最后的变换编码数据Fn 1885得到产生,其中实域舍入和/或修剪误差得到减少或消除。在一个具体实施例中,来自任何或所有整数转换器和修剪器模块的输出都被提供给输出装置1895。对于编码图象数据,输出装置可以是一个显示器或电视机。对于编码音频数据输出装置可以是一个播放机和/或录音机。
图19(a)中给出了一个数值例子,它显示了本发明是如何解决多重产生问题的一个方面的。一组变换域系数822-其中只有一个(常数或DC项)是非零的,受到反向变换的作用,以产生一个实域数据块824。在此情况下,数据由都等于128.5的64个值组成。注意8位数据的128JPEG电平的偏移已经被施加。随后施加正向变换,以产生新的变换域系数1910。可见新的变换系数1910与初始变换系数822相同。这是由于在送到正向DCT的数据中没有出现舍入误差。
图19(b)中给出了另一个数值例子,它显示了本发明是如何解决多重产生问题的另一方面的。一组变换域系数832-其中只有一个(常数或DC项)是非零的,受到反向变换的作用,以产生一个实域数据块834。在此情况下,数据由都等于128.875的64个值组成。注意8位数据的128JPEG电平的偏移已经被施加。随后施加正向变换,以产生新的变换域系数1938。可见新的变换系数1938与初始变换系数832相同。这是由于在送到正向DCT的数据中没有出现截断误差。
在已经显示了如何利用高精度数来除去实域舍入或截断造成的误差之后,我们现在显示实域修剪误差是如何也得到避免的。在图19(c)显示了与图8(f)中相同的数值起点和前三个步骤。初始量化DCT系数被显示在矩阵874中。除了两个系数以外的所有系数都是0;这两个非零系数是DC系数和一个高频系数。这些系数在去量化之后被显示在矩阵878中。所用的量化矩阵被显示在图8(a)中。当对这些变换数据进行逆DCT时,如矩阵882中所示地产生了实数据。显示在矩阵882中的数据已经被舍入到整数但还未被修剪到允许范围。
图19(d)显示了对实域数据进行的给出新的舍入变换数据1944的正向DCT的结果。当进行量化时,新的变换编码数据1948得到产生。在此例子中,变换数据的改变没有大至足以在量化之后在变换编码数据中产生改变的程度。
产生之间的操作的例子,包括合并两个或更多变换编码数据组。对于变换编码图象数据组,合并可能是需要的,因为多个小的图象需要被汇集成一个较大的图象。广告册通常由多个单个的图象组成。今天的最高级的激光打印机一次能够打印一页以上。在此情况下,图象通常不重叠,而可能没有同样的量化,而相对基准网格进行定位,诸如用于JPEG DCT或取向的8×8块结构。通过在实域组成最后的图象,可对各个子图象进行标准处理。随后复合的图象可得到再压缩,以在飞击式打印中作最终的解压缩。
类似地,数字编辑可包括要求依次进行的若干独立操作的特殊效果。数字电影经常采用淡入/淡出特殊效果以进行两个关键场面之间的平稳切换。这种特殊效果可跟随对各个场面的独立的处理。因此,解压缩和再压缩的多次产生是编辑中需要的,以产生特殊效果的复合。
彩色图象组合涉及两个独立的视频数据流。在一个视频中背景已经被获得。在另一视频中前景(经常是由涉及演员的动作组成)被印在空白的单色(诸如深蓝或黑)背景上。随后,前景图象中的空白象素被背景视频中的象素所代替。由于这些象素要在单个象素级上混频,这些图象需要在实域中结合。转换为整数和修剪所引入的误差对于这种数字作品室应用是非常不希望的。
高端数字图形市场有时采用高过100兆象素的数字图象。光彩的广告册和展台上的大照片只是这种高质量数字图象技术应用的两个例子。高质量损失JPEG压缩有时被用于限制发送和存储成本。当这样的图象被解压缩和再压缩以进行诸如加强调光、校正颜色、添加或改变内容和图象标头的改变和修正时,不希望的误差是一个问题,这种问题可利用本发明的原理而得到解决。
本发明的概念的上述例子是图象和视频变换数据中通常可见的。因特网的广泛使用已经显示了JPEG和MPEG压缩图象数据的价值。当JPEG图象将要被打印时,需要进行诸如标度改变或取向改变的修正。另外,在再压缩之后至另一色空间的变换将使准备好打印的版本能够得到存储。采用本发明克服了舍入和修剪所传播的误差的问题。
音频编码数据也需要得到解压缩、与特殊声音效果混频、与其他音频数据合并、在实域中以较少的误差进行编辑和处理。当数据被存储在变换域中时,类似的实施也对其他工业、商业、和军事应用中采用数据变换和反向变换的数字处理所进行。
本发明还可被作为设备或计算机产品而提供。例如,它可以作为包括其中体现有使计算机实施本发明的方法的计算机可读取程序码装置的制造品,而得到实施。
还应该注意的是,虽然本发明的描述是对于具体的步骤设置而进行的,本发明的原理和概念也适用于和可应用于其他的情况。本领域的技术人员应该理解的是,在不脱离本发明的精神和范围的前提下,可以对所公布的实施例进行其他的修正。
Claims (57)
1.一种用于对代表一种现象的变换数据进行数字处理的方法,该方法包括:
将所述变换数据反向变换至实域,从而形成高精度数;以及
在对所述高精度数进行转换之前直接操作所述高精度数以产生一种效果。
2.根据权利要求1的方法,进一步包括
把所述高精度数转换成整数并把该整数修剪到允许范围,从而形成转换数据。
3.根据权利要求1的方法,其中该现象是一种图象。
4.根据权利要求1的方法,其中所述效果是两个数据组的彩色图象组合合并。
5.根据权利要求1的方法,其中所述效果是图象数据的颜色校正。
6.根据权利要求3的方法,其中所述效果是图象的90度转动。
7.根据权利要求1的方法,其中所述高精度数是浮点数。
8.根据权利要求1的方法,其中所述高精度数是包括分数部分的固定精度数。
9.根据权利要求1的方法,其中反向变换步骤采用离散余弦反向变换。
10.根据权利要求1的方法,其中反向变换步骤采用离散子波反向变换。
11.根据权利要求1的方法,其中反向变换步骤采用离散付立叶反向变换。
12.根据权利要求1的方法,其中变换数据包括频谱分析的信息。
13.根据权利要求2的方法,进一步包括提供所述转换数据以被一个输出装置所使用。
14.根据权利要求13的方法,其中该输出装置是一个显示监视器。
15.根据权利要求13的方法,其中输出装置是一个光栅显示监视器。
16.一种用于在实域中对代表一种现象的变换数据进行数字处理的方法,该方法包括:
将所述变换数据反向变换至实域,从而形成高精度数;以及
在对所述高精度数进行转换之前直接对所述高精度数进行正向变换。
17.根据权利要求16的方法,其中对所述正向变换的反向操作不同于所述反向变换。
18.根据权利要求17的方法,其中所述正向变换是离散余弦正向变换且所述反向变换是离散子波反向变换。
19.根据权利要求16的方法,进一步包括操作所述高精度数以产生一种效果。
20.一种用于对代表一种现象的变换编码数据进行数字处理的方法,该方法包括:
对所述变换编码数据进行逆量化,从而形成变换数据;
将所述变换数据反向变换至实域,从而形成高精度数;以及
在对所述高精度数进行转换之前直接对所述高精度数进行操作,以产生一种效果。
21.根据权利要求20的方法,进一步包括把所述高精度数转换成整数并把该整数修剪到一个允许范围,从而形成转换数据。
22.根据权利要求20的方法,其中所述变换编码数据是编码的音频数据。
23.根据权利要求20的方法,其中所述变换编码数据是编码的图象数据。
24.根据权利要求20的方法,其中所述变换数据是编码的视频数据。
25.根据权利要求23的方法,其中所述编码图象数据是按照JPEG静止图象国际标准格式的。
26.根据权利要求24的方法,其中所述编码视频是根据MPEG运动视频国际标准格式的。
27.根据权利要求20的方法,其中反向变换步骤采用了离散余弦反向变换。
28.根据权利要求20的方法,其中反向变换步骤采用了离散子波反向变换。
29.根据权利要求20的方法,其中反向变换步骤采用了离散付立叶反向变换。
30.根据权利要求20的方法,其中所述高精度数是浮点数。
31.根据权利要求20的方法,其中所述高精度数是包括分数部分的固定精确数。
32.一种用于对代表一种现象的变换编码数据进行数字处理的方法,该方法包括:
对变换编码数据进行逆量化,以形成变换数据;
对所述变换数据反向变换至实域,以形成高精度数;
在对所述高精度数进行转换之前直接对所述高精度数进行一种正向变换,以形成正向变换数据;以及
对所述正向变换的数据进行量化以形成量化数据。
33.根据权利要求32的方法,进一步包括对所述高精度数进行操作以产生一种效果。
34.根据权利要求33的方法,进一步包括把所述高精度数转换成整数并修剪到一个允许范围以形成转换数据。
35.根据权利要求33的方法,进一步包括把操作步骤与进行正向变换、进行量化、进行逆量化、以及进行反向变换的步骤交替进行所希望的次数。
36.根据权利要求35的方法,其中所述变换编码数据是压缩数据,且进行正向变换、进行量化、进行逆量化、以及进行反向变换的步骤实施了压缩/解压缩循环。
37.根据权利要求33的方法,其中所述变换编码数据是编码的音频数据。
38.根据权利要求33的方法,其中所述变换编码数据是编码电磁环境数据。
39.根据权利要求33的方法,其中所述变换数据是编码的视频数据。
40.根据权利要求33的方法,其中该现象是以JPEG标准格式编码的图象数据,该方法进一步包括:
采用无损失熵译码对量化的变换系数进行译码;以及
采用无损失熵编码对量化的数据进行编码,以形成按照JPEG标准的数据压缩格式的编码数据。
41.一种用于在代表现象的实域中对第一级的变换编码数据进行数字处理的系统,该系统包括:
第一逆量化器,用于从所述变换编码数据产生变换数据;
第一反向变换器,用于产生所述变换数据至实域的一种反向变换,从而形成高精度数;
第一正向变换器,用于在对所述高精度数进行转换之前直接对所述高精度数进行正向变换,从而形成正向变换数据;以及
第一量化器,用于量化所述正向变换数据以形成量化数据。
42.根据权利要求41的系统,其中正向变换器采用了与反向变换器采用的第一种变换类型不同的类型的变换。
43.根据权利要求41的系统,其中所述正向变换器产生正离散余弦变换且所述反向变换器产生离散子波反向变换。
44.根据权利要求41的系统,进一步包括:
用于对高精度数进行操作以产生一种效果的操作器。
45.根据权利要求41的系统,其中所述逆量化器和所述量化器采用了相同的量化值。
46.根据权利要求44的系统,其中只有量化变换数据的一个子集产生不同的变换编码数据。
47.根据权利要求41的系统,其中所述逆量化器和所述量化器采用了至少一个不同的量化值。
48.根据权利要求41的系统,进一步包括:
无损失熵译码器,用于形成变换编码数据;以及
无损失熵编码器,用于对量化数据进行编码。
49.根据权利要求44的系统,其中量化数据形成了其他级的变换编码数据并进一步包括:
另一逆量化器、另一反向变换器、另一操作器、另一正向变换器、以及另一量化器以一起在变换编码数据的该另一级上执行与第一级的变换编码数据上所进行的同样的功能。
50.根据权利要求49的系统,其中第一操作器所产生的效果与另一操作器产生的效果是不同类型的。
51.根据权利要求49的系统,其中第一逆量化器、第一反向变换器、第一正向变换器、以及第一量化器的功能和所述另一逆量化器、另一反向变换器、另一正向变换器、以及另一量化器的相应功能均分别由同一相应模块进行。
52.一种用于对代表现象的变换数据进行数字处理的系统,该系统包括:
反向变换器,用于将该变换数据反向变换到使用高精度数的实域;以及
操作器,用于在对所述高精度数进行转换之前直接对该高精度数进行操作以产生一种效果。
53.根据权利要求52的系统,进一步包括用于把所述高精度数转换成整数的转换器以及用于把整数修剪到一个允许范围的修剪器。
54.一种用于对代表一种现象的变换编码数据进行数字处理的系统,该系统包括:
逆量化器,用于对所述变换编码数据进行逆量化以形成变换数据;
反向变换器,用于对所述变换数据进行至实域的反向变换,以形成高精度数;以及
操作器,用于在对所述高精度数进行转换之前直接操作高精度数以产生一种效果。
55.根据权利要求54的系统,进一步包括用于把所述高精度数转换成整数的转换器和用于把该整数修剪到一个允许范围的修剪器。
56.一种用于在实域中对代表一种现象的变换数据进行数字处理的系统,该系统包括:
反向变换器,用于将变换数据反向变换至实域,以形成高精度数;以及
正向变换器,用于在对所述高精度数进行转换之前直接对高精度数进行正向变换。
57.根据权利要求56的一种系统,进一步包括:
操作器,用于操作高精度数以产生一种效果。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/186,247 | 1998-11-04 | ||
US09/186,247 US7194138B1 (en) | 1998-11-04 | 1998-11-04 | Reduced-error processing of transformed digital data |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1253339A CN1253339A (zh) | 2000-05-17 |
CN100339852C true CN100339852C (zh) | 2007-09-26 |
Family
ID=22684203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB991234251A Expired - Fee Related CN100339852C (zh) | 1998-11-04 | 1999-11-03 | 数据处理方法和系统 |
Country Status (7)
Country | Link |
---|---|
US (2) | US7194138B1 (zh) |
JP (1) | JP3701824B2 (zh) |
KR (1) | KR100357658B1 (zh) |
CN (1) | CN100339852C (zh) |
GB (1) | GB2344716B (zh) |
MY (1) | MY130637A (zh) |
SG (1) | SG104256A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6909812B1 (en) * | 2000-07-13 | 2005-06-21 | Lucent Technologies Inc. | Methods and apparatus for nearly lossless-concatenated block transform coding |
US6961473B1 (en) * | 2000-10-23 | 2005-11-01 | International Business Machines Corporation | Faster transforms using early aborts and precision refinements |
KR100465156B1 (ko) * | 2001-08-31 | 2005-01-13 | (주)씨앤에스 테크놀로지 | 분산산술처리방식의 dct/idct 연산기에 있어서연산오차 및 연산시간 감소방법 |
US6882685B2 (en) * | 2001-09-18 | 2005-04-19 | Microsoft Corporation | Block transform and quantization for image and video coding |
US8000394B2 (en) * | 2004-03-08 | 2011-08-16 | Mitsubishi Denki Kabushiki Kaisha | Program, method, and apparatus for decoding coded data |
US7489826B2 (en) * | 2004-10-07 | 2009-02-10 | Infoprint Solutions Company, Llc | Compensating for errors in performance sensitive transformations |
US7689052B2 (en) * | 2005-10-07 | 2010-03-30 | Microsoft Corporation | Multimedia signal processing using fixed-point approximations of linear transforms |
US8942289B2 (en) * | 2007-02-21 | 2015-01-27 | Microsoft Corporation | Computational complexity and precision control in transform-based digital media codec |
EP2081387A4 (en) * | 2007-03-28 | 2011-08-31 | Panasonic Corp | DEQUANTIZATION CIRCUIT, DEBURRENT PROCESSING AND IMAGE PLAYING DEVICE |
EP2222086A1 (de) * | 2009-02-18 | 2010-08-25 | EcoDisc Technology AG | Verfahren und Vorrichtung zur Vermeidung von Rundungsfehlern nach Durchführung einer inversen diskreten orthogonalen Transformation |
US10447474B2 (en) * | 2009-04-20 | 2019-10-15 | Pure Storage, Inc. | Dispersed data storage system data decoding and decryption |
US9736500B2 (en) * | 2009-07-06 | 2017-08-15 | Thomson Licensing | Methods and apparatus for spatially varying residue coding |
US20120230395A1 (en) * | 2011-03-11 | 2012-09-13 | Louis Joseph Kerofsky | Video decoder with reduced dynamic range transform with quantization matricies |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2318472A (en) * | 1996-10-09 | 1998-04-22 | Sony Uk Ltd | Generating inter-frame encoded video signals |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02227770A (ja) | 1989-02-28 | 1990-09-10 | Nec Corp | 直交変換器 |
US5719964A (en) * | 1990-07-27 | 1998-02-17 | International Business Machines Corporation | Array processing with fused multiply/add instruction |
EP0533195A2 (en) * | 1991-09-20 | 1993-03-24 | Sony Corporation | Picture signal encoding and/or decoding apparatus |
US5379122A (en) * | 1992-10-02 | 1995-01-03 | Xerox Corporation | Decompression of standard ADCT-compressed images |
NL9301358A (nl) * | 1993-08-04 | 1995-03-01 | Nederland Ptt | Transcodeerinrichting. |
US5495292A (en) * | 1993-09-03 | 1996-02-27 | Gte Laboratories Incorporated | Inter-frame wavelet transform coder for color video compression |
JP3252567B2 (ja) | 1993-10-22 | 2002-02-04 | ソニー株式会社 | 高能率符号化復号化装置 |
US5675666A (en) | 1995-03-02 | 1997-10-07 | Sony Corportion | Image data compression method and apparatus with pre-processing to compensate for the blocky effect |
JP2914226B2 (ja) * | 1995-06-16 | 1999-06-28 | 日本電気株式会社 | 可逆変換を可能にするディジタル信号の変換符号化方式 |
US6256349B1 (en) * | 1995-12-28 | 2001-07-03 | Sony Corporation | Picture signal encoding method and apparatus, picture signal transmitting method, picture signal decoding method and apparatus and recording medium |
GB2318475B (en) * | 1996-10-21 | 2000-08-23 | B & W Loudspeakers | Enclosures for loudspeaker drive units |
US6009192A (en) | 1996-12-19 | 1999-12-28 | Xerox Corporation | Color correction of a compressed image |
KR100436649B1 (ko) | 1996-12-20 | 2004-09-08 | 소니 일렉트로닉스 인코포레이티드 | 초당24프레임필름으로부터취해진비디오프로그램재료의상태를변화시키기위한방법및장치 |
US6178205B1 (en) * | 1997-12-12 | 2001-01-23 | Vtel Corporation | Video postfiltering with motion-compensated temporal filtering and/or spatial-adaptive filtering |
US6151361A (en) * | 1997-12-29 | 2000-11-21 | Thomson Licensing S.A. | System and method for reducing multipass signal degradation |
US6134350A (en) * | 1998-02-18 | 2000-10-17 | Dome Imaging Systems, Inc. | Method of producing wavelets and compressing digital images and of restoring the digital images |
US6256422B1 (en) * | 1998-11-04 | 2001-07-03 | International Business Machines Corporation | Transform-domain correction of real-domain errors |
US6243728B1 (en) * | 1999-07-12 | 2001-06-05 | Sony Corporation Of Japan | Partitioned shift right logic circuit having rounding support |
-
1998
- 1998-11-04 US US09/186,247 patent/US7194138B1/en not_active Expired - Fee Related
-
1999
- 1999-10-13 KR KR1019990044264A patent/KR100357658B1/ko not_active IP Right Cessation
- 1999-10-18 GB GB9924446A patent/GB2344716B/en not_active Expired - Lifetime
- 1999-11-01 JP JP31075199A patent/JP3701824B2/ja not_active Expired - Fee Related
- 1999-11-01 SG SG9905410A patent/SG104256A1/en unknown
- 1999-11-02 MY MYPI99004737A patent/MY130637A/en unknown
- 1999-11-03 CN CNB991234251A patent/CN100339852C/zh not_active Expired - Fee Related
-
2007
- 2007-03-08 US US11/683,494 patent/US7724976B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2318472A (en) * | 1996-10-09 | 1998-04-22 | Sony Uk Ltd | Generating inter-frame encoded video signals |
Also Published As
Publication number | Publication date |
---|---|
US20070160146A1 (en) | 2007-07-12 |
GB2344716B (en) | 2003-07-30 |
US7724976B2 (en) | 2010-05-25 |
KR100357658B1 (ko) | 2002-10-25 |
GB2344716A (en) | 2000-06-14 |
JP2000151415A (ja) | 2000-05-30 |
JP3701824B2 (ja) | 2005-10-05 |
KR20000034993A (ko) | 2000-06-26 |
MY130637A (en) | 2007-07-31 |
SG104256A1 (en) | 2004-06-21 |
CN1253339A (zh) | 2000-05-17 |
US7194138B1 (en) | 2007-03-20 |
GB9924446D0 (en) | 1999-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1159660C (zh) | 对变换数据进行数字处理的方法和系统 | |
CN1176433C (zh) | 变换数据的方法和系统 | |
US7724976B2 (en) | Reduced error processing of transformed digital data | |
KR100880039B1 (ko) | 웨이블릿 기반 이미지 코덱에서의 부호화 이득을 달성하는방법 및 시스템 | |
US7499592B2 (en) | Image decoding apparatus and its control method | |
CN1640141A (zh) | 用于复合文档压缩的编码器匹配层的分离和插值 | |
US20090297054A1 (en) | Reducing dc leakage in hd photo transform | |
US20050276500A1 (en) | Image encoding apparatus, and image processing apparatus and its control method | |
CN1547708A (zh) | 以无损方式对数字图像和音频数据解码的系统和方法 | |
JP2005525006A (ja) | 複数スキャンを使用する変換係数圧縮 | |
CN1181679C (zh) | 图象解码装置和方法以及图象重放装置 | |
US7577302B2 (en) | Compressed image data enhancement | |
JPH0951504A (ja) | 画像符号化装置及び画像復号化装置 | |
EP1629675B1 (en) | Fixed bit rate, intraframe compression and decompression of video | |
EP1892965A2 (en) | Fixed bit rate, intraframe compression and decompression of video | |
JPH0575875A (ja) | 画像符号化装置 | |
JP4255071B2 (ja) | 注目画素値選択型符号化装置および復号装置 | |
JPH0690358A (ja) | データフィールド画像圧縮方法 | |
JP2006060657A (ja) | 画像データ圧縮装置及び画像データ圧縮方法 | |
JP2003009153A (ja) | 画像符号化装置及びその方法並びにプログラムコード、記憶媒体 | |
JP2002300593A (ja) | ディジタル信号変換方法およびその装置 | |
JP2007214680A (ja) | データ固定長化方法 | |
JPH11289534A (ja) | 画像データ処理装置 | |
JPH10112870A (ja) | 画像符号化装置 | |
JPH11150651A (ja) | 画像処理装置及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070926 Termination date: 20181103 |