CN100336079C - 在对jpeg图像进行代码转换时增强压缩 - Google Patents

在对jpeg图像进行代码转换时增强压缩 Download PDF

Info

Publication number
CN100336079C
CN100336079C CNB038212927A CN03821292A CN100336079C CN 100336079 C CN100336079 C CN 100336079C CN B038212927 A CNB038212927 A CN B038212927A CN 03821292 A CN03821292 A CN 03821292A CN 100336079 C CN100336079 C CN 100336079C
Authority
CN
China
Prior art keywords
quantization
data
transform coefficient
change
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB038212927A
Other languages
English (en)
Other versions
CN1692375A (zh
Inventor
琼·密特切尔
拉沃尔·普拉卡施
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1692375A publication Critical patent/CN1692375A/zh
Application granted granted Critical
Publication of CN100336079C publication Critical patent/CN100336079C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation

Abstract

通过在变换域中进行代码转换的期间执行进一步的压缩而不将图像数据恢复到其原始图像数据形式,以减少的时间执行允许在延长的时间内将数据经济地存储在高速访问存储器中的进一步数据压缩。通过在对熵解码量化变换数据的范围减小期间利用大量的零值量化变换系数并且不改变非零系数稀少的之字形扫描位置上的量化变换系数,实现处理时间的减少。通过计算或估计与进一步压缩的量化值一起存储的变更量化表,可以恢复范围。其他的优点得自于在代码转换期间对数据使用JPEG封装格式。

Description

在对JPEG图像进行代码转换时增强压缩
技术领域
本发明一般涉及施加校正以提高图像质量时的图像数据压缩,特别涉及为了附加或更极端的数据压缩而进行的文档解码和重新编码,以允许在经济上可接受的快速访问存储器中的长期存储,并且以减少的处理时间执行这种解码和重新编码。
背景技术
画面和图形图像包括极其大量的数据,并且如果其被数字化以允许通过数字数据处理器进行传输或处理,则以良好的保真度表示画面或图形图像的各个像素通常需要数以百万计的字节。图像压缩的目的是用较少数据表示图像,以便节约存储成本或传输时间和成本。最有效的压缩是通过近似原始图像来完成的,而不是完全地再现它。1993年由VanNostrand Reinhold出版的由Pennebaker和Mitchell在“JPEG StillImage Data Compression Standard”中详细讨论的JPEG(联合图像专家组)标准允许在不同应用之间交换图像,并且开创了在多媒体应用中提供数字连续-色调彩色图像的能力,这里将该文献的全文引作参考。
JPEG主要涉及具有二维空间、包含灰度或色彩信息且不具有时间相关性的图像,这有别于MPEG(运动图像专家组)标准。JEPG压缩能够将存储要求降低多个数量级,并且改善过程中的系统响应时间。JPEG标准的主要目标是针对给定的数据量和/或可用的传输或处理时间提供最大的图像保真度,并且允许任意程度的数据压缩。通常的情况是,系数为二十或更大的数据压缩(以及同等系数的传输时间和存储大小减少)不会产生可为一般观看者觉察到的不自然或图像恶化。
当然,对于具有特定已知特征的特定种类的图像或图形,其他数据压缩技术是可能的并且可能产生更大程度的图像压缩。JPEG标准已被完全一般化,以基本上相同地执行而与图像内容无关,并且适应各种数据压缩要求。因此,采用若干版本中的一个或多个的JPEG标准的编码器和解码器已经得到相对广泛的使用,并且允许为各种目的而对图像进行广泛的访问。标准化还允许减小成本,尤其是解码器的成本,以允许高质量图像访问广泛地可用。因此,利用JPEG标准通常优于其他数据压缩技术,特别是对于特定和明确种类的图像,即使由此获得的效率增加只是少量的,也是如此。
特别是使用根据JPEG标准的技术,即使这样的数据量大幅减小是可能的,一些应用也需要在图像质量和数据存储或传输时间的成本之间进行严格的折衷。例如,可能需要将图像存储一段时间,其中该段时间占据存储介质或设备的使用寿命的大部分,同时又要求其存储容量的大部分。因此,尽管事实上图像数据可能被覆写任意次数,但在给定时间段内存储图像的成本仍可被认为是存储介质或设备以及支持数据处理器安装的成本的一部分。当然,该存储的成本以必须存储的图像数为倍数。
考虑图像质量与存储成本之间的折衷的另一方法是确定可接受的最大存储成本,然后针对给定的质量确定所需数目的图像可以在可用存储器中保存多久。这是图像压缩大小的函数,它通常与图像的复杂度直接相关,并且与所需的重构图像质量成反比。
这种要求高的应用的例子是如果不被归档则必须长期存储的法律文档的存储,尤其是可流通票据,例如每日所产生的数以千万计的大量个人支票。虽然个人支票的最初结算和资金转帐目前使用自动设备来执行,并且通过使用印刷在支票上的可机读标记而变得便利,但是错误仍然可能存在,并且可能有必要为特定交易提供证明,以便在支票形成其一部分的该交易过后很久来纠正错误。
特别地,个人支票存在一些图像数据压缩复杂度。例如,为防止欺诈性交易,不变地提供具有或多或少复杂度并且具有一定范围图像值的背景图案。将采用可能是多种颜色的高对比度油墨来印刷一些信息,而以相对低的对比度包括其他安全信息。可能包括大范围图像值的装饰。另外,将以不容易预知的图像值来提供手写或印刷标记(例如,支票金额和签名)。
即使非常简单的文档也可能包括各种图像值,如信头的颜色和底纹,高对比度印刷,纸上的水印以及多个签名。当需要准确的图像重构时,可能包含在文档中的这一范围的图像值可以限制图像数据可被压缩的程度。因此,在不考虑维护存储的需要和在更长的时间内进行快速电子访问的可能性的情况下,以有可能以高保真度将图像重构到原始文档的形式进行存储的成本是相当高的,并且该成本限制了该存储在经济上可行的时间。
因为这些图像值必须是可准确再现的,并且利用JPEG标准是理想的以便适应广泛的访问和系统互兼容性,所以,与以良好的图像保真度再现一致的用于进一步减小数据量的基本上唯一的技术是减小原始图像的空间采样频率。然而,尤其是在低对比度的情况下,采样不可避免地降低了小标记的可辨认性。目前,每英寸100点(dpi)或每英寸100像素的采样(从目前常用的300dpi或600dpi打印机分辨率大约减至1/3到1/6)被认为是个人支票上的低对比度标记的足够可辨认性的限度。美国国家标准协会(ANSI)图像交换标准委员会推荐100dpi作为最小分辨率。当以每像素多个比特压缩图像时,大多数支票应用使用100dpi或120dpi灰度图像。
实际上,在这样的应用中图像数据的所需质量还随时间改变。例如,在文档或其处理的日期的数月内,经常出现真实性问题,从而需要足以例如鉴别签名的图像质量,而在相距甚远的以后日期,可能只需图像质量足以确认关于文档内容的基本信息。因此,特别是与存储成本相比,当降低的图像质量变得更可容忍时,可以为更长期的存储而进一步压缩图像数据。目前,个人支票图像为商业使用立即存储在DASD上大约90天,并且为归档的目的转移到磁带上,并且为法律的原因保存7年。因此,数据在“在线”的快速访问存储装置中仅在几个月内是可用的,并且转移到磁带上需要一些重要的处理时间。
在这一点上,逐日产生的个人支票和其他文档的数量本身存在若干问题。对图像进行编码和/或解码所需的处理是大量的,并且即使在通用或专用处理器上以极高的速度执行,也可能需要大量的时间。即使可以在一秒的一小部分(例如,1/10秒或更少)内执行编码或解码处理,绝对数量的文档也可能持续占用大量处理器的全部处理容量。如上所述,当降低的图像质量随着时间的过去而变得愈加可容忍时,为了降低存储成本,需要甚至更多的处理。也就是,为了从已经被压缩的数据增强图像压缩,如上面包括的发明申请序列号09/760,383所述,需要首先从压缩数据对图像进行解码,然后使用不同的量化表对图像进行再次编码,以便进一步减少数据量。该处理时间也表示巨大的成本,其在降低的所占存储介质量的成本上有效地增大存储成本。相反,如果用于进一步数据减少的处理的成本能够降低,则可以以在经济上可接受的成本将数据存储更长的时间并且/或者存储在具有更短访问或检索时间的存储器中。
公布日期为2001年7月10日、作者为Ravi Prakash和Joan L.Mitchell、名称为“enhanced JPEG compression of documents”的已公布文献描述了一种预处理图像以减小其动态范围的方法。由于它在JPEG数据流中使用修改的量化表选择性地丢弃一些噪声,因此这增强了JPEG压缩。
发明内容
因此,本发明的目的是提供一种能够增大压缩数据的压缩程度并且在减少的处理时间内减少图像数据量的图像数据处理方法和装置。
为了实现本发明的这些和其他目的,提供了一种用于对压缩数据进行代码转换以便进一步压缩的方法和装置,其包括以下步骤(或用于执行步骤的部件):对压缩数据进行熵解码以形成量化变换系数值,减小量化变换系数值的范围以形成减小范围的量化变换系数值,更改量化表中的至少一个值以形成更改的量化表,对所述减小范围的量化变换系数值进行熵编码,以形成进一步压缩的数据,以及与更改的量化表一起传输或存储进一步压缩的数据。
从第一方面来看,本发明提供一种用于对压缩数据进行代码转换以便进一步压缩的方法,其包括以下步骤:对所述压缩数据进行熵解码以形成量化变换系数值;减小所述量化变换系数值的范围以形成减小范围的量化变换系数值;更改量化表中的至少一个值以形成更改的量化表;对所述减小范围的量化变换系数值进行熵编码,以形成进一步压缩的数据;以及与所述更改的量化表一起传输或存储所述进一步压缩的数据。
最好,本发明提供一种方法,其中所述减小范围的步骤以系数2减小所述范围。最好,本发明提供一种方法,其中所述更改的量化值在原始数据样本中的8比特精度的1到255的范围内。
最好,本发明提供一种方法,其中所述更改的量化值在原始数据样本中的8比特精度的1到255的范围内。
最好,本发明提供一种方法,其还包括以下步骤:根据量化系数的变更来更改霍夫曼(Huffman)表,而不收集图像的新统计信息。
最好,本发明提供一种方法,其中从原始霍夫曼表数据来估计所述出现频率。
最好,本发明提供一种方法,其中从所述量化变换系数值的直方图来确定所述出现频率。
最好,本发明提供一种方法,其中所述熵编码步骤包括算术编码。
最好,本发明提供一种方法,其中所述量化变换系数值采用封装(packed)格式。
最好,本发明提供一种方法,其中更改所述量化表中的所述至少一个值的步骤与减小所述至少一个值的范围的所述步骤互补。
最好,本发明提供一种方法,其还包括以下步骤:根据量化系数的变更来更改霍夫曼表,而不收集图像的新统计信息。
最好,本发明提供一种方法,其中从原始霍夫曼表数据来估计所述出现频率。
最好,本发明提供一种方法,其中从所述量化变换系数值的直方图来确定所述出现频率。
最好,本发明提供一种方法,其中所述熵编码步骤还包括算术编码。
最好,本发明提供一种方法,其中所述变换系数值采用封装格式。
最好,本发明提供一种方法,其还包括以下步骤:根据之字形扫描位置上非零量化变换系数的出现频率,阻止变更所述之字形扫描位置上的量化变换系数,并且阻止变更所述之字形扫描位置上的所述量化表中的量化值。
最好,本发明提供一种方法,其还包括以下步骤:根据之字形扫描位置上非零量化变换系数的出现频率,阻止变更所述之字形扫描位置上的量化变换系数,并且阻止变更所述之字形扫描位置上的所述量化表中的量化值。
从第二方面来看,本发明提供一种用于对压缩数据进行代码转换以便进一步压缩的装置,其包括以下部件:用于对所述压缩数据进行熵解码以形成量化变换系数值的部件;用于减小所述量化变换系数值的范围以形成减小范围的量化变换系数值的部件;用于更改量化表中的至少一个值以形成更改的量化表的部件;用于对所述减小范围的量化变换系数值进行熵编码以形成进一步压缩的数据的部件;以及用于与所述更改的量化表一起传输或存储所述进一步压缩的数据的部件。
从第三方面来看,本发明提供一种计算机程序产品,其直接可装载到数字计算机的内部存储器中,包括用于当在计算机上运行所述产品时执行从而实现如上所述的本发明的软件代码部分。
附图说明
现在将参照附图仅作为示例对本发明的实施例进行描述,其中:
图1是示出增大压缩图像数据的压缩程度的示例性技术的流程图或高级方框图;以及
图2是示出根据本发明的处理压缩图像数据以在减少的处理时间内增大压缩程度的流程图或高级方框图。
具体实施方式
现在参照附图,并且特别是图1,其中示出了增大压缩图像数据的压缩程度的示例性技术的流程图或高级方框图。图1主要涉及这样一种装置和方法,其用于产生对文档图像数据的增大压缩以大幅减少其数据量,同时保持可辨认性和文档图像质量以及与标准解码处理的兼容性而无需后处理(如美国专利06606418的图7所示)。该功能是通过如下方式实现的:减小图像数据的动态范围,使用第一量化表对减小动态范围的数据进行编码,并且与不同的量化表一起存储或传输编码图像数据,其中该量化表在另外的传统解码期间恢复原始图像数据的动态范围。具体地说,该图示出将该技术应用于已经通过根据JPEG标准进行编码而压缩的图像数据。因此,图1中的任何部分都不被认为是关于本发明的现有技术,而是被标注为“相关技术”,因为提供它是为了帮助理解如图2所示并在下面讨论的本发明及其有益效果,不过这里没有反映本发明的区别特征。
更具体地说,文档图像中存在的图像值允许图像值的动态范围的减小,其可在以后被恢复同时保持细节和可辨认性。动态范围的这种减小,虽然理论上导致信息和图像保真度的一些损失,但是允许图像数据的进一步压缩,其超过当前为短期、高速访问存储装置采用的图像数据压缩,并且允许以其范围通常为2到5或更大的系数来减少数据量,同时将图像质量保持在可辨认的级别。如上面包括的申请所述,甚至还可以增强低对比度特征的可辨认性。
如果不考虑处理成本,数据量的这种减少将以类似的系数来降低存储成本。然而,如上面提到的那样,已经发现,期望存储大量文档如个人支票,并且处理已经采取压缩的形式存储在数据库中的大量文档以便降低将来的存储成本或提供更高速可访问性的成本将是相当高的。
通过考虑图1,能够更容易地理解该成本,其中该图示出用于从单个文档的数字存储数据进一步减少数据量的过程。首先,检索图像710,并且如果该图像采用任何压缩技术包括无损编码被压缩过720,而不是作为原始数据来存储的,则通过适当的解码器对其进行解压缩/解码730,以恢复原始图像数据。在上面包括的申请中讨论的可选直方图和预处理未在图1中示出,但是如果需要可以被包括。在块740中,减小图像范围,如果在750确定减小范围的图像数据要被压缩(可能采用不同的压缩技术),则对其进行编码760。然后,与范围扩展信息一起存储减小范围的图像(经过或未经压缩)770。对于基于JPEG DCT的压缩,该范围扩展信息可以是替换的、经过比例放缩(scaled)的Q表2的形式。对于其他应用,其可以是JPEG-LS输出再映射表的形式。
本领域的技术人员可以容易地理解,解码图像处理730包括熵解码、反量化和反离散余弦变换(IDCT)处理。熵解码是能够相对快速执行的处理。(熵编码利用这样的事实,即较常见的值以较少的比特表达是合适的,而表示相对较多信息的较不常见值以相对较多的比特表达是合适的。)另一方面,反量化和IDCT处理在计算上是相当密集的。减小图像范围的处理740可利用查询表来执行,从而对于每个图像数据样本需要两次存储器访问和一次存储操作。对图像进行编码的处理760需要在计算上密集的正向离散余弦变换(DCT)操作、量化和熵编码。
本领域的技术人员还可以容易地理解和清楚,图1的上面过程完全且充分地重构图像数据以便显示或其他表现(例如,打印),而处理740-770相同于根据上面包括的申请对原始图像数据执行的处理,以便实现超过标准JPEG处理的增大程度的压缩,同时保持文档图像特征的细节和可辨认性。因此,数据可被描述为从变换域转换到图像域(有时称作真实和/或像素域),并且转换回到变换域。因此,所涉及的过程实质上是彼此互逆的处理,其中的任一个或两者在计算上都可能是密集的,并且当大量的文档集中在一起时需要相当多的处理时间。
当数据保持在变换域中时,本发明提供相同的结果,因此避免了执行若干对实质上互逆且互补的处理,同时如下所述产生数据的一些附加压缩。由于数据没有返回到其原始形式,因此该过程被很好地描述为代码转换。现在将根据图2的流程图说明本发明的基本过程,该图还可以被理解成这样一种装置的高级方框图,其中该装置用于在通过程序配置成用于执行所示功能的设备的编程通用计算机或者类似配置的专用逻辑处理电路中执行所示的功能,这一点对于本领域的技术人员将是清楚的。
为便于下面讨论起见,假定已经以某种压缩形式如遵循JPEG标准的代码对图像数据进行了编码。需要理解的是,本发明完全适用于任何其他压缩编码方案,并且上面的假定仅仅避免原始数据不是压缩形式的情况(例如,原始图像数据),在上面包括的申请中对该情况提供了适合且优选的方法和装置。
作为本发明的过程和装置的概述,一旦检索出压缩图像数据(210),就对该压缩数据进行熵解码220,以便将数据恢复成量化系数的格式。然后,优选地采用下面将要详述的简化过程,如240所示可以直接减小量化系数的动态范围,并且执行熵编码260。然后,通过如270所示与扩展信息一起存储(或者传输)所得到的熵编码数据,完成进一步的压缩。该扩展信息可以与范围的减小互补或者可以为提供一些图像增强而选择。
如上面提到的那样,通过避免互逆且互补的操作对,一般可以在图1的完全图像解码处理730所需的处理时间的1/4内执行熵解码处理230。类似地,一般可以在完全图像编码处理所需的时间的少于1/4内完成熵编码处理而不考虑所采用的压缩技术或标准。一般而言,特别是通过下面讨论的优选技术,与减小图像数据的动态范围相比,可以更快速地执行减小量化系统范围的处理。因此,本发明提供的处理速度的增益系数至少为4,并且在甚至考虑使用专用处理器来执行DCT和IDCT以及量化和反量化处理的情况下,通常能够大得多。
熵解码和编码过程是公知的,并且无需作进一步的讨论,不过需要注意的是,对于熵编码,统计分析经常地可被省略,或者以对原始压缩数据的熵编码的相对简单的操纵或JPEG标准所允许的对熵编码的可选方案来替代。减小量化系数的范围的处理240可以使用查询表(LUT)来完成,这意味着对于被处理的每个量化系数存在两次存储器访问和一次存储操作,或者需要如图1的对应操作740对每个图像样本所做的那样来减小范围。然而,图1的图像数据的样本数目总是每宏块64个,而相同宏块(在块结束(EOB)标记/符号之前)的量化系数(根据编码约定包括一些零值系数)数目经常远远小于64,并且经常远远小于16。此外,由于只能减小非零量化系数,因此实际的量化系数数目经常甚至更少。而且,当之字形扫描位置(即变换块中的位置)上非零系数的稀少不值得(justify)额外的计算和可能的边沿恶化时,一些系数可以保持不变,在这种情况下,对应于其位置的量化值在范围恢复数据中也必须保持不变。因此,实际上,减小量化系数范围的处理时间经常比减小图像样本的动态范围所需的时间的1/4还少得多。
此外,如果范围减小对于减小了其范围的所有量化系数都是不变的,则只需一个LUT。甚至更简单和迅速的方案也经常提供良好的结果。例如,以2的系数减小范围在一些情况下是优选的,这消除了任何LUT的需要,并且范围减小可通过简单的幅度偏移来实现。
该简单范围减小实施例的特殊例子是,如在上面包括的美国专利申请序列号09/736,444和/或序列号09/896,110中所公开的那样,采用封装格式来维护或提供数据,其中以2的幂减小范围包括从前一RS字节中的大小减去2的幂数。如果在范围减小中该RS字节中的大小值小于2的幂,则该系数已被减至零,并且必须扩展该运行趟(run)中的系数数目,从而若有的话,在其任一侧合并新的零系数与零的运行趟。然而,采用新封装格式的减小范围数据中的字节总数将保持相同,或者更经常地减少,并且采用JPEG封装格式不可能需要更大数目的比特或字节。因此,虽然使用JPEG封装格式可能需要少量的相对简单的附加处理,但是可以采用减小范围的数据覆写相同的缓冲区。然后,对减小范围的数据进行重新熵编码,以获得大幅增大的压缩。在这一点上需要注意的是,缓冲区保存每系数需要至少两字节非零的未压缩量化系数,而霍夫曼代码可以只需几个比特。
一般而言,对于最大数据压缩,可以使用JPEG算术编码选项来自动提供接近于熵极限的重新熵编码数据;因此改善了压缩,同时避免了任何图像恶化,并且避免了用于收集定制霍夫曼熵编码的统计信息的一些处理时间。然后,需要时可以在以后将数据转换成基线JPEG。
此外关于JPEG封装格式,在上面包括的申请中公开了通过其帮助特定处理。具体地说,JPEG封装格式允许简化为减小范围的编码器生成定制霍夫曼表。定制霍夫曼表可以与经过算术编码的图像一起保存,以便在以后转换回到基线JPEG压缩。这些定义霍夫曼表(DHT)标记可以与采用“针对表简化的JPEG规范(JPEG-abbreviated-for-table-specification)”数据格式的JPEG图像编码数据分开存储,以便如果算术编码版本足够,则不传输这些额外的字节。(注意,如果不需要霍夫曼版本,则将不需要DHT标记。如果需要转换回到霍夫曼,则使用DHT标记,因为接收器的解码器不知道如何对进一步压缩的算术编码版本进行解码。)可选地,如上面包括的Pennebaker等人的出版物所详述,未用的定制霍夫曼表可以保存在JPEG应用标记(APPn标记)中。可以登记该标记的字段以允许解释数据。该标记可以与图像数据嵌入在一起,或者保持独立。
如果注意范围减小处理,可以从范围减小之前的表估计近似的定制霍夫曼表。例如,可以从所施加的范围减小量估计概率分布的偏移。如果解码器中的霍夫曼表不是采用JPEG标准提供的示例性霍夫曼表,则特别是在RS符号值没有数字顺序的情况下,可以假定它是定制表。如果假定某分布对应于每码字长度的符号数,则在给定动态范围减小量的情况下可以计算新的分布。如果给定R/S符号的代码为N比特,则该组内的所有相对部分之和总计为1/2N。相对频率可以在该类别内的所有2N个级别之间平分。可选地,可以对其进行调整,使得更小的级别是更可能的。只要总相对频率匹配原始类别的相对频率,则将相同的霍夫曼代码长度分配给不变数据。然后,动态范围减小将这些级别聚集在一起。然后,对于未减至零的级别,可以组合这些群集,以收集这些类别的相对频率。保守性估计将忽略运行趟变长的影响。注意,由于不能创建任何新的非零系数,因此运行趟不会变短。较早出现的块结束(EOB)的影响的估计可以通过观察对于期望的范围减小典型的图像如何改变其统计信息来以经验方式确定。必须注意,允许所组合的所有可能零运行趟的大小高达最大可能值,因为先前定制表可具有未用符号的间隙,并且除非收集实际的直方图,否则不允许这些间隙。只要满足该条件,该方法允许从一个定制霍夫曼表立即转换到另一个定制霍夫曼表而不必收集新的直方图;帮助保持本发明在其他方面实现的处理时间减小的增益。
上面已经提到,当额外的压缩不值得其计算和可能的边沿恶化时,无需改变一些量化系数,或者禁止修改。关于是否应当修改特定之字形扫描次序位置中的量化变换系数的判定可以基于每个之字形扫描位置上非零变换系数数目的可选直方图来进行,或者例如从原始数据中的定制霍夫曼表来估计。对于具有频繁出现的非零量化变换系数的那些之字形扫描位置,将获得最大的压缩增益。对于非零量化变换系数出现很少的位置,压缩增益将不值得其计算时间或者即使非常轻微的图像质量恶化。然而,所获得或估计的非零量化变换系数数目的统计信息可以提供对压缩增益和存储节省的估计,因此帮助识别量化系数不应被改变的之字形扫描位置。例如,在支票的背面,背书将不总是具有高对比度,而防伪图案在高/大得多的数目上很有可能具有相差非常大的统计信息。如果将不修改具有相对不频繁出现的非零量化系数的之字形扫描位置上的量化变换系数的基本原理应用于这种情况,则背书的图像值将很有可能不被修改那么多,并且可以导致保持背书的可辨认性和细节。在变换域而非真实或像素域中进行范围减小的一个重要优点是这样能够以不同方式按照之字形扫描次序处理不同位置上的变换系数,因此保持可能具有较大重要性的图像特征(这可以通过相对出现频率来表示),同时实现非常高的数据压缩。
如果使用了定制霍夫曼表(或者在需要将算术编码转换成基线霍夫曼表的情况下包括其),则可以在用来估计停止修改系数的之字形扫描位置的功能中包括分配给块结束(EOB)代码的比特数。在JPEG技术规范的附录K(包括在上面引作参考的文献中)内列出的AC系数霍夫曼代码表中,与在色度表中具有两比特代码长度相比,EOB在亮度表中具有四比特代码长度。与其他运行趟/大小组合的长度相结合,可以获得在之字形扫描次序中何时停止修改系数的估计,以及来自这些修改的比特节省的估计。亮度AC系数表中EOB的较长代码长度表示应当在更多的之字形扫描位置上修改量化变换系数。
在这一点上,还必须注意避免允许改变后的量化表值超过原始样本中的八比特精度的255(或者基于数据原始精度的其他最大值)。(不允许零值,因此所允许的范围为1到255。)如果解码器的量化表在变更以补偿范围减小之前已经为255,则这些量化系数在小于范围减小的情况下可以设为零,但不被减小,因为这些量化值已经为其最大值,并且当量化值限于八比特(例如,对于基线熵编码)时,附加的范围恢复是不可能的。
通过前文可以看到,本发明通过紧接在熵解码之后在变换域中进行范围减小来在对编码信号进行代码转换的期间执行附加的压缩,从而为增大文档图像数据的压缩提供大幅的处理时间减小,这在能够进行重新熵编码之前避免了在计算上密集的以下操作:反量化、向真实/图像域的反变换、在真实/图像域中的范围减小、以及之后的返回到变换域的正变换和重新量化。因此,根据本发明的进一步压缩的处理时间很有可能不大于在真实或图像像素数据域中执行压缩时所需的处理时间的1/4。
当按比例缩小量化系数时,改变霍夫曼表的统计信息。修改的霍夫曼表可以通过使用旧表来估计符号的相对频率然后适当地按比例放缩符号来估计。例如,以二的系数按比例缩小量化系数将合并相邻的系数频率。平均起来,对于该情况,每个霍夫曼代码将需要少一个比特,因为两个频率已被组合。
处理时间和成本的这一减少对应于图像存储成本的直接和大量降低,从而经济地提供在延长的时间内对这些图像的高速和“在线”访问,并且允许更容易且高效地向压缩形式的这种数据的现有数据库提供这些益处。
虽然本发明是按照单个优选实施例来描述的,但是本领域的技术人员应当认识到,可以在所附权利要求的精神和范围内通过修改来实施本发明。具体地说,本发明可以容易地应用于采用任何压缩技术和其他有损、基于变换的压缩算法以及遵循JPEG标准的技术经过压缩的压缩数据。

Claims (17)

1.一种用于对压缩数据进行代码转换以便进一步压缩的方法,包括以下步骤:
对所述压缩数据进行熵解码,以形成量化变换系数值;
减小所述量化变换系数值的范围,以形成减小范围的量化变换系数值,其中根据之字形扫描位置上非零量化变换系数的出现频率,阻止变更所述之字形扫描位置上的量化变换系数;
更改量化表中的至少一个值,以形成更改的量化表,其中阻止变更所述之字形扫描位置上的所述量化表中的量化值;
对所述减小范围的量化变换系数值进行熵编码,以形成进一步压缩的数据;以及
与所述更改的量化表一起传输或存储所述进一步压缩的数据。
2.如权利要求1所述的方法,其中所述减小范围的步骤以系数2减小所述范围。
3.如权利要求1所述的方法,其中所述更改的量化值在原始数据样本中的8比特精度的1到255的范围内。
4.如权利要求2所述的方法,其中所述更改的量化值在原始数据样本中的8比特精度的1到255的范围内。
5.如权利要求1所述的方法,还包括以下步骤:根据量化系数的变更来更改霍夫曼表,而不收集图像的新统计信息。
6.如权利要求5所述的方法,其中从原始霍夫曼表数据来估计所述出现频率。
7.如权利要求5所述的方法,其中从所述量化变换系数值的直方图来确定所述出现频率。
8.如权利要求1所述的方法,其中所述熵编码步骤包括算术编码。
9.如权利要求1所述的方法,其中所述量化变换系数值采用封装格式。
10.如权利要求1所述的方法,其中更改所述量化表中的所述至少一个值的所述步骤与减小所述至少一个值的范围的所述步骤互补。
11.如权利要求2所述的方法,还包括以下步骤:
根据量化系数的变更来更改霍夫曼表而不收集图像的新统计信息。
12.如权利要求11所述的方法,其中从原始霍夫曼表数据来估计所述出现频率。
13.如权利要求11所述的方法,其中从所述量化变换系数值的直方图来确定所述出现频率。
14.如权利要求2所述的方法,其中所述熵编码步骤还包括算术编码。
15.如权利要求2所述的方法,其中所述变换系数值采用封装格式。
16.如权利要求2所述的方法,还包括以下步骤:
根据之字形扫描位置上非零量化变换系数的出现频率,阻止变更所述之字形扫描位置上的量化变换系数;以及
阻止变更所述之字形扫描位置上的所述量化表中的量化值。
17.一种用于对压缩数据进行代码转换以便进一步压缩的装置,包括以下部件:
用于对所述压缩数据进行熵解码以形成量化变换系数值的部件;
用于减小所述量化变换系数值的范围以形成减小范围的量化变换系数值的部件,其中根据之字形扫描位置上非零量化变换系数的出现频率,阻止变更所述之字形扫描位置上的量化变换系数;
用于更改量化表中的至少一个值以形成更改的量化表的部件,其中阻止变更所述之字形扫描位置上的所述量化表中的量化值;
用于对所述减小范围的量化变换系数值进行熵编码以形成进一步压缩的数据的部件;以及
用于与所述更改的量化表一起传输或存储所述进一步压缩的数据的部件。
CNB038212927A 2002-10-04 2003-09-12 在对jpeg图像进行代码转换时增强压缩 Expired - Fee Related CN100336079C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/263,653 US7260265B2 (en) 2002-10-04 2002-10-04 Enhancing compression while transcoding JPEG images
US10/263,653 2002-10-04

Publications (2)

Publication Number Publication Date
CN1692375A CN1692375A (zh) 2005-11-02
CN100336079C true CN100336079C (zh) 2007-09-05

Family

ID=32042041

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB038212927A Expired - Fee Related CN100336079C (zh) 2002-10-04 2003-09-12 在对jpeg图像进行代码转换时增强压缩

Country Status (12)

Country Link
US (2) US7260265B2 (zh)
EP (1) EP1547017B1 (zh)
JP (1) JP4072160B2 (zh)
KR (1) KR100745429B1 (zh)
CN (1) CN100336079C (zh)
AT (1) ATE500571T1 (zh)
AU (1) AU2003263355A1 (zh)
CA (1) CA2498665C (zh)
DE (1) DE60336243D1 (zh)
PL (1) PL374500A1 (zh)
TW (1) TWI234744B (zh)
WO (1) WO2004032022A2 (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1187957C (zh) * 1999-11-09 2005-02-02 开放电视公司 事件预订方法和设备
US8526751B2 (en) * 2001-08-24 2013-09-03 International Business Machines Corporation Managing image storage size
US8352991B2 (en) * 2002-12-09 2013-01-08 Thomson Licensing System and method for modifying a video stream based on a client or network environment
JP4845382B2 (ja) 2004-02-06 2011-12-28 キヤノン株式会社 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US7570827B2 (en) 2004-07-14 2009-08-04 Slipstream Data Inc. Method, system and computer program product for optimization of data compression with cost function
ATE532270T1 (de) 2004-07-14 2011-11-15 Slipstream Data Inc Verfahren, system und computerprogramm für die optimierung von datenkomprimierung
US7502514B2 (en) * 2004-11-15 2009-03-10 Smith Micro Software, Inc. System and method for lossless compression of already compressed files
JP4034317B2 (ja) * 2005-03-29 2008-01-16 富士通株式会社 画像符号化装置
TWI314424B (en) * 2006-06-23 2009-09-01 Marketech Int Corp System and method for image signal contrast adjustment and overflow compensation
US8260070B1 (en) * 2006-10-03 2012-09-04 Adobe Systems Incorporated Method and system to generate a compressed image utilizing custom probability tables
US8213498B2 (en) * 2007-05-31 2012-07-03 Qualcomm Incorporated Bitrate reduction techniques for image transcoding
CN101923559B (zh) * 2010-03-24 2012-10-10 深圳市万兴软件有限公司 一种图像文件管理方法和系统
US8334911B2 (en) 2011-04-15 2012-12-18 Dolby Laboratories Licensing Corporation Encoding, decoding, and representing high dynamic range images
TWI513327B (zh) * 2011-04-15 2015-12-11 Dolby Lab Licensing Corp 高動態範圍影像的編碼、解碼及表示
JP5523413B2 (ja) * 2011-08-25 2014-06-18 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
KR102020220B1 (ko) 2011-12-26 2019-09-11 삼성전자주식회사 이미지 압축 방법 및 장치
JP5642105B2 (ja) * 2012-03-29 2014-12-17 京セラドキュメントソリューションズ株式会社 画像処理装置および画像形成装置
RU2616548C2 (ru) * 2012-10-19 2017-04-17 КОЛЕН, Жан-Клод Обратимый способ преобразования файла, закодированного первым кодированием, в файл, закодированный вторым кодированием
CN103400342A (zh) * 2013-07-04 2013-11-20 西安电子科技大学 基于混合色阶映射及压缩系数的高动态范围图像重构方法
JP2017158183A (ja) * 2016-02-29 2017-09-07 大学共同利用機関法人情報・システム研究機構 画像処理装置
CN114071141A (zh) * 2020-08-06 2022-02-18 华为技术有限公司 一种图像处理方法及其设备
US11871036B2 (en) 2020-09-24 2024-01-09 Korea University Research And Business Foundation Apparatus and method for compressing JPEG images

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US603137A (en) 1898-04-26 George henry grundy
US5339368A (en) 1991-11-21 1994-08-16 Unisys Corporation Document image compression system and method
US5583656A (en) 1992-12-31 1996-12-10 Eastman Kodak Company Methods and apparatus for attaching compressed look-up table (LUT) representations of N to M-dimensional transforms to image data and for processing image data utilizing the attached compressed LUTs
US5666161A (en) * 1993-04-26 1997-09-09 Hitachi, Ltd. Method and apparatus for creating less amount of compressd image data from compressed still image data and system for transmitting compressed image data through transmission line
US6031937A (en) 1994-05-19 2000-02-29 Next Software, Inc. Method and apparatus for video compression using block and wavelet techniques
US6195465B1 (en) 1994-09-21 2001-02-27 Ricoh Company, Ltd. Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
US5991451A (en) * 1995-03-23 1999-11-23 Intel Corporation Variable-length encoding using code swapping
US5699458A (en) 1995-06-29 1997-12-16 Intel Corporation Efficient browsing of encoded images
US5724453A (en) 1995-07-10 1998-03-03 Wisconsin Alumni Research Foundation Image compression system and method having optimized quantization tables
US5774597A (en) 1995-09-05 1998-06-30 Ge Medical Systems, Inc. Image compression and decompression using overlapped cosine transforms
US6141452A (en) 1996-05-13 2000-10-31 Fujitsu Limited Apparatus for compressing and restoring image data using wavelet transform
US6167161A (en) 1996-08-23 2000-12-26 Nec Corporation Lossless transform coding system having compatibility with lossy coding
SE515535C2 (sv) * 1996-10-25 2001-08-27 Ericsson Telefon Ab L M En transkoder
US6058215A (en) 1997-04-30 2000-05-02 Ricoh Company, Ltd. Reversible DCT for lossless-lossy compression
US6118820A (en) 1998-01-16 2000-09-12 Sarnoff Corporation Region-based information compaction as for digital images
US6343153B1 (en) 1998-04-03 2002-01-29 Matsushita Electric Industrial Co., Ltd. Coding compression method and coding compression apparatus
US6222944B1 (en) 1998-05-07 2001-04-24 Sarnoff Corporation Down-sampling MPEG image decoder
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
TW455821B (en) * 1999-09-03 2001-09-21 Ind Tech Res Inst Signal process method and device
US6941019B1 (en) * 2000-05-10 2005-09-06 International Business Machines Corporation Reentry into compressed data
US6606418B2 (en) * 2001-01-16 2003-08-12 International Business Machines Corporation Enhanced compression of documents
US6950463B2 (en) * 2001-06-13 2005-09-27 Microsoft Corporation Non-compensated transcoding of a video stream
US8526751B2 (en) * 2001-08-24 2013-09-03 International Business Machines Corporation Managing image storage size

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MITCHELL JL STEPNESKI D A ENHANCED JPEG COMPRESSION OF DOCUMENTS PRAKASH R,2001 IEEE INTERNATIONAL CONFEREVCE ON IMAGE 2001 *
PROCESSING JPEGCOMPERESSED IMAGES AND DPCUMENTS QUEIROZ DE R L,IEEE TRANSACTIONS ON IMAGE PROCESSING 1998 *

Also Published As

Publication number Publication date
WO2004032022A2 (en) 2004-04-15
KR100745429B1 (ko) 2007-08-02
TW200419458A (en) 2004-10-01
WO2004032022A3 (en) 2004-08-26
US7813575B2 (en) 2010-10-12
DE60336243D1 (de) 2011-04-14
TWI234744B (en) 2005-06-21
US20070196026A1 (en) 2007-08-23
CN1692375A (zh) 2005-11-02
AU2003263355A8 (en) 2004-04-23
EP1547017A2 (en) 2005-06-29
US20040066973A1 (en) 2004-04-08
PL374500A1 (en) 2005-10-31
CA2498665C (en) 2010-12-14
JP2006501736A (ja) 2006-01-12
ATE500571T1 (de) 2011-03-15
US7260265B2 (en) 2007-08-21
KR20050054927A (ko) 2005-06-10
EP1547017B1 (en) 2011-03-02
CA2498665A1 (en) 2004-04-15
AU2003263355A1 (en) 2004-04-23
JP4072160B2 (ja) 2008-04-09

Similar Documents

Publication Publication Date Title
CN100336079C (zh) 在对jpeg图像进行代码转换时增强压缩
US6606418B2 (en) Enhanced compression of documents
Jo et al. A digital image watermarking scheme based on vector quantisation
CN1108063C (zh) Mpeg2 活动图像编码/解码系统
JP2006501736A5 (zh)
Lu et al. Semi-fragile image watermarking method based on index constrained vector quantisation
JPH11168633A (ja) 再構成実行方法、再構成実行装置、記録媒体、逆変換実行方法、逆変換実行装置、好適再構成生成方法、好適再構成生成装置、符号化データ処理方法、符号化データ処理装置、データ処理方法、データ処理装置、符号化データのタイル処理方法、符号化データのタイル処理装置、データ復号化方法、データ復号化装置、再構成方法、及び、2値データモデル化方法
US20080089413A1 (en) Moving Image Encoding Apparatus And Moving Image Encoding Method
KR20080044835A (ko) 넓은 범위 계수의 적응형 코딩 및 디코딩
TWI511528B (zh) 編碼器、解碼器及編碼方法、解碼方法
Malik et al. A high payload data hiding scheme based on modified AMBTC technique
US20140112591A1 (en) Encoder, Decoder and Method
Krajcevski et al. GST: GPU-decodable supercompressed textures
Abhayaratne et al. Scalable watermark extraction for real-time authentication of JPEG 2000 images
Malik et al. A high capacity data hiding scheme using modified AMBTC compression technique.
US20070031054A1 (en) Encoding DCT coordinates
Lu et al. Reversible data hiding for JPEG images based on channel selection
Phade et al. Digital image watermarking using DCT and ZIP compression technique
Zouari et al. Dictionary-based histogram packing technique for lossless image compression
JP4137458B2 (ja) 固定長画像符号化装置
Sehgal et al. High capacity data embedding in the wavelet domain
Ageenko et al. Storage system for document imaging applications
Prakash et al. Enhanced JPEG compression of documents
Sibade et al. Compressed-domain processing for wide format printing application
Lee et al. An Iterative Method for Lossless Data Embedding in BMP Images

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070905

Termination date: 20200912