CN1214616C - 压缩与解压缩图像的方法和设备 - Google Patents
压缩与解压缩图像的方法和设备 Download PDFInfo
- Publication number
- CN1214616C CN1214616C CNB008009597A CN00800959A CN1214616C CN 1214616 C CN1214616 C CN 1214616C CN B008009597 A CNB008009597 A CN B008009597A CN 00800959 A CN00800959 A CN 00800959A CN 1214616 C CN1214616 C CN 1214616C
- Authority
- CN
- China
- Prior art keywords
- image
- representative image
- representative
- group
- compression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
Abstract
用于压缩静止图像组的方法,包括以下步骤:以彩色内容相似性为基础,根据至少一个图像相似性度量而把图像组成为两个群集;标识每一个群集中的至少一个代表图像,每一个群集内的所有其它图像被标识为非代表图像;例如使用有损(例如JPEG)或无损编码算法来独立编码每一个群集中的代表图像;以及将每个群集中的代表图像用作基准图像来对该群集中的每一个非代表图像进行预测编码。
Description
技术领域
本发明涉及图像压缩技术。
背景技术
在此整个申请中使用的术语″图像″是指与运动图像相对的静止画面。而且,一般说来,图像压缩技术专业的普通技术人员可将在此公开的图像压缩技术用于压缩包含在图像数据库中的用于发送、处理、编辑、维护或用于任何其它用途的图像。在此连接中,本申请的使用不局限于任何特定的应用,并且本发明不局限于任何特定的应用。
通常,当一组图像被压缩时,使用一个无损或有损压缩方案单独地压缩每个分别的图像。类似于JPEG标准规定的图像压缩方案使用空间相关来利用较少的比特表示图像,以便从而实现压缩。
发明内容
本发明的一个目的是提供对一组图像的进一步的压缩。为此目的,本发明提供用于压缩的方法与设备、发射机、编码数据流、存储媒体、用于解压缩的方法与设备以及显示设备。
在从属权利要求中定义了有益的实施例。
概括地,本发明包含用于压缩一组图像或子图像的一个方法,包括步骤:在图像或子图像组中指定至少一个代表图像或子图像,在该图像或子图像组之内的全部其它图像或子图像都被指定为非代表图像或子图像;独立地编码代表图像或子图像,并且使用代表图像或子图像作为基准图像或子图像来预测编码每一个非代表图像或子图像。
当前没有已知的图像压缩技术尝试相对于另一图像来预测编码一图像,以便利用在图像中的冗余度,从而实现高水平的图像压缩。虽然通过参照其它画面来预测编码某些画面的运动编码被通常采用在对运动图像的压缩中,以实现高水平的压缩,但是没有一个相似的技术应用到图像压缩。
根据上述的原因,当前图像压缩技术领域中存在的需要是不仅尝试利用在一个给定图像中的空间相关,而且利用不同图像之间的空间相关,以便实现显著的高水平的图像压缩。本发明通过使用基于内容的相似性(在一个图像数据库中使用类似图像的搜索与检索)以便有效率地压缩一个给定图像组,因此满足本技术领域对此的需要。
本发明进一步包含用于压缩一组图像的方法,包括步骤:以图像相似性为基础、根据至少一图像相似性度量而把图像形成两个群集(cluster),在每一个群集中标识至少一代表图像,在每一个群集中的全部其它图像被标识为非代表图像,使用例如有损(例如JPEG)或无损编码算法独立地编码每一个群集中的代表图像;并且,使用来自该群集的代表图像作为基准图像来预测编码每一群集的每一个非代表图像。在最佳实施例中,该图像相似性度量包括一个彩色相似性度量。但是,该图像相似性度量能够是任何适当的图像相似性度量或其组合例如彩色相似性度量、纹理(texture)相似性度量、形状相似性度量、几何相似性度量和/或内容相似性度量。
本发明还包含用于压缩一组图像的方法,包括步骤:把每一图像细分成两个或更多的分区;以图像相似性为基础、根据至少一相似性度量将在其各自的图像中具有对应位置的相应分区形成至少两个群集,以便从而针对相应分区的每一组产生一个群集组;针对每一分区群集标识至少一个代表图像,在每一个群集之内的所有的其它图像被标识为非代表图像;针对每一个群集在代表图像中独立地编码一个基准分区;并且,使用针对该群集的代表图像中的基准分区作为基准分区来预测编码每一群集的非代表图像中的每一个分区。
在一个实施例中,本方法进一步包括步骤:针对每一群集,把每一非代表图像细分成多个小目标数据块(block),并且把代表图像细分成具有与目标数据块相同尺寸的多个较小基准数据块,其中利用以下步骤针对每一群集执行该预测编码步骤:
针对每一个目标数据块,根据规定的搜索度量把该目标数据块的像素与在基准分区中的每一个相同尺寸的基准数据块的像素进行比较,并且针对进行的每一比较产生误差度量值;
针对每一个目标数据块,确定所产生的误差度量值之中的任何值是否小于规定的最大门限值,并且:
如果是的话,标识构成对于该目标数据块的最佳匹配的相同尺寸基准数据块之一,和
如果否的话,独立地编码该目标数据块。
在另一个实施例中,该预测编码是通过针对每一群集对在每一非代表分区和针对该群集的基准分区之间的差值进行编码来执行的。
本发明还包含用于压缩一组子图像的一个方法,包括步骤:在子图像组中指定至少一代表图像或子图像,在子图像组之内的全部其它子图像都被指定为非代表子图像;独立地编码代表子图像;并且,使用代表子图像作为基准子图像来预测编码每一个非代表子图像。
本发明还包含用于压缩一组图像的方法,包括步骤:把每一图像细分成两个或多个分区;根据至少一个相似性度量,以图像相似性为基础把分区形成至少两个群集;针对每一分区群集标识至少一个代表分区,在每一个群集之内的所有的其它分区被标识为非代表分区;针对每一个群集独立地编码代表分区;并且,使用该群集的代表分区作为基准分区,预测编码每一群集中的每一个非代表分区。在一个实施例中,本方法进一步包括步骤:针对每一群集,把每一非代表分区细分成多个较小的目标数据块,并且把基准分区细分成具有与目标数据块相同尺寸的多个较小的基准数据块,其中利用以下步骤针对每一群集执行预测编码步骤:
针对每一个目标数据块,根据规定的搜索度量把该目标数据块的像素与在基准分区中的每一个相同尺寸的基准数据块的像素进行比较,并且针对进行的每一比较产生误差度量值;
针对每一个目标数据块,确定所产生的误差度量值之中的任何值是否小于规定的最大门限值,并且:
如果是的话,标识构成该目标数据块的最佳匹配的相同尺寸的基准数据块之一,和
如果否的话,独立地编码该目标数据块。
在另一个实施例中,该预测编码是通过针对每一群集对在每一非代表分区和该群集的基准分区之间的一个差值进行编码来执行的。
根据本发明的另一可选的方面,当一个特定目标图像或分区在其群集中具有一个以上的基准图像或分区时,则最相似或至少最可能是最相似的基准图像或分区之一(例如,在用于节点的群集树中共用最接近的共同原始节点(ancestor node)的基准图像或分区之一)被选择为用于该特定目标图像或分区的基准图像或分区。
在一个当前最佳实施例中,本方法进一步包括预先步骤:把每一个图像分区成多个彩色比较数据块;针对每一个图像的每一个彩色比较数据块计算标准化直方图;并且在执行分组和标识步骤中使用计算的标准化直方图。
在一个最佳实施例中,通过把非代表图像或子图像分区成多个像素的目标数据块,参照选择的基准图像或子图像而编码每一个非代表图像或子图像;针对每一个目标数据块,根据规定的搜索度量把该目标数据块的像素与基准图像或子图像中的每一个相同尺寸的基准数据块的像素进行比较,并且针对进行的每一比较产生误差度量值;和,针对每一个目标数据块,确定所产生的误差度量值之中的任何值是否小于规定的最大门限值,并且:
如果是的话,标识构成该目标数据块的最佳匹配的相同尺寸基准数据块之一,和
如果否的话,独立地编码该目标数据块。
该编码数据的数据流还可以包括这样的编码数据,标识构成没有被独立编码的每一个非代表图像的相应目标数据块的最佳匹配的基准图像的基准数据块、标识每一个非代表图像的目标数据块的哪一些被独立地编码、以及进一步标识该组图像之中的哪一些图像是基准图像,和哪一些是非代表图像。选择地或附加地,该预测编码步骤能够包括子步骤:针对每一个没有被独立编码的目标数据块,计算在该目标数据块与构成其最佳匹配的基准数据块之间的差值,以便对于没有被独立编码的每一个目标数据块产生余值(residual value),其中表示计算余值的编码数据也能够被插入编码数据流中。
本发明还包括实现本发明方法的设备。
具体地,本发明提供一种压缩静止图像组的方法,所述方法包括以下步骤:标识所述静止图像组中的至少一个代表图像,将所述静止图像组之内的其它静止图像标识为非代表图像;独立编码至少一个代表图像;以及将至少一个代表图像用作基准图像来预测编码每一个非代表图像。
本发明同样提供一种压缩设备,用于压缩静止图像组,所述压缩设备包括:标识装置,用于标识静止图像组中的至少一个代表图像,将所述静止图像组内的其它静止图像标识为非代表图像;独立编码装置,用于独立编码至少一个代表图像;和预测编码装置,用于将至少一个代表图像用作基准图像来预测编码每一个非代表图像。
本发明还提供一种发射机,包括:压缩设备,用于压缩静止图像组,所述压缩设备包括:标识装置,用于标识静止图像组中的至少一个代表图像,将所述静止图像组内的其它静止图像标识为非代表图像;独立编码装置,用于独立编码至少一个代表图像;和预测编码装置,用于将至少一个代表图像用作基准图像来预测编码每一个非代表图像;以及发送装置,用于发送压缩的静止图像组。
本发明又提供一种解压缩方法,用于对压缩的静止图像组进行解压缩,所述方法包括以下步骤:标识压缩的静止图像组中的至少一个代表图像,将所述组内所有其它的压缩静止图像标识为非代表图像;独立解码至少一个代表图像;以及将至少一个代表图像用作基准图像来预测解码每一个压缩的非代表图像。
本发明仍提供一种解压缩设备,用于对压缩的静止图像组进行解压缩,所述解压缩设备包括:标识装置,用于标识压缩的静止图像组中的至少一个代表图像,所述组之内其它的压缩静止图像被标识为非代表图像;独立解码装置,用于独立解码至少一个代表图像;以及预测解码装置,用于将代表图像用作基准图像来预测解码每一个压缩的非代表图像。
本发明再提供一种显示设备,包括:解压缩设备,用于对压缩的静止图像组进行解压缩,所述解压缩设备包括:标识装置,用于标识压缩的静止图像组中的至少一个代表图像,所述组之内其它的压缩静止图像被标识为非代表图像;独立解码装置,用于独立解码至少一个代表图像;和预测解码装置,用于将代表图像用作基准图像来预测解码每一个压缩的非代表图像;以及显示单元,用于显示解压缩的静止图像。
附图说明
从下面结合附图的详细描述,将容易地理解本发明的其它方面、特点和优点,其中:
图1是示出结合本发明最佳实施例的图像压缩技术使用的分级群集算法构思的示意图;
图2是示出根据本发明图像压缩技术的当前最佳实施例的从基准图像预测编码一个目标图像的的构思的示意图;
图3示出根据本发明的一个发射机的实施例;
图4示出根据本发明一个存储设备的实施例,和
图5示出根据本发明的一个显示设备的实施例。
具体实施方式
根据彩色相似性形成图像的一个分级群集算法在序列号为09/102,474的未公开美国专利申请09/102,474(对应于PCT/IB99/01008,申请人的案号PHN 16.961)中被描述,其标题是“图像检索系统”。假定一组图像输入,此分级群集算法产生输出一组群集。在每一群集之内的图像相对于所在其中的空间分布彼此类似。在上述引用的专利申请中,此技术被使用在图像检索系统中用于在一个图像数据库中搜索与检索相似的图像,查找″看上去″类似的一个查询图像。此分级群集算法还用于从每一群集中选择代表图像。
一般说来,上述分级群集算法的工人是通过把每一个图像成多个彩色比较分区、然后计算针对每一图像的彩色比较分区的一个标准化直方图实现的。如此计算的标准化直方图被随后用于把图像形成最佳群集,并且然后针对每一群集选择一个或者多个代表图像。本发明的最佳实施例采用的分级群集算法的细节可以参考上述的专利申请了解。但是,应该清楚地理解在广义上本发明不局限于这种情况,以便使用任何图像分组或群集方案。
图1描述了在上述参考的申请PCT/IB9 9/01008中公开的分级群集技术相对于编号1到8的一组八个图像情况的工作情况。首先针对每一图像计算彩色直方图。其次,使用彩色直方图计算全部图像的相似性。第三,具有最接近相似性的图像被分组,例如图像2和4被分组以形成群集树的节点10。重复此过程,直到达到该群集树的根节点。在图1描述的情况中,在此分级群集处理的最终,八个图像被群集成两个组,一个组具有五个图像(图像编号1-5),而另一组具有三个图像(图像编号6-8)。对于第一群集,代表图像是2和5,而对于第二群集,代表图像是7。这些代表图像在图1中被阴影示出。由于群集处理的特性,每一群集具有一个相关的群集树。不同于示出的情况,代表图像的数目通常是群集中的图像总数的大约10-20%。
从群集的理论能够推知,在一个群集内部的图像彼此类似。因此,不尝试独立地压缩这些图像,而是谨慎地利用在图像之间的相似性以便改进图像压缩效率。更具体地说,根据本发明最佳实施例的图像压缩方案包括下列步骤:
1.根据其彩色内容相似性把一套给定图像组成群集,并且针对每一群集标识/指定至少一个代表图像,在每一群集中的所有的其余图像被指定为非代表图像。
2.在每一群集中,使用具有很高逼真度的一个少损图像编码技术或有损编码技术压缩该代表图像。例如此过程可以利用对于有损情况的一个JPEG编码方案实现。但是,该采用的特定的编码方案不限制本发明。
3.在每一群集中,使用该代表图像作为基准图像编码剩余部分的图像(即非代表图像)。为了编码一个给定的非代表图像(在下文称之为″目标图像″),首先把该目标图像分解成许多目标数据块。例如,该目标数据块可以是8×8或16×16的像素数据块。针对在该目标图像中的每一目标数据块,在该基准图像中搜索一个相似数据块。一旦发现这种基准数据块,仅编码在基准图像中的基准数据块和目标图像中的目标数据块之间的差值。使用熟知的DCT(离散余弦变换)和VLC(可变长度码)编码技术编码该剩余部分(在目标数据块和基准数据块之间的差值)。针对一个给定的目标数据块,如果在该基准图像中不存在相似的基准数据块,则以非预测(即与任何基准图像无关的独立方式)编码该目标数据块。
一般说来,如本专业技术人员熟知的那样,目标图像中的每一目标数据块能够与该基准图像之内对应位置的当前目标数据块的规定的水平和垂直搜索范围之内定位的一个基准图像的全部可能的相同尺寸基准数据块比较,以便根据一个指定的搜索度量(即匹配准则)确定在构成该最佳匹配的规定的水平和纵向搜索范围之内哪个是该相同尺寸的基准数据块。执行这种搜索的硬件和/或软件被通常称为″搜索引擎″,并且存在若干用于确定该匹配质量的熟知判据(即用于每一比较的误差度量)。
在这些判据(即搜索度量)当中最熟知的是最小绝对误差(MAE),其中的搜索度量包括在目标数据块中的每一个像素与在基准数据块中的对应像素的差值的绝对值的取和; 以及最小平方误差(MSE),其中该搜索度量包括上述像素差值的平方的取和。不论那种状况,具有该对应取和的最小值的匹配被选择作为在规定搜索范围之内的最佳匹配,并且其相对于该当前目标数据块的水平和垂直位置因此构成一个最佳匹配矢量,能够使用DCT或其它适当的编码技术被编码,以便实现更进一步的图像压缩。然而如果该产生的最小取和(即误差度量)被认为太大,则能够作出判定说明没有针对当前目标数据块的适当匹配,并且在此情况中的目标数据块能够被与在该基准图像中的任何基准数据块无关地编码。为本发明的目的,可用上述两个判据的任一个或任何其它适当的判据。
继续参考图1,根据本发明第一可选实施例的图像压缩方案包括下面步骤:
1.把在给定图像组之内的每一图像细分成两个或更多的分区(即″子图像″),例如256×256像素图像能够被细分为十六个64×64像素分区。
2.根据分区的彩色内容的相似性(例如根据该分区的彩色直方图该相似性)把对应分区组成不同的群集,例如以细分为16个不同分区的图像获得16个不同的群集组合(并且每一群集组合可以包含两个或更多的群集)。例如,如果该分区从图像的左上方到右下方地1至16进行编号,然后编号为1的全部分区被组成一个或者多个群集,然后然后编号为2的全部分区被组成一个或者多个群集,等等。一般说来,编号n的全部分区(在下文称作分区″n″,其中n=1至16)被组成群集产生总数为n的群集组合,其中每一群集的组合能够包含两个或多个群集。
3.针对每一分区,标识/指定至少一个代表图像,在每一个分区群集中的所有的其它图像被指定为非代表图像。
4.把每一图像的每一分区细分成多个较小的数据块(例如8×8或16×16像素数据块)以便促进该预测编码处理。在每一分区群集中,使用具有很高逼真度的无损图像编码技术或有损编码技术,针对该群集的代表图像中的基准分区被独立地码(压缩)。例如此过程可以利用针对有损情况的一个JPEG编码方案实现。但是,该采用的特定的编码方案不限制本发明。
5.在每一分区群集中,针对在一个非代表图像中的每一目标数据块,在针对该群集的该代表图像的对应(基准)分区中搜索一个相似的数据块。一旦发现这种基准数据块,仅编码在基准分区中的基准数据块和目标分区中的目标数据块之间的差值。使用熟知的DCT(离散余弦变换)和VLC(可变长度码)编码技术编码该剩余部分(在目标数据块和基准数据块之间的差值)。针对一个给定的目标数据块,如果在该基准图像的对应该基准分区中不存在相似的基准数据块,则以非预测(即与任何基准分区无关的独立方式)编码该目标数据块。例如参考图1,假定图像5被选择作为用于包含图像2的分区1的群集的代表图像,并且图像4被选择作为用于包含图像2的分区2的群集的代表图像。则针对图像2的分区1中的目标数据块,从代表图像5的分区1中选择该基准数据块,以及针对图像2的分区2中的目标数据块,从代表图像4的分区2中选择该基准数据块。
一般说来,如本专业技术人员熟知的那样,目标分区中的每一目标数据块能够与该基准分区之内对应位置的当前目标数据块的规定的水平和垂直搜索范围之内定位的一个基准分区的全部可能的相同尺寸基准数据块比较,以便根据一个指定的搜索度量(即匹配准则)确定在构成该最佳匹配的规定的水平和纵向搜索范围之内哪个是该相同尺寸的基准数据块。
继续参考图1,根据本发明的第二可选实施例的图像压缩方案包括下面步骤:
1.把在给定图像组之内的每一图像细分成两个或更多的分区(即″子图像″),例如256×256像素图像能够被细分为十六个64×64像素分区。
2.与在分别图像之内的位置无关,根据彩色内容的相似性(例如根据该分区的彩色直方图的相似性)把全部分区组成不同的群集。因此,与第一可选实施例的获得对应分区的每一组组合的群集的不同组合相反,仅获得分区的不同群集。
3.针对分区的每一群集标识/指定至少一个代表分区,在分区的每一个群集中的所有的其它分区被指定作为非代表分区。
4.把每一图像的每一分区细分成多个较小的数据块(例如8×8或16×16像素数据块)以便促进该预测编码处理。在每一分区群集中,使用具有很高逼真度的无损图像编码技术或有损编码技术,针对该群集的基准分区被独立地码(压缩)。例如此过程可以利用针对有损情况的一个JPEG编码方案实现。但是,该采用的特定的编码方案不限制本发明。
5.在每一分区群集中,针对在一个非代表分区中的每一目标数据块,在针对该群集的基准分区中搜索一个相似的数据块。一旦发现这种基准数据块,仅编码在基准分区中的基准数据块和目标分区中的目标数据块之间的差值。使用熟知的DCT(离散余弦变换)和VLC(可变长度码)编码技术编码该剩余部分(在目标数据块和基准数据块之间的差值)。针对一个给定的目标数据块,如果在该基准分区中不存在相似的基准数据块,则非预测地(即与任何基准分区无关的独立方式)编码该目标数据块。
根据本发明的再另一可选实施例,步骤(4)(即,细分每一分区的步骤成多个将)封根据本发明另一可选实施例,上述第一和第二可选实施例的每一个中的步骤(4)(即把每一分区细分成多个数据块的步骤)能够被删除,从而能够通过直接编码在目标和基准分区之间的差,而不是逐个数据块地搜索最佳匹配而执行步骤(5)(即预测编码步骤)。当然,该技术要求在该群集过程中的该图像的更细的分区,以便实现一个给定的图像压缩质量,这将需要在前端承担附加计算的额外开销;但是,由删除在后端针对一个最佳匹配的逐个数据块的搜索的必要性,删除与此处理相关的计算的额外开销。根据特定应用的不同,计算的额外开销、图像压缩质量、费用、复杂性等取舍将随之改变,例如,在其它考虑和因素当中,根据象该图像的类型以及相似程度的图像数据库的特性以及数据库的尺寸改变。
相对于上述本发明的任何实施例之一,当在一个特定目标图像或分区具有在其群集中的一个以上基准图像或分区时,则能够以任何适当的方式针对特定的目标图像或分区选择该基准图像或单个分区之一。例如,参考图1能够使用的益处是:由于群集处理的特性,每一群集将具有一个群集树,从而提供一个便利方式,识别在该群集之内的哪个基准图像或分区最类似于或统计地最类似于(即可能最相似)该特定的非代表(目标)图像或分区。
为了更具体地说明该要点,考虑图1中的编码图像4的情况,因此必须针对图像4中的每一目标数据块找到″最佳匹配″基准数据块。从用于图像4所属的群集的群集树中,能够推知图像2和4彼此之间要比图像4和5更类似,因为它们共用一个共同的原始节点(节点10),该节点比图像4和5共用的共同原始节点(节点14)更接近(这是在图像5接合在该群集之前为什么图像2和4被群集在一起的确切原因)。因此,根据本发明的附加可选方面,在该预测编码处理过程中,图像2能够被选择作为用于图像4的单个基准图像。一般说来,根据本发明的附加可选方面,当一个特定目标图像或分区具有在其群集中的一个以上的基准图像或分区时,则最相似或至少最可能是最相似的该基准图像或分区之一,例如在用于该节点的群集树中的共用最接近共同原始节点的基准图像或分区之一被选择作为用于该特定目标图像或分区的基准图像或分区。
图2示意地描述本发明图像压缩方法的当前最佳实施例,其中使用来自基准图像2的基准数据块RB2编码预测在目标图像4中的第一目标数据块TB1,并且使用来自基准图像5的基准数据块RB5编码预测在目标图像4中的第一目标数据块TB2。
因此,本发明的图像压缩/编码方案不仅通过使用DCT编码技术利用在一个给定图像中的空间冗余度,而且通过根据彩色相似性把图像组成群集然后使用预测编码技术而利用在图像当中的冗余度,以便进一步压缩图像数据。因为其考虑了图像之间的相似性,所以此方案将提供一个高压缩比率(在全部图像上的平均)用于满足要求的SNR或视觉质量。
用于解码根据本发明当前最佳实施例的上述图像压缩方法编码的图像的过程对于基准和非基准图像来说是不同的。通过执行该基准图像的单独数据块的可变长度解码和反向DCT直接地解码一个基准图像。一个非基准图像以两个步骤解码。为了解码在非基准图像中的每一个数据块,首先解码该基准图像之一中的对应基准数据块,随后解码在该目标数据块中的余值。把基准数据块的值和解码的余值相加在一起,以便给出该目标数据块的实际值。
图3示出根据本发明的一个发射机10的实施例,包括用于获得一组静止图像1,...,8的获得装置11,例如一摄像机或某些接收装置。发射机10还包括用于压缩该组静止图像的装置12。该装置包括标识装置13,用于标识如上所述方式中的一个代表图像或图像分区。标识装置13最好把图像组化分成群集组合,同时标识用于每一群集的一个代表图像。该代表图像被在一个独立编码装置15中编码。其它图像被标识作为非代表图像。利用代表图像作为基准图像,该非代表图像被在预测编码装置14中预测编码。该基准图像也可以是该独立编码的代表图像的一个重建,而不是该非编码的代表图像。进一步,可以使用一个独立编码的代表图像作为一个基准图像而在另一域(例如频域)中执行预测编码。参考使用在图1实例中的编号,通过该装置压缩一组静止图像1,...,8。在标识装置13中,图像被分组为群集,并且图像2、5和7被标识为代表图像。图像2,5,7被独立地编码。其它图像1,3,4,6,8被标识为非代表图像并且被预测编码,从而图像1,3,4以图像2和5作为基准图像而被编码,并且图像6和8通过使用图像7为基准图像而被编码。产生的压缩代表图像2*,5*,7*以及压缩非代表图像1*,3*,4*,6*,8*在一个多路复用器16中被多路复用,以便构成一组压缩图像1*,...,8*,作为一个编码数据的数据流{1*,...,8*}被发送出去。
图4示出类似于图3的一个实施例20,被设计用于在一个存储媒体17上存储表示一组压缩静止图像{1*,...,8*}′。多路复用器16′已经被应用来实现对存储媒体17的适当的格式化。
图5示出根据本发明的一个显示设备30的实施例,包括接收装置31,用于接收一组压缩的静止图像1*,...8*,例如存在于编码数据的数据流{1*,...,8*}中的一组压缩静止图像,由如图3所示的发射机10发送,或从如图4所示存储媒体17获得该压缩静止图像。该显示设备还包括用于解压缩组合的压缩图像1*,...8*的解压缩装置32和显示单元3 3。该解压缩装置32包括用于标识该压缩静止图像1*,...8*的组合中的代表图像*,7*(或图像分区)的标识装置34。代表图像2*,5*,7*被在独立解码装置36中独立地解码以便获得解压缩静止图像2,5,7。解码的代表图像2,5,7最好被在预测解码装置3 5中用作基准图像以获得解压缩的非代表图像1,3,4,6,8。解压缩的图像1......8在用于组合的组合装置37中进行组合,以便显示在显示单元33上。静止图像1,...,8可以显示在组合画面中或可以执行选择。
虽然在此之前已经详细描述了本发明的最佳和可选实施例,但是应该清楚地理解,本专业的技术人员在所附的权利要求书定义的本发明基本构思指教的范围中能够进行许多变化和/或修改。
例如,虽然上述本发明的实施例的每一个都采用使用一种彩色相似性度量的一个聚类算法,以便测量在不同图像之间的相似性,并且把该图像(或分区/子图像)分组成群集,但是本领域技术人员将理解,任何其它的适当图像或子图像分组或聚类算法和/或图像相似性度量都可以选择或附加使用在任何适当的组合中。
例如,该图像相似性度量能够是任何适当的图像相似性度量或其组合例如彩色相似性度量、纹理相似性度量、形状相似性度量、几何相似性度量和/或内容相似性度量,都是相关专业中熟知的。而且,应该认识到,虽然上述本发明的实施例的每一个都采用一个聚类算法以便把图像或子图像分组成不同群集,并且随后选择在每一群集之内的一个代表图像或子图像用于预测编码目的,但是本发明在广义而言不要求任何这种图像或子图像的分组或群集,即使在许多应用中这种技术将实现改进图像压缩效率。
概括地,本发明包含用于压缩一组图像或子图像的一个方法,包括步骤:在图像或子图像组中指定至少一代表图像或子图像,在该图像或子图像组之内的全部其它图像或子图像都被指定为非代表图像或子图像;独立地编码代表图像或子图像;并且,使用代表图像或子图像作为一个基准图像或子图像预测编码每一个非代表图像或子图像。就此而言,在广义上说,图像或子图像被组织、分组、排列或群集的方式、以及代表图像或子图像的选择方式不受本发明的限制。
在权利要求书中,在圆括号之间的任何标号不应解释为对该权利要求的限制。单词″包括″不排除在权利要求中所列出之外的另一单元或步骤的存在。本发明能够利用若干不同的单元硬件实现以及利用适当的程序控制计算机实现。在设备权利要求列举的若干装置中,若干这些装置能够由同一个硬件项实现。
Claims (14)
1.一种压缩静止图像组的方法,所述方法包括以下步骤:
标识所述静止图像组中的至少一个代表图像,将所述静止图像组内的其它静止图像标识为非代表图像;
独立编码至少一个代表图像;以及
将至少一个代表图像用作基准图像来预测编码每一个非代表图像。
2.如权利要求1的方法,还包括以下步骤:
根据至少一个相似性度量,以图像相似性为基础,将静止图像分组成至少两个群集;
所述标识步骤包括标识每一个群集中的至少一个代表图像;和
所述独立编码步骤包括独立编码每一个群集中的代表图像;以及
所述预测编码步骤包括将每一个群集中的相应代表图像用作基准图像来预测编码该群集中的每一个非代表图像。
3.如权利要求1的方法,其中利用以下步骤在预测编码步骤中参照选择的代表图像来编码每一个非代表图像:
将非代表图像分区成多个像素的目标数据块(TB1,TB2);
对于每一个目标数据块(TB1,TB2),根据规定的搜索度量将该目标数据块(TB1,TB2)的像素与代表图像中的每一个相同尺寸的基准数据块(RB2,RB5)的像素进行比较,并且对于进行的每一比较产生误差度量值;
对于每一个目标数据块(TB1,TB2),确定所产生的误差度量值之中的任何值是否小于规定的最大门限值;和
如果是的话,标识相同尺寸的基准数据块(RB2,RB5)之中的哪一个构成该目标数据块(TB1,TB2)的最佳匹配;以及
如果否的话,独立编码该目标数据块(TB1,TB2)。
4.如权利要求3的方法,其中预测编码步骤进一步包括产生编码数据流的步骤,所述编码数据流包括以下部分的标识:
对于没有被独立编码的每个非代表图像的相应目标数据块(TB1,TB2)构成最佳匹配的代表图像之中被标识的基准数据块(RB2,RB5);
被独立编码的每个非代表图像之中被标识的目标数据块(TB1,TB2);以及进一步
所述图像组之中的哪些图像被标识为代表图像,以及哪些图像被标识为非代表图像。
5.如权利要求3的方法,其中预测编码步骤进一步包括以下子步骤:
对于没有被独立编码的每个目标数据块(TB1,TB2),计算在该目标数据块(TB1,TB2)与构成其最佳匹配的基准数据块(RB2,RB5)之间的差值,以便针对没有被独立编码的每个目标数据块(TB1,TB2)产生余值;和
编码在计算步骤中产生的余值,以产生表示计算的余值的编码数据流。
6.如权利要求2的方法,其中相似性度量包括从一个组中选择的至少一个相似性度量,所述组由彩色相似性度量、纹理相似性度量、形状相似性度量、几何相似性度量和内容相似性度量构成。
7.如权利要求2的方法,还包括以下步骤:
将每一个静止图像分区成多个彩色比较数据块;
对于每个图像的每一个彩色比较数据块,计算标准化直方图;和
在执行分组和标识步骤中使用计算的标准化直方图。
8.如权利要求2的方法,还包括以下步骤:
将每个静止图像细分成至少两个分区;
所述分组步骤包括:根据至少一个相似性度量,以图像相似性为基础,将在其相应图像中具有对应位置的相应分区分组成至少两个群集,以便从而对于相应分区的每一组产生一个群集组;
所述标识步骤包括:针对每一个分区群集,标识至少一个代表图像,在每一个群集之内的其他图像被标识为非代表图像;
所述独立编码步骤包括:针对每一个群集,编码至少一个代表图像中的基准分区;以及
所述预测编码步骤包括:将用于每个群集的至少一个代表图像中的基准分区用作基准分区来编码用于该群集的非代表图像中的每一个分区。
9.如权利要求1的方法,还包括以下步骤:
将每一个图像细分成至少两个分区;
所述方法压缩所述分区而不压缩静止图像组。
10.一种压缩设备,用于压缩静止图像组,所述压缩设备包括:
标识装置,用于标识静止图像组中的至少一个代表图像,将所述静止图像组内的其它静止图像标识为非代表图像;
独立编码装置,用于独立编码至少一个代表图像;和
预测编码装置,用于将至少一个代表图像用作基准图像来预测编码每一个非代表图像。
11.一种发射机,包括:
压缩设备,用于压缩静止图像组,所述压缩设备包括:
标识装置,用于标识静止图像组中的至少一个代表图像,将所述静止图像组内的其它静止图像标识为非代表图像;
独立编码装置,用于独立编码至少一个代表图像;和
预测编码装置,用于将至少一个代表图像用作基准图像来预测编码每一个非代表图像;以及
发送装置,用于发送压缩的静止图像组。
12.一种解压缩方法,用于对压缩的静止图像组进行解压缩,所述方法包括以下步骤:
标识压缩的静止图像组中的至少一个代表图像,将所述组内所有其它的压缩静止图像标识为非代表图像;
独立解码至少一个代表图像;以及
将至少一个代表图像用作基准图像来预测解码每一个压缩的非代表图像。
13.一种解压缩设备,用于对压缩的静止图像组进行解压缩,所述解压缩设备包括:
标识装置,用于标识压缩的静止图像组中的至少一个代表图像,所述组内的其它的压缩静止图像被标识为非代表图像;
独立解码装置,用于独立解码至少一个代表图像;以及
预测解码装置,用于将代表图像用作基准图像来预测解码每一个压缩的非代表图像。
14.一种显示设备,包括:
解压缩设备,用于对压缩的静止图像组进行解压缩,所述解压缩设备包括:
标识装置,用于标识压缩的静止图像组中的至少一个代表图像,所述组之内的其它的压缩静止图像被标识为非代表图像;
独立解码装置,用于独立解码至少一个代表图像;和
预测解码装置,用于将代表图像用作基准图像来预测解码每一个压缩的非代表图像;以及
显示单元,用于显示解压缩的静止图像。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/281,353 US6625319B1 (en) | 1999-03-30 | 1999-03-30 | Image compression using content-based image similarity |
US09/281,353 | 1999-03-30 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1310913A CN1310913A (zh) | 2001-08-29 |
CN1214616C true CN1214616C (zh) | 2005-08-10 |
Family
ID=23076934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB008009597A Expired - Fee Related CN1214616C (zh) | 1999-03-30 | 2000-03-09 | 压缩与解压缩图像的方法和设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6625319B1 (zh) |
EP (1) | EP1084568A1 (zh) |
JP (1) | JP2002541738A (zh) |
KR (1) | KR20010025113A (zh) |
CN (1) | CN1214616C (zh) |
WO (1) | WO2000060847A1 (zh) |
Families Citing this family (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1282070B1 (de) * | 2001-08-01 | 2004-04-21 | ZN Vision Technologies AG | Hierarchische Bildmodellanpassung |
US7206450B2 (en) * | 2002-04-25 | 2007-04-17 | Microsoft Corporation | Compression of bi-level images with explicit representation of ink clusters |
KR100474769B1 (ko) * | 2002-12-06 | 2005-03-10 | 엘지전자 주식회사 | 영상 저장 장치 및 그 관리방법 |
US7805024B2 (en) * | 2004-05-05 | 2010-09-28 | Nokia Corporation | Method and apparatus to provide efficient multimedia content storage |
US7376265B2 (en) * | 2004-06-17 | 2008-05-20 | Seiko Epson Corporation | Segmentation-based hybrid compression scheme for scanned documents |
US8718140B1 (en) * | 2005-05-12 | 2014-05-06 | Visualon, Inc. | Encoding video data |
WO2006134509A2 (en) * | 2005-06-15 | 2006-12-21 | Koninklijke Philips Electronics N.V. | Method and apparatus for storing image data files |
EP1911278A2 (en) * | 2005-08-04 | 2008-04-16 | Nds Limited | Advanced digital tv system |
US8094959B2 (en) * | 2005-12-09 | 2012-01-10 | Seiko Epson Corporation | Efficient detection of camera shake |
KR20080107965A (ko) * | 2007-06-08 | 2008-12-11 | 삼성전자주식회사 | 객체 경계 기반 파티션을 이용한 영상의 부호화, 복호화방법 및 장치 |
KR101499545B1 (ko) * | 2007-10-23 | 2015-03-06 | 삼성전자주식회사 | 디지털 이미지 처리장치, 그 제어방법, 제어방법을실행시키기 위한 프로그램을 저장한 기록매체 및 디지털이미지 압축방법 |
US8015144B2 (en) | 2008-02-26 | 2011-09-06 | Microsoft Corporation | Learning transportation modes from raw GPS data |
US8972177B2 (en) | 2008-02-26 | 2015-03-03 | Microsoft Technology Licensing, Llc | System for logging life experiences using geographic cues |
US8966121B2 (en) * | 2008-03-03 | 2015-02-24 | Microsoft Corporation | Client-side management of domain name information |
US7930427B2 (en) * | 2008-03-03 | 2011-04-19 | Microsoft Corporation | Client-side load balancing |
US8458298B2 (en) * | 2008-03-03 | 2013-06-04 | Microsoft Corporation | Failover in an internet location coordinate enhanced domain name system |
US7991879B2 (en) | 2008-03-03 | 2011-08-02 | Microsoft Corporation | Internet location coordinate enhanced domain name system |
US9063226B2 (en) * | 2009-01-14 | 2015-06-23 | Microsoft Technology Licensing, Llc | Detecting spatial outliers in a location entity dataset |
US20100325552A1 (en) * | 2009-06-19 | 2010-12-23 | Sloo David H | Media Asset Navigation Representations |
US9009177B2 (en) | 2009-09-25 | 2015-04-14 | Microsoft Corporation | Recommending points of interests in a region |
US8612134B2 (en) * | 2010-02-23 | 2013-12-17 | Microsoft Corporation | Mining correlation between locations using location history |
US9261376B2 (en) | 2010-02-24 | 2016-02-16 | Microsoft Technology Licensing, Llc | Route computation based on route-oriented vehicle trajectories |
US10288433B2 (en) * | 2010-02-25 | 2019-05-14 | Microsoft Technology Licensing, Llc | Map-matching for low-sampling-rate GPS trajectories |
US8719198B2 (en) | 2010-05-04 | 2014-05-06 | Microsoft Corporation | Collaborative location and activity recommendations |
US9593957B2 (en) | 2010-06-04 | 2017-03-14 | Microsoft Technology Licensing, Llc | Searching similar trajectories by locations |
US8712930B1 (en) | 2010-08-09 | 2014-04-29 | Google Inc. | Encoding digital content based on models for predicting similarity between exemplars |
US8825813B2 (en) | 2010-12-28 | 2014-09-02 | Microsoft Corporation | Distributed network coordinate system based on network performance |
US8515193B1 (en) * | 2011-04-08 | 2013-08-20 | Google Inc. | Image compression using exemplar dictionary based on hierarchical clustering |
US9754226B2 (en) | 2011-12-13 | 2017-09-05 | Microsoft Technology Licensing, Llc | Urban computing of route-oriented vehicles |
US20130166188A1 (en) | 2011-12-21 | 2013-06-27 | Microsoft Corporation | Determine Spatiotemporal Causal Interactions In Data |
KR20130108948A (ko) * | 2012-03-26 | 2013-10-07 | 한국전자통신연구원 | 적응적 전처리 기법을 이용한 영상 인코딩 방법 |
CN105407353A (zh) * | 2014-09-11 | 2016-03-16 | 腾讯科技(深圳)有限公司 | 一种图像压缩方法,及装置 |
US9430718B1 (en) | 2015-02-09 | 2016-08-30 | Sony Corporation | Efficient local feature descriptor filtering |
US9311342B1 (en) | 2015-02-09 | 2016-04-12 | Sony Corporation | Tree based image storage system |
CN107872671B (zh) * | 2016-09-26 | 2022-01-14 | 华为技术有限公司 | 一种图片编码方法及终端 |
CN115278248B (zh) * | 2022-09-28 | 2023-04-07 | 广东电网有限责任公司中山供电局 | 一种视频图像编码设备 |
CN116320405B (zh) * | 2023-05-17 | 2023-10-27 | 西安畅榜电子科技有限公司 | 一种安防监控视频压缩存储方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5031053A (en) * | 1989-06-01 | 1991-07-09 | At&T Bell Laboratories | Efficient encoding/decoding in the decomposition and recomposition of a high resolution image utilizing pixel clusters |
DE4336101A1 (de) * | 1993-10-22 | 1995-04-27 | Philips Patentverwaltung | Standbild-Codierer mit einem Bewegtbild-Codierer als Codiereinheit |
US5606655A (en) * | 1994-03-31 | 1997-02-25 | Siemens Corporate Research, Inc. | Method for representing contents of a single video shot using frames |
JPH09121358A (ja) * | 1995-10-25 | 1997-05-06 | Matsushita Electric Ind Co Ltd | 画像符号化及び復号化装置と方法 |
IL128423A (en) * | 1997-06-16 | 2003-07-31 | Sony Corp | Image processing device and method, and transmission medium, tramsmission method and image format |
US6438254B1 (en) * | 1999-03-17 | 2002-08-20 | Matsushita Electric Industrial Co., Ltd. | Motion vector detection method, motion vector detection apparatus, and data storage media |
-
1999
- 1999-03-30 US US09/281,353 patent/US6625319B1/en not_active Expired - Fee Related
-
2000
- 2000-03-09 EP EP00916918A patent/EP1084568A1/en not_active Withdrawn
- 2000-03-09 WO PCT/EP2000/002102 patent/WO2000060847A1/en not_active Application Discontinuation
- 2000-03-09 KR KR1020007013547A patent/KR20010025113A/ko not_active Application Discontinuation
- 2000-03-09 JP JP2000610213A patent/JP2002541738A/ja active Pending
- 2000-03-09 CN CNB008009597A patent/CN1214616C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2002541738A (ja) | 2002-12-03 |
CN1310913A (zh) | 2001-08-29 |
WO2000060847A1 (en) | 2000-10-12 |
US6625319B1 (en) | 2003-09-23 |
EP1084568A1 (en) | 2001-03-21 |
KR20010025113A (ko) | 2001-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1214616C (zh) | 压缩与解压缩图像的方法和设备 | |
US5835034A (en) | System and method for lossless image compression | |
CN101185083B (zh) | 用于视频压缩的混合可变长度编码的方法和设备 | |
CN1166204C (zh) | 对视频信号进行编码的方法及装置 | |
WO2015120823A1 (zh) | 使用多种形式的参考像素存储空间的图像压缩方法和装置 | |
CN102017634A (zh) | 重新排序的变换系数的多级表示 | |
JP2007020208A (ja) | ブロック単位での画像データの圧縮及び圧縮解除 | |
WO2015120818A1 (zh) | 图像编码、解码方法及装置 | |
CN1238100A (zh) | 矢量量化代码本产生方法 | |
CN101053258A (zh) | 用于处理编码的视频数据的方法和设备 | |
JP2002532027A (ja) | ビデオ圧縮のための効率的な運動ベクトルの符号化 | |
CN104780379A (zh) | 一种屏幕图像集合的压缩方法 | |
CN113518226A (zh) | 一种基于地面分割的g-pcc点云编码改进方法 | |
Feng et al. | Cnn-based depth map prediction for fast block partitioning in hevc intra coding | |
CN1166209C (zh) | 编码视频信号的方法和设备 | |
CN110996127B (zh) | 图像编解码方法、设备及系统 | |
Patidar et al. | A review on medical image data compression techniques | |
CN101742301A (zh) | 一种块模式编码方法及装置 | |
CN107682699B (zh) | 一种近无损图像压缩方法 | |
CN1539239A (zh) | 帧间编码的方法和装置 | |
US20160088309A1 (en) | Apparatus and Method for Compression of Image Data Assembled Into Groups | |
CN1717033A (zh) | 视频压缩的设备和方法 | |
JPH10112862A (ja) | デジタルデータ処理方法 | |
Baroffio et al. | Hybrid coding of visual content and local image features | |
CN1241094A (zh) | 对视频信号进行编码的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |