CN100481946C - 编码和解码及压缩图像的方法和装置 - Google Patents

编码和解码及压缩图像的方法和装置 Download PDF

Info

Publication number
CN100481946C
CN100481946C CNB2004100747088A CN200410074708A CN100481946C CN 100481946 C CN100481946 C CN 100481946C CN B2004100747088 A CNB2004100747088 A CN B2004100747088A CN 200410074708 A CN200410074708 A CN 200410074708A CN 100481946 C CN100481946 C CN 100481946C
Authority
CN
China
Prior art keywords
interest
area
image
data
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB2004100747088A
Other languages
English (en)
Other versions
CN1592419A (zh
Inventor
E·渥美英二
N·法瓦丁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
University of Maryland at Baltimore
Original Assignee
Mitsubishi Electric Corp
University of Maryland at Baltimore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, University of Maryland at Baltimore filed Critical Mitsubishi Electric Corp
Priority claimed from PCT/US1998/003811 external-priority patent/WO1999049413A1/en
Publication of CN1592419A publication Critical patent/CN1592419A/zh
Application granted granted Critical
Publication of CN100481946C publication Critical patent/CN100481946C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]

Abstract

本发明涉及用于为图像编码和解码的方法及装置,它们大致以这种方式处理数据:提供数字图像数据;根据数学排序协议对数据排序;传输排序后的数据,并反复进行排序和传输,直至部分重建图像出现为止;根据部分重建图像选择感兴趣区域;标识感兴趣区域;根据感兴趣区域修改排序,对应于感兴趣区域的数据比对应于其他区域的数据具有,更高的优先级;再传输经过上述修改后的数据,利用本发明可以在编码操作开始之前或过程中指定感兴趣区域,从而提高速度和/或提高重建后感兴趣区域的保真度。因此本系统使得经过通信线路(128)进行的数字图像的重建更为高效。

Description

编码和解码及压缩图像的方法和装置
本案是国际申请PCT/US98/03811(其申请日为1998年3月20日、公开号为WO 99/49413)进入国家阶段(中国专利申请号98813906.5)后的分案申请。
技术领域
现代计算机及现代计算机网络使得计算机之间以及计算机与存储设备之间可进行大量的信息传送。当计算机访问象本地硬盘驱动器或本地软盘驱动器这样的本地存储设备时,大量的信息可被迅速地存取,但是,当试图从一个远程存储单元,如通过一个广域网(WAN)或互联网存取数据时,数据传输速度就会明显慢得多。因此传输大文件要占用大量时间。此外大文件的存储还要使用可贵而有限的存储空间。照片图像和类似的图形图像一般被认为是大文件。这是因为一个图像通常要有关于图像中每个像元或像素的信息。因此相片和类似的图形图像通常要有一兆字节以上的存储空间,并因此而要求在低速的网络通信中使用大量的传输时间。所以近年来已制定出许多协议和标准,用于压缩照片图像以减少用以储存照片图像的存储空间,以及减少传输和移交时间。压缩方法基本上是建立原始图像的数学近似或统计近似。
压缩方法大致可分为两个不同类别:有损失压缩方法,这是其中会有一定程度的图像保真度损失的方法;换言之,对重建图像仔细观察,即会显示出图像的保真度有所损失。无损失压缩方法是在解码后,原始图像可被精确重建的压缩方法。本发明的目的在于建立一种高效率的图像压缩方法及装置,它可使图像的一部分经压缩后,在重建的图像中与图像的其他部分相比具有更高的保真度,而这是基于由对于图像进行初始编码或压缩的用户,或者是由接收并通过与编码方的交互作用对图像数据进行解码的用户对感兴趣区域的选择而决定的。
背景技术
用于压缩图像的一个目前流行的标准被称为JPEG或“J-peg”标准,这一标准是由被称为联合图像专家组的一个委员会所制定的,并被普遍用于压缩静止图像以进行存储或传输。塞德(Said)和皮尔曼(Pearlman)在最近的论文中讨论了基于分层结构树中的集合分区(SPIHT)的新的图像编码和解码方法。请参见Said and Pearlman,ImageCodec Based on Set Partitioning in Hierarchical Trees,IEEE Transactionson Circuits and Systems for Video 
Figure C200410074708D0004090407QIETU
echnology,Vol.6,No.3,June 1996,以及Said and 
Figure C200410074708D0004090518QIETU
Image Multi-Resolution Representation,IEEETransactions on Image Processing,Vol.5,No.9,September 1996。这些论文的内容在这里引证作为参考资料。这些参考资料披露了装入并运行于通用计算机的计算机软件,该软件执行一种方法并生成一种利用了整数子波变换(integer wavelet transforms)的装置,这种整数子波变换在同一个嵌入式比特流内提供达到比特精度的有损失压缩和无损失压缩,或者生成一种利用了非整数子波变换的装置,这种非整数子波变换在一个单独的嵌入式比特流内提供了达到比特精度的有损失压缩。一幅最初存为代表了大量独立像素的二维矩阵的图像,根据一个变换系数来确定位的优先级以便作连续的图像传输。根据一个利用了子集合分区化的阈值来确认重要的或者是不重要的元素,从而选择最重要的信息。Said和Pearlman所披露的连续传输方法根据每个变换系数的数值来选择需要首先传输的最重要的信息,如果这一变换是归一的,则该数值越大,则从均方误差值(MSE,Dmse())的意义上讲,此系数所传送的信息就越多;
D mse ( p - p ^ ) = | | p - p ^ | | 2 N = 1 N Σ i Σ j ( p i , j - p ^ i , j ) 2
式中,(i,j)为像素坐标,而P则代表了一个像素的数值。根据C=Ω(p)来为二维矩阵C编码,这里Ω(·)用于表示一个归一层次子带变换。Said和Pearlman假定每个像素的坐标和数值均由具有相对较小位数的定点二进制格式来表示,这一格式使得元素在编码时可作为整数处理,通过假定重建向量
Figure C200410074708D00042
为0,并通过下式计算图像来完成对图像
Figure C200410074708D00043
的重建:
p ^ = Ω - 1 ( c ^ )
N为图像像素的数量,这样,即可完成对均方误差失真的以上计算。利用数学假设可知,这一均方误差失真量减少了‖ci,j2/N。这一事实使得像素的数值可依据其二进制表达式而分级,最高有效位(MSBs)最先传输,这也使得具有较大数值的像素系数最先传输,因为它有较多的信息含量。编码器利用了一种算法,用于为一个特定像素坐标系发送一个代表最大像素值的数值,通过子波变换系数值来为像素坐标排序,然后输出各系数的最高位,使用若干排序传送和改进传送,以利用一小部分的传输后的像素坐标来提供高质量的重建图像。用户可通过设定在排序传送和改进传送中所使用的位数来设定所需要达到的速度或失真度。现在使用如图1所示的空间定位树,像素信息被分为非重要集合表(LIS),非重要像素表(LIP)和重要像素表(LSP)。图1中标出了图像100,它有101,102,...,10x等等许多像素集合。如大家所知的那样,在这项技术中,空间定位树是通过整数值和非整数值的子波交换(WT)系数的分解而得到的。每一分解层的LH子带的系数形成了空间定位树。在本例中父代节点101有一系列的根和支系节点102—107。LIP是非重要像素坐标或WT系数的列表;LIS是有着非重要子集的树根坐标的列表,这些子集在表上有多重类型的表项(A型或B型);LSP是重要像素坐标的列表。对列表内容的排序和分区如图2所示的那样进行。在图2的流程图中所作的重要性确认是基于一个设定的重要性阈值,来自LIP的表项在方框202经确认是重要的,即前往LSP,方框203;而在方框202经确认不是重要的表项则返回LIP,以在后面的传送中测试。如果确认所有的LIP表项均已在方框204经过测试,则开始测试LIS表项。如果并非所有的LIP表项均经过测试,则在方框202测试下一个LIP表项的重要性。假定所有的LIP表项均经过测试,则在方框205的LIS表项要经过在方框206的测试以确认LIS表项是否属于A型,A型是一个节点的子节点坐标的集合;或者如果这个表项代表子节点和支系的坐标的差,则测试其是否属于B型。如果集合被确认是A型,则在方框207测试重要性。如果是重要的,在方框208该集合被区分为子集和子集的子节点,支系要在方框209测试重要性。如果是重要的,这个坐标就置于LSP上。如果是不重要的,则经过测试的支系就移到LIP的尾部;如果在方框207,初始的A型表项被确认为是不重要的,则这一表项被返回到LIS。B型的LIS表项在方框210测试重要性,如果是重要的就移至LIP,如果是不重要的则返回到LIS。每次重要性测试后,如果这个表项被确认是重要的,就输出一个1,如果这个表项被确认是不重要的则输出一个0。这些1和0被用于表示何时指定的位数已被输出以决定终止。解码是以相同但是反向的方法进行。每一列表的表项由像素坐标所标识,LIP和LSP表示单独的像素,LIS表示坐标的集合,根据这些坐标集合的地位,即它们是空间定位树的节点坐标还是子节点的坐标来对它们分组。
使用上述的编码算法进行排序传送,直至达到选定的终止点为止,随排序传送的增加,失真度会减小,这是因为更精确的重要性分类提供了进一步的改进。但是增加排序传送,就要求附加时间。解码器反向重复编码器的执行路径,对重要系数进行排序,在解码时将“输出”改为“输入”,再现适当的排序信息。因此先前技术的编码方法试图从数学角度,根据重要性的判定而确认图像中的一个区域,这个区域应比图像中其它区域具有更高的保真度或更小的损失。图3说明了SPIHT编码的一个重要特征,那就是对于一个给定阈值进行反复的排序传送和改进传送;排序和改进要一直重复进行到编码结束为止。(如要作关于SPIHT编码的更全面讨论,请参见前述所引用的参考文件)。
发明内容
本发明提供了一种用于为图像编码和解码的方法,该方法包括以下步骤:以一种计算机可读格式提供数字图像数据,而该数字图像数据包括了关于大批像素的数值和坐标的数据;根据一个数学排序协议对于上述数字图像数据进行排序,按照一个预定的优先级划分公式来对这些数字图像数据进行排序和优先级划分处理;将经过排序后的数据传输到一接收装置,并反复进行所述的排序和传输,直至部分重建图像出现在这一接收装置的显示器上为止;根据上述部分重建图像来选择一个感兴趣区域;再从接收装置发送数据给进行数据传输的计算机,以标识出所选的感兴趣区域;根据所选的感兴趣区域修改对于数字图像数据的排序,使得对应于感兴趣区域的数字图像数据与对应于感兴趣区域以外区域的数字图像数据相比,在进行排序和优先级划分处理时具有更高的优先级;并且将经过上述修改后的排序和优先级划分处理的数据再传输给接收装置,而使其中感兴趣区域与感兴趣区域以外区域相比,在进行传输时具有更高的优先级。
从另一角度看,本发明提供了一种用于为图像编码和解码的系统,该系统包括:以计算机可读格式输入数字图像数据的输入装置,其中该数字图像数据包括关于一个图形中的大量像素的数值和坐标的数据;根据一个数学排序协议来为所述字图像数据进行排序的排序装置,该排序装置按照一个预定的优先级划分公式来为上述数字图像数据进行排序和优先级划分处理;连接到排序装置的传输装置,用以传输经过上述排序后的数据,其中排序装置重复进行对所述数字图像数据的排序,而传输装置则重复进行所述数据的传输;从所述传输装置接收所述传输数据的接收装置,该接收装置包括一个连接其上的显示装置,该显示装置在所述传输进行中将所述传输来的数据显示为一幅部分重建的图像;连接到接收装置的选择装置,用以选择上述部分重建图像中的一个感兴趣区域;感兴趣区域传输装置,用于将对应于所选的感兴趣区域的数据传输到排序装置;其中排序装置根据对应于所选感兴趣区域的数据,修改对于数字图像数据的排序;其中对应于所选感兴趣区域的数字图像数据在经排序装置进行排序和优先级划分处理后,与对应于所选感兴趣区域以外区域的数字图像数据相比,具有更高的优先级;并且其中传输装置将经过上述修改后的排序和优先级划分处理的数据传输到接收装置,所选感兴趣区域与感兴趣区域以外区域相比,在传输中具有更高的优先级。
本发明的目的在于一种图像的编码和解码方法及其装置,它可使用户设定一个感兴趣区域(ROI),使得该区域与图像中其它区域相比,以更高保真度或更小损失进行压缩。本发明为ROI编码结合了一个新的特性,并且丝毫无损于ROI编码所具备的图像编码方法的性能,诸如按保真度改进,按分辨率改进,按保真度和分辨率改进,以及有损失/无损失性能等等。此外由于本发明的实施而产生的计算复杂性的增加是微乎其微的。根据先前技术所作的编码器的输出是有着顺序位序的比特流,对于这一顺序位序进行排序是为了减少总体均方误差。本发明是一种方法和装置,它修改比特流输出的排序,以使得与图像的其它方面相比,更多地加重感兴趣区域。在医学成像或实际上任何其它类型的成像应用中,从减少MSE的意义上讲,感兴趣区域也许并不是那些有着最高排序系数的像素值。因此本发明使得一个在传输端或接收端的用户可选择一个合适的感兴趣区域,该区域可以被无损失地重建并具有比图像其它部分更高的保真度,而不论该感兴趣区域在MSE意义上的重要性。
附图说明
为了更详尽地理解本发明的操作,应参考附图。其中:
图1说明了对应于先前技术的空间定位树的一个方面;
图2是一个流程图,它对于根据先前技术所作的SPIHT压缩作了简要说明;
图3是一个说明先前技术的概括性流程图;
图4是一个流程图,它说明了根据本发明所进行的感兴趣区域图像编码;
图5是一个曲线图,它说明了根据本发明,无损失重建的速度与左位移位的函数关系;
图6说明了本发明的PSNR性能;
图7说明本发明利用一个特定重建速率所得的结果;
图8是无损失重建的一张照片,它用的是与图7相同的一张照片,有着同样的感兴趣区域;
图9A和图9B说明了与根据本发明所作编码方法相关的速率失真损失;
图10是一个框图,它说明了一系列用于实施本发明的方框。其中ROI选择是在编码方完成的;
图11是一个框图,它说明了用于实施本发明的各环节,其中的ROI选择是在线完成的。
具体实施方式
本发明的目的是一种完成静止图像压缩的方法和装置,其中处于传输方的用户可以在编码处理前指定在他或她看来是重要的区域,或者是其中处于接收方的用户能够根据正在收到的比特流来确定感兴趣区域,并在其后的编码过程中标识所需区域,以加重感兴趣区域。在第一种情况下,由在传输方的用户确认ROI,编码可以离线完成。当由在接收方的用户标识ROI时,则编码必须在线完成。
当ROI被确定后,压缩方法或算法只对相应于ROI中数据的子波变换系按比例加以放大。压缩方法可以是,举例来说,塞德和皮尔曼的SPIHT方法;为便于进行本描述,将使用SPIHT方法作为例子,但是不应因此而理解为本发明受限于SPIHT应用。前面讨论过的按比例放大是由选定的系数来完成的,这些系数通过一定数目的左位移位而被给予较高的优先级,每一左位移位对应于在每个子带上按比例放大一次或在位数值上增加两倍。左移位数目越大,则对于WT系数加重程度越高,ROI重建的速度增加也就越显著。因此根据本发明,编码器或解码器可以选择感兴趣区域,并控制感兴趣区域重建的速度,或是该感兴趣区域与图像其余部分相比受到额外加重的程度。关于本发明,如图4所示,使用SPIHT型的压缩方法,排序传送作业以起始值或者说n=N的阈值开始。这一方法要求进行N+1次传送来为整个图像编码,使其达到最高的保真度(当子波分解是通过整数变换完成时,则是无损失的)。在完成了编码方法的P次传送(P=0,1,...,N)并且发送了结果输出后,编码器或者解码器标识感兴趣区域,相应的WT系数左位移位S位。应当注意到,P=O相应于由编码器来确定感兴趣区域的情况。因此,S的大数值结果使得感兴趣区域快速无损失重建。S的较低数值则会导致对于感兴趣区域来说较小幅度的速度增加,但也导致对于图像剩余部分的更好的重建,或者是提供了更好的整体速率失真性能。因此通过控制S值,用户就可以控制感兴趣区域相对于图像剩余部分的重要性水平。
图4说明了在象SPIHT这样的一种压缩方法中,本发明的ROI编码。编码之前,或是在编码进行当中,在方框400进行ROI选择。ROI选择后,在方框401,对于给定阈值水平,将ROI系数按比例增大。在方框402和403,分别完成对于ROI图像数据的排序传送和改进传送。在方框404,根据设定阈值来确定是否传送数量已经达到。如果传送数量未尚未达到,则进行进一步的排序和改进。如果传送数量已经完成,则在方框405确定是否ROI数据已经被完全重建了。如果还没有,则对后续的ROI图像数据进行相关的排序和改进。如果ROI已经完成,则在方框406对于图像数据的其余部分作排序和改进传送。排序和改进是根据最大阈限水平N,ROI编码起初的阈限水平k和左位移位值S来进行的。
换言之,假定完成了P次传送,则感兴趣区域与S值一同被选定,并且选定的ROI和S值被反馈给编码器。在P=0的情况下,编码器选择ROI和S,编码可以在离线或在线状态下进行。所有与感兴趣区域有关的WT系数(ROI系数)随后被标识,并向左移位S位。当前的重要性阈值n从当前值(N—P)增加为(N—P+S)。然后重新开始对ROI系数的编码,继续进行S次传送直至重要性阈值n=N-P。对于所有WT系数的编码则要继续进行,直到阈值n<0。应当注意到感兴趣区域的实际形状或轮廓是任意的,只要总的感兴趣区域可描述为或确定为许多相邻矩形或是由许多相邻矩形组成的不相邻的集合即可。感兴趣区域可以是单独一块感兴趣区域,也可以是能够以这里讨论的同样方法处理的许多块感兴趣区域。
换言之,一旦选定一个感兴趣区域,与该感兴趣区域重建相关的WT系数即可在子波变换域中被标识,而且只有这些WT系数被根据一种压缩方法进行编码/解码,这种压缩方法经过修改后,集中对这些特定系数进行编码/解码。因此,与SPIHT这样的压缩方法的具有最高优先级的系数相比,这些相关系数要在更早的阈值循环或更早的通路中被编码/解码。通过从图像域到WT系数域的逆子波变换的反向跟踪对ROI系数进行标识。逆子波变换将WT系数域中的图像表达转换为在图像域中的图像数据。图像中的一个像素是通过逆子波变换,以一对WT系数来重建的。因此,一旦在图像域中指定感兴趣区域,相应的WT系数,也称为ROI系数,即通过从图像域到WT域的逆子波变换的反向跟踪而被标识。
上面讨论的左移位指的是通过左位移位使WT系数按比例增大,每次左位移位相应于放大2倍、4倍、8倍等等,依已知二进制而定。SPIHT编码算法这样的常规方法是从所有系数的最高非零位域(MSB)到最低有效位(LSB)来处理WT系数。依照从MSB到LSB的路径顺序逐位扫描所有系数,即以一种可比方法取得了信息排序。在根据本发明对感兴趣区域编码时,通过将与感兴趣区域有关的WT系数按比例增大而使信息排序,从而使这些系数可以在较早的通路或循环中被处理或访问,因此,将这些ROI系数置于编码比特流中的较前部分。左位移位越大,则在这一比特流中ROI系数所处的位置就越靠前。因此,左位移位的数值越高,则感兴趣区域的重建速度也就越高。
当一个感兴趣区域以无损失方式重建时,在重建的感兴趣区域没有主观和客观损失。图像重建的无损失量是建立在子波变换基础上的,压缩方法以这一子波变换来产生编码比特流。这一编码比特流产生各种比特速率的图像。包括保证总图像的无损失性的图像。但是,如果在无损失性得到保证前编码或解码进程即行终止,则这一重建即要被认为是一个“有损失”重建。编码进程终止时的比特速率越低,则重建结果的损失就越多。因此,如果对感兴趣区域系数的编码早早即被终止,则即使与感兴趣区域以外的区域相比,对感兴趣区域的加重程度更高,感兴趣区域的重建结果也是有损失的。
应当注意到,甚至当子波变换不是整数对整数映射类型的子波变换时,例如通常被称为子带分解的浮点对浮点映射类型的整数变换,QMF,等等,根据本发明所作的感兴趣区域编码仍然能够以上面讨论的方式工作,由于子波变换以及相应的量化过程产生某些不可补救损失,从而导致重建结果不再能被认为是无损失的情况则属例外。但是如果假定子波变换系数的量化结果对应于图像中的原始信息,那么使用这种类型子波变换的本发明的ROI编码系统就可被认为在这种构形下是无损失的。不过,如果对于非整数子波变换方法无法取得实际无损失性,则除非使用整数变换,本权利要求的方法可认为是一种最高保真度的编码方法而非无损失编码方法。
图5和图6是曲线图,说明对一幅512 x 512的图像的完成情况,其感兴趣区域由图7的矩形部分加以说明。这个感兴趣区域是一个128 x 128的方块,包含一部分图像。再参见图5,可看到感兴趣区域的无损失重建速度作为左位移值S的数量的函数而变化。该图表明了在两个不同P值,即P=0和P=7下的结果。图6表明了同样在P=0和P=7情况下,在感兴趣区域无损失重建时,整个图像重建的最大信噪比(PSNR)性能。对于一个确定的P值,在感兴趣区域无损失重建时,对应于给定值S的每个点都与重建PSNR和总比特速率相对应。图7是一张照片,说明本发明使用SPIHT算法,在P=7下,在0.86bbp时PSNR为28.80dB。图8是有着和图7同样的感兴趣区域的同一张照片的无损失重建的照片,重建时P=7,S=7。这幅图像在0.389bpp时PSNR为29.22dB。当S=5时,这个感兴趣区域的重建可在0.710bpp下产生,其PSNR为35.69dB。当S=0(即无确定的感兴趣区域),整个图像的无损失重建在4.378bpp下完成,这与S=7时的情况相比,总比特速率大约要慢一个数量级。因此这些图说明,根据本发明建立的感兴趣区域编码技术为嵌入式的ROI图像编码提供了高效并且灵活的系统,可适用于从各种不同水平的有损失编码直至无损失的ROI图像编码。感兴趣区域的无损失重建和图像其余部分的高效或“无主观损失”重建可在较小比特速率下完成,该比特速率比整个图像的无损失重建所需的速率要小3—4倍。
图9(a)和图9(b)说明了相应于根据本发明的编码方法和装置的速率失真损失。这些图是整个图像的以dB为单位的PSNR与以bpp为单位的总比特速率的性能曲线的图,对应于P=7,S=2以及P=7,S=5时的情况。实线表示常规SPIHT算法的性能,对应于S=2和S=5的改进算法则用“+”和“○”表示。可以看出直到0.086bpp的比特速率为止,所有三种编码方案都是相同的,而在高于0.086bpp的比特速率下,S较大的方案与常规SPIHT方法相比,显示出了较大的速率失真损失,但也取得了更快的感兴趣区域的无损失重建。S=2的方案非常接近于SPIHT结果。
上面讨论的方法涵盖了许多用于图像压缩的实施例,其中感兴趣区域的选择既可在编码之前离线状态下,也可以在线方式在编码进行当中完成,当在传输当中(在线)选择感兴趣区域时,这一选择可在接收方完成。此时接收方对编码或传输方发送关于感兴趣区域的信息,排序和优先级划分过程即被相应地调整。如果编码方包括有一个可在传输或存储数据前模拟解码过程的本地解码器,则在线选择也可由编码方完成。本发明可在一个计算机系统上具体实施,该系统包括有一台显示器,一个中央处理器,内存以及相应的通信装置,诸如一台调制解调器和一条电话线等等。该通信装置的配置可以提供用于输入数字图像数据的输入装置,以使显示装置能够显示数字图像数据。可配置这个计算机系统,使得一个选择设备或选择装置可连接至显示器上以选择感兴趣区域。可将一个排序和优先级划分装置或设备连接至选择装置上,以根据至少两种优先级类别对于数字图像进行排序和优化,与对应于感兴趣区域之外的数字图像数据相比,对应于感兴趣区域的数字图像数据在这一过程中被给予更高的优先级。通信电路或装置可以作为传输装置工作,将经过排序或优先级划分的数据传输到一个远端位置,而传输装置则以比感兴趣区域以外的区域更高的优先级来传输对应于感兴趣区域的数字图像数据。传输过去的数据由一台接收计算机所接收,该接收计算机要包括接收装置或设备来接收传输数据,以及重建装置来重建传输数据,重建装置要包括一个解码装置,用于为排序和优先级划分后的数字图像数据解码。感兴趣区域由重建装置来重建,其速率高于对应于感兴趣区域以外的区域的数字图像数据。还有一个替代方法,即感兴趣区域能够以比感兴趣区域之外区域更高的保真度来重建。
感兴趣区域编码起始的阈值或通路可在对总图像的排序传送开始时,或在排序传送进行当中确定;还可以在改进传送开始时或进行当中确定;或是在整个编码过程开始时确定。如果在整个编码过程开始时确定,则这一操作可以离线方式完成。在一次排序或改进传送开始时完成的ROI选择则是一个交互式的或是在线的选择。换言之,在n等于ROI编码水平的情况下,ROI系数按比例增大,对于n=k+s;n>k则进行排序传送和改进传送。
相应于本发明的系统的另一个选择的实施例可以是这样情况:其感兴趣区域的选择基于部分重建图像来进行,该部分重建图像是接收器在传输装置开始其传输后所接收到的。根据这部分重建图像,接收端的用户可选择感兴趣区域,然后由接收器向传输计算机发送标识所选感兴趣区域的数据。传输计算机随后根据所选感兴趣区域修改数字图像数据的排序。对应于这一感兴趣区域的数字图像数据与感兴趣区域以外的数字图像数据相比,被排序和优先级划分以具有更高的优先级。经过修改排序和优化的数据随后被传输到接收器,感兴趣区域以较感兴趣区域之外区域更高的优先级被传输。为具备执行以上确定的操作的装置,计算机单元的特定配置可由此技术领域中的熟练人员根据包含在技术规格中的信息来完成。
图10是一个框图,它说明了在ROI选择由编码方完成的情况下,实施本发明的一系列环节。输入装置或输入设备110用于将数字图像数据输入到计算机或数据处理装置中。显示装置或设备111显示数字图像数据,选择装置112连接到显示设备上,用于选择由数字图像数据所表示的图像的一个区域。排序和优先级划分装置113连接到选择装置112上,根据至少两个优先级类别对数字图像数据进行排序和优先级划分。所选感兴趣区域的数据与对应于感兴趣区域以外区域的数字图像数据相比,被给予了更高的优先级。传输装置114将经过排序和优先级划分的数据传输到一个远程位置,这个远程位置可以为一个大容量存储器装置,互联网或网内网这样的网络,广域网络,局域网络,等等。传输过去的数据由接收装置115所接收,在这里由具备解码装置117的重建装置116来重建传输来的数字图像数据,其中与对应于感兴趣区域之外区域的数字图像数据相比,感兴趣区域要以更快的速度以及/或者更高的保真度重建。
图11为一个框图,它说明以在线方式进行的感兴趣区域选择过程。输入装置或输入设备121将数字图像数据输入到一台计算机或是其它图像数据处理装置中。数字图像随后可被任选地显示在显示装置122上,或者作为替代方式,可直接与排序装置或排序设备123进行通信。排序装置根据一个数学排序协议为数字图像数据排序,使得数字图像数据按照预定的优先级划分公式被排序和优先级划分。传输设备或传输装置124将经过排序的数据传输出去,然后排序装置再重复对数字图像数据的排序,传输装置也重复对数据的传输。这些数据由一台接收装置125所接收,而该装置有显示装置126与其相连。在传输过程中,这台显示装置将传输来的数据显示为部分重建的图像。图像的重建随着排序装置和传输装置重复其排序和传输而进行。感兴趣区域选择装置127连接到接收装置125上,以便根据部分重建的图像选择感兴趣区域。在选择了感兴趣区域后,一台感兴趣区域传输装置或设备128将对应于所选感兴趣区域的数据传输到排序装置123。排序装置根据对应于所选感兴趣区域的数据而修改数字图像数据的排序。经过排序装置的排序和优先级划分后,对应于所选感兴趣区域的数字图像数据与对应于所选感兴趣区域之外区域的数字图像数据相比,具有更高的优先级。
本发明以计算机软件的形式具体实施在一个计算机可读存储介质上,这个计算机可读存储介质包括软盘和大容量存储设备,如硬盘驱动器、DRAM、CD—ROM,等等。该计算机软件控制一台通用计算机以完成以上所述的方法步骤。
如以上所讨论的,本发明被应用于一台传输计算机或设备上,数据被发送到一台接收器或一台解码装置。本发明可包括这样的配置:在该配置中,在一台计算机上完成编码;经过编码的图像数据被传输到互联网上用于互联网浏览;解码则在另一台从互联网上检索信息的计算机上进行。编码器和解码器也可配置在一个局域网(LAN)上,或是广域网(WAN)、网中网上,也可在一台计算机和一台大容量存储装置之间进行编码和解码。因此其用途实际上可包括任何必须进行图像数据传输或存储的应用,包括远程医疗和一般图像存档及检索。依据本发明的感兴趣区域编码方法和装置解决了在这些应用中存在的瓶颈问题。
本发明的以上描述仅用于说明目的。应当认识到,可以用其它的压缩方法来利用依据本发明而进行感兴趣区域的选择和重建,而且以上所披露的各种装置也有着许许多多的等效物,而对于一个具备这方面技术的人来说,这些等效物是在其了解范围内的。本发明的界定和范围在随附的权利要求中明确说明。

Claims (6)

1.一种图像压缩方法,所述方法包括以下步骤:
选择由数字图像数据所表示的图像的一个感兴趣区域;
将对应于所选图像的所述数字图像数据的变换系数以预定的数量进行左移位,所述预定的数量是与所需放大比率相对应的;
与对应于所述感兴趣区域以外区域的数字图像数据相比,较早地输出对应于所述变换系数的移动位的所述数字图像数据。
2.根据权利要求1所述的图像压缩方法,其中所述预定的数量包含可变的数量。
3.根据权利要求2所述的图像压缩方法,其中所述输出步骤包括:与变换系数的较少移动位相比,较早地输出对应于变换系数的较多移动位的所述数字图像数据。
4.根据权利要求2或3所述的图像压缩方法,所述可变的数量对应于编码变换系数的排序。
5.根据权利要求2所述的图像压缩方法,所述可变的数量越大,所述变换系数越早被放置在所述数字图像数据中。
6.根据权利要求1所述的图像压缩方法,所述方法包括以下步骤:
输出所述选择的感兴趣区域的信息,所述信息被用于识别所述选择的感兴趣区域。
CNB2004100747088A 1998-03-20 1998-03-20 编码和解码及压缩图像的方法和装置 Expired - Lifetime CN100481946C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US80381198A 1998-03-20 1998-03-20
PCT/US1998/003811 WO1999049413A1 (en) 1998-03-20 1998-03-20 Lossy/lossless region-of-interest image coding

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB988139065A Division CN1175373C (zh) 1998-03-20 1998-03-20 有损失/无损失感兴趣区域图像编码的方法和系统

Publications (2)

Publication Number Publication Date
CN1592419A CN1592419A (zh) 2005-03-09
CN100481946C true CN100481946C (zh) 2009-04-22

Family

ID=25187487

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100747088A Expired - Lifetime CN100481946C (zh) 1998-03-20 1998-03-20 编码和解码及压缩图像的方法和装置

Country Status (3)

Country Link
JP (1) JP3597779B2 (zh)
KR (1) KR100714903B1 (zh)
CN (1) CN100481946C (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7525463B2 (en) * 2003-04-17 2009-04-28 Droplet Technology, Inc. Compression rate control system and method with variable subband processing
JP4514464B2 (ja) * 2004-02-09 2010-07-28 三洋電機株式会社 画像符号化装置および画像復号装置、ならびにそれらを利用可能な画像表示装置および方法
CN1655620B (zh) 2004-02-09 2010-09-22 三洋电机株式会社 图像显示装置
US7720295B2 (en) 2004-06-29 2010-05-18 Sanyo Electric Co., Ltd. Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality
JP4656912B2 (ja) 2004-10-29 2011-03-23 三洋電機株式会社 画像符号化装置
US8693537B2 (en) 2005-03-01 2014-04-08 Qualcomm Incorporated Region-of-interest coding with background skipping for video telephony
US8768084B2 (en) * 2005-03-01 2014-07-01 Qualcomm Incorporated Region-of-interest coding in video telephony using RHO domain bit allocation
US7724972B2 (en) * 2005-03-01 2010-05-25 Qualcomm Incorporated Quality metric-biased region-of-interest coding for video telephony
DE112005003791T5 (de) * 2005-12-28 2008-09-25 Intel Corporation, Santa Clara Ein neues, auf benutzersensitive Informationen anpassungsfähiges Videotranscodierungsrahmenwerk
KR101368120B1 (ko) * 2006-05-25 2014-02-28 톰슨 라이센싱 가중 인코딩을 위한 방법 및 시스템
JP4841504B2 (ja) * 2007-05-31 2011-12-21 三洋電機株式会社 画像符号化装置および方法
JP5100311B2 (ja) * 2007-10-29 2012-12-19 キヤノン株式会社 動画像データ送信方法、通信装置、及びプログラム
KR101885258B1 (ko) 2010-05-14 2018-08-06 삼성전자주식회사 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
JP2010206847A (ja) * 2010-06-23 2010-09-16 Sanyo Electric Co Ltd 画像処理装置
JP2012186616A (ja) * 2011-03-04 2012-09-27 Sony Corp 情報処理装置、情報処理方法、及び、プログラム
JP5639228B2 (ja) * 2013-06-18 2014-12-10 トムソン ライセンシングThomson Licensing 重み付け符号化する方法及びシステム
CN104301731B (zh) * 2014-10-24 2017-04-26 湘潭大学 一种反馈式图像质量分层方法
CN108076345A (zh) * 2016-11-09 2018-05-25 阿里巴巴集团控股有限公司 多视角视频帧的编码方法、传输方法、装置、计算机
JP7171768B2 (ja) 2018-06-28 2022-11-15 アップル インコーポレイテッド 動画符号化システム
DE102018221920A1 (de) * 2018-12-17 2020-06-18 Robert Bosch Gmbh Inhaltsadaptive verlustbehaftete Kompression von Messdaten
CN110827399A (zh) * 2019-11-11 2020-02-21 四川航天神坤科技有限公司 一种三维模型数据压缩方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5663763A (en) * 1992-10-29 1997-09-02 Sony Corp. Picture signal encoding method and apparatus and picture signal decoding method and apparatus
KR0119276B1 (ko) * 1993-12-15 1997-09-30 양승택 영상복원용 역양자화 회로

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
A NEW,FAST AND EFFICIENT IMAGE CODEC BASED ON SETPARTITIONING IN HIERARCHICAL TREES. Said A et al.IEEE Transactions on Circuits and Systems For Video Technology. 1996
A NEW,FAST AND EFFICIENT IMAGE CODEC BASED ON SETPARTITIONING IN HIERARCHICAL TREES. Said A et al.IEEE Transactions on Circuits and Systems For Video Technology. 1996 *
A REGION OF INTEREST(ROI) BASED WAVELET COMPRESSIONSCHEME FOR MEDICAL IMAGES. KONGKYOO SHIN ET AL.SPIE ISSN 0277-786X 3031. 1997
A REGION OF INTEREST(ROI) BASED WAVELET COMPRESSIONSCHEME FOR MEDICAL IMAGES. KONGKYOO SHIN ET AL.SPIE ISSN 0277-786X 3031. 1997 *
A REGION-OF-INTEREST(ROI) BASED WAVELET COMPRESSION SCHEME FOR MEDIA IMAGE. Dongkyoo Shin et al.Proceedings of the SPIE - The International Society For Optical Engineering SPIE-Int. Soc. Opt. Eng USA, ISSN:0277-786X. 1997
AN IMAGE MULTIRESOLUTION REPRESENTATION FOR LOSSLESS AND LOSSY COMPRESSION. Said A et al.IEEE Transactions on Image Processing, IEEE INC. NEW YORK, US, ISSN:1057-7149. 1996
文章题目 DYNAMIC REGIONBASED WAVELET COMPRESSION FOR TELEMEDICINE APPLICATION. Hui Li et al.Proceedings of the SPIE - The International Society For Optical Engineering SPIE-Int. Soc. Opt. Eng USA, ISSN:0277-786X. 1997

Also Published As

Publication number Publication date
KR20060106930A (ko) 2006-10-12
CN1592419A (zh) 2005-03-09
JP3597779B2 (ja) 2004-12-08
JP2002508606A (ja) 2002-03-19
KR100714903B1 (ko) 2007-05-04

Similar Documents

Publication Publication Date Title
CN1175373C (zh) 有损失/无损失感兴趣区域图像编码的方法和系统
CN100481946C (zh) 编码和解码及压缩图像的方法和装置
US7257266B2 (en) Lossy/lossless region-of-interest image coding
Said et al. A new, fast, and efficient image codec based on set partitioning in hierarchical trees
US6801665B1 (en) Method and apparatus for compressing and decompressing images
Wang et al. Multiple description coding using pairwise correlating transforms
US20040170335A1 (en) N-dimensional data compression using set partitioning in hierarchical trees
US6671413B1 (en) Embedded and efficient low-complexity hierarchical image coder and corresponding methods therefor
US6198412B1 (en) Method and apparatus for reduced complexity entropy coding
Yeung et al. Efficient rate control for JPEG2000 image coding
JP3631256B2 (ja) ツリー・コード化無損失画像圧縮
DE60200377T2 (de) Datenkompression
Flamich et al. Compression without quantization
Ansari et al. Context based medical image compression with application to ultrasound images
EP1862940A1 (en) Image compression
Ranjan et al. An Efficient Compression of Gray Scale Images Using Wavelet Transform
Ravi et al. Optimized two dimensional wavelet filter from BAT algorithm
Fukuma et al. A relative quality controlled region-of-interest image coding based on wavelet transform
Jafarkhani Wavelet coding of images: adaptation, scalability, and transmission over wireless channels
CN117793289A (zh) 一种视频传输方法、视频重建方法及相关设备
Ponlatha et al. Implementation Of Wavelet And Neural Network For Image Compression
Kore et al. An Efficient Image Compression Technique using 2D-DWT and FELICS Algorithm for Different Class of Images (COI)
Ilango et al. Optimized Image Compression using Geometric Wavelets and Genetic Algorithm
Aseena et al. A Review on Emerging Techniques in Digital Image Compression
Kiely et al. Combined Industry, Space and Earth Science Data Compression Workshop

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20090422