CN110383835B - 使用用于gcli熵编码的子带相关预测适应进行编码或解码的装置和方法 - Google Patents

使用用于gcli熵编码的子带相关预测适应进行编码或解码的装置和方法 Download PDF

Info

Publication number
CN110383835B
CN110383835B CN201780078866.6A CN201780078866A CN110383835B CN 110383835 B CN110383835 B CN 110383835B CN 201780078866 A CN201780078866 A CN 201780078866A CN 110383835 B CN110383835 B CN 110383835B
Authority
CN
China
Prior art keywords
mode
data
coefficients
encoded
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780078866.6A
Other languages
English (en)
Other versions
CN110383835A (zh
Inventor
约阿希姆·凯纳特
查尔斯·丹尼尔·巴斯查特
瓦伦丁·德西
米格尔·安吉尔·马丁内斯·德·阿莫
帕斯卡尔·休伯特·佩列格林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intopix SA
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Intopix SA
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intopix SA, Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Intopix SA
Publication of CN110383835A publication Critical patent/CN110383835A/zh
Application granted granted Critical
Publication of CN110383835B publication Critical patent/CN110383835B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/645Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种用于对图像数据进行编码的装置,所述图像数据被分解成多个不同子带(101‑109),每个子带包括多个系数,其中分区包括来自不同子带的不同系数集合(1001,1002),其中第一分区(300)的两个系数集合(1001,1002)属于由所述图像数据表示的图像的第一空间区域,所述装置包括:处理器(600),用于为集合内的每一系数组(1011‑1014)确定最大编码行索引(GCLI);编码器(600),用于根据第一编码模式对与第一分区(300)的第一集合(1001)相关联的最大编码行索引进行编码,以及用于根据第二编码模式对与所述第一分区的第二集合(1002)相关联的最大编码行索引进行编码,所述第二编码模式不同于所述第一编码模式;以及输出接口(680),用于输出具有关于已编码的最大编码行索引的数据(1103)和关于所述系数的数据的编码图像信号。

Description

使用用于GCLI熵编码的子带相关预测适应进行编码或解码的 装置和方法
说明书
本发明涉及图像编码,特别涉及依赖于最大共同行索引(greatest common lineindex,GCLI)熵编码的图像编码。
1.1图像变换
图像和视频压缩通常在运行熵编码之前应用变换。例如,参考文献[5]使用了基于块的预测,而参考文献[1][2][3][4]则提倡小波变换。
图1中描述了这种小波变换。它将图像分解为多个子带。如图1中所描述的,水平分解的数目可能不同于垂直分解的数目。在每个分解步骤中,先前分解的低通子带被进一步分解。L5子带表示图像的子采样版本,而其他子带包含细节信息。
在频率变换之后,子带的系数被熵编码。换句话说,子带ABm的g>1个系数(其中A,B∈{L,H},)被形成为系数组。随后,剩余位平面的数目被信号化,后面跟着原始数据位。在下文中解释该编码技术的更多细节。
图1示出图像的具体示例性小波变换。在本示例中,假设两个垂直分解和四个水平分解。
具体来讲,第一子带是由垂直方向或者y轴方向上的高通滤波和水平方向或者x轴方向上的低通滤波产生的子带HL1 101。由HH1指示的子带102是由垂直和水平两个方向上的高通滤波动作产生的。此外,在LH1处指示的子带103是通过对图像进行低通滤波后产生的子带进行垂直低通滤波和水平高通滤波而产生的。此外,在HH2处指示的子带105是通过对图像进行低通滤波后产生的子带进行垂直和水平高通滤波动作而产生的。
此外,在HL2处指示的子带104是通过对图像进行低通滤波后产生的子带进行垂直高通滤波和水平低通滤波而产生的。此外,在LH2处指示的子带106是通过对图像进行低通滤波后产生的子带进行垂直低通滤波和水平高通滤波而产生的。类似地,子带107是通过在水平和垂直两个方向上进行两次低通滤波后产生的子带进行水平高通滤波而产生的,并且在H4处指示的子带108是通过对在垂直方向上进行两次低通滤波和在水平方向上进行三次低通滤波后产生的子带进行垂直高通滤波而产生的,并且子带109示出近似的低通图像。
图2a示出GCLI编码的原理,其中一组系数由四个值构成,其中每个值通过若干个位平面(比如八个位平面)和在s0、s1、s2、s3处指示的符号位来表示。当然,可以形成任何其他系数组,比如仅仅具有两个系数或者仅仅具有三个乃至多于四个系数的组。此外,存在用于每一颜色的每个子带101至109中的每一位置的单个系数。因此,由于使用了三色表示,所以对于图1中示出的每一子带中的每一位置,存在三个系数。
1.2编码原理
图2a示出GCLI编码的原理。属于频率变换的相同子带的多个系数(大于一个)被组合成一组。这些系数以符号-数值的形式表示。组中的最大系数确定有效位平面的数目。如果位平面自身或者任何先前的(更重要的)位平面的至少一个系数位不等于零,则该位平面被称作有效的。有效位平面的数目是通过所谓的GCLI值(最大编码行索引)给出的。GCLI值为零意味着没有位平面是有效的,因此整个系数组是零。
对于有损编码,一些位平面可能被截断(truncated)。这对应于以作为2的幂的因数进行量化。该量化是通过所谓的GTLI(最大裁剪(Trimmed)行索引)规定的。GTLI为零对应于不量化。量化之后剩余的有效位平面在下文中被称作剩余位平面。而且,在下文中GTLI也被称作截断点。
随后,这些剩余位平面作为原始位被传输到解码器。为了实现正确的解码,解码器需要知道每一系数组的剩余/传输的位平面的数目。因此,它们也需要被信号化并送至解码器。这是通过可变长度编码来完成的,所述可变长度编码表示与先前系数组的剩余位平面的数目之间的差异。所述先前系数组原理上可以是编码器先前已经编码的任何系数组。因此,它例如可以是水平或者垂直的相邻组。
下文中将描述的方法对于不同位流部分的传输顺序是不可知的(agnostic)。例如,可以首先将所有子带的GCLI系数放入位流中,跟着放置所有子带的数据位。可替代地,GCLI和数据位也可以被交织。
1.3系数组织结构
图1中描绘的频率变换的系数是以图3中描绘的所谓分区(precinct)的方式组织的。分区对属于输入图像中的相同空间区域的不同子带的系数进行分组。
图3的上部分示出图1中示出的各个子带101至109内的各个分区1,2,…的分布。通常,分区定义具有例如两行高度的空间区域,其具有与图像相同的宽度,并且例如包括3840列。当然,分区还可以包括其他行高度,比如三行或者四行乃至更多行高,以及更多或者更少的列。然而,优选的是可以被二整除的行数。
具体来讲,该分区具有在301和302处指示的第一个两行HH1、和在303、304处指示的第一个两行LH1。此外,该分区具有在305和306处指示的第一个两行HL1和在309处指示的单行HL2、在307处指示的单行HH2、在308处指示的单行LH2、在310处指示的单行H3、在311处指示的单行H4、和在312处指示的单行L5。用于一幅图像的最终分区数目取决于该图像的行数以及分区内包括多少行。
1.4预测方案
为了使解码器能够恢复信号,解码器需要知道每一系数组的GCLI值。可在现有技术[2]中获得将GCLI值有效地信号化的不同方法。
1.4.1原始模式
在原始模式下,以不作出任何预测或通过基于零进行预测的方式,来传输GCLI值。因此,将F1设为接下来将要编码的系数组。随后,可以通过以下预测残差对GCLI值进行编码:
δ=max(GCLI(F1)-GTLI(F1),0)
对于该值,可以使用两种不同的编码。第一种编码是将δ作为固定长度二进制码传输,其中一个示例在以下表格中示出。
预测残差δ 编码后的值
0 0000
1 0001
2 0010
3 0011
第二种编码是可变长度无符号一元编码,该编码在下表中描绘,并且还在[7]描述为无预测的GCLI无符号一元编码。
预测残差δ 编码后的值
0 0
1 10
2 110
3 1110
在替代实施例中,可以通过在上述表格中将0替换为1(反之亦然)来构造替代编码。
1.4.2水平预测
将F1和F2设为两个水平相邻的系数组,由g>1个系数组成。将F2设为当前要编码的系数组。随后,GCLI(F2)可以被信号化,并通过传输以下值而被送至解码器:
解码器通过计算下式来恢复GCLI(F2):
在水平预测中,通常TLI(F1)=GTLI(F2)是有效的,δ通常作为可变长度编码传输。
实质上,这意味着:
δ=max(GCLI(F2),GTLI(F2))-max(GCLI(F1),GTLI(F2))
1.4.3垂直预测
将F1和F2设为两个垂直相邻的系数组,由g>1个系数组成。将F2设为当前要编码的系数组。
GCLI(F2)可以以在部分1.4.2中相同的方式来编码。
在替代实施例中,可以使用以下预测公式进行垂直预测:
δ=max(GCLI(F2),GTLI(F2))-max(GCLI(F1),max(GTLI(F1),GTLI(F2)))
随后,解码器通过计算下式来恢复GCLI(F2):
GCLI′(F2)=δ+max(GCLI(F1),max(GTLI(F1),GTLI(F2))
1.5编码模式
除了预测模式之外,还可以使用不同的编码模式。参考文献[6]例如提议了一种用于更有效地压缩零GCLI的方法。为此目的,对于每一个由八个GCLI构成的组,单个标志位指示该GCLI组是否是零。零GCLI组不再被进一步编码,而非零GCLI组按照部分1.4.2中所述的方式编码。
在下文中,为了简单起见,编码模式被简单地认为是附加的预测模式。
在图2b中,针对相对于编码器侧的水平或者垂直预测模式,示出了用于不同编码模式的计算的示例性等式。此外,图2c示出用于在解码器侧执行的水平/垂直预测模式的示例性等式,而图2d示出原始模式的功能性。
在现有技术[2]中,以分区为基础来选择所要使用的预测方法。换句话说,该分区的所有子带的GCLI值是通过相同方案预测的。然而,这并不会利用编解码器的全部潜力。
一个目的是提供一种改进的用于图像处理的编码或者解码方案。
该目的是通过根据权利要求1的用于对图像数据进行编码的装置、根据权利要求24的用于对编码图像信号进行解码的装置、根据权利要求40的用于对图像数据进行编码的方法、根据权利要求41的用于对编码图像信号进行解码的方法、根据权利要求42的编码图像信号或者根据权利要求43的计算机程序来实现的。
本发明是基于以下发现作出的:一方面的编码效率或者另一方面的编码质量可以通过为分区内的每一子带,即为来自分区内的子带的多个系数中的每一系数,确定用于对最大编码行索引(GCLI)数据进行编码的自有编码模式而得到增强。
因此,一种用于对图像数据进行编码的概念依赖于系数集合内的每一系数组的最大编码行索引的确定,其中图像数据被分解成多个不同子带,每个子带包括多个系数,并且分区包括来自不同子带的不同系数集合,其中分区的两个系数集合属于由该图像数据表示的图像的某一空间区而且附加地,依赖于用于根据第一编码模式对与分区的某一集合相关联的最大编码行索引进行编码以及根据第二编码模式用于对与相同分区的第二集合相关联的最大编码行索引进行编码的编码器,其中第二编码模式不同于第一编码模式。此外,用于对图像数据进行编码的装置的输出接口输出编码图像信号,所述编码图像信号具有关于各个子带/系数集合的已编码的最大编码行索引的数据、并且附加地具有关于对应系数的数据。
在解码器侧,本发明依赖于以下功能性:存在用于为关于分区内的不同子带的已编码的最大编码行索引的数据确定不同解码模式的解码模式确定器,其中关于系数的数据表示被分解为多个不同子带的图像数据,每个子带包括多个系数,其中该分区包括来自不同子带的不同系数集合。特别是,用于对关于第一分区中的第一集合的已编码的最大编码行索引的数据进行解码的解码器使用第一解码模式,而为了对关于该分区中的第二集合的已编码的最大编码行索引的数据进行解码,解码模式确定器确定使用第二解码模式。此外,随后使用通过为每一子带或者每一系数集合使用不同解码模式而获得的已解码的最大编码行索引数据,对关于系数的数据进行解码。
由于使得能够为分区内的各个系数集合或者各个子带设置各自的编码或者解码模式,所以计算效率得到增强,这是因为用于对最大编码行索引(GCLI)值进行编码的位数减少了。这是由于以下事实:在子带内很有可能存在相关的或者密切有关的GCLI值,使得它们对于某种预测有用,然而对于不同子带,该GCLI值可能在分区内显著地变化。
优选实施例依赖于基于各个子带的实际模式确定。因此,在实施例中,可以为每个子带预先确定特定编码模式,而不管实际数据如何。这种过程是极有效的,因为不必将编码模式从编码器传输至解码器,而可以在编码器侧和解码器侧预先确定。
其他实施例依赖于基于图像数据的编码模式的实际确定。一种具体实施例依赖于用于各个子带或者分区的数据预算的计算,以便确定每一子带的编码模式。该过程可以被充分地集成到基于与某一截断点对应的GTLI过程(GTLI=最大裁剪水平索引或者最大裁剪行索引)的量化确定内使用。然而,GTLI编码还可以作为无损编码使用,其中不执行任何截断并且因此任何GTLI处理都不是必需的。然而,优选的是除了GCLI处理外还使用GLTI处理,以便视情况使位速率适配于某一目标位速率或者获得恒定的位速率。
进一步的实施例依赖于混合过程,其中对于一分区内的某些子带,预先确定相同或者不同的编码模式,而对于其他子带,通常是表示高分辨率信息的较低子带,基于所要求的位预算计算编码模式,即,基于实际图像数据计算。
进一步的实施例依赖于用于系数组的最大编码行索引确定,其中一组内的系数的数目大于二,优选为等于四。此外,执行基于所确定的截断点的实际的有损编码或者量化,即GTLI处理,以便为整个分区确定相同GTLI。然而,在其他实施例中,为单个子带确定相同GTLI。因此,优选的是为截断点确定使用比最大编码行索引确定更高的粒度(granularity)。
在进一步的实施例中,执行三种不同的编码模式,即水平预测模式、垂直预测模式或者没有任何预测的原始模式。然而,也可以执行其他编码模式,比如行程长度模式,或者不是在水平方向或者垂直方向上、而是在一种偏斜方向上的预测模式,其中例如不在彼此垂直邻接的GCLI值之间执行预测,而是在与彼此水平平移的系数相关联的GCLI之间执行预测。因此,可以按照需要确定不同的编码模式,并且因此可以将编码模式确定为五种、六种乃至更多种编码模式。此外,编码模式不必始终包括水平或者垂直预测模式,而是不同的编码模式还可以包括例如原始模式和偏斜模式或者任何其他编码模式组合。
在进一步的实施例中,在编码器或者解码器内执行其他过程。具体来讲,可以在对图像数据引入离散小波变换操作之前,对图像数据执行颜色变换。可替代地或者附加地,可以在执行GCLI提取之前执行符号-数值变换。
此外,GCLI预测的结果可以被熵编码,比如通过使用一元编码,而例如原始数据被按照原样引入位流中,即,不进行进一步的编码。
此外,可以将系数数据的截断或者GTLI裁剪的结果按照原样引入数据流中,即,被打包到数据流中,但是替代地,也可附加地使用进一步的编码操作,比如哈夫曼编码或者算术编码或者任何其他种类的熵编码。然而,由于复杂性的原因,优选的是对GTLI控制的裁剪或者截断的输出进行打包,即,将GCLI指示的位平面和GTLI指示的位平面之间的剩余位直接打包到编码图像信号中,即,直接打包到二进制数据的位流中。
随后将相对于所附的附图来讨论本发明的优选实施例,其中:
图1示出具有示例性的两个垂直分解和五个水平分解的图像的小波变换;
图2a示出GCLI编码的原理;
图2b示出用于相对于编码器侧的水平或者垂直预测的预测规则;
图2c示出用于相对于与解码器侧相关的水平或者垂直预测的“反向”预测的预测规则;
图2d示出原始模式;
图3示出分区组织结构;
图4示出每个子带的子带适应预测方案的方框图;
图5示出用于减少的编码器复杂性的固定预测方案;
图6示出根据实施例的用于对图像数据进行编码的装置的方框图;
图7示出根据实施例的用于对图像数据进行解码的装置;
图8a示出用于确定用于子带的编码模式的模式确定器的实施方式;
图8b示出用于子带的编码模式的计算的编码模式确定器的进一步实施方式;
图8c示出编码模式确定器的进一步实施例;
图8d示出基于原始数据缓存器以及例如通过图8c的处理确定的子带的选定截断点进行的量化的处理;
图9示出对GTLI值的确定与量化处理的协作进行图示的一个方面的进一步实施例;
图10示出具有用于第一子带的第一系数集合、用于第二子带的第二系数集合和各个系数组的分区;
图11示出通过例如图6的用于编码的装置输出的、或者被输入到例如图7的用于解码的装置的编码图像信号;
图12示出通过包括在图11的用于对编码图像信号进行解码的装置内的解码器执行的过程;
图13示出进一步实施例中的编码器的方框图;
图14示出进一步实施例中的解码器的方框图;
图15示出编码器的一个方面的进一步实施方式;以及
图16示出显示熵编码器和速率分配之间的协作的示意图。
图6示出用于对图像数据进行编码的装置,其中该图像数据被分解成多个不同子带,其中每个子带包括多个系数。具体来讲,分区包括来自不同子带的不同系数集合,第一分区的两个系数集合属于由该图像数据表示的图像的第一空间区域,并且例如第二分区的两个系数集合属于由该图像数据表示的图像的第二空间区域,其中第一空间区域和第二空间区域彼此不同,并且优选为甚至彼此排斥,以使得第一空间区域和第二空间区域不具有任何共同的子带位置。在这样的情况下,当将变换系数与其中心滤波器系数相关联的时候,系数的空间区域可以或者通过在变换系数的域中直接地定义,或者在图像域的域中直接地定义。
用于对图像数据进行编码的装置包括处理器600,其用于为系数集合内的每一系数组确定最大编码行索引(GCLI)。此外,该装置包括编码器660,其用于根据第一编码模式对与第一分区的第一集合相关联的最大编码行索引进行编码,以及用于根据第二编码模式对与第一分区的第二集合相关联的最大编码行索引进行编码,第二编码模式可能不同于第一编码模式。此外,该装置包括输出接口680,其用于输出具有关于已编码的最大编码行索引的数据和关于系数值的数据的编码图像信号(out)。特别是,使用也在图6中示出的图像数据/系数编码器620对系数编码。图像数据/系数编码器620优选为接收与输入到处理器600中的图像数据相同的图像数据,来作为输入。附加地,块620也为每一组接收GCLI数据,并且块620输出关于系数的数据,该关于系数的数据也被包括在输出接口680输出的数据信号中。优选为,所使用的编码模式是垂直预测模式、水平预测模式、原始编码模式或者零行程长度模式,或者如先前所述的偏斜预测模式或者任何其他编码或者处理模式。
图7示出用于对编码图像信号进行解码的对应装置。编码图像信号被输入到解码器720。附加地,该用于解码的装置包括用于为关于分区内的不同子带的已编码的最大编码行索引的数据确定不同的解码模式的解码模式确定器。分区的每个子带的这种解码模式经由连接730从解码模式确定器700转送到解码器720。取决于实施方式,当在编码图像信号中包括解码模式指示的时候,将编码图像信号馈送至解码模式确定器700,以提取解码模式。然而,在其他实施例中,当每个子带的解码模式是固定的或者是预先确定的时候,则解码模式确定器仅仅为每个子带使用这种预先确定的解码模式分配,而不需要编码图像信号。因此,为了显示可选性,以虚线的方式示出了编码图像信号和解码模式确定器700之间的连接。因此,引入块700的标示为“预先确定的子带解码模式分配”的箭头也以虚线示出。
图8a示出编码模式确定器640的优选实施方式,编码模式确定器640也在图6中示为连接到用于进行GCLI编码的编码器660。模式确定器640构造为基于系数集合所属的对应子带,为该系数集合确定第一编码模式和第二编码模式。该过程在图8a中的块802和804处示出。图5中为示例性的九个子带101、102、103、104、105、106、107、108、109中的每一子带示出了每个子带分配的示例性编码模式。特别是,子带101、104依赖于用于GCLI数据的编码的水平预测模式,其他子带102、103、105、106、107、108、109依赖于每个子带的垂直预测模式。
在替代实施例中,如图8b中所示,执行通过模式确定器640执行的用于子带的编码模式的确定。特别是,模式确定器640构造为通过针对第一分区以及第一分区内的第一系数集合、并且针对第一编码模式计算810第一位预算,确定第一编码模式和第二编码模式。此外,模式确定器640针对第一分区和第一系数集合计算812第二位预算,但是现在针对的是第二编码模式。由块810、812计算的第一位预算和第二位预算两者都被模式确定器640用来选择用于第一分区的第一系数集合选择814的编码模式。随后,在由图6的输出接口680执行的步骤816中,将为第一系数集合选择的编码模式的指示包括到编码图像信号中。这也通过图6的虚线660指示。在超过两个编码模式的情况下,以上步骤据此重复。
图4示出每个子带的子带适应预测方案的方框图的进一步实施方式。
图4示出对应的方框图。频率变换400的输出在被发送到预算计算块410-414之前,被可选地量化402。预算计算块410-414为每一子带以及为每一可能的GTLI(截断点)和每一相关的预测方法计算用于所要编码的分区的给定子带的要求预算。
通过这种信息的支持,预测模式选择器421-425为每一子带和每一可能的截断点选择所使用的最佳预测方法。通常,这是通过选择具有用于对GCLI编码的最小结果位预算的预测方法来实现的。可替代地,可以使用基于先前数据的启发式算法。
这一信息随后被转送至速率控制430,速率控制430组合可用的速率信息并且为每一子带选择截断点。随后,使用通过预测模式选择器421-425为所选定的截断点确定的预测方法,来执行编码。
为了使解码器能够正确地对图像进行解码,在位流中包括对应的信号化信息(图1中的660),向解码器告知为每一子带选择的预测方案。假定仅仅在分区子带的粒度上要求这一信号化信息,并且该信号化仅仅要求少量的位,则可以忽视对于编码效率的影响。
图8c示出模式确定器640的进一步实施方式。该模式确定器包括与图4的块410至414对应的子带预算计算器、用于对图4的块421-425作出响应的预测模式选择器、预算组合器431和截断点选择器432,其中预算组合器431和截断点选择器432两者一起形成图4中的430处示出的速率控制。
特别是,子带预算计算器410至414计算位,或者一般来讲,计算用于(1)每一子带、(2)每一截断点(GTLI)和(3)每一GCLI编码模式的数据预算。因此,当存在例如两个子带、五个不同的截断点和三个不同的GCLI编码模式的时候,则块410-414,即子带预算计算器,计算30种不同的数据预算。这是通过送入块410-414中的由子带ID、GCLI标识符和编码模式标识符组成的输入示出的。
基于子带预算计算器的结果,预测模式选择器产生位,或者一般来讲,用于(1)每一子带和用于(2)每一截断点(GTLI)的数据预算,并且特别来讲,现在针对的是选定的GCLI编码模式的数据预算。请注意,所选定的GCLI编码模式可能取决于所考虑的截断点。每个子带和每个截断点的选定的GCLI编码模式由预测模式选择器经由线660输出,线660也在图6中示出了。因此,根据由子带预算计算器为以上示例产生的原始的30个值,现在存在通过选择使用最佳预测模式或者一般来讲使用选定的GCLI编码模式获得的剩余的十个位/数据预算值。
这些示例性的十个值现在由预算组合器431接收,预算组合器431通过组合用于每一截断点的各个子带方式的预算值,为每一截断点计算用于分区的完整的位/数据预算。因此,对于此处的示例,预算组合器431最终为五个不同的可能截断点输出五个不同的预算值。随后,这五个不同的预算值之中,截断点选择器432选择与符合该分区的可允许预算的预算值相关联的截断点。
接下来,能够通过在不超过可用位预算的情况下为视觉上重要的子带减少截断,对为每一子带选择的截断点进行精化。
因此,获得用于分区的每一子带的截断点,该截断点现在由图8d的量化器624用于对图2a中示例性地示出的每一系数的位平面数据进行量化或者截断,其中这一数据作为非截断数据被存储在原始数据缓存器中。现在,基于为每一子带/分区、以及示例性地为每一颜色选择的截断点,获得每一颜色的截断的或者量化的原始数据或者位平面数据。取决于这一情况,可以为每一颜色单独地计算截断点,或者可以为所有颜色计算单个截断点,或者甚至可以例如始终关于分区内的两个子带来计算用于该分区的两个截断点。因此,当分区具有例如十个子带的时候,则将存在用于这一分区的五个不同的截断点。
图9示出相对于图8d示出的功能性的进一步实施方式。图8c中通过块431和432示出的GTLI确定器为每一系数组来产生GTLI,或者利用比如用于系数集合(子带方式)的优选更高粒度来产生GTLI,或者为每个分区产生单个GTLI。随后,基于这一数据,通过量化器624量化所述系数以便输出量化的系数。
图10示出仅仅由两个子带组成的分区的示例性实施方式,其中在1001处示出第一子带的第一系数集合,在1002处示出第二子带的第二系数集合,其中例如,第一系数集合具有组1011和1012,第二系数集合具有组1013和1014。
优选为,在一个组中使用四个系数,为由四个系数构成的每一组计算GCLI值,并且为每一系数集合,即,为整个子带,计算GTLI,或者为每个分区,即,为集合1001和1002两者中的所有系数,计算单个GTLI值。如先前已经概述的,分区一般包括第一子带的系数数据,第二子带的系数数据,…,第n子带的系数数据,其中所有这些子带涉及图像的相同空间区域。
图11示出编码图像信号的示例性表示。编码图像信号包括用于第一子带和第二子带的解码模式指示1101和1102,一般表示为“信号化信息”。此外,图11中示出的图像数据包括编码数据,该编码数据包括在1103处示出的编码图像数据和编码GCLI数据。此外,编码图像信号可以包括头部,该头部包括在图11中的1104处指示的头部数据。尽管编码图像信号在图11中是作为串行流示出的,但是编码图像信号可以采用任何数据格式。
2.1信号化方法
现在存在用于将已经为每一子带使用的预测方法信号化的多种不同的可行方案。例如,当带宽与实际的编码GCLI的量相比通常可以忽略的时候,可以使用原始位将每一子带的方法信号化。因此,当目标压缩率更重要的时候以及当信号化的预算开始变得更重要的时候,可以使用可变位。
2.2计算工作的减少
一方面,先前部分中提供的方法改善了压缩效率。而另一方面,它稍微增加了所要求的硬件寄存器存储空间,因为需要为预算计算提供每一子带的分离寄存器。如果所有子带都正在使用相同的预测方法,则这些寄存器可能被组合成单个寄存器。
为了补偿这一问题,重要的是注意到:通过先前描述的方法产生的编码增益主要来源于少量子带。换句话说,可以预先判定图3中示出的分区子带的子集使用相同预测方法,而不会对重要的编码效率造成影响,并且仅仅子带的一个小子集可以独立于其他子带来选择它们的预测方法。
通过这些手段,可以限制硬件工作的增加,同时仍然可利用所提议方法的增加的编码效率。同时,可以减少用于在解码器处选择正确预测方法的信号化系统开销。
3用于减少编码器复杂性的固定预测方案
在部分1.4.2中描述的方法与现有技术[2]的不同之处在于,并不需要分区的所有子带使用相同的预测方法。通过允许预测方案动态地适应于图像内容,可以实现更佳的编码效率。
可替代地,预测方案可以对于每一子带是固定的,同时仍允许分区的子带之间的不同预测方案。通过这些手段,可以减少搜索空间。
图5示出了对应的示例。假设属于某一子带的系数始终通过相同预测方案预测。属于不同子带的系数可以使用不同的预测方案。
使用这种方法提供了减少编码器中的搜索空间的益处,因为对于每一子带,很清楚应使用哪种预测方法,因此无需为不同的预测方法计算预算然后使用具有最小预算的预测方法。
尽管使用这种方案不会提供部分1.4.2中描述的方法的编码性能,或者完全适应性或者部分适应性的编码模式选择的编码性能,但是它能够接近于在分区粒度上在水平和垂直预测之间作出选择的现有技术方法,但却不需要计算用于两种预测方法的预算。换句话说,它提供了具有减少的复杂性的相似编码效率。
图12示出了处于图5的固定预测方案或者图4的完全适应预测方案两者之间的过程。图12的过程是部分固定和部分适应性的。在这一情况下,编码图像信号仅仅包括用于子带的子组的信号化信息,比如仅仅用于两个最低的子带101和102,其中通过使用预先确定的规则确定用于其他子带的解码模式,即,用于例如符合图5中示出的分配的子带103-109。因此,在块700处示出的图7的解码模式确定器构造为从编码图像信号中提取1201用于所述子组的信号化信息,随后基于所提取的信息确定1203用于分区的子带的所述子组的解码模式。此外,解码模式确定器700构造为使用该预先确定的规则确定1205用于在由块1201处理的所述子组中未包括的其他子带的解码模式。因此,在块1205的过程之后,解码模式确定器具有用于所有子带(分区的系数集合)的解码模式。
在图12中的这种“混合的”实施方式中,编码过程设为使得仅仅对子带的所述子组执行相对于图8b和8c示出的操作,并且为其他子带执行图8a中示出的过程。因此,相对于完全适应性过程,编码器复杂性得到降低,然而至少为某些子带保留了了适应性。
图13示出具有某些全局块的示意性协作的图像数据编码器的优选实施方式。图14示出可以与图13的编码器或者其它编码器协作的解码器的对应图示。
图13的颜色变换1300是用于无损压缩和有损压缩的可逆的整数至整数变换,其对RGB颜色信息进行去相关。前向可逆颜色变换RCT结果获得了Y、U、V数据或者相似的颜色空间。在这一变换后,能够彼此独立地处理每个颜色分量。在YCbCr图像数据的情形中,颜色变换1300被绕过,因为颜色分量已经被去相关。
图14的块1430示出为了将Y、U、V数据计算返回为例如作为输出信号的RGB颜色信息而执行的反向颜色变换。
图13中的块400示出离散小波变换,并且相应地,解码器的块1420示出离散反向小波变换。离散小波变换(DWT)提供了确保信号的良好去相关性的空间-频率表示。通常,以二的互补表示的方式对小波变换的输出系数进行编码。为了熵编码的目的,对这些值进行变换以实现符号和数值表示。这是通过图13中的块1310示出的,并且对应的反向运算通过图14中的块1410示出。正数据无须修改,因为它们在两种方法中都是同样表示的。负采样则是在增量加“一”之前反转。
通过块600、660、661、430、431、432、624示出的过程执行的熵编码通常基于块固定长度编码,在其基础上,作出了某些优化以确保更佳的编码效率。优选实施方式在对位流打包之前,不对输出小波数据进行处理,并且例如这是相对于示出原始数据缓存器622的图8d示出的。仅仅索引(GCLI)的流要求处理资源。小波子带系数被分组为由四个采样构成的子集。每个子集是从位平面表示的角度来看的。为每一子集查找最大编码行索引(GCLI)。它是图2a中示出的最重要非空位平面的索引。如果存在子集中的至少一个非空位平面(GCLI大于0),则子集的该非空位平面被按照输出流中的原样复制。可替代地,它们可以在被复制到输出流中之前,首先被处理以便对量化进行精化。在对输出流进行打包之前,在缓存器中存储所有原始数据,以允许速率分配判定该数据的哪部分与输出流相关。可以沿原始数据的上流方向对GCLI索引进行进一步压缩和打包。在GCLI的两个子带行之间执行垂直预测。该结果是该GCLI值与先前编码行中的系数的相同子集的GCLI值之间的差值。
遵循在图13中靠近熵编码器块661示出的一元编码方法,对预测的预测值执行后向编码。该表格示出了用于GCLI编码的简单符号一元可变长度编码。这种一元编码将特定的可变长度编码与每个码元相关联,这可能取决于某些上下文信息。因此,尽管图13中的一元编码表示一种可行方案,但是替代的一元编码方案也是可行的,例如通过将0替换为1且反之亦然。一种这样的替代方案在[7]中作出描述,并且替代地对正和负的预测残差进行编码。GCLI也被水平地预测。从而,所编码的码元是该GCLI值与先前被编码的属于相同行和相同小波子带的GCLI的值之间的差值。
除了原始模式之外附加地、或者替代原始模式,其他预测模式也是可行的。通过速率分配机制,对数据和GCLI预测值进行截断。对系数进行分组可实现压缩方案的效率与系统的复杂性之间的折衷。已经在之前选择了每个子集中的系数的数目,因为它提供了用于高吞吐量的压缩效率与硬件复杂性之间的最佳折衷。
一旦它们被编码,则每一编码单元的输出被打包在一起。图15中示出了示例性的过程。特别是,图15示出GTLI缓存器1501、GCLI缓存器1502、水平预测模式计算器1503、垂直预测模式计算器1504和原始模式处理器1505。此外,图15示出了实现例如在图13中靠近熵编码器661处示出的编码的(一元)编码器,并且图15附加地示出用于产生已编码的GCLI数据的多路复用器/数据打包器1506。特别是,块1503计算水平预测模式,以便基于“当前的”GCLI值并基于来自缓存器1502的“过去的”GCLI值来产生Δ值。相应地,块1504也基于作为输入接收到的“当前的”GCLI值并基于从GCLI缓存器1502接收的“过去的”GCLI值来计算Δ值。术语“当前的”和“过去的”不是指时间,而是指某一系数组的子带内的位置。随后,对应的Δ值被(一元)编码。当然,对于某一子带,块1503的结果、或者块1504的结果、或者块1505的结果被输入到已编码的GCLI数据中。应当注意,在优选实施方式中,分配给GCLI的预算被原始编码扣留,这意味着每一GCLI最多具有四位。此外,通过一元编码产生的数据在解码器侧进入连续流中,因此,可以预先计算状态变量。因此,由于一元编码的停止位,这允许中断反馈回路。
在速率分配和GCLI打包处理期间,位平面数据在被打包到输出流中之前,被存储在缓存器中。由于这一缓存器是编解码器系统的重要资源成本,所以优选的是将该缓存器设计得尽可能小,并且已经发现,小到仅仅存储多达十行的缓存器可能就足够了。
随后,更详细地讨论速率分配。具体来讲,图16示出一方面的熵编码器与另一方面的速率分配之间的协作,其中如先前相对于图8c中的块431、432所讨论的那样,速率分配具有数据预算块1621、GCLI预算块1622、预算分配单元1610和速率分配核心。此外,图16也示出了头部1600的使用,正如之前已经相对于图11中的头部1104讨论的那样,头部1600也被打包器680打包到输出数据流中。
速率分配相对于逐个分区来工作。分区对构成相同空间区域的不同子带的频率分量进行分组。这种空间区域例如具有两个行高,并且具有与图像的宽度相同的宽度。对于三个分量,它包含六个包含低垂直频率的五个水平分解的结果的子带、和两个包含高垂直频率的单个水平分解的结果的子带。
速率分配通过裁剪所确定的子带的最不重要位平面、直到剩余位平面能够符合分区位平面的预算为止,来量化分区数据。这种裁剪策略是迭代应用的,逐渐地裁剪每个子带中的越来越多的位平面。基于其使用情形,人们可以应用适当的“裁剪策略”,该裁剪策略确定彼此相关的子带的重要性。与更为重要的子带相比,速率分配选择在次要的子带中裁剪更多的位平面。速率分配为定义的截断方案计算分区预算。如果该预算不符合分区预算,则它为新的截断方案计算预算,从所有子带中再进一步去除一个位平面。一旦分区尺寸符合分区预算,则它计算可行的精化方案,按照通过将不同的优先级与不同子带相关联的某种优先级规则所定义的顺序,为每一子带重新添加一个位平面子带,直到该预算被再次超过为止。这获得了每一子带的最终的截断级别。
速率分配对分区数据进行量化,以使得编码分区尺寸不超过速率预算。平均分区预算是目标编码流尺寸除以图像分区的数目。优选为,速率分配策略平均值是对于几个分区的预算,用于沿着图像来平滑截断级别。编码分区包含三个部分,即头部、已编码GCLI和原始位平面数据。头部具有不能调整的限定尺寸。速率分配可以通过增加量化来减少原始位平面数据部分和已编码GCLI部分的尺寸。原始位平面的预算是可用于存储原始位平面数据的分区预算的一部分。最小编码流尺寸能够产生头部和已编码GCLI的尺寸(原始位平面的数据尺寸等于0)。
用于已定义方案精化对的原始位平面数据预算的计算要求作为小的四位数字的采样的GCLI。此外,通过为由四个采样构成的组使用一个GCLI,将用于处理预算计算的数字量减少了四。一旦计算出该分区的每个组的尺寸,则总和给出某一迭代处的总数据尺寸。就GCLI数据预算而言,存在多种方式来存储GCLI,并且速率分配通常为所有方法计算预算并且选择最适当的。关于该数据,能够基于例如图15中示出的(一元)编码器661的输出来计算已编码GCLI的预算。在原始GCLI的情形中,当达到16数据位的时候,预算是组的数目乘以四位。一旦计算出该分区的每个已编码GCLI的尺寸,则总和给出某一迭代处的总的GCLI的尺寸。
图16中的速率分配块接收GCLI(数据)值的流作为输入,并且该块输出用于打包器的GTLI信息。数据预算块1621和GCLI预算块1622为每一可能的GTLI(从0至15)计算所要求的预算,以存储数据/GCLI。优选为,图8d中的诸如GTLI裁剪器624或者量化器624之类的量化器执行有效的中心取整(center-rounding)量化。为此目的,计算某一量化步长,并执行后续变换。在解码器侧,逆向变换包括将该量化步长应用于某一逆向变换操作中的数据。然而,也可以使用除有效中心取整过程以外的其他量化器。随后,一旦速率分配块已经确定在分区的每个子带中应当裁剪的位平面的数量,则从图8d的原始数据缓存器622中读出原始数据,对该原始数据进行量化,并将其馈送至输出流分组,以便被打包到输出流中。
在解码器侧,在数据解包之前对GCLI数据进行解码。这允许以逆向方式应用几乎相同的处理。
4文献
[1]AMBROISE RENAUD;BUYSSCHAERT CHARLES;PELLEGRIN PASCAL;ROUVROY GAEL,“Method and Device for Display Stream Compression(用于显示流压缩的方法和设备)”,US9332258BB
[2]AMBROISE RENAUD;BUYSSCHAERT CHARLES;PELLEGRIN PASCAL;ROUVROY GAEL,“Method and Device for display stream compression(用于显示流压缩的方法和设备)”,EP2773122A1
[3]Jean-Baptiste Lorent,“TICO Lightweight Codec Used in IP Networkedor in SDI Infrastructure(在IP联网或者SDI基础架构中使用的TICO轻量型编解码器)”,SMPTE RDD35:2016
[4]Toshiaki Kojima,“LLVC–Low Latency Video Codec for Network Transfer(用于网络传输的LLVC-低延迟视频编解码器)”,SMPTE RDD 34:2015
[5]J.Kim and C.M.Kyung,“A Lossless Embedded Compression UsingSignificant Bit Truncation for HD Video Coding(用于HD视频编码的使用重要位截断的无损嵌入压缩)”,IEEE Transactions on Circuits and Systems for VideoTechnology,2010
[6]intoPIX,“intoPIX Codec Submission for JPEG-XS CfP(用于JPEG-XS CfP的intoPIX编解码器投稿)”,Design Description v0.1,2016
[7]intoPIX,“JPEG XS GCLI Bounded code proposal(JPEG XS GCLI有界编码建议)”,wg1m76032,Oct 2017
应当注意,所附的与用于编码的装置相关的权利要求在适当的情况下也适用于用于解码的装置。
尽管已经从几个实施例的角度描述了本发明,但是存在属于本发明范围的替代方案、重新配置方案以及等效方案。还应注意的是,存在许多替代方式来实现本发明的方法和组成。因此,以下所附权利要求书应被解释为包括所有这类属于本发明的真实精神和范围的替代方案、重新配置方案以及等效方案。
尽管已经在装置的上下文中描述了某些方面,但是显然这些方面也代表了对应方法的描述,其中块或者设备对应于方法步骤或者方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也代表了对应装置的对应块或者项或者特征的描述。某些或者所有的方法步骤可以通过(或者使用)硬件装置执行,例如微处理器、可编程计算机或者电子电路。在某些实施例中,可以通过这种装置执行最重要的方法步骤中的某个或多个。
创造性的编码图像信号可以被存储在数字存储介质上,或者可以在诸如无线传输介质或者有线传输介质之类的传输介质上传输,比如因特网。
取决于某些实施要求,本发明的实施例可以以硬件或者软件实现。实施方式可以使用在其上已经存储了电子可读的控制信号的数字存储介质实现,比如软盘、DVD、Blu-Ray(蓝光)、CD、ROM、PROM、EPROM、EEPROM或者闪速存储器,所述控制信号与(或者有能力与)可编程计算机系统协作以执行相应方法。因此,所述数字存储介质可以是计算机可读的。
根据本发明的某些实施例包括具有电子可读的控制信号的数据载体,所述控制信号能够与可编程计算机系统协作以执行本文所述方法之一。
通常,本发明的实施例可以作为具有程序代码的计算机程序产品实现,当所述计算机程序产品在计算机上运行的时候,该程序代码操作用于执行所述方法之一。所述程序代码例如可以存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的用于执行本文所述方法之一的计算机程序。
换句话说,本创造性方法的实施例因此是具有用于当在计算机上运行计算机程序的时候执行本文所述方法之一的程序代码的计算机程序。
本创造性方法的进一步实施例因此是包括记录在其上的用于执行本文所述方法之一的计算机程序的数据载体(或者数字存储介质,或者计算机可读介质)。数据载体、数字存储介质或者记录介质通常是有形的和/或非过渡的(non-transitionary)。
本创造性方法的进一步实施例因此是表示用于执行本文所述方法之一的计算机程序的数据流或者信号序列。该数据流或者信号序列例如可以构造为经由数据通信连接来传输,例如经由因特网来传输。
进一步实施例包括构造为或者适配为执行本文所述方法之一的处理手段,例如计算机或者可编程逻辑器件。
进一步实施例包括在其上已经安装有用于执行本文所述方法之一的计算机程序的计算机。
根据本发明的进一步实施例包括构造为将用于执行本文所述方法之一的计算机程序(例如电子地或者光学地)传输至接收器的装置或者系统。该接收器例如可以是计算机、移动设备、存储设备等等。该装置或者系统例如可以包括用于将计算机程序传输至接收器的文件服务器。
在某些实施例中,可编程逻辑器件(例如现场可编程门阵列)可被用于执行本文所述方法的功能性的某些或者全部。在某些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述方法之一。通常,该方法优选为通过任何硬件装置执行。
本文所述的装置可以使用硬件装置、或者使用计算机、或者使用硬件装置与计算机的组合来实现。
本文所述的方法可以使用硬件装置、或者使用计算机、或者使用硬件装置与计算机的组合来执行。
以上描述的实施例仅仅是用于例示本发明的原理。可理解的是,本文所述的布局和细节的修改和变型对于本领域技术人员是显而易见的。因此,意图是仅仅受到所附专利权利要求的范围限制,而不受限于通过本文实施例的描述和解释提供的具体细节。

Claims (40)

1.用于对图像数据进行编码的装置,所述图像数据被分解成多个不同子带(101-109),每个子带包括多个系数,其中所述多个不同子带(101-109)中的第一子带包括第一系数集合(1001),其中所述多个不同子带(101-109)中的不同的第二子带包括不同的第二系数集合(1002),其中分区(300)包括来自所述多个不同子带(101-109)中的所述第一和第二子带的所述第一和第二系数集合(1001,1002),其中所述分区(300)的所述第一和第二系数集合(1001,1002)属于由所述图像数据表示的图像的第一空间区域,所述装置包括:
处理器(600),用于为集合内的每一系数组(1011-1014)确定最大编码行索引(GCLI);
编码器(660),用于根据第一编码模式对与所述分区(300)的所述第一系数集合(1001)相关联的最大编码行索引进行编码,以及根据第二编码模式对与所述分区(300)的所述第二系数集合(1002)相关联的最大编码行索引进行编码,所述第二编码模式不同于所述第一编码模式;以及
输出接口(680),用于输出编码图像信号,所述编码图像信号具有关于已编码的最大编码行索引的数据(1103)和关于所述系数的数据,
其中所述第一编码模式和所述第二编码模式是从包括下述编码模式之中的至少两种编码模式的编码模式集合中选择出来的:
垂直预测编码模式,水平预测编码模式和原始编码模式。
2.如权利要求1所述的装置,还包括:
模式确定器(640),用于确定所述第一编码模式和所述第二编码模式,所述模式确定器构造为基于系数集合所属于(802)的对应子带来确定(804)用于所述系数集合的编码模式。
3.如权利要求1所述的装置,还包括模式确定器(640),用于确定所述第一编码模式和所述第二编码模式,其中所述模式确定器构造为
使用所述第一编码模式,计算(810)用于所述分区(300)的所述第一系数集合(1001)的第一要求数据预算,
使用所述第二编码模式,计算(812)用于所述分区(300)的所述第一系数集合(1001)的第二要求数据预算,
基于所述第一要求数据预算和所述第二要求数据预算,选择(814)所述第一编码模式和所述第二编码模式之一,以及
其中所述输出接口(680)构造为将被选择用于所述第一系数集合(1001)的编码模式的指示包括(816)到所述编码图像信号中。
4.如权利要求1所述的装置,还包括:
量化器(624),用于根据用于各个组的最大裁剪行索引(GTLI)来量化所述组中的系数,
其中关于系数的数据包括关于已量化系数的数据,以及
其中所述输出接口(680)构造为将关于组的最大裁剪行索引的数据引入到所述编码图像信号中。
5.如权利要求1所述的装置,
其中所述第一编码模式是水平预测模式,其中在与两个水平相邻的系数组的至少两个最大编码行索引相关的数据项之间执行预测,
其中所述第二编码模式是垂直预测模式,其中在与两个垂直相邻的系数组的至少两个最大编码行索引相关的数据项之间执行预测,其中所述水平相邻的系数组或者所述垂直相邻的系数组指示所述图像信号的对应空间位置,所述空间位置与所述系数关联。
6.如权利要求4所述的装置,其中所述编码器(660)构造为使用用于所述系数组的所述最大编码行索引和与所述系数组相关联的最大裁剪行索引,确定与最大编码行索引相关的数据项。
7.如权利要求4所述的装置,
其中为系数组确定最大裁剪行索引(GTLI),以表示所述系数组的量化步长,以及
其中所述垂直预测或者所述水平预测基于以下等式:
其中F1和F2分别是两个水平相邻的系数组或者是两个垂直相邻的系数组,由g>1个系数组成,其中F2是当前要编码的系数组,其中用于当前要编码的所述系数组的最大编码行索引(GCLI)通过发送δ值而被信号化,并且其中max()代表最大值确定函数。
8.如权利要求1所述的装置,
其中为系数组确定最大裁剪行索引,以表示用于所述系数组的量化步长,并且其中所述第一编码模式和所述第二编码模式之一是原始编码模式,其中使用与组相关联的最大裁剪行索引,对所述组的最大编码行索引进行编码。
9.如权利要求1所述的装置,
其中为系数组确定最大裁剪行索引,以表示用于所述系数组的量化步长,并且其中用于所述分区的所述最大裁剪行索引是在比所述最大编码行索引高的粒度上确定的,所述最大裁剪行索引包括用于子带的单个最大裁剪行索引或者用于所述分区(300)的单个最大裁剪行索引。
10.如权利要求1所述的装置,其中所述多个不同子带包括
LH1子带(103),表示通过在x轴方向上对所述图像高通滤波和在y轴方向上对所述图像低通滤波而获得的数据,以及
HL1子带(101),包括通过在x轴方向上对所述图像低通滤波和在y轴方向上对所述图像高通滤波而获得的图像数据,
其中与所述HL1子带(101)相关联的编码模式是水平预测编码模式,以及
其中与所述LH1子带(103)相关联的编码模式是垂直预测编码模式。
11.根据权利要求1所述的装置,其中所述多个不同子带包括
HH1子带(102),表示通过根据x轴方向对所述图像高通滤波和根据y轴方向对所述图像高通滤波而获得的图像数据;以及
其中与所述HH1子带(102)相关联的编码模式是垂直预测编码模式。
12.如权利要求1所述的装置,其中所述多个不同子带包括:
LH2子带(106),包括通过在x轴方向上使用高通滤波器和在y轴方向上使用低通滤波器进行滤波而获得的数据,
HL2子带(104),通过在x轴方向上使用低通滤波器和在y轴方向上使用高通滤波器进行滤波而获得,
其中与所述HL2子带(104)相关联的编码模式是水平预测编码模式,以及
其中与所述LH2子带(106)相关联的编码模式是垂直预测编码模式。
13.如权利要求1所述的装置,其中所述多个不同子带包括:
HH2子带(105),包括通过根据x轴方向使用高通滤波器和在y轴方向上使用高通滤波器进行滤波而获得的数据;以及
其中与所述HH2子带(105)相关联的编码模式是垂直预测编码模式。
14.如权利要求1所述的装置,其中所述多个子带包括:
H3子带(107),通过在x轴方向上使用高通滤波器进行滤波而获得;
H4子带(108),通过在y轴方向上使用高通滤波器进行滤波而获得;以及
L5子带(109),通过在x轴方向上使用低通滤波器进行滤波而获得,以及
其中与所述H3子带(107)相关联的编码模式、与所述H4子带(108)相关联的编码模式、或者与所述L5子带(109)相关联的编码模式是垂直预测编码模式。
15.如权利要求1所述的装置,其中对于每一子带,所述编码器(660)包括,
预算计算器(410-414),其中所述预算计算器(410-414)构造为为所述子带和每个可能的截断点(GTLI)和每个编码模式计算用于所述分区的所述子带的要求数据预算;以及
预测模式选择器(421-425),用于为每一子带选择具有最小结果数据预算的编码模式,或者基于先前数据使用启发式算法为每一子带选择编码模式;以及
速率控制器(430),用于组合可用速率信息并且为每一子带选择截断点;以及
所述输出接口(680)构造为使用所选择的截断点产生关于系数的数据,其中所述关于已编码的最大编码行索引的数据包括用于所选择的截断点和所选择的编码模式的数据。
16.如权利要求15所述的装置,
其中所述输出接口(680)构造为将信号化信息(1101,1102)包括到所述编码图像信号里,所述信号化信息用于为每一子带将所选择的编码模式信号化。
17.如权利要求15所述的装置,
其中所述编码器(660)构造为将所述预算计算设备和所述编码模式选择器应用于所述分区中的所有子带的第一子组,其中预先确定用于所述分区的所述子带的第二子组的编码模式,所述第二子组不同于用于所述分区的所述第一子组。
18.如权利要求1所述的装置,
其中所述编码器(660)构造为使用熵编码器(661),或者使用采用具有代码表或者动态建立的代码本的可变长度编码的编码,或者使用采用所述第一编码模式和/或所述第二编码模式的一元编码。
19.如权利要求1所述的装置,
其中进一步分区的两个系数集合属于所述图像的进一步空间区域,所述进一步空间区域不同于所述空间区域,以及
其中所述编码器(660)构造为根据所述第一编码模式对与所述进一步分区的第一系数集合相关联的最大编码行索引进行编码,以及根据所述第二编码模式对与所述进一步分区的第二系数集合相关联的所述最大编码行索引进行编码,所述第二编码模式不同于所述第一编码模式。
20.如权利要求2所述的装置,其中所述模式确定器(640)包括:
子带预算计算器(410-414),用于为分区计算用于使用不同截断点和不同编码模式对第一子带的第一系数集合进行编码的第一多个数据预算、以及使用不同截断点和不同编码模式对第二子带的第二系数集合进行编码的第二多个数据预算;
预测模式选择器(421-425),用于为所述第一系数集合选择具有用于与每一截断点的目标匹配的所述第一多个数据预算的数据预算的第一编码模式,并且为所述第二系数集合选择具有用于与每一截断点的目标匹配的所述第二多个数据预算的数据预算的第二编码模式,以获得每一系数集合的选定编码模式。
21.如权利要求20所述的装置,其中所述模式确定器(640)包括:
预算组合器(431),用于为每一截断点将用于与所述第一系数集合的选定编码模式相关联的所述第一系数集合的第一数据预算、与用于与所述第二系数集合的选定编码模式相关联的所述第二系数集合的第二数据预算相组合,以获得每一截断点的组合预算;以及
截断点选择器(432),用于选择与符合预算目标的组合预算相关联的截断点。
22.如权利要求1所述的装置,其中除了所述第一系数集合(1001)和所述第二系数集合(1002)之外,所述分区(300)或者任何附加分区还包括一个或多个附加系数集合,
其中所述编码器(660)构造为根据所述第一编码模式,或者根据所述第二编码模式,或者根据不同于所述第一编码模式和所述第二编码模式的第三编码模式,对与所述一个或多个附加系数集合相关联的最大编码行索引进行编码;以及
其中所述输出接口(680)构成为输出编码图像信号,所述编码图像信号具有关于与所述一个或多个附加系数集合相关联的已编码的最大编码行索引的数据(1103)、关于所述一个或多个附加系数集合的数据、以及选择用于所述一个或多个附加系数集合的编码模式的指示。
23.用于对包括关于已编码的最大编码行索引的数据和关于系数的数据的编码图像信号进行解码的装置,包括:
解码模式确定器(700),用于为关于分区(300)内的不同子带的已编码的最大编码行索引的数据确定不同解码模式,其中所述关于系数的数据表示被分解成多个不同子带(101-109)的图像数据,每个子带包括多个系数,其中所述分区(300)包括来自不同子带的不同系数集合(1001,1002),其中所述分区(300)的两个系数集合属于由所述图像数据表示的图像的空间区域;以及
解码器(720),用于使用通过所述解码模式确定器(700)而确定的不同解码模式中的第一解码模式对关于所述分区(300)中的第一系数集合(1001)的已编码的最大编码行索引的数据进行解码,并且使用通过所述解码模式确定器(700)而确定的不同解码模式中的第二解码模式对关于用于所述分区(300)中的第二系数集合(1002)的已编码的最大编码行索引的数据进行解码,并且使用已解码的最大编码行索引数据对所述关于系数的数据进行解码,
其中所述第一解码模式和所述第二解码模式是从包括所述不同解码模式的组中选择出来的,所述组包括垂直反向预测解码模式,水平反向预测解码模式和原始解码模式中的至少两个。
24.如权利要求23所述的装置,
其中所述编码图像信号包括用于所述分区(300)的至少两个不同子带的解码模式信息(1101,1102),作为信号化信息,以及
其中所述解码模式确定器(700)构造为通过从所述编码图像信号中提取(1201)所述解码模式信息(1101,1102)并且通过为所述分区(300)的至少两个不同子带中的每一子带解释所提取的解码模式信息,来确定解码模式。
25.如权利要求23所述的装置,
其中所述解码模式确定器(700)构造为通过根据所述集合的系数组所属的子带选择解码模式来确定(1205)解码模式,其中所述多个不同子带中的每一子带具有与之关联的预定解码模式,并且其中在所述分区(300)内,两个不同子带具有与之关联的两个不同解码模式。
26.如权利要求23所述的装置,
其中所述解码器(720)还包括用于根据各个组的最大裁剪行索引(GTLI)对每个组中的系数进行去量化的去量化器(724),其中在所述编码图像信号中包括关于所述分区(300)的所述最大裁剪行索引的数据。
27.如权利要求23所述的装置,
其中所述第一解码模式是水平反向预测解码模式,其中所述反向预测是使用传输的数据项和先前解码的最大编码行索引执行的,其中所述数据项和所述先前解码的最大编码行索引与两个水平相邻的系数组相关联,以及
其中所述第二解码模式是垂直反向预测解码模式,其中所述反向预测是在传输的数据项和先前解码的最大编码行索引之间执行的,其中所述数据项和所述先前解码的最大编码行索引与两个垂直相邻的系数组相关联。
28.如权利要求23所述的装置,
其中为系数组从所述编码图像信号中提取最大裁剪行索引,所述最大裁剪行索引表示用于所述系数组的量化步长,并且其中所述垂直或者水平反向预测是基于以下等式执行的:
其中δ是传输数据项,F1和F2是两个水平相邻的系数组,由g>1个系数组成,其中max代表最大值操作,其中GCLI(F2)表示当前解码的数据项。
29.如权利要求23所述的装置,
其中在所述编码图像信号中包括最大裁剪行索引,并且其中用于所述系数组的所述最大裁剪行索引是在比所述最大编码行索引数据高的粒度上给出的,所述最大裁剪行索引包括用于子带的单个最大裁剪行索引或者用于所述分区的单个最大裁剪行索引。
30.如权利要求23所述的装置,其中所述多个不同子带包括
LH1子带(103),表示通过在x轴方向上对所述图像高通滤波和在y轴方向上对所述图像低通滤波而获得的数据,以及
HL1子带(101),包括通过在x轴方向上对所述图像低通滤波和在y轴方向上对所述图像高通滤波而获得的图像数据,
其中与所述HL1子带(101)相关联的解码模式是水平反向预测解码模式,以及
其中与所述LH1子带(103)相关联的解码模式是垂直反向预测解码模式。
31.如权利要求23所述的装置,其中所述多个不同子带包括
HH1子带(102),表示通过根据x轴方向对所述图像高通滤波和根据y轴方向对所述图像高通滤波而获得的图像数据;以及
其中与所述HH1子带(102)相关联的解码模式是垂直反向预测解码模式。
32.如权利要求23所述的装置,其中所述多个不同子带包括:
LH2子带(106),包括通过在x轴方向上使用高通滤波器和在y轴方向上使用低通滤波器进行滤波而获得的数据,
HL2子带(104),通过在x轴方向上使用低通滤波器和在y轴方向上使用高通滤波器进行滤波而获得,
其中与所述HL2子带(104)相关联的解码模式是水平反向预测解码模式,以及
其中与所述LH2子带(106)相关联的解码模式是垂直反向预测解码模式。
33.如权利要求23所述的装置,其中所述多个不同子带包括
HH2子带(105),包括通过根据x轴方向使用高通滤波器和在y轴方向上使用高通滤波器进行滤波而获得的数据;以及
其中与所述HH2子带(105)相关联的解码模式是垂直反向预测解码模式。
34.如权利要求23所述的装置,其中所述多个子带包括:
H3子带(107),通过在x轴方向上使用高通滤波器进行滤波而获得;
H4子带(108),通过在y轴方向上使用高通滤波器进行滤波而获得;以及
L5子带(109),通过在x轴方向上使用低通滤波器进行滤波而获得,以及
其中与所述H3子带(107)相关联的解码模式、与所述H4子带(108)相关联的解码模式、或者与所述L5子带(109)相关联的解码模式是垂直反向预测解码模式。
35.如权利要求23所述的装置,
其中所述编码图像信号包括仅仅用于所述分区(300)的子带的子组的信号化信息,以及
其中所述解码模式确定器(700)构造为基于所述信号化信息为所述子组的子带确定(1203)解码模式,以及使用在所述装置中可用于解码的用于所述子带的解码模式为除所述子组以外的所述分区(300)中的子带确定(1205)解码模式。
36.如权利要求23所述的装置,其中进一步分区的两个系数集合属于所述图像的进一步空间区域,所述进一步空间区域不同于所述空间区域,以及
其中所述解码器(720)构造为使用由所述解码模式确定器确定的所述第一解码模式对关于所述进一步分区中的所述第一系数集合的所述已编码的最大编码行索引的数据进行解码,以及使用由所述解码模式确定器确定的第二解码模式对关于所述进一步分区中的所述第二系数集合的所述已编码的最大编码行索引的数据进行解码,以及使用已解码的最大编码行索引数据对所述关于系数的数据进行解码。
37.如权利要求23所述的装置,其中所述解码模式确定器(700)构造为为关于除了所述分区(300)或者一个或多个附加分区的所述第一和第二系数集合之外的一个或多个附加系数集合的已编码的最大编码行索引的数据确定一个或多个解码模式,其中与所述一个或多个附加系数集合相关联的最大编码行索引是根据第一编码模式或者根据第二编码模式、或者根据不同于所述第一编码模式和所述第二编码模式的第三编码模式编码的;以及
其中所述解码器(720)构造为使用所述一个或多个解码模式对关于所述分区(300)或者所述一个或多个附加分区中的所述一个或多个附加系数集合的所述已编码的最大编码行索引的数据进行解码,并且使用所述一个或多个附加系数集合的已解码的最大编码行索引数据对关于所述一个或多个附加系数集合中的系数的数据进行解码。
38.用于对图像数据进行编码的方法,所述图像数据被分解成多个不同子带(101-109),每个子带包括多个系数,其中所述多个不同子带(101-109)中的第一子带包括第一系数集合(1001),其中所述多个不同子带(101-109)中的不同的第二子带包括不同的第二系数集合(1002),其中分区(300)包括来自所述多个不同子带(101-109)中的所述第一和第二子带的所述第一和第二系数集合(1001,1002),其中所述分区(300)的所述第一和第二系数集合(1001,1002)属于由所述图像数据表示的图像的空间区域,所述方法包括:
为集合内的每一系数组确定最大编码行索引(GCLI);
根据第一编码模式对与所述分区(300)的所述第一系数集合(1001)相关联的最大编码行索引进行编码,以及根据第二编码模式对与所述分区(300)的所述第二系数集合(1002)相关联的最大编码行索引进行编码,所述第二编码模式不同于所述第一编码模式;以及
输出或者存储编码图像信号,所述编码图像信号具有关于所述已编码的最大编码行索引的数据(1103)和关于所述系数的数据,
其中所述第一编码模式和所述第二编码模式是从包括下述编码模式之中的至少两种编码模式的编码模式组中选择出来的:垂直预测编码模式,水平预测编码模式和原始编码模式。
39.用于对包括关于已编码的最大编码行索引的数据和关于系数的数据的编码图像信号进行解码的方法,包括:
为关于分区(300)内的不同子带的所述已编码的最大编码行索引的数据确定不同解码模式,其中所述关于系数的数据表示被分解成多个不同子带(101-109)的图像数据,每个子带包括多个系数,其中所述分区(300)包括来自不同子带的不同系数集合,其中所述分区(300)的两个系数集合属于由所述图像数据表示的图像的空间区域;以及
使用通过确定不同解码模式而确定的所述不同解码模式中的第一解码模式对关于所述分区(300)中的第一系数集合(1001)的所述已编码的最大编码行索引的数据进行解码,并且使用通过确定不同解码模式而确定的所述不同解码模式中的第二解码模式对关于用于所述分区(300)中的第二系数集合(1002)的所述已编码的最大编码行索引的数据进行解码,并且使用已解码的最大编码行索引数据对所述关于系数的数据进行解码,
其中所述第一解码模式和所述第二解码模式是从包括所述不同解码模式的组中选择出来的,所述组包括垂直反向预测解码模式,水平反向预测解码模式和原始解码模式中的至少两个。
40.一种在其上存储有计算机程序的存储介质,当所述计算机程序在计算机或者处理器上运行时,执行如权利要求38或者权利要求39所述的方法。
CN201780078866.6A 2016-12-19 2017-12-18 使用用于gcli熵编码的子带相关预测适应进行编码或解码的装置和方法 Active CN110383835B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16205187.4 2016-12-19
EP16205187 2016-12-19
PCT/EP2017/083334 WO2018114813A1 (en) 2016-12-19 2017-12-18 Apparatus and method for encoding or decoding using a subband dependent prediction adaption for gcli entropy coding

Publications (2)

Publication Number Publication Date
CN110383835A CN110383835A (zh) 2019-10-25
CN110383835B true CN110383835B (zh) 2023-09-22

Family

ID=57754994

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780078866.6A Active CN110383835B (zh) 2016-12-19 2017-12-18 使用用于gcli熵编码的子带相关预测适应进行编码或解码的装置和方法

Country Status (8)

Country Link
US (1) US10944972B2 (zh)
EP (1) EP3556097B1 (zh)
JP (1) JP6828184B2 (zh)
KR (1) KR102361206B1 (zh)
CN (1) CN110383835B (zh)
ES (1) ES2908216T3 (zh)
PL (1) PL3556097T3 (zh)
WO (1) WO2018114813A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3556097B1 (en) * 2016-12-19 2021-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Image coding using a subband dependent prediction adaption for gcli entropy coding
AU2017201760B2 (en) * 2017-03-15 2023-03-09 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
AU2017204643B2 (en) * 2017-07-07 2020-05-14 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
KR102364942B1 (ko) 2017-07-10 2022-02-18 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 비트-플래인 코딩
EP3917143A4 (en) 2019-01-23 2022-09-07 LG Electronics Inc. VIDEO SIGNAL PROCESSING METHOD AND DEVICE
EP3751852A1 (en) * 2019-06-12 2020-12-16 intoPIX s.a. Encoder and method of encoding a sequence of frames
GB2593523B (en) * 2020-03-26 2023-06-14 Imagination Tech Ltd Image data compression

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100401778C (zh) * 2002-09-17 2008-07-09 弗拉迪米尔·切佩尔科维奇 具有高压缩率和最小必需资源的快速codec
KR101421231B1 (ko) * 2007-07-04 2014-07-24 세종대학교산학협력단 웨이블릿 변환을 이용한 영상 압축 장치
KR20090097013A (ko) * 2008-03-10 2009-09-15 삼성전자주식회사 영상 부호화장치 및 영상 복호화장치
JP2011071649A (ja) * 2009-09-24 2011-04-07 Sony Corp 画像処理装置および方法
US8446301B2 (en) * 2011-04-15 2013-05-21 Research In Motion Limited Methods and devices for coding and decoding the position of the last significant coefficient
EP2773122A1 (en) * 2013-03-01 2014-09-03 intoPIX s.a. Method and device for display stream compression
US9332258B2 (en) * 2013-03-01 2016-05-03 intoPIX SA Method and device for display stream compression
US20140307780A1 (en) * 2013-04-11 2014-10-16 Mitsubishi Electric Research Laboratories, Inc. Method for Video Coding Using Blocks Partitioned According to Edge Orientations
US11330297B2 (en) * 2014-08-19 2022-05-10 Qualcomm Incorporated Methods incorporating extensions to copy-above mode for palette mode coding
JP6497981B2 (ja) * 2015-03-04 2019-04-10 キヤノン株式会社 画像符号化装置及びその制御方法
EP3200455B1 (en) * 2016-01-28 2018-09-05 intoPIX Method and device for compression and decompression of binary data
EP3556097B1 (en) * 2016-12-19 2021-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Image coding using a subband dependent prediction adaption for gcli entropy coding
US10212421B2 (en) * 2016-12-30 2019-02-19 Intopix S.A. Method and device for digital data compression with sign bit removal
AU2017201760B2 (en) * 2017-03-15 2023-03-09 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
US11475600B2 (en) * 2017-07-10 2022-10-18 Intopix S.A. Method and device for digital data compression

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
INTOPIX.intoPIX Codec Submission for JPEG-CfP, Design description V0.1.《JPEG MEETING》.2016,全文. *
N.S.A.M Taujuddin et al..Image compression using a new adaptive standard deviation thresholding estimation at the wavelet details subbands.《2015 Second International Conference on Computing Technology and Information Management (ICCTIM)》.2015,109-114. *
周兵等.小波图像编码器研究进展.《计算机科学》.2002,(第1期),57-61. *
季向阳.可伸缩视频编码研究.《中国学位论文全文数据库》.2008,全文. *
马德.基于细粒度加速单元灵活可配H.264视频解码子系统研究.《中国博士学位论文全文数据库(信息科技辑)》.2014,全文. *

Also Published As

Publication number Publication date
JP2020502960A (ja) 2020-01-23
JP6828184B2 (ja) 2021-02-10
PL3556097T3 (pl) 2022-04-25
EP3556097B1 (en) 2021-12-15
ES2908216T3 (es) 2022-04-28
US10944972B2 (en) 2021-03-09
CN110383835A (zh) 2019-10-25
WO2018114813A1 (en) 2018-06-28
KR102361206B1 (ko) 2022-02-10
EP3556097A1 (en) 2019-10-23
US20190289295A1 (en) 2019-09-19
KR20190103214A (ko) 2019-09-04

Similar Documents

Publication Publication Date Title
CN110383835B (zh) 使用用于gcli熵编码的子带相关预测适应进行编码或解码的装置和方法
JP4273996B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
US9332258B2 (en) Method and device for display stream compression
CN108235023B (zh) 用于编码和解码图像的方法、编码和解码设备
Padmaja et al. Analysis of various image compression techniques
US8767823B2 (en) Method and apparatus for frame memory compression
US10887610B2 (en) Transform block coding
CN107623857B (zh) 视频编码/解码方法、设备以及生成和存储比特流的方法
EP4072136A1 (en) Method and device for display stream compression
CN111869206A (zh) 多编解码器处理和速率控制
JP7128580B2 (ja) ビットプレーン符号化
CN110720222B (zh) 用于数字数据压缩的方法和设备
US8938001B1 (en) Apparatus and method for coding using combinations
JP7390788B2 (ja) 画像符号化装置及びその制御方法及びプログラム
EP3291559A1 (en) Encoder for encoding, and decoder for decoding, a 2-dimensional digital image representation into a data stream using further encoding of one or more remaining bits below the quantization factor
US6873737B2 (en) Image encoding system, image decoding system and methods therefor
KR20230136121A (ko) 인공 신경망을 사용한 프로그래시브 데이터 압축
JP2010118795A (ja) 並列分散情報源符号化システム及び並列分散情報源符号化・復号化方法
US20190158879A1 (en) Successive refinement video compression
KR100311573B1 (ko) 웨이브릿 기반의 소프트웨어 부호화기 및 복호화기
Richter et al. Towards high-speed, low-complexity image coding: variants and modification of JPEG 2000
CN109413446B (zh) 多描述编码中的增益控制方法
CN116746066A (zh) 使用人工神经网络的渐进式数据压缩
Kobayashi et al. A new class of near-lossless coding allowing estimation of ℓ∞ bound
Xu et al. Context clustering in lossless compression of gray-scale image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant