CN117915092A - 数据编码和解码方法、数据编码和解码设备及存储介质 - Google Patents
数据编码和解码方法、数据编码和解码设备及存储介质 Download PDFInfo
- Publication number
- CN117915092A CN117915092A CN202410102762.6A CN202410102762A CN117915092A CN 117915092 A CN117915092 A CN 117915092A CN 202410102762 A CN202410102762 A CN 202410102762A CN 117915092 A CN117915092 A CN 117915092A
- Authority
- CN
- China
- Prior art keywords
- data
- values
- value
- context
- data values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 139
- 230000001419 dependent effect Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 description 37
- 230000006837 decompression Effects 0.000 description 32
- 238000007906 compression Methods 0.000 description 22
- 230000006835 compression Effects 0.000 description 19
- 238000013507 mapping Methods 0.000 description 19
- 238000013144 data compression Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 17
- 230000009466 transformation Effects 0.000 description 15
- 230000003044 adaptive effect Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 12
- 238000013139 quantization Methods 0.000 description 8
- 239000000523 sample Substances 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 244000309469 Human enteric coronavirus Species 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
一种数据编码和解码方法、数据编码和解码设备及存储介质,该数据编码方法包括:在两种或更多种模式下对数据值的有序阵列进行编码,数据值在第一模式中表示离散余弦变换或离散正弦变换系数,并且数据值在第二变换跳过模式中表示数据值幅度和表示数据值符号的数据;针对第二变换跳过模式中的数据值,从有序阵列中的至少一个数据值中检测相应的数据符号值;以及得出用于编码数据值的上下文。
Description
本申请是申请日为2019年1月23日、申请号为201980011647.5、发明名称为“数据编码和解码”的PCT申请进中国国家阶段申请的分案申请,该PCT申请的国际申请号为PCT/GB2019/050181。
技术领域
本公开涉及图像数据编码和解码。
背景技术
本文中提供的“背景技术”描述是为了通常呈现本公开的上下文的目的。在本背景技术部分中描述的范围内,当前指定的发明人的工作,以及在提交时可能不符合现有技术的描述的方面,既不明确地也不隐含地承认作为相对本公开的现有技术。
存在几个视频数据编码和解码系统,其涉及将视频数据变换成频域表示,量化频域系数,并且然后将熵编码的一些形式应用到量化系数。这可以实现视频数据的压缩。相应的解码或解压缩技术被应用以恢复原始视频数据的已重建版本。
发明内容
本公开应对或减缓由此处理所发生的问题。
在所附权利要求中限定了本公开的各个方面和特征。
应当理解,上述一般性描述和以下详细描述是示例性的,而非限制本技术。
附图说明
通过结合附图考虑以下详细描述,将更容易地获得对本公开的更完整的理解以及其许多伴随的优点,其中:
图1示意性地示出了使用视频数据压缩和解压缩的音频/视频(A/V)数据发送和接收系统;
图2示意性地示出了使用视频数据解压缩的视频显示系统;
图3示意性地示出了使用视频数据压缩和解压缩的音频/视频存储系统;
图4示意性地示出了使用视频数据压缩的摄像机;
图5和图6示意性地示出了存储介质;
图7提供了视频数据压缩和解压缩设备的示意性概述;
图8示意性地示出了预测器;
图9示意性地示出了部分编码图像;
图10示意性地示出了一组可能的帧内预测方向;
图11示意性地示出了一组预测模式;
图12示意性地示出了另一组预测模式;
图13示意性地示出了帧内预测处理;
图14示意性地示出了帧间预测处理;
图15示意性地示出了示例性CABAC编码器;
图16示意性地示出了数据值阵列;
图17示意性地示出了示例性符号位依赖关系;
图18示意性地示出了阵列区域;
图19示意性地示出了预测器/选择器;
图20a和图20b示意性地示出了一组相对位置;
图21示意性地示出了预测器/选择器;
图22和图23是示出了相应方法的示意性流程图;
图24示意性地示出了数据编码设备;
图25示意性地示出了数据解码设备;
图26和图27是示出了相应方法的示意性流程图;以及
图28示意性地示出了示例性阵列顺序。
具体实施方式
现在参考附图,提供图1至图4给出了利用下面结合本技术的实施方式描述的压缩和/或解压缩设备的设备或系统的示意图。
以下将描述的所有数据压缩和/或解压缩设备可以以硬件、以在诸如通用计算机的通用数据处理设备上运行的软件实现为诸如专用集成电路(ASIC)或场可编程门阵列(FPGA)的可编程硬件或实现为这些的组合。在由软件和/或固件实现实施方式的情况下,应当理解,这种软件和/或固件、以及通过其存储或以其他方式提供这种软件和/或固件的非易失性数据存储介质被视为本技术的实施方式。
图1示意性地示出了使用视频数据压缩和/或解压缩的音频/视频数据发送和接收系统。在这个实例中,待编码或解码的数据值表示图像数据。
输入音频/视频信号10被提供给视频数据压缩设备20,该视频数据压缩设备20压缩音频/视频信号10的至少视频分量以用于沿着诸如电缆、光纤、无线链路等传输路径30的传输。压缩信号被解压缩设备40处理以提供输出音频/视频信号50。对于返回路径,压缩设备60压缩音频/视频信号以沿着传输路径30传输到解压缩设备70。
压缩设备20和解压缩设备70由此能够形成传输链路的一个节点。解压缩设备40和解压缩设备60能够形成传输链路的另一节点。当然,在传输链路为单向的情况下,仅一个节点需要压缩设备并且另一节点仅需要解压缩设备。
图2示意性地示出了使用视频数据解压缩的视频显示系统。具体地,压缩的音频/视频信号100被解压缩设备110处理以提供可以在显示器120上显示的解压缩信号。解压缩设备110可以实现为显示器120的组成部分,例如,与显示装置设置在同一壳体内。可替换地,解压缩设备110可被提供为(例如)所谓的机顶盒(STB),应注意,表述“机上”并非暗示机盒需设置在相对于显示器120的任何特定方位或位置;其仅为本技术中所使用的术语用以指示可连接至作为外围装置的显示器的装置。
图3示意性地示出了使用视频数据压缩和解压缩的音频/视频存储系统。输入音频/视频信号130被提供给压缩设备140,该压缩设备140生成用于由诸如磁盘装置、光盘装置、磁带装置的存储装置150、诸如半导体存储器的固态存储装置或者其他存储装置存储的压缩信号。在重放时,从存储装置150读取压缩数据并且将其传送到用于解压缩的解压缩设备160以提供输出音频/视频信号170。
应理解,压缩的或编码的信号、以及存储该信号的诸如机器可读非易失性存储介质的存储介质被视为本技术的实施方式。
图4示意性地示出了使用视频数据压缩的摄像机。在图4中,诸如电荷耦合装置(CCD)图像传感器及相关的控制和读出电子器件的图像捕获装置180生成传送给压缩设备190的视频信号。麦克风(或者多个麦克风)200生成被传送给压缩设备190的音频信号。压缩设备190生成将被存储和/或传输(通常示出为示意性平台220)的压缩的音频/视频信号210。
以下将描述的技术主要关于视频数据压缩和解压缩。应当理解,许多现有技术可结合将描述的视频数据压缩技术用于音频数据压缩以生成压缩的音频/视频信号。因此,将不提供对音频数据压缩的单独讨论。还应理解,与视频数据相关联的数据速率,尤其是广播质量视频数据,通常比与(无论是压缩的或者未压缩的)音频数据相关联的数据速率高很多。因此,应当理解,未压缩的音频数据可伴随压缩的视频数据形成压缩的音频/视频信号。进一步应当理解,尽管(图1至图4中示出的)本实例涉及音频/视频数据,然而,以下将描述的技术可以发现在只处理(即,压缩、解压缩、存储、显示和/或传输)视频数据的系统中使用。即,实施方式可以应用于视频数据压缩,而不必具有任何相关联的音频数据处理。
因此图4提供了包括图像传感器和以下要讨论的类型的编码设备的视频捕获设备的实例。因此图2提供了以下要讨论的类型的解码设备以及解码图像输出至的显示器的实例。
图2和图4的结合可以提供包括图像传感器180和编码设备190的视频捕获设备、解码设备110以及解码图像输出至的显示器120。
图5和图6示意性地示出了存储介质,该存储介质存储(例如)由设备20、60生成的压缩数据、输入至设备110或存储介质或平台150、220的压缩数据。图5示意性地示出了诸如磁盘或光盘的磁盘存储介质,并且图6示意性地示出了诸如闪速存储器的固态存储介质。应注意,图5和图6也可以提供存储计算机软件的非易失性机器可读存储介质的实例,当由计算机执行时,该计算机软件使得计算机执行以下要讨论的一种或多种方法。
因此,上述配置提供了体现本技术中的任一个的视频存储、捕获、发送或接收设备的实例。
图7提供了用于编码和/或解码表示一个或多个图像的图像数据的视频或图像数据压缩和解压缩设备的示意性概述。
控制器343控制设备的整体操作,并且具体地,当参考压缩模式时,通过用作选择器,控制试验编码程序以选择诸如块大小和形状的操作的各种模式以及是否无损地或以其他方式将视频数据进行编码。该控制器被认为是图像编码器或图像解码器(视情况而定)的一部分。输入视频信号300的连续图像被提供给加法器310和图像预测器320。以下将参考图8更详细地描述图像预测器320。图像编码器或解码器(视情况而定)加上图8的图像内预测器可以使用来自图7的设备的特征。然而,这不意味着图像编码器或解码器必然需要图7的每个特征。
事实上,加法器310执行减法(负加法)操作,即,在“+”输入端接收输入视频信号300并且在“-”输入端接收图像预测器320的输出,使得从输入图像中减去预测图像。结果是生成表示实际图像与预测图像之间的差值的所谓残差图像信号330。
生成残差图像信号的原因之一如下。待描述的数据编码技术(即,将应用于残差图像信号的技术)倾向于更有效率地作用在当待编码的图像中有较少“能量”时。在此,术语“有效地”是指少量的编码数据的生成;对于特定的图像质量水平,理想的是(并且视为“有效的”)实际上生成尽可能少的数据。提及的残差图像中的“能量”涉及包含在残差图像中的信息量。如果预测图像与实际图像一致,两者之间的差值(即,残差图像)将包含零信息(零能量)并且将非常容易编码成少量的编码数据。通常,如果预测过程工作的相当好使得预测图像内容与待编码的图像内容相似,则预期的是残差图像数据将包含比输入图像少的信息(更少能量)并且因此将更容易编码成少量的编码数据。
因此,(使用加法器310的)编码包括为待编码的图像预测图像区域;并且根据预测的图像区域和待编码的图像的相应区域之间的差值生成残差图像区域。结合以下要讨论的技术,数据值的有序阵列包括表示残差图像区域的数据值。解码包括为待解码的图像预测图像区域;生成指示预测的图像区域和待解码的图像的相应区域之间的差值的残差图像区域;其中,数据值的有序阵列包括表示残差图像区域的数据值;并且结合预测的图像区域和残差图像区域。
现在描述用作编码器(用于编码残留或差异图像)的设备的剩余部分。残差图像数据330被提供给生成残差图像数据的块或区域的离散余弦变换(DCT)表示的变换单元或电路340。DCT技术本身是公知的并且此处将不作详细描述。还应注意,DCT的使用仅是一个示例性布置的说明。可以使用的其他转换包括例如离散正弦变换(DST)。变换还可以包括单独变换的顺序或层级,诸如,一个变换(直接地或不直接地)跟着另一个变换的布置。变换的选择可以明确地根据和/或取决于用于配置编码器和解码器的辅助信息。
因此,在实例中,编码和/或解码方法包括为待编码的图像预测图像区域;并且根据预测的图像区域和待解码的图像的相应区域之间的差值生成残差图像区域;其中,(以下要讨论的)数据值的有序阵列包括表示残差图像区域的数据值。
变换单元340的输出(即,针对图像数据的各变换块的一组DCT系数)被提供给量化器350。各种量化技术在从简单乘以量化比例因子至在量化参数控制下的复杂查找表的应用范围的视频数据压缩的领域中是公知的。总的目标是双重的。首先,量化过程减少了变换数据的可能值的数目。其次,量化过程可以增加变换数据的值为零的可能性。这两者可使得以下要描述的熵编码程序更有效率地作用于产生少量的压缩视频数据。
通过扫描单元360应用数据扫描过程。扫描过程的目的是对量化变换数据重新排序,以便使尽可能多的非零量化变换系数收集在一起,并且当然,由此使尽可能多的零值系数收集在一起。这些特征可以允许所谓的游程编码或类似的技术被有效地应用。因此,扫描过程涉及从量化变换数据选择系数,并且具体地,根据“扫描顺序”从对应于已经变换和量化的图像数据的块的系数块中选择系数,使得(a)一次选择所有系数作为扫描的一部分;以及(b)扫描趋向于提供期望的重新排序。一种能够给出有用结果的示例性扫描顺序是一种所谓的笔直对角扫描顺序。
然后,扫描系数被传送给熵编码器(EE)370。再次,可使用各种类型的熵编码。两个实例是所谓的CABAC(上下文自适应二进制算术编码)系统的变形和所谓的CAVLC(上下文自适应可变长编码)系统的变形。一般地说,CABAC被视为提供更好的效率,并且在一些研究中已经示出,与CAVLC相比,对于可比较的图像质量提供的编码输出数据的量减少10-20%。然而,CAVLC被视为表示(就其实现方式而言)比CABAC更低的复杂度。应注意,扫描过程和熵编码过程示出为单独的过程,但是事实上,可以进行组合或者一起处理。即,读入到熵编码器的数据可以以扫描顺序来进行。对应的因素应用于以下将描述的相应的逆过程。
熵编码器370的输出以及例如定义预测器320生成预测图像的方式的(以上提及和/或以下所讨论的)额外数据一起提供压缩的输出视频信号380。
然而,因为预测器320自身的操作取决于压缩的输出数据的解压缩版本,所以还提供返回路径。
该特征的原因如下。在适当平台,在(以下将描述的)解压缩过程中,生成残差数据的解压缩版本。此解压缩的残差数据被添加到预测图像以生成输出图像(因为原始的残差数据为输入图像与预测图像之间的差值)。为了使作为压缩侧与解压缩侧之间的该过程具有可比较性,在压缩过程期间和在解压缩过程期间由预测器320生成的预测图像应相同。当然,在解压缩时,该设备并不访问原始的输入图像,而仅访问解压缩图像。因此,在压缩时,预测器320基于对压缩图像的解压缩版本(至少,对图像间编码)的预测。
由熵编码器370执行的熵编码过程(在至少一些实例中)被视为“无损耗”,即,熵编码过程可以逆转以精确达到与最早提供给熵编码器370的数据相同。因此,在这种实例中,在熵编码平台之前可以实现返回路径。事实上,由扫描单元360执行的扫描过程也被视为无损耗,而在本实施方式中,返回路径390为从量化器350的输出至互补逆量化器420的输入。在由平台引入损耗或潜在损耗的情况下,该平台可包括在由返回路径形成的反馈回路中。例如,熵编码平台至少在原则上有损耗,例如,通过在奇偶信息内编码位的技术。在这种情况下,熵编码和解码应当形成反馈回路的一部分。
一般地说,熵解码器410、反向扫描单元400、逆量化器420和逆变换单元或电路430提供熵编码器370、扫描单元360、量化器350和变换单元340的相应逆功能。现在,将继续讨论压缩过程;以下将单独讨论解压缩输入压缩视频信号的过程。
在压缩过程中,通过执行扫描单元360的逆操作的返回路径390将扫描系数从量化器350传送至逆量化器420。由单元420、430执行逆量化和逆变换过程以生成压缩-解压缩的残差图像信号440。
在加法器450中,图像信号440添加至预测器320的输出以生成重构的输出图像460。如下所述,这形成了到图像预测器320的一个输入。
现在回到应用于解压缩接收的压缩视频信号470的过程,信号被供应至熵解码器410并且在通过加法器450添加至图像预测器320的输出之前从该熵解码器供应至反向扫描单元400、逆量化器420和逆变换单元430的链。因此,在解码器侧,解码器重构残差图像的版本,然后将其(通过加法器450)应用于图像的预测版本(在逐块的基础上),以便解码每个块。在简单方面,加法器450的输出460形成输出解压缩的视频信号480。实际上,在输出信号之前可以可选地应用(例如,通过图8中示出的过滤器560,但是为了使图7的高层级图清晰可见,在图7中省略了该过滤器)进一步过滤。
图7和图8的设备可用作压缩(编码)设备或解压缩(解码)设备。两种类型的设备的功能基本上重叠。在解压缩模式中没有使用扫描单元360和熵编码器370,并且预测器320(以下将进行详细描述)和其他单元的操作依循包含在所接收的压缩位流中而非生成这种信息本身的模式和参数信息。
图8示意性地示出了预测图像的生成,并且具体地,示出了图像预测器320的操作。
存在两种由图像预测器320执行的基本预测模式:所谓的图像内预测和所谓的图像间预测、或者运动补偿(MC)预测。在编码器侧,每个预测包括检测待预测的当前块的预测方向,并且根据其他采样(在相同图像(内)或另一个图像(间)中)生成采样的预测块。鉴于单元310或450,编码或应用在预测块与实际块之间的差异,以便分别编码或解码该块。
(在解码器中,或者在编码器的逆解码侧,预测方向的检测可响应于与通过编码器的编码数据相关联的数据,表示在编码器中使用哪个方向。或者,检测可响应于与在编码器中做出决定的那些因素相同的因素)。
图像内预测基于来自相同图像内的数据预测图像的块或区域的内容。这对应于其他视频压缩技术中的所谓的I帧编码。与I帧编码相反,然而,其包括通过帧内编码来编码整个图像,尽管在其他实施方式中,仍然在逐个图像的基础上做选择,但在本实施方式中,可在逐个块的基础上在帧内编码(intra-encoding)和帧间编码(inter-encoding)之间进行选择。
运动补偿预测是图像间预测的实例并且利用其尝试限定将当前图像中待编码的图像细节的来源(在另一邻接或附近图像中)的运动信息。因此,在理想的实例中,可以将预测图像中图像数据的块的内容非常简单地编码为指向在相邻图像中的相同或稍微不同的位置处的相应块的参考(运动矢量)。
在某些方面,被称为“块复制”的技术是两者的混合,因为它使用矢量指示在相同图像内从当前预测的块位移的位置处的采样的块,这应该被复制为形成当前预测的块。
返回图8,示出了两种图像预测布置(对应于图像内和图像间预测),其结果在(例如,来自控制器343的)模式信号510的控制下由多路复用器500选择,以便提供用于供应给加法器310和450的预测图像的块。做出该选择是根据哪个选项给出最低“能量”(如上所述,其可被视为需要编码的信息内容),并且将该选择在编码输出数据流内发信号给解码器。例如,在这方面,可以通过从输入图像中对两个版本的预测图像的区域执行试验减法,平方差分图像的每个像素值,对平方值求和,以及识别两个版本中的哪一个产生了有关该图像区域的差分图像的较低均方值来检测图像能量。在其他实例中,可以为每个选择或潜在选择执行试验编码,其中就图片编码和失真所需的位的数量中的一个或两个而言根据每个潜在选择的成本进行选择。
帧内编码系统中的实际预测基于作为信号460的一部分接收的图像块进行,即,该预测基于编码-解码图像块,以便在解压缩设备中能够精确地做出相同预测。然而,通过帧内模式选择器520可以从输入视频信号300中得出数据以控制图像内预测器530的操作。
对于图像间预测,运动补偿(MC)预测器540使用诸如由运动估计器550从输入视频信号300得出的运动矢量的运动信息。运动矢量被运动补偿预测器540应用于重构图像460的处理版本以生成图像间预测的块。
因此,根据由预测方向限定的其他采样,单元530和540(使用估计器550进行操作)均用作检测待预测的当前块的预测方向的检测器,并且用作生成采样的预测块的生成器(形成传送至单元310和450的预测的一部分)。
现将描述应用于信号460的处理。首先,信号由过滤器单元560进行可选地过滤,以下将进行更详细地描述。这涉及应用“解块”过滤器以去除或者至少趋向于减少由变换单元340和后续操作执行的基于块处理的效果。还可以使用采样自适应偏移(SAO)过滤器。此外,使用通过处理重构信号460和输入视频信号300得到的系数可选地应用自适应环路滤波器。自适应环路滤波器是使用已知技术将自适应过滤系数应用到待过滤数据的滤波器类型。即,过滤系数可根据各种因素而变化。限定使用哪个过滤系数的数据被包括为编码输出数据流的一部分。
当设备操作为解压缩设备时,从滤波器单元560过滤的输出实际上形成输出视频信号480。它也在一个或多个图像或帧存储器570中缓冲;连续图像的存储是运动补偿预测处理的要求,并且特别是运动矢量的生成。为了节省存储要求,图像存储器570中的存储图像可保持成压缩形式并且然后在生成运动矢量使用时解压缩。对于这个具体目的,可使用任何已知的压缩/解压缩系统。存储图像被传送给生成存储图像的分辨率更高版本的内插滤波器580;在这个实例中,生成中间采样(子采样),使得由内插滤波器580所输出的内插图像的分辨率是针对4:2:0的亮度信道而存储在图像存储器570中的图像的分辨率的4倍(在各个维度),并且是针对4:2:0的色度信道而存储在图像存储器570中的图像的分辨率的8倍(在各个维度)。内插图像作为输入被传送至运动估计器550以及还传送至运动补偿预测器540。
现将描述将图像分割以用于压缩处理的方式。在基础层,待压缩图像被视为采样的块或区域的阵列。可以通过决策树执行图像分为这种块或区域,诸如,在SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services-Coding of moving video High efficiency video coding Recommendation ITU-TH.265 12/2016中描述的决策树。另外,High Efficiency Video Coding(HECV)algorithmsand Architectures,Editors:Madhukar Budagavi,Gary J.Sullivan,Vivienne Sze;ISBN978-3-319-06894-7;2014通过引证将其全部内容结合于本文中。在一些实例中,合成的块或区域具有大小并且在一些情况下具有形状,借助于决策树,大小和形状通常可以依循图像内的图像特征的布置。就其本身而言,这可以允许改善的编码效率,因为表示或依循类似的图像特征的采样将趋向于通过这种布置组合在一起。在一些实例中,不同尺寸(诸如,4×4的采样,高达比如64×64或更大的块)的正方形块或区域可用于选择。在其他示例性布置中,可以使用诸如(例如,垂直或水平定向的)矩形块的不同形状的块或区域。设想了其他非正方形和非矩形的块。将图像划分为这种块或区域的结果(至少在本实例中)在于图像的每个采样被分配至这种块或区域中的一个并且仅一个。
现在将讨论帧内预测过程。一般地说,帧内预测涉及从相同图像中的先前编码和解码的采样生成采样的当前块的预测。
图9示意性地示出了部分编码图像800。在此,图像在逐个块的基础上从左上至右下被编码。通过整个图像的处理部分编码的示例性块被示出为块810。已经编码了块810的上方和左侧的阴影区域820。块810的内容的图像内预测可以利用任一阴影区域820,但是不能利用该阴影区域下方的非阴影区域。
在一些实例中,图像在逐个块的基础上进行编码,使得按照诸如参考图9讨论的顺序的顺序编码较大的块(被称为编码单元或CU)。在每个CU内,存在被处理为一组两个或更多个更小的块或变换单元(TU)的潜力(根据已经发生的块分裂过程)。这可以给出编码的分级顺序,使得图像在逐个CU的基础上进行编码,并且每个CU在逐个TU的基础上进行潜在编码。然而,应注意,对于当前编码树单元(在块划分的树结构中的最大节点)内的单个TU,以上所讨论的编码的分级顺序(逐个CU然后逐个TU)意味着可能有在当前CU中并可用于该TU的编码的先前编码的采样,例如,该采样在该TU的右上或左下。
块810表示CU;如以上所讨论,为了图像内预测处理的目的,这可被细分为一组较小的单元。在CU 810内示出了当前TU 830的实例。一般地说,图片被分成采样的区域或组以允许信令信息和变换数据的有效编码。信息的信令可需要与变换的树结构不同的细分的树结构,并且实际上是与预测信息或预测本身的树结构不同的细分的树结构。因此,编码单元可具有与变换块或区域、预测块或区域和预测信息的树结构不同的树结构。在一些实例中,该结构可以是编码单元的所谓的四叉树,它们的叶节点包含一个或多个预测单元和一个或多个变换单元;变换单元可以包含对应于图片的亮度和色度表示的多个变换块,并且预测可以被视为可应用于变换块水平。在实例中,应用于采样的特定组的参数可以被视为主要限定在块水平,这潜在地与变换结构不具有相同的粒度。
图像内预测考虑了在考虑当前TU之前编码的采样,诸如那些当前TU的上方和/或左方的那些采样。从其中预测所需采样的源采样相对于当前TU可位于不同的位置或者方向上。为了决定哪个方向适于当前的预测单元,示例性编码器的模式选择器520可测试各候选方向的可用TU结构的所有组合并选择具有最佳压缩效率的预测方向和TU结构。
图片也可以基于“片段”进行编码。在一个实例中,片段是CU的水平相邻的组。但是,更一般地说,整个残差图像可形成片段,或者片段可以是单个CU,或者片段可以是CU的行等。因为片段被编码为独立的单元,所以片段给予误差一定的恢复力(resilience)。编码器和解码器状态在片段边界处被完全重置。例如,不跨片段边界执行帧内预测;片段边界被视为用于此目的的图像边界。
图10示意性地示出了一组可能的(候选的)预测方向。全组候选方向可用于预测单元。通过相对于当前块位置的水平和垂直位移来确定方向,但方向被编码为预测“模式”,在图11中示出了一组“模式”。应注意,所谓的DC模式表示周围左上方采样的简单算术平均。还应注意,图10中示出的该组方向仅是一个实例;在其他实例中,一组(例如)65个角度模式加上图12中示意性地示出的DC和平面(一个全组67个模式)组成全组。可以使用其他数量的模式。
一般地说,在检测预测方向之后,根据由预测方向限定的其他采样,这些系统可操作为生成采样的预测块。在实例中,图像编码器被配置为编码识别为图像的每个采样或区域选择的预测方向的数据(并且图像解码器被配置为检测这种数据)。
图13示意性地示出了采样的块或区域910的采样900根据由与该采样相关联的帧内预测模式限定的方向930来源于相同图像的其他参考采样920的帧内预测过程。该实例中的参考采样920来自以上块并且去向所讨论的块910的左侧,并且通过沿着方向930跟踪至参考采样920获得采样900的预测值。方向930可以指向单个单独的参考采样,但是在更普通的情况下,周围参考采样之间的内插值用作预测值。应注意,块910可以是如图13所示的正方形或者可以是另一形状,诸如矩形。
图14示意性地示出了相对于由一个或多个其他图像1450、1460中的运动矢量1420指向的块1430、1440或者这两者预测当前图像1410的块或区域1400的帧间预测过程。如以上所讨论的,可以在生成如上所述编码残差数据中使用该预测块。
CABAC编码
图15示意性地示出了CABAC熵编码器的操作。
在这种本质的上下文自适应编码中,并且根据实施方式,可关于表示数据位多大可能为1或0的预期或预测的概率模型或上下文来编码数据位。为了这样做,输入数据位在代码值范围的两个(或更多个,通常多个)互补子范围中所选择的一个内分配一个代码值,其中,子范围的相应大小(在实施方式中,子范围的相应比例相对于该组代码值)由上下文限定(反过来,该上下文由与输入值相关联的上下文变量或者以其他方式与该输入值有关的上下文变量限定)。下一步骤是响应于所分配的代码值和选择子范围的当前大小修改整个范围,即该组代码值(关于下一个输入数据位或值所使用的)。如果修改后的范围小于表示预定最小大小的阈值(例如,二分之一的原始范围大小),则增加大小,例如,通过使修改后的范围增加一倍(左移),如果需要的话可连续执行加倍过程(一次以上),直至该范围具有至少预定最小大小。在这点上,生成输出编码数据位以指示(或者如果多于一次的话,每个)加倍或大小增加操作发生。进一步步骤是修改用于或者关于下一个输入数据位或值(或者在一些实施方式中,关于下一组待编码的数据位或值)的上下文(即,在实施方式中,修改上下文变量)。这可通过使用当前上下文和当前“最可能符号”(1或者0,无论哪个被上下文指示,当前具有大于0.5的概率)的特性(identity)作为到新上下文值的查找表中的索引或作为从其可得出新上下文变量的适当的数学公式的输入来执行。在实施方式中,上下文变量的修改可增加该组代码值在为当前数据值选择子范围内的比例。
CABAC编码器相对于二进制数据操作,即,仅由0和1这两个符号表示的数据。编码器利用基于先前编码的数据为后续数据选择“上下文”或者概率模型的所谓的上下文建模过程。以确定性方式执行上下文的选择,使得在不需要将进一步数据(具体指上下文)添加到传送至解码器的编码数据流情况下,可基于先前解码的数据在解码器处执行相同的确定。
参考图15,如果不是二进制形式,待编码的输入数据可被传送至二进制转换器900;如果数据已经是二进制形式,(通过示意性的开关910)绕开转换器900。在本实施方式中,通过将量化的变换系数数据表示为一系列二进制“映射”来实际执行对二进制形式的转换,下面将进行进一步描述。
二进制数据然后可以由两个处理路径之一处理,即,“常规”和“旁路”路径(示意性地示出为单独的路径,但是,在下面所讨论的本发明的实施方式中,事实上,可以通过仅利用稍微不同参数的同一处理平台来实施)。旁路路径采用并不一定使用与常规路径相同形式的上下文建模的所谓旁路编码器920。在CABAC编码的一些实例中,如果需要特别地迅速处理一批数据,可以选择旁路路径,但是,在本实施方式中,注意所谓“旁路”数据的两个特征:首先,由CABAC编码器(950,960)处理旁路数据,仅使用表示50%概率的固定上下文模型;以及第二,旁路数据有关某些类别的数据,一个特别的实例为系数符号数据。此外,由示意性开关930、940选择常规路径。这涉及紧跟着编码引擎960的上下文建模器950所处理的数据。
如果该块由零值数据整个形成,图15示出的熵编码器将数据的块(即,例如,对应于与残差图像的块有关的系数的块的数据)编码为单个值。对于不属于这类的每个块,即,包含至少一些非零数据的块,制定“有效映射”。有效映射指示对于待编码的数据的块中的每个位置该块中的对应系数是不是非零(因此,是指示作为非零的最有效数据部分中的相对于数据值阵列的位置的有效映射的实例)。有效映射可包括指示具有非零值的最有效的数据部分的最后的根据数据值阵列的预定排序的位置的数据标志。例如,该编码的数据值阵列的排序可以按照在空间频率中从最低频率系数向上的顺序。这可以与数据值符号的编码的阵列顺序不同,数据值符号的编码可以按照从最高的空间频率系数向下的顺序,例如,从最后一个(按照向上的空间频率顺序)非零系数开始。
二进制形式的有效映射数据本身就是CABAC编码。对于有效映射指示为零的幅值的系数,因为没有任何数据需要被编码,所以使用有效映射可助于压缩。此外,有效映射可包括特殊代码来指示块中的最终非零系数,使得所有的最终高频/拖尾(trailing)零系数可以从编码中省略。在编码位流中,定义由有效映射指定的非零系数的值的数据紧跟有效映射之后。
还制定映射数据的进一步等级并且被CABAC编码。实例是作为二进制值(1=是,0=否)的定义位于有效映射指示为“非零”的映射位置的系数数据是否实际上具有“1”值的映射。另一映射指定位于有效映射指示为“非零”的映射位置的系数数据是否实际上具有“2”值。进一步映射指示,对于有效映射指示系数数据为“非零”的这些映射位置,数据是否具有“大于2”的值。另一映射再次对于识别为“非零”的数据指示数据值的符号(使用预定的二进制表示法,诸如,+为1,-为0,当然或以其他相反方式)数据值的符号。
在实施方式中,例如,由扫描单元360从量化变换系数生成有效映射和其他映射,并且在经受CABAC编码之前经受之字形扫描过程(或者根据帧内预测模式从之字形、水平光栅以及垂直光栅扫描中选择的扫描过程)。
在一些实施方式中,CABAC熵编码器使用以下过程编码语法元素:
编码TU中的最后一个有效系数(按照扫描顺序)的位置。
针对每个4×4系数群组(按照相反扫描顺序处理群组),有效系数群组标记被编码为指示该群组是否包含非零系数。这不需要群组包含最后一个有效系数并且(包含DC系数)左上方群组被假设为1。如果标记是1,则与该群组有关的以下语法元素直接按照以下方式进行编码:
有效映射:
针对该群组中的每个系数,标记被编码为指示该系数是不是有效的(具有非零值)。没有标记是由最后一个有效位置指示的系数所必需的。
大于1的映射:
针对具有有效映射值1(从该群组的端部向后计数)的高达八个系数,这指示幅值是否大于1。
大于2的标记:
至于具有大于1的映射值1(最接近该群组的端部的值)的高达1个系数,这指示幅值是否大于2。
符号位:
在先前提出的布置中,符号位被编码为等概率的CABAC箱,其中,当使用符号位隐藏时,可能反而从奇偶性推断最后一个符号位(按照相反的扫描顺序)。以下将讨论适用于本公开的实施方式的该布置的替换。
转义码:
针对其幅值不是完全由早先的语法元素描述的任意系数,其余被编码为转义码。
一般地说,CABAC编码涉及基于其他先前编码数据预测用于待编码的下一个位的上下文或者概率模型。如果下一个位与由概率模型识别为“最可能”的位相同,则“下一个位与概率模型一致”的信息编码被以极高的效率编码。较低效率的编码“下一个位与概率模型不一致”,因此,上下文数据的推导对于编码器的良好操作比较重要。术语“自适应”意指在编码期间适应上下文或概率模型或者改变,以试图提供对(尚未编码的)下一数据的良好匹配。
用一个简单的比喻,在书面英语中,字母“U”比较少见。但在紧接字母“Q”后的字母位置中,实际上字母“U”很常见。所以,概率模型可将“U”的概率设置为非常低的值,但是如果当前字母是“Q”,作为下一个字母“U”的概率模型可设置为非常高概率值。
尽管不可以为每个系数编码这些语法元素中的任一个,但是在本布置中,使用CABAC编码至少用于有效映射并且该映射指示非零值是1还是2。在这些实施方式中,与CABAC编码相同,但是实际上概率模型被固定在1s和0s的相等(0.5:0.5)概率分布的旁路处理至少用于符号数据以及没有被早先的语法元素描述过的系数幅值的部分。至于识别为具有未被完全描述的系数幅值的部分的那些数据位置,分开的所谓的转义数据编码可用于编码数据的实际的剩余值,其中,实际的幅值是剩余幅值加上从相应的编码语法元素得出的偏移。这可包括哥伦布-莱斯(Golomb-Rice)编码技术。
在SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure ofaudiovisual services-Coding of moving video High efficiency video codingRecommendation ITU-T H.265 12/2016中更详细地描述了CABAC上下文建模和编码过程。另外,High Efficiency Video Coding(HECV)algorithms and Architectures,Editors:Madhukar Budagavi,Gary J.Sullivan,Vivienne Sze;ISBN 978-3-319-06894-7;2014Chap 8p209-274通过引证将其全部内容结合于本文中。
符号位编码
在以下讨论的示例性实施方式中,符号位可以通过等概率编码以外的方式进行编码,例如,对于包括至少一些数据值的一组数据值,从有序阵列中的一个或多个其他数据值的性质预测相应的数据值符号;并依赖相应的预测值对该组数据值的该数据值符号进行编码。
为了实现此目标,使用至少一个或多个符号位的预测。在获得该预测中,应注意,尽管由符号位部分表示的数据值包括明显独立的数据值(例如,作为空间频率系数),但是可以至少存在数据值符号之间的部分依赖性。以下将讨论有助于本公开的实施方式的设计和操作的这个依赖性的原始和经验观察。
应注意,为了实现改善的编码效率,实际上不必能够利用完整的可靠性进行预测,特定的符号位将肯定是表示负号的位,或者将肯定是表示正号的位。实际上,例如使用上下文自适应编码器或者考虑了待编码的下一个符号的概率的类似类型的布置,需要的全部是预测具体的符号位与表示负号的位为(甚至稍微)大约相等的(50%)机会的能力,或者与表示正号的位为(甚至稍微)大约相等机会的能力。可以在诸如图15中示出的上下文自适应编码器中使用这种预测,以便选择用于编码下一个符号位的合适的上下文。
现在将描述符号位预测的技术背景。将首先使用有关DCT编码的实例,但是在以下进一步讨论中,该技术将延伸至诸如离散正弦变换(DST)、所谓的变换跳过模式和所谓的不可分离的二级变换(NSST)模式的其他布置。
在“Algorithm Description of Joint Exploration Test Model 1”,Chen etal,Joint Video Exploration Team(JVET)document JVET-A1001中讨论了不可分离的二级变换(NSST)。在本文献中,公开的NSST表示在正向核心变化和量子化(编码器侧)之间以及在去量子化和反向核心变换(解码器侧)之间应用的二级变换。该文献中的内容通过引证结合于本说明书中。
因此,在示例性布置中,数据值的有序阵列包括残差图像区域的频率变换表示的数据值。频率变换可包括:例如,离散余弦变换(DCT);离散正弦变换(DST);在一个方向上的DCT以及在正交方向上的DST;以及第一变换,随后是不可分离的二级变换。在其他实例中,数据值的有序阵列可包括变换跳过模式中的残差图像区域的重排表示的数据值。
在SERIES H:AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure ofaudiovisual services-Coding of moving video High efficiency video codingRecommendation ITU-T H.265 12/2016中更详细地描述了CABAC上下文建模和编码过程的部分8.6.2讨论了变换跳过操作。另外,High Efficiency Video Coding(HECV)algorithmsand Architectures,Editors:Madhukar Budagavi,Gary J.Sullivan,Vivienne Sze;ISBN978-3-319-06894-7;2014Chap 8p209-274通过引证将其全部内容结合于本文中。针对一些区域或块,可以通过跳过该转换实现编码增益。在一些情况下,空间域中的残差按照反向空间顺序被量化和编码(以便利用频率变换块中的系数幅值的期望顺序(通常,DC系数的左上方最大)调整空间差值的期望幅值,远离参考采样最远的块的右下方最大)。
针对帧内预测数据,在残差块中,一般说来,残差采样越接近其相应的参考采样,预期的误差或残差值幅值越低。(相反,针对帧间预测数据,误差倾向于更均匀地分布在块上)。在此使用且在本技术的其他讨论中经常使用的表示中,残差块的左上方的参考采样将趋向于比在残差块的底部和/或右侧的参考采样具有更低的误差。实际上,部分原因在于提出了所谓的“短距离帧内预测”(SDIP)布置。
在CE6.b1 Report on Short Distance Intra Prediction Method,Cao et al,Joint Collaborative Team on Video Coding(JCT-VC)document:JCTVC-E278中讨论了短距离帧内预测(SDIP)。在SDIP中,较大的块被划分为可以单独编码的所谓的SDIP分区。该文献中的内容通过引证结合于本说明书中。
然而,考虑到DCT实例中的频域中的含义,图16示意性地示出了来自左上方的DC系数的8×8的示例性块的一组DCT基底函数,在向右方向上朝向增长的水平空间频率并且在向下方向上朝向增长的垂直空间频率。
例如,以水平方向为例,如果残差块中的能量低至块的左侧,则DCT系数1600(系数(0,0)可能与下一个水平相邻的系数(0,1)1610具有相反符号。换言之:
符号(c0,0)与符号(c0,1)相同的概率<0.5
这仅是一对系数位置的一个实例。实际上,使用大量试验数据的经验研究指出在符号位之间、DCT块内的多组位置之间存在相互关系(也就是说正的或负的相互关系)。
下面将讨论帧间编码。在帧内编码用于生成从其获得残差块的预测的情况下,这些相互关系的性质可以取决于所使用的预测模式或方向。上述图10至图12讨论了预测模式的示例性组,并且在下面的讨论中,尽管该原理可以应用于使用的任何组,但是图11的示例性组将参考该原理。因此,在实例中,为待编码的图像预测图像区域的步骤包括根据图像的沿由预测模式限定的方向从预测采样位移的其他先前编码和解码的采样预测图像区域的采样。
考虑了通常垂直的预测模式(诸如,模式25或25+/-诸如4的裕度)的实例。在此,符号位之间的依赖性可以趋向于通常(但是不一定唯一地)在垂直方向上作用。参考图17,使用块中仅有一个位置的实例(位置1700,标记为“X”),但是应理解,类似原理至少潜在应用于块内的任何或所有位置。至于垂直模式,被视为与位置X的符号最相关的符号位示出为位置1710,标记为“V”。
接下来考虑了通常水平的预测模式(诸如,模式10或10+/-诸如4的裕度)的实例。在此,符号位之间的依赖性可以趋向于通常(但不一定是唯一地)在水平方向上作用。再次参考图17,至于水平模式,被视为与位置X的符号最相关的符号位示出为位置1720,标记为“H”。
接下来考虑了通常为对角线的预测模式(诸如,模式18或18+/-诸如4的裕度、或者模式2+裕度、或者模式34–裕度)的实例。在此,符号位之间的依赖性可以趋向于通常(但不一定是唯一地)在对角线或水平和垂直混合方向上作用。再次参考图17,至于对角线模式,被视为与位置X的符号最相关的符号位示出为位置1730,标记为“D”。
接下来考虑了DC或平面预测模式(诸如,模式0或1)的实例。再次参考图17,至于DC或平面模式,被视为与位置X的符号最相关的符号位示出为位置1740,标记为“P”。
因此,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的相对位置可以取决于适用于数据值阵列的预测模式。
在使用该技术的块的编码中,响应于以前编码的符号位为特定的符号位生成预测可能是有用的。这使得能够在编码器和解码器执行补充过程,使得可以基于已经解码的符号位在解码器进行对应预测。
该技术适用于DST、变换跳过和编码图像间以及适用于在此讨论的DCT编码的帧内图像的实例。查询可以在这些不同布置之间不同,但是根本技术同样可适用。可以使用不可分离的二级变换(NSST)或者增强的多个变换(EMT)。一个变换(诸如,DCT或者DST)可以在一个轴线(诸如,水平的或垂直的)上使用并且另一变换(诸如,DST或DCT)可以在其他正交方向上使用。
针对帧间编码块,可以观察并且以下将讨论不同的相互关系。图16的块提供数据值的有序阵列包括残差图像区域的频率变换表示的数据值的实例,其中,残差图像区域经受了一系列一个或多个频率变换(诸如,变换和NSST)。例如,频率变换包括以下中的一个或多个:离散余弦变换(DCT);离散正弦变换(DST);在一个方向上的DCT以及在正交方向上的DST;以及第一变换,随后是不可分离的二级变换。可替换地,数据值的有序阵列可包括变换跳过模式中的残差图像区域的重排表示的数据值。
以下将讨论可以利用这些相互关系的示例性方式。
参考图18,至于待编码的不同区域,可以使用不同组的系数甚至不同的算法执行符号预测过程。图18中示出的实例是:
·区域0,左上方(DC)系数;
·区域1,第一行;
·区域2,左列;以及
·区域3,所有其他位置
这些分组可以影响从其预测符号的该采样或多个采样的相对位置,在于针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的相对位置取决于待预测的数据值的数据值阵列内的位置。因此,在实例中,至于该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的相对位置取决于待预测的数据值的数据值阵列内的位置。
图19示意性地示出了作为输入接收以下项中的一个或多个的预测器/选择器单元1900:
·当前适用的预测模式
·当前块内的系数位置
·当前块是否被帧间编码或帧内预测的指示
·当前块是否被DCT编码、DST编码、在一个方向上的DCT编码和在正交方向上的DST编码或者变换跳过编码的指示
·由其他先前编码的符号位表示的符号
这些输入应用于查询表,例如,因此使得预测器/选择器单元1900作为输出1910生成以下项中的一个或两个:
·当前符号位的预测;和/或
·编码(或者在解码器的情况下,解码)当前符号位中待使用的上下文
应注意,查询还可以是指其他数据,使得在一些实例中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的性质取决于选自由以下项组成的列表中的一个或多个:
·适用于数据值阵列的预测模式;
·数据值阵列的阵列大小;
·数据值阵列的形状;以及
·数据值阵列内的该数据值的位置
应注意,实施方式不局限于一个或多个其他数据值的性质(预测/上下文选择基于此)包括一个或多个其他数据值的符号的布置。在其他实例中,一个或多个其他数据值的性质反而或额外可以包括一个或多个其他数据值的幅值。
图20a和图20b示意性地示出了另一实例,其中,针对块中诸如位置2000的特定的任意位置X,适用于该位置的符号被预测(或者生成用于编码该符号位的上下文)为相应的相对位置处的其他附近的以前编码的(或者在解码器中,以前解码的)符号位A…F的符号的查询功能,其中,那些位置实际上存在于相对于位置X的已经编码或已经解码的数据中。
针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值在与数据值阵列中的该数据值的预定的相对位置处。图20b提供了该实例。
针对帧间编码块,可以观察不同的相互关系:
针对DCT×DCT符号位帧内预测:
当前系数X(以及位置x,y)周围的邻居
参见包括图20b中待预测的数据值X的图案:
在至少一些示例性实施方式中,在上文中做出的不同预测根据匹配可具有与它们相关联的不同的概率模型(即,使用不同的上下文)。
例如,如果右侧和下方具有相同的符号,则良好预测的概率通常比仅存在于右侧或仅存在于下方更好。因此,不同的CABAC上下文可以用于不同的条件。在实施方式中,使用的CABAC上下文还可以取决于位置(例如,DC)、或者色度/亮度分量。
图21示意性地示出了在许多方面与图19的预测器/上下文选择器单元类似的预测器/上下文选择器单元2100,但是该输入(就它们存在的其他以前编码/解码的符号位而言)包括在相对于考虑中的当前符号位的相对位置A…F处的那些输入。该输出可以是通过图15的设备的当前符号位或反而(或者同样)在当前符号位的上下文自适应编码中使用的上下文的预测。在采样A…F的实例中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值在与数据值阵列中的该数据值的预定的相对位置处。
在这种实施方式中,将数据值符号进行编码可包括执行其中上下文取决于(如通过图21的设备获得的)预测的数据值符号的上下文自适应编码(例如,使用图15)。类似地,在解码中,图21的布置可以通过与图15的设备互补的熵解码器410使用的上下文,使得使数据值符号解码包括执行上下文取决于预测的数据值符号的上下文自适应解码。
图21或图19的输入例如可以是其他数据值符号,使得一个或多个其他数据值的性质包括一个或多个其他数据值的符号。在其他实例中,一个或多个其他数据值的性质包括一个或多个其他数据值的幅值。
作为到目前为止讨论的信息的概要,图22是示出了数据编码方法的示意性流程图,包括:
将数据值的有序阵列编码(在步骤2200中)为表示数据值幅值的数据以及表示数据值符号的数据;
针对包含至少一些数据值的一组数据值从有序阵列中的一个或多个其他数据值的性质预测(在步骤2210中)相应的数据值符号;并且
根据相应的预测值为该组数据值编码(在步骤2220中)数据值符号。
类似地,图23是示出了数据解码方法的示意性流程图,包括:
将数据值的有序阵列解码(在步骤2300中)为表示数据值幅值的数据以及表示数据值符号的数据;
针对包含至少一些数据值的一组数据值从有序阵列中的一个或多个其他数据值的性质预测(在步骤2310中)相应的数据值符号;并且
根据相应的预测值为该组数据值解码(在步骤2320中)数据值符号。
图24示意性地示出了数据编码设备的至少一部分,包括:
编码器2400,例如包括图7的单元360、370,该编码器2400被配置为将数据值的有序阵列编码为表示数据值幅值的数据以及表示数据值符号的数据;以及
预测器2410,例如由单元370与单元343合作实现,该预测器被配置为针对包含至少一些数据值的一组数据值从有序阵列中的一个或多个其他数据值的性质预测相应的数据值符号;
编码器被配置为根据相应的预测值为该组数据值编码数据值符号。
图25示意性地示出了数据解码设备的至少一部分,包括:
解码器2500,例如包括图7的单元410、400,该解码器2500被配置为将数据值的有序阵列编码为表示数据值幅值的数据以及表示数据值符号的数据;以及
预测器2510,例如由单元410与单元343合作实现,该预测器2510被配置为针对包含至少一些数据值的一组数据值从有序阵列中的一个或多个其他数据值的性质预测相应的数据值符号;
解码器被配置为根据相应的预测值为该组数据值编码数据值符号。
编码设备和解码设备中的一个或两个可以实现为以上讨论的视频存储、捕获、发送或接收设备的至少一部分。
以上提供了编码顺序的实例。现在将参考图26和图27描述其他两个实例。在图26和图27中,左列表示变换单元执行的动作,并且右侧列表示该变换单元内的4×4或16(或者另一细分)个系数的其他群组执行的动作,每个接着例如按照16个系数群组的相反对角线扫描顺序进行处理。
编码顺序的实例
参考图26,变换单元可以执行以下步骤:
·编码最后的X/Y位置(在步骤2600中)-具有最高扫描顺序位置的系数(最高频率系数)的X/Y位置
·针对16个系数的每个群组,以包含最后的X/Y位置的最后的系数群组开始
·编码(在步骤2610中)该群组是否具有任何系数(除非这由一些其他方法推断出)
·编码(在步骤2620中)有效映射
·编码(在步骤2630中)>1的映射
·编码(在步骤2640中)>2的映射
·编码(在步骤2650中)剩余系数。
·如果该群组中的系数的数量超过极限,发送(如果需要)EMT+NSST标记的信号(在步骤2660中)
·针对16个系数的每个群组…
·编码(在步骤2670中)符号位。
参考图27,在可替换的示例性布置中,变换单元可以执行以下步骤:
·编码最后的X/Y位置(在步骤2700中)-具有最高扫描顺序位置的系数(最高频率系数)的X/Y位置
·如果最后的X/Y位置(作为扫描顺序索引)超过极限,则发送(如果需要)EMT+NSST标记的信号(在步骤2710中)
·针对每个群组的16个系数,以包含最后的X/Y位置的最后一个系数群组开始
·编码(在步骤2720中)该群组是否具有任何系数(除非这由一些其他方法推断出)
·编码(在步骤2730中)有效映射
·编码(在步骤2740中)>1的映射
·编码(在步骤2750中)>2的映射
·编码(在步骤2760中)剩余系数。
·编码(在步骤2770中)符号位。
隐写术和符号位隐藏
该术语指的是将数据隐藏在其他数据内,并且在本上下文是被称为符号位隐藏(SBH)的技术的参考中,其版本可以应用于本技术。
符号位隐藏是通过(实际上)将非零系数的一个符号位隐藏在一组其他系数内来节省发送每个块的一个符号位的成本的技术。这通过编码器将该群组系数的奇偶性(总和是偶数或奇数)人为设置为期待值来实现,使得奇偶性本身表示隐藏的符号位。这通过使系数值中的一个稍微畸变来实现,希望以这导致的增大的噪音比没有传输一个符号位的净增益更不重要的方式。
先前提出的SBH技术将此应用于DC系数或者应用于按照(以下讨论的)编码或阵列顺序待编码的最后一个系数。
在本示例性技术中,SBH或隐写编码应用于按照阵列顺序待编码的第一符号位。这是因为以上讨论的符号位的预测依赖于以前编码和解码的符号位,因此可以通过利用待编码的第一符号位上的SBH实现更重要的增益,使得可以在该符号位上建立其他预测。
用于符号编码的阵列处理顺序可以是诸如图28中示意性地示出的反向对角线扫描顺序。待编码的第一符号位是16个系数(诸如,图28中的系数2800)的当前群组中的“最后的X/Y位置”处的系数的符号位。“最后的X/Y位置”相对于从块的左上方的顺序得出,但是编码和解码按照图28的阵列顺序进行。
因此,在这些实例中,以上讨论的方法可以包括根据诸如图28的反向对角线扫描顺序的阵列处理顺序为阵列的数据值执行预测和编码步骤。在一些实例中,该方法包括按照阵列处理顺序(诸如,“最后的X/Y位置”,但是按照图28的反向对角线顺序)为表示数据值幅值的数据之中的第一数据值隐写地编码数据值符号。
目前,已经将本公开的实施方式描述为至少部分地由软件控制的数据处理设备实现,应当理解,承载这种软件的诸如光盘、磁盘、半导体存储器等的非易失性机器可读介质也被认为表示本公开的实施方式。类似地,包括根据以上讨论的方法生成的编码数据的数据信(无论是否体现在非易失性机器可读介质上)号也被认为表示本公开的实施方式。
显而易见的是,借鉴上述教导,本公开的许多修改和变化是可能的。因此应当理解,在所附项的范围内,该技术可以按不同于本文中具体描述的方式来实践。
应当理解,为了清楚起见,以上描述已经参考不同的功能单元、电路和/或处理器描述了实施方式。然而,显而易见的是,在不背离实施方式的情况下,可以使用不同的功能单元、电路和/或处理器之间的任何合适的功能分布。所描述的实施方式可以以任何合适的形式实现,包括硬件、软件、固件或这些的任何组合。所描述的实施方式可以可选地至少部分地实现为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件。任何实施方式的元件和部件可以以任何合适的方式在物理上、功能上和逻辑上实现。实际上,该功能可以在单个单元中、在多个单元中或作为其他功能单元的一部分来实现。因而,所公开的实施方式可以在单个单元中实现,或者可以在不同的单元、电路和/或处理器之间在物理上和在功能上分布。
尽管已经结合一些实施方式描述了本公开,但是并不旨在局限于本文中阐述的特定形式。此外,尽管可能看起来结合具体实施方式描述了特征,但是本领域技术人员将认识到,所描述的实施方式的各种特征可以以适合于实现该技术的任何方式组合。
在以下带标号的项中限定了各个方面和特征:
1.一种数据编码方法,包括:
将数据值的有序阵列编码为表示数据值幅值的数据以及表示数据值符号的数据;
针对包含至少一些数据值的一组数据值从有序阵列中的一个或多个其他数据值的性质预测相应的数据值符号;并且
根据相应的预测值为该组数据值编码数据值符号。
2.根据项1所述的方法,其中,编码数据值符号的步骤包括执行上下文自适应编码,其中,上下文取决于预测的数据值符号。
3.根据项1或项2所述的方法,其中,一个或多个其他数据值的性质包括一个或多个其他数据值的符号。
4.根据前述项中任一项所述的方法,其中,一个或多个其他数据值的性质包括一个或多个其他数据值的幅值。
5.根据前述项中任一项所述的方法,其中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值在与数据值阵列中的该数据值的预定的相对位置处。
6.根据项5所述的方法,其中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的相对位置取决于待预测的数据值的数据值阵列内的位置。
7.根据项5或项6所述的方法,其中,数据值表示图像数据。
8.根据项7所述的方法,包括以下步骤:
为待编码的图像预测图像区域;并且
根据预测的图像区域与待编码的图像的相应区域之间的差值生成残差图像区域;
其中,数据值的有序阵列包括表示残差图像区域的数据值。
9.根据项8所述的方法,其中,数据值的有序阵列包括残差图像区域的频率变换表示的数据值,其中,残差图像区域经受了一系列一个或多个频率变换。
10.根据项9所述的方法,其中,频率变换包括以下项中的一个或多个:
离散余弦变换(DCT);
离散正弦变换(DST);
在一个方向上的DCT以及在正交方向上的DST;以及
第一变换,随后是不可分离的二级变换。
11.根据项8所述的方法,其中,数据值的有序阵列包括变换跳过模式中的残差图像区域的重排表示的数据值。
12.根据项8至11中任一项所述的方法,其中,为待编码的图像预测图像区域的步骤包括根据图像的沿由预测模式限定的方向从预测的采样位移的其他先前编码和解码的采样预测图像区域的采样。
13.根据项12所述的方法,其中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的相对位置取决于适用于数据值阵列的预测模式。
14.根据项12或项13所述的方法,其中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的性质取决于选自由以下项组成的列表中的一个或多个:
适用于数据值阵列的预测模式;
数据值阵列的阵列大小;
数据值阵列的形状;以及
数据值阵列内的该数据值的位置。
15.根据前述项中任一项所述的方法,包括根据阵列处理顺序为阵列的数据值执行预测和编码步骤。
16.根据项15所述的方法,包括按照阵列处理顺序为表示数据值幅值的数据之中的第一数据值隐写地编码数据值符号。
17.一种计算机软件,在由计算机执行时使计算机执行前述项中任一项所述的方法。
18.一种机器可读非易失性储存介质,存储根据项17所述的计算机软件。
19.一种数据编码设备,包括:
编码器,被配置为将数据值的有序阵列编码为表示数据值幅值的数据以及表示数据值符号的数据;以及
预测器,被配置为针对包含至少一些数据值的一组数据值从有序阵列中的一个或多个其他数据值的性质预测相应的数据值符号;
编码器被配置为根据相应的预测值为该组数据值编码数据值符号。
20.一种视频存储、捕获、发送或接收设备,包括根据条款19所述的设备。
21.一种数据解码方法,包括:
将数据值的有序阵列解码为表示数据值幅值的数据以及表示数据值符号的数据;
针对包含至少一些数据值的一组数据值从有序阵列中的一个或多个其他数据值的性质预测相应的数据值符号;并且
根据相应的预测值为该组数据值解码数据值符号。
22.根据项21所述的方法,其中,解码数据值符号的步骤包括执行上下文自适应解码,其中,上下文取决于预测的数据值符号。
23.根据项21或项22所述的方法,其中,一个或多个其他数据值的性质包括一个或多个其他数据值的符号。
24.根据项21至23中任一项所述的方法,其中,一个或多个其他数据值的性质包括一个或多个其他数据值的幅值。
25.根据项21至24中任一项所述的方法,其中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值在与数据值阵列中的该数据值的预定的相对位置处。
26.根据项25所述的方法,其中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的相对位置取决于待预测的数据值的数据值阵列内的位置。
27.根据项25或项26所述的方法,其中,数据值表示图像数据。
28.根据项27所述的方法,包括以下步骤:
为待解码的图像预测图像区域;
生成指示预测的图像区域与待解码的图像的相应区域之间的差值的残差图像区域;
其中,数据值的有序阵列包括表示残差图像区域的数据值;并且
将预测的图像区域和残差图像区域结合。
29.根据项28所述的方法,其中,数据值的有序阵列包括残差图像区域的频率变换表示的数据值。
30.根据项29所述的方法,其中,频率变换包括:
离散余弦变换(DCT);
离散正弦变换(DST);
在一个方向上的DCT以及在正交方向上的DST;以及
第一变换,随后是不可分离的二级变换。
31.根据项28所述的方法,其中,数据值的有序阵列包括变换跳过模式中的残差图像区域的重排表示的数据值。
32.根据项28至31中任一项所述的方法,其中,为待解码的图像预测图像区域的步骤包括根据图像的沿由预测模式限定的方向从预测的采样位移的其他先前解码的采样预测图像区域的采样。
33.根据项32所述的方法,其中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的相对位置取决于适用于数据值阵列的预测模式。
34.根据项32或项33所述的方法,其中,针对该组数据值中的每个数据值,从其预测该数据值的一个或多个其他数据值的性质取决于选自由以下项组成的列表中的一个或多个:
适用于数据值阵列的预测模式;
数据值阵列的阵列大小;
数据值阵列的形状;以及
数据值阵列内的该数据值的位置。
35.根据项21至34中任一项所述的方法,包括根据阵列处理顺序为阵列的数据值执行预测和解码步骤。
36.根据项35所述的方法,包括按照阵列处理顺序为表示数据值幅值的数据之中的第一数据值隐写地编码数据值符号。
37.一种计算机软件,当由计算机执行时,使计算机执行根据项21所述的方法。
38.一种机器可读非易失性储存介质,存储根据项37所述的计算机软件。
39.一种数据解码设备,包括:
解码器,被配置为将数据值的有序阵列编码为表示数据值幅值的数据以及表示数据值符号的数据;以及
预测器,被配置为针对包含至少一些数据值的一组数据值从有序阵列中的一个或多个其他数据值的性质预测相应的数据值符号;
解码器被配置为根据相应的预测值为该组数据值编码数据值符号。
40.一种视频存储、捕获、发送或接收设备,包括根据项39所述的设备。
41.一种视频捕获设备,包括图像传感器和根据项19所述的编码器设备。
42.一种根据项41所述的视频捕获设备,还包括根据项39的设备以及数据流输出至的显示器。
43.一种根据项41所述的视频捕获设备,包括被配置为发送经编码的数据流的发射器。
Claims (24)
1.一种数据编码方法,包括:
在两种或更多种模式下对数据值的有序阵列进行编码,所述数据值在第一模式中表示离散余弦变换或离散正弦变换系数,并且所述数据值在第二变换跳过模式中表示数据值幅度和表示数据值符号的数据;
针对所述第二变换跳过模式中的数据值,从所述有序阵列中的至少一个数据值中检测相应的数据符号值;以及
得出用于编码所述数据值的上下文。
2.根据权利要求1所述的数据编码方法,其中,所述上下文基于检测到的相应的所述数据符号值。
3.根据权利要求2所述的数据编码方法,所述方法进一步包括:使用得出的上下文对所述数据值符号进行编码。
4.根据权利要求2所述的数据编码方法,其中,从所述有序阵列中的至少一个数据值中检测相应的数据符号值包括:检测附近的已编码数据值的符号值。
5.根据权利要求2所述的数据编码方法,其中,从所述有序阵列中的至少一个数据值中检测相应的数据符号值包括:检测水平相邻数据值和垂直相邻数据值的符号值。
6.根据权利要求5所述的数据编码方法,其中,得出所述上下文包括:对检测到的所述数据符号值使用查找函数。
7.根据权利要求2所述的数据编码方法,其中,查找函数基于检测到的符号值是否相反或检测到的符号值是否相等来确定选择多个上下文中的哪个上下文,并且所述方法进一步包括基于所选的上下文对数据值进行编码。
8.根据权利要求2所述的数据编码方法,其中,用于确定选择多个上下文中的哪个上下文的查找函数进一步取决于检测到的对于所述数据值的预测模式。
9.根据权利要求8所述的数据编码方法,检测到的所述预测模式包括帧间预测模式和帧内预测模式。
10.根据权利要求1所述的数据编码方法,其中,所述上下文是CABAC上下文。
11.一种数据编码设备,包括电路,所述电路被配置为:
在两种或更多种模式下对数据值的有序阵列进行编码,所述数据值在第一模式中表示离散余弦变换或离散正弦变换系数,并且所述数据值在第二变换跳过模式中表示数据值幅度和表示数据值符号的数据;
针对所述第二变换跳过模式中的数据值,从所述有序阵列中的至少一个数据值中检测相应的数据符号值;以及
得出用于编码所述数据值的上下文。
12.一种数据解码方法,包括:
在两种或更多种模式下对数据值的有序阵列进行解码,所述数据值在第一模式中表示离散余弦变换或离散正弦变换系数,并且所述数据值在第二变换跳过模式中表示数据值幅度和表示数据值符号的数据;
针对所述第二变换跳过模式中的数据值,从所述有序阵列中的至少一个数据值中检测相应的数据符号值;以及
得出用于解码所述数据值的上下文。
13.根据权利要求12所述的数据解码方法,其中,所述上下文基于检测到的相应的所述数据符号值。
14.根据权利要求12所述的数据解码方法,所述方法进一步包括:使用得出的上下文对所述数据值符号进行解码。
15.根据权利要求12所述的数据解码方法,其中,从所述有序阵列中的至少一个数据值中检测相应的数据符号值包括:检测附近的已编码数据值的符号值。
16.根据权利要求12所述的数据解码方法,其中,从所述有序阵列中的至少一个数据值中检测相应的数据符号值包括:检测水平相邻数据值和垂直相邻数据值的符号值。
17.根据权利要求16所述的数据解码方法,其中,得出所述上下文包括:对检测到的所述数据符号值使用查找函数。
18.根据权利要求12所述的数据解码方法,其中,查找函数基于检测到的符号值是否相反或检测到的符号值是否相等来确定选择多个上下文中的哪个上下文,并且所述方法进一步包括基于所选的上下文对数据值进行解码。
19.根据权利要求12所述的数据解码方法,其中,用于确定选择多个上下文中的哪个上下文的查找函数进一步取决于检测到的对于所述数据值的预测模式。
20.根据权利要求19所述的数据解码方法,检测到的所述预测模式包括帧间预测模式和帧内预测模式。
21.根据权利要求12所述的数据解码方法,其中,所述上下文是CABAC上下文。
22.一种非暂时性存储介质,其上存储有代码组件,所述代码组件在由计算机执行时,使所述计算机执行根据权利要求12所述的方法。
23.一种数据解码设备,包括电路,所述电路被配置为:
在两种或更多种模式下对数据值的有序阵列进行解码,所述数据值在第一模式中表示离散余弦变换或离散正弦变换系数,并且所述数据值在第二变换跳过模式中表示数据值幅度和表示数据值符号的数据;
针对所述第二变换跳过模式中的数据值,从所述有序阵列中的至少一个数据值中检测相应的数据符号值;以及
得出用于解码所述数据值的上下文。
24.视频存储、捕获、发送或接收设备,包括根据权利要求23所述的数据解码设备。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1801839.0 | 2018-02-05 | ||
GB1801839.0A GB2570711B (en) | 2018-02-05 | 2018-02-05 | Data encoding and decoding |
CN201980011647.5A CN111684810A (zh) | 2018-02-05 | 2019-01-23 | 数据编码和解码 |
PCT/GB2019/050181 WO2019150075A1 (en) | 2018-02-05 | 2019-01-23 | Data encoding and decoding |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980011647.5A Division CN111684810A (zh) | 2018-02-05 | 2019-01-23 | 数据编码和解码 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117915092A true CN117915092A (zh) | 2024-04-19 |
Family
ID=61730928
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980011647.5A Pending CN111684810A (zh) | 2018-02-05 | 2019-01-23 | 数据编码和解码 |
CN202410102762.6A Pending CN117915092A (zh) | 2018-02-05 | 2019-01-23 | 数据编码和解码方法、数据编码和解码设备及存储介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980011647.5A Pending CN111684810A (zh) | 2018-02-05 | 2019-01-23 | 数据编码和解码 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11924430B2 (zh) |
EP (1) | EP3750319A1 (zh) |
JP (2) | JP2021513257A (zh) |
KR (1) | KR20200116479A (zh) |
CN (2) | CN111684810A (zh) |
GB (1) | GB2570711B (zh) |
WO (1) | WO2019150075A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113841409B (zh) * | 2019-05-10 | 2023-12-19 | 北京字节跳动网络技术有限公司 | 用于视频处理的简化二次变换的有条件使用 |
CN117354521A (zh) | 2019-06-07 | 2024-01-05 | 北京字节跳动网络技术有限公司 | 视频比特流中的简化二次变换的有条件信令 |
EP3994887A4 (en) | 2019-08-03 | 2022-09-28 | Beijing Bytedance Network Technology Co., Ltd. | MATRIX SELECTION FOR A REDUCED SECONDARY TRANSFORM IN VIDEO CODING |
CN114223208B (zh) | 2019-08-17 | 2023-12-29 | 北京字节跳动网络技术有限公司 | 为视频中的缩减二次变换的边信息的上下文建模 |
US11677971B2 (en) * | 2020-10-01 | 2023-06-13 | Tencent America LLC | Method and apparatus for video coding |
CN116800968A (zh) * | 2022-03-17 | 2023-09-22 | 中兴通讯股份有限公司 | 编码方法及装置、解码方法及装置、存储介质、电子装置 |
WO2023194193A1 (en) * | 2022-04-08 | 2023-10-12 | Interdigital Ce Patent Holdings, Sas | Sign and direction prediction in transform skip and bdpcm |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7352903B2 (en) * | 2004-08-17 | 2008-04-01 | Pegasus Imaging Corporation | Methods and apparatus for implementing JPEG 2000 encoding operations |
GB0600141D0 (en) * | 2006-01-05 | 2006-02-15 | British Broadcasting Corp | Scalable coding of video signals |
US9167253B2 (en) | 2011-06-28 | 2015-10-20 | Qualcomm Incorporated | Derivation of the position in scan order of the last significant transform coefficient in video coding |
WO2013003819A1 (en) * | 2011-06-30 | 2013-01-03 | Huawei Technologies Co., Ltd. | Encoding of prediction residuals for lossless video coding |
GB2501535A (en) * | 2012-04-26 | 2013-10-30 | Sony Corp | Chrominance Processing in High Efficiency Video Codecs |
US20130294524A1 (en) * | 2012-05-04 | 2013-11-07 | Qualcomm Incorporated | Transform skipping and lossless coding unification |
US9307264B2 (en) * | 2012-06-22 | 2016-04-05 | Sharp Kabushiki Kaisha | Arithmetic decoding device, arithmetic coding device, image decoding apparatus, and image coding apparatus |
US9088769B2 (en) * | 2012-06-28 | 2015-07-21 | Blackberry Limited | Reduced worst-case context-coded bins in video compression with parity hiding |
US20140286413A1 (en) * | 2013-03-25 | 2014-09-25 | Qualcomm Incorporated | Disabling sign data hiding in video coding |
GB2513111A (en) * | 2013-04-08 | 2014-10-22 | Sony Corp | Data encoding and decoding |
US9456210B2 (en) * | 2013-10-11 | 2016-09-27 | Blackberry Limited | Sign coding for blocks with transform skipped |
US9264724B2 (en) * | 2013-10-11 | 2016-02-16 | Blackberry Limited | Sign coding for blocks with transform skipped |
FR3012714A1 (fr) * | 2013-10-25 | 2015-05-01 | Orange | Procede de codage et de decodage d'images, dispositif de codage et de decodage d'images et programmes d'ordinateur correspondants |
GB2521828A (en) * | 2013-12-23 | 2015-07-08 | Sony Corp | Data encoding and decoding |
FR3023112A1 (fr) * | 2014-06-27 | 2016-01-01 | Bcom | Procede de codage d'une image numerique, procede de decodage, dispositifs et programmes d'ordinateurs associes |
JP2016092589A (ja) * | 2014-11-04 | 2016-05-23 | キヤノン株式会社 | 符号化装置及びその制御方法 |
EP3326369A4 (en) * | 2015-07-17 | 2019-02-27 | Nokia Technologies Oy | METHOD AND DEVICE FOR CODING AND DECODING PICTURES |
US10440399B2 (en) * | 2015-11-13 | 2019-10-08 | Qualcomm Incorporated | Coding sign information of video data |
US20170374369A1 (en) * | 2016-06-24 | 2017-12-28 | Mediatek Inc. | Methods and Apparatuses of Decoder Side Intra Mode Derivation |
US10666937B2 (en) * | 2016-12-21 | 2020-05-26 | Qualcomm Incorporated | Low-complexity sign prediction for video coding |
-
2018
- 2018-02-05 GB GB1801839.0A patent/GB2570711B/en active Active
-
2019
- 2019-01-23 CN CN201980011647.5A patent/CN111684810A/zh active Pending
- 2019-01-23 JP JP2020542267A patent/JP2021513257A/ja active Pending
- 2019-01-23 CN CN202410102762.6A patent/CN117915092A/zh active Pending
- 2019-01-23 WO PCT/GB2019/050181 patent/WO2019150075A1/en unknown
- 2019-01-23 KR KR1020207024914A patent/KR20200116479A/ko active Search and Examination
- 2019-01-23 US US16/965,510 patent/US11924430B2/en active Active
- 2019-01-23 EP EP19702672.7A patent/EP3750319A1/en active Pending
-
2023
- 2023-08-16 JP JP2023132413A patent/JP2023156438A/ja active Pending
-
2024
- 2024-02-29 US US18/592,128 patent/US20240205408A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
JP2021513257A (ja) | 2021-05-20 |
GB2570711A (en) | 2019-08-07 |
US20210051328A1 (en) | 2021-02-18 |
EP3750319A1 (en) | 2020-12-16 |
CN111684810A (zh) | 2020-09-18 |
GB2570711B (en) | 2023-04-05 |
US11924430B2 (en) | 2024-03-05 |
GB201801839D0 (en) | 2018-03-21 |
US20240205408A1 (en) | 2024-06-20 |
KR20200116479A (ko) | 2020-10-12 |
WO2019150075A1 (en) | 2019-08-08 |
JP2023156438A (ja) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240205408A1 (en) | Data encoding and decoding | |
CN109155852B (zh) | 利用可变内预测方向集合进行内编码和解码 | |
KR20220027162A (ko) | 픽처의 서브-섹션들에 대한 독립적인 cabac | |
CN111684798A (zh) | 数据编码和解码 | |
US20220248024A1 (en) | Image data encoding and decoding | |
GB2585041A (en) | Image data encoding and decoding | |
US11936872B2 (en) | Image data encoding and decoding | |
GB2577350A (en) | Image data encoding and decoding | |
TWI856996B (zh) | 用於係數位準之逃逸寫碼 | |
US20220078430A1 (en) | Image data encoding and decoding | |
US20200413039A1 (en) | Image data encoding and decoding apparatus and method | |
JP2022548685A (ja) | 画像データの符号化及び復号化 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |