CN114760470A - 图像编码/解码方法及其设备 - Google Patents
图像编码/解码方法及其设备 Download PDFInfo
- Publication number
- CN114760470A CN114760470A CN202210299667.0A CN202210299667A CN114760470A CN 114760470 A CN114760470 A CN 114760470A CN 202210299667 A CN202210299667 A CN 202210299667A CN 114760470 A CN114760470 A CN 114760470A
- Authority
- CN
- China
- Prior art keywords
- block
- coefficients
- blocks
- sub
- scan order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 106
- 238000000638 solvent extraction Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims description 39
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000013139 quantization Methods 0.000 abstract description 15
- 238000005192 partition Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 25
- 230000008569 process Effects 0.000 description 24
- 238000001914 filtration Methods 0.000 description 13
- 239000013598 vector Substances 0.000 description 13
- 230000002441 reversible effect Effects 0.000 description 11
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 230000006835 compression Effects 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 6
- 239000013074 reference sample Substances 0.000 description 5
- 241000023320 Luma <angiosperm> Species 0.000 description 4
- 210000004027 cell Anatomy 0.000 description 4
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 1
- 241000985610 Forpus Species 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 210000001316 polygonal cell Anatomy 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/119—Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
公开一种图像编码/解码方法及其设备。具体的,图像编码方法可以包括下述步骤:通过对当前块的残差信号执行变换和量化来生成量化的变换块;将量化的变换块分割成多个系数组;确定表示系数组的系数当中的扫描顺序的第一扫描顺序;以及根据第一扫描顺序和表示多个系数组当中的扫描顺序的第二扫描顺序对量化的变换块的系数进行熵编码。
Description
本申请是2019年11月14日提交的国际申请日为2018年3月13日的申请号为201880031909.X(PCT/KR2018/002952)的,发明名称为“图像编码/解码方法及其设备”的专利申请的分案申请。
技术领域
本公开涉及静止图像或运动图像处理方法,并且更具体地,涉及用于对变换后的残差信号进行编码/解码的方法及其支持该方法的设备。
背景技术
压缩编码指的是经由通信线路发送数字化信息的一系列信号处理技术,或者以适用于存储介质的形式存储信息的技术。包括图片、图像、音频等等的媒体可以是用于压缩编码的目标,并且具体地,对图片执行压缩编码的技术被称为视频图像压缩。
下一代视频内容被假定为具有高空间分辨率、高帧速率和场景表示的高维度的特征。为了处理这样的内容,将导致在存储器存储、存储器存取速率和处理能力方面的急剧增长。
因此,需要设计一种有效率地处理下一代视频内容的编译工具。
发明内容
技术问题
本公开的目的是提出一种用于对变换后的残差信号进行编码/解码的方法。
此外,本公开的目的是提出一种用于在来自变换块的分割系数组当中配置扫描顺序以便对残差信号执行熵编译的方法。
此外,本公开的目的是提出一种用于在来自变换块的分割系数组中的系数中配置扫描顺序以便对残差信号执行熵编译的方法。
本公开的技术目的不限于上述技术目的,并且本领域的普通技术人员将从以下描述中清楚地认识到以上未提及的其他技术目的。
技术方案
在本公开的一方面,一种图像编码方法可以包括:通过对当前块的残差信号执行变换和量化来生成量化的变换块;将量化的变换块分割成多个系数组;确定表示系数组的系数当中的扫描顺序的第一扫描顺序;以及根据第一扫描顺序和表示多个系数组当中的扫描顺序的第二扫描顺序对量化的变换块的系数进行熵编码。
优选地,确定第一扫描顺序可以包括:基于系数组的左上系数确定系数组的各个系数当中的距离值;以及根据预定顺序将扫描索引分配给具有相同距离值的系数同时顺序地增加距离值。
优选地,确定系数组的各个系数当中的距离值可以包括:当系数组是非正方形块时,基于系数组的宽度和高度的比率确定表示在每个系数的水平方向上的坐标值的增加量的水平增量和表示垂直方向上的坐标值的增加量的垂直增量,并且各个系数的距离值可以由通过求和水平增量和垂直增量而获得的值来确定。
优选地,当系数组的宽度大于高度时,水平增量可以被确定为1并且垂直增量可以被确定为2,并且当系数组的高度大于宽度时,可以将水平增量确定为2并且将垂直增量确定为1。
优选地,将量化的变换块分割成多个系数组可以包括:将量化的变换块进行分层分割,以及将分割的量化的变换块分割成具有较低深度的系数组,并且第二扫描顺序可以包括来自量化的变换块的具有各个深度的系数组当中的扫描顺序。
优选地,当量化变换块是非正方形块时,可以将量化变换块分割成由特定数量的系数构成的系数组,并且可以根据量化的变换块的宽度和高度的比率来确定特定数量。
在本公开的另一方面,一种用于解码图像的方法可以包括:将当前处理块分割成多个系数组;确定表示系数组的系数当中的扫描顺序的第一扫描顺序;对从编码器输出的比特流进行熵解码以生成量化的变换系数;以及根据第一扫描顺序和表示多个系数组当中的扫描顺序的第二扫描顺序排列量化变换块的系数以生成当前处理块的量化变换块。
在本公开的另一方面中,确定第一扫描顺序的步骤可以包括:基于系数组的左上系数来确定系数组的各个系数当中的距离值;以及根据预定的顺序将扫描索引分配给具有相同的距离值的系数同时顺序地增加距离值。
优选地,确定系数组的各个系数当中的距离值可以包括:当系数组是非正方形块时,基于系数组的宽度和高度的比率确定表示每个系数的水平方向上的坐标值的增加量的水平增量和表示垂直方向上的坐标值的增加量的垂直增量,并且可以由通过求和水平增量和垂直增量而获得的值来确定各个系数的距离值。
优选地,当系数组的宽度大于高度时,水平增量可以被确定为1并且垂直增量可以被确定为2,并且当系数组的高度大于宽度时,可以将水平增量确定为2并且将垂直增量确定为1。
优选地,将当前处理块分割成多个系数组可以包括:分层地分割当前处理块;以及将分割的当前处理块分割成具有较低深度的系数组,并且第二扫描顺序可以包括来自当前处理块的具有各个深度的系数组当中的扫描顺序。
优选地,当当前处理块是非正方形块时,可以将当前处理块分割成由特定数量的系数构成的系数组,并且可以根据当前处理块的高度和宽度的比率来确定特定数量。
在本发明的又一方面,一种用于解码图像的设备可以包括:系数组分割单元,该系数组分割单元将当前处理块分割成多个系数组;和扫描顺序确定单元,该扫描顺序确定单元确定表示系数组的系数当中的扫描顺序的第一扫描顺序;变换系数生成单元,该变换系数生成单元对从编码器输出的比特流进行熵解码以生成量化的变换系数;以及变换块生成单元,该变换块生成单元根据表示第一扫描顺序和多个系数组当中的扫描顺序的第二扫描顺序来排列量化的变换块的系数以生成当前处理块的量化变换块。
有益效果
根据本公开的实施例,可以在编码静止图像或运动图像时节省残差信号的量。
此外,根据本公开的实施例,残差信号的量被节省以增强编码/解码效率。
此外,根据本公开的实施例,有效地配置变换系数的扫描顺序以减少编译变换系数所需的数据量。
此外,根据本公开的实施例,通过考虑非正方形块形状来配置变换系数的扫描顺序,以减少编译变换系数所需的数据量并增强压缩性能。
在本公开中可获得的优点不限于上述效果,并且本领域的技术人员从以下描述中将清楚地理解其他未提及的优点。
附图说明
在此作为说明书的一部分而包括用于帮助理解本公开的附图提供本公开的实施例,并通过以下描述来描述本公开的技术特征。
图1图示作为应用本公开的实施例的编码器的示意性框图,在该编码器中执行静止图像或视频信号的编码。
图2图示作为应用本公开的实施例的解码器的示意性框图,在该解码器中执行静止图像或视频信号的解码。
图3是用于描述可以应用于本公开的编译单元的分割结构的图。
图4是用于描述可以应用于本公开的预测单元的图。
图5图示作为应用本公开的实施例的用于对残差信号进行编码的方法。
图6图示作为应用本公开的实施例的用于解码残差信号的方法。
图7是图示作为应用本公开的实施例的用于以系数组为单位扫描变换系数的方法的图。
图8是图示作为应用本公开的实施例的每个系数组的变换系数的扫描顺序的图。
图9和图10是用于描述作为应用本公开的实施例的用于确定变换块的分割结构和变换系数的扫描顺序的方法的图。
图11是图示作为应用本公开的实施例的表示块中的系数的位置的一个示例的图。
图12和图13是图示根据本公开的实施例的取决于块中的变换系数的位置的扫描顺序的图。
图14和图15是作为应用本公开的实施例的用于描述用于确定非正方形块的系数的扫描顺序的方法的图。
图16和图17是作为应用本公开的实施例的用于描述用于以超像素为单位确定非正方形块的系数的扫描顺序的方法的图。
图18是图示作为应用本公开的实施例的用于确定系数组的扫描顺序的方法的图。
图19图示根据本公开的实施例的用于编码图像的方法。
图20图示根据本公开的实施例的用于解码图像的方法。
图21图示根据本公开的实施例的用于解码图像的设备。
具体实施方式
在下文中,将参考附图描述本公开的优选实施例。下面将结合附图进行描述的描述是为了描述本公开的示例性实施例,并且旨在不描述可以实现本公开的唯一实施例。以下描述包括特定细节以便提供对本公开的完美理解。然而,应理解,对于本领域的技术人员而言,可以在没有特定细节的情况下实现本公开。
在某些情况下,为了防止本公开的技术概念不清楚,可以省略公知的结构或设备,或者可以以设备的结构的核心功能为中心来描绘框图。
此外,尽管在本公开中尽可能多地选择当前广泛使用的通用术语作为术语,但是在特定情况下使用由申请人任意选择的术语。因为在这种情况下术语的含义将在说明书的相应部分中清楚地描述,所以应理解,本公开将不会仅由仅在本公开的描述中使用的术语来简单地解释,而是应找出术语的意义。
可以提供以下描述中使用的特定术语以帮助理解本公开。此外,在本公开的技术概念的范围内,可以将特定术语修改为其他形式。例如,信号、数据、样本、图片、帧、块等可以在每个编译过程中被适当地替换和解释。
在下文中,在本公开中,“块”或“单元”可以意指其中执行诸如预测、变换和/或量化的编码/解码处理并且可以以样本(或像素)的多维阵列配置样本的单元。
“块”或“单元”可以意指亮度分量的样本的多维阵列,并且可以意指色度分量的样本的多维阵列。此外,块或单元可以被统称为亮度分量的样本的多维阵列和色度分量的样本的多维阵列。
例如,“块”或“单元”可以被解释为包括下述的意义,即,所有编译块(CB),意指要被编码/解码的样本的阵列;编译树块(CTB),通过多个编译块组成;预测块(PB)(或者预测单元(PU)),意指应用相同预测的样本的阵列;以及变换块(TB)(或变换单元(TU)),意指应用相同变换的样本的阵列。
此外,除非在本公开中另外提及,否则“块”或“单元”可以解释为包括在对亮度分量和/或色度分量的样本的阵列进行编码/解码的过程期间使用的语法结构的含义。在此,语法结构意指以特定顺序存在于比特流中的0个或者更多个元素的语法元素,并且语法元素意指以比特流表示的数据元素。
例如,“块”或“单元”可以被解释为包括下述的意义,即,所有编译单元(CU),包括编译块(CB)和被用于编码编译块(CB)的语法结构;编译树单元(CU),由多个编译单元构成;预测单元(PU),包括预测块(PB)和被用于预测预测块(PB)的语法结构;以及变换单元(TU),包括变换块(TB)和被用于变换变换块(TB)的语法结构。
此外,在本公开中,“块”或“单元”不特别限于正方形或矩形样本(像素)的阵列,并且可以意指具有三个或更多个顶点的多边形样本(或像素)的阵列。在这种情况下,“块”或“单元”可以称为多边形块或多边形单元。
图1图示作为本公开应用于的实施例的执行静止图像或者视频信号编码的编码器的示意性框图。
参考图1,编码器100可以包括视频分段单元110、减法器115、变换单元120、量化单元130、去量化单元140、逆变换单元150、滤波单元160、解码的图片缓冲器(DPB)单元170、预测单元180和熵编码单元190。此外,预测单元180可以包括帧间预测单元(inter-prediction unit)181和帧内预测单元(intra-prediction unit)182。
视频分段单元110将输入给编码器100的输入视频信号(或者图片或者帧)分割为一个或多个块。
减法器115通过从输入视频信号中减去由预测单元180(即,由帧间预测单元181或者帧内预测单元182)输出的预测信号(或者预测块)来生成残差信号(或者残差块)。生成的残差信号(或者残差块)被发送给变换单元120。
变换单元120通过将变换方案(例如,离散余弦变换(DCT)、离散正弦变换(DST)、基于图的变换(GBT)或者卡南-洛伊夫变换(KLT))应用于残差信号(或者残差块)来生成变换系数。在这种情况下,通过使用应用于残差块的预测模式和基于残差块的大小所确定的变换方案来执行变换,变换单元120可以生成变换系数。
量化单元130量化变换系数,并且将其发送给熵编码单元190,并且熵编码单元190执行量化信号的熵编码操作,以及将其作为比特流输出。
同时,由量化单元130输出的量化的信号可以用于生成预测信号。例如,可以通过经由去量化单元140和逆变换单元150将去量化和逆变换应用于量化信号来重建残差信号。可以通过将重建的残差信号与由帧间预测单元181或者帧内预测单元182输出的预测信号相加来生成重建的信号(或者重建的块)。
同时,在这样的压缩过程期间,邻近块通过不同的量化参数来量化。因此,显示块边缘的伪影(artifact)可能出现。这样的现象被称为块伪影,其是用于评估图像质量的重要因素中的一个。为了减少这样的伪影,可以执行滤波过程。经由这样的滤波过程,块伪影被除去,并且当前图片的误差同时被降低,从而改善图像质量。
滤波单元160将滤波应用于重建的信号,并且经由回放设备将其输出,或者将其发送给解码的图片缓冲器170。发送给解码的图片缓冲器170的滤波的信号可以在帧间预测单元181中用作参考图片。如上所述,可以以图片间预测模式,使用滤波的图片作为参考图片来改善编码速率以及图像质量。
解码的图片缓冲器170可以存储滤波的图片,以便在帧间预测单元181中将其用作参考图片。
帧间预测单元181参考重建的图片来执行时间预测和/或空间预测,以便除去时间冗余和/或空间冗余。在这种情况下,块伪影或者环形伪影可能出现,因为用于执行预测的参考图片是变换的信号,当其被预先地编码/解码时,其在块单元中经历量化或者去量化。
这里,因为用于执行预测的参考图片是在先前时间以块为单位进行编码/解码的信号,所以可能存在块状伪像或环形伪像。
因此,帧间预测单元181可以通过应用低通滤波器来以子像素为单位在像素之间内插信号,以解决由于这种信号的不连续性或量化引起的性能下降或增强对运动预测的预测。在此,子像素是指通过应用内插滤波器而生成的虚拟像素,并且整数像素是指存在于重建图片中的实际像素。作为内插方法,可以采用线性内插、双线性内插、维纳滤波器等。
将内插滤波器应用于重建的图片以提高预测的精度。例如,帧间预测单元181将内插滤波器应用于整数像素以生成插值像素,并且可以通过使用由插值像素构成的内插块来执行预测。
帧内预测单元182通过参考要进行当前编码的块附近的样本来预测当前块。帧内预测单元182可以执行以下处理以便执行帧内预测。首先,可以准备参考样本,这是生成预测信号所必需的。另外,可以通过使用准备的参考样本来生成预测信号(预测块)。此后,对预测模式进行编码。在这种情况下,可以通过参考样本填充和/或参考样本过滤来制备参考样本。因为参考样本经历预测和重建过程,所以可能存在量化误差。因此,可以针对用于帧内预测的每个预测模式执行参考样本滤波处理,以减小这种误差。
通过帧间预测单元181或帧内预测单元182生成的预测信号(或预测块)可以用于生成重建信号(或重建块)或用于生成残差信号(或残差块)。
图2图示作为本公开应用于的实施例的执行静止图像或者视频信号解码的解码器的示意性框图。
参考图2,解码器200可以包括熵解码单元210、去量化单元220、逆变换单元230、加法器235、滤波单元240、解码的图片缓冲器(DPB)250和预测单元260。此外,预测单元260可以包括帧间预测单元261和帧内预测单元262。
此外,经由解码器200输出的重建的视频信号可以经由回放设备来回放。
解码器200可以接收由在图1中示出的编码器100输出的信号(即,比特流)。熵解码单元210对接收的信号执行熵解码操作。
去量化单元220使用量化步长信息(quantization step size information)从熵解码的信号获得变换系数。
逆变换单元230通过应用逆变换方案对变换系数进行逆变换来获得残差信号(或者残差块)。
加法器235将获取的残差信号(或者残差块)添加到从预测单元260(即,帧间预测单元261或者帧内预测单元262)输出的预测信号(或者预测块),以生成重建的信号(或者重建的块)。
滤波单元240将滤波应用于重建的信号(或者重建的块),并且将滤波的信号输出给回放设备,或者将滤波的信号发送给解码的图片缓冲器250。发送给解码的图片缓冲器250的滤波的信号可以在帧间预测单元261中用作参考图片。
在本说明书中,在编码器100的滤波单元160、帧间预测单元181和帧内预测单元182中描述的实施例可以分别同等地应用于解码器的滤波单元240、帧间预测单元261和帧内预测单元262。
块分割结构
通常,基于块的图像压缩方法被在静止图像或者视频的压缩技术(例如,HEVC)中使用。基于块的图像压缩方法是通过将其分割为特定块单元来处理图像的方法,并且可以降低存储器使用和计算的负载。
图3是描述可以应用于本公开的编译单元的分割结构的图。
编码器将单个图像(或者图片)分割为方格形式的编译树单元(CTU),并且按照光栅扫描顺序逐个地编码CTU。
在HEVC中,CTU的大小可以被确定为64×64、32×32和16×16中的一个。编码器可以基于输入视频信号的分辨率或者输入视频信号的特征来选择和使用CTU的大小。CTU包括用于亮度分量的编译树块(CTB)和用于与其相对应的两个色度分量的CTB。
一个CTU可以以四叉树结构分割。也就是说,一个CTU可以被分割为每个具有正方形形式并且具有一半水平大小和一半垂直大小的四个单元,从而能够生成编译单元(CU)。四叉树结构的这样的分割可以递归地执行。也就是说,以四叉树结构从一个CTU分等级地分割CU。
CU指的是用于输入视频信号的处理过程(例如,执行帧内/帧间预测的编译)的基本单位。CU包括用于亮度分量的编译块(CB)和用于与亮度分量相对应的两个色度分量的CB。在HEVC中,CU大小可以被确定为64×64、32×32、16×16和8×8中的一个。
参考图3,四叉树的根节点与CTU有关。四叉树被分割,直到达到叶节点。叶节点对应于CU。
对此进行更详细地描述。CTU对应于根节点,并且具有最小的深度(即,深度=0)值。根据输入视频信号的特征,CTU可能不能被分割。在这种情况下,CTU对应于CU。
CTU可以以四叉树形式分割。因此,生成下节点,也就是说,深度1(深度=1)。此外,属于具有深度1的下节点并且不再分割的节点(即,叶节点)对应于CU。例如,在图3(B)中,对应于节点a、b和j的CU(a)、CU(b)和CU(j)已经从CTU分割一次,并且具有深度1。
具有深度1的节点中的至少一个可以以四叉树形式分割。因此,生成具有深度1的下节点(即,深度=2)。此外,属于具有深度2的下节点并且不再分割的节点(即,叶节点)对应于CU。例如,在图3(B)中,对应于节点c、h和i的CU(c)、CU(h)和CU(i)已经从CTU分割两次,并且具有深度2。
此外,具有深度2的节点中的至少一个可以以四叉树形式再次分割。因此,生成具有深度3(即,深度=3)的下节点。此外,属于具有深度3的下节点并且不再分割的节点(即,叶节点)对应于CU。例如,在图3(B)中,对应于节点d、e、f和g的CU(d)、CU(e)、CU(f)和CU(g)已经从CTU分割三次,并且具有深度3。
在编码器中,CU的最大大小或者最小大小可以基于视频图像的特征(例如,分辨率)或者通过考虑编码速率来确定。此外,有关最大或者最小大小的信息或者能够得到该信息的信息可以被包括在比特流中。具有最大大小的CU被称为最大编译单元(LCU),并且具有最小大小的CU被称为最小编译单元(SCU)。
此外,具有树结构的CU可以以预定的最大深度信息(或者最大等级信息)分等级地分割。此外,每个分割的CU可以具有深度信息。由于深度信息表示分割计数和/或CU的程度,其可以包括有关CU大小的信息。
由于LCU被以四叉树形状分割,所以SCU的大小可以通过使用LCU的大小和最大深度信息来获得。或者,相反地,LCU的大小可以通过使用SCU的大小和树的最大深度信息来获得。
对于单个CU,表示是否相应的CU被分割的信息(例如,分割的CU标志(split_cu_flag))可以转发给解码器。这个分割的信息被包括在除了SCU之外的所有CU中。例如,当表示是否分割的标志的值是“1”时,相应的CU被进一步分割为四个CU,并且当表示是否分割的标志的值是“0”时,相应的CU不再分割,并且可以执行用于相应的CU的处理过程。
如上所述,CU是执行帧内预测或者帧间预测的编译的基本单位。HEVC在预测单元(PU)中分割CU,以更加有效地编译输入视频信号。
PU是用于生成预测块的基本单位,并且即使在单个CU中,预测块也可以以PU为单位以不同的方式生成。但是,对于属于单个CU的PU不一起使用帧内预测和帧间预测,并且属于单个CU的PU通过相同的预测方法(即,帧内预测或者帧间预测)来编译。
PU不以四叉树结构分割,但是在单个CU中以预定的形状分割一次。这些将通过参考以下的附图来描述。
图4是描述可以应用于本公开的预测单元的图。
根据是使用帧内预测模式还是使用帧间预测模式作为PU所属于的CU的编译模式,PU被不同地分割。
图4(A)图示使用帧内预测模式时的PU,并且图4(B)图示使用帧间预测模式时的PU。
参考图4(A),假设单个CU的大小是2N×2N(N=4、8、16和32),单个CU可以被分割为两种类型(即,2N×2N或者N×N)。
在这种情况下,如果单个CU被分割为2N×2N形状的PU,则这指的是仅一个PU存在于单个CU中。
同时,如果单个CU被分割为N×N形状的PU,则单个CU被分割为四个PU,并且对于每个PU单元生成不同的预测块。但是,只有在用于CU的亮度分量的CB的大小是最小大小(即,CU是SCU的情形)时,可以执行这样的PU分割。
参考图4(B),假设单个CU的大小是2N×2N(N=4、8、16和32),单个CU可以被分割为八个PU类型(即,2N×2N、N×N、2N×N、N×2N、nL×2N、nR×2N、2N×nU和2N×nD)。
像在帧内预测中一样,只有在用于CU的亮度分量的CB的大小是最小大小(即,CU是SCU的情形)时,可以执行N×N形状的PU分割。
帧间预测以在水平方向上分割的2N×N形状和以在垂直方向上分割的N×2N形状来支持PU分割。
此外,帧间预测支持nL×2N、nR×2N、2N×nU和2N×nD形状的PU分割,其是不对称运动分割(AMP)。在这种情况下,“n”指的是2N的1/4值。但是,如果PU所属于的CU是最小大小的CU,则AMP可以不被使用。
为了在单个CTU中有效率地编码输入视频信号,可以经由如下的处理过程基于最小速率失真值来确定编译单元(CU)、预测单元(PU)和变换单元(TU)的最佳分割结构。例如,关于在64×64CTU中的最佳CU分割过程,可以经由从64×64大小的CU到8×8大小的CU的分割过程来计算速率失真成本。详细的过程如下。
1)生成最小速率失真值的PU和TU的最佳分割结构通过对64×64大小的CU执行帧间/帧内预测、变换/量化、去量化/逆变换和熵编码来确定。
2)PU和TU的最佳分割结构被确定以将64×64CU分割为32×32大小的四个CU,并且生成用于每个32×32CU的最小速率失真值。
3)PU和TU的最佳分割结构被确定以进一步将32×32CU分割为16×16大小的四个CU,并且生成用于每个16×16CU的最小速率失真值。
4)PU和TU的最佳分割结构被确定以进一步将16×16CU分割为8×8大小的四个CU,并且生成用于每个8×8CU的最小速率失真值。
5)通过将在过程3)中获得的16×16CU的速率失真值与在过程4)中获得的四个8×8CU的速率失真值的增加比较来确定在16×16块中的CU的最佳分割结构。也以相同的方式对于剩余的三个16×16CU来执行这个过程。
6)通过将在过程2)中获得的32×32CU的速率失真值与在过程5)中获得的四个16×16CU的速率失真值的增加比较来确定在32×32块中的CU的最佳分割结构。也以相同的方式对于剩余的三个32×32CU执行这个过程。
7)最后,在64×64块中CU的最佳分割结构通过将在过程1)中获得的64×64CU的速率失真值与在过程6)中获得的四个32×32CU的速率失真值的增加比较来确定。
在帧内预测模式中,预测模式被选择为PU单元,并且在实际的TU单元中对选择的预测模式执行预测和重建。
TU指的是执行实际的预测和重建的基本单位。TU包括用于亮度分量的变换块(TB)和用于与亮度分量相对应的两个色度分量的TB。
在图3的示例中,像在一个CTU被以四叉树结构分割以生成CU的示例中一样,从要编译的一个CU以四叉树结构分等级地分割TU。
因为TU被以四叉树结构分割,所以从CU分割的TU可以被分割为更小和更低的TU。在HEVC中,TU的大小可以被确定为32×32、16×16、8×8和4×4中的一个。
返回参考图3,四叉树的根节点被假设为与CU相关。四叉树被分割,直到达到叶节点,并且叶节点对应于TU。
对此进行更详细的描述。CU对应于根节点,并且具有最小的深度(即,深度=0)值。根据输入图像的特征,CU可能不能被分割。在这种情况下,CU对应于TU。
CU可以以四叉树形式分割。因此,生成具有深度1(深度=1)的下节点。此外,属于具有深度1的下节点并且不再分割的节点(即,叶节点)对应于TU。例如,在图3(B)中,对应于节点a、b和j的TU(a)、TU(b)和TU(j)已经从CU分割一次,并且具有深度1。
具有深度1的节点的至少一个可以再次以四叉树形式分割。因此,生成具有深度2(即,深度=2)的下节点。此外,属于具有深度2的下节点并且不再分割的节点(即,叶节点)对应于TU。例如,在图3(B)中,对应于节点c、h和i的TU(c)、TU(h)和TU(i)已经从CU分割两次并且具有深度2。
此外,具有深度2的节点的至少一个可以以四叉树形式再次分割。因此,生成具有深度3(即,深度=3)的下节点。此外,属于具有深度3的下节点并且不再分割的节点(即,叶节点)对应于CU。例如,在图3(B)中,对应于节点d、e、f和g的TU(d)、TU(e)、TU(f)和TU(g)已经从CU分割三次,并且具有深度3。
具有树结构的TU可以以预定的最大深度信息(或者最大等级信息)分等级地分割。此外,每个分割的TU可以具有深度信息。该深度信息可以包括有关TU的大小的信息,因为其指示分割数目和/或TU的程度。
表示是否相应的TU已经相对于一个TU被分割的信息(例如,分割的TU标记“split_transform_flag”)可以传送给解码器。分割信息被包括在除了最小大小的TU之外的所有TU中。例如,如果表示是否TU已经被分割的标志的值是“1”,则相应的TU被分割为四个TU。如果表示是否TU已经被分割的标志的值是“0”,则相应的TU不再分割。
残差信号的编码/解码
通过帧内预测单元或帧间预测单元预测的块来区分输入图像,并且发送与预测有关的信息和用于差分的残差信号以在解码器中重建图像。将参考下面给出的附图对此进行更详细地描述。
图5图示作为应用本公开的实施例的用于对残留信号进行编码的方法。
参考图5,编码器(编码设备)对残差信号(或残差块)进行变换(S501)。残差信号是指与由帧内预测单元或帧间预测单元从输入图像预测的信号相区别的信号。残差信号是空间域的信号,并被变换到频域以消除信号之间的相关性,并将能量集中在低频区域。在这种情况下,编码器可以通过应用诸如DCT、DST、GBT、KLT等的变换技术来生成变换系数。
编码器对变换系数进行量化(S502)。缩放和/或量化变换后的信号以便减小信号的幅度。
编码器将变换块分割成子块(S503)。编码器可将变换块分割成具有预定恒定大小的子块(例如,具有4×4大小的子块)。
编码器扫描量化的变换系数,并根据扫描顺序对系数进行编码(S504)。即,根据预定顺序对量化的变换系数进行熵编码并发送给解码器。
这里,扫描顺序可以对应于右上对角线扫描顺序、水平扫描顺序、垂直扫描顺序等。
编码器可以通过在最后一个有效系数(最后一个非零系数)的位置处开始,沿反方向扫描变换系数,直到达到所谓的DC系数的坐标系数(0,0)为止。在这种情况下,可以根据右上对角线扫描顺序来扫描每个子块中的量化变换系数,并且进一步地,类似地,也可以根据右上对角线扫描顺序来扫描各个子块。
在这种情况下,可以对用于识别变换块中的最后有效系数的位置(即,列的位置和行的位置)的信息进行编码。
解码器可以通过在编码器中反向执行处理来获取重建图像。将参考下面给出的附图对此进行更详细地描述。
图6图示作为应用本公开的实施例的用于解码残差信号的方法。
参考图6,解码器(解码设备)对系数进行解码(S601)。即,解码器对从编码器输出的信号(即,比特流)执行熵解码,以获取量化的变换系数。
解码器按扫描顺序定位量化的变换系数,并对变换系数进行逆量化(S602)。即,解码器可以根据预定顺序将通过熵解码重建的各个量化的变换系数排列在残差信号阵列中。
如上所述,扫描顺序可以对应于右上对角线扫描顺序、水平扫描顺序、垂直扫描顺序等。
如上所述,可以通过比特流用信号发送表示根据变换块中的扫描顺序的最后有效系数(即,非零系数)的位置的信息。解码器解析以上信息,以根据变换块中的扫描顺序来导出最后有效系数(即,非零系数)的列的位置和行的位置。
解码器可以通过在最后一个有效系数(即非零系数)的位置处开始,沿反方向扫描变换系数,直到到达所谓的DC系数的坐标(0,0)为止。在这种情况下,可以按照与右上对角线扫描顺序相反的顺序来扫描每个子块中的量化变换系数,并且此外,也可以按照与右上对角线扫描顺序相反的顺序来类似地扫描各个子块。
解码器可以根据如上所述的扫描顺序对量化的变换系数进行逆量化。
解码器对逆量化的变换系数进行逆变换(S603)。即,解码器可以通过应用逆变换技术来对变换系数进行逆变换并且获取残差信号。
这样,通过熵解码重建的各个系数可以根据扫描顺序被排列在残差信号阵列中,并且可以通过逆量化和逆变换重建成空间域的残差信号。另外,重建的残差信号与预测信号组合,并且然后通过滤波过程作为重建图像输出。
实施例1
在本公开的实施例中,编码器/解码器可以分层地配置变换系数的扫描顺序。换句话说,编码器/解码器可以将变换块(或残差块或扫描处理块)分割成系数组,并且然后以分割的系数组为单位执行扫描。系数组可以被称为子块、子组、子系数组等。
编码器/解码器可以在根据扫描顺序以从变换块分割的系数组为单位扫描变换系数的同时扫描每个系数组中的变换系数。例如,系数组可以是具有4×4大小的块。将参照下面的图7对此进行描述。
图7是图示作为应用本公开的实施例的用于以系数组为单位扫描变换系数的方法的图。
参考图7,假设当前块(即,变换块)的大小是8×8,并且系数组被确定为4×4个块。在这种情况下,例如,编码器/解码器可以按照CG1 701、CG3 703、CG2 702和CG4 704的顺序扫描系数组。此外,编码器/解码器可以根据类似于系数组之间的扫描顺序的对角线扫描顺序扫描每个系数组中的系数。
当具有图7的8×8的大小的当前块被表达为CG0(1)并且具有4×4的大小的系数组被表达为CG1(1,k),k=1,...,4(其中k表示扫描顺序)时,图7的系数组可以满足下面的等式1。
[等式1]
CG1(1,1)=CG 1,CG1(1,2)=CG 3,CG1(1,3)=CG 2,CG1(1,4)=CG 4
假设扫描从图7和等式1中的与低频对应的系数(即,DC系数)开始,但是可以从实际编码/解码过程中最后扫描的系数组执行编码/解码。此外,在这种情况下,可以通过使用相同的扫描顺序来扫描系数组中的系数,并且可以从被定位在扫描顺序中最后的系数开始执行编码/解码。
即,当执行针对变换系数的熵编译时,可以按照CG4 704、CG2 702、CG3 703和CG1701的顺序对系数组进行编码,并且在这种情况下,定位在左上端处的DC分量系数可以被最后编码。
在本公开中,基于如等式1中那样首先扫描在左上端处的DC分量的方法来描述实施例,但是本公开不限于此,并且可以应用反向扫描顺序。即使当在实际编译过程中应用反向扫描顺序时,也可以应用本公开提出的方法。在这种情况下,可以根据正向扫描顺序通过使用将在下面描述的等式9导出反向扫描顺序。
图8是示出作为应用本公开的实施例的每个系数组的变换系数的扫描顺序的图。
参考图8,当前块801、系数组802、803、804和805以及每个系数组中的系数的层次关系可以表示为树结构。在这种情况下,编码器/解码器可以按照从左侧到右侧的顺序执行扫描,并且根据深度优先搜索方法执行扫描。
具有树结构的叶节点表示当前块801中的系数的位置。每个系数的位置可以表示为由行方向索引和列方向索引构成的1×2行向量。
在本公开中,系数组可以写为CGd(i0,i1,...,id)。在此,ik(k=0,1,...,d)表示对应系数组的k深度的扫描索引。此外,d表示树结构中相应系数组的深度。
图9和图10是用于描述作为应用本公开的实施例的用于确定变换块的分割结构和变换系数的扫描顺序的方法的图。
参考图9,假定当前处理块是具有16×16大小的块。在这种情况下,编码器/解码器可以递归地(或分层地)分割当前处理块(即,将当前处理块分割层深度2或更大),以便执行变换系数的扫描。当如图9(c)中所示递归地分割当前处理块时,当前处理块的分割结构可以以图14中所图示的树形表示。
参考图10,从左侧到右侧扫描具有树形结构的叶节点,以执行对所有变换系数的扫描。即,可以从具有树结构的叶节点的左侧到右侧确定扫描顺序。
在本公开中,叶系数组表示包括具有图10中的树结构的叶节点(即,系数组中的变换系数)的最低深度系数组(即,图10中的深度2的系数组)。叶系数组不再被分割成具有更低深度的系数组。此外,在分割成树结构的块结构中,随着分割次数的增加,深度增加。具有较低深度的节点表示从深度值相对较大的节点,即,具有较高深度的节点,分割的节点。
CGd(i0,i1,...,id)的扫描顺序可以如下面的等式2所示被表达。
[等式2]
参考图2,每个行向量[ri ci](i=1,...,h×w)表示h×w块中变换系数的位置。ri表示行索引,并且ci表示列索引(1≤ri≤h,1≤ci≤w)。
在本公开中,假定所有2D块的行索引和列索引从1开始。在等式2中,τ(CGd(i0,i1,...,id))表示相应系数组中的系数的扫描顺序。即,可以以从[r1 c1]到[rhxw chxw]的顺序扫描相应位置处的系数。
如上所述,因为构成等式2的τ(CGd(i0,i1,...,id))的每个行向量表示变换系数在具有h×w大小的块中的位置,所以将用于具有深度d的系数组CGd(i0,i1,...,id)的变换块(即,CG0(1))中的行索引偏移和列索引偏移添加到组成τ(CGd(i0,i1,...,id))的所有列向量以获取变换块中的扫描顺序。在这种情况下,可以通过使用下面的等式3来计算行索引偏移和列索引偏移。
[等式3]
参考等式3,Vrel(CGd+1(i0,i1,...,id+1))表示表示当前变换块的CGd(i0,i1,...,id)的相对位置的列向量。例如,在上面的图9中,Vrel(CG2(1,1,4))=[88]可以被建立并且V(CG2(1,2,2))=V(CG1(1,2))+Vrel(CG2(1,2,2))=[12 0]+[0 8]=[12 8]可以被建立。
将向量1定义为1=[1 1 … 1]T时,可以使用下面的等式4计算CGd(i0,i1,...,id)的扫描顺序。
[等式4]
S(CGd(i0,i1,...,id))=τ(CGd(i0,i1,...,id))+1·V(CGd(i0,i1,...,id))
当CGd(i0,i1,...,id)是叶系数组时,可以通过使用上面的等式4来计算所有块(即,变换块)中的扫描顺序。即,所有块中的扫描顺序等于通过上述等式2计算出的系数组中的扫描顺序与通过上述等式3计算出的系数组的偏移量(即,1·V(CGd(i0,i1,...,id)))之和。
当CGd(i0,i1,...,id)不是叶系数组时,可以使用下面的等式5来计算变换块中的扫描顺序。
[等式5]
所有块CG0(1)的扫描顺序可以表达为S(CG0(i0))。在这种情况下,S(CG0(i0))的行索引可以表示扫描索引,并且S(CG0(i0))的每个行向量可以表示所有块中的对应扫描索引的位置。
图11是图示作为应用本公开的实施例的表示块中的系数的位置的一个示例的图。
参考图11,可以通过使用栅格扫描顺序(即,行优先顺序和词典编纂的顺序)来表示系数在块中的位置。如图11中所图示,可以根据扫描顺序将索引值分配给各个系数的位置。另外,表示图11的系数的位置的索引值可以如下面的等式6中所示表达。
[等式6]
当在块中的变换系数的位置中根据包括上述栅格扫描顺序的随机扫描顺序来指配表示系数位置的索引时,可以如下面的等式7所示来表达扫描顺序。
[等式7]
本公开中提出的扫描顺序可以通过以上等式2至7中描述的方案来描述。当通过上述方案这样描述扫描顺序时,可以由以下分量确定扫描顺序。
1)在每个深度(即,0或更大)中对系数组进行递归分割
2)确定分割系数组的扫描顺序
3)确定叶系数组的变换系数的扫描顺序
当确定分量时,可以通过使用等式2至7来确定扫描顺序。因此,本公开提出一种通过确定分量来配置适当的扫描顺序的方法。
包括所有适用的扫描顺序矩阵的集合可以被表达,如下面的等式8所示。
[等式8]
这里,表示集合,其中收集适用于这些块的所有扫描顺序矩阵。另外,块可以具有各种大小或形状(例如,4×4、4×8、16×4、16×16、32×8等)。另外,可以将通过上述等式5导出的S(CG0(i0))可以作为的元素被包括。
在实施例中,编码器/解码器可以通过使用关于当前处理块的邻近块的信息来选择中的特定的扫描顺序,并且通过使用所选择的扫描顺序来执行扫描。关于邻近块的信息可以是例如存在于左块或上块中的非零系数的数量或最后非零系数的位置。此外,可以通过使用关于在紧接当前处理块之前编码的块的信息来确定当前处理块的扫描顺序。
在实施例中,编码器/解码器可以在适用于具有特定大小或形状的块的扫描顺序的集合(即,的子集)当中选择并应用特定的扫描顺序。在这种情况下,编码器可以向解码器用信号发送以序列、图片、条带、CTU、编译块或变换块(或变换单元)为单位选择的扫描顺序的索引。
当对变换系数执行熵编码时,除了正向扫描顺序之外,还可以应用反向扫描顺序。可以通过使用下面的等式9来计算反向扫描顺序。
[等式9]
,其中N=CGd(i0,i1,...,id)中的CG数量并且d≥0
这里,P表示仅反对角分量具有1的值的置换矩阵。可以通过使用置换矩阵来导出与正向扫描顺序相反的扫描顺序。
实施例2
在本公开的实施例中,编码器/解码器可以基于系数组的大小或形状来确定系数组中各个系数的扫描顺序。即,编码器/解码器可以根据块的大小或形状来确定上述等式2的系数组中的系数的扫描顺序。
图12和图13是图示根据本公开的实施例的取决于块中的变换系数的位置的扫描顺序的图。
参考图12,编码器/解码器可以按照对角线扫描顺序以d值增加的顺序扫描系数。在此,d表示基于左上系数的对应系数的距离。编码器/解码器可以从左下侧到右上侧在具有相同d值的位置处扫描系数。
这里,可以将d值确定为d=dx+dy,并且如图12(b)中所图示,dx和dy分别表示水平增量(或水平坐标)和垂直增量(或垂直坐标)。
如上所述,编码器/解码器可以将反向扫描顺序应用于对变换系数执行熵编译。在这种情况下,其中d值为6的系数到其中d值为0的系数可以被扫描并且以与图12(a)中所图示的箭头方向相反的从右上侧到左下侧扫描。在本公开中,主要描述前向扫描顺序,但是在执行熵编码时,编码器/解码器可以遵循反向扫描顺序或前向扫描顺序。
具有相同d值的位置可以对应于在频率方面具有相等相位的系数的位置。因此,编码器/解码器可以将随机顺序指配给具有相同d值的位置处的系数。例如,编码器/解码器可以以[4 1]、[3 2]、[2 3]和[1 4](每个位置由行向量表达),[1 4]、[2 3]、[3 2]和[4 1]或[2 3]、[3 2]、[1 4]和[4 1]的顺序扫描行位置,在该行位置中,图12(a)的d值是3。
此外,编码器/解码器可以被配置成如图13中所图示从右侧到左侧扫描每条反对角线,不同于图12(a)的示例。
下面的表1示出用于确定对角线扫描顺序的伪代码的一个示例。
[表1]
参考表1,编码器/解码器可以通过从最左下角位置的系数到最右上角位置的系数分配扫描索引同时将d值从0增加1来确定扫描顺序。在此,sypos和sxpos表示分别表示从行索引和列索引中减去1所获得的值的参数。也就是说,假设sypos和sxpos从0开始。
在表1中,假定从左下侧扫描由d值指定的对角线,但是可以配置代码以从右上侧扫描对角线,如图13中所描述。
在上述表1中,“while loop”是根据相对于由d值指定的对角线的扫描顺序确定表示扫描信息的参数(或矩阵)。该参数可以是表示扫描顺序的参数(scan_order)或表示扫描位置的参数(scan_pos)。分配给块的每个位置(即,scan_order矩阵的分量)的扫描索引被存储在scan_order矩阵中。另外,在scan_pos矩阵中,每个行索引对应于扫描索引,并且块中的系数位置以行向量的形式存储在每个行中。
当通过现有方法(例如,HEVC)将扫描顺序分配给系数的位置时,当当前处理块是非正方形块时,水平或垂直频率增加率可能无法被有效反映。
具体地,当将可分离的变换应用于非正方形块时,垂直方向的变换基向量的长度和水平方向的变换基向量的长度可以彼此不同。例如,当当前处理块是具有2N×N大小的块时,可以将具有2N×2N大小的DCT应用于垂直方向,并且可以将具有N×N大小的DCT应用于水平方向。在这种情况下,每当系数的垂直坐标增加1时,频率在高度方向上增加1/(2N)*π,而每当系数的水平坐标增加1时,频率在宽度方向上增加1/(N)*π。
在描述本公开提出的方法时,主要描述M×N块是具有高度M和宽度N的块,但是本公开不限于此,并且M×N块可以表示宽度和高度分别为M和N的块。
在非正方形块的情况下,当通过现有方法将扫描顺序类似地应用于系数的位置时,频率增加率可能无法有效地反映在水平方向或垂直方向上。结果,可能无法正常执行从高频分量到低频分量的扫描,并且图像的压缩性能可能下降。
因此,本公开提出一种用于将扫描顺序分配给非正方形块中各个位置处的系数以解决该问题并有效地反映水平方向或垂直方向上的频率增加率的方法。
甚至对于非正方形块,可以通过使用上面的图12和表1中描述的方法来获取扫描顺序。例如,当当前处理块是具有4×8大小的块时,高度和宽度可以分别被配置成4和8,作为函数的输入参数,并且当执行表1的函数时,相应的扫描顺序可以被获取。
图14和图15是作为应用本公开的实施例的用于描述用于确定非正方形块的系数的扫描顺序的方法的图。
如上所述,当将可分离变换应用于非正方形块时,垂直方向(即,行方向)的变换基向量的长度和水平方向(即,列方向)的变换基向量的长度可能会彼此不同。
参考图14,假设当前处理块是具有4×8大小的块。在这种情况下,可以将4×4大小的DCT应用于垂直方向,并且可以将8×8大小的DCT应用于水平方向。当假设在变换系数被定位在左上端处时变换系数表示低频分量并且在变换系数被定位在右下端时变换系数表示高频分量时,在图14(a)的4x8块的情况下,垂直方向(或高度方向)的频率增量可以是水平方向(或宽度方向)的频率增量的两倍。
因此,取决于变换系数的位置的dx和dy可以如图14(b)所示配置。另外,编码器/解码器可以以d值以具有相同d(在这种情况下,d=dx+dy)值的位置的系数的单位增加的顺序来配置扫描顺序。在反向扫描顺序的情况下,编码器/解码器可以以d值减小的顺序配置扫描顺序。
在本公开中,扫描线可以指代在具有相同d值的位置处的系数。即,具有相同的d值的系数可以被包括在相同的扫描线中。
可以在属于同一扫描线的系数之间分配随机扫描顺序。当从左侧到右侧扫描系数时,扫描索引可以被分配给如图14(c)中所图示的各个位置处的系数。
参考图15,假定当前处理块是具有8×4大小的块。除了水平频率增量和垂直频率增量彼此不同之外,编码器/解码器可以通过与上述方法相同的方法通过配置d值来确定扫描顺序。
下面的表2示出用于通过应用图14和图15中描述的方法来获取扫描顺序的伪代码的一个示例。
[表2]
参考表2,sh是表示垂直增量(即,dy)的参数,并且sw是表示水平增量(即,dx)的参数。其他参数与上表1相同。另外,向下取整(floor)函数返回最大大小等于或小于作为因子给出的数字的整数值,并且舍入(round)函数返回通过四舍五入作为因子给出的数字而获得的整数值。编码器/解码器通过使用当前处理块的宽度和高度的比率来配置sh值和sw值,并将扫描索引分配给最左下位置的系数到最右上位置的系数同时将d值从0增加1来确定扫描顺序。
在本公开的实施例中,编码器/解码器可以以特定数量的系数为单位对系数进行分组,并且然后通过应用各种扫描顺序来扫描系数。下面参考图16对此进行描述。
图16和图17是作为应用本公开的实施例的用于描述用于确定以超像素为单位的非正方形块的系数的扫描顺序的方法的图。
参考图16,假设当前处理块是具有4×8大小的块。编码器/解码器可以以超像素为单位分割当前处理块。在此,超像素可以表示特定数量的系数(或像素)的集合,并且可以根据当前块的宽度与高度的比率来确定特定数量。可以将超像素称为子块、子组、系数组、子系数组等。因为当前块的宽度与高度之比为2,所以通过两个像素可以构成超像素。
编码器/解码器可以使用超像素来配置正方形块,通过使用上面的图7至图13中描述的方法来确定以超像素为单位的扫描顺序,并在超像素中根据随机顺序扫描系数。
编码器/解码器可以按照对角线扫描顺序以超像素为单位对具有4×4大小的正方形块应用扫描顺序,如图16中所图示,并在每个超像素中从左侧到右侧应用扫描顺序。
参考图17,假设当前处理块是具有8×4大小的块。类似地,编码器/解码器可以以超像素为单位分割当前处理块。因为高度是宽度的两倍,所以编码器/解码器可以通过在垂直方向(或高度方向)上对两个系数进行分组来配置超像素。
下面的表3示出用于通过应用图16和17中描述的方法来获取扫描顺序的伪代码的一个示例。
[表3]
参考表3,splen是表示超像素的长度的参数。可以根据当前处理块的宽度和高度来确定splen。例如,当高度大于宽度时,可以将超像素确定为在垂直方向上较长的超像素,而当宽度大于高度时,可以将超像素确定为在水平方向上较长的超级像素。另外,norm_length是表示以超像素为单位配置的块(即,正方形块)的一侧的长度的参数。在上面的表3中,“while loop”中的“for-loop”将扫描索引分配给超像素中各个位置的系数。
编码器/解码器除该扫描顺序外还可以应用各种扫描顺序。例如,编码器/解码器可以通过使用具有特定大小(例如,4×8、16×8、32×32等等)的块变换系数的统计获取关于在各自位置处的系数的非零系数的数量信息。另外,编码器/解码器可以基于所获取的非零系数的数量以对应数量的降序(或升序)来确定系数的扫描顺序。
当CGd(i0,i1,...,id)的高度和宽度分别为h和w时,如上述等式2所示,编码器/解码器可以表示适用于如下面的等式10中所示的h×w块的扫描顺序的集合。
[等式10]
实施例3
在本公开的实施例中,提出一种用于确定系数组的扫描顺序的方法。例如,编码器/解码器可以确定针对图9(c)中构成CG1(1,1)的四个系数组的扫描顺序。
编码器/解码器可以按照对角线扫描顺序来扫描扫描组,如图9(c)中所图示。此外,编码器/解码器可以在确定系数组之间的扫描顺序时应用上面示例1和2中描述的扫描方法,并且应用具有随机顺序的扫描顺序。
图18是图示作为应用本公开的实施例的用于确定系数组的扫描顺序的方法的图。
参考图18,编码器/解码器可以被配置成类似地使用系数组的扫描顺序和系数组中系数的扫描顺序,或者被配置成单独使用各个扫描顺序。
作为一个示例,参考图18(a),编码器/解码器可以将系数组分割成具有4×2大小的块,在系数组之间应用通过使用上述表2生成的扫描顺序,并且在每个系数组中应用通过使用上述表1生成的扫描顺序。
作为另一示例,参考图18(b),编码器/解码器可以将系数组分割成具有2×4大小的块,并且应用与系数组之间的扫描顺序和系数组中的系数之间的扫描顺序相似的通过使用上述表2生成的扫描顺序。
作为又一示例,参考图18(c),编码器/解码器可以将系数组分割成具有2×4大小的块,在系数组之间应用通过使用上述表2生成的扫描顺序,并且在每个系数组中应用通过上述表3生成的扫描顺序。
图19图示根据本公开的实施例的用于编码图像的方法。
编码器对当前处理块的残差信号执行变换和量化,以生成量化的变换块(S1901)。可以类似于上述图5中描述的步骤S501和S502来执行步骤S1901。
编码器将量化的变换块分割成多个系数组(S1902)。
如在上面的图9和图10中所描述的,编码器可以递归地(或分层地)分割当前处理块,以便扫描变换系数。例如,将量化的变换块分割成多个系数组可以包括分层地分割量化的变换块并且将量化的变换块分割成具有较低深度的系数组,并且第二扫描顺序可以包括从量化的变换块中分割的具有各个深度的系数组当中的扫描顺序。
此外,如上面的图16和17中所描述的,编码器可以以特定数目的系数为单位对系数进行分组,并且然后通过应用各种扫描顺序来扫描系数。即,当量化变换块是非正方形块时,可以将量化变换块分割成由特定数目的系数构成的系数组,并且可以根据量化的变换块的宽度和高度的比率来确定特定数目。
编码器确定表示系数组的系数之间的扫描顺序的第一扫描顺序(S1903)。
编码器可以通过应用上面的图12至图18中描述的方法来确定第一扫描顺序。例如,步骤S1903可以包括:基于系数组的左上系数来确定系数组的各个系数的距离值;以及根据预定顺序将扫描索引分配给具有相同距离值的系数同时顺序地增大距离值。
进一步,如上面的图14和15中所描述的,编码器可以将扫描顺序分配给非正方形块中各个位置处的系数,以便有效地反映水平方向或垂直方向上的频率增加率。例如,确定系数组的各个系数的距离值的步骤可以包括:基于系数组的宽度和高度的比率确定表示每个系数的水平方向上的坐标值的增加量的水平增量和表示垂直方向上的坐标值的增加量的垂直增量,并且可以通过使用通过将水平增量和垂直增量求和而获得的值来确定各个系数的距离值。
此外,当系数组的宽度大于高度时,可以将水平增量确定为1,并且将垂直增量确定为2,并且当系数组的高度大于宽度时,可以将水平增量确定为2,并且将垂直增量确定为2。
可以由编码器预定义(或配置)第一扫描顺序,并且编码器可以以图片、条带、CTU、编译单元或变换单元为单位将第一扫描顺序发送到解码器。
此外,编码器可以确定表示多个系数组当中的扫描顺序的第二扫描顺序。在这种情况下,步骤S1903可以包括确定第二扫描顺序,并且编码器可以通过应用上面的图12至图18中描述的方法来确定第二扫描顺序。可以由编码器预定义(或配置)第二扫描顺序,并且编码器可以以图片、条带、CTU、编译单元或变换单元为单位将第二扫描顺序发送到解码器。
编码器根据第一扫描顺序和表示多个系数组当中的扫描顺序的第二扫描顺序对量化的变换块的系数进行熵编码(S1904)。
图20图示根据本公开的实施例的用于解码图像的方法。
解码器将当前处理块分割成多个系数组(S2001)。
如上面的图9和图10在上面所描述的,解码器可以递归地(或分层地)分割当前处理块,以便扫描变换系数。例如,将当前处理块分割成多个系数组可以包括:分层地分割当前处理块,以及将当前处理块分割成具有较低深度的系数组,并且第二扫描顺序可以包括从当前处理块中分割的具有各个深度的系数组当中的扫描顺序。
此外,如上面的图16和图17中所描述,解码器可以以特定数目的系数为单位对系数进行分组,并且然后通过应用各种扫描顺序来扫描系数。即,当当前处理块是非正方形块时,可以将当前处理块分割成由特定数量的系数构成的系数组,并且可以根据当前的处理块的宽度和高度的比率确定特定数量。
解码器确定表示系数组的系数之间的扫描顺序的第一扫描顺序(S2002)。
解码器可以通过应用上面的图12至图18中描述的方法来确定第一扫描顺序。例如,步骤S2002可以包括,基于系数组的左上系数来确定系数组的各个系数的距离值;以及根据预定顺序将扫描索引分配给具有相同距离值的系数,同时顺序地增大距离值。
此外,如上面的图14和15中所描述的,解码器可以将扫描顺序分配给非正方形块中各个位置处的系数,以便有效地反映水平方向或垂直方向上的频率增加率。例如,确定系数组的各个系数的距离值可以包括:基于系数组的宽度和高度的比率确定表示每个系数的水平方向上的坐标值的增加量的水平增量和表示垂直方向上的坐标值的增加量的垂直增量,并且可以通过使用将水平增量和垂直增量求和而获得的值来确定各个系数的距离值。
此外,当系数组的宽度大于高度时,可以将水平增量确定为1,并且将垂直增量确定为2,并且当系数组的高度大于宽度时,将可以将水平增量确定为2,并且将垂直增量确定为2。
第一扫描顺序可以由解码器预先定义(或配置),并且解码器可以以图片、条带、CTU、编码单元或变换单元为单位将第一扫描顺序发送到解码器。
此外,解码器可以确定表示多个系数组当中的扫描顺序的第二扫描顺序。在这种情况下,步骤S2002可以包括确定第二扫描顺序,并且解码器可以通过应用上面的图12至图18中描述的方法来确定第二扫描顺序。第二扫描顺序可以由解码器预定义(或配置),并且可以以图片、条带、CTU、编译单元或变换单元为单位从编码器发送至解码器。
解码器对从编码器输出的比特流进行熵解码,以生成量化的变换系数(S2003)。可以类似于上面图6中描述的步骤S601来执行步骤S2003。
解码器根据第一扫描顺序和表示多个系数组当中的扫描顺序的第二扫描顺序排列量化变换块的系数,以生成当前处理块的量化变换块(S2004)。
另外,解码器可以通过对量化的变换块进行去量化来获取变换块。去量化方法可以采用已知技术,并且将省略其详细描述。在根据上述实施例的图像解码方法中,可以省略或增加一些步骤,并且即使按照所描述的顺序,图像解码方法也不受限制。此外,步骤S2003和S2004可以分别执行或同时执行。
图21图示根据本公开的实施例的用于解码图像的设备。
在图21中,为了便于描述,将系数组分割单元2101、扫描顺序确定单元2102、变换系数生成单元2103和变换块生成单元2104图示为单独的块,但是系数组分割单元2101、扫描顺序确定单元2102、变换系数生成单元2103和变换块生成单元2104可以被实现为包括在编码器和/或解码器中的组件。
参考图21,根据该实施例的用于解码图像的设备实现上面的图5至图20中提出的功能、过程和/或方法,并且还执行下面将描述的缩放和变换过程。具体地,解码设备可以被配置成包括系数组分割单元2101、扫描顺序确定单元2102、变换系数生成单元2103和变换块生成单元2104。
在图21中图示的用于解码图像的设备的详细组件仅是一个示例,并且一些图示的详细组件可以被包括在另一详细组件中并且一起被实现,并且未图示的另一组件可以被添加并一起实现。
系数组分割单元2101将当前处理块分割为多个系数组。
如在上面的图9和图10中所描述的,系数组分割单元2101可以递归地(或分层地)分割当前处理块,以便扫描变换系数。例如,系数组分割单元2101分层地分割当前处理块以将当前处理块分割成具有较低深度的系数组,并且第二扫描顺序可以包括从当前处理块分割的具有各个深度的系数组当中的扫描顺序。
进一步,如上面的图16和图17中所描述的,系数组分割单元2101可以以特定数目的系数为单位对系数进行分组,并且然后通过应用各种扫描顺序来扫描系数。即,当当前处理块是非正方形块时,可以将当前处理块分割成由特定数量的系数构成的系数组,并且可以根据当前处理块的宽度和高度的比率确定特定数量。
扫描顺序确定单元2102确定表示系数组的系数之间的扫描顺序的第一扫描顺序。
扫描顺序确定单元2102可以通过应用上面的图12至图18中描述的方法确定第一扫描顺序。例如,扫描顺序确定单元2102可以基于系数组的左上系数来确定系数组的各个系数的距离值,并且根据预定顺序将扫描索引分配给具有相同距离值的系数并且依次增加距离值。
另外,如上面的14图15中所描述的,扫描顺序确定单元2103可以将扫描顺序分配给非正方形块中各个位置处的系数,以便有效地反映水平方向或垂直方向上的频率增加率。例如,扫描顺序确定单元2102可以基于系数组的宽度和高度的比率来确定表示每个系数的水平方向上的坐标值的增加量的水平增量和表示垂直方向上的坐标值的增加量的垂直增量,并且可以通过使用将水平增量和垂直增量相加而获得的值来确定各个系数的距离值。
此外,当系数组的宽度大于高度时,可以将水平增量确定为1,并且将垂直增量确定为2,并且当系数组的高度大于宽度时,将可以将水平增量确定为2并且将垂直增量确定为2。
第一扫描顺序可以由解码器预先定义(或配置),并且解码器可以以图片、条带、CTU、编译单元或变换单元为单位将第一扫描顺序发送到解码器。
此外,扫描顺序确定单元2102可以确定表示多个系数组当中的扫描顺序的第二扫描顺序。换句话说,扫描顺序确定单元2102可以包括确定第二扫描顺序,并且扫描顺序确定单元2102可以通过应用上面的图12至图18中描述的方法来确定第二扫描顺序。此外,第二扫描顺序可以由解码器预定义(或配置),并且可以以图片、条带、CTU、编译单元或变换单元为单位从编码器发送到解码器。
变换系数生成单元2103对从编码器输出的比特流进行熵解码,以生成量化的变换系数。在这种情况下,可以应用与图6中描述的步骤S601相同的方法。
变换块生成单元2104根据第一扫描顺序和表示多个系数组当中的扫描顺序的第二扫描顺序来排列量化的变换块的系数以生成当前处理块的量化的变换块。
在上述实施例中,本公开的组件和特征以预定形式组合。除非另有明确说明,否则每个组件或特征都应视为选项。每个组件或特征可以被实现为不与其他组件或特征相关联。此外,可以通过关联一些组件和/或特征来配置本公开的实施例。本公开的实施例中描述的操作的顺序可以被改变。任何实施例的一些组件或特征可以被包括在另一实施例中,或者被与另一实施例相对应的组件和特征所代替。显而易见的是,在权利要求中未明确引用的权利要求被组合以形成实施例,或者在申请之后通过修改被包括在新的权利要求中。
本公开的实施例可以通过硬件、固件、软件或其组合来实现。在通过硬件实现的情况下,根据硬件实现,可以通过使用一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器等来实现本文描述的示例性实施例。
在通过固件或软件实现的情况下,本公开的实施例可以以执行上述功能或操作的模块、过程、函数等形式来实现。可以将软件代码存储在存储器中并由处理器执行。存储器可以被定位在处理器内部或外部,并且可以通过各种手段向处理器发送数据或从处理器接收数据。
对于本领域的技术人员显而易见的是,在不脱离本公开的本质特征的情况下,本公开可以以其他特定形式来体现。因此,前述详细描述不应在所有方面解释为限制性的,而应被示例性地考虑。本公开的范围应该由所附权利要求的合理解释来确定,并且在本公开的等同范围内的所有修改都包括在本公开的范围内。
[工业实用性]
在上文中,出于说明的目的公开本公开的优选实施例,并且在下文中,本领域的技术人员将在随附的权利要求中公开的本公开的技术精神和技术范围内对各种其他实施例进行修改、改变、替换或添加。
Claims (9)
1.一种用于解码图像的方法,所述方法包括:
基于当前块是非正方形块,将所述当前块分割成子块,其中所述子块包括非正方形子块;
基于第一扫描顺序和第二扫描顺序获得用于所述当前块的系数,其中所述第一扫描顺序表示所述非正方形子块的系数中的扫描顺序,并且其中所述第二扫描顺序表示所述子块之间的扫描顺序;
基于所述系数获得残差样本;以及
基于所述残差样本重建所述图像;
其中,所述非正方形子块的系数的数量是基于所述当前块的宽度和高度确定的。
2.根据权利要求1所述的方法,其中,所述第一扫描顺序是基于包括以下的步骤确定的:
基于所述非正方形子块的左上系数的位置确定所述非正方形子块内的系数的距离值,以及
根据预定的顺序将扫描索引分配给具有相同距离值的系数,同时顺序地增加所述距离值。
3.根据权利要求2所述的方法,其中,确定所述非正方形子块内的系数的距离值的步骤包括:
基于所述非正方形子块的宽度和高度的比率,确定表示每个系数的坐标值在水平方向上的增加量的水平增量和表示所述坐标值在垂直方向上的增加量的垂直增量,
其中,所述系数的距离值由通过总计所述水平增量和所述垂直增量获得的值来确定。
4.根据权利要求3所述的方法,
其中,基于所述非正方形子块的宽度大于高度,所述水平增量被确定为1,并且所述垂直增量被确定为2,以及
其中,基于所述非正方形子块的高度大于宽度,所述水平增量被确定为2,并且所述垂直增量被确定为1。
5.根据权利要求1所述的方法,
其中,将所述当前块分割成子块的步骤包括:
分层分割所述当前块,并将分割的当前块分割成具有更低深度的子块,以及
其中,所述第二扫描顺序包括从所述当前块开始具有相应深度的子块之间的扫描顺序。
6.根据权利要求1所述的方法,
其中,所述子块具有特定数量的系数,以及
其中,所述特定数量是基于所述当前处理块的宽度和高度的比率确定的。
7.一种编码图像的方法,所述方法包括:
生成包括当前块的图像的预测样本;
基于所述预测样本生成残差样本;
通过对所述残差样本执行变换生成系数;
基于所述当前块是非正方形块,将所述当前块分割成子块,其中所述子块包括非正方形子块;以及
基于第一扫描顺序和第二扫描顺序对所述系数进行熵编码,
其中,所述第一扫描顺序表示所述非正方形子块的系数中的扫描顺序,
其中,所述第二扫描顺序表示所述子块之间的扫描顺序,以及
其中,所述非正方形子块的系数的数量是基于所述当前块的宽度和高度确定的。
8.一种计算机可读介质,其存储通过执行以下步骤生成的编码的视频信息:
生成包括当前块的图像的预测样本;
基于所述预测样本生成残差样本;
通过对所述残差样本执行变换生成系数;
基于所述当前块是非正方形块,将所述当前块分割成子块,其中所述子块包括非正方形子块;以及
基于第一扫描顺序和第二扫描顺序对所述系数进行熵编码,
其中,所述第一扫描顺序表示所述非正方形子块的系数中的扫描顺序,
其中,所述第二扫描顺序表示所述子块之间的扫描顺序,以及
其中,所述非正方形子块的系数的数量是基于所述当前块的宽度和高度确定的。
9.一种用于包括图像的比特流的数据的传输方法,所述方法包括:
获得所述图像的所述比特流,其中所述比特流是通过执行以下步骤生成的:生成包括当前块的图像的预测样本;基于所述预测样本生成残差样本;通过对所述残差样本执行变换生成系数;基于所述当前块是非正方形块,将所述当前块分割成子块,其中所述子块包括非正方形子块;以及基于第一扫描顺序和第二扫描顺序对所述系数进行熵编码,其中,所述第一扫描顺序表示所述非正方形子块的系数中的扫描顺序,其中,所述第二扫描顺序表示所述子块之间的扫描顺序,以及其中,所述非正方形子块的系数的数量是基于所述当前块的宽度和高度确定的;以及
发送包含所述比特流的所述数据。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762484900P | 2017-04-13 | 2017-04-13 | |
US62/484,900 | 2017-04-13 | ||
CN201880031909.XA CN110622511B (zh) | 2017-04-13 | 2018-03-13 | 图像编码/解码方法及其设备 |
PCT/KR2018/002952 WO2018190523A1 (ko) | 2017-04-13 | 2018-03-13 | 영상의 부호화/복호화 방법 및 이를 위한 장치 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880031909.XA Division CN110622511B (zh) | 2017-04-13 | 2018-03-13 | 图像编码/解码方法及其设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114760470A true CN114760470A (zh) | 2022-07-15 |
Family
ID=63793701
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880031909.XA Active CN110622511B (zh) | 2017-04-13 | 2018-03-13 | 图像编码/解码方法及其设备 |
CN202210301060.1A Pending CN114760471A (zh) | 2017-04-13 | 2018-03-13 | 图像编码/解码方法及其设备 |
CN202210299667.0A Pending CN114760470A (zh) | 2017-04-13 | 2018-03-13 | 图像编码/解码方法及其设备 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880031909.XA Active CN110622511B (zh) | 2017-04-13 | 2018-03-13 | 图像编码/解码方法及其设备 |
CN202210301060.1A Pending CN114760471A (zh) | 2017-04-13 | 2018-03-13 | 图像编码/解码方法及其设备 |
Country Status (11)
Country | Link |
---|---|
US (1) | US11729390B2 (zh) |
EP (1) | EP3609183B1 (zh) |
JP (2) | JP6949990B2 (zh) |
KR (4) | KR102257829B1 (zh) |
CN (3) | CN110622511B (zh) |
AU (2) | AU2018252853A1 (zh) |
BR (2) | BR122021018343B1 (zh) |
CA (1) | CA3060201C (zh) |
MX (2) | MX2019012294A (zh) |
RU (1) | RU2746706C1 (zh) |
WO (1) | WO2018190523A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110622511B (zh) * | 2017-04-13 | 2022-04-15 | Lg 电子株式会社 | 图像编码/解码方法及其设备 |
JP7278084B2 (ja) * | 2019-01-29 | 2023-05-19 | キヤノン株式会社 | 情報処理装置および情報処理方法ならびにプログラム |
CN113475062A (zh) | 2019-02-24 | 2021-10-01 | 北京字节跳动网络技术有限公司 | 确定屏幕内容编解码的条件 |
US11677969B2 (en) * | 2019-03-22 | 2023-06-13 | Tencent America LLC | Method and apparatus for video coding |
JP7359936B2 (ja) | 2019-07-20 | 2023-10-11 | 北京字節跳動網絡技術有限公司 | パレットモードの使用の指示の条件依存符号化 |
CN117221536A (zh) | 2019-07-23 | 2023-12-12 | 北京字节跳动网络技术有限公司 | 调色板模式编解码的模式确定 |
WO2021018167A1 (en) * | 2019-07-29 | 2021-02-04 | Beijing Bytedance Network Technology Co., Ltd. | Palette mode coding in prediction process |
US11388439B2 (en) * | 2019-10-21 | 2022-07-12 | Google Llc | Sparse matrix representation using a boundary of non-zero coefficients |
US11363299B2 (en) | 2019-12-12 | 2022-06-14 | Panasonic Intellectual Property Corporation Of America | Encoding and decoding with merge mode and block partition index |
CN113132734B (zh) * | 2019-12-31 | 2023-05-26 | 杭州海康威视数字技术股份有限公司 | 一种编码、解码方法、装置及其设备 |
CN115004706B (zh) * | 2020-01-28 | 2024-06-04 | 北京达佳互联信息技术有限公司 | 关于变换和系数信令的方法和装置 |
CN116636205A (zh) * | 2021-08-30 | 2023-08-22 | 腾讯美国有限责任公司 | 次级变换系数的扫描顺序 |
US12113996B2 (en) * | 2021-12-06 | 2024-10-08 | Tencent America LLC | Arrangement of adaptive loop filter coefficients for fast vectorized transpositions |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010069018A (ko) * | 2000-01-11 | 2001-07-23 | 구자홍 | 영상 압축 부호화를 위한 변형 이중 스캔방법 |
WO2013006446A1 (en) * | 2011-07-01 | 2013-01-10 | Qualcomm Incorporated | Context adaptive entropy coding for non-square blocks in video coding |
US20150078443A1 (en) * | 2012-04-13 | 2015-03-19 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding a subset of transform units of encoded video data |
CN105120272A (zh) * | 2011-10-18 | 2015-12-02 | 株式会社Kt | 图像编码方法、图像解码方法、图像编码器及图像解码器 |
Family Cites Families (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5473376A (en) * | 1994-12-01 | 1995-12-05 | Motorola, Inc. | Method and apparatus for adaptive entropy encoding/decoding of quantized transform coefficients in a video compression system |
KR101354151B1 (ko) * | 2006-08-24 | 2014-01-28 | 삼성전자주식회사 | 영상 변환 방법 및 장치, 역변환 방법 및 장치 |
US8619853B2 (en) * | 2007-06-15 | 2013-12-31 | Qualcomm Incorporated | Separable directional transforms |
US8571104B2 (en) | 2007-06-15 | 2013-10-29 | Qualcomm, Incorporated | Adaptive coefficient scanning in video coding |
US8638852B2 (en) | 2008-01-08 | 2014-01-28 | Qualcomm Incorporated | Video coding of filter coefficients based on horizontal and vertical symmetry |
US9100646B2 (en) * | 2008-09-03 | 2015-08-04 | Sk Telecom Co., Ltd. | Device and method for image encoding/decoding using prediction direction conversion and selective encoding |
US9143803B2 (en) | 2009-01-15 | 2015-09-22 | Qualcomm Incorporated | Filter prediction based on activity metrics in video coding |
EP2395755A4 (en) * | 2009-02-09 | 2015-01-07 | Samsung Electronics Co Ltd | VIDEO PROCESSING AND DEVICE WITH LOW-COMPLEX FREQUENCY CONVERSION AND VIDEO PROCESSING AND DEVICE |
KR101456498B1 (ko) * | 2009-08-14 | 2014-10-31 | 삼성전자주식회사 | 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치 |
CN106028045B (zh) | 2010-04-13 | 2019-06-25 | Ge视频压缩有限责任公司 | 解码数据流的方法、生成数据流的方法及其解码器 |
CN113556563B (zh) * | 2010-04-13 | 2024-08-20 | Ge视频压缩有限责任公司 | 显著性图和变换系数块的编码 |
KR20110125153A (ko) * | 2010-05-12 | 2011-11-18 | 에스케이 텔레콤주식회사 | 영상의 필터링 방법 및 장치와 그를 이용한 부호화/복호화를 위한 방법 및 장치 |
AU2010357291B2 (en) * | 2010-07-15 | 2015-01-15 | Kabushiki Kaisha Toshiba | Image encoding method and image decoding method |
KR101483179B1 (ko) * | 2010-10-06 | 2015-01-19 | 에스케이 텔레콤주식회사 | 주파수 마스크 테이블을 이용한 주파수변환 블록 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
KR102034004B1 (ko) * | 2010-10-08 | 2019-10-18 | 지이 비디오 컴프레션, 엘엘씨 | 블록 분할 및 블록 병합을 지원하는 픽처 코딩 |
US9641846B2 (en) | 2010-10-22 | 2017-05-02 | Qualcomm Incorporated | Adaptive scanning of transform coefficients for video coding |
JP5809292B2 (ja) * | 2011-01-14 | 2015-11-10 | ジーイー ビデオ コンプレッション エルエルシー | エントロピー符号化および復号化スキーム |
US9338449B2 (en) * | 2011-03-08 | 2016-05-10 | Qualcomm Incorporated | Harmonized scan order for coding transform coefficients in video coding |
US9167253B2 (en) * | 2011-06-28 | 2015-10-20 | Qualcomm Incorporated | Derivation of the position in scan order of the last significant transform coefficient in video coding |
US20130003837A1 (en) * | 2011-06-29 | 2013-01-03 | General Instrument Corporation | Methods and system for using a scan coding pattern during intra coding |
US20130083856A1 (en) * | 2011-06-29 | 2013-04-04 | Qualcomm Incorporated | Contexts for coefficient level coding in video compression |
US9807426B2 (en) * | 2011-07-01 | 2017-10-31 | Qualcomm Incorporated | Applying non-square transforms to video data |
US9756360B2 (en) * | 2011-07-19 | 2017-09-05 | Qualcomm Incorporated | Coefficient scanning in video coding |
JP2014523710A (ja) * | 2011-07-22 | 2014-09-11 | モトローラ モビリティ エルエルシー | ビデオ・コーディングにおける直交形状変換をスキャンするためのデバイスおよび方法 |
US8995708B2 (en) * | 2011-09-08 | 2015-03-31 | Samsung Electronics Co., Ltd. | Apparatus and method for robust low-complexity video fingerprinting |
JP2013087869A (ja) | 2011-10-18 | 2013-05-13 | Hitachi Constr Mach Co Ltd | 圧油エネルギ回収装置及びこれを用いた建設機械 |
US9247254B2 (en) * | 2011-10-27 | 2016-01-26 | Qualcomm Incorporated | Non-square transforms in intra-prediction video coding |
US20130114692A1 (en) * | 2011-11-04 | 2013-05-09 | Texas Instruments Incorporated | Simplified Coefficient Scans for Non-Square Transforms (NSQT) in Video Coding |
KR20130049525A (ko) | 2011-11-04 | 2013-05-14 | 오수미 | 잔차 블록 복원을 위한 역변환 방법 |
KR20130049524A (ko) * | 2011-11-04 | 2013-05-14 | 오수미 | 인트라 예측 블록 생성 방법 |
US10390016B2 (en) * | 2011-11-04 | 2019-08-20 | Infobridge Pte. Ltd. | Apparatus of encoding an image |
US10390046B2 (en) * | 2011-11-07 | 2019-08-20 | Qualcomm Incorporated | Coding significant coefficient information in transform skip mode |
CN107396100B (zh) * | 2011-11-08 | 2020-05-05 | 株式会社Kt | 利用解码装置对视频信号进行解码的方法 |
CN107071434A (zh) * | 2011-11-08 | 2017-08-18 | 株式会社Kt | 对视频信号进行解码的方法 |
US9743098B2 (en) | 2011-11-19 | 2017-08-22 | Blackberry Limited | Multi-level significance map scanning |
US9350996B2 (en) * | 2011-12-20 | 2016-05-24 | Google Technology Holdings LLC | Method and apparatus for last coefficient indexing for high efficiency video coding |
US9621894B2 (en) * | 2012-01-13 | 2017-04-11 | Qualcomm Incorporated | Determining contexts for coding transform coefficient data in video coding |
US9191670B2 (en) * | 2012-01-17 | 2015-11-17 | Qualcomm Incorporated | Throughput improvement for CABAC coefficient level coding |
US9654772B2 (en) * | 2012-01-19 | 2017-05-16 | Qualcomm Incorporated | Context adaptive entropy coding with a reduced initialization value set |
AU2012200319B2 (en) * | 2012-01-19 | 2015-11-26 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit |
EP2618570B1 (en) * | 2012-01-20 | 2017-12-13 | BlackBerry Limited | Method and devices for context set selection |
CN104956674B (zh) * | 2012-01-20 | 2019-02-15 | 谷歌技术控股有限责任公司 | 用于最末重要系数位置编解码中的上下文减少的设备和方法 |
US20130195200A1 (en) * | 2012-01-28 | 2013-08-01 | Research In Motion Limited | Methods and devices for context modeling to enable modular processing |
JP2013187869A (ja) | 2012-03-09 | 2013-09-19 | Sharp Corp | 算術復号装置、算術符号化装置、画像復号装置、および画像符号化装置 |
US9621921B2 (en) * | 2012-04-16 | 2017-04-11 | Qualcomm Incorporated | Coefficient groups and coefficient coding for coefficient scans |
US9912944B2 (en) * | 2012-04-16 | 2018-03-06 | Qualcomm Incorporated | Simplified non-square quadtree transforms for video coding |
GB2501535A (en) * | 2012-04-26 | 2013-10-30 | Sony Corp | Chrominance Processing in High Efficiency Video Codecs |
US11025922B2 (en) * | 2012-06-13 | 2021-06-01 | Texas Instruments Incorporated | Inverse transformation using pruning for video coding |
US10257520B2 (en) | 2012-06-26 | 2019-04-09 | Velos Media, Llc | Modified coding for transform skipping |
US9350998B2 (en) * | 2012-06-29 | 2016-05-24 | Qualcomm Incorporated | Coding of significance flags |
US9332257B2 (en) * | 2012-10-01 | 2016-05-03 | Qualcomm Incorporated | Coded black flag coding for 4:2:2 sample format in video coding |
CN108259900B (zh) | 2013-01-16 | 2021-01-01 | 黑莓有限公司 | 针对视频的上下文自适应二进制熵编码的变换系数编码 |
CN113259683B (zh) * | 2013-04-08 | 2024-08-23 | Ge视频压缩有限责任公司 | 分量间预测 |
US10412419B2 (en) * | 2013-07-12 | 2019-09-10 | Qualcomm Incorporated | Adaptive filtering in video coding |
US11470339B2 (en) * | 2013-08-27 | 2022-10-11 | Qualcomm Incorporated | Residual prediction for intra block copying |
US9445132B2 (en) * | 2013-09-09 | 2016-09-13 | Qualcomm Incorporated | Two level last significant coefficient (LSC) position coding |
US20150271515A1 (en) * | 2014-01-10 | 2015-09-24 | Qualcomm Incorporated | Block vector coding for intra block copy in video coding |
US9756354B2 (en) * | 2014-03-17 | 2017-09-05 | Qualcomm Incorporated | Block vector predictor for intra block copying |
US10432928B2 (en) * | 2014-03-21 | 2019-10-01 | Qualcomm Incorporated | Using a current picture as a reference for video coding |
US10477232B2 (en) * | 2014-03-21 | 2019-11-12 | Qualcomm Incorporated | Search region determination for intra block copy in video coding |
US20150373362A1 (en) * | 2014-06-19 | 2015-12-24 | Qualcomm Incorporated | Deblocking filter design for intra block copy |
WO2016154963A1 (en) * | 2015-04-01 | 2016-10-06 | Mediatek Inc. | Methods for chroma coding in video codec |
US10200713B2 (en) * | 2015-05-11 | 2019-02-05 | Qualcomm Incorporated | Search region determination for inter coding within a particular picture of video data |
WO2016200234A1 (ko) * | 2015-06-11 | 2016-12-15 | 엘지전자(주) | 영상의 부호화/복호화 방법 및 이를 위한 장치 |
US10681379B2 (en) * | 2015-09-29 | 2020-06-09 | Qualcomm Incorporated | Non-separable secondary transform for video coding with reorganizing |
WO2017091016A1 (ko) * | 2015-11-24 | 2017-06-01 | 삼성전자 주식회사 | 비디오 복호화 방법 및 장치, 그 부호화 방법 및 장치 |
WO2017090967A1 (ko) * | 2015-11-24 | 2017-06-01 | 삼성전자 주식회사 | 부호화 순서 부호화 방법 및 그 장치, 복호화 방법 및 그 장치 |
US10200719B2 (en) * | 2015-11-25 | 2019-02-05 | Qualcomm Incorporated | Modification of transform coefficients for non-square transform units in video coding |
CN109155847A (zh) * | 2016-03-24 | 2019-01-04 | 英迪股份有限公司 | 用于编码/解码视频信号的方法和装置 |
US11228754B2 (en) * | 2016-05-06 | 2022-01-18 | Qualcomm Incorporated | Hybrid graphics and pixel domain architecture for 360 degree video |
EP3270594A1 (en) * | 2016-07-15 | 2018-01-17 | Thomson Licensing | Method and apparatus for advanced cabac context adaptation for last coefficient coding |
CN117412037A (zh) * | 2016-08-31 | 2024-01-16 | 株式会社Kt | 用于处理视频信号的方法和设备 |
KR102471208B1 (ko) * | 2016-09-20 | 2022-11-25 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
CN110622511B (zh) | 2017-04-13 | 2022-04-15 | Lg 电子株式会社 | 图像编码/解码方法及其设备 |
US20190313108A1 (en) * | 2018-04-05 | 2019-10-10 | Qualcomm Incorporated | Non-square blocks in video coding |
JP2022016726A (ja) * | 2018-11-16 | 2022-01-25 | ソニーグループ株式会社 | 画像処理装置および方法 |
-
2018
- 2018-03-13 CN CN201880031909.XA patent/CN110622511B/zh active Active
- 2018-03-13 US US16/605,094 patent/US11729390B2/en active Active
- 2018-03-13 RU RU2019135696A patent/RU2746706C1/ru active
- 2018-03-13 KR KR1020197033091A patent/KR102257829B1/ko active IP Right Grant
- 2018-03-13 BR BR122021018343-0A patent/BR122021018343B1/pt active IP Right Grant
- 2018-03-13 KR KR1020217015593A patent/KR102302797B1/ko active IP Right Grant
- 2018-03-13 EP EP18784722.3A patent/EP3609183B1/en active Active
- 2018-03-13 JP JP2019556231A patent/JP6949990B2/ja active Active
- 2018-03-13 CN CN202210301060.1A patent/CN114760471A/zh active Pending
- 2018-03-13 BR BR112019021584-0A patent/BR112019021584B1/pt active IP Right Grant
- 2018-03-13 WO PCT/KR2018/002952 patent/WO2018190523A1/ko active Application Filing
- 2018-03-13 CA CA3060201A patent/CA3060201C/en active Active
- 2018-03-13 CN CN202210299667.0A patent/CN114760470A/zh active Pending
- 2018-03-13 KR KR1020217029105A patent/KR102424411B1/ko active IP Right Grant
- 2018-03-13 MX MX2019012294A patent/MX2019012294A/es unknown
- 2018-03-13 AU AU2018252853A patent/AU2018252853A1/en not_active Abandoned
- 2018-03-13 KR KR1020227025143A patent/KR102558015B1/ko active IP Right Grant
-
2019
- 2019-10-11 MX MX2023005933A patent/MX2023005933A/es unknown
-
2021
- 2021-07-21 AU AU2021206839A patent/AU2021206839B2/en active Active
- 2021-09-22 JP JP2021153969A patent/JP2022008491A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010069018A (ko) * | 2000-01-11 | 2001-07-23 | 구자홍 | 영상 압축 부호화를 위한 변형 이중 스캔방법 |
WO2013006446A1 (en) * | 2011-07-01 | 2013-01-10 | Qualcomm Incorporated | Context adaptive entropy coding for non-square blocks in video coding |
CN105120272A (zh) * | 2011-10-18 | 2015-12-02 | 株式会社Kt | 图像编码方法、图像解码方法、图像编码器及图像解码器 |
US20150078443A1 (en) * | 2012-04-13 | 2015-03-19 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding a subset of transform units of encoded video data |
Non-Patent Citations (1)
Title |
---|
CHEUNG AUYEUNG: "Additional horizontal and vertical scan for transform coefficients", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU -T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》》, 3 July 2012 (2012-07-03) * |
Also Published As
Publication number | Publication date |
---|---|
KR20210114560A (ko) | 2021-09-23 |
KR102558015B1 (ko) | 2023-07-21 |
CN114760471A (zh) | 2022-07-15 |
KR102257829B1 (ko) | 2021-05-28 |
AU2021206839B2 (en) | 2023-07-27 |
KR20220107081A (ko) | 2022-08-01 |
EP3609183B1 (en) | 2023-05-03 |
KR102302797B1 (ko) | 2021-09-16 |
BR112019021584A2 (pt) | 2020-05-12 |
KR102424411B1 (ko) | 2022-07-25 |
AU2018252853A1 (en) | 2019-12-05 |
JP2022008491A (ja) | 2022-01-13 |
WO2018190523A1 (ko) | 2018-10-18 |
BR122021018343B1 (pt) | 2022-10-25 |
US11729390B2 (en) | 2023-08-15 |
JP6949990B2 (ja) | 2021-10-13 |
CN110622511A (zh) | 2019-12-27 |
JP2020517194A (ja) | 2020-06-11 |
CA3060201A1 (en) | 2018-10-18 |
US20210105477A1 (en) | 2021-04-08 |
KR20210063465A (ko) | 2021-06-01 |
EP3609183A1 (en) | 2020-02-12 |
RU2746706C1 (ru) | 2021-04-19 |
MX2023005933A (es) | 2023-06-22 |
AU2021206839A1 (en) | 2021-08-12 |
CN110622511B (zh) | 2022-04-15 |
EP3609183A4 (en) | 2020-06-10 |
KR20190133050A (ko) | 2019-11-29 |
CA3060201C (en) | 2023-09-19 |
MX2019012294A (es) | 2020-01-27 |
BR112019021584B1 (pt) | 2022-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110622511B (zh) | 图像编码/解码方法及其设备 | |
CN109792519B (zh) | 基于帧内预测模式的图像处理方法及其装置 | |
CN109644281B (zh) | 用于处理视频信号的方法和设备 | |
KR102048169B1 (ko) | 비디오 코딩에서 비-스퀘어 변환 유닛들에 대한 변환 계수들의 수정 | |
CN110024405B (zh) | 图像处理方法及其装置 | |
CN111885380B (zh) | 在内预测模式的基础上处理图像的方法及其装置 | |
KR20190090866A (ko) | 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치 | |
KR20190042732A (ko) | 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치 | |
KR20180009048A (ko) | 영상의 부호화/복호화 방법 및 이를 위한 장치 | |
KR20180040577A (ko) | 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치 | |
RU2786121C1 (ru) | Способ и устройство кодирования/декодирования изображений |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |