CN117336470A - 图像编码/解码方法、图像数据发送方法和存储介质 - Google Patents
图像编码/解码方法、图像数据发送方法和存储介质 Download PDFInfo
- Publication number
- CN117336470A CN117336470A CN202311303909.XA CN202311303909A CN117336470A CN 117336470 A CN117336470 A CN 117336470A CN 202311303909 A CN202311303909 A CN 202311303909A CN 117336470 A CN117336470 A CN 117336470A
- Authority
- CN
- China
- Prior art keywords
- transform
- target block
- rst
- inverse
- block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 143
- 238000013507 mapping Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 93
- 238000013139 quantization Methods 0.000 claims description 13
- 230000001131 transforming effect Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 abstract description 61
- 238000000844 transformation Methods 0.000 abstract description 6
- 230000009467 reduction Effects 0.000 description 55
- 239000013598 vector Substances 0.000 description 45
- 239000000523 sample Substances 0.000 description 34
- 230000008569 process Effects 0.000 description 29
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 20
- 238000010586 diagram Methods 0.000 description 18
- 238000012545 processing Methods 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000001914 filtration Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 230000011664 signaling Effects 0.000 description 9
- 230000003044 adaptive effect Effects 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 241000023320 Luma <angiosperm> Species 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000013074 reference sample Substances 0.000 description 2
- YREOLPGEVLLKMB-UHFFFAOYSA-N 3-methylpyridin-1-ium-2-amine bromide hydrate Chemical compound O.[Br-].Cc1ccc[nH+]c1N YREOLPGEVLLKMB-UHFFFAOYSA-N 0.000 description 1
- 101100278585 Dictyostelium discoideum dst4 gene Proteins 0.000 description 1
- 102100038123 Teneurin-4 Human genes 0.000 description 1
- 101710122302 Teneurin-4 Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 101150089388 dct-5 gene Proteins 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 101150090341 dst1 gene Proteins 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本申请涉及图像编码/解码方法、图像数据发送方法和存储介质。根据本发明的图像解码方法包括如下步骤:通过解量化的方式推导针对目标块的变换系数;基于针对变换系数的逆缩减二次变换RST来推导修改的变换系数;基于针对修改的变换系数的逆一次变换来推导针对目标块的残差样本;以及基于以针对目标块的帧内预测模式为基础推导的预测样本和残差样本来生成重构样本。基于变换集执行逆RST。根据应用于目标块的帧内预测模式基于映射关系来确定变换集。包括目标块的帧内预测模式的多个帧内预测模式被映射到一个变换集。
Description
本申请是原案申请号为201980057941.X的发明专利申请(国际申请号:PCT/KR2019/008377,申请日:2019年7月8日,发明名称:基于变换的图像编码方法及装置)的分案申请。
技术领域
本公开总体上涉及图像编码技术,更具体地,涉及图像编码系统中的基于变换的图像编码方法及其设备。
背景技术
如今,在各个领域中对诸如4K、8K或更高的超高清(UHD)图像/视频这样的高分辨率和高质量图像/视频的需求已经不断增长。随着图像/视频数据变成更高分辨率和更高质量,与传统图像数据相比,所发送的信息量或比特量增加。因此,当使用诸如传统有线/无线宽带线这样的介质来发送图像数据或者使用现有存储介质来存储图像/视频数据时,其传输成本和存储成本增加。
另外,如今,对于诸如虚拟现实(VR)和人工现实(AR)内容或全息图等这样的沉浸式媒体的兴趣和需求正在增加,并且对具有与诸如游戏图像这样的真实图像不同的图像特征的图像/视频的广播正在增加。
因此,需要有效地压缩并发送或存储以及再现具有如上所述的各种特征的高分辨率和高质量图像/视频的信息的高效图像/视频压缩技术。
发明内容
技术问题
本公开的一个技术目的是提供增加图像编码效率的方法和设备。
本公开的另一技术目的是提供增加变换效率的方法和设备。
本公开的又一技术目的是提供通过变换来增加残差编码的效率的方法和设备。
本公开的又一技术目的是提供基于缩减二次变换(RST)的图像编码方法和设备。
本公开的又一技术目的是提供基于变换集并且能够增加编码效率的图像编码方法和设备。
技术方案
根据本公开的示例,提供了由解码设备执行的图像解码方法。该方法包括:从比特流推导目标块的量化变换系数;通过基于目标块的量化变换系数的解量化来推导变换系数;基于针对变换系数的逆缩减二次变换(RST)推导修改的变换系数;基于针对修改的变换系数的逆一次变换来推导目标块的残差样本;以及基于目标块的残差样本和基于目标块的帧内预测模式推导的预测样本生成重构块,其中基于从包括多个变换核矩阵的变换集中选择的变换核矩阵执行逆RST,根据应用于目标块的帧内预测模式基于映射关系来确定变换集,并且包括目标块的帧内预测模式的多个帧内预测模式被映射到一个变换集。
根据本公开的另一示例,提供了执行图像解码的解码设备。解码设备包括:熵解码器,其从比特流推导关于预测的信息和目标块的量化变换系数;预测器,其基于关于预测的信息中包括的帧内预测模式生成目标块的预测样本;解量化器,其通过基于目标块的量化变换系数的解量化来推导变换系数;逆变换器,其包括基于变换系数的逆RST来推导修改的变换系数的逆缩减二次变换器以及基于修改的变换系数的逆一次变换来推导目标块的残差样本的逆一次变换器;以及加法器,其基于残差样本和预测样本生成重构图片,其中,逆缩减二次变换器基于与帧内预测模式具有映射关系的变换集中包括的变换核矩阵执行逆RST,根据应用于目标块的帧内预测模式基于映射关系来确定变换集,并且将包括目标块的帧内预测模式的多个帧内预测模式映射到一个变换集。
根据本公开的示例,提供了由编码设备执行的图像编码方法。该方法包括:基于应用于目标块的帧内预测模式推导预测样本;基于预测样本推导目标块的残差样本;基于针对残差样本的一次变换推导目标块的变换系数;基于针对变换系数的缩减二次变换(RST)推导修改的变换系数;以及通过执行基于修改的变换系数的量化来推导量化变换系数,其中,基于从包括多个变换核矩阵的变换集中选择的变换核矩阵来执行RST,根据应用于目标块的帧内预测模式基于映射关系来确定变换集,并且包括目标块的帧内预测模式的多个帧内预测模式被映射到一个变换集。
根据本公开的又一示例,可以提供一种数字存储介质,其中存储了包括根据由编码设备执行的图像编码方法生成的编码图像信息的图像数据。
根据本公开的又一示例,可以提供一种数字存储介质,其中存储了包括使解码设备执行图像解码方法的编码图像信息的图像数据。
技术效果
根据本公开,可以增加整体图像/视频压缩效率。
根据本公开,通过高效变换,可以减少针对残差处理必须传送的数据量,并且可以增加残差编码效率。
根据本公开,可以通过频域中的二次变换将非零变换系数集中在低频分量中。
根据本公开,可以通过基于变换集执行图像编码来增加图像编码效率。
附图说明
图1示意性地表示可以应用本公开的视频/图像编码系统的示例。
图2是示意性地描述可以应用本公开的视频/图像编码设备的配置的图。
图3是示意性地描述可以应用本公开的视频/图像解码设备的配置的图。
图4示意性地表示根据本公开的示例的多变换技术。
图5例示性地表示65个预测方向的帧内定向模式。
图6是用于说明根据本公开的示例的RST的图。
图7是示出根据本公开的示例的逆RST处理的流程图。
图8是示出根据本公开的另一示例的逆RST处理的流程图。
图9是示出根据本公开的示例的基于不可分离的二次变换的逆RST处理的流程图。
图10是示出根据本公开的示例的应用RST的块的图。
图11是表示应用于4×4变换系数的扫描顺序的图。
图12是例示根据本公开的示例的根据对角线扫描顺序的变换系数的映射的图。
图13是例示根据本公开的另一示例的基于对角线扫描顺序的变换系数的映射的图。
图14是例示根据本公开的示例的在考虑特定条件的情况下选择变换集的方法的图。
图15是示出根据本公开的示例的视频解码设备的操作的流程图。
图16是示出根据本公开的示例的视频编码设备的操作的流程图。
图17例示性地表示应用本公开的内容流系统结构图。
具体实施方式
尽管本文档可能易于进行各种修改并且包括各种实施方式,但是其具体实施方式已在附图中通过示例的方式示出,并且现在将对其进行详细描述。然而,这并不旨在将本文档限制于本文中公开的具体实施方式。本文中使用的术语只是出于描述特定实施方式的目的,而不旨在限制本文档的技术思路。单数形式可以包括复数形式,除非上下文中另外清楚指示。诸如“包括”和“具有”这样的术语旨在指示存在以下描述中使用的特征、数字、步骤、操作、元件、组件或其组合,因此不应该被理解为预先排除了存在或添加一个或更多个不同特征、数字、步骤、操作、元件、组件或其组合的可能性。
此外,为了方便描述彼此不同的特性功能,独立地例示了本文中描述的附图上的各组件,然而,并不意指各组件由单独的硬件或软件来实现。例如,可以组合这些组件中的任何两个或更多个以形成单个组件,并且任何单个组件可以被划分成多个组件。其中组件被组合和/或划分的实施方式将属于本文档的专利权的范围,只要它们不脱离本文档的实质即可。
在下文中,将参照附图更详细地说明本文档的优选实施方式。另外,在附图中,相同的附图标号用于相同的组件,并且将省略对相同组件的重复描述。
本文档涉及视频/图像编码。例如,本文档中公开的方法/示例可以涉及VVC(通用视频编码)标准(ITU-T Rec.H.266)、VVC之后的下一代视频/图像编码标准、或者其它视频编码相关标准(例如,HEVC(高效视频编码)标准(ITU-T Rec.H.265)、EVC(基本视频编码)标准、AVS2标准等)。
在本文档中,可以提供与视频/图像编码相关的各种实施方式,并且除非相反地指定,否则这些实施方式可以彼此组合并执行。
在本文档中,视频可以是指一段时间内一系列图像的集合。通常,图片是指表示特定时间区域的图像的单元,而条带/贴片是构成图片的一部分的单元。条带/贴片可包括一个或更多个编码树单元(CTU)。一幅图片可以由一个或更多个条带/贴片组成。一幅图片可以由一个或多个贴片组组成。一个贴片组可以包括一个或更多个贴片。
像素或图元(pel)可以是指构成一幅图片(或图像)的最小单元。另外,“样本”可用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。另选地,样本可以意指空间域中的像素值,或者当该像素值被转换为频域时,其可以意指频域中的变换系数。
单元可以表示图像处理的基本单位。单元可以包括特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。根据情况,可以将单元和诸如块、区域等这样的术语互换地使用。在通常情况下,M×N块可以包括由M列和N行组成的样本(或样本阵列)或变换系数的集(或阵列)。
在本文档中,术语“/”和“,”应该被解释为指示“和/或”。例如,表述“A/B”可以意指“A和/或B”。另外,“A、B”可以意指“A和/或B”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。另外,“A/B/C”可以意指“A、B和/或C中的至少一个”。
另外,在该文档中,术语“或”应该被解释为指示“和/或”。例如,表述“A或B”可以包括1)仅A、2)仅B和/或3)A和B二者。换句话说,本文档中的术语“或”应该被解释为指示“附加地或另选地”。
图1示意性地表示可以应用本文档的视频/图像编码系统的示例。
参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式将编码后的视频/图像信息或数据传递到接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,并且解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获得视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板计算机和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以被生成相关数据的处理取代。
编码设备可以对输入视频/图像进行编码。编码设备可以执行诸如针对压缩和编码效率的预测、变换和量化这样的一系列过程。编码后的数据(编码后的视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式将以比特流的形式输出的编码后的视频/图像信息或数据发送到接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并且将接收/提取的比特流发送到解码设备。
解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换、预测等这样的一系列过程来解码视频/图像。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
图2是示意性地描述可以应用本文档的视频/图像编码设备的配置的图。在下文中,所谓的视频编码设备可以包括图像编码设备。
参照图2,编码设备200可以包括图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234、逆变换器235。残差处理器230可以进一步包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,以上描述的图像划分器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由一个或更多个硬件组件(例如,编码器芯片组或处理器)构成。此外,存储器270可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件可以进一步包括作为内部/外部组件的存储器270。
图像划分器210可以将输入到编码设备200的输入图像(或图片或帧)划分为一个或更多个处理单元。作为一个示例,处理单元可以被称为编码单元(CU)。在这种情况下,从编码树单元(CTU)或最大编码单元(LCU)开始,可以根据四叉树二叉树三叉树(QTBTTT)结构来递归地划分编码单元。例如,基于四叉树结构、二叉树结构和/或三叉树结构,一个编码单元可以被划分为深度较深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,并且可以稍后应用二叉树结构和/或三叉树结构。另选地,可以首先应用二叉树结构。可以基于未进一步划分的最终编码单元来执行根据本文档的编码过程。在这种情况下,基于根据图像特性的编码效率,最大编码单元可以直接用作最终编码单元。另选地,可以根据需要将编码单元递归地划分为更深的深度的编码单元,由此可以将最佳大小的编码单元用作最终编码单元。这里,编码过程可以包括诸如预测、变换和重构之类的过程,其将在后面描述。作为另一示例,处理单元可以进一步包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可以与上述最终编码单元分开或划分开。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
根据情况,可以使用单元和诸如块、区域等之类的术语来代替彼此。在通常情况下,M×N块可以表示由M列和N行构成的样本或变换系数的集。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可用作与一幅图片(或图像)的像素或图元(pel)相对应的术语。
减法器231从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如图所示,编码设备200中的从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以被称为减法器231。预测器可以对处理目标块(下文称为“当前块”)执行预测,并且可以生成包括当前块的预测样本的预测块。预测器可以确定是以当前块或CU为基础应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所讨论的,预测器可以生成与预测有关的各种信息(例如,预测模式信息),并将所生成的信息发送到熵编码器240。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33种定向预测模式或65种定向预测模式。然而,这仅仅是示例,并且根据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于参考图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可以彼此相同或彼此不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表,并且生成指示哪个候选被用于推导当前块的运动向量和/或参考图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳变模式和合并模式的情况下,帧间预测器221可以使用邻近块的运动信息作为当前块的运动信息。在跳变模式下,与合并模式不同,不能发送残差信号。在运动信息预测(运动向量预测、MVP)模式的情况下,邻近块的运动向量可以被用作运动向量预测符,并且可以通过发信号通知运动向量差来指示当前块的运动向量。
预测器220可以基于各种预测方法来生成预测信号。例如,预测器可以将帧内预测或帧间预测应用于对一个块的预测,并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以基于块内复制(IBC)预测模式或调色板模式,以便对块执行预测。IBC预测模式或调色板模式可以被用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。尽管IBC基本上在当前块中执行预测,但是其执行方式与帧间预测的相似之处在于,它推导当前块中的参考块。即,IBC可以使用本文档中描述的帧间预测技术中的至少一种。
通过帧间预测器221和/或帧内预测器222生成的预测信号可以被用于生成重构信号或者生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、Karhunen-Loève变换(KLT)、基于图的变换(GBT)或有条件非线性变换(CNT)中的至少一种。这里,GBT意指当用曲线图表示像素之间的关系信息时从曲线图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而获得的变换。另外,变换处理可以被应用于大小相同的正方形像素块,或者可以应用于大小可变的块而非正方形的块。
量化器233可以对变换系数进行量化并且将它们发送到熵编码器240,并且熵编码器240可以对量化后的信号(关于量化变换系数的信息)进行编码并且输出比特流中的编码后的信号。关于量化变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将块类型的量化变换系数重新布置成一维向量形式,并且基于一维向量形式的量化变换系数来生成关于量化变换系数的信息。熵编码器240可以执行诸如例如指数哥伦布(exponential Golomb)、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等这样的各种编码方法。熵编码器240可以对除了量化变换系数(例如,语法元素的值等)之外的视频/图像重构所需的信息一起或分别进行编码。编码后的信息(例如,编码后的视频/图像信息)可以以比特流的形式在网络抽象层(NAL)的单元基础上进行发送或存储。视频/图像信息还可以包括关于诸如适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)等这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。在本文档中,从编码设备发送到/发信号通知给解码设备的信息和/或语法元素可以被包括在视频/图像信息中。视频/图像信息可以通过上述编码过程进行编码并且被包括在比特流中。可以通过网络传输比特流,或者将其存储在数字存储介质中。这里,网络可以包括广播网络、通信网络和/或类似物,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等这样的各种存储介质。发送从熵编码器240输出的信号的发送器(未示出)或存储其的存储器(未示出)可以被配置为编码设备200的内部/外部元件,或者发送器可以被包括在熵编码器240中。
从量化器233输出的量化变换系数可以被用于生成预测信号。例如,通过利用解量化器234和逆变换器235向量化变换系数应用解量化和逆变换,可以重构残差信号(残差块或残差样本)。加法器155将重构后的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,使得可以生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时,可以将预测块用作重构块。加法器250可以被称为重构器或重构块生成器。所生成的重构信号可以被用于当前块中的下一处理目标块的帧内预测,并且如随后描述的,可以被用于通过滤波进行的下一图片的帧间预测。
此外,在图片编码和/或重构处理中,可以应用具有色度缩放的亮度映射(LMCS)。
滤波器260可以通过向重构信号应用滤波来改善主观/客观视频质量。例如,滤波器260可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且可以将修改后的重构图片存储在存储器270中,尤其是存储在存储器270的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。如随后在对每种滤波方法的描述中所讨论的,滤波器260可以生成与滤波相关的各种信息,并且将所生成的信息发送到熵编码器240。关于滤波的信息可以在熵编码器240中被编码并且以比特流的形式被输出。
已发送到存储器270的修改后的重构图片可以被用作帧间预测器221中的参考图片。据此,编码设备可以避免在应用帧间预测时编码设备100和解码设备中的预测失配,并且还可以提高编码效率。
存储器270DPB可以存储修改后的重构图片,以便使用它作为帧间预测器221中的参考图片。存储器270可以存储从中已推导(或编码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器221,以被用作邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且将它们发送到帧内预测器222。
图3是示意性地描述可以应用本文档的视频/图像解码设备的配置的图。
参照图3,视频解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括解量化器321和逆变换器322。根据实施方式,上面已描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由一个或更多个硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),并且可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码设备300可以与据此已在图2的编码设备中处理视频/图像信息的处理对应地重构图像。例如,解码设备300可以基于与从比特流获得的与块分割相关的信息来推导单元/块。解码设备300可以通过使用在编码设备中应用的处理单元来执行解码。因此,解码的处理单元可以是例如编码单元,可以用编码树单元或最大编码单元顺着四叉树结构、二叉树结构和/或三叉树结构对其进行分割。可以用编码单元推导一个或更多个变换单元。并且,可以通过再现器来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以以比特流的形式接收从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以对比特流进行解析,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)、视频参数集(VPS)等这样的各种参数集的信息。另外,视频/图像信息还可以包括常规约束信息。解码设备可以进一步基于关于参数集的信息和/或常规约束信息对图片进行解码。在本文档中,随后将描述的发信号通知/接收的信息和/或语法元素可以通过解码过程被解码并且从比特流中获得。例如,熵解码器310可以基于诸如指数哥伦布编码、CAVLC、CABAC等这样的编码方法对比特流中的信息进行解码,并且可以输出图像重构所需的语法元素的值和关于残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的各语法元素对应的bin,使用解码目标语法元素信息以及邻近和解码目标块的解码信息或者在先前步骤中解码的符号/bin的信息来确定上下文模型,根据所确定的上下文模型来预测bin生成概率并且对bin执行算术解码以生成与每个语法元素值对应的符号。这里,CABAC熵解码方法可以在确定上下文模型之后使用针对下一个符号/bin的上下文模型解码的符号/bin的信息来更新上下文模型。在熵解码器310中解码的信息当中的关于预测的信息可以被提供到预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中已对其执行了熵解码的残差值(即,量化变换系数)和关联的参数信息可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,在熵解码器310中解码的信息当中的关于滤波的信息可以被提供到滤波器350。此外,接收从编码设备输出的信号的接收器(未示出)还可以将解码设备300构成为内部/外部元件,并且接收器可以是熵解码器310的组件。此外,根据本文档的解码设备可以被称为视频/图像/图片编码设备,并且解码设备可以被分为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
解量化器321可以通过对量化变换系数进行解量化来输出变换系数。解量化器321可以将量化变换系数重新布置为二维块的形式。在这种情况下,可以基于已在编码设备中执行的系数扫描的顺序来执行重新布置。解量化器321可以使用量化参数(例如,量化步长信息)对量化变换系数执行解量化,并且获得变换系数。
逆变换器322通过对变换系数进行逆变换来获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测,并且生成包括针对当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且具体地可以确定帧内/帧间预测模式。
预测器可以基于各种预测方法来生成预测信号。例如,预测器可以将帧内预测或帧间预测应用于对一个块的预测,并且也可以同时应用帧内预测和帧间预测。这可以被称为组合的帧间和帧内预测(CIIP)。另外,预测器可以针对块的预测执行块内复制(IBC)。块内复制可以被用于诸如屏幕内容编码(SCC)这样的游戏等的内容图像/视频编码。尽管IBC基本上在当前块中执行预测,但是其执行方式与帧间预测的相似之处在于,它推导当前块中的参考块。即,IBC可以使用本文档中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考样本可以位于当前块的附近或与当前块分开。在帧内预测中,预测模式可以包括多种非定向模式和多种定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参考图片上的运动向量所指定的参考块(参考样本阵列)来推导针对当前块的预测块。此时,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为基础来预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括当前图片中存在的空间邻近块和参考图片中存在的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表,并且基于接收到的候选选择信息来推导当前块的运动向量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器330输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。当如在应用跳变模式的情况下一样没有针对处理目标块的残差时,可以将预测块用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以被用于当前块中的下一处理目标块的帧内预测,并且如随后描述的,可以通过滤波来输出或者被用于下一图片的帧间预测。
此外,在图片解码处理中,可以应用具有色度缩放的亮度映射(LMCS)。
滤波器350可以通过向重构后的信号应用滤波来改善主观/客观视频质量。例如,滤波器350可以通过向重构图片应用各种滤波方法来生成修改后的重构图片,并且可以将修改后的重构图片发送到存储器360中,尤其是发送到存储器360的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环形滤波器、双边滤波器等。
已存储在存储器360的DPB中的(修改后的)重构图片可以被用作帧间预测器331中的参考图片。存储器360可以存储从中已推导(或解码了)运动信息的当前图片中的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被发送到帧间预测器331,以被用作邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中的重构块的重构样本,并且将它们发送到帧内预测器332。
在本说明书中,在解码设备300的预测器330、解量化器321、逆变换器322和滤波器350中描述的示例可以分别类似地或对应地应用于编码设备200的预测器220、解量化器234、逆变换器235和滤波器260。
如上所述,执行预测,以便提高执行视频编码时的压缩效率。据此,可以生成包括针对作为编码目标块的当前块的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。可以在编码设备和解码设备中相同地推导预测块,并且编码设备可以通过向解码设备发信号通知并非原始块本身的原始样本值而是关于原始块与预测块之间的残差的信息(残差信息)来提高图像编码效率。解码设备可以基于残差信息来推导包括残差样本的残差块,通过将残差块与预测块相加来生成包括重构样本的重构块,并且生成包括重构块的重构图片。
可以通过变换过程和量化过程来生成残差信息。例如,编码设备可以推导原始块与预测块之间的残差块,通过对残差块中所包括的残差样本(残差样本阵列)执行变换过程来推导变换系数,并且通过对变换系数执行量化过程来推导量化变换系数,使得它可以(通过比特流)向解码设备发信号通知关联的残差信息。这里,残差信息可以包括量化变换系数的值信息、位置信息、变换技术、变换核、量化参数等。解码设备可以基于残差信息来执行量化/解量化过程并且推导残差样本(或残差样本块)。解码设备可以基于预测块和残差块来生成重构块。编码设备可以通过对量化变换系数进行解量化/逆变换来推导残差块以便作为下一个图片的帧间预测的参考,并且可以基于此来生成重构图片。
图4示意性地表示根据本公开的多变换技术。
参照图4,变换器可以对应于前述图2的编码设备中的变换器,并且逆变换器可以对应于前述图2的编码设备中的逆变换器、或者图3的解码设备中的逆变换器。
变换器可以通过基于残差块中的残差样本(残差样本阵列)执行一次变换来推导(一次)变换系数(S410)。该一次变换可以被称为核心变换。在本文中,一次变换可以基于多变换选择(MTS),并且当将多变换用作一次变换时,可以将其称为多核心变换。
多核心变换可以表示附加地使用离散余弦变换(DCT)类型2和离散正弦变换(DST)类型7、DCT类型8和/或DST类型1进行变换的方法。也就是说,多核心变换可以表示基于从DCT类型2、DST类型7、DCT类型8和DST类型1当中选择的多个变换核将空间域的残差信号(或残差块)变换为频域的变换系数(或一次变换系数)的变换方法。在本文中,从变换器的视角来看一次变换系数可以称为临时变换系数。
换句话说,当应用常规变换方法时,可以通过基于DCT类型2对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数。与此不同,当应用多核心变换时,可以通过基于DCT类型2、DST类型7、DCT类型8和/或DST类型1对残差信号(或残差块)应用从空间域到频率域的变换来生成变换系数(或一次变换系数)。在本文中,DCT类型2、DST类型7、DCT类型8和DST类型1可以被称为变换类型、变换核或变换核心。
作为参考,可以基于基函数来限定DCT/DST变换类型,并且基函数可以如下表所示。
[表1]
如果执行多核心变换,则可以从变换核当中选择用于目标块的垂直变换核心和水平变换核心,可以基于垂直变换核对目标块执行垂直变换,并且可以基于水平变换核对目标块执行水平变换。这里,水平变换可以表示针对目标块的水平分量的变换,并且垂直变换可以表示针对目标块的垂直分量的变换。可以基于包括残差块的目标块(CU或子块)的预测模式和/或变换索引来适应性地确定垂直变换核心/水平变换核心。
变换器可以通过基于(一次)变换系数执行二次变换来推导修改的(二次)变换系数(S420)。一次变换是从空间域到频域的变换,而二次变换是指通过使用(一次)变换系数之间存在的相关性,变换为更具压缩性的表示。二次变换可以包括不可分离的变换。在这种情况下,二次变换可以称为不可分离的二次变换(NSST)或模式相关的不可分离的二次变换(MDNSST)。不可分离的二次变换可表示这样的变换,其通过基于不可分离的变换矩阵对通过一次变换推导出的(一次)变换系数进行二次变换来生成针对残差信号的修改的变换系数(或二次变换系数)。此时,垂直变换和水平变换可以不单独应用于(一次)变换系数(或者水平变换和垂直变换可以不独立应用),但是可以基于不可分离的变换一次地应用变换矩阵。换句话说,不可分离的二次变换可以表示这样的变换方法,其中,(一次)变换系数的垂直分量和水平分量不分离,并且例如,将二维信号(变换系数)通过某个确定的方向(例如,行第一方向或列第一方向)重新布置为一维信号,然后基于不可分离的变换矩阵生成修改的变换系数(或二次变换系数)。不可分离的二次变换可以应用于配置有(一次)变换系数的块(在下文中,可以称为变换系数块)的左上区域。例如,如果变换系数块的宽度(W)和高度(H)均等于或大于8,则可以将8×8不可分离的二次变换应用于变换系数块的左上8×8区域。此外,如果变换系数块的宽度(W)和高度(H)均等于或大于4,并且变换系数块的宽度(W)或高度(H)小于8,那么可以将4×4不可分离的二次变换应用于变换系数块的左上min(8,W)×min(8,H)区域。然而,实施方式不限于此,并且例如,即使仅满足变换系数块的宽度(W)或高度(H)等于或大于4的条件,4×4不可分离的二次变换也可以应用于变换系数块的左上min(8,W)×min(8,H)区域。
具体地,例如,如果使用4×4输入块,则不可分离的二次变换可以如下执行。
4×4输入块X可以表示如下。
[式1]
如果X以向量的形式表示,则向量可以如下表示。
[式2]
在这种情况下,可以如下计算不可分离的二次变换。
[式3]
其中,表示变换系数向量,而T表示16×16(不可分离的)变换矩阵。
通过前述式3,可以推导16×1变换系数向量并且可以通过扫描顺序(水平、垂直和对角线等)将向量重新组织为4×4块。然而,上述计算是示例,并且超立方体-吉文斯变换(HyGT)等也可以用于不可分离的二次变换的计算,以便降低不可分离的二次变换的计算复杂度。
此外,在不可分离的二次变换中,可以将变换核(或变换核心、变换类型)选择为模式相关。在这种情况下,模式可以包括帧内预测模式和/或帧间预测模式。
如上所述,可以基于以变换系数块的宽度(W)和高度(H)为基础确定的8×8变换或4×4变换来执行不可分离的二次变换。此时,为了选择模式相关的变换核,可以为8×8变换和4×4变换二者配置用于不可分离的二次变换的3个不可分离的二次变换核的35个集。也就是说,可以将35个变换集配置为用于8×8变换,并且可以将35个变换集配置为用于4×4变换。在这种情况下,用于8×8变换的35个变换集中的每一个可以包括三个8×8变换核,并且在这种情况下,用于4×4变换的35个变换集中的每一个可以包括三个4×4变换核。然而,变换的大小、集的数量以及集中的变换核的数量是示例,并且可以使用除8×8或4×4之外的任何其它大小,或者可以配置n个集,并且每个集可以包括k个核。
变换集可以被称为NSST集,并且NSST集中的变换核可以被称为NSST核。例如,可以基于目标块(CU或子块)的帧内预测模式来执行来自变换集当中的特定集的选择。
为了参照,作为示例,帧内预测模式可以包括两个非定向(或非角度)帧内预测模式和65个定向(或角度)帧内预测模式。非定向帧内预测模式可以包括0号平面帧内预测模式和1号DC帧内预测模式,并且定向帧内预测模式可以包括在2号帧内预测模式与66号帧内预测模式之间的65个帧内预测模式。然而,这是示例,并且本公开可以应用于帧内预测模式的数量不同的情况。此外,根据情况,可以进一步使用67号帧内预测模式,并且67号帧内预测模式可以表示线性模型(LM)模式。
图5例示性地表示65个预测方向的帧内定向模式。
参照图5,基于具有左上对角线预测方向的34号帧内预测模式,可以对具有水平方向性的帧内预测模式和具有垂直方向性的帧内预测模式进行分类。图5的H和V分别是指水平方向性和垂直方向性,并且序号-32至32指示在样本网格位置上以1/32为单位的位移。这可以代表模式索引值的偏移。2号至33号帧内预测模式具有水平方向性,而34号至66号帧内预测模式具有垂直方向性。此外,严格来说,34号帧内预测模式可以被认为既不是水平的也不是垂直的,但是就确定二次变换的变换集而言,可以将其分类为属于水平方向性。这是因为输入数据被转置为用于基于34号帧内预测模式对称的垂直方向模式,并且用于水平模式的输入数据对齐方法被用于34号帧内预测模式。18号帧内预测模式和50号帧内预测模式可以分别表示水平帧内预测模式和垂直帧内预测模式,并且2号帧内预测模式可以被称为右上对角线帧内预测模式,因为它有左参考像素,并且在右上方向上预测。以相同的方式,34号帧内预测模式可以被称为右下对角线帧内预测模式,而第66号帧内预测模式可以被称为左下对角线帧内预测模式。
在这种情况下,例如,35个变换集与帧内预测模式之间的映射可以如下表所示。作为参考,如果将LM模式应用于目标块,则可以不将二次变换应用于目标块。
[表2]
此外,如果确定要使用特定集,则可以通过不可分离的二次变换索引来选择特定集中的k个变换核之一。编码设备可以基于率失真(RD)校验来推导指示特定变换核的不可分离的二次变换索引,并且可以将不可分离的二次变换索引发信号通知给解码设备。解码设备可以基于不可分离的二次变换索引从特定集中的k个变换核当中选择一个。例如,NSST索引值0可以指示第一不可分离的二级变换核,NSST索引值1可以指示第二不可分离的二次变换核,NSST索引值2可以指示第三不可分离的二次变换核。另选地,NSST索引值0可以指示第一不可分离的二次变换没有被应用于目标块,并且NSST索引值1至3可以指示三个变换核。
返回参照图4,变换器可以基于所选择的变换核来执行不可分离的二次变换,并且可以获得修改的(二次)变换系数。如上所述,修改的变换系数可以被推导为通过量化器量化的变换系数,并且可以被编码并发信号通知给解码设备,并且被传送到编码设备中的解量化器/逆变换器。
此外,如上所述,如果省略了二次变换,则可以将作为一次(可分离的)变换的输出的(一次)变换系数推导为如上所述通过量化器量化的变换系数,并且可以被编码并发信号通知给解码设备,并传送到编码设备中的解量化器/逆变换器。
逆变换器可以与在上述变换器中已经执行的顺序相反的顺序执行一系列过程。逆变换器可以接收(解量化的)变换系数,并且通过执行二次(逆)变换来推导(一次)变换系数(S450),并且可以通过对(一次)变换系数执行一次(逆)变换来获得残差块(残差样本)。就此而言,从逆变换器的视角来看,一次变换系数可以被称为修改的变换系数。如上所述,编码设备和解码设备可以基于残差块和预测块来生成重构块,并且可以基于重构块来生成重构图片。
此外,如上所述,如果省略二次(逆)变换,则可以接收(解量化的)变换系数,可以执行一次(可分离的)逆变换,并且可以获得残差块(残差样本)。如上所述,编码设备和解码设备可以基于残差块和预测块来生成重构块,并且可以基于重构块来生成重构图片。
此外,在本公开中,可以在NSST的概念中应用其中减小了变换矩阵(核)的大小的缩减二次变换(RST),以便减少不可分离的二次变换所需的计算量和存储量。
此外,本公开中描述的变换核、变换矩阵以及构成变换核矩阵的系数,即,核系数或矩阵系数,可以以8比特来表示。这可以是在解码设备和编码设备中实现的条件,并且与现有的9比特或10比特相比,可以减少存储变换核所需的存储量,并且可以合理地适应性能劣化。另外,以8比特表示核矩阵可以允许使用小的乘法器,并且可以更适合于用于最佳软件实现的单指令多数据(SIMD)指令。
在本说明书中,术语“RST”可以是指基于大小根据缩减因子而减小的变换矩阵来对目标块的残差样本执行的变换。在执行缩减变换的情况下,由于变换矩阵的大小的减小,可以减少变换所需的计算量。也就是说,RST可以用于解决在大小大的块的变换或不可分离的变换时发生的计算复杂性问题。
RST可以被称为诸如缩减变换、缩减二次变换、缩小变换、简化变换和简单变换等之类的各种术语,并且RST可以被称为的名称不限于所列示例。另选地,由于RST主要在变换块中的包括非零系数的低频区域中执行,因此它可以被称为低频不可分离的变换(LFNST)。
此外,当基于RST执行二次逆变换时,编码设备200的逆变换器235和解码设备300的逆变换器322可以包括逆缩减二次变换器,其基于变换系数的逆RST而推导修改的变换系数;以及逆一次变换器,其基于修改的变换系数的逆一次变换来推导目标块的残差样本。逆一次变换是指应用于残差的一次变换的逆变换。
图6是用于说明根据本公开的示例的RST的图。
在本说明书中,术语“目标块”可以指在其上执行编码的当前块或残差块。
在根据示例的RST中,可以将N维向量映射到位于另一个空间中的R维向量,从而可以确定缩减变换矩阵,其中R小于N。N可以是指应用了变换的块的侧边的长度的平方,或与应用了变换的块相对应的变换系数的总数,并且缩减因子可以是指R/N值。缩减因子可以被称为缩减因子、缩小因子、简化因子、简单因子或其它各种术语。此外,R可以被称为缩减系数,但是根据情况,缩减因子可以是指R。此外,根据情况,缩减因子可以是指N/R值。
在示例中,可以通过比特流来用信号通知缩减因子或缩减系数,但是示例不限于此。例如,可以在编码设备200和解码设备300中的每一个中存储针对缩减因子或缩减系数的预定值,并且在这种情况下,可以不单独发信号通知缩减因子或缩减系数。
根据示例的缩减变换矩阵的大小可以是小于N×N(常规变换矩阵的大小)的R×N,并且可以如下面的式4所限定。
[式4]
图6的(a)中所示的缩减变换块中的矩阵T可以是指式4的矩阵TR×N。如图6的(a)所示,当将缩减变换矩阵TR×N乘以目标块的残差样本时,可以推导目标块的变换系数。
在示例中,如果应用了变换的块的大小是8×8并且R=16(即,R/N=16/64=1/4),则根据图6的(a)的RST可以被表示为以下式5所示的矩阵运算。在这种情况下,存储和乘法计算可以通过缩减因子缩减至大约1/4。
[式5]
在式5中,r1至r64可以表示目标块的残差样本。作为式5的计算的结果,可以推导目标块的变换系数ci,并且推导ci的过程可以如式6所示。
[式6]
作为式6的计算的结果,可以推导目标块的变换系数c1至cR。也就是说,当R=16时,可以推导目标块的变换系数c1至c16。如果应用常规变换而不是RST,并将64×64(N×N)大小的变换矩阵与64×1(N×1)大小的残差样本相乘,则因为应用了RST而针对目标块仅推导16(R)个变换系数,尽管针对目标块推导了64(N)个变换系数。由于用于目标块的变换系数的总数从N缩减到R,所以编码设备200向解码设备300发送的数据量减少,因此编码设备200与解码设备300之间的传输效率可以提高。
当从变换矩阵的大小的视角考虑时,常规变换矩阵的大小为64×64(N×N),但缩减变换矩阵的大小缩减为16×64(R×N),因此与执行常规变换的情况相比,执行RST的情况下的存储使用率可以减小R/N比率。另外,当与使用常规变换矩阵的情况下的乘法计算的数量N×N相比时,使用缩减变换矩阵可以将乘法计算的数量(R×N)减小R/N比率。
在示例中,编码设备200的变换器232可以通过对目标块的残差样本执行一次变换和基于RST的二次变换来推导目标块的变换系数。这些变换系数可以被传送到解码设备300的逆变换器,并且解码设备300的逆变换器322可以基于针对变换系数的逆缩减二次变换(RST)来推导修改的变换系数,并且可以基于针对修改的变换系数的逆一次变换来推导目标块的残差样本。
根据示例的逆RST矩阵TN×R的大小为比常规逆变换矩阵N×N的大小小的N×R,并且与式4中所示的缩减变换矩阵TR×N具有转置关系。
图6的(b)所示的缩减逆变换块中的矩阵Tt可以是指逆RST矩阵TN×R T(上标T是指转置)。如图6的(b)所示,当将逆RST矩阵TN×R T乘以目标块的变换系数时,可以推导目标块的修改的变换系数或目标块的残差样本。
更具体地,当逆RST被用作二次逆变换时,当逆RST矩阵TN×R T被乘以目标块的变换系数时,可以推导目标块的修改的变换系数。此外,可以将逆RST用作逆一次变换,并且在这种情况下,当将逆RST矩阵TN×R T与目标块的变换系数相乘时,可以推导目标块的残差样本。
在示例中,如果应用逆变换的块的大小是8×8并且R=16(即,R/N=16/64=1/4),则根据图6的(b)的RST可以被表示为以下式7所示的矩阵运算。
[式7]
在式7中,c1至c16可以表示目标块的变换系数。作为式7的计算的结果,可以推导表示目标块的修改的变换系数或目标块的残差样本的rj,并且推导rj的过程可以如式8所示。
[式8]
作为式8的计算的结果,可以推导表示目标块的修改的变换系数或目标块的残差样本的r1至rN。从逆变换矩阵的大小的视角考虑,常规逆变换矩阵的大小为64×64(N×N),但逆缩减变换矩阵的大小缩减为64×16(R×N),因此与执行常规逆变换的情况相比,执行逆RST的情况下的存储使用率可以减小R/N比率。另外,当与使用常规逆变换矩阵的情况下的乘法计算的数量N×N相比时,使用逆缩减变换矩阵可以将乘法计算的数量(N×R)减少R/N比率。
图7是示出根据本公开的示例的逆RST处理的流程图。
图7中公开的每个步骤都由图3中公开的解码设备300来执行。更具体地,可以由图3公开的解量化器321执行S700,并且S710和S720可以由图3中公开的逆变换器322来执行。因此,对与上述图3所述的内容重复的特定内容的说明将被省略或简述。此外,在本公开中,RST可以被应用于正向变换,并且逆RST可以是指被应用于反向的变换。
在示例中,根据逆RST的特定操作与根据RST的特定操作不同之处可以仅在于它们的操作顺序彼此相反,并且根据逆RST的特定操作可以基本上是类似于根据RST的特定操作。因此,本领域技术人员将容易理解,以下描述的用于逆RST的S700至S720的描述可以以相同或相似的方式应用于RST。
根据示例的解码设备300可以通过对目标块的量化变换系数执行解量化来推导变换系数(S700)。
根据示例的解码设备300可以选择变换核(S710)。更具体地,解码设备300可以基于关于变换索引、应用了变换的区域的宽度和高度、在图像解码中使用的帧内预测模式、以及目标块的颜色分量的信息中的至少一项来选择变换核。然而,示例不限于此,例如,可以预先定义变换核,并且可以不发信号通知用于选择变换核的单独信息。
在一个示例中,可以通过CIdx指示关于目标块的颜色分量的信息。如果目标块是亮度块,则CIdx可以指示0,并且如果目标块是色度块(例如,Cb块或Cr块),则CIdx可以指示非零值(例如,1)。
根据示例的解码设备300可以基于选择的变换核和缩减因子将逆RST应用于变换系数(S720)。
图8是示出根据本公开的另一示例的逆RST的流程图。
图8公开的每个步骤可以由图3公开的解码设备300来执行图8的处理。更具体地,S800可以由图3公开的解量化器321来执行,S810至S860可以由图3公开的逆变换器322来执行。因此,对与上述图3所述的内容重复的特定内容的说明将被省略或简述。
在示例中,如上所述,根据逆RST的特定操作与根据RST的特定操作的不同之处可以仅在于它们的操作顺序彼此相反,并且根据逆RST的特定操作可以基本上类似于根据RST的特定操作。因此,本领域技术人员将容易理解,以下描述的用于逆RST的S800至S860的描述可以以相同或相似的方式应用于RST。
根据示例的解码设备300可以对目标块的量化系数执行解量化(S800)。如果已经由编码设备200执行了变换,则在S800中,解码设备300可以通过对目标块的量化变换系数执行解量化来推导目标块的变换系数。相反,如果编码设备200尚未执行变换,则在S800中,解码设备300可以通过对目标块的量化残差样本执行解量化来推导目标块的残差样本。
根据示例的解码设备300可以确定是否已经对编码设备200中的目标块的残差样本执行了变换(S810),并且当确定已经执行了变换时,解码设备可以解析变换索引(或从比特流中对其进行解码)(S820)。变换索引可以包括用于水平方向的变换的水平变换索引和用于垂直方向的变换的垂直变换索引。
在示例中,变换索引可以包括一次变换索引、核心变换索引和NSST索引等。变换索引可以被表示为,例如,Transform_idx,并且NSST索引可以被表示为,例如,NSST_idx。另外,水平变换索引可以被表示为Transform_idx_h,并且垂直变换索引可以被表示为Transform_idx_v。
此外,根据本公开的另一示例,可以在已经解析所有变换索引之后执行解量化。
在S810中确定编码设备200未对目标块的残差样本执行变换时,根据示例的解码设备300可省略根据S820至S860的操作。
根据示例的解码设备300可以基于关于变换索引、应用变换的区域的宽度和高度、图像解码中使用的帧内预测模式、以及目标块的颜色分量的信息中的至少一项来选择变换核(S830)。
根据示例的解码设备300可以确定其是否对应于用于对目标块的变换系数执行逆RST的条件(S840)。
在示例中,当逆RST应用于的区域的宽度和高度分别大于第一系数时,解码设备300可以确定其对应于用于对目标块的变换系数执行逆RST的条件。第一系数可以是4。
在另一示例中,当逆RST应用于的区域的宽度和高度的乘积大于第二系数并且逆RST应用于的区域的宽度和高度中的较小者大于第三系数时,解码设备300可以确定其对应于用于对目标块的变换系数执行逆RST的条件。第二系数和第三系数可以是预设值。
在又一示例中,当逆RST应用于的区域的宽度和高度分别小于或等于第四系数时,解码设备300可以确定其对应于用于对目标块的变换系数执行逆RST的条件。第四系数可以是8。
在又一示例中,当逆RST应用于的区域的宽度和高度的乘积小于或等于第五系数并且逆RST应用于的区域的宽度和高度中的较小者小于或等于第六系数时,解码设备300可以确定其对应于用于对目标块的变换系数执行逆RST的条件。第五系数和第六系数可以是预设值。
在又一示例中,当其中逆RST应用于的区域的宽度和高度大于第一系数的条件、其中逆RST应用于的区域的宽度和高度的乘积大于第二系数并且逆RST应用于的区域的宽度和高度中的较小者大于第三系数的条件、其中逆RST应用于的区域的宽度和高度小于或等于第四系数的条件、以及其中逆RST应用于的区域的宽度和高度的乘积小于或等于第五系数并且逆RST应用于的区域的宽度和高度中的较小者小于或等于第六系数的条件中的至少一个条件满足时,解码设备300可以确定其对应于用于对目标块的变换系数执行逆RST的条件。
在上述示例中,第一系数至第六系数可以是任何预定义的正整数。例如,第一系数至第六系数可以是4、8、16或32。
根据示例的逆RST可以被应用于目标块中包括的正方形区域(也就是说,当逆RST应用于的区域的宽度和高度是相同的长度时),并且在某些情况下,可以将逆RST应用于的区域的宽度和高度固定为预定义系数的值(例如,4、8、16、32等)。此外,逆RST应用于的区域不限于正方形区域,而是可以将逆RST应用于矩形区域或非矩形区域。在下面的图10中将提供对逆RST应用于的区域的更详细描述。
在示例中,可以基于变换索引来确定是否满足执行逆RST的条件。也就是时候,变换索引可以指示已经对目标块执行了哪个变换。
在S840中确定不满足用于执行逆RST的条件时,根据示例的解码设备300可以对目标块的变换系数执行(常规)逆变换(S850)。如上面的图4所述,(逆)变换可以包括但不限于例如DCT2、DCT4、DCT5、DCT7、DCT8、DST1、DST4、DST7、NSST和JEM-NSST(HyGT)等。
在S840中确定满足用于执行逆RST的条件时,根据示例的解码设备300可以对目标块的变换系数执行逆RST。
图9是示出根据本公开的示例的基于不可分离的二次变换的RST处理的流程图。
图9公开的每个步骤都由图3公开的解码设备300执行。更具体地,可以由图3公开的解量化器321来执行S900,并且可以由图3公开的逆变换器322来执行S910至S980。另外,图9的S900可以对应于图8的S800,图9的S940可以对应于图8的S830,并且图9的S950可以对应于图8的S840。因此,对与上面的图3至图8中描述的内容重复的特定内容的说明将被省略或简述。
在示例中,如上所述,根据逆RST的特定操作与根据RST的特定操作的不同之处可以仅在于它们的操作顺序彼此相反,并且根据逆操作的特定操作RST可以基本上类似于根据RST的特定操作。因此,本领域技术人员将容易理解,以下描述的逆RST的S900至S980的描述可以以相同或相似的方式应用于RST。
根据示例的解码设备300可以对目标块的量化系数执行解量化(S900)。
根据示例的解码设备300可以确定是否已经在编码设备200中对目标块的残差样本执行了NSST(S910),并且当确定已经执行了NSST时,解码设备可以解析NSST索引(或从比特流对其解码)(S920)。
根据示例的解码设备300可以确定NSST索引是否大于0(S930),并且当确定NSST索引大于0时,解码设备可以基于关于NSST索引、NSST被应用于的区域的宽度和高度、帧内预测模式、以及目标块的颜色分量的信息中的至少一项选择变换核(S940)。
根据示例的解码设备300可以确定其是否对应于用于对目标块的变换系数执行逆RST的条件(S950)。
在S950中确定不满足用于执行逆RST的条件时,根据示例的解码设备300可以对目标块的变换系数执行不基于逆RST的(常规)逆NSST(S960)。
在S950中确定满足用于执行逆RST的条件时,根据示例的解码设备300可以对目标块的变换系数执行基于逆RST的逆NSST(S970)。
在S910中确定编码设备200未对目标块的残差样本执行NSST时,根据示例的解码设备300可省略根据S920至S970的操作。
在S930中确定NSST索引不大于0时,根据示例的解码设备300可以省略根据S940至S970的操作。
根据示例的解码设备300可以对通过应用逆NSST推导的目标块的修改的变换系数执行逆一次变换(S980)。在对修改的变换系数执行逆一次变换时,可以推导目标块的残差样本。
图10是示出根据本公开的示例的应用RST的块的图。
参照图8,如上所述,目标块中的应用RST的区域不限于正方形区域,并且RST也可以应用于矩形区域或非矩形区域。
图10示出了将RST应用于大小为16×16的目标块1000中的非矩形区域的示例。图10中阴影的十个块1010指示目标块1000中应用了RST的区域。由于每个最小单元块的大小是4×4,因此根据图10的示例,RST被应用于十个4×4像素(也就是说,RST被应用于160个像素)。当R=16时,缩减变换矩阵的大小可以是16×160。
另一方面,本领域技术人员将容易地理解,图10所示的包括在应用RST的区域中的最小单元块1010的布置只是众多示例之一。例如,包括在应用RST的区域中的最小单元块可以彼此不相邻,并且可以处于它们彼此仅共享一个顶点的关系。
在下文中,将描述可应用于4×4块的RST或逆RST的设计、在应用4×4 RST之后生成的变换系数的布置和扫描顺序、以及用于指定要应用于变换块的4×4 RST的索引编码方法等。
更具体地,在下文中,提出了根据本公开的示例的可应用于4×4块的RST的设计方法、应用4×4 RST的区域的配置、布置在应用4×4 RST之后生成的变换系数的方法、布置的变换系数的扫描顺序、以及针对每个目标块生成的变换系数的排序和增加的方法。
此外,作为根据本公开的示例的编码指定应用于目标块的4×4 RST的索引的方法,提出了在应用4×4 RST时确定在不允许区域中是否存在非零变换系数并且对相应的索引进行条件编码的方法,或者在对最后一个非零变换系数位置进行编码之后省略针对不允许的位置的相关残差编码并且然后对相应的索引进行条件编码的方法。
另外,在下文中,根据本公开的示例,提出了在应用4×4 RST时对亮度和色度应用不同的索引编码和残差编码的方法。
通过此方法,与通过应用4×4 RST进行其它不可分离的二次变换相比,在对静止图像或视频进行编码时可以显著减少计算量。另外,基于在应用4×4 RST时在特定区域中没有有效的变换系数的事实,可以对指定4×4 RST的索引进行条件编码并可以优化相关的残差编码,这最终可以提高编码性能。
根据本公开的示例,可以应用于一个4×4变换块(即,要变换的4×4目标块)的不可分离的变换或RST是16×16变换。也就是说,如果构成4×4目标块的数据元素以行优先或列优先顺序布置,则它们变为16×1向量,并且不可分离的变换或RST可以应用于目标块。正向,也就是说,可以在编码设备中执行的正向16×16变换由十六个行方向变换基向量构成,并且当取16×1向量和每个变换基向量的内积时,获得相应的变换基向量的变换系数。获得十六个变换基向量的相应变换系数的过程与将16×16不可分离的变换或RST矩阵与输入的16×1向量相乘相同。通过矩阵乘法获得的变换系数具有16×1向量形式,并且每个变换系数的统计特性可能不同。例如,如果用第0个元素到第15个元素构造16×1变换系数向量,则第0个元素的方差可能大于第15个元素的方差。也就是说,由于更大的方差值,位于另一元素前面的一个元素可以具有更大的能量值。
此外,如果应用了16×16不可分离的变换或逆RST(当忽略了量化或整数计算的效果时),则可以从16×1变换系数重构变换之前的原始4×4目标块信号。如果正向16×16不可分离的变换是正交变换,则可以通过对正向16×16变换进行矩阵转置来获得16×16逆变换。将16×16不可分离的逆变换矩阵与16×1变换系数向量简单相乘即可得到16×1向量形式的数据,并且可以通过按首先应用的行优先或列优先顺序进行排列来重建4×4块信号。
此外,如上所述,构成16×1变换系数向量的元素可以具有不同的统计特性。与前面的示例一样,如果更靠近前侧(更靠近第0个元素)的变换系数具有更大的能量,则即使将逆变换应用于某些首先出现的变换系数,而不使用所有变换系数,也可以重构与原始信号非常接近的信号。例如,如果由16个列基向量构成16×16不可分离的逆变换,则通过仅保留L个列基向量,并仅保留在变换系数当中更重要的L个变换系数(L×1向量,如前面的示例中一样,首先出现),在构造16×L之后将16×L矩阵与L×1向量相乘,可以从原始输入的16×1向量数据中重构误差很小的16×1向量。结果,由于仅L个系数参与数据恢复,因此即使当获得变换系数时,获得L×1变换系数向量而不是16×1变换系数向量也是足够的。也就是说,通过从正向16×16不可分离的变换矩阵中选择L个相应的行方向变换向量,构造L×16变换矩阵,然后将其与16×1输入向量相乘,由此可以获得L个有效变换系数。
此时,尽管L值的范围为1≤L<16,并且通常,可以通过任何方法从16个变换基向量中选择L个变换基向量,但是从编码和解码的角度,就编码效率而言,选择在信号能量方面具有高度重要性的变换基向量可以是是有利的,如上述示例中所示。
如上所述,可以将4×4 RST用作二次变换,并且在这种情况下,可以将其二次应用于已经应用了诸如DCT类型2之类的一次变换的块。当假设应用一次变换的块的大小为N×N时,通常,当N×N大于或等于4×4时,可以应用4×4 RST。将4×4 RST应用于N×N块的示例如下。
1)4×4 RST可以仅应用于N×N中的某些区域,而非所有区域。例如,它可以仅应用于左上的M×M区域(M≤N)。
2)在将应用二次变换的区域划分为4×4块之后,可以将4×4 RST应用于每个划分的块。
3)可以将上述1)和2)混合并应用。例如,在将左上的M×M区域划分为4×4的块之后,可以将4×4的RST应用于划分的区域。
作为具体示例,可以仅将二次变换应用于左上8×8区域,并且当N×N块大于或等于8×8时,可以应用8×8 RST,而当N×N块比8×8小(4×4、8×4、4×8)时,可以像上面的2)一样将其划分为4×4块,然后可以应用4×4 RST。
假设在应用4×4 RST之后生成了L个变换系数(1≤L<16),则如何布置L个变换系数(也就是说,如何将变换系数映射到目标块)存在自由度。然而,由于当在残差编码部分中读取和处理变换系数时存在预定顺序,因此编码性能可以依据如何将L个变换系数布置到二维块中而变化。HEVC中的残差编码从距离DC位置最远的位置开始。这是通过利用如下事实来提高编码性能的:随着距DC位置的距离增加,量化系数值是0或接近于0。因此,对于L个变换系数,就编码性能而言,在残差编码的顺序中将具有较高能量的更重要的系数布置为在后面进行编码可以是有利的。
图11表示可以应用于在HEVC标准中应用的变换系数块(4×4块、系数组(CG))或4×4变换系数的三个正向扫描顺序。图11的(a)表示对角线扫描;图11的(b)表示水平扫描,并且图11的(c)表示垂直扫描。
残差编码遵循图11的扫描顺序的相反顺序,也就是说,以16到1的顺序执行编码。由于根据帧内预测模式选择图11的三个扫描顺序,因此其可以配置为使得根据帧内预测模式来同样确定用于L个变换系数的扫描顺序。
图12和图13是例示根据本公开的示例的根据对角线扫描顺序的变换系数的映射的图。
假设同样遵循图11的对角线扫描顺序,并且将左上的4×8块划分为4×4块,并且将4×4RST应用于每个划分的块,当L值为8时(也就是说,如果在16个变换系数中留下8个变换系数),变换系数可以如图12所示地定位,并且可以将变换系数映射到每个4×4块的区域的一半,而用X标记的位置可以填充默认为0的值。也就是说,基于正向对角线扫描顺序,将从基于RST执行的二次变换中得到的二次变换系数映射到4×4目标块中。
如上所述,根据逆RST的特定操作与根据RST的特定操作不同之处可以仅在于它们的操作顺序彼此相反,并且根据逆RST的特定操作可以基本上类似于RST的特定操作。因此,当执行逆RST时,可以通过根据对角线扫描顺序读取映射在目标块中的二次变换系数来利用变换核(式8)执行操作。
因此,在根据图11中所示的扫描顺序将L个变换系数布置或映射到每个4×4块并且将0映射到每个4×4块的剩余(16-L)位置之后,可以应用相应的残差编码(例如,常规HEVC中的残差编码)。
此外,根据本公开的另一示例,如图13所示,可以将布置在两个4×4块中的L个变换系数(a)组合并映射到一个4×4块(b)中。特别地,当L值为8时,将两个4×4块的变换系数映射到一个4×4块,并且一个4×4目标块被完全填充,因此在另一个4×4块中没有剩余任何变换系数。因此,由于大部分残差编码对于清空的4×4块而言是不必要的,因此在HEVC的情况下,相应的coded_sub_block_flag可以被编码为0。应用于HEVC和VVC的coded_sub_block_flag是用于指示当前变换块中用于16个变换系数等级的4×4阵列的子块的位置的标志信息,并且可以针对没有剩余残差的4×4块被发信号通知为“0”。
另外,用于混合两个4×4块的变换系数的各种方法是可能的。通常,它们可以以任何顺序组合,但是实际示例可以包括以下方法。
(1)以扫描顺序交替混合两个4×4块的变换系数。也就是说,当用于图12的上部块的变换系数12是并且下部块的变换系数是 时,系数可以按以下方式交替混合:当然,可以改变和的顺序,使得首先映射
(2)可以首先放置用于第一4×4块的变换系数,然后可以放置用于第二4×4块的变换系数。也就是说,它们可以如下连续地布置:当然,顺序可以改变如下:
在下文中,将描述编码用于4×4 RST的NSST索引的方法。第一种方法是在残差编码之后对NSST索引进行编码的情况,并且第二种方法是在残差编码之前对NSST索引进行编码的情况。
此外,如图12所示,当应用4×4 RST时,根据每个4×4块的变换系数扫描顺序,可以从第L+1个到第16个填充值0。因此,如果甚至在两个4×4块的一个中的第L+1个至第16个位置之间出现非零值,则其对应于不应用4×4 RST的情况。
如果4×4 RST具有选择并应用准备好的变换集(例如NSST)之一的结构,则可以发信号通知在其上应用变换的索引(可以称为变换索引、RST索引或NSST索引)。
假设如果通过解码设备中解析的比特流而知道NSST索引,则该解析处理在残差编码之后执行。如果执行残差编码并且发现在第L+1个至第16个之间存在至少一个非零变换系数,则如上所述确定未应用4×4 RST,因此可以将其设置为不解析NSST索引。因此,在这种情况下,仅在必要时才选择性地解析NSST索引,因此增加了信令效率。
例如,如在图12中,如果将4×4 RST应用于特定区域内的几个4×4块(所有相同的4×4 RST可以应用于所有,或者不同的4×4 RST可以应用),则应用于所有4×4块的(相同或不同)4×4 RST可以通过一个NSST索引来指定。由于用于所有4×4块的4×4 RST以及是否应用由一个NSST索引确定,因此可以配置为使得:通过在残差编码期间检查所有4×4块的从第L+1个到第16个的位置是否存在非零变换系数,当甚至一个4×4块中的不允许的位置(第从L+1个位置至第16个位置)中存在非零变换系数时,不对NSST索引进行编码。
可以单独为亮度(Luminance)块和色度(Chrominance)块发信号通知这些NSST索引,或者在色度块的情况下,可以为Cb和Cr发信号通知单独的NSST索引,或者通过仅发信号通知一次NSST索引来共享一个NSST索引。
如果针对Cb和Cr共享一个NSST索引,则可以应用由同一NSST索引指示的4×4 RST(用于Cb和Cr的4×4 RST可以相同,或者即使NSST索引相同,也可以应用单独的4×4 RST)。为了对共享的NSST索引应用上述条件信令,检查用于Cb和Cr的所有4×4块,从第L+1个到第16个是否存在非零变换系数,并且如果找到任何非零变换系数,则其可以配置为使得省略用于NSST索引的信令。
作为另一示例,同样在如图13所示将两个4×4块的变换系数组合的情况下,在检查当应用4×4 RST时在不存在有效变换系数的位置处是否出现非零变换系数之后,可以确定是否发信号通知NSST索引。特别地,在如图13中的L值是8并且针对应用4×4 RST时的一个4×4块(图13的(b)中由Xs指示的块)不存在有效变换系数的情况下,其可以设置为使得在没有有效变换系数的情况下在检查块的coded_sub_block_flag后,如果该值为1,则不发信号通知NSST索引。
稍后将在根据用于编码NSST索引的第二方法在残差编码之前执行用于NSST索引的编码的情况下描述用于NSST索引的信令的优化方法。
如果在残差编码之前执行用于NSST索引的编码,则预先确定是否应用4×4 RST,因此对于肯定要用零填充变换系数的位置可以省略残差编码。
在这方面,可以发信号通知NSST索引值,以便使其知道是否应用4×4 RST(例如,如果NSST索引为0,则不应用4×4 RST),或者通过单独的语法元素发信号通知它。例如,如果单独的语法元素是NSST标志,则首先解析NSST标志以确定是否应用了4×4 RST。然后,如果NSST标志值为1,则可以为不能存在有效变换系数的位置省略残差编码。
在HEVC的情况下,当执行残差编码时,首先对TU上的最后一个非零系数位置进行编码。如果在最后一个非零系数位置编码之后执行NSST索引的编码并且假设应用4×4 RST而最后一个非零系数的位置被标识为不能出现非零系数的位置,则NSST索引可能未编码并且4×4 RST可能未应用。例如,在图12中由Xs指示位置的情况下,由于当应用4×4 RST时不存在有效变换系数(例如,可以填充0的值),因此如果最后一个非零系数位于由X指示的区域中,则可以省略用于NSST索引的编码。如果最后一个非零系数不位于X指示的区域中,则可以执行用于NSST索引的编码。
如果已知是否在对最后一个非零系数位置进行编码之后通过有条件地对NSST索引进行编码来应用4×4 RST(如上所述,如果在假设应用4×4 RST时不允许最后一个非零系数的位置,则可以省略用于NSST索引的编码),可以通过以下两种方式处理之后的剩余的残差编码部分。
(1)在不应用4×4 RST的情况下,可以原样保持一般残差编码。也就是说,在从最后的非零系数位置到DC位置的任何位置可以存在非零变换系数的假设下执行编码。
(2)在应用4×4 RST的情况下,对于特定位置或特定4×4块(例如,图12中的X位置),不应存在相应的变换系数(其可以默认填充以零),使得可以省略相应位置或块的残差编码。例如,当到达图12中的由X所指示的位置时,可以省略对sig_coeff_flag(在应用于HEVC和VVC的相应位置处是否存在非零系数的标志)的编码,并且当如图13所示组合两个块的变换系数时,可以省略用于被清空为0的4×4块的coded_sub_block_flag(存在于HEVC中)的编码,并且可以将相应的值推导为0,并且可以在不单独编码的情况下用零值填充该4×4块。
另一方面,在对最后一个非零系数位置进行编码之后对NSST索引进行编码的情况下,如果最后一个非零系数的x-位置(Px)和y-位置(Py)分别小于Tx和Ty(特定阈值),其可以配置为使得省略NSST索引编码并且不应用4×4 RST。例如,当Tx=1且Ty=1时,这是指当最后一个非零系数存在于DC位置中时省略NSST索引编码。通过与阈值的比较来确定是否对NSST索引进行编码的方法可以不同地应用于亮度和色度。例如,可以将不同的Tx和Ty应用于亮度和色度,或者可以将阈值应用于亮度(或色度)而可以不将其应用于色度(或亮度)。
当然,省略NSST索引编码的两种方法(当最后一个非零系数位于不存在有效变换系数的区域时省略NSST索引编码的方法,以及当最后一个非零系数的X坐标和Y坐标各自小于某个阈值时省略NSST索引编码的方法)可以被应用。例如,在首先对最后的非零系数位置坐标执行阈值检查之后,可以检查最后的非零系数是否位于不存在有效变换系数的区域中,并且相反的顺序也是可能的。
在残差编码之前对NSST索引进行编码的方法可以应用于8×8 RST。也就是说,如果最后一个非零系数位于除左上4×4区域之外的左上8×8区域中,则可以省略用于NSST索引的编码,否则,可以执行用于NSST索引的编码。另外,如果用于最后一个非零系数位置的X坐标值和Y坐标值都小于某个阈值,则可以省略用于NSST索引的编码。当然,两种方法可以一起应用。
此外,当应用RST时,可以分别对亮度和色度应用不同的NSST索引编码和残差编码方案。
在残差编码之后执行NSST索引编码的第一方法(方法1)和在残差编码之前执行NSST索引编码的方法(方法2)可以不同地应用于亮度和色度。
例如,亮度可以遵循方法2中所述的方案,而方法1可以应用于色度。另选地,可以根据方法1或方法2将NSST索引编码有条件地应用于亮度,并且可以不将有条件的NSST索引编码应用于色度,反之亦然。也就是说,可以根据方法1或方法2有条件地将NSST索引编码应用于色度,并且可以不将有条件的NSST索引编码应用于亮度。
在下文中,本公开的示例将提供一种用于在应用NSST或RST的过程中应用各种NSST条件的混合NSST变换集(MNTS)以及构成MNTS的方法。在下文中,根据应用了NSST的变换块的大小,可以将应用于左上4×4区域的16×16变换表示为4×4 NSST,并且可以将应用于左上8×8区域的64×64变换表示为8×8 NSST。
如上所述,在不可分离的变换中,根据预先选择的下部块的大小,在4×4 NSST集的情况下,仅包括4×4核(4×4 NSST),并且在8×8 NSST集的情况下,仅包括8×8核(8×8NSST)。因此,在该示例中,如下附加地提出了构成MNTS的方法。
(1)可用的NSST核的大小可以不是固定的,而是依据NSST集而变化为一个或更多个(例如4×4 NSST核(4×4 NSST)和8×8 NSST核(8×8 NSST)可以一起使用)。
(2)可用的NSST核的数量可以不是固定的,而是依据NSST集而变化(例如,集1支持3个核,集2支持4个核)。
(3)NSST核的顺序可以不是固定的,而是依据NSST集而不同地限定。
(例如,在集1中,NSST核1、2和3分别映射到NSST索引1、2和3,而在集2中,NSST核3、2和1被映射到NSST索引1、2和3)
构成MNTS的方法的示例的更详细描述如下。
作为示例,当确定给定集中可用的NSST核的优先级时,可以考虑NSST核的大小(4×4 NSST相比8×8 NSST)及关系。例如,如果变换块很大,则8×8 NSST核可以比4×4 NSST核更重要,因此可以将较低的NSST索引分配给8×8 NSST核。
作为另一示例,可以在考虑NSST核的顺序(第一、第二、第三)的情况下确定在给定集中可用的NSST核的优先级。例如,给定的4×4 NSST第1核可以比4×4 NSST第2核具有更高的优先级。
由于NSST_index被编码和发送,因此希望将优先级给予频繁出现的NSST核,也就是说,以较少的比特数对其进行编码以具有低索引。
上述MNTS的示例可以在表3或表4中表示。
[表3]
[表4]
在下文中,根据本公开的示例,提出了一种在考虑帧内预测模式和块大小的情况下确定二次NSST集的方法。
在示例中,通过结合上述MNTS基于帧内预测模式构成当前变换块的集,可以将配置有具有各种大小的变换核的变换集应用于变换块。
[表5]
如表5所示,将0或1的混合类型映射到每个帧内预测模式。混合类型可以被限定为指示针对每个帧内预测模式是遵循常规的NSST集构造方法还是遵循另一种NSST集构造方法的索引(“混合类型”)。
更具体地,在其混合类型被映射为表5中的'1'的帧内预测模式的情况下,可以根据上述MNTS构造变换集,而无需遵循常规(JEM)NSST集构造方法。
作为又一示例,尽管表5作为一个示例示出了基于与帧内预测模式关联的混合类型信息(标记)的两种变换集构造方法(1:常规NSST集构造,2:基于MNTS的变换集构造)。然而提出的基于MNTS的集构造方法可以是一种或更多种,并且在这种情况下,混合类型信息可以由N(N>2)个各种值表示。
作为又一示例,当构造变换集时,同时考虑帧内预测模式和相应的变换块的大小,并且基于此,可以确定是否构造为混合类型或使用常规的NSST集。例如,如果与帧内预测模式相对应的模式类型是0,则可以无条件地遵循常规的NSST集配置方法,否则(模式类型==1),可以根据相应的变换块的大小确定各种混合类型的NSST集。
图14是例示根据本公开的示例的在考虑特定条件的情况下选择变换集的方法的图。
如图所示,当在执行系数的解量化之后执行二次逆变换时,选择变换集。此时,在选择变换集时,块的大小和帧内预测模式可以被考虑,而且可以考虑它是常规NSST集还是根据MNTS的变换集(多个混合类型1、2、3...)。
当以这种方式确定变换集时,可以通过NSST索引信息选择相应的NSST核。
根据本公开的另一示例,可以将下面表6所示的固定的NSST核映射同时用于4×4NSST和8×8 NSST。
[表6]
也就是说,4×4不可分离的变换(4×4二次变换、4×4 RST,4×4逆RST)和8×8不可分离的变换(8×8二次变换、8×8 RST,8×8逆RST)可以不使用不同的变换集,而是同一个变换集。
在下文中,在考虑帧内预测模式和块的大小来构造变换集的情况下,提出了高效地编码被编码和发送的NSST索引值的统计分布中的变化的方法。为此,其是通过使用指示上述提出的核大小的语法来选择基本上要应用于变换块的核的方法。
在本示例中,由于每个变换集的可用NSST核的数量不同,针对高效二值化方法,提出了根据可用于每个集的最大NSST索引值的截短一元二值化方法,如表7所示。
[表7]
表7示出了NSST索引值的(截短一元)二值化方法,并且由于针对每个变换集可用NSST核的数量不同,因此根据最大NSST索引值来执行NSST索引的二值化的方法。
在表7中,每个二进制值是上下文编码的,并且在这种情况下,可以在考虑诸如相应的变换块的大小、帧内预测模式、混合类型值、以及相应的变换集的最大NSST索引值之类的变量的情况下形成上下文建模值。
此外,根据本公开的另一示例,与表2不同,可以将五个或更多个帧内预测模式映射到一个变换集。如上所述,基于从包括多个变换核矩阵的变换集中选择的变换核矩阵来执行逆RST,并且根据应用于目标块的帧内预测模式基于映射关系来确定变换集。根据本示例,如下面的表8至表10所示,可以将包括目标块的帧内预测模式的多个帧内预测模式映射到一个变换集。也就是说,由于可以将帧内预测模式映射到一组变换矩阵的变换集,并且变换集的数量小于帧内预测模式的数量,所以可以将多个帧内预测模式映射到一个变换集。
也就是说,当目标块包括第一块和第二块,并且应用于第一块的第一帧内预测模式和应用于第二块的第二帧内预测模式彼此不同时,映射到第一帧内预测模式和第二帧内预测模式的变换集可以相同。
映射到一个变换集的帧内预测模式的数量可以是至少一个,并且可以将五个或更多个帧内预测模式映射到一个变换集。
[表8]
[表9]
[表10]
表8至表10中使用的NSST集索引可以是指表2中所示的35个变换集中的任何一个,并且表8中的变换集的数量是35个中的19个,表9中的变换集的数量是35个中的13个,而表10中的变换集的数量是35个中的6个。
这是指,如果在预测方向上具有相似性,则如在相邻的帧内预测模式中一样,可以应用相同的变换集,因此在表8的情况下,两个到三个相邻的帧内预测模式被映射到同一变换集。作为示例,在表8中,图5的帧内预测模式33至35被映射到同一变换集。
在表9的情况下,帧内预测模式46至48映射到一个变换集20,并且帧内预测模式29至39交替映射到变换集29和变换集10。
在应用了最少数量的变换集的表10的情况下,帧内预测模式28至40,即13个帧内预测模式,被映射到一个变换集32。
表8至表10的变换集可以仅应用于4×4 NSST,或者可以应用于4×4 NSST和8×8NSST二者。另选地,可以将不同的变换集映射应用于4×4 NSST和8×8 NSST中的每一个(即,表8至表10被不同地应用)。例如,表2的变换集映射可以应用于4×4 NSST,表8至表10的变换集映射可以应用于8×8 NSST。
如果使用表2(使用16×16直接矩阵二次变换)应用4×4 NSST的情况称为TESTA(测试A);使用表2应用4×4 NSST的情况以及使用表2和16×64直接矩阵二次变换应用8×8NSST的情况称为TEST B(测试B);并且针对存储缩减使用表8至表10应用4×4 NSST的情况和使用表8至表10和16×64直接矩阵二次变换应用8×8 NSST的情况称为TESTC(测试C),则存储要求如下表11所示。
[表11]
如果针对平面模式和DC模式的每个变换集是由两个变换核构成的,则表11的“#类型”列中的数量应减去2。例如,“具有提议的存储缩减核的测试B(6个变换集)的“#类型”将为16。如表11所示,随着要被映射的变换集数量的减小,变换内核的总数会显著减小。因此,可以通过在性能与复杂性之间进行合理的权衡来减少存储需求。在表11中,针对HyGT 4×4(BMS)、测试A(4×4 NSST)和测试B(4×4 NSST+8×8 RST),可以使用表2的变换集映射。
图15是示出根据本公开的示例的视频解码设备的操作的流程图。
图15公开的每个步骤由图3公开的解码设备300来执行。更具体地,S1510可以由图3公开的熵解码器310来执行;S1520可以由图3公开的解量化器321来执行;S1530和S1540可以由图3公开的逆变换器322来执行;并且S1550可以由图3公开的加法器340来执行。此外,根据S1510至S1550的操作基于图6至图10中描述的一些内容。因此,对与上面的图3、图6至图10描述的内容重复的特定内容的说明将被省略或简述。
根据示例的解码设备300可以从比特流推导目标块的量化变换系数(S1510)。更具体地,解码设备300可以从比特流中解码关于目标块的量化变换系数的信息,并且可以基于关于目标块的量化变换系数的信息来推导目标块的量化变换系数。关于目标块的量化变换系数的信息可以被包括在序列参数集(SPS)或条带头部中,并且可以包括关于是否应用缩减变换(RST)的信息、关于缩减因子的信息、关于应用了缩减变换的最小变换大小的信息、关于应用了缩减变换的最大变换大小的信息、以及关于应用了逆缩减变换大小的信息。
更具体地,可以通过可用标志来表示关于是否应用了缩减变换的信息;可以通过缩减因子值来表示缩减因子的信息;可以通过最小变换大小值来表示关于应用了逆缩减变换的最小变换大小的信息(即,在执行逆变换时允许的最小变换核大小);可以通过最大变换大小值来表示关于应用了逆缩减变换的最大变换大小的信息(即,在执行逆变换时所应用的最大变换核大小);并且可以通过逆缩减变换的大小值来表示关于基本上应用到逆变换的逆缩减变换的大小的信息(即,变换核的大小)。此时,可用标志可以通过第一语法元素发信号通知;缩减因子值可以通过第二语法元素发信号通知;最小变换大小值可以通过第三语法元素发信号通知;最大变换大小值可以通过第四语法元素发信号通知;并且逆缩减变换大小值可以通过第五语法元素发信号通知。
在示例中,第一语法元素可以由语法元素Reduced_transform_enabled_flag表示。当应用缩减变换时,语法元素Reduced_transform_enabled_flag指示1,而当未应用缩减变换时,语法元素Reduced_transform_enabled_flag可以指示0。当未发信号通知语法元素Reduced_transform_enabled_flag时,可以将语法元素Reduced_transform_enabled_flag的值估计为0。
另外,第二语法元素可以被表示为语法元素Reduced_transform_factor。语法元素Reduced_transform_factor可以指示R/N的值,其中N可以是指要应用变换的块的一侧的长度的平方,或者要应用变换的块中的变换系数的总数。R可以是指小于N的缩减系数。然而,示例不限于此,例如,Reduced_transform_factor可以指示R而不指示R/N。从逆缩减变换矩阵的视角考虑时,R是指逆缩减变换矩阵的列数,N是指逆缩减变换矩阵的行数。在这种情况下,逆缩减变换矩阵的列数应小于行数。R可以是,例如,8、16或32的值,但不限于此。当未发信号通知语法元素Reduced_transform_factor时,Reduced_transform_factor的值可以被估计为R/N(或R)。
此外,第三语法元素可以被表示为语法元素min_reduced_transform_size。当未发信号通知语法元素min_reduced_transform_size时,min_reduced_transform_size的值可以被估计为0。
另外,第四语法元素可以被表示为语法元素max_reduced_transform_size。当未发信号通知语法元素max_reduced_transform_size时,max_reduced_transform_size的值可以被估计为0。
另外,第五语法元素可以被表示为语法元素reduceed_transform_size。在被包括在语法元素reduce_transform_size中的同时被发信号通知的逆缩减变换的大小值可以表示缩减变换矩阵的大小,即,变换核,即,式4或式5中所示的缩减变换矩阵的大小,并且可以表示针对缩减变换而缩减的维数,但其不限于此。当未发信号通知语法元素reduce_transform_size时,reduce_transform_size的值可以被估计为0。
在下面的表12中示出了在SPS中包括发信号通知目标块的量化变换系数的信息的示例。
[表12]
根据示例的解码设备300可以通过对目标块的量化变换系数执行解量化来推导变换系数(S1520)。
根据示例的解码设备300可以基于变换系数的逆缩减二次变换(RST)来推导修改的变换系数(S1530)。
在示例中,可以基于逆缩减变换矩阵来执行逆缩减变换,并且逆缩减变换矩阵可以是其中列数小于行数的非正方形矩阵。
在示例中,S1530可以包括:解码变换索引;基于变换索引确定是否满足用于应用逆缩减变换的条件;选择变换核;以及当满足应用逆缩减变换的条件时,基于所选择的变换核和缩减因子将逆缩减变换应用于变换系数。在这种情况下,可以基于缩减因子来确定逆缩减变换矩阵的大小。
如果根据S1530的逆缩减变换基于逆NSST,则可以通过对目标块的变换系数执行逆缩减变换来推导目标块的修改的变换系数。
根据示例的解码设备300可以基于针对修改的变换系数的逆变换来推导目标块的残差样本(S1540)。
解码设备300可以对目标块的修改的变换系数执行逆一次变换。在这种情况下,可以将逆缩减变换用作逆一次变换,或者可以使用常规的可分离的变换。
根据示例的解码设备300可以基于目标块的残差样本和目标块的预测样本来生成重构样本(S1550)。
参照S1530,可以确认基于针对目标块的变换系数的逆缩减变换来推导目标块的残差样本。从逆变换矩阵的大小的视角考虑时,常规逆变换矩阵的大小为N×N,但是逆缩减变换矩阵的大小被缩减为N×R,因此与执行常规变换的情况相比,执行缩减变换的情况的存储使用量可以减少R/N比率。另外,当与使用常规的逆变换矩阵的情况下的乘法计算的数量N×N相比时,使用逆缩减变换矩阵可以将乘法计算的数量(N×R)减少R/N比率。另外,当应用逆缩减变换时,仅需要解码R个变换系数,因此,与在应用常规的逆变换时解码N个变换系数相比,目标块的变换系数的总数可以从N个减少到R,由此增加了解码效率。总之,根据S1530,可以通过逆缩减变换来增加解码设备300的(逆)变换效率和解码效率。
图16是示出根据本公开的示例的视频编码设备的操作的流程图。
图16公开的每个步骤可以由图2公开的编码设备200来执行。更具体地,S1610可以由图2公开的预测器220来执行;S1620可以由图2公开的减法器231来执行;S1630和S1640可以由图2公开的变换器232来执行;S1650可以由图2公开的量化器233和熵编码器240来执行。此外,根据S1610至S1650的操作是基于上述图6至图10中描述的一些内容。因此,对与在上面的图2、图6至图10中描述的内容重复的特定内容的说明将被省略或简述。
根据实施方式的编码设备200可以基于应用于目标块的帧内预测模式来推导预测样本(S1610)。
根据示例的编码设备200可以推导目标块的残差样本(S1620)。
根据示例的编码设备200可以基于针对残差样本的一次变换来推导目标块的变换系数(S1630)。可以通过多个变换核来执行一次变换,并且在这种情况下,可以基于帧内预测模式来选择变换核。
解码设备300可以对目标块的变换系数执行NSST,并且在这种情况下,可以基于缩减变换或者不基于缩减变换来执行NSST。如果基于缩减变换执行NSST,则其可以对应于根据S1640的操作。
根据示例的编码设备200可以基于针对变换系数的缩减变换(RST)来推导目标块的修改的变换系数(S1640)。在示例中,可以基于缩减变换矩阵来执行缩减变换,并且缩减变换矩阵可以是其中行数小于列数的非正方形矩阵。
在示例中,S1640可以包括:确定是否满足用于应用缩减变换的条件;基于该确定来生成和编码变换索引;选择变换核;以及当满足应用缩减变换的条件时,基于所选择的变换核和缩减因子来将缩减变换应用于残差样本。在这种情况下,可以基于缩减因子来确定缩减变换矩阵的大小。
根据示例的编码设备200可以通过执行基于目标块的修改的变换系数的量化来推导量化变换系数,并且对关于量化变换系数的信息进行编码(S1660)。
更具体地,编码设备200可以生成关于量化变换系数的信息,并且对关于生成的量化变换系数的信息进行编码。关于量化变换系数的信息可以包括残差信息。
在示例中,关于量化变换系数的信息可以包括以下信息中的至少一项:关于是否应用缩减变换的信息,关于缩减因子的信息,关于应用缩减变换的最小变换大小的信息,以及关于应用了缩减变换的最大变换大小的信息。
参照S1640,可以确认基于针对残差样本的缩减变换来推导目标块的变换系数。在从变换矩阵的大小的视角考虑时,常规变换矩阵的大小为N×N,但是缩减变换矩阵的大小缩减为R×N,因此与执行常规变换的情况相比,执行缩减变换的情况下的存储使用率可以减小R/N比率。另外,当与使用常规变换矩阵的情况下的乘法计算的数量N×N相比时,使用缩减变换矩阵可以使乘法计算的数量(R×N)减少R/N比率。另外,当应用缩减变换时,仅需要推导R个变换系数,因此,与当应用常规变换时推导的N个变换系数相比,目标块的变换系数的总数可以从N减少至R,由此减少了编码设备200向解码设备300发送的数据量。总之,根据S1640,可以通过缩减变换来增加编码设备200的变换效率和编码效率。
在上述实施方式中,借助于一系列步骤或方框基于流程图解释了方法,但是本公开不限于步骤的顺序,并且可以按与上述顺序或步骤不同的顺序或步骤来执行某一步骤,或某一步骤与其它步骤并发地执行。此外,本领域普通技术人员可以理解,流程图中所示的步骤不是排它的,并且在不影响本公开的范围的情况下,可以并入另一步骤或者可以删除流程图中的一个或更多个步骤。
根据本公开的上述方法可以被实现为软件形式,并且根据本公开的编码设备和/或解码设备可以被包括在诸如电视、计算机、智能手机、机顶盒和显示装置等之类的用于图像处理的设备中。
当本公开中的实施方式通过软件来实施时,上述方法可以被实施为用于执行上述功能的模块(步骤、功能等)。这些模块可以存储在存储器中并且可以由处理器执行。存储器可以在处理器内部或外部,并且可以以各种众所周知的方式连接到处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。也就是说,本公开中描述的实施方式可以在处理器、微处理器、控制器或芯片上实施和执行。例如,每个附图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实施和执行。
此外,应用本公开的解码设备和编码设备可以包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监控相机、视频聊天装置、实时通信装置(诸如视频通信)、移动流装置、存储介质、便携式摄像机、视频点播(VoD)服务提供装置、顶置(OTT)视频装置、互联网流服务提供装置、三维(3D)视频装置、视频电话视频装置、和医疗视频装置,并且可以用于处理视频信号或数据信号。例如,顶置(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入TV、家庭影院系统、智能电话、平板PC、数字视频记录仪(DVR)等。
另外,应用本公开的处理方法可以以由计算机执行的程序的形式来生产,并且可以存储在计算机可读记录介质中。具有根据本公开的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的各种存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。此外,计算机可读记录介质包括以载波(例如,互联网上的传输)形式实施的介质。另外,通过编码方法所生成的比特流可以存储在计算机可读记录介质中,或者通过有线或无线通信网络来传输。另外,本公开的实施方式可以通过程序代码被实施为计算机程序产品,并且程序代码可以按照本公开的实施方式在计算机上执行。程序代码可以存储在计算机可读载体上。
图17例示性地表示应用了本公开的内容流系统结构图。
此外,应用本公开的内容流系统可以大致包括编码服务器、流服务器、web服务器、媒体存储装置、用户设备和多媒体输入装置。
编码服务器用于将从诸如智能电话、相机、便携式摄像机等的多媒体输入装置输入的内容压缩成数字数据以生成比特流,并且向流服务器发送它。作为另一示例,在诸如智能电话、相机、便携式摄像机等的多媒体输入装置直接生成比特流的情况下,可以省略编码服务器。可以通过应用本公开的编码方法或比特流生成方法来生成比特流。并且流服务器可以在发送或接收比特流的过程期间临时存储比特流。
流服务器基于用户的请求通过web服务器向用户装置发送多媒体数据,web服务器用作向用户通知存在什么服务的的器具。当用户请求用户想要的服务时,web服务器将请求传送至流服务器,并且流服务器向用户发送多媒体数据。在此而言,内容流系统可以包括单独的控制服务器,并且在这种情况下,控制服务器用于控制内容流系统中的相应装置之间的命令/响应。
流服务器可以从媒体存储装置和/或编码服务器接收内容。例如,在从编码服务器接收内容的情况下,可以实时地接收内容。在这种情况下,为了平稳地提供流服务,流服务器可以存储比特流达预定时间。
例如,用户装置可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、板式PC、平板PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。内容流系统中的各个服务器可以作为分布式服务器操作,并且在这种情况下,由各个服务器接收到的数据可以用分布式方式进行处理。
Claims (10)
1.一种由解码设备执行的图像解码方法,该图像解码方法包括以下步骤:
从包括残差信息的比特流推导目标块的量化变换系数;
通过基于所述目标块的所述量化变换系数的解量化来推导变换系数;
基于针对所述变换系数的逆缩减二次变换RST来推导修改的变换系数,RST被称为低频不可分离的二次变换LFNST;
基于针对所述修改的变换系数的逆一次变换来推导所述目标块的残差样本;以及
基于所述目标块的所述残差样本和所述目标块的预测样本来生成重构图片,所述预测样本是基于所述目标块的帧内预测模式推导的,
其中,所述逆RST通过变换核矩阵和针对所述目标块中的左上区域的输入数据的矩阵运算来推导比所述输入数据更多的输出数据,
其中,针对所述左上区域的所述输入数据存在于所述目标块的左上4×4区域中,并且针对所述左上区域的所述输出数据存在于所述目标块的左上4×4区域或所述目标块的左上8×8区域中,
其中,基于所述变换核矩阵来执行所述逆RST,所述变换核矩阵是基于变换索引从包括多个变换核矩阵的变换集中选择的,所述变换索引指示所述多个变换核矩阵中的一个,
其中,根据应用于所述目标块的所述帧内预测模式基于映射关系来确定所述变换集,
其中,包括所述目标块的所述帧内预测模式的十个或更多个定向帧内预测模式被映射到一个变换集,并且
其中,映射到索引为2的定向帧内预测模式的变换集等于映射到索引为3的定向帧内预测模式的变换集。
2.根据权利要求1所述的图像解码方法,其中,基于根据所述目标块的所述帧内预测模式确定的扫描顺序将所述修改的变换系数映射到所述目标块中。
3.根据权利要求1所述的图像解码方法,该图像解码方法还包括以下步骤:从所述比特流中的序列参数集SPS获得RST启用标志。
4.根据权利要求1所述的图像解码方法,其中,所述变换核矩阵中的矩阵系数以8比特表示。
5.根据权利要求1所述的图像解码方法,其中,基于以所述目标块的宽度和高度为基础确定的逆4×4RST或逆8×8RST来执行所述逆RST,并且基于相同的变换集来执行所述逆4×4RST或所述逆8×8RST。
6.一种由图像编码设备执行的图像编码方法,该图像编码方法包括以下步骤:
基于目标块的帧内预测模式来推导预测样本;
基于所述预测样本来推导所述目标块的残差样本;
基于针对所述残差样本的一次变换来推导所述目标块的变换系数;
基于针对所述变换系数的缩减二次变换RST来推导修改的变换系数;
通过执行基于所述修改的变换系数的量化来推导量化变换系数;以及
生成关于所述量化变换系数的残差信息,
其中,所述RST通过变换核矩阵和针对所述目标块中的左上区域的输入数据的矩阵运算来推导比所述输入数据更少的输出数据,
其中,针对所述左上区域的所述输入数据存在于所述目标块的左上4×4区域或所述目标块的左上8×8区域中,并且针对所述左上区域的所述输出数据存在于所述目标块的所述左上4×4区域中,
其中,基于从包括多个变换核矩阵的变换集中选择的所述变换核矩阵来执行所述RST,
其中,变换索引被编码到比特流中以指示所选择的变换核矩阵,
其中,根据所述目标块的所述帧内预测模式基于映射关系来确定所述变换集,
其中,包括所述目标块的所述帧内预测模式的十个或更多个定向帧内预测模式被映射到一个变换集,并且
其中,映射到索引为2的定向帧内预测模式的变换集等于映射到索引为3的定向帧内预测模式的变换集。
7.根据权利要求6所述的图像编码方法,该图像编码方法还包括以下步骤:将RST启用标志编码到所述比特流中的序列参数集SPS中。
8.根据权利要求6所述的图像编码方法,其中,基于以所述目标块的宽度和高度为基础确定的4×4RST或8×8RST来执行所述RST,并且基于相同的变换集来执行所述4×4RST或所述8×8RST。
9.一种非暂时性计算机可读存储介质,该非暂时性计算机可读存储介质存储通过图像编码方法生成的编码信息,所述图像编码方法包括以下步骤:
基于目标块的帧内预测模式来推导预测样本;
基于所述预测样本来推导所述目标块的残差样本;
基于针对所述残差样本的一次变换来推导所述目标块的变换系数;
基于针对所述变换系数的缩减二次变换RST来推导修改的变换系数;
通过执行基于所述修改的变换系数的量化来推导量化变换系数;以及
生成关于所述量化变换系数的残差信息,
其中,所述RST通过变换核矩阵和针对所述目标块中的左上区域的输入数据的矩阵运算来推导比所述输入数据更少的输出数据,
其中,针对所述左上区域的所述输入数据存在于所述目标块的左上4×4区域或所述目标块的左上8×8区域中,并且针对所述左上区域的所述输出数据存在于所述目标块的所述左上4×4区域中,
其中,基于从包括多个变换核矩阵的变换集中选择的所述变换核矩阵来执行所述RST,
其中,变换索引被编码到比特流中以指示所选择的变换核矩阵,
其中,根据所述目标块的所述帧内预测模式基于映射关系来确定所述变换集,
其中,包括所述目标块的所述帧内预测模式的十个或更多个定向帧内预测模式被映射到一个变换集,并且
其中,映射到索引为2的定向帧内预测模式的变换集等于映射到索引为3的定向帧内预测模式的变换集。
10.一种用于图像的数据的发送方法,该发送方法包括以下步骤:
获得用于所述图像的比特流,其中,通过以下步骤生成所述比特流:基于目标块的帧内预测模式来推导预测样本,基于所述预测样本来推导所述目标块的残差样本,基于针对所述残差样本的一次变换来推导所述目标块的变换系数,基于针对所述变换系数的缩减二次变换RST来推导修改的变换系数,通过执行基于所述修改的变换系数的量化来推导量化变换系数,以及对所述量化变换系数进行编码以生成关于所述量化变换系数的残差信息;以及
发送包括所述比特流的所述数据,
其中,所述RST通过变换核矩阵和针对所述目标块中的左上区域的输入数据的矩阵运算来推导比所述输入数据更少的输出数据,
其中,针对所述左上区域的所述输入数据存在于所述目标块的左上4×4区域或所述目标块的左上8×8区域中,并且针对所述左上区域的所述输出数据存在于所述目标块的所述左上4×4区域中,
其中,基于从包括多个变换核矩阵的变换集中选择的所述变换核矩阵来执行所述RST,
其中,变换索引被编码到所述比特流中以指示所选择的变换核矩阵,
其中,根据所述目标块的所述帧内预测模式基于映射关系来确定所述变换集,
其中,包括所述目标块的所述帧内预测模式的十个或更多个定向帧内预测模式被映射到一个变换集,并且
其中,映射到索引为2的定向帧内预测模式的变换集等于映射到索引为3的定向帧内预测模式的变换集。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862694929P | 2018-07-06 | 2018-07-06 | |
US62/694,929 | 2018-07-06 | ||
PCT/KR2019/008377 WO2020009556A1 (ko) | 2018-07-06 | 2019-07-08 | 변환에 기반한 영상 코딩 방법 및 그 장치 |
CN201980057941.XA CN112655216B (zh) | 2018-07-06 | 2019-07-08 | 基于变换的图像编码方法及装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980057941.XA Division CN112655216B (zh) | 2018-07-06 | 2019-07-08 | 基于变换的图像编码方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117336470A true CN117336470A (zh) | 2024-01-02 |
Family
ID=69059312
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311291956.7A Pending CN117097892A (zh) | 2018-07-06 | 2019-07-08 | 图像编码/解码设备和图像数据发送设备 |
CN202311294676.1A Pending CN117097893A (zh) | 2018-07-06 | 2019-07-08 | 图像编码/解码设备和图像数据发送设备 |
CN201980057941.XA Active CN112655216B (zh) | 2018-07-06 | 2019-07-08 | 基于变换的图像编码方法及装置 |
CN202311303909.XA Pending CN117336470A (zh) | 2018-07-06 | 2019-07-08 | 图像编码/解码方法、图像数据发送方法和存储介质 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311291956.7A Pending CN117097892A (zh) | 2018-07-06 | 2019-07-08 | 图像编码/解码设备和图像数据发送设备 |
CN202311294676.1A Pending CN117097893A (zh) | 2018-07-06 | 2019-07-08 | 图像编码/解码设备和图像数据发送设备 |
CN201980057941.XA Active CN112655216B (zh) | 2018-07-06 | 2019-07-08 | 基于变换的图像编码方法及装置 |
Country Status (5)
Country | Link |
---|---|
US (4) | US11265557B2 (zh) |
EP (1) | EP3806475B1 (zh) |
KR (3) | KR20230159640A (zh) |
CN (4) | CN117097892A (zh) |
WO (1) | WO2020009556A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2019315029A1 (en) * | 2018-08-03 | 2021-03-11 | V-Nova International Limited | Transformations for signal enhancement coding |
US11595662B2 (en) * | 2019-02-06 | 2023-02-28 | Tencent America LLC | Method and apparatus for neighboring block availability in video coding |
WO2020207502A1 (en) * | 2019-04-12 | 2020-10-15 | Beijing Bytedance Network Technology Co., Ltd. | Most probable mode list construction for matrix-based intra prediction |
JP7458489B2 (ja) * | 2020-01-10 | 2024-03-29 | エルジー エレクトロニクス インコーポレイティド | 変換に基づく画像コーディング方法及びその装置 |
KR20220160575A (ko) * | 2020-03-30 | 2022-12-06 | 바이트댄스 아이엔씨 | 비디오 코딩에서의 동일 위치 픽처에 대한 제약 |
US11616983B2 (en) * | 2020-05-05 | 2023-03-28 | Tencent America LLC | Joint component secondary transform |
US20230143945A1 (en) * | 2020-05-11 | 2023-05-11 | Lg Electronics Inc. | Image coding method and device therefor |
CN113727103B (zh) * | 2020-05-25 | 2022-08-12 | 腾讯科技(深圳)有限公司 | 视频编码、解码方法、装置、电子设备及存储介质 |
WO2021238828A1 (en) * | 2020-05-27 | 2021-12-02 | Beijing Bytedance Network Technology Co., Ltd. | Indication of multiple transform matrices in coded video |
US11206428B1 (en) | 2020-07-14 | 2021-12-21 | Tencent America LLC | Method and apparatus for frequency-dependent joint component secondary transform |
US11871010B2 (en) | 2020-10-02 | 2024-01-09 | Qualcomm Incorporated | Extended low-frequency non-separable transform (LFNST) designs with worst-case complexity handling |
CN117044208A (zh) * | 2021-02-24 | 2023-11-10 | Lg电子株式会社 | 图像编译方法及其装置 |
WO2022220528A1 (ko) * | 2021-04-12 | 2022-10-20 | 엘지전자 주식회사 | 영상 코딩 방법 및 그 장치 |
US11800110B2 (en) * | 2021-04-20 | 2023-10-24 | Tencent America LLC | Adaptive scanning with multiple transform selection |
CN113596470A (zh) * | 2021-06-30 | 2021-11-02 | 深圳市朗强科技有限公司 | 应用中压缩算法的超高清视频无线发送、接收方法及设备 |
CN113592966B (zh) * | 2021-08-04 | 2024-04-30 | 上海哔哩哔哩科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN114757164B (zh) * | 2022-06-13 | 2022-11-15 | 浙江中控技术股份有限公司 | 工艺流程图的对比方法及装置、非易失性存储介质 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2395755A4 (en) * | 2009-02-09 | 2015-01-07 | Samsung Electronics Co Ltd | VIDEO PROCESSING AND DEVICE WITH LOW-COMPLEX FREQUENCY CONVERSION AND VIDEO PROCESSING AND DEVICE |
TW201132129A (en) * | 2009-08-06 | 2011-09-16 | Panasonic Corp | Encoding method, decoding method, encoding device and decoding device |
US9172968B2 (en) * | 2010-07-09 | 2015-10-27 | Qualcomm Incorporated | Video coding using directional transforms |
WO2012118358A2 (ko) * | 2011-03-03 | 2012-09-07 | 한국전자통신연구원 | 변환 계수 스캔 방법 및 그 장치 |
US8929455B2 (en) * | 2011-07-01 | 2015-01-06 | Mitsubishi Electric Research Laboratories, Inc. | Method for selecting transform types from mapping table for prediction modes |
US10306229B2 (en) * | 2015-01-26 | 2019-05-28 | Qualcomm Incorporated | Enhanced multiple transforms for prediction residual |
US10681379B2 (en) * | 2015-09-29 | 2020-06-09 | Qualcomm Incorporated | Non-separable secondary transform for video coding with reorganizing |
EP3389270A4 (en) * | 2016-02-12 | 2019-02-27 | Samsung Electronics Co., Ltd. | BILDCODING DEVICE AND METHOD AND IMAGE DECODING METHOD AND DEVICE |
US10708164B2 (en) * | 2016-05-03 | 2020-07-07 | Qualcomm Incorporated | Binarizing secondary transform index |
CN109076242B (zh) * | 2016-05-13 | 2023-01-03 | 索尼公司 | 图像处理设备和方法 |
CN116567262A (zh) * | 2016-05-24 | 2023-08-08 | 韩国电子通信研究院 | 图像编码/解码方法和用于所述方法的记录介质 |
CN116708782A (zh) * | 2016-07-12 | 2023-09-05 | 韩国电子通信研究院 | 图像编码/解码方法以及用于该方法的记录介质 |
US11095893B2 (en) * | 2016-10-12 | 2021-08-17 | Qualcomm Incorporated | Primary transform and secondary transform in video coding |
US20190313102A1 (en) * | 2016-11-28 | 2019-10-10 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding/decoding image, and recording medium in which bit stream is stored |
US10798164B2 (en) * | 2016-12-15 | 2020-10-06 | Bose Corporation | Techniques for intelligent device collaboration |
WO2018123444A1 (ja) * | 2016-12-28 | 2018-07-05 | ソニー株式会社 | 画像処理装置及び画像処理方法 |
EP4007277A1 (en) * | 2017-03-16 | 2022-06-01 | HFI Innovation Inc. | Method and apparatus of enhanced multiple transforms and non-separable secondary transform for video coding |
AU2018239635A1 (en) * | 2017-03-21 | 2019-10-17 | Lg Electronics Inc. | Transform method in image coding system and apparatus for same |
JP2020109884A (ja) * | 2017-04-28 | 2020-07-16 | シャープ株式会社 | 動画像符号化装置及び動画像復号装置 |
GB2564151A (en) * | 2017-07-05 | 2019-01-09 | Sony Corp | Image data encoding and decoding |
EP3709640A4 (en) * | 2017-11-09 | 2021-08-25 | Samsung Electronics Co., Ltd. | DEVICE AND METHOD FOR ENCODING IMAGES ON THE BASIS OF MOTION VECTOR RESOLUTION, AND DECODING DEVICE AND METHOD |
-
2019
- 2019-07-08 CN CN202311291956.7A patent/CN117097892A/zh active Pending
- 2019-07-08 KR KR1020237038895A patent/KR20230159640A/ko not_active Application Discontinuation
- 2019-07-08 KR KR1020217003031A patent/KR102454971B1/ko active IP Right Grant
- 2019-07-08 KR KR1020227035305A patent/KR102602614B1/ko active IP Right Grant
- 2019-07-08 CN CN202311294676.1A patent/CN117097893A/zh active Pending
- 2019-07-08 EP EP19829912.5A patent/EP3806475B1/en active Active
- 2019-07-08 CN CN201980057941.XA patent/CN112655216B/zh active Active
- 2019-07-08 CN CN202311303909.XA patent/CN117336470A/zh active Pending
- 2019-07-08 WO PCT/KR2019/008377 patent/WO2020009556A1/ko unknown
-
2020
- 2020-12-30 US US17/138,662 patent/US11265557B2/en active Active
-
2021
- 2021-12-27 US US17/562,923 patent/US11575914B2/en active Active
-
2022
- 2022-12-27 US US18/089,100 patent/US11973963B2/en active Active
-
2024
- 2024-03-22 US US18/614,112 patent/US20240244233A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
KR20230159640A (ko) | 2023-11-21 |
US20210120252A1 (en) | 2021-04-22 |
US11973963B2 (en) | 2024-04-30 |
EP3806475B1 (en) | 2023-05-10 |
KR20220140878A (ko) | 2022-10-18 |
US11575914B2 (en) | 2023-02-07 |
CN112655216A (zh) | 2021-04-13 |
US20230133403A1 (en) | 2023-05-04 |
KR20210019108A (ko) | 2021-02-19 |
US11265557B2 (en) | 2022-03-01 |
CN117097892A (zh) | 2023-11-21 |
EP3806475A4 (en) | 2021-08-04 |
US20240244233A1 (en) | 2024-07-18 |
KR102454971B1 (ko) | 2022-10-14 |
CN117097893A (zh) | 2023-11-21 |
CN112655216B (zh) | 2023-10-24 |
EP3806475A1 (en) | 2021-04-14 |
US20220124351A1 (en) | 2022-04-21 |
KR102602614B1 (ko) | 2023-11-14 |
WO2020009556A1 (ko) | 2020-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112655216B (zh) | 基于变换的图像编码方法及装置 | |
CN113940070B (zh) | 基于变换的图像解码和编码方法及发送比特流的方法 | |
CN113170197B (zh) | 基于二次变换的图像编码方法及其装置 | |
CN113273214B (zh) | 基于二次变换的图像编码方法及其装置 | |
CN113302942B (zh) | 基于二次变换的图像编码方法及其设备 | |
CN114982239A (zh) | 基于变换的图像编码方法及其装置 | |
CN114946189A (zh) | 基于变换的图像编码方法及其装置 | |
CN114930847A (zh) | 基于变换的图像编码方法及其装置 | |
CN114009023B (zh) | 基于变换的图像编码方法及其装置 | |
CN113228685B (zh) | 用于基于二次变换编码图像的方法及其装置 | |
CN116760981A (zh) | 图像解码方法、图像变换方法、存储介质和数据发送方法 | |
CN113597770B (zh) | 基于变换的图像编译方法及其装置 | |
CN114930845A (zh) | 基于变换的图像编码方法及其装置 | |
CN114270839B (zh) | 基于变换对图像进行编码的方法和设备 | |
CN114902678A (zh) | 基于变换的图像编码方法及其设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |