CN114586350A - 基于交叉分量自适应环路滤波的图像编译装置和方法 - Google Patents
基于交叉分量自适应环路滤波的图像编译装置和方法 Download PDFInfo
- Publication number
- CN114586350A CN114586350A CN202080073409.XA CN202080073409A CN114586350A CN 114586350 A CN114586350 A CN 114586350A CN 202080073409 A CN202080073409 A CN 202080073409A CN 114586350 A CN114586350 A CN 114586350A
- Authority
- CN
- China
- Prior art keywords
- information
- component
- cross
- alf
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 216
- 238000001914 filtration Methods 0.000 title claims abstract description 112
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 38
- 230000008569 process Effects 0.000 claims abstract description 120
- 241000023320 Luma <angiosperm> Species 0.000 claims description 44
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 claims description 44
- 239000000523 sample Substances 0.000 description 85
- 239000013598 vector Substances 0.000 description 68
- 239000013074 reference sample Substances 0.000 description 18
- 230000009466 transformation Effects 0.000 description 14
- 238000005192 partition Methods 0.000 description 13
- 238000013139 quantization Methods 0.000 description 13
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 7
- 229910003460 diamond Inorganic materials 0.000 description 7
- 239000010432 diamond Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 239000000872 buffer Substances 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 238000009795 derivation Methods 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- IESVDEZGAHUQJU-ZLBXKVHBSA-N 1-hexadecanoyl-2-(4Z,7Z,10Z,13Z,16Z,19Z-docosahexaenoyl)-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CC\C=C/C\C=C/C\C=C/C\C=C/C\C=C/C\C=C/CC IESVDEZGAHUQJU-ZLBXKVHBSA-N 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 208000031212 Autoimmune polyendocrinopathy Diseases 0.000 description 2
- 235000019395 ammonium persulphate Nutrition 0.000 description 2
- 238000000261 appearance potential spectroscopy Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101150114515 CTBS gene Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/117—Filters, e.g. for pre-processing or post-processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/174—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/1883—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/80—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
- H04N19/82—Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
根据本文档的一个实施例,一种图像/视频编译过程中的环路内滤波过程可以包括交叉分量自适应环路滤波过程。根据本实施例的CCALF能够提高环路内滤波的准确度。
Description
技术领域
本公开涉及一种基于交叉分量自适应环路滤波的图像编译装置和方法。
背景技术
最近,在各种领域中对诸如4K或8K或更高超高清(UHD)图像/视频的高分辨率、高质量图像/视频的需求不断增加。随着图像/视频数据具有高分辨率和高质量,相对于现有图像/视频数据,将被发送的信息或比特的量增大,因此,使用诸如现有有线/无线宽带线路的介质或现有存储介质发送图像数据或者使用现有存储介质存储图像/视频数据增加了传输成本和存储成本。
另外,对诸如虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的关注和需求日益增长,并且具有与现实图像(诸如游戏图像)不同的特性的图像/视频的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩、发送、存储或再现如上所述具有各种特性的高分辨率、高质量图像/视频的信息。
交叉分量自适应环路滤波过程(CCALF)是为了改进环路滤波过程内的滤波的准确度而执行的过程,并且与在CCALF过程中使用的信息的传输有关的讨论在进行中。
发明内容
技术方案
本公开提供一种用于提高图像/视频编译效率的方法和装置。
本公开还提供一种有效率的滤波应用方法和装置。
本公开还提供一种有效率的ALF应用方法和装置。
根据本公开的实施例,可以基于重构亮度样本来对重构色度样本执行滤波过程。
根据本公开的实施例,可以基于重构亮度样本来修改滤波的重构色度样本。
根据本公开的实施例,可以在SPS中用信号通知关于CCALF是否可用的信息。
根据本公开的实施例,可以从ALF数据(正常ALF数据或CCALF数据)推导关于交叉分量滤波器系数的值的信息。
根据本公开的实施例,可以用信号通知在切片中包括用于推导交叉分量滤波器系数的ALF数据的APS的标识符(ID)信息。
根据本公开的实施例,能够以CTU(块)为单位用信号通知关于CCALF的滤波器集索引的信息。
根据本文档的实施例,提供了一种由解码装置执行的视频/图像解码方法。
根据本文档的实施例,提供了一种用于执行视频/图像解码的解码装置。
根据本文档的实施例,提供了一种由编码装置执行的视频/图像编码方法。
根据本文档的实施例,提供了一种用于执行视频/图像编码的编码装置。
根据本文档的一个实施例,提供了一种计算机可读数字存储介质,其中存储有根据本文档的实施例中的至少一个实施例中公开的视频/图像编码方法生成的编码的视频/图像信息。
根据本文档的实施例,提供了一种计算机可读数字存储介质,其中存储有使解码装置执行本文档的实施例中的至少一个实施例中公开的视频/图像解码方法的编码的信息或编码的视频/图像信息。
有益效果
根据本文档的实施例,可以提高整体图像/视频压缩效率。
根据本文档的实施例,可以通过有效率的滤波来改进主观/客观的视觉质量。
根据本公开的实施例,可以有效率地执行ALF过程并且可以改进滤波性能。
根据本公开的实施例,可以修改基于重构亮度样本而滤波的重构色度样本以改进解码图片的色度分量的图片质量和编译准确度。
根据本公开的实施例,可以有效率地执行CCALF过程。
根据本公开的实施例,可以有效率地用信号通知ALF相关信息。
根据本公开的实施例,可以有效率地用信号通知CCALF相关信息。
根据本公开的实施例,能够以图片、切片和/或编译块为单位自适应地应用ALF和/或CCALF。
根据本文档的实施例,当在用于静止图像或视频的编码和解码方法和装置中使用CCALF时,可以改进用于CCALF的滤波器系数和块或CTU单元中的开/关传输方法,从而提高编码效率。
附图说明
图1示意性地示出可以应用于本公开的实施例的视频/图像编译系统的示例。
图2是示意性地图示可以应用于本公开的实施例的视频/图像编码装置的配置的图。
图3是示意性地图示可以应用于本公开的实施例的视频/图像解码装置的配置的图。
图4示例性地示出编译图像/视频的层级结构。
图5是图示解码装置中的基于帧内预测的块重构方法的流程图。
图6是图示解码装置中的基于帧间预测的块重构方法的流程图。
图7示出ALF滤波器的形状的示例。
图8是图示根据本公开的实施例的应用于滤波过程的虚拟边界的图。
图9图示根据本公开的实施例的使用虚拟边界的ALF过程的示例。
图10是图示根据本公开的实施例的交叉分量自适应环路滤波(CC-ALF(CCALF))过程的图。
图11和图12示意性地示出根据本公开的实施例的视频/图像编码方法和相关组件的示例。
图13和图14示意性地示出根据本公开的实施例的图像/视频解码方法和相关组件的示例。
图15示出能够应用本公开中公开的实施例的内容流传输系统的示例。
具体实施方式
能够以各种形式修改本公开,并且将在附图中描述和示出其特定实施例。然而,实施例不旨在限制本公开。以下描述中使用的术语用于仅仅描述特定实施例,而不旨在限制本公开。单数的表述包括复数的表述,只要它不被清楚地不同地理解即可。诸如“包括”和“具有”的术语旨在表明存在以下描述中使用的特征、数目、步骤、操作、元件、组件或其组合,因此应该理解,不排除存在或添加一个或多个不同的特征、数目、步骤、操作、元件、组件或其组合的可能性。
同时,在本公开中描述的附图中的每个配置是为了有关不同特征功能的描述的方便而独立地示出的,而不意味着每个配置被实现为单独的硬件或单独的软件。例如,可以组合每个组件之中的两个或更多个组件以形成一个组件,或者可以将一个组件划分成多个组件。其中每个组件被集成和/或分离的实施例也被包括在本公开的文档的范围内。
本公开涉及视频/图像编译。例如,本公开中公开的方法/实施例可以被应用于通用视频编译(VVC)中公开的方法。另外,本公开中公开的方法/实施例可以被应用于基本视频编译(EVC)标准、AOMedia视频1(AV1)标准、第二代音频视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267或H.268等)中公开的方法。
本公开呈现视频/图像编译的各种实施例,并且除非另外提及,否则这些实施例可以被彼此相结合地执行。
图1示意性地图示可以应用本文档的实施例的视频/图像编译系统的示例。
参考图1,视频/图像编译系统可以包括源设备和接收设备。源设备可以经由数字存储介质或网络以文件或流的形式将编码的视频/图像信息或数据递送到接收设备。
源设备可以包括视频源、编码装置和发射器。接收设备可以包括接收器、解码装置和渲染器。编码装置可以被称为视频/图像编码装置,解码装置可以被称为视频/图像解码装置。发射器可以被包括在编码装置中。接收器可以被包括在解码装置中。渲染器可以包括显示器,并且显示器可以被配置为单独的设备或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获设备和/或视频/图像生成设备。例如,视频/图像捕获设备可以包括一个或更多个摄像头、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成设备可以包括计算机、平板计算机和智能电话,并且可以(以电子方式)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码装置可以对输入视频/图像进行编码。为了压缩和编译效率,编码装置可以执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可以以比特流的形式输出。
发射器可以通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送至接收设备的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发射器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络传输的元件。接收器可以接收/提取比特流并且将所接收的比特流发送至解码装置。
解码装置可以通过执行与编码装置的操作相对应的诸如解量化、逆变换和预测的一系列处理对视频/图像进行解码。
渲染器可以渲染解码的视频/图像。渲染的视频/图像可以通过显示器显示。
在本公开中,视频可以是指随着时间推移的一系列图像。图片通常是指表示特定时间区域中的一个图像的单元,并且切片(slice)/图块(tile)是在编码中构成图片的一部分的单元。切片/图块可以包括一个或多个编译树单元(CTU)。图片可以由一个或多个切片/块组成。图块是图片中的特定图块列和特定图块行内的CTU的矩形区域。图块列是具有等于图片的高度的高度和由图片参数集中的语法元素所指定的宽度的CTU的矩形区域。图块行是具有由图片参数集中的语法元素所指定的高度和等于图片的宽度的宽度的CTU的矩形区域。图块扫描是对图片进行分区的CTU的特定顺序排序,其中CTU在图块中以CTU光栅扫描被连续地排序,而图片中的图块以图片的图块的光栅扫描被连续地排序。切片包括整数个完整图块或在图片的图块内可以被排他地包含在单个NAL单元中的整数个连续的完整CTU行。
同时,可以将一个图片划分为两个或更多个子图片。子图片可以是图片内的一个或多个切片的矩形区域。
像素或像元(pel)可以意指构成一个图片(或图像)的最小单元。另外,“样本”可以被用作与像素相对应的术语。样本可以通常表示像素或像素的值,并且可以表示仅亮度分量的像素/像素值或仅色度分量的像素/像素值。
单元可以表示图像处理的基本单元。单元可以包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如cb、cr)块。在一些情况下,单元可以与诸如块或区域的术语互换地使用。在一般情况下,M×N块可以包括样本(或样本阵列)或M列和N行的变换系数的集合(或阵列)。
在本公开中,“A或B(A或B)”可以意指“仅A”、“仅B”或“A和B这两者”。换句话说,可以将本公开中的“A或B(A或B)”解释为“A和/或B(A和/或B)”。例如,在本公开中,“A、B或C(A、B或C)”意指“仅A”、“仅B”、“仅C”或“A、B和C中的任一个和任何组合”。
本公开中使用的斜线(/)或逗号可以意指“和/或”。例如,“A/B”可以意指“A和/或B”。因此,“A/B”可以意指“仅A”、“仅B”或“A和B这两者”。例如,“A、B、C”可以意指“A、B或C”。
在本公开中,“A和B中的至少一个”可以意指“仅A”、“仅B”或“A和B这两者”。另外,在本公开中,可以将表述“A或B中的至少一个”或“A和/或B中的至少一个”同等地解释为“A和B中的至少一个”。
另外,在本公开中,“A、B和C中的至少一个”意指“仅A”、“仅B”、“仅C”或“A、B和C的任何组合”。另外,“A、B或C中的至少一个”或“A、B和/或C中的至少一个”可以意指“A、B和C中的至少一个”。
另外,本公开中使用的括号可以意指“例如”。具体地,当“预测(帧内预测)”被指示时,可以将它称为该“帧内预测”作为“预测”的示例被提出。换句话说,本公开中的“预测”不限于“帧内预测”,并且可以将“帧内预测”作为“预测”的示例提出。另外,即使当“预测(即,帧内预测)”被指示时,可以将它称为该“帧内预测”作为“预测”的示例被提出。
可以单独地或同时地实现在本公开中的一个附图中单独地描述的技术特征。
在下文中,将参考附图描述本公开的实施例。在下文中,在附图中相同的附图标记可以被用于相同的组件,并且可以省略相同的组件的重复描述。
图2是示意性地解释本文档适用于的视频/图像编码装置的配置的图。在下文中,视频编码装置可以包括图像编码装置。
参考图2,编码装置200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以被称为重构器或重构块生成器。根据实施例,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件组件(例如,编码器芯片组或处理器)配置。另外,存储器270可以包括解码图片缓冲器(DPB),或者可以由数字存储介质配置。硬件组件还可以包括存储器270作为内部/外部组件。
图像分割器210可以将输入至编码装置200的输入图像(或图片或帧)分割成一个或更多个处理器。例如,可以将处理器称作编译单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地分割编译单元。例如,可以基于四叉树结构、二叉树结构和/或三叉树结构将一个编译单元分割成较深深度的多个编译单元。在这种情况下,例如,可以首先应用四叉树结构,和/或可以稍后应用二叉树结构和/或三叉树结构。另选地,也可以首先应用二叉树结构。可以基于不再分割的最终编译单元来执行根据本公开的编译处理。在这种情况下,基于根据图像特征的编译效率,可以将最大编译单元用作最终编译单元,或者必要时,可以将编译单元递归地分割成较深深度的编译单元,并且具有最佳大小的编译单元可以用作最终编译单元。这里,编译处理可以包括稍后描述的预测、变换和重构的处理。作为另一示例,处理器还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元可以从前述最终编译单元分区或分割。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可以与诸如块或区域的术语互换使用。在一般情况下,M×N块可以表示由M列和N行组成的样本或变换系数的集合。样本通常可以表示像素或像素值,可以仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可以用作与一个图片(或图像)的像素或像元相对应的术语。
减法器231可以通过从输入图像信号(原始块、原始样本或原始样本阵列)中减去从预测器220输出的预测信号(预测块、预测样本或预测样本阵列)来生成残差信号(残差块、残差样本或残差样本阵列),并且可以将生成的残差信号发送到变换器232。预测器220可以对处理目标块(以下称为“当前块”)执行预测,并且可以生成包括用于当前块的预测样本的预测块。预测器220可以确定以当前块或CU为单位应用帧内预测还是帧间预测。预测器可以生成和向熵编码器240传递关于预测的各种信息,诸如稍后将在各预测模式的解释中描述的预测模式信息。关于预测的信息可以由熵编码器240编码,并且能够以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可以位于当前块附近或者可以隔开。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。例如,非定向模式可以包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可以包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可以根据设置使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于参考图片上运动矢量所指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可以相同或不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动矢量和/或参考图片索引的信息。可以基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可以不发送残差信号。在运动矢量预测(MVP)模式的情况下,邻近块的运动矢量可以用作运动矢量预测子,并且可以通过用信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于以下描述的各种预测方法生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为组合的帧间和帧内预测(CIIP)。此外,预测器可以执行帧内块复制(IBC)用于针对块的预测。帧内块复制可以被用于游戏等的内容图像/视频编译,例如,屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是可以在当前图片中推导参考块的点上与帧间预测类似地执行。也就是说,IBC可以使用本文档中描述的帧间预测技术中的至少一种。
通过帧间预测器221和/或帧内预测器222生成的预测信号可以被用于生成重构信号或生成残差信号。变换器232可以通过将变换技术应用于残差信号来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、基于图形的变换(GBT)或条件非线性变换(CNT)中的至少一个。这里,GBT意指当像素之间的关系信息由图表示时从图获得的变换。CNT意指基于使用所有先前重构的像素生成的预测信号而生成的变换。此外,变换处理可以应用于具有相同大小的正方形像素块,或者可以应用于具有可变大小而不是正方形的块。
量化器233可以对变换系数进行量化并且将它们发送到熵编码器240并且熵编码器240可以对量化的信号(关于量化的变换系数的信息)进行编码并且输出比特流。关于量化的变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序将块型量化的变换系数重新排列成一维向量形式,并且基于一维向量形式的量化的变换系数生成关于量化的变换系数的信息。熵编码器240可以执行各种编码方法,例如,指数哥伦布、上下文自适应可变长度编译(CAVLC)、上下文自适应二进制算术编译(CABAC)等。熵编码器240可以一起或单独地编码除了量化的变换系数(例如,语法元素的值等)之外的用于视频/图像重构所需的信息。编码信息(例如,编码视频/图像信息)能够以比特流的形式以NAL(网络抽象层)为单位被发送或存储。视频/图像信息可以进一步包括关于各种参数集的信息,诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。此外,视频/图像信息可以进一步包括一般约束信息。在本文档中,将在本文档中稍后描述的用信号发送/发送的信息和/或语法元素可以通过上述编码过程被编码并且可以被包括在比特流中。比特流可以通过网络被发送或者可以被存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送从熵编码器240输出的信号的发射器(未示出)和/或存储该信号的存储单元(未示出)可以作为编码装置200的内部/外部元件被包括,并且可替选地,发射器可以被包括在熵编码器240中。
从量化器233输出的量化的变换系数可以被用于生成预测信号。例如,可以通过解量化器234和逆变换器235对量化的变换系数应用解量化和逆变换来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号添加到从预测器220输出的预测信号以生成重构信号(重构图片、重构块、重构样本或重构样本阵列)。如果要处理的块没有残差,诸如应用跳过模式的情况,则可以将预测块用作重构块。所生成的重构信号可以被用于对当前图片中要处理的下一个块的帧内预测,并且可以通过如下所述的滤波被用于对下一图片进行帧间预测。
同时,可以在图片编码和/或重构期间应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改的重构图片,并且将修改的重构图片存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可以包括:例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息,并将生成的信息发送到熵编码器240,如稍后在每种滤波方法的描述中所描述的。与滤波有关的信息可以由熵编码器240编码并且以比特流的形式输出。
发送到存储器270的修改的重构图片可以用作帧间预测器221中的参考图片。当通过编码装置应用帧间预测时,编码装置200和解码装置300之间的预测失配可以被避免,并且可以改进编码效率。
存储器270的DPB可以存储修改的重构图片以用作帧间预测器221中的参考图片。存储器270可以存储从其推导(或编码)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。存储的运动信息可以被发送到帧间预测器221并用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中重构块的重构样本并且可以将重构样本传递到帧内预测器222。
图3是示意性地解释本文档适用于的视频/图像解码装置的配置的图。
参考图3,解码装置300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括解量化器321和逆变换器321。根据实施例,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件组件(例如,解码器芯片组或处理器)配置。另外,存储器360可以包括解码图片缓冲器(DPB)或者可以由数字存储介质配置。硬件组件还可以包括存储器360作为内部/外部组件。
当输入包括视频/图像信息的比特流时,解码装置300可以与在图2的编码装置中处理视频/图像信息的处理相对应地重构图像。例如,解码装置300可以基于从比特流获得的块分区相关信息来推导单元/块。解码装置300可以使用在编码装置中应用的处理器来执行解码。因此,解码的处理器例如可以是编译单元,并且编译单元可以从编译树单元或最大的编译单元按照四叉树结构、二叉树结构和/或三叉树结构进行分区。可以从编译单元推导一个或多个变换单元。通过解码装置300解码和输出的重构图像信号可以通过再现装置被再现。
解码装置300可以接收以比特流的形式从图2的编码装置输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以解析比特流以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息可以进一步包括关于各种参数集的信息,诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。此外,视频/图像信息可以进一步包括一般约束信息。解码装置可以进一步基于关于参数集的信息和/或通用约束信息对图片进行解码。可以通过解码过程对本文档中稍后描述的用信号发送/接收的信息和/或语法元素进行解码并从比特流中获得。例如,熵解码器310可以基于诸如指数哥伦布编译(exponential Golomb coding)、CAVLC或CABAC的编译方法以及图像重构所需的语法元素的输出值和用于残差的变换系数的量化值来解码比特流中的信息。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin,使用解码目标语法元素信息、邻近和解码目标块的解码信息或前一阶段中解码的符号/bin的信息来确定上下文模型,并且根据确定的上下文模型通过预测bin出现的概率对bin执行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,CABAC熵解码方法可以在确定上下文模型之后通过将解码的符号/bin的信息用于下一个符号/bin的上下文模型来更新上下文模型。由熵解码器310解码的信息之中的关于预测的信息可以提供给预测器330,并且关于已经在熵解码器310中对其执行熵解码的残差的信息,即,量化的变换系数和相关参数信息可以被输入到解量化器321。此外,由熵解码器310解码的信息之中的关于滤波的信息可以被提供给滤波器350。同时,用于接收从编码装置输出的信号的接收器(未示出)可以进一步被配置为解码装置300的内部/外部元件,或者接收器可以是熵解码器310的组件。同时,根据本文的解码装置可以被称为视频/图像/图片解码装置,并且解码装置可以被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括解量化器321、逆变换器322、预测器330、加法器340、滤波器350和存储器360中的至少一个。
解量化器321可以将量化的变换系数解量化并输出变换系数。解量化器321可以按二维块的形式重新排列量化的变换系数。在这种情况下,可以基于在编码装置中执行的系数扫描次序来执行重新排列。解量化器321可以通过使用量化参数(例如,量化步长信息)对量化的变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数进行逆变换,以获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测并生成包括针对当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定对当前块应用帧内预测还是帧间预测并且可以确定特定帧内/帧间预测模式。
预测器可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,还可以同时应用帧内预测和帧间预测。这可以称为组合的帧间和帧内预测(CIIP)。此外,预测器可以执行帧内块复制(IBC)用于针对块的预测。帧内块复制可以被用于游戏等的内容图像/视频编译,例如,屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测被执行,因为在当前图片中推导参考块。也就是说,IBC可以使用本文档中描述的帧间预测技术中的至少一个。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。所参考的样本可以位于当前块的附近或者可以根据预测模式而位于分开的位置。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参考图片上的由运动矢量所指定的参考块(参考样本阵列)推导用于当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可以基于邻近块和当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息可以进一步包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表并且基于接收到的候选选择信息来推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示用于当前块的帧间预测的模式的信息。
加法器340可以通过将获得的残差信号与从预测器(330)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差,诸如当应用跳过模式时,预测块可以用作重构块。
加法器340可以被称为重构器或重构块生成器。生成的重构信号可以被用于当前图片中的下一个要处理的块的帧内预测,可以通过如下所述的滤波输出,或者可以用于下一个图片的帧间预测。
同时,可以在图片解码过程中应用亮度映射与色度缩放(LMCS)。
滤波器350可以通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器350可以通过将各种滤波方法应用于重构图片来生成修改的重构图片,并将修改的重构图片存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可以包括:例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构图片可以用作帧间预测器332中的参考图片。存储器360可以存储从其推导(或者解码)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。存储的运动信息可以被发送到帧间预测器260,使得被用作空间邻近块的运动信息或时间邻近块的运动信息。存储器360可以存储当前图片中重构块的重构样本并将重构样本传递到帧内预测器331。
在本说明书中,解码装置300的预测器330、解量化器321、逆变换器322和滤波器350中解释的实施例能够分别以相同的方式应用于或对应于编码装置200的预测器220,解量化器234、逆变换器235和滤波器260。
如上所述,在视频编译中,执行预测以提高压缩效率。通过这种操作,可以生成包括针对当前块(即,要编译的块)的预测样本的预测块。这里,预测块包括空间域(或像素域)中的预测样本。预测块从编码装置和解码装置中相同地推导,并且编码装置对关于原始块与预测块之间的残差(而非原始块的原始样本值本身)的信息(残差信息)进行解码。通过用信号向装置通知可以提高图像编译效率。解码装置可以基于残差信息来推导包括残差样本的残差块,通过将残差块和预测块相加来生成包括重构样本的重构块,并且生成包括重构块的重构图片。
残差信息可以通过变换处理和量化处理来生成。例如,编码装置可以推导原始块与预测块之间的残差块,对包括在残差块中的残差样本(残差样本阵列)执行变换处理以推导变换系数,然后通过对变换系数执行量化处理来推导量化的变换系数,以将残差相关信息(经由比特流)用信号通知给解码装置。这里,残差信息可以包括量化的变换系数的值信息、位置信息、变换技术、变换核心和量化参数等。解码装置可以基于残差信息来执行解量化/逆变换处理并且推导残差样本(或残差块)。解码装置可以基于预测块和残差块来生成重构图片。编码装置还可以对供后续图片的帧间预测参考的量化的变换系数进行解量化/逆变换来推导残差块,并且基于此生成重构图片。
在本文档中,可以省略量化/解量化和/或变换/逆变换中的至少一个。当省略量化/解量化时,量化的变换系数可以被称为变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或者为了表达的统一,仍可以被称为变换系数。
在本文档中,量化的变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且关于变换系数的信息可以通过残差编译语法用信号通知。可以基于残差信息(或关于变换系数的信息)推导变换系数,并且可以通过对变换系数进行逆变换(缩放)来推导缩放变换系数。可以基于缩放变换系数的逆变换(变换)来推导残差样本。这也可以在本文档的其它部分中应用/表达。
编码装置/解码装置的预测器可以通过以块为单位执行帧间预测来推导预测样本。帧间预测可以是以依赖于除当前图片之外的图片的数据元素(例如,样本值或运动信息)的方式推导的预测。当将帧间预测应用于当前块时,可以基于由参考图片索引指示的参考图片上的运动矢量指定的参考块(参考样本阵列)来推导针对当前块的预测块(预测样本阵列)。这里,为了减少在帧间预测模式下发送的运动信息量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测当前块的运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可以相同或不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,可以基于当前块的邻近块来配置运动信息候选列表,并且可以用信号通知指示哪一候选被选择(使用)的标志或索引信息,以推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,当前块的运动信息可以与邻近块的运动信息相同。在跳过模式下,与合并模式不同,可以不发送残差信号。在运动矢量预测(MVP)模式的情况下,所选邻近块的运动矢量可以用作运动矢量预测子,并且可以用信号通知当前块的运动矢量。在这种情况下,可以使用运动矢量预测子和运动矢量差的和来推导当前块的运动矢量。
根据帧间预测类型(L0预测、L1预测、Bi预测等),运动信息可以包括L0运动信息和/或L1运动信息。L0方向的运动矢量可以被称为L0运动矢量或MVL0,并且L1方向的运动矢量可以被称为L1运动矢量或MVL1。基于L0运动矢量的预测可以被称为L0预测,基于L1运动矢量的预测可以被称为L1预测,并且基于L0运动矢量和L1运动矢量二者的预测可以被称为双向预测。这里,L0运动矢量可以指示与参考图片列表L0(L0)相关联的运动矢量,并且L1运动矢量可以指示与参考图片列表L1(L1)相关联的运动矢量。参考图片列表L0可以包括在输出次序上比当前图片更早的图片作为参考图片,并且参考图片列表L1可以包括在输出次序上比当前图片更晚的图片。前面的图片可以被称为前向(参考)图片,并且后续图片可以被称为反向(参考)图片。参考图片列表L0还可以包括在输出次序上比当前图片更晚的图片作为参考图片。在这种情况下,可以首先在参考图片列表
L0中对先前图片进行索引,并且可以稍后对后续图片进行索引。参考图片
列表L1还可以包括在输出次序上比当前图片更早的图片作为参考图片。在这种情况下,可以首先在参考图片列表1中对后续图片进行索引,并且先前的图片可以稍后被索引。输出次序可以与图片次序计数(POC)次序相对应。
图4示例性地示出编译图像/视频的层级结构。
参考图4,编译图像/视频被划分成处理图像/视频及它本身的解码过程的视频编译层(VCL)、发送并存储编译信息的子系统、以及负责网络适应功能并存在于VCL与子系统之间的NAL(网络抽象层)。
在VCL中,生成包括压缩图像数据(切片数据)的VCL数据,或者可以生成包括图片参数集(PSP)、序列参数集(SPS)和视频参数集(VPS)的参数集、或图像解码过程附加地需要的补充增强信息(SEI)消息。
在NAL中,可以通过向在VCL中生成的原始字节序列有效载荷(RBSP)添加报头信息(NAL单元报头)来生成NAL单元。在这种情况下,RBSP是指在VCL中生成的切片数据、参数集、SEI消息等。NAL单元报头可以包括根据相应NAL单元中包括的RBSP数据指定的NAL单元类型信息。
如图所示,可以根据在VCL中生成的RBSP来将NAL单元划分成VCL NAL单元和非VCLNAL单元。VCL NAL单元可以意指包括关于图像(切片数据)的信息的NAL单元,并且非VCLNAL单元可以意指包括对图像进行解码所需要的信息(参数集或SEI消息)的NAL单元。
可以通过根据子系统的数据标准附加报头信息来通过网络发送前述VCL NAL单元和非VCL NAL单元。例如,NAL单元可以被变换成诸如H.266/VVC文件格式、实时传输协议(RTP)、传输流(TS)等的预定标准的数据格式,并且通过各种网络来发送。
如上所述,可以根据相应NAL单元中包括的RBSP数据结构利用NAL单元类型来指定NAL单元,并且可以在NAL单元报头中存储和用信号通知关于NAL单元类型的信息。
例如,可以根据NAL单元是否包括关于图像的信息(切片数据)来将NAL单元分类成VCL NAL单元类型和非VCL NAL单元类型。可以根据VCL NAL单元中包括的图片的性质和类型对VCL NAL单元类型进行分类,并且可以根据参数集的类型对非VCL NAL单元类型进行分类。
以下是根据非VCL NAL单元类型中包括的参数集的类型所指定的NAL单元类型的示例。
-APS(自适应参数集)NAL单元:用于包括APS的NAL单元的类型
-DPS(解码参数集)NAL单元:用于包括DPS的NAL单元的类型
-VPS(视频参数集)NAL单元:用于包括VPS的NAL单元的类型
-SPS(序列参数集)NAL单元:用于包括SPS的NAL单元的类型
-PPS(图片参数集)NAL单元:用于包括PPS的NAL单元的类型
-PH(图片报头)NAL单元:用于包括PH的NAL单元的类型
前述NAL单元类型可以具有用于NAL单元类型的语法信息,并且可以在NAL单元报头中存储和用信号通知语法信息。例如,语法信息可以是nal_unit_type,并且NAL单元类型可以由nal_unit_type值指定。
同时,如上所述,一个图片可以包括多个切片,并且一个切片可以包括切片报头和切片数据。在这种情况下,可以向一个图片中的多个切片(切片报头和切片数据集)进一步添加一个图片报头。图片报头(图片报头语法)可以包括共同地适用于图片的信息/参数。在本文档中,切片可以与图块组混用或替换。另外,在本文档中,切片报头可以与图块组报头混用或替换。
切片报头(切片报头语法、切片报头信息)可以包括可以被共同地应用于切片的信息/参数。APS(APS语法)或PPS(PPS语法)可以包括可以被共同地应用于一个或多个切片或图片的信息/参数。SPS(SPS语法)可以包括可以被共同地应用于一个或多个序列的信息/参数。VPS(VPS语法)可以包括可以被共同地应用于多个层的信息/参数。DPS(DPS语法)可以包括可以被共同地应用于整个视频的信息/参数。DPS可以包括与编译视频序列(CVS)的级联有关的信息/参数。本文档中的高级语法(HLS)可以包括APS语法、PPS语法、SPS语法、VPS语法、DPS语法和切片报头语法中的至少一种。
在本文档中,从编码装置编码并且以比特流的形式用信号通知给解码装置的图像/图像信息不仅包括图片中的分区相关信息、帧内/帧间预测信息、残差信息、环路内滤波信息等,而且还包括切片报头中包括的信息、APS中包括的信息、PPS中包括的信息、SPS中包括的信息和/或VPS中包括的信息。
同时,为了补偿由于在诸如量化的压缩编译过程中发生的误差而导致的原始图像与重构图像之间的差异,可以如上所述对重构样本或重构图片执行环路内滤波过程。如上所述,环路内滤波可以由编码装置的滤波器和解码设备的滤波器执行,并且可以应用去块滤波器、SAO和/或自适应环路滤波器(ALF)。例如,可以在去块滤波过程和/或SAO过程完成之后执行ALF过程。然而,即使在这种情况下,也可以省略去块滤波过程和/或SAO过程。
在下文中,将描述图片重构和滤波的详细描述。在图像/视频编译中,可以基于针对每个块的帧内预测/帧间预测来生成重构块,并且可以生成包括重构块的重构图片。在当前图片/切片是I图片/切片时,可以仅基于帧内预测来重构当前图片/切片中包括的块。同时,在当前图片/切片是P或B图片/切片时,可以基于帧内预测或帧间预测来重构当前图片/切片中包括的块。在这种情况下,可以对当前图片/切片中的一些块应用帧内预测,并且可以对剩余块应用帧间预测。
帧内预测可以是指基于当前块所属于的图片(在下文中,称为当前图片)中的参考样本来生成当前块的预测样本的预测。在对当前块应用帧内预测时,可以推导要用于当前块的帧内预测的邻近参考样本。当前块的邻近参考样本可以包括与具有大小为nWxnH的当前块的左边界相邻的样本和邻近左下部的总共2xnH个样本、与当前块的上边界相邻的样本和邻近右上部的总共2xnW个样本、以及邻近当前块的左上部的一个样本。可替选地,当前块的邻近参考样本可以包括多个上邻近样本和多个左邻近样本。另外,当前块的邻近参考样本可以包括与具有大小为nWxnH的当前块的右边界相邻的总共nH个样本、与当前块的下边界相邻的总共nW个样本、以及邻近当前块的右下部的一个样本。
然而,当前块的一些邻近参考样本可能仍未被解码或可用。在这种情况下,解码器可以通过用可用样本取代不可用的样本来配置要用于预测的邻近参考样本。可替选地,可以通过可用样本的插值来配置要用于预测的邻近参考样本。
当推导邻近参考样本时,可以基于当前块的邻近参考样本的平均或插值和(ii)当前块的邻近参考样本之中的预测来推导预测样本。可以基于相对于样本在特定(预测)方向中存在的参考样本来推导预测样本。可以将(i)的情况称作非定向模式或非角度模式,并且可以将(ii)的情况称作定向模式或角度模式。另外,基于邻近参考样本之中的当前块的预测样本,第一邻近样本和位于与当前块的帧内预测模式的预测方向相反的方向中的第二邻近样本被插值。可以生成预测样本。可以将上述情况称为线性插值帧内预测(LIP)。另外,可以使用线性模型基于亮度样本来生成色度预测样本。可以将这种情况称作LM模式。另外,可以基于滤波的邻近参考样本来推导当前块的临时预测样本,并且可以对现有的邻近参考样本之中根据帧内预测模式推导的至少一个参考样本(即,未滤波的邻近参考样本)和临时预测样本进行加权求和以推导当前块的预测样本。可以将上述情况称为位置相关帧内预测(PDPC)。另外,可以选择当前块的邻近多参考样本线之中具有最高预测准确度的参考样本线以通过使用对应线上位于预测方向中的参考样本来推导预测样本,然后可以将本文使用的参考样本线指示(用信号通知)给解码装置,从而执行帧内预测编码。可以将上述情况称为多参考线(MRL)帧内预测或基于MRL的帧内预测。另外,可以通过将当前块划分成垂直或水平子分区基于相同的帧内预测模式来执行帧内预测,并且可以在子分区单元中推导和使用邻近参考样本。也就是说,在这种情况下,用于当前块的帧内预测模式被同等地应用于子分区,并且可以在一些情况下通过推导和使用子分区单元中的邻近参考样本来改进帧内预测性能。可以将这样的预测方法称作帧内子分区(ISP)或基于ISP的帧内预测。可以将前述帧内预测方法与帧内预测模式分开地称作帧内预测类型。能够以诸如帧内预测技术或附加帧内预测模式的各种术语来称呼帧内预测类型。例如,帧内预测类型(或附加帧内预测模式)可以包括前述LIP、PDPC、MRL和ISP中的至少一种。可以将除了诸如LIP、PDPC、MRL或ISP的特定帧内预测类型之外的一般帧内预测方法称作正常帧内预测类型。当无法应用特定帧内预测类型时,可以通常应用正常帧内预测类型,并且可以基于上述帧内预测模式执行预测。同时,可以根据需要对所推导的预测样本执行后滤波。
具体地,帧内预测过程可以包括帧内预测模式/类型确定步骤、邻近参考样本推导步骤和基于帧内预测模式/类型的预测样本推导步骤。另外,可以根据需要对所推导的预测样本执行后滤波步骤。
在下文中,将描述编码装置中的帧内预测。编码装置对当前块执行帧内预测。编码装置可以推导用于当前块的帧内预测模式,推导当前块的邻近参考样本,并且基于帧内预测模式和邻近参考样本来生成当前块中的预测样本。这里,可以同时地执行帧内预测模式确定、周围参考样本推导和预测样本生成过程,或者可以在另一过程之前执行一个过程。例如,编码设备的帧内预测器222可以包括预测模式/类型确定器、参考样本推导器和预测样本推导器,并且预测模式/类型确定器可以确定用于当前块的帧内预测模式/类型,参考样本推导器可以推导当前块的邻近参考样本,并且预测样本推导器可以推导当前块的运动样本。同时,尽管未示出,但是当执行要稍后描述的预测样本滤波过程时,帧内预测器222还可以包括预测样本滤波器(未示出)。编码装置可以从多个帧内预测模式之中确定应用于当前块的模式。编码装置可以比较帧内预测模式的RD成本并且确定用于当前块的最佳帧内预测模式。
同时,编码装置可以执行预测样本滤波过程。可以将预测样本滤波称为后滤波。可以通过预测样本滤波过程来对一些或所有预测样本进行滤波。在一些情况下,可以省略预测样本滤波过程。
编码装置基于预测样本来推导用于当前块的残差样本(S510)。编码装置可以基于相位来比较当前块的原始样本中的预测样本并且推导残差样本。
编码装置可以对残差样本进行变换/量化以推导量化变换系数(S520),此后再次对量化变换系数进行解量化/逆变换以推导(修改的)残差样本(S530)。在变换/量化之后再次执行解量化/逆变换的原因是为了推导与如上所述从解码装置推导的残差样本相同的残差样本。
编码装置可以基于预测样本和(修改的)残差样本来生成包括用于当前块的重构样本的重构块(S540)。可以基于重构块来生成用于当前图片的重构图片。
如上所述,编码装置可以对包括关于帧内预测的预测信息(例如,指示预测模式的预测模式信息)以及关于帧内和残差样本的残差信息的图像信息进行编码并且以比特流的形式输出编码图像信息。残差信息可以包括残差编译语法。编码装置可以对残差样本进行变换/量化以推导量化变换系数。残差信息可以包括关于量化变换系数的信息。
图5是图示解码装置中的基于帧内预测的块重构方法的流程图。图5的方法可以包括步骤S500、S510、S520、S530和S540。解码装置可以执行与在编码装置中执行的操作相对应的操作。
S500至S520可以由解码装置的帧内预测器331执行,并且S500的预测信息和S530的残差信息可以由解码装置的熵解码器310从比特流获得。解码装置的残差处理器320可以基于残差信息来推导用于当前块的残差样本。具体地,残差处理器320的解量化器321通过基于以残差信息为基础所推导的量化变换系数执行解量化来推导变换系数,并且残差处理器的逆变换器322可以通过对变换系数执行逆变换来推导用于当前块的残差样本。S540可以由解码装置的加法器340或重构器执行。
具体地,解码装置可以基于所接收到的预测模式信息来推导用于当前块的帧内预测模式(S500)。解码装置可以推导当前块的周围参考样本(S510)。解码装置基于帧内预测模式和邻近参考样本来生成当前块中的预测样本(S520)。在这种情况下,解码装置可以执行预测样本滤波过程。可以将预测样本滤波称为后滤波。可以通过预测样本滤波过程来对一些或所有预测样本进行滤波。在一些情况下,可以省略预测样本滤波过程。
解码装置基于所接收到的残差信息来生成用于当前块的残差样本(S530)。解码装置可以基于预测样本和残差样本来生成用于当前块的重构样本,并且推导包括重构样本的重构块(S540)。可以基于重构块来生成用于当前图片的重构图片。
这里,解码装置的帧内预测器331可以包括预测模式/类型确定器、参考样本推导器和预测样本推导器,并且预测模式/类型确定器可以基于由解码装置的熵解码器310所获得的预测模式信息来确定用于当前块的帧内预测模式,参考样本推导器可以推导当前块的周围参考样本,并且预测样本推导器可以推导当前块的预测样本。同时,尽管未示出,但是当执行上述预测样本滤波过程时,帧内预测器331还可以包括预测样本滤波器(未示出)。
预测信息可以包括帧内预测模式信息和/或帧内预测类型信息。帧内预测模式信息可以包括例如指示是否对当前块应用最可能模式(MPM)或应用剩余模式的标志信息(例如,Intra_luma_mpm_flag),并且在对当前块应用MPM时,预测模式信息还可以包括指示帧内预测模式候选(MPM候选)之一的索引信息(例如,intra_luma_mpm_idx)。帧内预测模式候选(MPM候选)可以包括MPM候选列表或MPM列表。另外,在不对当前块应用MPM时,帧内预测模式信息还可以包括指示除了帧内预测模式候选(MPM候选)之外的剩余帧内预测模式之一的剩余模式信息(例如,Intra_luma_mpm_remainder)。解码装置可以基于帧内预测模式信息来确定当前块的帧内预测模式。可以为前述MIP配置单独的MPM列表。
另外,能够以各种形式实现帧内预测类型信息。例如,帧内预测类型信息可以包括指示帧内预测类型之一的帧内预测类型索引信息。作为另一示例,帧内预测类型信息可以包括以下各项中的至少一种:指示是否对当前块应用MRL并且在应用的情况下指示哪个参考样本线被使用的参考样本线信息(例如,Intra_luma_ref_idx)、指示是否对当前块应用ISP的ISP标志信息(例如,Intra_subpartitions_mode_flag)、指示当ISP被应用时子分区的分割类型的ISP类型信息(例如,Intra_subpartitions_split_flag)、指示PDCP是否被应用的标志信息或指示LIP是否被应用的标志信息。另外,帧内预测类型信息可以包括指示是否对当前块应用MIP的MIP标志。
可以通过本公开中描述的编译方法来对帧内预测模式信息和/或帧内预测类型信息进行编码/解码。例如,可以通过基于截断(莱斯)二进制码的熵编译(例如,CABAC、CAVLC)编译来对帧内预测模式信息和/或帧内预测类型信息进行编码/解码。
编码装置/解码装置的预测器可以通过在逐块基础上执行帧间预测来推导预测样本。帧间预测可以是以依赖于除当前图片以外的图片的数据元素(例如,样本值或运动信息)的方式推导的预测。在对当前块应用帧间预测时,可以基于由参考图片索引指示的参考图片上的由运动矢量指定的参考块(参考样本阵列)来推导用于当前块的预测块(预测样本阵列)。在这种情况下,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位来预测当前块的运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测类型(L0预测、L1预测、Bi预测等)信息。当应用帧间预测时,邻近块可以包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可以彼此相同或彼此不同。可以将时间邻近块称为诸如并置参考块、并置CU(colCU)等的名称,并且可以将包括时间邻近块的参考图片称为并置图片(colPic)。例如,可以基于当前块的邻近块来配置运动信息候选列表并且可以用信号通知指示哪个候选被选择(使用)来推导当前块的运动矢量和/或参考图片索引的标志或索引信息。可以基于各种预测模式来执行帧间预测,并且例如,在跳过模式和合并模式的情况下,当前块的运动信息可以与邻近块的运动信息相同。在跳过模式的情况下,与合并模式不同,可以不发送残差信号。在运动矢量预测(MVP)模式的情况下,所选择的邻近块的运动矢量被用作运动矢量预测子并且可以用信号通知运动矢量差。在这种情况下,可以使用运动矢量预测子和运动矢量差之和来推导当前块的运动矢量。
在下文中,将描述由编码装置进行的帧间预测过程。编码装置对当前块执行帧间预测。编码装置可以推导当前块的帧间预测模式和运动信息,并且生成当前块的预测样本。这里,可以同时地执行用于确定帧间预测模式、推导运动信息并且生成预测样本的过程,或者可以在另一过程之前执行一个过程。例如,编码装置的帧间预测器221可以包括预测模式确定器、运动信息推导器和预测样本推导器,并且预测模式确定器可以确定用于当前块的预测模式,运动信息推导器可以推导当前块的运动信息,并且预测样本推导器可以推导当前块的运动样本。例如,编码装置的帧间预测器221可以通过运动估计在参考图片的预定区域(搜索区域)内搜索与当前块类似的块,并且可以推导与当前块的差异是最小或预定参考或更少的参考块。基于此,可以推导指示参考块所位于的参考图片的参考图片索引,并且可以基于参考块与当前块之间的位置差来推导运动矢量。编码装置可以从各种预测模式之中确定应用于当前块的模式。编码装置可以比较用于各种预测模式的速率失真(RD)成本并且确定用于当前块的最佳预测模式。
例如,在对当前块应用跳过模式或合并模式时,编码装置可以构建要稍后描述的合并候选列表并且在由包括在合并候选列表中的合并候选所指示的参考块之中推导与当前块的差异最小或者为预定参考或更少的参考块。在这种情况下,可以选择与所推导的参考块相关联的合并候选,并且可以生成指示所选择的合并候选的合并索引信息并将其用信号通知解码装置。可以使用所选择的合并候选的运动信息来推导当前块的运动信息。
作为另一示例,在对当前块应用(A)MVP模式时,编码装置构建要稍后描述的(A)MVP候选列表,并且使用(A)MVP候选列表中包括的运动矢量预测子(mvp)候选之中的所选mvp候选的运动矢量作为当前块的mvp。在这种情况下,例如,可以将指示通过上述运动估计推导的参考块的运动矢量用作当前块的运动矢量,并且在mvp候选之中具有与当前块的运动矢量具有最小差的运动矢量的mvp候选可以是所选mvp候选。可以推导作为通过从当前块的运动矢量中减去mvp所获得的差的运动矢量差(MVD)。在这种情况下,可以将关于MVD的信息用信号通知给解码装置。另外,当应用(A)MVP模式时,参考图片索引的值可以被配置为参考图片索引信息并且单独地用信号通知给解码装置。
编码装置可以基于预测样本来推导残差样本(S710)。编码装置可以通过将当前块的原始样本与预测样本进行比较来推导残差样本。
编码装置对残差样本进行变换/量化以推导量化变换系数(S720),然后再次对量化变换系数进行解量化/逆变换以推导(修改的)残差样本(S730)。在变换/量化之后再次执行解量化/逆变换的原因是为了推导与如上所述从解码装置推导的残差样本相同的残差样本。
编码装置可以基于预测样本和(修改的)残差样本来生成包括当前块的重构样本的重构块(S740)。可以基于重构块来生成用于当前图片的重构图片。
尽管未示出,但是如上所述,编码装置100可以对包括预测信息和残差信息的视频信息进行编码。编码装置100可以以比特流的形式输出编码图像信息。预测信息可以是与预测过程有关的信息并且可以包括预测模式信息(例如,跳过标志、合并标志或模式索引)和运动信息。运动信息可以包括作为用于推导运动矢量的信息的候选选择信息(例如,合并索引、mvp标志或mvp索引)。另外,关于运动信息的信息可以包括前述MVD信息和/或参考图片索引信息。另外,关于运动信息的信息可以包括指示是否应用L0预测、L1预测或bi预测的信息。残差信息是关于残差样本的信息。残差信息可以包括关于用于残差样本的量化变换系数的信息。
输出比特流可以被存储在(数字)存储介质中并且被发送到解码装置,或者可以通过网络被发送到解码装置。
图6是图示解码装置中的基于帧间预测的块重构方法的流程图。图6的方法可以包括步骤S600、S610、S620、S630和S640。解码装置可以执行与由编码装置执行的操作相对应的操作。
S600至S620可以由解码装置的帧间预测器332执行,并且S600的预测信息和S630的残差信息可以由解码装置的熵解码器310从比特流获得。解码装置的残差处理器320可以基于残差信息来推导当前块的残差样本。具体地,残差处理器320的解量化器321可以通过基于以残差信息为基础所推导的量化变换系数执行解量化来推导变换系数,并且残差处理器的逆变换器322可以通过对变换系数执行逆变换来推导用于当前块的残差样本。S640可以由解码装置的加法器340或重构器执行。
具体地,解码装置可以基于所接收到的预测信息来确定用于当前块的预测模式(S600)。解码装置可以基于预测信息中的预测模式信息来确定对当前块应用哪个帧间预测模式。
例如,可以基于合并标志来确定是否对当前块应用合并模式或者是否确定(A)MVP模式。可替选地,可以基于模式索引来选择各种帧间预测模式候选之一。帧间预测模式候选可以包括跳过模式、合并模式和/或(A)MVP模式,或者可以包括要稍后描述的各种帧间预测模式。
解码装置基于所确定的帧间预测模式来推导当前块的运动信息(S610)。例如,在对当前块应用跳过模式或合并模式时,解码装置可以配置要在下面描述的合并候选列表并且从合并候选列表中包括的合并候选中选择一个合并候选。可以基于前述选择信息(合并索引)来执行选择。可以使用所选择的合并候选的运动信息来推导当前块的运动信息。所选择的合并候选的运动信息可以被用作当前块的运动信息。
作为另一示例,在对当前块应用(A)MVP模式时,解码装置可以构建要在下面描述的(A)MVP候选列表并且使用(A)MVP候选列表中包括的运动矢量预测子(mvp)候选之中的所选mvp候选的运动矢量作为当前块的mvp。可以基于上述选择信息(mvp标志或mvp索引)来执行选择。在这种情况下,可以基于关于MVD的信息来推导当前块的MVD,并且可以基于当前块的mvp和MVD来推导当前块的运动矢量。另外,可以基于参考图片索引信息来推导当前块的参考图片索引。可以将在用于当前块的参考图片列表中由参考图片索引指示的图片推导为针对当前块的帧间预测而参考的参考图片。
同时,如将在下面描述的,可以在不用配置候选列表的情况下推导当前块的运动信息。在这种情况下,可以根据要稍后描述的在预测模式下公开的过程来推导当前块的运动信息。在这种情况下,可以省略如上所述的候选列表的配置。
解码装置可以基于当前块的运动信息来生成当前块的预测样本(S620)。在这种情况下,可以基于当前块的参考图片索引来推导参考图片,并且可以使用参考图片上的由当前块的运动矢量所指示的参考块的样本来推导当前块的预测样本。在这种情况下,如稍后描述的,可以取决于情况而进一步执行针对当前块的所有或一些预测样本的预测样本滤波过程。
例如,解码装置的帧间预测器332可以包括预测模式确定器、运动信息推导器和预测样本推导器,并且预测模式确定器可以基于所接收到的预测模式信息来确定用于当前块的预测模式,运动信息推导器可以基于所接收到的关于运动信息的信息来推导当前块的运动信息(运动矢量和/或参考图片索引等),并且预测样本推导单元可以推导当前块的预测样本。
解码装置基于所接收到的残差信息来生成用于当前块的残差样本(S630)。解码装置可以基于预测样本和残差样本来生成用于当前块的重构样本,并且可以推导包括重构样本的重构块(S640)。可以基于重构块来生成用于当前图片的重构图片。
各种帧间预测模式可以被用于图片中的当前块的预测。例如,可以使用各种模式,诸如合并模式、跳过模式、运动矢量预测(MVP)模式、仿射模式、子块合并模式和与MVD合并(MMVD)模式等。还可以附加地或替代地使用解码器侧运动矢量细化(DMVR)模式、自适应运动矢量分辨率(AMVR)模式、具有CU级权重的bi-预测(BCW)、双向光流(BDOF)等作为附加模式。可以将仿射模式称作仿射运动预测模式。可以将MVP模式称为高级运动矢量预测(AMVP)模式。在本文档中,可以包括一些模式和/或通过一些模式推导的运动信息候选作为其他模式的运动信息候选之一。例如,HMVP候选可以在合并/跳过模式下作为合并候选被添加或者可以在MVP模式中作为mvp候选被添加。
可以将指示当前块的帧间预测模式的预测模式信息从编码装置用信号通知给解码装置。预测模式信息可以被包括在比特流中并且由解码装置接收。预测模式信息可以包括指示多种候选模式之一的索引信息。可替选地,可以通过标志信息的层级信令来指示帧间预测模式。在这种情况下,预测模式信息可以包括一个或多个标志。例如,可以用信号通知跳过标志以指示是否应用跳过模式,并且如果不应用跳过模式,则可以用信号通知合并标志以指示是否应用合并模式,以及如果不应用合并模式,则指示要应用MVP模式或者可以进一步用信号通知用于附加分类的标志。可以在独立模式下用信号通知仿射模式或者可以在依赖于合并模式或MVP模式的模式下用信号通知仿射模式。例如,仿射模式可以包括仿射合并模式和仿射MVP模式。
同时,可以在当前块中用信号通知指示是否在当前块(当前编译单元)中使用上述list0(L0)预测、list1(L1)预测或bi-预测的信息。该信息可以被称为运动预测方向信息、帧间预测方向信息或帧间预测指示信息,并且可以被以例如inter_pred_idc语法元素的形式配置/编码/用信号通知。也就是说,inter_pred_idc语法元素可以指示前述list0(L0)预测、list1(L1)预测或bi-预测是否被用于当前块(当前编译单元)。在本文档中,为了描述的方便,可以将通过inter_pred_idc语法元素指示的帧间预测类型(L0预测、L1预测或BI预测)指示为运动预测方向。可以将L0预测表示为pred_L0,将L1预测表示为pred_L1,并且将成对预测表示为pred_BI。例如,可以根据inter_pred_idc语法元素的值来确定以下预测类型。
[表1]
如上所述,一个图片可以包括一个或多个切片。切片可以具有包括帧内(I)切片、预测(P)切片和双向预测(B)切片的切片类型之一。可以基于切片类型信息来指示切片类型。对于I切片中的块,可以不使用帧间预测进行预测,并且可以使用仅帧内预测。当然,即使在这种情况下,也可以在没有预测的情况下对原始样本值进行编译和用信号通知。可以针对P切片中的块使用帧内预测或帧间预测,并且可以在使用帧间预测时使用仅单向预测。同时,可以针对B切片中的块使用帧内预测或帧间预测,并且可以在使用帧间预测时使用高达双向预测。
L0和L1可以包括在当前图片之前先前编码/解码的参考图片。例如,L0可以包括按POC顺序在当前图片之前和/或之后的参考图片,并且L1可以包括按POC顺序在当前图片之后和/或之前的参考图片。在这种情况下,L0可以相对于POC顺序中的先前参考图片被指配比当前图片低的参考图片索引,并且L1可以相对于POC顺序中的在后参考图片被指配比当前图片低的参考图片索引。在B切片的情况下,可以应用bi-预测,并且在这种情况下,可以应用单向bi-预测或者可以应用双向bi-预测。可以将双向bi-预测称作真bi-预测。
如上所述,可以基于通过在编码阶段处的预测所推导的预测块(预测样本)来推导残差块(残差样本),并且可以生成通过残差信息来变换/量化的残差样本。残差信息可以包括关于量化变换系数的信息。残差信息可以被包括在视频/图像信息中,并且视频/图像信息可以被编码并以比特流的形式发送到解码装置。解码装置可以从比特流获得残差信息,并且可以基于残差信息来推导残差样本。具体地,解码装置可以基于残差信息来推导量化变换系数,并且可以通过解量化/逆变换过程来推导残差块(残差样本)。
同时,可以省略(逆)变换和/或(解)量化的至少一个过程。
在下文中,将描述针对重构图片执行的环路内滤波过程。可以通过环路内滤波过程来生成修改的重构样本、块、图片(或修改滤波的样本、块、图片),并且修改的(修改且滤波的)重构图片可以在解码装置处作为解码图片被输出并且也可以被存储在编码装置/解码装置的解码图像缓冲器或存储器中以及在稍后对图片进行编码/解码时用作帧间预测过程中的参考图片。环路内滤波过程可以包括如上所述的去块滤波过程、样本自适应偏移(SAO)过程和/或自适应环路滤波器(ALF)过程。在这种情况下,去块滤波过程、样本自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程和双边滤波器过程中的一个或一些可以被依次应用或者全部可以被依次应用。例如,可以在对重构图片应用去块滤波过程之后执行SAO过程。或者,例如,可以在对重构图片应用去块滤波过程之后执行ALF过程。还可以在编码装置中执行这个。
去块滤波是去除重构图片中的块之间的边界处的失真的滤波技术。例如,去块滤波过程可以根据重构图片推导目标边界,确定目标边界的边界强度(bS),并且基于bS来对目标边界执行去块滤波。可以基于与目标边界相邻的两个块的预测模式、运动矢量差、参考图片是否相同、是否存在非零有效系数等来确定bS。
SAO是用于在样本基础上补偿重构图片与原始图片之间的偏移差的方法。例如,可以基于诸如带偏移、边缘偏移等的类型来应用SAO。根据SAO,可以根据每种SAO类型来将样本分类成不同类别,并且可以基于类别向每个样本添加偏移值。用于SAO的滤波信息可以包括关于是否应用SAO的信息、SAO类型信息和SAO偏移值信息。可以在应用去块滤波之后将SAO应用于重构图片。
自适应环路滤波器(ALF)是用于根据滤波器形状基于滤波器系数在样本基础上对重构图片进行滤波的技术。编码装置可以通过比较重构图片和原始图片来确定是否应用ALF、ALF形状和/或ALF滤波系数等并且可以用信号通知给解码设备。也就是说,用于ALF的滤波信息可以包括关于是否应用ALF的信息、ALF滤波器形状信息、ALF滤波系数信息等。可以在应用去块滤波之后将ALF应用于重构图片。
图7示出ALF滤波器的形状的示例。
在图7中,(a)示出7x7菱形滤波器的形状,(b)示出5x5菱形滤波器的形状。在图7中,滤波器形状中的Cn表示滤波器系数。当Cn中的n相同时,这指示可以指配相同的滤波器系数。在本公开中,可以将根据ALF的滤波器形状来指配滤波器系数的位置和/或单元称为滤波器抽头。在这种情况下,可以将一个滤波器系数指配给每个滤波器抽头,并且滤波器抽头的布置可以对应于滤波器形状。可以将位于滤波器形状的中央处的滤波器抽头称为中央滤波器抽头。可以将相同的滤波器系数指配给存在于相对于中央滤波器抽头彼此相对应的位置处的具有相同n值的两个滤波器抽头。例如,在7x7菱形滤波器形状的情况下,包括25个滤波器抽头,并且由于以中央对称形式指配滤波器系数C0至C11,所以可以使用仅13个滤波器系数来将滤波器系数指配给25个滤波器抽头。另外,例如,在5x5菱形滤波器形状的情况下,包括13个滤波器抽头,并且由于以中央对称形式指配滤波器系数C0至C5,所以使用仅7个滤波器系数来将滤波器系数指配给13个滤波器抽头。例如,为了减少关于用信号通知的滤波器系数的信息的数据量,可以(显式地)用信号通知用于7x7菱形滤波器形状的13个滤波器系数中的12个,并且可以(隐式地)推导1个滤波器系数。另外,例如,可以(显式地)用信号通知用于5x5菱形滤波器形状的7个滤波器系数中的6个,并且可以(隐式地)推导1个滤波器系数。
根据本公开的实施例,可以通过自适应参数集(APS)来用信号通知用于ALF过程的ALF参数。可以根据用于ALF的滤波器信息或ALF数据来推导ALF参数。
ALF是一种可以在如上所述的视频/图像编译中应用的环路内滤波技术。可以使用基于维纳(Wiener)的自适应滤波器来执行ALF。这可以是为了使原始样本与解码样本(或重构样本)之间的均方误差(MSE)最小化。针对ALF工具的高级设计可以并入在SPS和/或切片报头(或图块组报头)中可访问的语法元素。
在示例中,在针对每个4x4亮度块的滤波之前,可以对取决于为块计算的梯度值的滤波器系数f(k,l)和相应滤波器限幅值c(k,l)应用诸如旋转或对角线和垂直翻转的几何变换。这相当于将这些变换应用于滤波器支持区域中的样本。创建对其应用ALF的其他块可以类似于根据它们的方向性布置这些块。
例如,可以基于以下等式来执行三种变换:对角线、垂直翻转和旋转。
[等式1]
对角线:f_D(k,l)=f(l,k),c_D(k,l)=c(l,k)
[等式2]
垂直翻转:f_V(k,l)=f(k,K-l-1),c_V(k,l)=c(k,K-l-1)
[等式3]
旋转:f_R(k,l)=f(K-l-1,k),c_R(k,l)=c(K-l-1,k)
在等式1至3中,K可以是滤波器的大小。0≤k和1≤K-1可以是系数坐标。例如,(0,0)可以是左上角坐标,并且/或者(K-1,K-1)可以是右下角坐标。可以在下表中概括变换与四个方向中的四个梯度之间的关系。
[表2]
梯度值 | 变换 |
g<sub>d2</sub><g<sub>d1</sub>且g<sub>h</sub><g<sub>v</sub> | 无变换 |
g<sub>d2</sub><g<sub>d1</sub>且g<sub>v</sub><g<sub>h</sub> | 对角线 |
g<sub>d1</sub><g<sub>d2</sub>且g<sub>h</sub><g<sub>v</sub> | 垂直翻转 |
g<sub>d1</sub><g<sub>d2</sub>且g<sub>v</sub><g<sub>h</sub> | 旋转 |
可以在APS和切片报头中用信号通知ALF滤波器参数。在一个APS中,可以用信号通知最多25个亮度滤波器系数和限幅值索引。在一个APS中,可以用信号通知最多8个色度滤波器系数和限幅值索引。为了减少比特开销,可以合并用于亮度分量的不同分类的滤波器系数。在切片报头中,可以用信号通知用于当前切片的(由当前切片参考的)APS的索引。
从APS解码的限幅值索引可以使得有可能使用限幅值的亮度表和限幅值的色度表来确定限幅值。这些限幅值可能取决于内部比特深度。更具体地,可以基于以下等式来推导限幅值的亮度表和限幅值的色度表。
[等式4]
AlfClipL={round(2^(B(N-n+1)/N))对于n∈[1..N]}
[等式5]
AlfClipC={round(2^((B-8)+8((N-n))/(N-1)))对于n∈[1..N]}
在上述等式中,B可以是内部比特深度,并且N可以是允许限幅值的数目(预定数目)。例如,N可以是4。
在切片报头中,可以用信号通知最多7个APS索引以指示用于当前切片的亮度滤波器集。可以在CTB级别处进一步控制滤波过程。例如,可以用信号通知指示是否对亮度CTB应用ALF的标志。亮度CTB可以选择16个固定滤波器集和来自APS的滤波器集之一。可以针对亮度CTB用信号通知滤波器集索引以指示哪个滤波器集被应用。16个固定滤波器集可以被预定义和硬编译在编码器和解码器这两者中。
对于色度分量,可以在切片报头中用信号通知APS索引以指示用于当前切片的色度滤波器集。在CTB级别处,当在APS中存在两个或更多个色度滤波器集时,可以针对每个色度CTB用信号通知滤波器索引。
可以用128作为范数(norm)来量化滤波器系数。为了限制乘法复杂度,可以应用比特流一致性(bitstream conformance),使得非中心位置的系数值可以从0到28变动并且/或者剩余位置的系数值可以在从-27到27-1的范围内。可以不在比特流中用信号通知中心位置系数并且可以将其预先确定(考虑)为128。
当ALF可用于当前块时,可以对每个样本R(i,j)进行滤波,并且滤波结果R′(i,j)可以由以下等式表示。
[等式6]
R′(i,j)=R(i,j)+((∑k≠0∑l≠0f(k,l)×K(R(i+k,j+l)-R(i,j),c(k,l))+64)>>7)
在上述等式中,f(k,l)可以是解码滤波器系数,K(x,y)可以是限幅函数,并且c(k,l)可以是解码限幅参数。例如,变量k和/或1可以从-L/2到L/2变化。这里,L可以表示滤波器长度。限幅函数K(x,y)=min(y,max(-y,x))可以对应于函数Clip3(-y,y,x)。
在示例中,为了减少ALF的行缓冲器要求,可以针对与水平CTU边界相邻的样本应用修改的块分类和滤波。出于此目的,可以定义虚拟边界。
图8是图示根据本公开的实施例的应用于滤波过程的虚拟边界的图。图9图示根据本公开的实施例的使用虚拟边界的ALF过程的示例。将结合图8描述图9。
参考图9,虚拟边界可以是通过使水平CTU边界移位N个样本而定义的线。在示例中,对于亮度分量来说N可以是4,并且/或者对于色度分量来说N可以是2。
在图8中,可以对亮度分量应用修改的块分类。对于虚拟边界上的4x4块的1D拉普拉斯梯度(Laplacian gradient)计算,可以使用仅虚拟边界上方的样本。类似地,为了计算虚拟边界下方的4x4块的1D拉普拉斯梯度,可以使用仅虚拟边界下方的样本。考虑到在1D拉普拉斯梯度计算中使用的样本数目减少,可以相应地缩放活性值A的量化。
对于滤波过程,虚拟边界处的对称填充操作可以被用于亮度分量和色度分量。参考图8,当滤波的样本位于虚拟边界下方时,可以填充位于虚拟边界上方的邻近样本。同时,还可以对称地填充在另一侧上的相应样本。
当没有滤波器跨边界可用时,根据图9描述的过程也可以被用于切片、分块(brick)和/或图块的边界。对于ALF块分类,可以使用仅包含在同一切片、分块和/或图块中的样本并且可以相应地缩放活性值。对于ALF滤波,可以针对相对于水平边界和/或垂直边界的水平方向和/或垂直方向中的每个应用对称填充。
图10是图示根据本公开的实施例的交叉分量自适应环路滤波(CC-ALF)过程的图。可以将CCALF过程称为交叉分量滤波过程。
在一个方面中,ALF过程可以包括一般ALF过程和CCALF过程。也就是说,CCALF过程可以是指ALF过程的一些过程。在另一方面中,滤波过程可以包括去块过程、SAO过程、ALF过程和/或CCALF过程。
CC-ALF可以使用亮度样本值来细化每个色度分量。CC-ALF由比特流的(图像)信息控制,所述信息包括(a)关于用于每个色度分量的滤波器系数的信息和(b)关于控制滤波器到样本块的应用的掩码的信息。可以在APS处用信号通知滤波器系数,并且可以在切片级别处用信号通知块大小和掩码。
参考图10,可以通过对每个色度分量的亮度通道应用线性菱形滤波器(图10的(b))来操作CC-ALF。滤波器系数被发送到APS,通过210的因子被缩放,并且向上舍入以获得定点表示。滤波器的应用可以在可变块大小处被控制并且通过针对每个样本的块所接收的上下文编译标志被用信号通知。可以针对每个色度分量在切片级别处接收块大小以及CC-ALF启用标志。块大小(对于色度样本)可以是16x16、32x32、64x64或128x128。
在以下实施例中,提出了一种基于重构亮度样本来对由ALF滤波的重构色度样本进行重新滤波或修改的方法。
本公开的实施例涉及CC-ALF中的滤波器开/关传输和滤波器系数传输。如上所述,本公开中公开的语法表中的信息(语法元素)可以被包括在图像/视频信息中,可以在编码设备中被配置/编码并且以比特流的形式发送到解码装置。解码装置可以对相应语法表中的信息(语法元素)进行解析/解码。解码装置可以基于解码的信息来执行图片/图像/视频解码过程(具体地,例如,CC-ALF过程)。在下文中,这同样适用于其他实施例。
下表示出根据本公开的实施例的切片报头信息的一些语法。
[表3]
下表示出用于上表中包括的语法元素的示例性语义。
[表4]
参考上述两个表,当sps_cross_component_alf_enabled_flag在切片报头中是1时,可以执行slice_cross_component_alf_cb_enabled_flag的解析以确定是否在切片中应用Cb CC-ALF。当slice_cross_component_alf_cb_enabled_flag是1时,CC-ALF被应用于所对应的Cb切片,并且当slice_cross_component_alf_cb_reuse_temporal_layer_filter是1时,可以重用相同现有的时间层的滤波器。当slice_cross_component_alf_cb_enabled_flag是0时,可以通过slice_cross_component_alf_cb_aps_id解析使用相应自适应参数集(APS)id中的滤波器来应用CC-ALF。Slice_cross_component_alf_cb_log2_control_size_minus4可以意指Cb切片中应用CC-ALF的块单元。
例如,当slice_cross_component_alf_cb_log2_control_size_minus4的值是0时,以16x16为单位确定是否应用CC-ALF。当slice_cross_component_alf_cb_log2_control_size_minus4的值是1时,以32x32为单位确定是否应用CC-ALF。当slice_cross_component_alf_cb_log2_control_size_minus4的值是2时,以64x64为单位确定是否应用CC-ALF。当slice_cross_component_alf_cb_log2_control_size_minus4的值是3时,以128x128为单位确定是否应用CC-ALF。另外,与上述相同的语法被用于Cr CC-ALF。
下表示出用于ALF数据的示例语法。
[表5]
下表是上表中包括的语法元素的示例语义。
[表6]
参考上述两个表,CC-ALF语法元素不遵循现有的(一般)ALF语法结构,而是被独立地发送并且被配置成被独立地应用。也就是说,即使当SPS上的ALF工具关闭时,也可以应用CC-ALF。新硬件流水线设计是必需的,因为CC-ALF应该能够独立于现有的ALF结构而操作。这引起硬件实现方式成本的增加和硬件延迟的增加。
另外,在ALF中,以CTU为单位来确定是否应用亮度图像和色度图像这两者,并且通过信令向解码器发送确定的结果。然而,是否应用变量CC-ALF是以16x16至128x128为单位确定的,并且此应用可以引起现有的ALF结构与CC-ALF之间的冲突。这在硬件实现方式方面引起问题并且同时引起用于各种可变CC-ALF应用的行缓冲器的增加。
在本公开中,通过将CC-ALF语法结构整体地应用于ALF语法结构中来解决上面提及的CC-ALF的硬件实现方式中的问题。
根据本公开的实施例,为了确定是否使用(应用)CC-ALF,序列参数集(SPS)可以包括CC-ALF启用标志(sps_ccalf_enable_flag)。可以独立于用于确定是否使用(应用)ALF的ALF启用标志(sps_alf_enabled_flag)来发送CC-ALF启用标志。
下表示出根据本实施例的SPS的一些示例性语法。
[表7]
参考上表,只有当ALF始终在操作时才可以应用CC-ALF。也就是说,只有当ALF启用标志(sps_alf_enabled_flag)是1时,才可以解析CC-ALF启用标志(sps_ccalf_enabled_flag)。可以根据上表组合CC-ALF和ALF。CC-ALF启用标志可以指示CC-ALF是否可用(并且可能与CC-ALF是否可用有关)。
下表示出切片报头的一些示例语法。
[表8]
参考上表,只有当sps_alf_enabled_flag是1时才可以执行sps_ccalf_enabled_flag的解析。可以基于表4来描述表中包括的语法元素。在示例中,由编码设备编码或者由解码设备获得(接收)的图像信息可以包括切片报头信息(slice_header())。基于CCALF启用标志(sps_ccalf_flag)的值是1的确定,切片报头信息包括与CC-ALF是否可用于滤波的重构色度样本的Cb颜色分量有关的第一标志(slice_cross_component_alf_cb_enabeld_flag)和与CC-ALF是否可用于滤波的重构色度样本的Cr颜色分量有关的第二标志(slice_cross_component_alf_cr_enabeld_flag)。
在示例中,基于第一标志(slice_cross_component_alf_cb_enabeld_flag)的值是1的确定,切片报头信息可以包括用于推导用于Cb颜色分量的交叉分量滤波器系数的第一APS的ID信息(slice_cross_component_alf_cb_aps_id)。基于第二标志(slice_cross_component_alf_cr_enabeld_flag)的值是1的确定,切片报头信息可以包括用于推导用于Cr颜色分量的交叉分量滤波器系数的第二APS的ID信息(slice_cross_component_alf_cr_aps_id)。
下表示出根据本实施例的另一示例的SPS语法的一部分。
[表9]
下表示例性地示出切片报头语法的一部分。
[表10]
参考表9,当ChromaArrayType不是0并且ALF启用标志(sps_alf_enabled_flag)是1时,SPS可以包括CCALF启用标志(sps_ccalf_enabled_flag)。例如,如果ChromaArrayType不是0,则色度格式可以不是单色,并且可以基于色度格式不是单色的情况通过SPS来发送CCALF启用标志。
参考表9,基于ChromaArrayType不是0的情况,关于CCALF的信息(slice_cross_component_alf_cb_enabled_flag、slice_cross_component_alf_cb_aps_id、slice_cross_component_alf_cr_enabled_flag、slice_cross_component_alf_cr)可以被包括在切片报头信息中。
在示例中,由编码设备编码或者由解码设备获得的图像信息可以包括SPS。SPS可以包括与ALF是否可用有关的第一ALF启用标志(sps_alf_enabled_flag)。例如,基于第一ALF启用标志的值是1的确定,SPS可以包括与交叉分量滤波是否可用有关的CCALF启用标志。在另一例中,如果不使用sps_ccalf_enabled_flag并且sps_alf_enabled_flag是1,则可以始终应用CCALF(sps_ccalf_enabled_flag==1)。
下表示出根据本实施例的另一示例的切片报头语法的一部分。
[表11]
参考上表,只有当ALF启用标志(sps_alf_enabled_flag)是1时才可以执行CCALF启用标志(sps_ccalf_enabled_flag)的解析。
下表示出用于上表中包括的语法元素的示例性语义。
[表12]
可以通过下表的语义来描述上表的slice_ccalf_chroma_idc。
[表13]
下表示出根据本实施例的另一示例的切片报头语法的一部分。
[表14]
可以根据表12或表13来描述表中包括的语法元素。另外,当色度格式不是单色时,CCALF相关信息可以被包括在切片报头中。
下表示出根据本实施例的另一示例的切片报头语法的一部分。
[表15]
下表示出用于上表中包括的语法元素的示例性语义。
[表16]
下表示出根据此实施例的另一示例的切片报头语法的一部分。可以根据表12或表13来描述下表中包括的语法元素。
[表17]
参考上表,可以通过slice_alf_enabled_flag一次确定是否应用切片单元ALF和CC-ALF。在解析slice_alf_chroma_idc之后,当第一ALF启用标志(sps_alf_enabled_flag)是1时,可以解析slice_ccalf_chroma_idc。
参考上表,只有当slice_alf_enabled_flag是1时才可以确定sps_ccalf_enabeld_flag在切片报头信息中是否是1。切片报头信息可以包括与ALF是否可用有关的第二ALF启用标志(slice_alf_enabled_flag)。基于第二ALF启用标志(slice_alf_enabled_flag)的值是1的确定,CCALF可能可用于切片。
下表示例性地示出APS语法的一部分。语法元素adaptation_parameter_set_id可以指示APS的标识符信息(ID信息)。
[表18]
下表示出用于ALF数据的示例语法。
[表19]
参考以上两个表,APS可以包括ALF数据(alf_data())。可以将包括ALF数据的APS称为ALF APS(ALF类型APS)。也就是说,包括ALF数据的APS的类型可以是ALF类型。可以将APS的类型确定为关于APS类型的信息或语法元素(aps_params_type)。ALF数据可以包括与是否用信号通知用于Cb颜色分量的交叉分量滤波器有关的Cb滤波器信号标志(alf_cross_component_cb_filter_signal_flag或alf_cc_cb_filter_signal_flag)。ALF数据可以包括与是否用信号通知用于Cr颜色分量的交叉分量滤波器有关的Cr滤波器信号标志(alf_cross_component_cr_filter_signal_flag或alf_cc_cr_filter_signal_flag)。
在示例中,基于Cr滤波器信号标志,ALF数据可以包括关于用于Cr颜色分量的交叉分量滤波器系数的绝对值的信息(alf_cross_component_cr_coeff_abs)和关于用于Cr颜色分量的交叉分量滤波器系数的符号的信息(alf_cross_component_cr_coeff_sign)。基于关于用于Cr颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cr颜色分量的交叉分量滤波器系数的符号的信息,可以推导用于Cr颜色分量的交叉分量滤波器系数。
在示例中,ALF数据可以包括关于用于Cb颜色分量的交叉分量滤波器系数的绝对值的信息(alf_cross_component_cb_coeff_abs)和关于用于Cb颜色分量的交叉分量滤波器系数的符号的信息(alf_cross_component_cb_coeff_sign)。基于关于用于Cb颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cb颜色分量的交叉分量滤波器系数的符号的信息,可以推导用于Cb颜色分量的交叉分量滤波器系数。
下表示出根据另一示例的与ALF数据有关的语法。
[表20]
参考上表,在首先发送alf_cross_component_filter_signal_flag之后,当alf_cross_component_filter_signal_flag是1时,可以发送Cb/Cr滤波器信号标志。也就是说,alf_cross_component_filter_signal_flag对Cb/Cr进行整合以确定是否发送CC-ALF滤波器系数。
下表示出根据另一示例的与ALF数据有关的语法。
[表21]
下表示出用于上表中包括的语法元素的示例性语义。
[表22]
下表示出根据另一示例的与ALF数据有关的语法。
[表23]
下表示出用于上表中包括的语法元素的示例性语义。
[表24]
在上述两个表中,用于解析alf_cross_component_cb_coeff_abs[j]和alf_cross_component_cr_coeff_abs[j]语法的exp-Golomb二值化的阶数可以由值0至9之一定义。
参考上述两个表,ALF数据可以包括与是否用信号通知用于Cb颜色分量的交叉分量滤波器有关的Cb滤波器信号标志(alf_cross_component_cb_filter_signal_flag或alf_cc_cb_filter_signal_flag)。基于Cb滤波器信号标志(alf_cross_component_cb_filter_signal_flag),ALF数据可以包括与用于Cb颜色分量的交叉分量滤波器的数目有关的信息(ccalf_cb_num_alt_filters_minus1)。基于与用于Cb颜色分量的交叉分量滤波器的数目有关的信息,ALF数据可以包括关于用于Cb颜色分量的交叉分量滤波器系数的绝对值的信息(alf_cross_component_cb_coeff_abs)和关于用于Cb颜色分量的交叉分量滤波器系数的符号的信息(alf_cross_component_cr_coeff_sign)。基于关于用于Cb颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cb颜色分量的交叉分量滤波器系数的符号的信息,可以推导用于Cb颜色分量的交叉分量滤波器系数。
在示例中,ALF数据可以包括与是否用信号通知用于Cr颜色分量的交叉分量滤波器有关的Cr滤波器信号标志(alf_cross_component_cr_filter_signal_flag或alf_cc_cr_filter_signal_flag)。基于Cr滤波器信号标志(alf_cross_component_cr_filter_signal_flag),ALF数据可以包括与用于Cr颜色分量的交叉分量滤波器的数目有关的信息(ccalf_cr_num_alt_filters_minus1)。基于与用于Cr颜色分量的交叉分量滤波器的数目有关的信息,ALF数据可以包括关于用于Cr颜色分量的交叉分量滤波器系数的绝对值的信息(alf_cross_component_cr_coeff_abs)和关于用于Cr颜色分量的交叉分量滤波器系数的符号的信息(alf_cross_component_cr_coeff_sign)。基于用于Cr颜色分量的交叉分量滤波器系数的绝对值的信息和用于Cr颜色分量的交叉分量滤波器系数的符号的信息,可以推导用于Cr颜色分量的交叉分量滤波器系数。
下表示出根据本公开的实施例的有关编译树单元的语法。
[表25]
下表示出用于上表中包括的语法元素的示例性语义。
[表26]
下表示出根据此实施例的另一示例的编译树单元语法。
[表27]
参考上表,能够以CTU为单位应用CCALF。在示例中,图像信息可以包括关于编译树单元的信息(coding_tree_unit())。关于编译树单元的信息可以包括关于是否对Cb颜色分量的当前块应用交叉分量滤波器的信息(ccalf_ctb_flag[0])和/或关于是否对Cr颜色分量的当前块应用交叉分量滤波器的信息(ccalf_ctb_flag[1])。另外,关于编译树单元的信息可以包括关于应用于Cb颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息(ccalf_ctb_filter_alt_idx[0])和/或关于应用于Cr颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息(ccalf_ctb_filter_alt_idx[1])。可以根据语法slice_ccalf_enabled_flag和slice_ccalf_chroma_idc自适应地发送语法。
下表示出根据本实施例的另一示例的编译树单元语法。
[表28]
下表示出用于上表中包括的语法元素的示例性语义。
[表29]
下表示出根据本实施例的另一示例的编译树单元语法。可以根据表29来描述下表中包括的语法元素。
[表30]
在示例中,图像信息可以包括关于编译树单元的信息(coding_tree_unit())。关于编译树单元的信息可以包括关于是否对Cb颜色分量的当前块应用交叉分量滤波器的信息(ccalf_ctb_flag[0])和/或关于是否对Cr颜色分量的当前块应用交叉分量滤波器的信息(ccalf_ctb_flag[1])。另外,关于编译树单元的信息可以包括关于应用于Cb颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息(ccalf_ctb_filter_alt_idx[0])和/或关于应用于Cr颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息(ccalf_ctb_filter_alt_idx[1])。
图11和图12示意性地示出根据本公开的实施例的视频/图像编码方法和相关组件的示例。图11中公开的方法可以由图2中公开的编码装置执行。具体地,例如,图11的S1100可以由编码装置的加法器250执行,S1110至S1140可以由编码装置的滤波器260执行,并且S1570可以由编码装置的熵编码器240执行。图11公开的方法可以包括以上在本公开中描述的实施例。
参考图11,编码装置可以生成当前块的重构亮度样本和重构色度样本(S1100)。编码装置可以生成残差亮度样本和/或残差色度样本。编码装置可以基于残差亮度样本来生成重构亮度样本并且可以基于残差色度样本来生成重构色度样本。
在示例中,可以基于当前块的原始样本和预测样本来生成用于当前块的残差样本。具体地,编码装置可以基于预测模式来生成当前块的预测样本。在这种情况下,可以应用本公开中公开的各种预测方法,诸如帧间预测或帧内预测。可以基于预测样本和原始样本来生成残差样本。
在示例中,编码装置可以生成残差亮度样本。可以基于原始亮度样本和预测亮度样本来生成残差亮度样本。在示例中,编码装置可以生成残差色度样本。可以基于原始色度样本和预测色度样本来生成残差色度样本。
编码装置可以推导变换系数。编码装置可以基于用于残差样本的变换过程来推导变换系数。编码装置可以推导用于残差亮度样本的变换系数(亮度变换系数)和/或用于残差色度样本的变换系数(色度变换系数)。例如,变换过程可以包括DCT、DST、GBT或CNT中的至少一个。
编码装置可以推导量化变换系数。编码装置可以基于用于变换系数的量化过程来推导量化变换系数。量化变换系数可以具有基于系数扫描顺序的一维矢量形式。量化变换系数可以包括量化亮度变换系数和/或量化色度变换系数。
编码设备可以生成残差信息。编码装置可以生成指示(包括)量化变换系数的残差信息。可以通过诸如指数哥伦布(exponential Golomb)、CAVLC、CABAC等的各种编码方法来生成残差信息。
编码设备可以生成预测相关信息。编码装置可以基于预测样本和/或应用于其的模式来生成预测相关信息。预测相关信息可以包括关于各种预测模式(例如,合并模式、MVP模式等)的信息、MVD信息等。
编码设备可以推导用于ALF过程的ALF滤波器系数(S1110)。ALF滤波器系数可以包括用于重构亮度样本的ALF亮度滤波器系数和用于重构色度样本的ALF色度滤波器系数。可以基于ALF滤波器系数来生成滤波的重构亮度样本和/或滤波的重构色度样本。
编码设备可以生成ALF相关信息(S1120)。编码装置可以基于ALF滤波器系数来生成ALF相关信息。编码装置推导可以被应用于滤波重构样本的ALF相关参数,并且生成ALF相关信息。例如,ALF相关信息可以包括以上在本公开中描述的ALF相关信息。
编码装置可以推导交叉分量滤波器(CCALF滤波器)和/或交叉分量滤波器系数(CCALF滤波器系数)(S1130)。可以在CCALF过程中使用交叉分量滤波器和/或交叉分量滤波器系数。可以基于交叉分量滤波器和/或交叉分量滤波器系数来生成修改滤波的重构色度样本。
编码设备可以生成交叉分量滤波相关信息(或CCALF相关信息)(S1140)。在示例中,交叉分量滤波相关信息可以包括关于交叉分量滤波器的数目的信息和关于交叉分量滤波器系数的信息。交叉分量滤波器可以包括用于Cb颜色分量的交叉分量滤波器和用于Cr颜色分量的交叉分量滤波器。
在示例中,CCALF相关信息可以包括CCALF启用标志、与CCALF是否可用于Cb(或Cr)颜色分量有关的标志、与是否用信号通知用于Cb(或Cr)颜色分量的交叉分量滤波器有关的Cb(或Cr)滤波器信号标志、与用于Cb(或Cr)颜色分量的交叉分量滤波器的数目有关的信息、关于用于Cb(或Cr)颜色分量的交叉分量滤波器系数的值的信息、关于用于Cb(或Cr)颜色分量的交叉分量滤波器系数的绝对值的信息、关于用于Cb(或Cr)颜色分量的交叉分量滤波器系数的符号的信息、和/或关于是否对在关于编译树单元的信息(编译树单元语法)中的Cb(或Cr)颜色分量的当前块应用交叉分量滤波器的信息。
图像/视频信息可以包括根据本公开的实施例的各种类型的信息。例如,图像/视频信息可以包括在上述表1至表30中的至少一个中公开的信息。
在实施例中,图像信息可以包括序列参数集(SPS)。SPS可以包括与交叉分量滤波是否可用有关的CCALF启用标志。基于CCALF启用标志是1的确定,可以推导包括用于推导用于CCALF的交叉分量滤波器系数的ALF数据的自适应参数集(APS)的ID信息(标识符信息)。图像信息可以包括切片报头信息。
根据实施例的示例,切片报头信息可以包括包含用于推导交叉分量滤波器系数的ALF数据的APS的ID信息。在另一示例中,基于CCALF启用标志是1的确定,切片报头信息可以包括包含用于推导交叉分量滤波器系数的ALF数据的APS的ID信息。
在实施例中,SPS可以包括与ALF是否可用有关的ALF启用标志(sps_ccalf_enabled_flag)。基于第一ALF启用标志的值是1的确定,SPS可以包括与交叉分量滤波是否可用有关的CCALF启用标志。
在实施例中,图像信息可以包括切片报头信息和自适应参数集(APS)。报头信息可以包括与包括ALF数据的APS的标识符有关的信息。例如,可以基于ALF数据来推导交叉分量滤波器系数。
在实施例中,切片报头信息可以包括与ALF是否可用有关的ALF启用标志(slice_alf_enabled_flag)。可以将sps_alf_enabled_flag和slice_alf_enabled_flag分别称为第一ALF启用标志和第二ALF启用标志。基于ALF启用标志(slice_alf_enabled_flag)的值是1的确定,可以确定CCALF启用标志的值是否是1。在示例中,基于ALF启用标志的值是1的确定,CCALF对于切片可以是可用的。
在实施例中,报头信息(切片报头信息)可以包括与CCALF是否可用于滤波的重构色度样本的Cb颜色分量有关的第一标志和与CCALF是否可用于滤波的重构色度样本的Cr颜色分量有关的第二标志。在另一示例中,基于ALF启用标志(slice_alf_enabled_flag)的值是1的确定,报头信息(切片报头信息)可以包括与CCALF是否可用于滤波的重构色度样本的Cb颜色分量有关的第一标志和与CCALF是否可用于滤波的重构色度样本的Cr颜色分量有关的第二标志。
在实施例中,基于第一标志的值是1的确定,切片报头信息可以包括用于推导用于Cb颜色分量的交叉分量滤波器系数的第一APS的ID信息(与第二APS的标识符有关的信息)。基于第二标志的值是1的确定,切片报头信息可以包括用于推导用于Cr颜色分量的交叉分量滤波器系数的第二APS的ID信息(与第二APS的标识符有关的信息)。
在实施例中,包括在第一APS中的第一ALF数据可以包括与是否用信号通知用于Cb颜色分量的交叉分量滤波器有关的Cb滤波器信号标志。基于Cb滤波器信号标志,第一ALF数据可以包括与用于Cb颜色分量的交叉分量滤波器的数目有关的信息。基于与用于Cb颜色分量的交叉分量滤波器的数目有关的信息,第一ALF数据可以包括关于用于Cb颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cb颜色分量的交叉分量滤波器系数的符号的信息。基于关于用于Cb颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cb颜色分量的交叉分量滤波器系数的符号的信息,可以推导用于Cb颜色分量的交叉分量滤波器系数。
在实施例中,与用于Cb颜色分量的交叉分量滤波器的数目有关的信息可以是零阶指数哥伦布(第0EG)编译的。
在实施例中,包括在第二APS中的第二ALF数据可以包括与是否用信号通知用于Cr颜色分量的交叉分量滤波器有关的Cr滤波器信号标志。基于Cr滤波器信号标志,第二ALF数据可以包括与用于Cr颜色分量的交叉分量滤波器的数目有关的信息。基于与用于Cr颜色分量的交叉分量滤波器的数目有关的信息,第二ALF数据可以包括关于用于Cr颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cr颜色分量的交叉分量滤波器系数的符号的信息。基于关于用于Cr颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cr颜色分量的交叉分量滤波器系数的符号的信息,可以推导用于Cr颜色分量的交叉分量滤波器系数。
在实施例中,与用于Cr颜色分量的交叉分量滤波器的数目有关的信息可以是零阶指数哥伦布(第0EG)编译的。
在实施例中,图像信息可以包括关于编译树单元的信息。关于编译树单元的信息可以包括关于是否对Cb颜色分量的当前块应用交叉分量滤波器的信息和/或关于是否对Cr颜色分量的当前块应用交叉分量滤波器的信息。
在实施例中,关于编译树单元的信息可以包括关于应用于Cb颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息和/或关于应用于Cr颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息。
图13和图14示意性地示出根据本公开的实施例的视频/图像解码方法和相关组件的示例。图13中公开的方法可以由图3或图14中图示的解码装置执行。具体地,例如,图13的S1300可以由解码装置的熵解码器310执行,S1310可以由解码装置的加法器340执行,并且S1320至S1330可以由解码装置的滤波器350执行。
参考图13,解码装置可以接收/获取视频/图像信息(S1300)。视频/图像信息可以包括预测相关信息和/或残差信息。解码装置可以通过比特流来接收/获取图像/视频信息。可以通过诸如指数哥伦布、CAVLC、CABAC等的各种编码方法来生成残差信息。在示例中,视频/图像信息还可以包括CCAL相关信息。例如,在示例中,CCALF相关信息可以包括CCALF启用标志、与CCALF是否可用于Cb(或Cr)颜色分量有关的标志、与是否用信号通知用于Cb(或Cr)颜色分量的交叉分量滤波器有关的Cb(或Cr)滤波器信号标志、与用于Cb(或Cr)颜色分量的交叉分量滤波器的数目有关的信息、关于用于Cb(或Cr)颜色分量的交叉分量滤波器系数的绝对值的信息、关于用于Cb(或Cr)颜色分量的交叉分量滤波器系数的符号的信息、和/或关于是否对在关于编译树单元的信息(编译树单元语法)中的Cb(或Cr)颜色分量的当前块应用交叉分量滤波器的信息。
图像/视频信息可以包括根据本公开的实施例的各种类型的信息。例如,图像/视频信息可以包括在上述表1至表30中的至少一个中公开的信息。
解码装置可以推导变换系数。具体地,解码装置可以基于残差信息来推导量化变换系数。变换系数可以包括亮度变换系数和色度变换系数。量化变换系数可以具有基于系数扫描顺序的一维矢量形式。解码装置可以基于针对量化变换系数的解量化过程来推导变换系数。
解码装置可以推导残差样本。解码装置可以基于变换系数来推导残差样本。残差样本可以包括残差亮度样本和残差色度样本。例如,可以基于亮度变换系数来推导残差亮度样本,并且可以基于色度变换系数来推导残差色度样本。另外,可以基于当前块的原始样本和预测样本来推导用于当前块的残差样本。
解码装置可以基于图像/视频信息来执行预测并且推导当前块的预测样本。解码装置可以基于预测相关信息来推导当前块的预测样本。预测相关信息可以包括预测模式信息。解码装置可以基于预测模式信息来确定是否对当前块应用帧间预测或帧内预测,并且可以基于此来执行预测。预测样本可以包括预测亮度样本和/或预测色度样本。
解码装置可以生成/推导重构亮度样本和/或重构色度样本(S1310)。重构样本可以包括重构亮度样本和/或重构色度样本。解码装置可以基于残差亮度样本来生成重构亮度样本。解码装置可以基于残差色度样本来生成重构色度样本。重构样本的亮度分量可以对应于重构亮度样本,并且重构样本的色度分量可以对应于重构色度样本。
解码装置可以针对重构色度样本执行自适应环路滤波器(ALF)过程以生成滤波的重构色度样本(S1320)。在ALF过程中,解码装置可以推导用于重构色度样本的ALF过程的ALF滤波器系数。另外,解码装置可以推导用于重构亮度样本的ALF过程的ALF滤波器系数。可以基于APS中的ALF数据中包括的ALF参数来推导ALF滤波器系数。
解码装置可以生成滤波的重构色度样本。解码装置可以基于重构色度样本和ALF滤波器系数来生成滤波的重构样本。
为了生成修改滤波的重构色度样本,解码装置可以对滤波的重构色度样本执行交叉分量滤波过程(S1330)。在交叉分量滤波过程中,解码装置可以推导用于交叉分量滤波的交叉分量滤波器系数。可以基于前述APS中包括的ALF数据中的CCALF相关信息来推导交叉分量滤波器系数,并且相应APS的标识符(ID)信息可以被包括在切片报头中(可以通过其用信号通知)。
解码装置可以生成修改滤波的重构色度样本。解码装置可以基于重构亮度样本、滤波的重构色度样本和交叉分量滤波器系数来生成修改且滤波的重构色度样本。在示例中,解码装置可以推导重构亮度样本之中的两个样本之间的差,并且将该差乘以交叉分量滤波器系数之中的一个滤波器系数。基于乘法结果和滤波的重构色度样本,解码装置可以生成修改滤波的重构色度样本。例如,解码装置可以基于乘积和滤波的重构色度样本之一的和来生成修改滤波的重构色度样本。
在实施例中,图像信息可以包括序列参数集(SPS)。SPS可以包括与交叉分量滤波是否可用有关的CCALF启用标志。基于CCALF启用标志是1的确定,可以推导包括用于推导用于CCALF的交叉分量滤波器系数的ALF数据的自适应参数集(APS)的ID信息(标识符信息)。图像信息可以包括切片报头信息。
根据实施例的示例,切片报头信息可以包括包含用于推导交叉分量滤波器系数的ALF数据的APS的ID信息。在另一示例中,基于CCALF启用标志是1的确定,切片报头信息可以包括包含用于推导交叉分量滤波器系数的ALF数据的APS的ID信息。
在实施例中,SPS可以包括与ALF是否可用有关的ALF启用标志(sps_ccalf_enabled_flag)。基于ALF启用标志(sps_ccalf_enabled_flag)的值是1的确定,SPS可以包括与交叉分量滤波是否可用有关的CCALF启用标志。
在实施例中,图像信息可以包括切片报头信息和自适应参数集(APS)。报头信息可以包括与包括ALF数据的APS的标识符有关的信息。例如,可以基于ALF数据来推导交叉分量滤波器系数。
在实施例中,切片报头信息可以包括与ALF是否可用有关的ALF启用标志(slice_alf_enabled_flag)。可以将sps_alf_enabled_flag和slice_alf_enabled_flag分别称为第一ALF启用标志和第二ALF启用标志。基于ALF启用标志(slice_alf_enabled_flag)的值是1的确定,可以确定CCALF启用标志的值是否是1。在示例中,基于ALF启用标志的值是1的确定,CCALF可以是可用的。
在实施例中,报头信息(切片报头信息)可以包括与CCALF是否可用于滤波的重构色度样本的Cb颜色分量有关的第一标志和与CCALF是否可用于滤波的重构色度样本的Cr颜色分量有关的第二标志。在另一示例中,基于ALF启用标志(slice_alf_enabled_flag)的值是1的确定,报头信息(切片报头信息)可以包括与CCALF是否可用于滤波的重构色度样本的Cb颜色分量有关的第一标志和与CCALF是否可用于滤波的重构色度样本的Cr颜色分量有关的第二标志。
在实施例中,基于第一标志的值是1的确定,切片报头信息可以包括用于推导用于Cb颜色分量的交叉分量滤波器系数的第一APS的ID信息(与第二APS的标识符有关的信息)。基于第二标志的值是1的确定,切片报头信息可以包括用于推导用于Cr颜色分量的交叉分量滤波器系数的第二APS的ID信息(与第二APS的标识符有关的信息)。
在实施例中,包括在第一APS中的第一ALF数据可以包括与是否用信号通知用于Cb颜色分量的交叉分量滤波器有关的Cb滤波器信号标志。基于Cb滤波器信号标志,第一ALF数据可以包括与用于Cb颜色分量的交叉分量滤波器的数目有关的信息。基于与用于Cb颜色分量的交叉分量滤波器的数目有关的信息,第一ALF数据可以包括关于用于Cb颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cb颜色分量的交叉分量滤波器系数的符号的信息。基于关于用于Cb颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cb颜色分量的交叉分量滤波器系数的符号的信息,可以推导用于Cb颜色分量的交叉分量滤波器系数。
在实施例中,与用于Cb颜色分量的交叉分量滤波器的数目有关的信息可以是零阶指数哥伦布(第0EG)编译的。
在实施例中,包括在第二APS中的第二ALF数据可以包括与是否用信号通知用于Cr颜色分量的交叉分量滤波器有关的Cr滤波器信号标志。基于Cr滤波器信号标志,第二ALF数据可以包括与用于Cr颜色分量的交叉分量滤波器的数目有关的信息。基于与用于Cr颜色分量的交叉分量滤波器的数目有关的信息,第二ALF数据可以包括关于用于Cr颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cr颜色分量的交叉分量滤波器系数的符号的信息。基于关于用于Cr颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于Cr颜色分量的交叉分量滤波器系数的符号的信息,可以推导用于Cr颜色分量的交叉分量滤波器系数。
在实施例中,与用于Cr颜色分量的交叉分量滤波器的数目有关的信息可以是零阶指数哥伦布(第0EG)编译的。
在实施例中,图像信息可以包括关于编译树单元的信息。关于编译树单元的信息可以包括关于是否对Cb颜色分量的当前块应用交叉分量滤波器的信息和/或关于是否对Cr颜色分量的当前块应用交叉分量滤波器的信息。
在实施例中,关于编译树单元的信息可以包括关于应用于Cb颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息和/或关于应用于Cr颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息。
在存在针对当前块的残差样本的情况下,解码装置可以接收关于针对当前块的残差的信息。关于残差的信息可以包括针对残差样本的变换系数。解码装置可以基于残差信息来推导针对当前块的残差样本(或残差样本阵列)。具体地,解码装置可以基于残差信息来推导量化的变换系数。量化的变换系数可以具有基于系数扫描次序的一维矢量形式。解码装置可以基于针对量化的变换系数的解量化处理来推导变换系数。解码装置可以基于变换系数来推导残差样本。
解码装置可以基于(帧内)预测样本和残差样本来生成重构样本,并且可以基于重构样本来推导重构块或重构图片。具体地,解码装置可以基于(帧内)预测样本与残差样本之和来生成重构样本。此后,如上所述,如果需要,则解码装置可以对重构图片应用环路滤波处理(例如,去块滤波和/或SAO处理),以提高主观/客观图片质量。
例如,解码装置可以通过对比特流或编码的信息进行解码来获得包括所有或一些上述信息(或语法元素)的图像信息。此外,比特流或编码的信息可以存储在计算机可读存储介质中,或者可以使上述解码方法被执行。
在上述实施例中,基于具有一系列步骤或框的流程图来描述方法。本公开不限于上述步骤或框的次序。一些步骤或框可以与如上所述的其它步骤或框同时发生或以与如上所述的其它步骤或框不同的次序发生。此外,本领域技术人员将理解,上述流程图所示的步骤并非排他性的,可以包括另外的步骤,或者可以删除流程图中的一个或更多个步骤,而不影响本文档的范围。
根据本文档的上述实施例的所述方法可以以软件形式实现,并且可以将根据本文档的编码装置和/或解码装置例如包括在TV、计算机、智能电话、机顶盒和显示设备等的执行图像处理的设备中。
当本文档中的实施例以软件实现时,上述方法可以实现为执行上述功能的模块(处理、功能等)。模块可以被存储在存储器中并由处理器执行。存储器可以在处理器内部或外部并且可以通过各种公知手段联接至处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理设备。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储设备。也就是说,可以在处理器、微处理器、控制器或芯片上实现并执行本文档中描述的实施例。例如,可以在计算机、处理器、微处理器、控制器或芯片上实现并执行每个附图中示出的功能单元。在这种情况下,可以在数字存储介质中存储关于针对实现方式的指令或算法的信息。
另外,应用本文档的解码装置和编码装置可以被包括在多媒体广播发送/接收装置、移动通信终端、家庭影院视频装置、数字影院视频装置、监控摄像头、视频聊天装置、诸如视频通信的实时通信装置、移动流传输装置、存储介质、摄像机、VoD服务提供装置、过顶(OTT)视频装置、互联网流传输服务提供装置、三维(3D)视频装置、电话会议视频装置、交通用户设备(即,车载用户设备、飞机用户设备、船舶用户设备等)和医疗视频装置中,并且可以用于处理视频信号和数据信号。例如,过顶(OTT)视频装置可以包括游戏机、蓝光播放器、互联网接入电视、家庭影院系统、智能电话、平板电脑、数字视频录像机(DVR)等。
此外,应用本文档的处理方法可以以由计算机执行的程序的形式产生并且可以被存储在计算机可读记录介质中。也可以将具有根据本公开的数据结构的多媒体数据存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机系统可读的数据的所有种类的存储设备。例如,计算机可读记录介质可以包括BD、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储设备。此外,计算机可读记录介质包括以载波(即,通过互联网的传输)的形式实现的介质。另外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中或者可以通过有线或无线通信网络来发送。
另外,可以利用根据程序代码的计算机程序产品来实现本文档的实施例,并且可以按照本文档的实施例在计算机中执行程序代码。可以将程序代码存储在计算机可读的载体上。
图15示出可以应用本文档中公开的实施例的内容流传输系统的示例。
参考图15,应用本文档的实施例的内容流传输系统可以主要包括编码服务器、流传输服务器、网络(web)服务器、媒体存储、用户设备和多媒体输入设备。
编码服务器将从多媒体输入设备(例如,智能电话、相机、摄像机等)输入的内容压缩为数字数据,以生成比特流,并且将该比特流发送至流传输服务器。作为另一示例,在诸如智能电话、相机、摄像机等的多媒体输入设备直接生成比特流时,可以省略编码服务器。
可以通过应用本公开的实施例的编码方法或比特流生成方法来生成比特流,并且流传输服务器可以在发送或接收比特流的处理中暂时存储比特流。
流传输服务器基于用户的请求通过web服务器向用户设备发送多媒体数据,该web服务器充当向用户通知服务的介质。当用户从web服务器请求期望的服务时,web服务器将请求传递至流传输服务器,并且流传输服务器将多媒体数据发送至用户。在这种情况下,内容流传输系统可以包括单独的控制服务器。在这种情况下,控制服务器用来控制内容流传输系统中的设备之间的命令/响应。
流传输服务器可以从媒体存储和/或编码服务器接收内容。例如,在从编码服务器接收到内容时,可以实时地接收内容。在这种情况下,为了提供流畅的流传输服务,流传输服务器可以将比特流存储预定时间。
用户设备的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、板式PC、平板PC、超极本、可穿戴设备(例如,智能手表、智能眼镜、头戴式显示器)、数字TV、台式计算机、数字标牌等。可以将内容流传输系统中的每个服务器作为分布式服务器操作,并且在这种情况下,从每个服务器接收到的数据可以被分发。
可以将内容流传输系统中的每个服务器作为分布式服务器操作,并且在这种情况下,可以以分布式方式处理从每个服务器接收到的数据。
本文所述的权利要求可以以各种方式组合。例如,可以将本文档的方法权利要求的技术特征组合并实现为装置,也可以将本文档的装置权利要求的技术特征组合并实现为方法。另外,本文档的方法权利要求的技术特征和装置权利要求的技术特征可以组合以实现为装置,并且本文档的方法权利要求的技术特征和装置权利要求的技术特征可以组合并实现为方法。
Claims (19)
1.一种用于由解码装置执行的图像解码的方法,所述方法包括:
通过比特流来接收图像信息;
基于所述图像信息,生成重构亮度样本和重构色度样本;
对所述重构色度样本执行自适应环路滤波(ALF)过程以生成滤波的重构色度样本;以及
对所述滤波的重构色度样本执行交叉分量滤波过程以生成修改滤波的重构色度样本,
其中,所述图像信息包括关于交叉分量滤波的信息,以及
所述交叉分量滤波过程的执行包括:
基于关于所述交叉分量滤波的信息,推导用于所述交叉分量滤波的交叉分量滤波器的数目;
基于所述交叉分量滤波器的数目,推导用于所述交叉分量滤波过程的交叉分量滤波器系数;以及
基于所述滤波的重构色度样本和所述交叉分量滤波器系数,生成所述修改滤波的重构色度样本。
2.根据权利要求1所述的方法,其中,
所述交叉分量滤波器包括用于所述滤波的重构色度样本的Cb颜色分量的交叉分量滤波器和用于所述滤波的重构色度样本的Cr颜色分量的交叉分量滤波器,
所述图像信息包括包含第一ALF数据的第一自适应参数集(APS)和包含第二ALF数据的第二APS,
所述第一ALF数据包括关于用于所述Cb颜色分量的交叉分量滤波器的数目的信息,以及
所述第二ALF数据包括关于用于所述Cr颜色分量的交叉分量滤波器的数目的信息。
3.根据权利要求2所述的方法,其中,
基于关于用于所述Cb颜色分量的交叉分量滤波器的数目的信息,所述第一ALF数据包括关于用于所述Cb颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于所述Cb颜色分量的交叉分量滤波器系数的符号的信息,以及
基于关于用于所述Cb颜色分量的所述交叉分量滤波器系数的绝对值的信息和关于用于所述Cb颜色分量的所述交叉分量滤波器系数的符号的信息,推导用于所述Cb颜色分量的所述交叉分量滤波器系数。
4.根据权利要求2所述的方法,其中,
基于用于所述Cr颜色分量的交叉分量滤波器的数目的信息,所述第二ALF数据包括关于用于所述Cr颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于所述Cr颜色分量的交叉分量滤波器系数的符号的信息,以及
基于关于用于所述Cr颜色分量的所述交叉分量滤波器系数的绝对值的信息和关于用于所述Cr颜色分量的所述交叉分量滤波器系数的符号的信息,推导用于所述Cr颜色分量的所述交叉分量滤波器系数。
5.根据权利要求1所述的方法,其中,
所述图像信息包括关于编译树单元的信息,以及
关于所述编译树单元的信息包括:
关于是否对Cb颜色分量的当前块应用交叉分量滤波器的信息;以及
关于是否对Cr颜色分量的当前块应用交叉分量滤波器的信息。
6.根据权利要求1所述的方法,其中,
所述图像信息包括关于编译树单元的信息,以及
关于所述编译树单元的信息包括:
关于应用于Cb颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息;以及
关于应用于Cr颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息。
7.根据权利要求1所述的方法,其中,
所述图像信息包括序列参数集(SPS),
所述SPS包括与所述交叉分量滤波是否可用有关的交叉分量自适应环路滤波器(CCALF)启用标志。
8.根据权利要求1所述的方法,其中,
所述图像信息包括切片报头信息,
所述切片报头信息包括与所述ALF是否可用有关的ALF启用标志,以及
基于所述ALF启用标志的值是1的确定,所述交叉分量滤波是可用的。
9.根据权利要求1所述的方法,其中,
所述图像信息包括切片报头信息,以及
所述切片报头信息包括自适应参数集(APS)的ID信息,所述APS包括用于推导所述交叉分量滤波器系数的ALF数据。
10.一种用于由编码装置执行的图像编码的方法,所述方法包括:
生成当前图片中的当前块的重构亮度样本和重构色度样本;
推导用于自适应环路滤波(ALF)过程的ALF滤波器系数;
基于所述ALF滤波器系数,生成ALF相关信息;
推导用于交叉分量滤波过程的交叉分量滤波器和交叉分量滤波器系数;
基于所述交叉分量滤波器和所述交叉分量滤波器系数,生成交叉分量滤波相关信息;以及
对包括用于生成所述重构样本的信息、所述ALF相关信息和所述交叉分量滤波相关信息的图像信息进行编码,
其中,所述交叉分量滤波相关信息包括关于所述交叉分量滤波器的数目的信息和关于所述交叉分量滤波器系数的信息。
11.根据权利要求10所述的方法,其中,
所述交叉分量滤波器包括用于Cb颜色分量的交叉分量滤波器和用于Cr颜色分量的交叉分量滤波器,
所述图像信息包括包含第一ALF数据的第一自适应参数集(APS)和包含第二ALF数据的第二APS,
所述第一ALF数据包括关于用于所述Cb颜色分量的交叉分量滤波器的数目的信息,以及
所述第二ALF数据包括关于用于所述Cr颜色分量的交叉分量滤波器的数目的信息。
12.根据权利要求11所述的方法,其中,
基于关于用于所述Cb颜色分量的交叉分量滤波器的数目的信息,所述第一ALF数据包括关于用于所述Cb颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于所述Cb颜色分量的交叉分量滤波器系数的符号的信息,以及
基于关于用于所述Cb颜色分量的所述交叉分量滤波器系数的绝对值的信息和关于用于所述Cb颜色分量的所述交叉分量滤波器系数的符号的信息来推导用于所述Cb颜色分量的所述交叉分量滤波器系数。
13.根据权利要求11所述的方法,其中,
基于用于所述Cr颜色分量的交叉分量滤波器的数目的信息,所述第二ALF数据包括关于用于所述Cr颜色分量的交叉分量滤波器系数的绝对值的信息和关于用于所述Cr颜色分量的交叉分量滤波器系数的符号的信息,以及
基于关于用于所述Cr颜色分量的所述交叉分量滤波器系数的绝对值的信息和关于用于所述Cr颜色分量的所述交叉分量滤波器系数的符号的信息来推导用于所述Cr颜色分量的所述交叉分量滤波器系数。
14.根据权利要求10所述的方法,其中,
所述图像信息包括关于编译树单元的信息,以及
关于所述编译树单元的信息包括:
关于是否对Cb颜色分量的当前块应用交叉分量滤波器的信息;以及
关于是否对Cr颜色分量的当前块应用交叉分量滤波器的信息。
15.根据权利要求10所述的方法,其中,
所述图像信息包括关于编译树单元的信息,以及
关于所述编译树单元的信息包括:
关于应用于Cb颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息;以及
关于应用于Cr颜色分量的当前块的交叉分量滤波器的滤波器集索引的信息。
16.根据权利要求10所述的方法,其中,
所述图像信息包括序列参数集(SPS),
所述SPS包括与所述交叉分量滤波是否可用有关的交叉分量自适应环路滤波器(CCALF)启用标志。
17.根据权利要求10所述的方法,其中,
所述图像信息包括切片报头信息,
所述切片报头信息包括与所述ALF是否可用有关的ALF启用标志,以及
基于所述ALF启用标志的值是1的确定,所述交叉分量滤波是可用的。
18.根据权利要求10所述的方法,其中,
所述图像信息包括切片报头信息,以及
所述切片报头信息包括自适应参数集(APS)的ID信息,所述APS包括用于推导所述交叉分量滤波器系数的ALF数据。
19.一种计算机可读存储介质,所述计算机可读存储介质存储使图像解码装置执行图像解码方法的编码信息,其中所述图像解码方法包括:
通过比特流来接收图像信息;
基于所述图像信息,生成重构亮度样本和重构色度样本;
对所述重构色度样本执行自适应环路滤波(ALF)过程以生成滤波的重构色度样本;以及
对所述滤波的重构色度样本执行交叉分量滤波过程以生成修改滤波的重构色度样本,
其中,所述图像信息包括关于交叉分量滤波的信息,以及
所述交叉分量滤波过程的执行包括:
基于关于所述交叉分量滤波的信息,推导用于所述交叉分量滤波的交叉分量滤波器的数目;
基于所述交叉分量滤波器的数目,推导用于所述交叉分量滤波过程的交叉分量滤波器系数;以及
基于所述滤波的重构色度样本和所述交叉分量滤波器系数,生成所述修改滤波的重构色度样本。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962893760P | 2019-08-29 | 2019-08-29 | |
US62/893,760 | 2019-08-29 | ||
PCT/KR2020/011601 WO2021040484A1 (ko) | 2019-08-29 | 2020-08-31 | 크로스-컴포넌트 적응적 루프 필터링 기반 영상 코딩 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114586350A true CN114586350A (zh) | 2022-06-03 |
Family
ID=74685704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080073409.XA Pending CN114586350A (zh) | 2019-08-29 | 2020-08-31 | 基于交叉分量自适应环路滤波的图像编译装置和方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US12047568B2 (zh) |
EP (1) | EP4024858A4 (zh) |
KR (1) | KR20220050088A (zh) |
CN (1) | CN114586350A (zh) |
AU (1) | AU2020337712A1 (zh) |
CA (1) | CA3152834A1 (zh) |
WO (1) | WO2021040484A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112544081A (zh) * | 2019-12-31 | 2021-03-23 | 北京大学 | 环路滤波的方法与装置 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021025169A1 (en) | 2019-08-08 | 2021-02-11 | Panasonic Intellectual Property Corporation Of America | System and method for video coding |
KR20220044894A (ko) | 2019-08-29 | 2022-04-12 | 엘지전자 주식회사 | 영상 코딩 장치 및 방법 |
CA3241768A1 (en) * | 2019-08-29 | 2021-03-04 | Lg Electronics Inc. | Device and method for coding video on basis of filtering |
WO2021045130A1 (en) * | 2019-09-03 | 2021-03-11 | Panasonic Intellectual Property Corporation Of America | System and method for video coding |
KR102707834B1 (ko) * | 2019-10-29 | 2024-09-19 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 루마 차이를 이용한 크로스 컴포넌트 적응적 루프 필터 |
JP2024511725A (ja) * | 2021-03-05 | 2024-03-15 | ボドナー、ザカリー | 眼位異常を測定および分類するためのシステムおよび方法 |
US11683530B2 (en) * | 2021-03-19 | 2023-06-20 | Tencent America LLC | Adaptive non-linear mapping for sample offset |
WO2024145745A1 (zh) * | 2023-01-03 | 2024-07-11 | Oppo广东移动通信有限公司 | 编解码方法、装置、编码设备、解码设备以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013258784A (ja) * | 2013-10-02 | 2013-12-26 | Sony Corp | 画像処理装置および方法、記録媒体、並びにプログラム |
CN106028050A (zh) * | 2011-05-16 | 2016-10-12 | 联发科技股份有限公司 | 用于亮度和色度分量的样本自适应偏移的方法和装置 |
JP2017011587A (ja) * | 2015-06-24 | 2017-01-12 | 日本放送協会 | シーンチェンジ検出装置、シーンチェンジ検出方法及びそのプログラム |
CN109691102A (zh) * | 2016-08-31 | 2019-04-26 | 高通股份有限公司 | 跨分量滤波器 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9807403B2 (en) | 2011-10-21 | 2017-10-31 | Qualcomm Incorporated | Adaptive loop filtering for chroma components |
KR20130050900A (ko) | 2011-11-08 | 2013-05-16 | 한국전자통신연구원 | 인트라 예측 방법 및 그 장치 |
KR102277121B1 (ko) | 2011-11-08 | 2021-07-15 | 한국과학기술원 | 영상 부호화/복호화 방법 및 장치 |
US9451252B2 (en) | 2012-01-14 | 2016-09-20 | Qualcomm Incorporated | Coding parameter sets and NAL unit headers for video coding |
US10200700B2 (en) | 2014-06-20 | 2019-02-05 | Qualcomm Incorporated | Cross-component prediction in video coding |
US10057574B2 (en) | 2015-02-11 | 2018-08-21 | Qualcomm Incorporated | Coding tree unit (CTU) level adaptive loop filter (ALF) |
WO2016167538A1 (ko) | 2015-04-12 | 2016-10-20 | 엘지전자(주) | 비디오 신호의 인코딩, 디코딩 방법 및 그 장치 |
WO2017043786A1 (ko) | 2015-09-10 | 2017-03-16 | 엘지전자 주식회사 | 비디오 코딩 시스템에서 인트라 예측 방법 및 장치 |
US20190238845A1 (en) * | 2018-01-26 | 2019-08-01 | Qualcomm Incorporated | Adaptive loop filtering on deblocking filter results in video coding |
WO2020262396A1 (en) * | 2019-06-24 | 2020-12-30 | Sharp Kabushiki Kaisha | Systems and methods for reducing a reconstruction error in video coding based on a cross-component correlation |
KR20230002447A (ko) | 2020-04-26 | 2023-01-05 | 바이트댄스 아이엔씨 | 비디오 코딩 신택스 요소의 조건적 시그널링 |
-
2020
- 2020-08-31 CN CN202080073409.XA patent/CN114586350A/zh active Pending
- 2020-08-31 KR KR1020217039750A patent/KR20220050088A/ko active Search and Examination
- 2020-08-31 EP EP20857126.5A patent/EP4024858A4/en active Pending
- 2020-08-31 AU AU2020337712A patent/AU2020337712A1/en active Pending
- 2020-08-31 US US17/639,260 patent/US12047568B2/en active Active
- 2020-08-31 CA CA3152834A patent/CA3152834A1/en active Pending
- 2020-08-31 WO PCT/KR2020/011601 patent/WO2021040484A1/ko unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106028050A (zh) * | 2011-05-16 | 2016-10-12 | 联发科技股份有限公司 | 用于亮度和色度分量的样本自适应偏移的方法和装置 |
JP2013258784A (ja) * | 2013-10-02 | 2013-12-26 | Sony Corp | 画像処理装置および方法、記録媒体、並びにプログラム |
JP2017011587A (ja) * | 2015-06-24 | 2017-01-12 | 日本放送協会 | シーンチェンジ検出装置、シーンチェンジ検出方法及びそのプログラム |
CN109691102A (zh) * | 2016-08-31 | 2019-04-26 | 高通股份有限公司 | 跨分量滤波器 |
Non-Patent Citations (2)
Title |
---|
KIRAN MISRA ET AL.,: "Cross-Component Adaptive Loop Filter for chroma", 《JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11》, 12 July 2019 (2019-07-12) * |
夏校朋: "基于H.264/HEVC的视频编解码关键技术研究", 《中国优秀博士论文电子期刊》, 31 August 2016 (2016-08-31) * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112544081A (zh) * | 2019-12-31 | 2021-03-23 | 北京大学 | 环路滤波的方法与装置 |
CN112544081B (zh) * | 2019-12-31 | 2023-12-22 | 北京大学 | 环路滤波的方法与装置 |
US12041231B2 (en) | 2019-12-31 | 2024-07-16 | SZ DJI Technology Co., Ltd. | In-loop filtering method and device |
Also Published As
Publication number | Publication date |
---|---|
EP4024858A1 (en) | 2022-07-06 |
US20220337823A1 (en) | 2022-10-20 |
CA3152834A1 (en) | 2021-03-04 |
US12047568B2 (en) | 2024-07-23 |
AU2020337712A1 (en) | 2022-04-14 |
JP2022545747A (ja) | 2022-10-28 |
WO2021040484A1 (ko) | 2021-03-04 |
KR20220050088A (ko) | 2022-04-22 |
EP4024858A4 (en) | 2023-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240187602A1 (en) | In-loop filtering-based image coding apparatus and method | |
US20240098261A1 (en) | Cross component filtering-based image coding apparatus and method | |
US12047568B2 (en) | Cross-component adaptive loop filtering-based image coding apparatus and method | |
US12108044B2 (en) | Apparatus and method for image coding based on filtering | |
US11962767B2 (en) | Apparatus and method for coding image | |
CN114586351B (zh) | 基于自适应环路滤波的图像编译装置和方法 | |
CN114946190B (zh) | 用于控制环路滤波的图像编码装置和方法 | |
CN114982245A (zh) | 基于滤波的图像编码装置和方法 | |
CN114365497A (zh) | 基于缩放列表参数的视频或图像编码 | |
CN114946191B (zh) | 基于用于滤波的信息的信令的图像编码设备和方法 | |
CN114270852A (zh) | 基于缩放列表数据的信令的视频或图像编码 | |
CN113796079A (zh) | 基于缩放列表参数的视频或图像编译 | |
US20230164321A1 (en) | In-loop filtering-based image coding device and method | |
CN113940068A (zh) | 基于缩放列表参数的视频或图像编译 | |
CN113785581A (zh) | 基于缩放列表的视频或图像编译 | |
JP7573024B2 (ja) | クロス-コンポーネント適応的ループフィルタリングベースの映像コーディング装置及び方法 | |
CN115280771A (zh) | 基于滤波相关信息信令的图像编码设备和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |