CN116962692A - 解码和编码设备、存储介质及发送用于图像的数据的设备 - Google Patents

解码和编码设备、存储介质及发送用于图像的数据的设备 Download PDF

Info

Publication number
CN116962692A
CN116962692A CN202311110124.0A CN202311110124A CN116962692A CN 116962692 A CN116962692 A CN 116962692A CN 202311110124 A CN202311110124 A CN 202311110124A CN 116962692 A CN116962692 A CN 116962692A
Authority
CN
China
Prior art keywords
block
current block
type
size
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311110124.0A
Other languages
English (en)
Inventor
崔璋元
金昇焕
许镇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN116962692A publication Critical patent/CN116962692A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

公开了一种解码和编码设备、存储介质及发送用于图像的数据的设备。根据本文档的由解码设备对图像进行解码的方法可以包括以下步骤:获取包括当前块的分割信息的图像信息;基于当前块的尺寸确定是否对当前块进行分割;以及如果确定要对当前块进行分割,则基于分割信息将当前块分割为子块,并对子块进行解码,以及如果确定不对当前块进行分割,则不对当前块进行分割,并对当前块进行解码,其中,如果当前块为色度块并且当前块的尺寸至多是色度块的最小尺寸,则确定不对当前块进行分割。

Description

解码和编码设备、存储介质及发送用于图像的数据的设备
本申请是原案申请号为201980066015.9的发明专利申请(国际申请号:PCT/KR2019/012196,申请日:2019年9月20日,发明名称:图像编码系统中通过使用块分割对图像解码的方法及其装置)的分案申请。
技术领域
本公开涉及视频编码技术,并且更具体地,涉及一种在视频编码系统中使用块分割的视频解码方法及其设备。
背景技术
近来,在各种领域中,对诸如HD(高清)图像和UHD(超高清)图像这样的高分辨率、高质量图像的需求正在增长。因为图像数据具有高分辨率和高质量,所以相对于传统图像数据,待传输的信息或比特的量增加。因此,当使用诸如传统有线/无线宽带线路这样的介质发送图像数据或者使用现有存储介质存储图像数据时,其传输成本和存储成本增加。
因此,需要用于有效地发送、存储和再现高分辨率高质量图像的信息的高效图像压缩技术。
发明内容
技术问题
本公开提供了一种用于提高图像编码效率的方法及装置。
本公开还提供了一种用于提高帧内预测效率的方法及装置。
本公开还提供了一种基于跨分量线性模型(CCLM)的用于提高帧内预测效率的方法及装置。
本公开还提供了一种用于CCLM预测的有效编码和解码方法,以及用于执行该编码和解码方法的装置。
本公开还提供了一种用于选择相邻样本以推导用于CCLM的线性模型参数的方法及装置。
技术方案
在一方面,提供了一种由解码设备执行的视频解码方法。该方法包括:获得包括分割信息的图像信息;基于当前块的尺寸确定是否对当前块进行分割;以及基于是否对所确定的当前块进行分割,对当前块进行解码或者对当前块的子块进行解码,其中当确定对当前块进行分割时,基于分割信息将当前块分割为子块,并对子块进行解码,其中当确定不对当前块进行分割时,不对当前块进行分割,并对当前块进行解码,并且其中在当前块为色度块并且当前块的尺寸小于或等于最小色度块尺寸时,确定不对当前块进行分割。
在另一方面,提供了一种用于执行视频解码的解码设备。该装置设备包括:熵解码器,其获得包括分割信息的图像信息;以及预测器,其基于当前块的尺寸确定是否对当前块进行分割;以及基于是否对所确定的当前块进行分割,对当前块进行解码或者对当前块的子块进行解码,其中当确定对当前块进行分割时,基于分割信息将当前块分割为子块,并对子块进行解码,其中当确定不对当前块进行分割时,不对当前块进行分割,并对当前块进行解码,并且其中在当前块为色度块并且当前块的尺寸小于或等于最小色度块尺寸时,确定不对当前块进行分割。
另一方面,提供了一种由编码设备执行的视频编码方法。该方法包括:确定当前块的分割类型;基于当前块的尺寸确定是否对当前块进行分割;如果确定不对当前块进行分割,则不对当前块进行分割,并且如果确定要对当前块进行分割,则基于分割类型将当前块分割为子块;以及对图像信息进行编码,图像信息包括指示当前块的分割类型的分割信息,其中在当前块为色度块并且当前块的尺寸小于或等于最小色度块尺寸时,确定不对当前块进行分割。
另一方面,提供了一种视频编码设备。该编码设备包括:图像分割器,其确定当前块的分割类型,基于当前块的尺寸确定是否对当前块进行分割,如果确定不对当前块进行分割,则不对当前块进行分割,以及如果确定要对当前块进行分割,则基于分割类型将当前块分割为子块;以及熵编码器,其对图像信息进行编码,图像信息包括指示当前块的分割类型的分割信息,其中在当前块为色度块并且当前块的尺寸小于或等于最小色度块尺寸时,确定不对当前块进行分割。
有益效果
根据本公开,能够提高整体图像/视频压缩效率。
根据本公开,可以通过有效地执行图像分割来提高图像编码效率。
根据本公开,可以通过限制分割为具有特定尺寸或更小尺寸的亮度块和/或色度块来减小最坏情况的数据吞吐量,从而有效地减小编码和解码处理速率。
附图说明
图1简要例示了可应用本公开的实施方式的视频/图像编码装置的示例。
图2是例示了可以应用本公开的实施方式的视频/图像编码设备的配置的示意图。
图3是例示了可以应用本公开的实施方式的视频/图像解码设备的配置的示意图。
图4示出了通过QT结构分割块的示例。
图5示出了通过BT结构分割块的示例。
图6示出了通过TT结构分割块的示例。
图7示例性地示出了分割信息的信令机制。
图8示例性地示出了MTT结构中的分割类型。
图9示例性地示出了当输入图像的尺寸为FHD或更大时,禁止分割为4×4尺寸的亮度块和2×2尺寸的色度块的实施方式。
图10示例性地示出了基于输入图像的尺寸来调整最小块尺寸的实施方式。
图11示例性地示出了调整最小块尺寸的实施方式。
图12示例性地示出了基于发信号通知的最小块尺寸信息来确定最小块尺寸的实施方式。
图13示意性地示出了根据本公开的编码设备的图像编码方法。
图14示意性地示出了根据本公开的执行图像编码方法的编码设备。
图15示意性地示出了根据本公开的解码设备的图像解码方法。
图16示意性地示出了根据本公开的执行图像解码方法的解码设备。
图17示例地示出了应用了本公开的实施方式的内容流系统的结构图。
具体实施方式
本公开可以以各种形式修改,并且将在附图中描述和例示其特定实施方式。然而,实施方式并非旨在限制本公开。在以下描述中使用的术语仅用于描述特定实施方式,并非旨在限制本公开。只要清楚地以不同的方式理解,单数的表达包括复数的表达。诸如“包括”和“具有”之类的术语旨在表示存在以下描述中使用的特征、数目、步骤、操作、元件、组件或其组合,因此应理解的为不排除存在或添加一个或更多个不同的特征、数目、步骤、操作、元件、组件或其组合的可能性。
此外,在本公开中描述的附图中的元件是为了方便地解释不同的特定功能而独立地绘制的,并不意味着这些元件由独立的硬件或独立的软件来体现。例如,可以将元件中的两个或更多个元件组合以形成单个元件,或者可以将一个元件分割为多个元件。其中组合元件和/或分割元件的实施方式属于本公开,而没有脱离本公开的概念。
在下文中,将参照附图详细描述本公开的实施方式。另外,在整个附图中,相似的附图标记用于指示相似的元件,并且将省略对相似元件的相同描述。
图1简要例示了可应用本公开的实施方式的视频/图像编码装置的示例。
参照图1,视频/图像编码系统可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式向接收装置发送编码视频/图像信息或数据。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以称为视频/图像编码设备,并且解码设备可以称为视频/图像解码设备。发送器可以包括在编码设备中。接收器可以包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部组件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板电脑和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码设备可以对输入的视频/图像进行编码。编码设备可以执行诸如预测、变换和量化的一系列过程,以实现压缩和编码效率。编码数据(编码视频/图像信息)可以以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式向接收装置的接收器发送以比特流形式输出的编码后的图像/图像信息或数据。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并向解码设备发送接收到的比特流。
解码设备可以通过执行与编码设备的操作相对应的诸如反量化、逆变换和预测之类的一系列过程,来对视频/图像进行解码。
渲染器可以渲染经解码的视频/图像。经渲染的视频/图像可以通过显示器显示。
本公开涉及视频/图像编码。例如,本公开中所公开的方法/实施方式可以应用于在多功能视频编码(VVC)、EVC(基本视频编码)标准、AOMedia Video 1(AV1)标准、第2代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267、或H.268等)中公开的方法。
本公开呈现了视频/图像编码的各种实施方式,并且除非另外提及,否则实施方式可以彼此组合地执行。
在本公开中,视频可以是指一段时间上的一系列图像。图片通常是指在特定时间区域表示一幅图像的单位,而条带(slice)/切片(tile)是在编码中组成图片的一部分的单位。条带/切片可以包括一个或更多个编码树单元(CTU)。一幅图片可以包括一个或更多个条带/切片。一幅图片可以包括一个或更多个切片组。一个切片组可以包括一个或更多个切片。砖块(brick)可以表示图片中切片内CTU行的矩形区域。一个切片可以分割为多个砖块,每个砖块包括切片内的一个或更多个CTU行。没有分割为多个砖块的切片也可以称为砖块。砖块扫描是对其中CTU在砖块的CTU光栅扫描中连续排序的图片进行分割的CTU的特定顺序排序,切片内的砖块在切片的砖块的光栅扫描中是连续排列的,并且图片中的切片在图片的切片的光栅扫描中是连续排序的。切片是图片中特定切片列和特定切片行内的CTU的矩形区域。切片列是高度等于图片的高度并且宽度由图片参数集中的语法元素指定的CTU的矩形区域。切片行是高度由图片参数集中的语法元素指定并且宽度等于图片宽度的CTU的矩形区域。切片扫描是指对其中CTU在切片的CTU光栅扫描中是连续排序的图片进行分割的CTU的特定顺序排序,而图片中的切片在图片的切片的光栅扫描中是连续排序的。条带包括可以唯一地包含在单个NAL单元中的图片的整数个砖块。条带可以包括多个完整的切片,或者仅一个切片的完整砖块的连续序列。切片组和条带在本公开中可以互换使用。例如,在本公开中,切片组/切片组头可以被称为条带/条带报头。
像素或画素可以表示组成一幅图片(或图像)的最小单位。另外,“样本”可以用作与像素相对应的术语。样本通常可以表示像素或像素值,并且可以仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可以与诸如块或区域之类的术语互换使用。在一般情况下,M×N块可以包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。
在本公开中,术语“/”和“、”应解释为指示“和/或”。例如,表述“A/B”可以表示“A和/或B”。此外,“A、B”可以表示“A和/或B”。此外,“A/B/C”可以表示“A、B和/或C中的至少一个”。另外,“A/B/C”可以表示“A、B和/或C中的至少一个”。
此外,在本文档中,术语“或”应解释为指示“和/或”。例如,表述“A或B”可包括1)仅A,2)仅B,和/或3)A和B两者。换句话说,本公开中的术语“或”应解释为指示“附加地或另选地。”
图2是例示了可以应用本公开的实施方式的视频/图像编码设备的配置的示意图。在下文中,视频编码设备可以包括图像编码设备。
参照图2,编码设备200包括图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、反量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件组件(例如,编码器芯片组或处理器)构成。另外,存储器270可以包括解码图片缓冲器(DPB)或者可以由数字存储介质构成。硬件组件还可以包括作为内部/外部组件的存储器270。
图像分割器210可以将输入到编码设备200的输入图像(或图片或帧)分割到一个或更多个处理器中。例如,处理器可以被称为编码单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)来递归地分割编码单元。例如,一个编码单元可以基于四叉树结构、二叉树结构和/或三元结构而被分割为深度更深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,随后可以应用二叉树结构和/或三元结构。另选地,可以首先应用二叉树结构。可以基于不再分割的最终编码单元来执行根据本公开的编码过程。在这种情况下,可以根据图像特性基于编码效率将最大编码单元用作最终编码单元,或者如果需要,可以将编码单元递归地分割为深度更深的编码单元并且具有最佳尺寸的编码单元可以用作最终编码单元。这里,编码过程可以包括预测、变换和重构的过程,这将在后面描述。作为另一示例,处理器还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从上述最终编码单元来分离或分割预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在一些情况下,单元可以与诸如块或区域之类的术语互换使用。在一般情况下,M×N块可以表示由M列和N行组成的样本或变换系数的集合。样本通常可以表示像素或像素值,可以仅表示亮度分量的像素/像素值,或者仅表示色度分量的像素/像素值。样本可用作与像素或画素的一幅图片(或图像)相对应的术语。
在编码设备200中,从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列),以生成残差信号(残差块、残差样本阵列)并且所生成的残差信号被发送到变换器232。在这种情况下,如图所示,在编码设备200中用于从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以称为减法器231。预测器可以对要处理的块(在下文中称为当前块)执行预测,并生成包括当前块的预测样本的预测块。预测器可以以当前块或CU为基础来确定是应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所述,预测器可以生成与预测有关的、诸如预测模式信息之类的各种信息,并向熵编码器240发送所生成的信息。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33个定向预测模式或65个定向预测模式。然而,这仅是示例,依据设置,可以使用更多或更少的定向预测模式。帧内预测器222可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于由参考图片上的运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块和存在于参考图片中的时间相邻块。包括参考块的参考图片和包括时间相邻块的参考图片可以相同或不同。时间相邻块可以称为并置参考块、共位CU(colCU)等,并且包括时间相邻块的参考图片可以称为并置图片(colPic)。例如,帧间预测器221可以基于相邻块来配置运动信息候选列表,并且生成指示使用哪个候选来推导当前块的运动矢量和/或参考图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以将相邻块的运动信息用作当前块的运动信息。在跳过模式下,与合并模式不同,可能无法发送残差信号。在运动矢量预测(MVP)模式的情况下,可以将相邻块的运动矢量用作运动矢量预测子,并且可以通过发信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测二者。这可以称为帧间帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为参考块是在当前图片中推导出的。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或生成残差信号。变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、karhunen-loève变换(KLT)、基于图的变换(GBT)或条件非线性变换(CNT)中的至少一种。这里,GBT表示当像素之间的关系信息由图表示时从图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而生成的变换。另外,变换处理可以应用于具有相同尺寸的正方形像素块,或者可以应用于具有可变尺寸而非正方形的块。
量化器233可以对变换系数进行量化,并且将它们发送给熵编码器240,并且熵编码器240可以对量化信号(关于量化变换系数的信息)进行编码并且输出比特流。关于量化变换系数的信息可以称为残差信息。量化器233可以基于系数扫描顺序将块类型量化变换系数重新布置为一维矢量形式,并且基于一维矢量形式的量化变换系数来生成关于量化变换系数的信息。可以生成关于变换系数的信息。熵编码器240可以执行各种编码方法,诸如,例如指数哥伦布(Golomb)、上下文自适应变长编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等。熵编码器240可以对除了量化变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或分开地进行编码。可以以比特流的形式以NAL(网络抽象层)为单位发送或存储编码信息(例如,编码视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可包括一般约束信息。在本公开中,从编码设备向解码设备发送/发信号通知的信息和/或语法元素可以包括在视频/图片信息中。视频/图像信息可以通过上述编码过程被编码并且被包括在比特流中。比特流可以通过网络发送,或者可以存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。可以包括发送从熵编码器240输出的信号的发送器(未示出)和/或存储该信号的存储单元(未示出)作为编码设备200的内部/外部元件,另选地,发送器可以包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过利用反量化器234和逆变换器235对量化变换系数应用反量化和逆变换,来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(诸如应用了跳过模式的情况),则可以将预测块用作重构块。加法器250可以称为重构器或重构块生成器。所生成的重构信号可以用于在当前图片中要处理的下一块的帧内预测,并且可以通过如下所述的滤波用于下一图片的帧间预测。
此外,在图片编码和/或重构期间,可以应用具有色度缩放的亮度映射(LMCS)。
滤波器260可以通过对重构信号应用滤波来改善主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息,并且将生成的信息发送给熵编码器240,如稍后在各种滤波方法的描述中所述。与滤波有关的信息可以由熵编码器240编码并且以比特流的形式输出。
发送给存储器270的修改后的重构图片可以用作帧间预测器221中的参考图片。当通过编码设备应用帧间预测时,可以避免编码设备200与解码设备之间的预测不匹配,并且可以提高编码效率。
存储器270的DPB可以存储用作帧间预测器221中的参考图片的修改后的重构图片。存储器270可以存储从中推导(或编码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器221,并且用作空间相邻块的运动信息或时间相邻块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器222。
图3是例示了可以应用本公开的实施方式的视频/图像解码设备的配置的示意图。
参照图3,解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350、存储器360。预测器330可以包括帧间预测器332和帧内预测器331。残差处理器320可以包括反量化器321和逆变换器322。根据实施方式,熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件组件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),或者可以由数字存储介质构成。硬件组件还可以包括存储器360作为内部/外部组件。
当输入了包括视频/图像信息的比特流时,解码设备300可以与在图2的编码设备中处理视频/图像信息的处理相对应地重构图像。例如,解码设备300可以基于从比特流获得的块分割相关信息来推导单元/块。即,解码设备300的图像分割器可以将输入图像(或图片、帧)分割为一个或更多个处理单元。解码设备300可以使用在编码设备中应用的处理器来执行解码。因此,解码的处理器例如可以是编码单元,并且可以根据四叉树结构、二叉树结构和/或三叉树结构,从编码树单元或最大编码单元对编码单元进行分割。可以从编码单元推导一个或更多个变换单元。可以通过再现设备来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以接收以比特流形式从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以解析比特流,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集的信息和/或一般约束信息来对图片进行解码。本公开中稍后描述的发信号通知的/接收的信息和/或语法元素可以通过解码过程被解码,并从比特流中获取。例如,熵解码器310基于诸如指数哥伦布编码、CAVLC或CABAC之类的编码方法对比特流中的信息进行解码,并输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin(位),使用解码目标语法元素信息、解码目标块的解码信息或在先前级中解码的符号/bin的信息来确定上下文模型,并通过根据所确定的上下文模型预测bin的出现概率来对该bin进行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,在确定上下文模型之后,CABAC熵解码方法可以通过将经解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310解码的信息当中与预测有关的信息可以提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中对其执行了熵解码的残差值(也就是说,量化变换系数和相关参数信息)可以被输入到残差处理器320。残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,由熵解码器310解码的信息当中关于滤波的信息可以提供给滤波器350。此外,用于接收从编码设备输出的信号的接收器(未示出)可以进一步被配置为解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。此外,根据本公开的解码设备可以称为视频/图像/图片解码设备,并且解码设备可以分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括反量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
反量化器321可以对量化变换系数进行反量化并且输出变换系数。反量化器321可以以二维块的形式重新布置量化变换系数。在这种情况下,可以基于在编码设备中执行的系数扫描顺序来执行重新布置。反量化器321可以通过使用量化参数(例如,量化步长信息)对量化变换系数执行反量化,并且获得变换系数。
逆变换器322对变换系数进行逆变换以获得残差信号(残差块、残差样本阵列)。
预测器可以对当前块执行预测,并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是帧间预测,并且可以确定具体的帧内/帧间预测模式。
预测器330可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为帧间和帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为在当前图片中推导参考块。即,IBC可以使用本公开中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于由参考图片上的运动矢量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式中发送的运动信息的量,可以基于相邻块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块和存在于参考图片中的时间相邻块。例如,帧间预测器332可以基于相邻块来配置运动信息候选列表,并基于接收到的候选选择信息来推导当前块的运动矢量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(例如当应用跳过模式时),则可以将预测块用作重构块。
加法器340可以称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中要处理的下一块的帧内预测,可以通过如下所述的滤波输出,或者可以用于下一图片的帧间预测。
此外,在图片解码处理中可以应用具有色度缩放的亮度映射(LMCS)。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储器360的DPB中存储的(修改后的)重构图片可以用作帧间预测器332中的参考图片。存储器360可以存储从中推导(或解码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器221,以作为空间相邻块的运动信息或时间相邻块的运动信息来利用。存储器360可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器331。
在本公开中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可以与解码设备300的滤波器350、帧间预测器332和帧内预测器331相同或者分别被应用以对应于解码设备300的滤波器350、帧间预测器332和帧内预测器331。相同的内容也可以应用于帧间预测器332和帧内预测器331。
此外,VVC标准的编码目标图像是诸如UHD和FHD之类的高分辨率图像,并且为了处理图像,硬件日益复杂。例如,当在VVC标准软件VTM2.0.1中执行以上描述的帧内预测时,使用128×128尺寸的编码树单元(CTU),但是最小CU块尺寸对于亮度块为4×4尺寸,并且对于色度块为2×2尺寸。因此,当通过经由VTM2.0.1软件执行帧内预测来对UHD图像(3840×2160分辨率)进行编码时,在最坏情况的场景下,UHD图像可能被分割为518400个4×4亮度块和1036800个2×2色度块。在此,最坏的情况可以表示UHD图像的所有亮度分量被编码为4×4尺寸的亮度块,并且所有色度分量被编码为2×2尺寸的色度块的情况。在硬件实现中,数据吞吐量应覆盖最坏的情况,这可能导致硬件制造成本和硬件延迟的增加。
本公开提出了用于解决上述问题的实施方式。
在实施方式中,提出了通过根据图像尺寸(即,分辨率)的大小自适应地调整最小块尺寸来解决硬件实现的复杂度的方法。即,在本公开中,提出了通过根据图像尺寸自适应地调整最小块尺寸来调整最坏情况下的数据吞吐量,以控制最坏情况下的数据吞吐量的量的实施方式。在此,块可以代表编码单元(CU)、预测单元(PU)或变换单元(TU)。
此外,如下表所示,可以推导出在VTM2.0.1软件上限制4×4尺寸的亮度块和2×2尺寸的色度块的图像的实验结果。即,实验可以表示其中亮度块的最小尺寸为4×8尺寸/8×4尺寸并且色度块的最小尺寸为2×4尺寸/4×2尺寸的图像的编码。此外,下表可以示出所有分辨率的图像的实验结果。
[表1]
参照表1,可以推导出,在全部帧内实验中编码损失Y为0.46%,在随机访问实验中Y为0.36%,并且在低延迟B实验中Y为0.29%。但是,通过限制4×4尺寸的亮度块和2×2尺寸的色度块,最坏情况下的数据吞吐量可以减半,并且编码和解码处理速率可以降低。
另外,如下表所示,可以推导出限制4×4尺寸的亮度块和2×2尺寸的色度块的UHD和FHD图像(即,高分辨率图像)的实验结果。即,实验可以表示其中亮度块的最小尺寸为4×8尺寸/8×4尺寸并且色度块的最小尺寸为2×4尺寸/4×2尺寸的UHD和FHD图像(即,高分辨率图像)的编码。
[表2]
参照上表2,可以推导出在UHD和FHD实验图像的全部帧内实验中Y为0.19%,在随机访问实验中Y为0.17%,并且在低延迟B实验中Y为0.12%。因此,可以看出,限制最小块尺寸的方法在对作为VVC标准的编码目标的高分辨率图像进行编码时更加有效。
基于上述实验结果,本实施方式提出了如下自适应地调整最小块尺寸的方法。
-如果输入图像的尺寸(即,分辨率)大于或等于FHD,则禁止将亮度块分割为4×4尺寸的亮度块,并且禁止将色度块分割为2×2尺寸的色度块。
-具体地说,当输入图像的尺寸(即,分辨率)大于或等于FHD时,在确定是否对块QT/BT/TT进行分割时可以应用以下条件。
-当输入图像的尺寸(即,分辨率)为FHD或更大时,确定QT/BT/TT分割条件。
1)在当前亮度块中进行QT、水平BT、垂直BT、水平TT或垂直TT分割后为4×4块情况下,禁止进行相应的分割。
2)在当前色度块中进行QT、水平BT、垂直BT、水平TT或垂直TT分割之后为2×2块的情况下,禁止进行相应的分割。
此外,稍后可以描述QT结构、BT结构和TT结构。
图4示出了通过QT结构分割块的示例。QT结构可以表示其中具有2N×2N尺寸的块被分割为具有N×N尺寸的四个子块的结构。参照图4,可以根据QT结构将块A分割为四个正方形子块(块A0、块A1、块A2和块A3)。另外,可以按照QT结构将分割后的块递归地分割为更低深度的块。例如,参照图4,可以根据QT结构将子块A1分割为四个子块(块B0、块B1、块B2和块B3)。
图5示出了通过BT结构分割块的示例。BT结构可以表示其中W×H尺寸的块被分割为两个(W/2)×H尺寸的子块或两个W×(H/2)尺寸的子块的结构。其中W×H尺寸的块被分割为两个(W/2)×H尺寸的子块的结构可以表示为垂直BT结构,其中W×H尺寸的块被分割为两个W×(H/2)尺寸的子块的结构可以称为水平BT结构。
参照图5,不再按照QT结构进行分割的块B3可以按照垂直BT结构分割为子块C0和子块C1,或者可以按照水平BT结构被分割为子块D0和子块D1。另外,像块C0一样,每个子块可以按照水平BT结构进一步递归地分割(例如,子块E0、子块E1)或者按照垂直BT结构进一步递归地分割(例如,子块F0、子块F1)。
图6示出了通过TT结构分割块的示例。TT结构可以表示其中W×H尺寸的块被分割为两个(W/4)×H尺寸的子块和(W/2)×H尺寸的子块、或者两个W×(H/4)尺寸的子块和W×(H/2)尺寸的子块的结构。在这种情况下,在三个子块当中,(W/2)×H尺寸的子块或W×(H/2)尺寸的子块可以是中心子块。其中W×H尺寸的块被分割为两个(W/4)×H尺寸的子块和(W/2)×H尺寸的子块的结构可以表示为垂直TT结构,并且其中W×H尺寸的块被分割为两个W×(H/4)尺寸的子块和W×(H/2)尺寸的子块的结构可以表示为水平TT结构。
参照图6,不再按照QT结构进行分割的块B3可以按照垂直TT结构被分割为子块C0、子块C1和子块C2,或者可以按照水平TT结构被分割为D0、子块D1和子块D2。另外,像块C1一样,每个子块可以通过水平TT结构递归地分割(例如,分割为子块E0、子块E1、子块E2)或通过垂直TT结构递归地分割(例如,子块F0、子块F1和子块F2)。
此外,可以根据四叉树二叉树三叉树(QTBTTT)结构来递归地分割当前块。例如,可以基于四叉树结构、二叉树结构和/或三元结构将当前块分割为深度更深的多个编码单元。QTBTTT结构也可以称为多类型树(MTT)结构。
例如,可以基于发信号通知的分割信息根据MTT结构来分割当前块。
图7示例性地示出了分割信息的信令机制。
参照图7,CTU可以被视为QT的根,因此,CTU可以被初始分割为QT结构。此后,每个QT叶节点(不再被分割为QT结构的CU)可以向后进一步分割为MTT结构。在MTT结构中,可以发信号通知第一标志(例如,MTT拆分CU标志(mtt_split_cu_flag))以指示相应节点(即,相应CU)是否被附加分割。当相应节点被附加分割时(即,当第一标志的值为1时),可以发信号通知第二标志(例如,MTT拆分CU垂直标志(mtt_split_cu_vertical_flag))以指示分割方向。即,第二标志可以指示相应节点的分割方向。此后,可以发信号通知第三标志(例如,MTT拆分CU二进制标志(mtt_split_cu_binary_flag))以指示分割类型是二元分割还是三元分割。即,第三标志可以指示相应节点的分割类型是二元分割还是三元分割。例如,可以如下所示地推导基于第二标志和第三标志推导的相应CU的多类型树分割模式(MttSplitMode)。
[表3]
MttSplitMode mtt_split_cu_vertical_flag mtt_split_cu_binary_flag
SPLIT_TT_HOR 0 0
SPLIT_BT_HOR 0 1
SPLIT_TT_VER 1 0
SPLIT_BT_VER 1 1
在此,SPLIT_TT_HOR、SPLIT_BT_HOR、SPLIT_TT_VER和SPLIT_BT_VER可以表示分割类型(或多类型树分割模式)。具体地,SPLIT_TT_HOR可以表示水平三元类型,SPLIT_BT_HOR可以表示水平二元类型,SPLIT_TT_VER可以表示垂直三元类型,而SPLIT_TT_VER可以表示垂直二元类型。参照表3,当第二标志的值为0且第三标志的值为0时,相应CU的分割类型可以被推导为水平三元类型,当第二标志的值为0且第三标志的值为1时,CU的分割类型可以推导为水平二元类型,当第二标志的值为1且第三标志的值为0时,相应CU的分割类型可以推导为垂直三元类型,以及当第二标志的值为1且第三标志的值为1时,相应CU的分割类型可以推导为垂直二元类型。
图8示例性地示出了MTT结构中的分割类型。
参照图8,水平三元类型可以是其中块被分割为两个W×(H/4)尺寸的子块和W×(H/2)尺寸的子块的类型,其中W×(H/2)尺寸的子块是中心子块。另外,参照图8,垂直三元可以表示其中块被分割为两个(W/4)×H尺寸的子块和(W/2)×H尺寸的子块的类型,其中(W/2)×H尺寸的子块是中心子块。另外,参照图8,水平二元类型可以表示其中块被分割为两个W×(H/2)尺寸的子块的类型,而垂直二元类型可以表示其中块被分割为两个(W/2)×H尺寸的子块的类型。
此外,当在输入图像的尺寸(即,分辨率)大于或等于FHD时确定是否对块进行QT/BT/TT分割时应用上述条件的实施方式如下。
图9示例性地示出了当输入图像的尺寸大于或等于FHD时,禁止分割为4×4尺寸的亮度块和2×2尺寸的色度块的实施方式。
参照图9,编码设备/解码设备可以确定当前图像的样本数目(或者像素数目)是否为1920×1080或更高(S900)。
在当前图像的样本数目是1920×1080或更大时,编码设备/解码设备可以确定通过将当前块分割为QT结构、BT结构或TT结构而生成的块的样本数目是否大于特定数目(S910)。在当前块是当前亮度块时,编码设备/解码设备可以确定通过分割而生成的块的样本数目是否大于16,并且在当前块是当前色度块时,编码设备/解码设备可以确定通过分割而生成的块的样本数目是否大于4。该特定数目可以表示为阈值。
当通过分割而生成的块的样本数目大于特定数目时,编码设备/解码设备可以检查当前块的现有QT/BT.TT分割条件,并对当前块执行分割(S920)。
另选地,当通过分割而生成的块的样本数目不大于特定数目时,编码设备/解码设备可以不对当前块执行分割(S930)。
此外,在当前图像的样本数目小于1920×1080时,编码设备/解码设备可以在无需步骤S910的确定过程的情况下检查当前块的现有QT/BT.TT分割条件,然后对当前块执行分割(S920)。
另选地,更具体地,可以提出其中通过分割图像尺寸(即,分辨率)来自适应地确定最小块尺寸的实施方式。以上实施方式如下。
-当输入图像的尺寸为FHD或更大且UHD或更小时,禁止分割为4×4尺寸的亮度块和2×2尺寸的色度块。
-当输入图像的尺寸为UHD或更大时,禁止分割为4×4尺寸、4×8尺寸、8×4尺寸的亮度块以及2×2尺寸、4×2尺寸和2×4尺寸的色度块。
具体地,当输入图像的尺寸(即,分辨率)对应于上述条件时,在确定是否对块进行QT/BT/TT分割时可以应用以下条件。
-当输入图像的尺寸大于FHD且小于UHD时的QT/BT/TT分割条件确定
1)如果在QT、水平BT、垂直BT、水平TT或垂直TT分割之后当前亮度块变为4×4尺寸的块,则禁止进行相应的分割。
2)如果在QT、水平BT、垂直BT、水平TT或垂直TT分割之后当前色度块变为2×2尺寸的块,则禁止进行相应的分割。
-当输入图像的尺寸为UHD或更大时的QT/BT/TT分割条件确定
1)如果在QT、水平BT、垂直BT、水平TT或垂直TT分割之后当前亮度块变为4×4尺寸、4×8尺寸或8×4尺寸的块,则禁止进行相应的分割。
2)如果在QT、水平BT、垂直BT、水平TT或垂直TT分割之后当前色度块变为2×2尺寸、2×4尺寸或4×2尺寸,则禁止进行相应的分割。
根据本实施方式,通过如上所述在FHD和UHD中应用不同的最小块尺寸,可以将UHD视频的编码/解码期间的最坏情况数据的吞吐量减少到1/4,并且同时使编码损失最小化。
此外,当输入图像的尺寸(即,分辨率)大于或等于FHD时,在确定是否对块进行QT/BT/TT分割时应用上述条件的实施方式如下。
图10示例性地示出了其中基于输入图像的尺寸来调整最小块尺寸的实施方式。
参照图10,编码设备/解码设备可以确定当前图像的样本数目(或像素数目)是否为1920×1080或更高(S1000)。
在当前图像的样本数目是1920×1080或更大时,编码设备/解码设备可以确定当前图像的样本数目(或像素数目)是否为3840×2160或更大(S1010)。
在当前图像的样本数目为3840×2160或更多时,编码设备/解码设备可以为当前块设置阈值(S1020)。在这种情况下,当前亮度块的阈值可以设置为32,并且当前色度块的阈值可以设置为8。另选地,在当前图像的样本数目小于3840×2160时,编码设备/解码设备可以为当前块设置阈值(S1030)。在这种情况下,当前亮度块的阈值可以设置为16,并且当前色度块的阈值可以设置为4。
此后,编码设备/解码设备可以确定通过将当前块分割为QT结构、BT结构或TT结构而生成的块的样本数目是否大于所设置的阈值(S1040)。
当通过对块进行分割而生成的样本的数目大于阈值时,编码设备/解码设备可以检查当前块的现有QT/BT.TT分割条件,并且对当前块执行分割(S1050)。
另选地,当通过分割块而生成的样本的数目不大于阈值时,编码设备/解码设备可以不对当前块进行分割(S1060)。
此外,在当前图像的样本数目小于1920×1080时,编码设备/解码设备可以在没有步骤S1010至S1040的确定过程的情况下,检查当前块的现有QT/BT.TT分割条件,并且对当前块执行分割(S1050)。
另选地,可以提出其中与输入图像的尺寸无关地确定最小块尺寸的实施方式。
作为实施方式,可以提出以下方案。
-禁止在所有尺寸的输入图像中分割为4×4尺寸的亮度块和2×2尺寸的色度块。
具体地,当确定是否将块分割为QT/BT/TT时,可以应用以下条件。
-确定在所有图像尺寸中的QT/BT/TT分割条件
1)如果在QT、水平BT、垂直BT、水平TT或垂直TT分割之后当前亮度块变为4×4尺寸的块,则禁止分割。
2)如果在QT、水平BT、垂直BT、水平TT或垂直TT分割之后当前色度块变为2×2尺寸的块,则禁止分割。
图11示例性地示出了调整最小块尺寸的实施方式。
参照图11,编码设备/解码设备可以确定通过将当前块分割为QT结构、BT结构或TT结构而生成的块的样本数目是否大于阈值(S1100)。在当前块是当前亮度块时,编码设备/解码设备可以确定该块的所划分和生成的样本的数目是否大于16,并且在当前块是当前色度块时,编码设备/解码设备可以确定该块的所分割和生成的样本的数目是否大于4。即,当前亮度块的阈值可以设置为16,而当前色度块的阈值可以设置为4。换句话说,在当前块是当前亮度块时,编码设备/解码设备可以确定当前块的样本数目是否为32或更少,而在当前块是当前色度块时,编码设备/解码设备可以确定当前块中的样本数目是否为8或更少。即,当前亮度块的阈值可以设置为32,并且当前色度块的阈值可以设置为8。在分割当前块时,在根据BT结构进行分割时,当前块被分割为包括当前块的样本数目的一半的子块,因此,可以将该块的所分割和生成的样本的数目的阈值的两倍的值与当前块进行比较并确定该值。另外,在分割当前块时,在根据QT结构或TT结构分割当前块时,当前块被分割为包括当前块的样本数目的1/4的样本数目的子块,因此,可以将该块的所分割和生成的样本的数目阈值的四倍的值与当前块进行比较并确定该值。
当块的所分割和生成的样本的数目大于阈值(即,当前块的样本数目小于或等于阈值)时,编码设备/解码设备可以检查当前块的现有的QT/BT.TT分割条件,并对当前块执行分割(S1110)。
另选地,在块的所分割和生成的样本的数目不大于阈值(即,在当前块的样本数目大于阈值)时,编码设备/解码设备可以不对当前块执行分割(S1120)。
另选地,可以提出以下方案作为实施方式。
-在所有尺寸的输入图像中分割为2×2尺寸的色度块。
具体地,在确定是否对块进行QT/BT/TT分割时,可以应用以下条件。
-确定在所有图像尺寸中的QT/BT/TT分割条件。
1)当在QT、水平BT、垂直BT、水平TT或垂直TT分割之后当前色度块变为2×2尺寸的块时,禁止进行相应的分割。
例如,编码设备/解码设备可以确定通过将当前色度块分割为QT结构、BT结构或TT结构而生成的块的样本数目是否大于阈值(例如,4)。例如,当前色度块的阈值可以设置为4。
当该块的所分割和生成的样本的数目大于阈值时,编码设备/解码设备可以检查当前色度块的现有QT/BT.TT分割条件,并且对当前色度块执行分割。另选地,当块的所分割和生成的样本的数目不大于阈值时,编码设备/解码设备可以不对当前色度块进行分割。
如在上述实施方式中那样,通过在所有输入图像尺寸中限制最小块尺寸,可以防止依赖于输入图像的编码和解码。
另选地,可以提出可通过调整最小块尺寸来解决硬件实现中的复杂度和高成本的问题的另一实施方式。即,可以提出另一实施方式,其中通过自适应地调整最小块尺寸来调整最坏情况下的数据吞吐量。
基于上表2所示的实验结果,本实施方式提出了通过诸如序列参数集(SPS)、图片参数集(PPS)或条带报头之类的高阶语法(HLS)来传输最小块信息的方法。即,根据本实施方式,可以通过SPS、PPS或条带报头来发信号通知指示最小块尺寸的最小块尺寸信息,并且可以基于以最小块尺寸信息为基础而推导的最小块尺寸来执行块分割。
例如,SPS中的最小块尺寸信息可以表示为如下表所示。即,通过SPS发信号通知的最小块尺寸信息可以如下表所示。
[表4]
最小块尺寸信息可以包括最小亮度块尺寸信息和/或最小色度块尺寸信息。最小亮度块尺寸信息可以表示最小亮度块尺寸,并且最小色度块尺寸信息可以表示最小色度块尺寸。参照表4,可以在SPS中包括log2_min_cu_pixel_num_luma_minus4和log2_min_cu_pixel_num_chroma_minus2。log2_min_cu_pixel_num_luma_minus4可以指示最小亮度块尺寸信息的语法元素,而log2_min_cu_pixel_num_chroma_minus2可以指示最小色度块尺寸信息的语法元素。
解码设备可以基于log2_min_cu_pixel_num_luma_minus4和log2_min_cu_pixel_num_chroma_minus2来限制最小块尺寸。
作为示例,当用信号通知的log2_min_cu_pixel_num_luma_minus4的值为0并且log2_min_cu_pixel_num_chroma_minus2的值为0时,由log2_min_cu_pixel_num_luma_minus4表示的亮度块的最小样本数目为16(例如,log2_num_num_2×4尺寸),并且所指示的色度块的最小样本数目可以为4(例如,2×2尺寸)。因此,可以不执行最小块尺寸限制。
作为另一示例,当发信号通知的log2_min_cu_pixel_num_luma_minus4的值为1并且log2_min_cu_pixel_num_chroma_minus2的值为1时,由log2_min_cu_pixel_num_luma_minus4表示的亮度块的最小样本数目可以为32,并且由log2_min_cu_pixel_num_chroma_minus2样本表示的色度块的最小数目可以为8。因此,解码设备可以限制4×4尺寸的亮度块和2×2尺寸的色度块的尺寸。即,解码设备可以限制分割为4×4尺寸的亮度块和2×2尺寸的色度块。
作为另一示例,当用信号通知的log2_min_cu_pixel_num_luma_minus4的值为0并且log2_min_cu_pixel_num_chroma_minus2的值为2时,由log2_min_cu_pixel_num_luma_minus4表示的亮度块的最小样本数目可以为16,并且由log2_min_cu_pixel_num_chroma_minus2样本表示的色度块的最小数目可以为16。在这种情况下,解码设备可以不限制最小亮度块尺寸。另外,解码设备可以限制2×2、2×4和4×2尺寸的色度块尺寸。即,解码设备可以限制分割为2×2、2×4和4×2尺寸的色度块。
图12示例性地示出了基于发信号通知的最小块尺寸信息来确定最小块尺寸的实施方式。
参照图12,编码设备/解码设备可以确定当前块是否是亮度块(S1200)。即,编码设备/解码设备可以确定当前块是当前亮度块还是当前色度块。
在当前块是当前亮度块时,编码设备/解码设备可以基于log2_min_cu_pixel_num_luma_minus4设置当前亮度块的阈值(S1210)。例如,当前亮度块的阈值可以设置为16<<log2_min_cu_pixel_num_luma_minus4。另选地,在当前块不是当前亮度块而是当前色度块时,编码设备/解码设备可以基于log2_min_cu_pixel_num_chroma_minus2设置当前色度块的阈值(S1220)。例如,当前色度块的阈值可以设置为4<<log2_min_cu_pixel_num_chroma_minus2。
此后,编码设备/解码设备可以确定通过将当前块分割为QT结构、BT结构或TT结构而生成的块的样本数目是否大于所设置的阈值(S1230)。
当通过分割块而生成的样本的数目大于阈值时,编码设备/解码设备可以检查当前块的现有QT/BT.TT分割条件,并对当前块执行分割(S1240)。
另选地,当通过分割块而生成的样本的数目不大于阈值时,编码设备/解码设备可以不对当前块执行分割(S1250)。
此外,编码设备可以通过设置log2_min_cu_pixel_num_luma_minus4和log2_min_cu_pixel_num_chroma_minus2的值来执行编码,并通过SPS发送信息。另外,编码设备可以在基于设置的log2_min_cu_pixel_num_luma_minus4和log2_min_cu_pixel_num_chroma_minus2执行最小块尺寸限制之后执行编码。
另外,可以根据如先前实施方式中的图像尺寸来设置log2_min_cu_pixel_num_luma_minus4和log2_min_cu_pixel_num_chroma_minus2的值,或者可以在编码时直接设置该值并且可以执行编码。
图13示意性地示出了根据本公开的编码设备的视频编码方法。图13中所公开的方法可以由图2中公开的编码设备执行。具体地,例如,可以由编码设备的图像分割器执行图13的步骤S1300至S1320,并且可以由编码设备的熵编码器执行S1330。另外,尽管未示出,但是可以由编码设备的减法器执行基于当前块(或当前块的子块)的原始样本和预测样本来推导当前块(或当前块的子块)的残差样本的处理,可以由编码设备的加法器来执行基于当前块(或当前块的子块)的残差样本和预测样本来推导当前块(或当前块的子块)的重构样本的处理,并且可以由编码设备的变换器执行基于残差样本来生成当前块(或当前块的子块)的关于残差的信息的处理,并且可以由编码设备的熵编码器执行对关于残差的信息进行编码的处理。
编码设备确定当前块的分割类型(S1300)。编码设备可以将输入图像(或图片、帧)分割为一个或更多个处理单元。例如,可以从编码树单元(CTU)或最大编码单元(LCU)根据QTBTTT(四叉树二叉树三叉树)结构来递归地分割当前块。例如,可以基于QT(四叉树)类型、水平二元类型、水平三元类型、垂直二元类型和/或垂直三元类型将当前块分割为多个子块。编码设备可以将当前块的分割类型确定为QT(四叉树)类型、水平二元类型、水平三元类型、垂直二元类型和垂直三元类型之一。
编码设备基于当前块的尺寸来确定是否对当前块进行分割(S1310)。编码设备可以基于当前块的尺寸来确定是否对当前块进行分割。当前块的尺寸可以代表当前块的样本数目。另选地,当前块的尺寸可以表示当前块的宽度或高度。例如,在当前块的分割类型是垂直二元类型或垂直三元类型时,当前块的尺寸可以是当前块的宽度,并且在当前块的分割类型是水平二元类型或水平三元类型时,当前块的尺寸可以是当前块的高度。
例如,在当前块是色度块并且当前块的尺寸小于或等于最小色度块尺寸时,可以确定不对当前块进行分割。另外,在当前块是色度块并且当前块的尺寸大于最小色度块尺寸时,可以确定对当前块进行分割。
例如,在当前块是色度块并且从当前块分割并推导出的子块的尺寸为2×2时,可以确定不对当前块进行分割。
此外,例如,在当前块是亮度块并且当前块的尺寸小于或等于最小亮度块尺寸时,可以确定不对当前块进行分割。另外,在当前块是亮度块并且当前块的尺寸大于最小亮度块尺寸时,可以确定对当前块进行分割。
例如,在当前块是亮度块并且从当前块分割并推导出的子块的尺寸为4×4时,可以确定不对当前块进行分割。
此外,可以如下地推导最小色度块尺寸。
作为示例,最小色度块尺寸可以被推导为预设值。例如,最小色度块尺寸可以为8、16或32。
另选地,作为示例,可以基于指示最小色度块尺寸的信息来推导最小色度块尺寸。例如,编码设备可以确定最小色度块尺寸,并且生成指示最小色度块尺寸的信息并对其进行编码,并且可以基于指示最小色度块尺寸的信息来推导最小色度块尺寸。基于指示最小色度块尺寸的信息,最小色度块尺寸可以被推导为8、16或32。
另外,可以如下地推导最小亮度块尺寸。
作为示例,最小亮度块尺寸可以被推导为预设值。例如,最小亮度块尺寸可以为16、32或64。
另选地,作为示例,可以基于指示最小亮度块尺寸的信息来推导最小亮度块尺寸。例如,编码设备可以确定最小亮度块尺寸,并且生成指示最小亮度块尺寸的信息并对其进行编码,并且可以基于指示最小色度块尺寸的信息来推导最小亮度块尺寸。例如,基于指示最小亮度块尺寸的信息,最小亮度块尺寸可以被推导为16、32或64。
当确定不对当前块进行分割时,编码设备不对当前块进行分割,并且当确定对当前块进行分割时,编码设备基于分割类型将当前块分割为子块(S1320)。
例如,当确定对当前块进行分割时,编码设备可以根据分割类型将当前块分割为子块。分割类型可以为QT(四叉树)类型、水平二元类型、水平三元类型、垂直二元类型和垂直三元类型中的一种。
QT类型可以指示其中块被分割为四个(W/2)×(H/2)尺寸的子块的类型。在此,W可以指代当前块的宽度,并且H可以是当前块的高度。另外,水平三元类型可以指示其中块被分割为两个W×(H/4)尺寸的子块和W×(H/2)尺寸的子块的类型,其中W×(H/2)尺寸的子块是中心子块。另外,垂直三元类型可以指示其中块被分为两个(W/4)×H尺寸的子块和(W/2)×H尺寸的子块的类型,其中(W/2)×H的子块是中心子块。可以指示块内(Block-in)类型。另外,水平二元类型可以指示其中块被分割为两个W×(H/2)尺寸的子块的类型,并且垂直二元类型可以指示其中块被分割为两个(W/2)×H尺寸的子块的类型。
此外,编码设备可以对子块进行编码。
例如,如上所述,编码设备可以对子块执行预测,生成包括子块的预测样本的预测块,并且生成子块的预测相关信息并对其进行编码。图像信息可以包括预测相关信息。编码设备可以确定对每个子块应用帧内预测还是帧间预测,并且可以为每个子块确定特定的帧内/帧间预测模式。接下来,编码设备可以基于上述各种预测方法来生成预测样本。
另外,例如,尽管未示出,但是编码设备可以基于子块的原始样本和预测样本来推导子块的残差样本,基于残差样本来生成子块的关于残差的信息,并对关于残差的信息进行编码。图像信息可以包括关于残差的信息。另外,编码设备可以基于子块的预测样本和残差样本来生成子块的重构样本。
此外,例如,在不对当前块进行分割时,编码设备可以对当前块进行解码。
例如,如上所述,编码设备可以对当前块执行预测,并且生成包括当前块的预测样本的预测块,并且生成关于当前块的预测相关信息并对其进行编码。图像信息可以包括预测相关信息。编码设备可以确定对当前块应用帧内预测还是帧间预测,并且可以确定当前块的特定帧内/帧间预测模式。接下来,编码设备可以基于上述各种预测方法来生成预测样本。
另外,例如,尽管未示出,但是编码设备可以基于当前块的原始样本和预测样本来推导当前块的残差样本,基于残差样本生成当前块的关于残差的信息,并对关于残差的信息进行编码。另外,编码设备可以基于当前块的预测样本和残差样本来生成当前块的重构样本。
编码设备对包括指示当前块的分割类型的分割信息的图像信息进行编码(S1330)。编码设备可以对包括指示当前块的分割类型的分割信息的图像信息进行编码,并且通过比特流来发信号通知该信息。
作为示例,分割信息可以包括第一标志,该第一标志指示当前块是否按照QT(四叉树)类型来分割。在此,QT类型可以指示其中当前块被分割成四个(W/2)×(H/2)尺寸的子块的分割类型。W可以指代当前块的宽度,并且H可以指代当前块的高度。
另外,当第一标志的值为0时,分割信息可以包括第二标志和第三标志。第二标志可以指示当前块的分割方向,并且第三标志可以指示当前块的分割类型是二叉树(BT)类型还是三叉树(TT)类型。指示第一标志的语法元素可以是split_qt_flag,指示第二标志的语法元素可以是mtt_split_cu_vertical_flag,并且指示第三标志的语法元素可以是mtt_split_cu_binary_flag。
另外,例如,图像信息可以包括指示最小亮度块尺寸的信息。可以以编码单元(CU)、条带报头、图片参数集(PPS)或序列参数集(SPS)为单位发信号通知指示最小亮度块尺寸的信息。即,指示最小亮度块尺寸的信息可以作为编码单元(CU)、条带报头、图片参数集(PPS)或序列参数集(SPS)来发信号通知。另外,例如,图像信息可以包括指示最小色度块尺寸的信息。可以以编码单元(CU)、条带报头、图片参数集(PPS)或序列参数集(SPS)为单位发信号通知指示最小色度块尺寸的信息。指示最小亮度块尺寸的信息可以作为编码单元(CU)、条带报头、图片参数集(PPS)或序列参数集(SPS)发信号通知。指示用于指示最小亮度块尺寸的信息的语法元素可以是log2_min_cu_pixel_num_luma_minus4,而指示用于指示最小色度块尺寸的信息的语法元素可以是log2_min_cu_pixel_num_chroma_minus2。
此外,图像信息可以包括关于当前块或子块的预测相关信息。预测相关信息可以指示关于应用于当前块或子块的帧间预测或帧内预测的信息。另外,图像信息可以包括当前块或子块的关于残差的信息。
此外,比特流可以通过网络或(数字)储存介质发送到解码设备。在此,网络可以包括广播网络和/或通信网络,并且数字储存介质可以包括各种储存介质,诸如USB、SD、CD、DVD、蓝光、HDD和SSD。
图14示意性地示出了根据本公开的执行图像编码方法的编码设备。可以由图14中公开的编码设备执行图13中公开的方法。具体地,例如,图14的编码设备的图像分割器可以执行图13的S1300至S1320,并且图14的编码设备的熵编码器可以执行图13的S1330。另外,尽管未示出,但是可以由图14的编码设备的减法器来执行基于当前块(或当前块的子块)的原始样本和预测样本来推导当前块(或当前块的子块)的残差样本的处理,可以由图14的编码设备的加法器执行基于当前块(或当前块的子块)的预测样本和残差样本来推导当前块(或当前块的子块)的重构样本的处理,并且可以由图14的编码设备的变换器执行基于残差样本生成当前块(或当前块的子块)的关于残差的信息的处理,并且可以由图14的编码设备的熵编码器执行对关于残差的信息进行编码的处理。
图15示意性地示出了根据本公开的解码设备的视频解码方法。可以由图3中公开的解码设备执行图15中公开的方法。具体地,例如,可以由解码设备的熵解码器执行图15的S1500,并且可以由解码设备的图像分割器、预测器和加法器执行步骤S1510和S1520。另外,尽管未示出,但是可以由解码设备的熵解码器执行通过比特流获取当前块的关于残差的信息的处理,以及可以由解码设备的逆变换器执行基于残差信息来推导当前块的残差样本的处理。
解码设备获得包括分割信息的图像信息(S1500)。解码设备可以通过比特流获得包括分割信息的图像信息。
作为示例,分割信息可以包括指示当前块是否按照QT(四叉树)类型来分割的第一标志。在此,QT类型可以指示其中当前块被分割成四个(W/2)×(H/2)尺寸的子块的分割类型。W可以指代当前块的宽度,并且H可以指代当前块的高度。
另外,当第一标志的值为0时,分割信息可以包括第二标志和第三标志。第二标志可以指示当前块的分割方向,并且第三标志可以指示当前块的分割类型是二叉树(BT)类型还是三叉树(TT)类型。指示第一标志的语法元素可以是split_qt_flag,指示第二标志的语法元素可以是mtt_split_cu_vertical_flag,并且指示第三标志的语法元素可以是mtt_split_cu_binary_flag。
另外,例如,图像信息可以包括指示最小亮度块尺寸的信息。可以以编码单元(CU)、条带报头、图片参数集(PPS)或序列参数集(SPS)为单位发信号通知指示最小亮度块尺寸的信息。即,指示最小亮度块尺寸的信息可以作为编码单元(CU)、条带报头、图片参数集(PPS)或序列参数集(SPS)发信号通知。另外,例如,图像信息可以包括指示最小色度块尺寸的信息。可以以编码单元(CU)、条带报头、图片参数集(PPS)或序列参数集(SPS)为单位发信号通知指示最小色度块尺寸的信息。指示最小亮度块尺寸的信息可以作为编码单元(CU)、条带报头、图片参数集(PPS)或序列参数集(SPS)发信号通知。指示用于指示最小亮度块尺寸的信息的语法元素可以是log2_min_cu_pixel_num_luma_minus4,而指示用于指示最小色度块尺寸的信息的语法元素可以是log2_min_cu_pixel_num_chroma_minus2。
此外,图像信息可以包括关于当前块或子块的预测相关信息。预测相关信息可以指示关于应用于当前块或子块的帧间预测或帧内预测的信息。
解码设备基于当前块的尺寸确定是否对当前块进行分割(S1510)。解码设备可以基于当前块的尺寸来确定是否对当前块进行分割。当前块的尺寸可以表示当前块的样本数目。另选地,当前块的尺寸可以表示当前块的宽度或高度。例如,在当前块的分割类型是垂直二元类型或垂直三元类型时,当前块的尺寸可以是当前块的宽度,并且在当前块的分割类型是水平二元类型或水平三元类型时,当前块的尺寸可以是当前块的高度。
例如,在当前块是色度块并且当前块的尺寸小于或等于最小色度块尺寸时,可以确定不对当前块进行分割。另外,在当前块是色度块并且当前块的尺寸大于最小色度块尺寸时,可以确定对当前块进行分割。
例如,在当前块是色度块并且从当前块分割并推导出的子块的尺寸为2×2时,可以确定不对当前块进行分割。
此外,例如,在当前块是亮度块并且当前块的尺寸小于或等于最小亮度块尺寸时,可以确定不对当前块进行分割。另外,在当前块是亮度块并且当前块的尺寸大于最小亮度块尺寸时,可以确定对当前块进行分割。
例如,在当前块是亮度块并且从当前块分割并推导出的子块的尺寸为4×4时,可以确定不对当前块进行分割。
此外,可以如下地推导最小色度块尺寸。
作为示例,最小色度块尺寸可以被推导为预设值。例如,最小色度块尺寸可以为8、16或32。
另选地,作为示例,可以基于指示最小色度块尺寸的信息来推导最小色度块尺寸。例如,基于指示最小色度块尺寸的信息,最小色度块尺寸可以被推导为8、16或32。
另外,可以如下地推导最小亮度块尺寸。
作为示例,最小亮度块尺寸可以被推导为预设值。例如,最小亮度块尺寸可以为16、32或64。
另选地,作为示例,可以基于指示最小亮度块尺寸的信息来推导最小亮度块尺寸。例如,基于指示最小亮度块尺寸的信息,最小亮度块尺寸可以被推导为16、32或64。
解码设备基于是否对所确定的当前块进行分割来解码当前块或当前块的子块(S1520)。
例如,在确定对当前块进行分割时,解码设备可以基于分割信息将当前块分割为子块,并且对子块进行解码。
例如,在确定出要对当前块进行分割时,解码设备可以基于分割信息来推导当前块的分割类型,并且根据分割类型将当前块分割为子块。
例如,分割信息可以包括第一标志。当第一标志的值为1时,解码设备可以根据QT类型将当前块分割为子块。QT类型可以表示其中将块分割为四个(W/2)×(H/2)尺寸的子块的类型。在此,W可以指代当前块的宽度,而H可以是当前块的高度。
此外,例如,当第一标志的值为0时,解码设备可以通过基于第二标志和第三标志推导的当前块的分割类型,将当前块分割为子块。基于第一标志和第三标志推导出的分割类型可以是水平三元类型、水平二元类型、垂直三元类型和垂直二元类型中的一种。例如,当第二标志的值为0并且第三标志的值为0时,分割类型可以被推导为水平三元类型。当第二标志的值为0并且第三标志的值为1时,分割类型可以被推导为水平二元类型。当第二标志的值为1并且第三标志的值为0时,分割类型可以被推导为垂直三元类型,并且当第二标志的值为1并且第三标志的值为1时,分割类型可以被推导为垂直二元类型。
水平三元类型可以是其中块被分割为两个W×(H/4)尺寸的子块和W×(H/2)尺寸的子块的类型,其中W×(H/2)尺寸的子块是中心子块。另外,垂直三元可以表示其中块被分割为两个(W/4)×H尺寸的子块和(W/2)×H尺寸的子块的类型,其中(W/2)×H尺寸的子块是中心子块。另外,水平二元类型可以表示其中块被分割为两个W×(H/2)尺寸的子块的类型,而垂直二元类型可以表示其中块被分割为两个(W/2)×H尺寸的子块的类型。
此后,解码设备可以对子块进行解码。
例如,如上所述,解码设备可以对子块执行预测,并生成包括子块的预测样本的预测块。解码设备可以基于预测相关信息来确定向每个子块应用帧内预测还是帧间预测,并且可以为每个子块确定特定的帧内/帧间预测模式。接下来,解码设备可以基于上述各种预测方法来生成预测样本。
解码设备可以基于预测样本来生成重构样本。例如,解码设备可以从比特流接收子块的关于残差的信息。关于残差的信息可以包括关于残差样本的变换系数。解码设备可以基于关于残差的信息来推导子块的残差样本(或残差样本阵列)。在这种情况下,解码设备可以基于预测样本和残差样本来生成重构样本。解码设备可以基于重构样本来推导重构块或重构图片。此后,如上所述,解码设备可以将诸如解块滤波和/或SAO过程之类的环路滤波过程应用于重构图片,以根据需要改善主观/客观图像质量。
此外,当确定出不对当前块进行分割时,解码设备可以对当前块进行解码而不对当前块进行分割。
例如,如上所述,解码设备可以对当前块执行预测,并且生成包括当前块的预测样本的预测块。解码设备可以基于预测相关信息来确定向当前块应用帧内预测还是帧间预测,并且可以为当前块确定特定的帧内/帧间预测模式。接下来,解码设备可以基于上述各种预测方法来生成预测样本。
解码设备可以基于预测样本来生成重构样本。例如,解码设备可以从比特流接收当前块的关于残差的信息。关于残差的信息可以包括关于残差样本的变换系数。解码设备可以基于关于残差的信息来推导当前块的残差样本(或残差样本阵列)。在这种情况下,解码设备可以基于预测样本和残差样本来生成重构样本。解码设备可以基于重构样本来推导重构块或重构图片。此后,如上所述,解码设备可以将诸如解块滤波和/或SAO过程的环路滤波过程应用于重构图片,以根据需要改善主观/客观图像质量。
图16示意性地示出了根据本公开的用于执行视频解码方法的解码设备。可以由图16中公开的解码设备执行图15中公开的方法。具体地,例如,图16的解码设备的熵解码器可以执行图15的S1500,并且图16的解码设备的图像分割器、预测器和加法器可以执行图15的步骤S1510和S1520。另外,尽管未示出,但是可以由图16的解码设备的熵解码器执行通过比特流获取包括当前块的关于残差的信息的图像信息的处理。可以由图16的解码设备的逆变换器执行基于关于残差的信息来推导当前块的残差样本的处理。
根据本公开,通过有效地执行图像分割,可以提高图像编码效率。
另外,根据本公开,可以通过限制分割为具有特定尺寸或以下的亮度块和/或色度块来减小最坏情况的数据吞吐量,从而有效地减小编码和解码处理速率。
在以上实施方式中,基于具有一系列步骤或方框的流程图描述了方法。本公开不限于以上步骤或方框的顺序。一些步骤或方框可以以与上述的其它步骤或方框不同的顺序执行或同时执行。此外,本领域技术人员将理解,流程图中所示的步骤不是排它的,并且可以还包括其它步骤,或者可以在不影响本公开的范围的情况下删除流程图中的一个或更多个步骤。
在本说明书中所描述的实施方式可以通过被实现在处理器、微处理器、控制器或芯片上来执行。例如,每个图中所示的功能单元可以通过被实现在计算机、处理器、微处理器、控制器或芯片上来执行。在这种情况下,用于实现的信息(例如,关于指令的信息)或算法可以存储在数字存储介质中。
另外,应用本公开的解码设备和编码设备可以被包括在如下设备中:多媒体广播发送/接收设备、移动通信终端、家庭影院视频设备、数字影院视频设备、监视相机、视频聊天设备、诸如视频通信的实时通信设备、移动流设备、存储介质、便携式摄像机、VoD服务提供设备、顶置(OTT)视频设备、互联网流服务提供设备、三维(3D)视频设备、电话会议视频设备、运输用户设备(例如,车辆用户设备、飞机用户设备和轮船用户设备)和医疗视频装置;并且应用本公开的解码设备和编码设备可以用于处理视频信号或数据信号。例如,顶置(OTT)视频设备可以包括游戏机、蓝光播放器、互联网接入电视机、家庭影院系统、智能电话、平板电脑、数字视频记录仪(DVR)等。
另外,应用本公开的处理方法可以以计算机执行的程序的形式产生,并且可以存储在计算机可读记录介质中。根据本公开的具有数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括其中存储计算机可读数据的所有类型的存储装置。计算机可读记录介质可以包括例如BD、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。另外,计算机可读记录介质包括以载波(例如,经由互联网的传输)形式实现的介质。另外,由编码方法生成的比特流可以存储在计算机可读记录介质中或通过有线/无线通信网络来传输。
另外,本公开的实施方式可以根据程序代码利用计算机程序产品来实现,并且程序代码可以通过本公开的实施方式在计算机中执行。程序代码可以存储在计算机可读载体上。
图17例示了应用了本公开的内容流系统的结构图。
应用本文档的实施方式的内容流系统可以主要包括编码服务器、流服务器、网络服务器、媒体储存器、用户装置和多媒体输入装置。
编码服务器将从诸如智能手机、相机或便携式摄像机等的多媒体输入装置输入的内容压缩为数字数据,以生成比特流并将比特流发送到流服务器。作为另一示例,当诸如智能手机、相机或便携式摄像机等的多媒体输入装置直接生成比特流时,可以省略编码服务器。
可以通过应用了本公开的实施方式的编码方法或比特流生成方法来生成比特流,并且流服务器可以在发送或接收比特流的过程中临时存储比特流。
流服务器基于用户请求通过网络服务器向用户装置发送多媒体数据,并且网络服务器用作向用户通知服务的媒介。当用户从网络服务器请求所需的服务时,网络服务器向流服务器递送该请求,并且流服务器向用户发送多媒体数据。在这种情况下,内容流系统可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流系统内的装置之间的命令/响应。
流服务器可以从媒体储存器和/或编码服务器接收内容。例如,当从编码服务器接收内容时,可以实时接收内容。在这种情况下,为了提供平稳的流服务,流服务器可以将比特流存储预定时间段。
用户装置的示例可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航仪、触屏PC、平板PC、超级本、可穿戴装置(例如,智能手表、智能眼镜和头戴式显示器)、数字TV、台式计算机和数字标牌等。内容流系统内的每个服务器可以作为分布式服务器来操作,在这种情况下,从每个服务器接收的数据可以被分布。

Claims (14)

1.一种用于图像解码的解码设备,该解码设备包括:
存储器;以及
至少一个处理器,所述至少一个处理器连接到所述存储器,所述至少一个处理器被配置为:
获得包括分割信息的图像信息;
基于当前块的样本数目确定是否对所述当前块进行分割;以及
基于是否对所确定的当前块进行分割,对所述当前块进行解码,
其中,所述分割信息包括指示所述当前块是否按照四叉树QT类型来分割的第一标志,并且
基于所述第一标志的值为0,所述分割信息包括第二标志和第三标志,所述第二标志指示所述当前块的分割方向,并且所述第三标志指示所述当前块的分割类型为二叉树BT类型还是三叉树TT类型。
2.根据权利要求1所述的解码设备,其中,在所述当前块是色度块并且从所述当前块分割和推导出的子块的尺寸为2×2时,确定不对所述当前块进行分割。
3.根据权利要求1所述的解码设备,其中,最小色度块尺寸为16。
4.根据权利要求3所述的解码设备,其中,所述图像信息包括指示所述最小色度块尺寸的信息,并且基于指示所述最小色度块尺寸的信息来推导所述最小色度块尺寸。
5.根据权利要求1所述的解码设备,其中,在所述当前块是亮度块并且所述当前块的所述样本数目等于或小于最小亮度块尺寸时,确定不对所述当前块进行分割。
6.根据权利要求5所述的解码设备,其中,所述图像信息包括指示所述最小亮度块尺寸的信息,并且基于指示所述最小亮度块尺寸的信息来推导所述最小亮度块尺寸。
7.根据权利要求6所述的解码设备,其中,指示所述最小亮度块尺寸的所述信息按照序列参数集SPS来发信号通知。
8.根据权利要求1所述的解码设备,其中,根据基于所述第二标志和所述第三标志推导的所述当前块的分割类型,所述当前块被分割为子块。
9.根据权利要求8所述的解码设备,其中,
当所述第二标志的值为0并且所述第三标志的值为0时,所述分割类型被推导为水平三元类型,
当所述第二标志的值为0并且所述第三标志的值为1时,所述分割类型被推导为水平二元类型,
当所述第二标志的值为1并且所述第三标志的值为0时,所述分割类型被推导为垂直三元类型,并且
当所述第二标志的值为1并且所述第三标志的值为1时,所述分割类型被推导为垂直二元类型。
10.一种用于图像编码的编码设备,该编码设备包括:
存储器;以及
至少一个处理器,所述至少一个处理器连接到所述存储器,所述至少一个处理器被配置为:
确定当前块的分割类型;
基于所述当前块的样本数目确定是否对所述当前块进行分割;
基于确定对所述当前块进行分割,基于所述分割类型将所述当前块分割为子块;以及
对图像信息进行编码,所述图像信息包括指示所述当前块的所述分割类型的分割信息,
其中,所述分割信息包括指示所述当前块是否按照四叉树QT类型来分割的第一标志,并且
基于所述第一标志的值为0,所述分割信息包括第二标志和第三标志,所述第二标志指示所述当前块的分割方向,并且所述第三标志指示所述当前块的分割类型为二叉树BT类型还是三叉树TT类型。
11.根据权利要求10所述的编码设备,其中,当所述当前块是色度块并且从所述当前块分割和推导出的子块的尺寸为2×2时,确定不对所述当前块进行分割。
12.根据权利要求10所述的编码设备,其中,最小色度块尺寸为16。
13.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质存储通过根据权利要求10所述的编码设备生成的比特流。
14.一种发送用于图像的数据的设备,该设备包括:
至少一个处理器,所述至少一个处理器被配置为获得包括残差信息的图像信息的比特流,其中,所述比特流是通过以下操作生成的:确定当前块的分割类型,基于所述当前块的样本数目确定是否对所述当前块进行分割,基于确定对所述当前块进行分割,基于所述分割类型将所述当前块分割为子块,对图像信息进行编码,所述图像信息包括指示所述当前块的所述分割类型的分割信息,并且生成包括所述图像信息的所述比特流,
发送器,所述发送器被配置为发送包含包括所述残差信息的所述图像信息的所述比特流的所述数据,
其中,所述分割信息包括指示所述当前块是否按照四叉树QT类型来分割的第一标志,并且
基于所述第一标志的值为0,所述分割信息包括第二标志和第三标志,所述第二标志指示所述当前块的分割方向,并且所述第三标志指示所述当前块的分割类型为二叉树BT类型还是三叉树TT类型。
CN202311110124.0A 2018-09-21 2019-09-20 解码和编码设备、存储介质及发送用于图像的数据的设备 Pending CN116962692A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201862734292P 2018-09-21 2018-09-21
US62/734,292 2018-09-21
CN201980066015.9A CN112840649A (zh) 2018-09-21 2019-09-20 图像编码系统中通过使用块分割对图像解码的方法及其装置
PCT/KR2019/012196 WO2020060259A1 (ko) 2018-09-21 2019-09-20 영상 코딩 시스템에서 블록 파티셔닝을 사용하는 영상 디코딩 방법 및 그 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980066015.9A Division CN112840649A (zh) 2018-09-21 2019-09-20 图像编码系统中通过使用块分割对图像解码的方法及其装置

Publications (1)

Publication Number Publication Date
CN116962692A true CN116962692A (zh) 2023-10-27

Family

ID=69888581

Family Applications (6)

Application Number Title Priority Date Filing Date
CN201980066015.9A Pending CN112840649A (zh) 2018-09-21 2019-09-20 图像编码系统中通过使用块分割对图像解码的方法及其装置
CN202311109417.7A Pending CN116962690A (zh) 2018-09-21 2019-09-20 视频解码和编码方法、存储介质及数据的发送方法
CN202311126831.9A Pending CN117041575A (zh) 2018-09-21 2019-09-20 视频解码和编码方法、存储介质及数据的发送方法
CN202311110102.4A Pending CN116996672A (zh) 2018-09-21 2019-09-20 视频解码和编码方法、存储介质及数据的发送方法
CN202311110124.0A Pending CN116962692A (zh) 2018-09-21 2019-09-20 解码和编码设备、存储介质及发送用于图像的数据的设备
CN202311109742.3A Pending CN116962691A (zh) 2018-09-21 2019-09-20 解码和编码设备、存储介质及发送用于图像的数据的设备

Family Applications Before (4)

Application Number Title Priority Date Filing Date
CN201980066015.9A Pending CN112840649A (zh) 2018-09-21 2019-09-20 图像编码系统中通过使用块分割对图像解码的方法及其装置
CN202311109417.7A Pending CN116962690A (zh) 2018-09-21 2019-09-20 视频解码和编码方法、存储介质及数据的发送方法
CN202311126831.9A Pending CN117041575A (zh) 2018-09-21 2019-09-20 视频解码和编码方法、存储介质及数据的发送方法
CN202311110102.4A Pending CN116996672A (zh) 2018-09-21 2019-09-20 视频解码和编码方法、存储介质及数据的发送方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202311109742.3A Pending CN116962691A (zh) 2018-09-21 2019-09-20 解码和编码设备、存储介质及发送用于图像的数据的设备

Country Status (3)

Country Link
US (3) US11368687B2 (zh)
CN (6) CN112840649A (zh)
WO (1) WO2020060259A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023039859A1 (zh) * 2021-09-17 2023-03-23 Oppo广东移动通信有限公司 视频编解码方法、设备、系统、及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PT2465265T (pt) 2009-08-12 2019-02-01 Interdigital Vc Holdings Inc Procedimentos e dispositivos para melhorada intra-codificação e intra-descodificação croma
ES2554237T3 (es) * 2009-10-01 2015-12-17 Sk Telecom. Co., Ltd. Método y aparato para codificar/decodificar imagen usando una capa dividida
KR101813189B1 (ko) 2010-04-16 2018-01-31 에스케이 텔레콤주식회사 영상 부호화/복호화 장치 및 방법
KR20130058524A (ko) * 2011-11-25 2013-06-04 오수미 색차 인트라 예측 블록 생성 방법
KR101709775B1 (ko) * 2013-07-23 2017-02-23 인텔렉추얼디스커버리 주식회사 영상 부호화/복호화 방법 및 장치
EP3069510A4 (en) 2013-11-18 2017-06-28 Nokia Technologies Oy Method and apparatus for enhanced digital imaging
WO2016074147A1 (en) * 2014-11-11 2016-05-19 Mediatek Singapore Pte. Ltd. Separated coding tree for luma and chroma
WO2017088093A1 (en) * 2015-11-23 2017-06-01 Mediatek Singapore Pte. Ltd. On the smallest allowed block size in video coding
US10567808B2 (en) 2016-05-25 2020-02-18 Arris Enterprises Llc Binary ternary quad tree partitioning for JVET
US20210281873A1 (en) * 2016-09-06 2021-09-09 Mediatek Inc. Methods and apparatuses of candidate set determination for binary-tree splitting blocks
US20190260992A1 (en) * 2016-10-10 2019-08-22 Samsung Electronics Co., Ltd. Method and device for encoding or decoding luma block and chroma block
KR102390384B1 (ko) 2017-03-13 2022-04-22 에스케이텔레콤 주식회사 영상 부호화 또는 복호화하기 위한 장치 및 방법
KR20200001554A (ko) * 2018-06-27 2020-01-06 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체

Also Published As

Publication number Publication date
US20220329796A1 (en) 2022-10-13
CN112840649A (zh) 2021-05-25
US11368687B2 (en) 2022-06-21
CN116962691A (zh) 2023-10-27
US20210352285A1 (en) 2021-11-11
CN117041575A (zh) 2023-11-10
WO2020060259A1 (ko) 2020-03-26
US11882280B2 (en) 2024-01-23
US20240146920A1 (en) 2024-05-02
CN116996672A (zh) 2023-11-03
CN116962690A (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
US11575891B2 (en) Intra prediction method and device based on intra sub-partitions in image coding system
US11849151B2 (en) Syntax design method and apparatus for performing coding by using syntax
CN114208175B (zh) 基于色度量化参数数据的图像解码方法及其设备
US20220417517A1 (en) Image decoding method using cclm prediction in image coding system, and apparatus therefor
US20220070442A1 (en) Affine motion prediction-based video decoding method and device using subblock-based temporal merge candidate in video coding system
KR20220019241A (ko) 적응적 루프 필터 기반 비디오 또는 영상 코딩
CN114586350A (zh) 基于交叉分量自适应环路滤波的图像编译装置和方法
CN114258677A (zh) 编译色度量化参数偏移相关信息的图像解码方法和设备
CN111989919B (zh) 基于使用mpm列表的帧内预测的图像编码方法及设备
US20240146920A1 (en) Method for decoding image by using block partitioning in image coding system, and device therefor
US20220124309A1 (en) Unified mpm list-based intra prediction
CN114586351A (zh) 基于自适应环路滤波的图像编译设备和方法
US20220408115A1 (en) Image decoding method and device
KR20220073834A (ko) 영상/비디오 코딩을 위한 상위 레벨 신택스 시그널링 방법 및 장치
CN114600451A (zh) 基于矩阵帧内预测的图像编码设备和方法
CN113273210B (zh) 用于编译关于合并数据的信息的方法和装置
CN115349258B (zh) 图像编码系统中用于残差编码的图像解码方法及其设备
US11483573B2 (en) Image encoding/decoding method and device for determining division mode on basis of prediction mode type determined according to color format, and method for transmitting bitstream
US20230209075A1 (en) Image decoding method and device therefor
KR20220083818A (ko) 슬라이스 관련 정보를 시그널링하는 방법 및 장치
KR20220137954A (ko) 비디오 또는 영상 코딩 시스템에서의 타일과 관련된 정보 및 슬라이스와 관련된 정보에 기반한 영상 코딩 방법
KR20220082082A (ko) 영상 정보를 시그널링하는 방법 및 장치
CN116456107A (zh) 解码设备、编码设备以及发送数据的设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination