CN118056399A - 利用几何分区模式的视频编码/解码的方法和装置 - Google Patents
利用几何分区模式的视频编码/解码的方法和装置 Download PDFInfo
- Publication number
- CN118056399A CN118056399A CN202280066941.8A CN202280066941A CN118056399A CN 118056399 A CN118056399 A CN 118056399A CN 202280066941 A CN202280066941 A CN 202280066941A CN 118056399 A CN118056399 A CN 118056399A
- Authority
- CN
- China
- Prior art keywords
- region
- block
- intra
- prediction mode
- current block
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000005192 partition Methods 0.000 title description 106
- 238000000638 solvent extraction Methods 0.000 claims abstract description 25
- 239000013598 vector Substances 0.000 description 48
- 238000010586 diagram Methods 0.000 description 44
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000009795 derivation Methods 0.000 description 12
- 238000013139 quantization Methods 0.000 description 12
- 238000012935 Averaging Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000008707 rearrangement Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 108010063123 alfare Proteins 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了一种视频编码/解码方法和装置。根据本发明的视频解码方法可以包括以下步骤:将当前块分区为第一区域和第二区域;确定第一区域是否使用帧内预测模式或帧间预测模式;确定第二区域是否使用帧内预测模式或帧间预测模式;生成用于利用帧内预测模式的区域的帧内预测块;生成用于利用帧间预测模式的区域的帧间预测块;以及基于用于第一区域的预测块和用于第二区域的预测块来生成当前块的预测块。
Description
技术领域
本发明在一些实施方案中涉及利用几何分区模式的视频编码/解码的方法和装置。更具体地,本发明涉及这样一种视频编码/解码方法和装置,其用于通过将帧内预测模式和帧间预测模式应用于在几何分区模式下分区的两个区域的每个来生成当前块的预测块。
背景技术
下面描述的内容仅提供与本实施方案有关的背景技术信息,并不构成现有技术。
由于视频数据量大于语音数据量或静止影像数据量,在不通过压缩来处理视频数据的情况下存储或传输视频数据需要大量的硬件资源,包括存储器。
相应地,在存储或传输视频数据时,通常利用编码器来压缩视频数据,以便于存储或传输视频数据。然后,解码器接收压缩的视频数据,解压并再现视频数据。用于这种视频数据的压缩技术包括H.264/AVC、高效率视频编解码(High Efficiency Video Coding,HEVC)和多功能视频编解码(Versatile Video Coding,VVC),所述多功能视频编解码(VVC)比HEVC的编解码效率提高了大约30%或更多。
然而,视频大小、分辨率和帧速率逐渐增加,并且因此要编码的数据量也在增加。因此,需要一种与现有压缩技术相比具有更好的编码效率和更高的影像质量的新压缩技术。
几何分区模式是通过将两个帧间预测信号进行加权平均来生成当前块的预测块的方法,所述两个帧间预测信号是通过将一个编码单元(coding unit,CU)分区为两个区域并在两个分区的区域中独立地执行帧间预测而生成的。需要在几何分区模式下利用帧内预测模式和帧间预测模式的各种组合,而不是仅利用帧间预测模式。
发明内容
技术问题
本发明的一个目的是提供基于几何分区模式生成当前块的预测块的方法和装置。
本发明的另一个目的是提供通过将帧间预测模式和帧内预测模式应用于在几何分区模式下分区的两个区域的每个来生成当前块的预测块的方法和装置。
本发明的另一个目的是提供通过可变地组合几何分区模式下的帧间预测模式和帧内预测模式来生成当前块的预测块的方法和装置。
本发明的另一个目的是提供增强几何分区模式下的预测准确性的方法和装置。
本发明的另一个目的是提供用于提高视频编码/解码效率的方法和装置。
本发明的另一个目的在于提供一种存储由本发明的视频编码/解码方法或视频编码/解码装置生成的比特流的记录介质。
本发明的另一个目的在于提供一种用于传输由本发明的视频编码/解码方法或装置生成的比特流的方法和装置。
技术方案
根据本发明,一种视频解码方法包括:将当前块分区为第一区域和第二区域,确定第一区域是否利用帧内预测模式或帧间预测模式,确定第二区域是否利用帧内预测模式或帧间预测模式,基于最可能模式(MPM)列表、与当前块邻近的一个或更多个块的帧内预测模式、与当前块邻近的一个或更多个参考像素以及与当前块邻近的第三区域的至少一个来生成用于第一区域与第二区域之间的利用帧内预测模式的任何区域的帧内预测块,生成用于第一区域与第二区域之间的利用帧间预测模式的任何区域的帧间预测块,以及基于用于第一区域的预测块和用于第二区域的预测块来生成当前块的预测块。
根据本发明,一种视频编码方法包括:将当前块分区为第一区域和第二区域,确定第一区域是否利用帧内预测模式或帧间预测模式,确定第二区域是否利用帧内预测模式或帧间预测模式,基于最可能模式(MPM)列表、与当前块邻近的一个或更多个块的帧内预测模式、与当前块邻近的一个或更多个参考像素以及与当前块邻近的第三区域的至少一个来生成用于第一区域与第二区域之间的利用帧内预测模式的任何区域的帧内预测块,生成用于第一区域与第二区域之间的利用帧间预测模式的任何区域的帧间预测块,以及基于用于第一区域的预测块和用于第二区域的预测块来生成当前块的预测块。
另外,根据本发明,可以提供一种传输由根据本发明的视频编码方法或装置生成的比特流的方法。
另外,根据本发明,可以提供一种存储由根据本发明的视频编码方法或装置生成的比特流的记录介质。
另外,根据本发明,可以提供一种存储由根据本发明的视频解码装置接收和解码并且用于重构视频的比特流的记录介质。
有益效果
根据本发明,可以提供基于几何分区模式生成当前块的预测块的方法和装置。
另外,根据本发明,可以提供通过将帧间预测模式和帧内预测模式应用于在几何分区模式下分区的两个区域的每个来生成当前块的预测块的方法和装置。
另外,根据本发明,可以提供通过可变地组合几何分区模式下的帧间预测模式和帧内预测模式来生成当前块的预测块的方法和装置。
另外,根据本发明,可以提供增强几何分区模式下的预测准确性的方法和装置。
另外,根据本发明,可以提供用于提高视频编码/解码效率的方法和装置。
可以通过本发明获取的效果不限于上述效果,本领域普通技术人员可以通过下面的描述清楚地理解未提及的其他效果。
附图说明
图1是可以实现本发明技术的视频编码装置的框图。
图2示出利用四叉树加二叉树三叉树(QTBTTT)结构来对块进行分区的方法。
图3a和图3b示出包括宽角度帧内预测模式的多个帧内预测模式。
图4示出当前块的相邻块。
图5是可以实现本发明技术的视频解码装置的框图。
图6是示出根据本发明的至少一个实施方案的将几何分区模式应用于32×32块的方法的示意图。
图7a和图7b是示出根据本发明的一些实施方案的几何分区模式下的角度参数和距离参数的示意图。
图8是示出根据本发明的至少一个实施方案的几何分区模式下的分区方向信息的查找表的示意图。
图9a和图9b是示出根据本发明的至少一个实施方案的帧间预测的误差分布和帧内预测的误差分布的示意图。
图10是示出根据本发明的至少一个实施方案的几何分区模式下的第一区域、第二区域和周围参考像素的示意图。
图11是示出根据本发明的至少一个实施方案的几何分区模式下的与第一区域相邻的参考块的示意图。
图12a和图12b是示出根据本发明的其他实施方案的几何分区模式下的与第一区域相邻的参考块的示意图。
图13是示出根据本发明的至少一个实施方案的几何分区模式下的帧内预测模式的语法的示意图。
图14是示出根据本发明的至少一个实施方案的几何分区模式下的模板以及由基于模板的帧内预测模式推导所使用的参考像素的示意图。
图15a和图15b是示出根据本发明的其他实施方案的几何分区模式下的模板以及由基于模板的帧内预测模式推导所使用的参考像素的示意图。
图16是示出根据本发明的至少一个实施方案的几何分区模式下应用索贝尔运算的参考像素的示意图。
图17a和图17b是示出根据本发明的其他实施方案的几何分区模式下应用索贝尔运算的参考像素的示意图。
图18是示出根据本发明的至少一个实施方案的几何分区模式下应用模式直方图的当前块的相邻块的示意图。
图19a、图19b、图19c和图19d是示出根据本发明的其他实施方案的几何分区模式下应用模式直方图的当前块的相邻块的示意图。
图20是示出根据本发明的至少一个实施方案的几何分区模式下组合帧内预测模式和帧间预测模式的方法的示意图。
图21是示出根据本发明的至少一个实施方案的几何分区模式下组合帧内预测模式和帧间预测模式的语法的示意图。
图22是示出根据本发明的至少一个实施方案的几何分区模式下的帧内预测模式的语法的示意图。
图23是示出根据本发明的至少一个实施方案的几何分区模式下的帧间预测模式的语法的示意图。
图24是示出根据本发明的至少一个实施方案的视频解码过程的示意图。
图25是示出根据本发明的至少一个实施方案的视频编码过程的示意图。
具体实施方式
在下文中,将参考所附说明性附图对本发明的一些实施方案进行详细描述。在下面的描述中,相同的附图标记表示相同的元件,尽管元件在不同的附图中示出。此外,在一些实施方案的以下描述中,当认为相关的已知组件和功能的详细描述模糊了本发明的主题时,为了清楚和简洁起见,已经省略对相关的已知组件和功能的详细描述。
图1是可以实现本发明技术的视频编码装置的框图。在下文中,参考图1的图示,对视频编码装置以及该装置的组件进行描述。
编码装置可以包括:图像分割器110、预测器120、减法器130、变换器140、量化器145、重排单元150、熵编码器155、逆量化器160、逆变换器165、加法器170、环路滤波单元180和存储器190。
编码装置的每个组件可以实现为硬件或软件,或者实现为硬件和软件的组合。另外,每个组件的功能可以实现为软件,并且微处理器也可以实现为执行对应于每个组件的软件的功能。
一个视频由包括多个图像的一个或更多个序列组成。每个图像分割为多个区域,并且对每个区域执行编码。例如,一个图像分割为一个或更多个瓦片(tile)或/和切片(slice)。这里,一个或更多个瓦片可以定义为瓦片组。每个瓦片或/和切片分割为一个或更多个编码树单元(coding tree unit,CTU)。另外,每个CTU通过树结构分割为一个或更多个编码单元(coding unit,CU)。应用于每个编码单元(CU)的信息被编码为CU的语法,并且共同应用于包括在一个CTU中的CU的信息被编码为CTU的语法。另外,共同应用于一个切片中的所有块的信息被编码为切片头的语法,而应用于构成一个或更多个图像的所有块的信息被编码为图像参数集(Picture Parameter Set,PPS)或图像头。此外,多个图像共同参考的信息被编码为序列参数集(Sequence Parameter Set,SPS)。另外,一个或更多个SPS共同参考的信息被编码为视频参数集(Video Parameter Set,VPS)。此外,共同应用于一个瓦片或瓦片组的信息也可以被编码为瓦片或瓦片组头的语法。包括在SPS、PPS、切片头、瓦片或瓦片组头中的语法可以称为高级语法。
图像分割器110确定编码树单元(CTU)的大小。关于CTU的大小(CTU尺寸)的信息被编码为SPS或PPS的语法,并且被传送至视频解码装置。
图像分割器110将构成视频的每个图像分割为具有预定大小的多个编码树单元(CTU),然后通过利用树结构递归地分割CTU。树结构中的叶节点成为编码单元(CU),所述CU是编码的基本单元。
树结构可以是四叉树(quadtree,QT),其中较高节点(或父节点)被分割为具有相同大小的四个较低节点(或子节点)。树结构也可以是二叉树(binarytree,BT),其中较高的节点分割为两个较低的节点。树结构还可以是三叉树(ternarytree,TT),其中较高的节点以1:2:1的比率分割为三个较低的节点。树结构还可以是QT结构、BT结构和TT结构中的两个或更多个结构混合的结构。例如,可以使用四叉树加二叉树(quadtree plus binarytree,QTBT)结构,或者可以使用四叉树加二叉树三叉树(quadtree plus binarytreeternarytree,QTBTTT)结构。这里,BTTT被添加到树结构以称为多类型树(multiple-typetree,MTT)。
图2是用于描述通过利用QTBTTT结构来对块进行分割的方法的示意图。
如图2所示,CTU可以首先分割为QT结构。四叉树分割可以是递归的,直到分割块的大小达到QT中允许的叶节点的最小块大小(MinQTSize)。由熵编码器155对指示QT结构的每个节点是否被分割为下层的四个节点的第一标志(QT_split_flag)进行编码,并将其用信号通知视频解码装置。当QT的叶节点不大于BT中允许的根节点的最大块大小(MaxBTSize)时,可以将叶节点进一步分割为BT结构或TT结构的至少一个。在BT结构和/或TT结构中可以存在多个分割方向。例如,可以存在两个方向,即,水平地分割相应节点的块的方向以及竖直地分割相应节点的块的方向。如图2所示,当MTT分割开始时,由熵编码器155对指示节点是否被分割的第二标志(mtt_split_flag)、以及在节点被分割的情况下额外指示分割方向(竖直或水平)的标志和/或指示分割类型(二叉或三叉)的标志进行编码,并将其用信号通知视频解码装置。
替选地,在对指示每个节点是否被分割为下层的四个节点的第一标志(QT_split_flag)进行编码之前,还可以对指示节点是否被分割的CU分割标志(split_cu_flag)进行编码。当CU分割标志(split_cu_flag)的值指示出每个节点没有被分割时,相应节点的块成为分割树结构中的叶节点并成为CU,CU是编码的基本单元。当CU分割标志(split_cu_flag)的值指示出每个节点被分割时,视频编码装置以上述方案对第一标志首先开始编码。
当QTBT用作树结构的另一个示例时,可以存在两种类型,即,将相应节点的块水平地分割为具有相同大小的两个块的类型(即,对称水平分割)以及将相应节点的块竖直地分割为具有相同大小的两个块的类型(即,对称竖直分割)。由熵编码器155对指示BT结构的每个节点是否被分割为下层的块的分割标志(split_flag)和指示分割类型的分割类型信息进行编码,并将其传送至视频解码装置。另一方面,可以另外存在相应节点的块被分割为彼此非对称形式的两个块的类型。非对称形式可以包括相应节点的块被分割为大小比率为1:3的两个矩形块的形式,或者还可以包括相应节点的块在对角线方向上被分割的形式。
CU可以根据从CTU分割的QTBT或QTBTTT而具有各种大小。在下文中,与要编码或解码的CU(即,QTBTTT的叶节点)相对应的块称为“当前块”。当采用QTBTTT分割时,除了正方形形状之外,当前块的形状也可以是矩形形状。
预测器120对当前块进行预测以生成预测块。预测器120包括帧内预测器122和帧间预测器124。
通常,可以对图像中的当前块的每个进行预测地编码。通常,可以通过利用帧内预测技术(其利用来自包括当前块的图像的数据)或帧间预测技术(其利用来自在包括当前块的图像之前编码的图像的数据)执行当前块的预测。帧间预测包括单向预测和双向预测两者。
帧内预测器122通过利用在包括当前块的当前图像中位于当前块邻近的像素(参考像素)来预测当前块中的像素。根据预测方向,存在多个帧内预测模式。例如,如图3a所示,多个帧内预测模式可以包括包含平面(Planar)模式和DC模式的两种非方向模式,并且可以包括65种方向模式。根据每种预测模式不同地定义要使用的相邻像素和算法等式。
为了对具有矩形形状的当前块进行高效的方向预测,可以额外地使用图3b中虚线箭头所示的方向模式(#67至#80,帧内预测模式#-1至#-14)。方向模式可以称为“宽角度帧内预测模式(wide angle intra-prediction modes)”。在图3b中,箭头指示用于预测的相应参考样本,而非代表预测方向。预测方向与箭头指示的方向相反。在当前块具有矩形形状时,宽角度帧内预测模式是在没有额外比特传输的情况下在与特定方向模式相反的方向上执行预测的模式。在这种情况下,在宽角度帧内预测模式中,可以通过具有矩形形状的当前块的宽度与高度的比率来确定可用于当前块的一些宽角度帧内预测模式。例如,在当前块具有高度小于宽度的矩形形状时,具有小于45度的角度的宽角度帧内预测模式(帧内预测模式#67至#80)是可用的。在当前块具有宽度大于高度的矩形形状时,具有大于-135度的角度的宽角度帧内预测模式是可用的。
帧内预测器122可以确定要用于对当前块进行编码的帧内预测。在一些示例中,帧内预测器122可以通过利用多个帧内预测模式来对当前块进行编码,并且还可以从测试模式中选择要使用的适当的帧内预测模式。例如,帧内预测器122可以通过利用对多个测试的帧内预测模式的率失真(rate-distortion)分析来计算率失真值,并且还可以在测试模式中选择具有最佳率失真特性的帧内预测模式。
帧内预测器122在多个帧内预测模式中选择一个帧内预测模式,并且通过利用根据选择的帧内预测模式确定的相邻像素(参考像素)和算法等式来预测当前块。由熵编码器155对关于选择的帧内预测模式的信息进行编码并将其传送至视频解码装置。
帧间预测器124通过利用运动补偿处理来生成当前块的预测块。帧间预测器124在比当前图像更早已被编码和解码的参考图像中搜索与当前块最相似的块,并且通过利用搜索到的块来生成当前块的预测块。另外,生成运动矢量(motion vector,MV),所述运动矢量与当前图像中的当前块和参考图像中的预测块之间的位移(displacement)相对应。通常,对亮度(luma)分量执行运动估计,并且基于亮度分量计算的运动矢量用于亮度分量和色度分量两者。由熵编码器155对包括参考图像的信息和关于用于预测当前块的运动矢量的信息的运动信息进行编码,并将其传送至视频解码装置。
帧间预测器124还可以执行参考图像或参考块的插值,以增加预测的准确性。换句话说,通过向包括两个整数样本的多个连续整数样本应用滤波器系数来在两个连续整数样本之间插值子样本。在对插值的参考图像执行搜索与当前块最相似的块的处理时,对于运动矢量可以表示小数单位精度而不是整数样本单位精度。对于要编码的每个目标区域,例如,诸如切片、瓦片、CTU、CU等的单元,可以不同地设置运动矢量的精度或分辨率。当应用这种自适应运动矢量分辨率(adaptive motion vector resolution,AMVR)时,应该针对每个目标区域用信号通知关于要应用于每个目标区域的运动矢量分辨率的信息。例如,当目标区域是CU时,用信号通知关于应用于每个CU的运动矢量分辨率的信息。关于运动矢量分辨率的信息可以是代表要在以下描述的运动矢量差的精度的信息。
另一方面,帧间预测器124可以通过利用双向预测来执行帧间预测。在双向预测的情况下,使用两个参考图像和代表与每个参考图像中的当前块最相似的块位置的两个运动矢量。帧间预测器124分别从参考图像列表0(RefPicList0)和参考图像列表1(RefPicList1)选择第一参考图像和第二参考图像。帧间预测器124还搜索与相应参考图像中的当前块最相似的块,以生成第一参考块和第二参考块。此外,通过对第一参考块和第二参考块进行平均或加权平均来生成当前块的预测块。此外,包括关于用于预测当前块的两个参考图像的信息并且包括关于两个运动矢量的信息的运动信息被传送至熵编码器155。这里,参考图像列表0可以由预重构图像中按显示顺序在当前图像之前的图像构成,并且参考图像列表1可以由预重构图像中按显示顺序在当前图像之后的图像构成。然而,尽管不特别限于此,但可以将显示顺序中在当前图像之后的预重构图像额外地包括在参考图像列表0中。相反,在当前图像之前的预重构图像也可以额外地包括在参考图像列表1中。
为了最小化用于编码运动信息所消耗的比特量,可以使用各种方法。
例如,在当前块的参考图像和运动矢量与相邻块的参考图像和运动矢量相同时,能够识别相邻块的信息被编码以将当前块的运动信息传送至视频解码装置。这种方法称为合并模式(merge mode)。
在合并模式中,帧间预测器124从当前块的相邻块选择预定数量的合并候选块(在下文中,称为“合并候选”)。
作为用于推导合并候选的相邻块,可以使用与当前图像中的当前块邻近的左侧块A0、左下侧块A1、上侧块B0、右上侧块B1和左上侧块B2的全部或一些,如图4所示。此外,除了当前块所在的当前图像之外,位于参考图像内的块(其可以与用于预测当前块的参考图像相同或不同)也可以用作合并候选。例如,参考图像内的当前块的同位块(co-locatedblock)或与该同位块邻近的块可以额外地用作合并候选。如果通过上述方法选择的合并候选的数量小于预设数量,则将零矢量添加到合并候选。
帧间预测器124通过利用相邻块来配置包括预定数量的合并候选的合并列表。从合并列表中包括的合并候选之中选择要用作当前块的运动信息的合并候选,并且生成用于识别选择的候选的合并索引信息。由熵编码器155对生成的合并索引信息进行编码并将其传送至视频解码装置。
合并跳过模式是合并模式的特例。在量化之后,在用于熵编码的所有变换系数都接近零时,仅传输相邻块选择信息而不传输残差信号。通过利用合并跳过模式,对于具有轻微运动的影像、静止影像、屏幕内容影像等可以实现相对较高的编码效率。
此后,合并模式和合并跳过模式统称为合并/跳过模式。
用于编码运动信息的另一种方法是高级运动矢量预测(advanced motion vectorprediction,AMVP)模式。
在AMVP模式中,帧间预测器124通过利用当前块的相邻块来推导用于当前块的运动矢量的运动矢量预测候选。作为用于推导运动矢量预测候选的相邻块,可以使用与图4所示的当前图像中的当前块邻近的左侧块A0、左下侧块A1、上侧块B0、右上侧块B1和左上侧块B2的全部或一些。此外,除了当前块所在的当前图像之外,位于参考图像(其可以与用于预测当前块的参考图像相同或不同)内的块也可以用作用于推导运动矢量预测候选的相邻块。例如,可以使用参考图像内的当前块的同位块或与该同位块邻近的块。如果通过上述方法选择的运动矢量候选的数量小于预设数量,则将零矢量添加到运动矢量候选。
帧间预测器124通过利用相邻块的运动矢量来推导运动矢量预测候选,并且通过利用运动矢量预测候选来确定当前块的运动矢量的运动矢量预测。另外,通过将当前块的运动矢量减去运动矢量预测来计算运动矢量差。
可以通过将预定义函数(例如,中值和平均值计算等)应用于运动矢量预测候选来获取运动矢量预测。在这种情况下,视频解码装置还知道预定义功能。此外,由于用于推导运动矢量预测候选的相邻块是已经完成编码和解码的块,所以视频解码装置也可能已经知道相邻块的运动矢量。因此,视频编码装置不需要对用于识别运动矢量预测候选的信息进行编码。相应地,在这种情况下,对关于运动矢量差的信息和关于用于预测当前块的参考图像的信息进行编码。
另一方面,还可以通过选择运动矢量预测候选的任何一个的方案来确定运动矢量预测。在这种情况下,用于识别选择的运动矢量预测候选的信息与用于预测当前块的关于运动矢量差的信息以及关于参考图像的信息共同进行额外的编码。
减法器130通过将当前块减去由帧内预测器122或帧间预测器124生成的预测块来生成残差块。
变换器140将具有空域的像素值的残差块中的残差信号变换为频域的变换系数。变换器140可以通过利用残差块的整个大小作为变换单元来变换残差块中的残差信号,或者也可以将残差块分割为多个子块,并且可以通过利用子块作为变换单元来执行变换。替选地,将残差块划分成两个子块,即变换区域和非变换区域,以通过仅利用变换区域子块作为变换单元来变换残差信号。这里,变换区域子块可以是基于水平轴线(或竖直轴线)的具有大小比率为1:1的两个矩形块的一个。在这种情况下,由熵编码器155对指示出仅变换子块的标志(cu_sbt_flag)、以及方向(竖直/水平)信息(cu_sbt_horizontal_flag)和/或位置信息(cu_sbt_pos_flag)进行编码,并将其用信号通知视频解码装置。另外,变换区域子块的大小基于水平轴线(或竖直轴线)可以具有1:3的大小比率。在这种情况下,由熵编码器155对划分相应分割的标志(cu_sbt_quad_flag)进行额外地编码,并将其用信号通知视频解码装置。
另一方面,变换器140可以在水平方向和竖直方向上单独地执行残差块的变换。对于该变换,可以使用各种类型的变换函数或变换矩阵。例如,用于水平变换和竖直变换的成对变换函数可以定义为多变换集(multiple transform set,MTS)。变换器140可以选择MTS中具有最高变换效率的一个变换函数对,并且可以在水平方向和竖直方向的每个上变换残差块。由熵编码器155对关于MTS中的变换函数对的信息(mts_idx)进行编码,并将其用信号通知视频解码装置。
量化器145利用量化参数对从变换器140输出的变换系数进行量化,并且将量化的变换系数输出到熵编码器155。量化器145还可以对相关的残差块立即进行量化,而无需对任何块或帧进行变换。量化器145还可以根据变换块中的变换系数的位置来应用不同的量化系数(缩放值)。可以对应用于布置为二维的量化的变换系数的量化矩阵进行编码,并将其用信号通知视频解码装置。
重排单元150可以对量化的残差值执行系数值的重新排列。
重排单元150可以通过利用系数扫描将2D系数阵列改变为1D系数序列。例如,重排单元150可以利用锯齿形扫描(zig-zag scan)或对角线扫描(diagonal scan)来扫描DC系数到高频区域的系数以输出1D系数序列。根据变换单元的大小和帧内预测模式,也可以利用在列方向上扫描2D系数阵列的竖直扫描和在行方向上扫描2D块类型系数的水平扫描来代替锯齿形扫描。换句话说,根据变换单元的大小和帧内预测模式,可以在锯齿形扫描、对角线扫描、竖直扫描和水平扫描中确定要使用的扫描方法。
熵编码器155通过利用包括基于上下文的自适应二进制算术编码(Context-basedAdaptive Binary Arithmetic Code,CABAC)、指数哥伦布(Exponential Golomb)等的各种编码方案来对从重排单元150输出的1D量化的变换系数的序列进行编码,以生成比特流。
此外,熵编码器155对与块分割相关的信息(例如,CTU大小、CTU分割标志、QT分割标志、MTT分割类型和MTT分割方向等)进行编码,以使得视频解码装置能够等同于视频编码装置来分割块。此外,熵编码器155对关于指示当前块是由帧内预测编码还是由帧间预测编码的预测类型的信息进行编码。熵编码器155根据预测类型对帧内预测信息(即,关于帧内预测模式的信息)或帧间预测信息(在合并模式的情况下的合并索引,以及在AMVP模式的情况下的关于参考图像索引和运动矢量差的信息)进行编码。此外,熵编码器155对与量化相关的信息(即,关于量化参数的信息和关于量化矩阵的信息)进行编码。
逆量化器160对从量化器145输出的量化的变换系数进行逆量化,以生成变换系数。逆变换器165将从逆量化器160输出的变换系数从频域变换到空域,以重构残差块。
加法器170将重构的残差块和由预测器120生成的预测块相加,以重构当前块。在对下一个块进行帧内预测时,重构的当前块中的像素用作参考像素。
环路滤波单元180对重构的像素执行滤波,以减少由于基于块的预测和变换/量化而发生的块伪影(blocking artifacts)、振铃伪影(ringing artifacts)、模糊伪影(blurring artifacts)等。作为环内滤波器的环路滤波单元180可以包括去块滤波器182、样本自适应偏移(sample adaptive offset,SAO)滤波器184和自适应环路滤波器(adaptive loop filter,ALF)186的全部或一些。
去块滤波器182对重构的块之间的边界进行滤波,以去除由于块单元编码/解码而发生的块伪影(blocking artifacts),并且SAO滤波器184和ALF 186对去块滤波的视频进行额外的滤波。SAO滤波器184和ALF 186是用于补偿由于有损编码(lossy coding)而发生的重构的像素与原始像素之间的差异的滤波器。SAO滤波器184应用偏移作为CTU单位,以增强主观图像质量和编码效率。另一方面,ALF 186执行块单元滤波,并且通过划分相应块的边界和变化量的程度来应用不同的滤波器以补偿失真。可以对关于要用于ALF的滤波器系数的信息进行编码,并将其用信号通知视频解码装置。
通过去块滤波器182、SAO滤波器184和ALF 186滤波的重构的块存储在存储器190中。当一个图像中的所有块被重构时,重构的图像可以用作用于对随后要被编码的图像内的块进行帧间预测的参考图像。
图5是可以实现本发明技术的视频解码装置的功能框图。在下文中,参考图5,描述了视频解码装置和该装置的组件。
视频解码装置可以包括熵解码器510、重排单元515、逆量化器520、逆变换器530、预测器540、加法器550、环路滤波单元560和存储器570。
类似于图1的视频编码装置,视频解码装置的每个组件可以实现为硬件或软件,或者实现为硬件和软件的组合。另外,每个组件的功能可以实现为软件,并且微处理器也可以实现为执行对应于每个组件的软件的功能。
熵解码器510通过解码由视频编码装置生成的比特流来提取与块分割相关的信息,以确定要解码的当前块,并且提取恢复当前块所需的预测信息和关于残差信号的信息。
熵解码器510通过从序列参数集(SPS)或图像参数集(PPS)提取关于CTU大小的信息来确定CTU的大小,并且将图像分割为具有确定大小的CTU。此外,CTU被确定为树结构的最高层(即,根节点),并且提取CTU的分割信息以通过利用树结构来分割CTU。
例如,当通过利用QTBTTT结构来分割CTU时,首先提取与QT的分割相关的第一标志(QT_split_flag),以将每个节点分割为下层的四个节点。另外,相对于与QT的叶节点相对应的节点来提取与MTT的分割相关的第二标志(mtt_split_flag)、分割方向(竖直/水平)和/或分割类型(二叉/三叉),以将相应的叶节点分割为MTT结构。结果,QT的叶节点下方的每个节点被递归地分割为BT或TT结构。
作为另一个示例,当通过利用QTBTTT结构来分割CTU时,提取指示是否分割CU的CU分割标志(split_cu_flag)。当分割相应块时,还可以提取第一标志(QT_split_flag)。在分割过程期间,对于每个节点,在递归QT分割0次或更多次之后可能发生0次或更多次的递归MTT分割。例如,对于CTU,MTT分割可以立即发生,或者相反,也可以仅发生多次QT分割。
作为另一个示例,当通过利用QTBT结构来分割CTU时,提取与QT的分割相关的第一标志(QT_split_flag),以将每个节点分割为下层的四个节点。另外,提取指示将与QT的叶节点相对应的节点是否进一步分割为BT的分割标志(split_flag)以及分割方向信息。
另一方面,当熵解码器510通过利用树结构的分割来确定要解码的当前块时,熵解码器510提取关于指示当前块是被帧内预测还是被帧间预测的预测类型的信息。当预测类型信息指示帧内预测时,熵解码器510提取用于当前块的帧内预测信息(帧内预测模式)的语法元素。当预测类型信息指示帧间预测时,熵解码器510提取代表帧间预测信息的语法元素的信息,即,运动矢量和运动矢量参考的参考图像。
此外,熵解码器510提取量化相关的信息并且提取关于量化的当前块的变换系数的信息作为关于残差信号的信息。
重排单元515可以以由视频编码装置执行的系数扫描次序的相反顺序,将由熵解码器510熵解码的1D量化的变换系数的序列再次改变为2D系数阵列(即,块)。
逆量化器520对量化的变换系数进行逆量化,并且通过利用量化参数对量化的变换系数进行逆量化。逆量化器520还可以向布置为2D的量化的变换系数应用不同的量化系数(缩放值)。逆量化器520可以通过将来自视频编码装置的量化系数(缩放值)的矩阵应用于量化的变换系数的2D阵列来执行逆量化。
逆变换器530通过将逆量化的变换系数从频域逆变换到空域来恢复残差信号,以生成当前块的残差块。
此外,当逆变换器530对变换块的部分区域(子块)进行逆变换时,逆变换器530提取仅对变换块的子块进行变换的标志(cu_sbt_flag)、子块的方向(竖直/水平)信息(cu_sbt_horizontal_flag)和/或子块的位置信息(cu_sbt_pos_flag)。逆变换器530还将相应子块的变换系数从频域逆变换到空域以重构残差信号,并且用值“0”填充未被逆变换的区域作为残差信号,以生成当前块的最终残差块。
此外,当应用MTS时,逆变换器530通过利用从视频编码装置用信号通知的MTS信息(mts_idx)来确定在水平方向和竖直方向的每个上要应用的变换索引或变换矩阵。逆变换器530还通过利用确定的变换函数在水平方向和竖直方向上对变换块中的变换系数执行逆变换。
预测器540可以包括帧内预测器542和帧间预测器544。在当前块的预测类型是帧内预测时,激活帧内预测器542,而在当前块的预测类型是帧间预测时,激活帧间预测器544。
帧内预测器542根据从熵解码器510提取的帧内预测模式的语法元素来确定多个帧内预测模式中当前块的帧内预测模式。帧内预测器542还根据帧内预测模式通过利用当前块的相邻参考像素来预测当前块。
帧间预测器544通过利用从熵解码器510提取的帧间预测模式的语法元素来确定当前块的运动矢量和运动矢量参考的参考图像。
加法器550通过将从逆变换器530输出的残差块与从帧间预测器544或帧内预测器542输出的预测块相加来重构当前块。在对后续要被解码的块进行帧内预测时,重构的当前块内的像素用作参考像素。
作为环内滤波器的环路滤波单元560可以包括去块滤波器562、SAO滤波器564和ALF 566。去块滤波器562对重构的块之间的边界执行去块滤波,以便去除由于块单元解码而发生的块伪影。SAO滤波器564和ALF 566在去块滤波之后对重构的块执行额外的滤波,以便补偿由于有损编码而发生的重构的像素与原始像素之间的差异。通过利用关于从比特流解码的滤波器系数的信息来确定ALF的滤波器系数。
通过去块滤波器562、SAO滤波器564和ALF 566滤波的重构的块存储在存储器570中。当一个图像中的所有块被重构时,重构的图像可以用作用于对随后要被编码的图像内的块进行帧间预测的参考图像。
图6是示出根据本发明的至少一个实施方案的将几何分区模式应用于32×32块的方法的示意图。对于几何分区模式,在该模式下,编码单元可以通过直的分区线分区为两个区域。两个分区的区域的每个可以通过利用不同的运动信息来执行帧间预测。可以生成用于两个分区的区域的每个的帧间预测块。通过对两个生成的帧间预测块进行加权平均,可以生成几何分区模式下的最终预测块。几何分区模式使用角度参数和距离参数来设置由直线定义的分区边界区域。
参考图6,32×32块可以分区为两个区域。可以对两个分区的区域的每个执行帧间预测。可以等同于角度参数。ρ可以等同于距离参数。利用角度参数和距离参数,可以建立划分32×32块的直线。
图7a和图7b是示出根据本发明的一些实施方案的几何分区模式下的角度参数和距离参数的示意图。
参考图7a,通过在编码单元内对称地划分360度范围,角度参数可以由总共20个量化的角度来定义。
参考图7b,距离参数可以由四个量化的距离来定义。在可以用角度参数和距离参数的组合出现的总共80个可能的分区方向中,可以排除具有二叉树分区和三叉树分区的10个冗余分区方向和6个冗余分区方向。这留下可以由几何分区模式利用的总共64个分区方向。
图8是示出根据本发明的至少一个实施方案的几何分区模式下的分区方向信息的查找表的示意图。角度参数和距离参数的组合可以定义为查找表。对于每个编码单元,可以传输分区方向信息。几何分区模式可以从常规合并候选列表构造用于几何分区模式并且仅包括单向运动信息的合并候选列表。这可以简化运动信息的编码并且减少可能的组合的数量。利用用于几何分区模式的合并候选列表,可以传输用于每个分区的区域的使用的合并索引。
参考图8,可以基于关于角度参数的信息(例如,angleIdx)和关于距离参数的信息(例如,distanceIdx)来确定分区方向信息(例如,merge_gpm_partition_idx)。通过angleIdx和distanceIdx的组合的merge_gpm_partition_idx可以定义为查找表。merge_gpm_partition_idx的值可以在0到63的范围内。可以为每个编码单元传输merge_gpm_partition_idx。
图9a和图9b是示出根据本发明的至少一个实施方案的帧间预测的误差分布和帧内预测的误差分布的示意图。
参考图9a,帧间预测的误差分布可以基于水平/竖直坐标值展现。在帧间预测中,可以使用相对于当前块的中心的运动矢量。相应地,从当前块的中心向外越远,帧间预测的误差可能变得越大。
参考图9b,帧内预测的误差分布可以基于水平/竖直坐标值展现。在帧内预测中,在预测中使用的参考块可以在当前块的左上方。相应地,帧内预测的误差可以从左上方到右下方增加。
图10是示出根据本发明的至少一个实施方案的几何分区模式下的第一区域、第二区域和周围参考像素的示意图。在几何分区模式下,一个编码单元可以分区为两个区域。分区的区域的每个可以分类为第一区域和第二区域。可以通过利用用于第一区域和第二区域的独立运动信息项来生成用于第一区域和第二区域的帧间预测信号。这里,为了简化运动信息的编码并减少组合的数量,可以从常规合并候选列表生成仅包含单向运动信息的几何分区模式的合并候选列表。
通过将帧内预测模式应用于第一区域,可以生成帧内预测信号,并且可以通过将帧间预测模式应用于第二区域来生成帧间预测信号。第二区域可以使用来自包含双向运动信息的常规合并候选列表的运动信息进行帧间预测。
参考图10,可以根据几何分区模式将一个编码单元划分为第一区域和第二区域。一个编码单元可以相当于N×N块。在一个编码单元的外围可以有相邻参考像素。一个编码单元可以等于当前块。对于第一区域,可以应用帧内预测模式,这是因为帧内预测的误差朝向当前块的右下方区域增加。第一区域包括左上方像素。对于第二区域,可以应用帧间预测模式,这是因为帧内预测的误差朝向当前块的右下方区域增加。第二区域远离参考像素。第一区域可以使用帧内预测模式来生成帧内预测块,并且第二区域可以使用帧间预测模式来生成帧间预测块。由于仅对第二区域编码运动信息,可以提高编解码效率。可以通过对在第一区域中生成的帧内预测块和在第二区域中生成的帧间预测块进行加权平均来生成当前块的预测块。加权平均可以等同于加权求和。在第一区域中生成的帧内预测块和在第二区域中生成的帧间预测块可以独立地编码和解码。
图11是示出根据本发明的至少一个实施方案的几何分区模式下的与第一区域相邻的参考块的示意图。在几何分区模式下,第一区域可以通过利用最可能模式(mostprobable mode,MPM)列表进行帧内预测。可以通过利用当前块的相邻块的帧内预测模式来生成MPM列表。
参考图11,在几何分区模式下,当前块可以划分为第一区域和第二区域。相邻参考块可以存在于当前块的外围。可以存在与当前块的顶部邻近的A块和与当前块的左侧邻近的L块。A模式可以等同于A块的帧内预测模式。L模式可以等同于L块的帧内预测模式。A块的A模式和帧内预测模式可以互换地使用。L模式和L块的帧内预测模式可以互换地使用。可以通过利用A模式和L模式来生成MPM列表。第一区域可以利用MPM列表以执行帧内预测。
图12a和图12b是示出根据本发明的其他实施方案的几何分区模式下的与第一区域相邻的参考块的示意图。
参考图12a,在几何分区模式下,当前块可以分区为第一区域和第二区域。分区边界可以从上到下存在。关于第一区域,可以存在与第一区域的顶部邻近的参考块A’块。可以存在与第一区域的左侧邻近的L块。可以通过利用A’模式和L模式来生成MPM列表。第一区域可以利用生成的MPM列表以执行帧内预测。
参考图12b,在几何分区模式下,当前块可以分区为第一区域和第二区域。可以存在从左到右延伸的分区边界。关于第一区域,可以存在与第一区域的顶部邻近的参考块A块。可以存在与第一区域的左侧邻近的L’块。可以通过利用A模式和L’模式来生成MPM列表。第一区域可以使用生成的MPM列表以执行帧内预测。本发明不限于这些实施方案,并且可以通过考虑当前块的分区边界来可变地确定上侧参考块的位置和左侧参考块的位置。
图13是示出根据本发明的至少一个实施方案的几何分区模式下的帧内预测模式的语法的示意图。在第一区域中用于帧内预测模式的语法的传输方法可以与利用传统MPM列表的用于帧内预测模式的语法的传输方法相同。用于第二区域的帧间预测模式的语法的传输方法可以与用于传统帧间预测模式的语法的传输方法相同。
参考图13,可以基于merge_gpm_partition_idx来确定当前块的分区形式。可以用信号通知指示第一区域是否通过利用MPM列表执行帧内预测的信息(例如,merge_gpm_idx0_mpm_flag)。如果merge_gpm_idx0_mpm_flag是第一值(例如,0),则可以用信号通知merge_gpm_idx0_remainder。第一区域可以使用merge_gpm_idx0_remainder来确定关于帧内预测模式的信息。如果merge_gpm_idx0_mpm_flag是第二值(例如,1),则可以用信号通知merge_gpm_idx0_mpm_idx。第一区域可以从MPM列表确定关于帧内预测模式的信息。关于第二区域中的帧间预测,可以用信号通知merge_gpm_idx1。利用merge_gpm_idx1,可以从合并候选列表确定运动信息。
图14是示出根据本发明的至少一个实施方案的几何分区模式下的模板以及由基于模板的帧内预测模式推导所使用的参考像素的示意图。可以隐式地传输关于第一区域的帧内预测模式的信息。在这种情况下,解码装置可以推导关于帧内预测模式的信息。在几何分区模式下,可以有三种方式隐式地传输关于帧内预测模式的信息。第一种方法是基于模板的帧内预测模式推导。第二种方法是基于索贝尔运算的帧内预测模式推导。第三种方法是基于模式直方图的帧内预测模式推导。
利用与第一区域邻近的模板,可以推导第一区域的帧内预测模式。可以通过将MPM列表中的所有候选模式的方向性应用于模板中的参考像素来生成预测模板。可以计算生成的预测模板的像素和已经重构的模板的像素的绝对变换差值和(Sum of AbsoluteTransformed Difference,SATD)。在MPM候选模式下,用于计算具有最小绝对变换差值和的值的MPM候选模式是通过基于模板的帧内预测模式推导而推导出的第一区域的帧内预测模式。
参考图14,可以根据几何分区模式将大小为N×N的当前块分区为第一区域和第二区域。相邻模板可以存在于当前块的外围。与当前块的左侧邻近的模板的大小可以是L1×N。与当前块的顶部邻近的模板的大小可以是N×L2。可以通过利用基于模板的帧内预测模式推导来推导第一区域的帧内预测模式。可以通过图11、图12a和图12b中描述的MPM列表生成方法的任何一种来生成MPM列表。可以通过将生成的MPM列表中的相应候选模式应用于模板中的参考像素来生成预测模板。可以计算预测模板中的像素与已经重构的模板中的像素之间的绝对变换差值和。用于计算具有最小绝对变换差值和的值的MPM列表中的候选模式可以是第一区域的帧内预测模式。
图15a和图15b是示出根据本发明的其他实施方案的几何分区模式下的模板以及由基于模板的帧内预测模式推导所使用的参考像素的示意图。
参考图15a,可以根据几何分区模式将当前块分区为第一区域和第二区域。在几何分区模式下,可以存在从上到下延伸的分区边界。可以存在与第一区域的顶部邻近的模板和与第一区域的左侧邻近的模板。模板的形状可以基于第一区域来确定。可以通过图11、图12a和图12b中描述的MPM列表生成方法的任何一种来生成MPM列表。可以通过将生成的MPM列表中的相应候选模式应用于模板中的参考像素来生成预测模板。可以计算预测模板中的像素与已经重构的模板中的像素之间的绝对变换差值和。用于计算具有最小绝对变换差值和的值的MPM列表中的候选模式可以是第一区域的帧内预测模式。
参考图15b,可以根据几何分区模式将当前块分区为第一区域和第二区域。在几何分区模式下,可以存在从左到右延伸的分区边界。可以存在与第一区域的顶部邻近的模板和与第一区域的左侧邻近的模板。模板的形状可以基于第一区域来确定。可以通过图11、图12a和图12b中描述的MPM列表生成方法的任何一种来生成MPM列表。可以通过将生成的MPM列表中的相应候选模式应用于模板中的参考像素来生成预测模板。可以计算预测模板中的像素与已经重构的模板中的像素之间的绝对变换差值和。用于计算具有最小绝对变换差值和的值的MPM列表中的候选模式可以是第一区域中的帧内预测模式。
图16是示出根据本发明的至少一个实施方案的几何分区模式下应用索贝尔运算的参考像素的示意图。对于基于索贝尔运算推导帧内预测模式的方法,本发明可以将索贝尔滤波器应用于当前块的相邻像素。可以计算那些像素的斜度。利用计算的斜度,可以生成斜度的直方图。从斜度的直方图中,可以选择具有最大值的斜度。通过将选择的斜度映射到帧内预测模式,可以推导帧内预测模式。
参考图16,可以根据几何分区模式将当前块分区为第一区域和第二区域。参考像素可以存在于当前块的外围。M可以等于大于或等于1的任何数。索贝尔滤波器可以应用于参考像素。可以计算参考像素的斜度。利用计算的斜度,可以生成斜度的直方图。可以从斜度的直方图中选择具有最大值的斜度。通过将选择的斜度映射到帧内预测模式,可以推导第一区域的帧内预测模式。
在一个示例中,可以从这样的斜度的直方图中选择具有最大值的N个斜度。N个斜度可以各自映射到N个帧内预测模式。利用N个帧内预测模式,可以生成用于第一区域的N个帧内预测块。可以生成用于第一区域的N个帧内预测块的加权平均值,以生成第一区域的最终帧内预测块。权重值可以是任意的。
图17a和图17b是示出根据本发明的其他实施方案的几何分区模式下应用索贝尔运算的参考像素的示意图。
参考图17a,根据几何分区模式,当前块可以分区为第一区域和第二区域。可以存在从上到下延伸的分区边界。参考像素可以存在于第一区域的外围。M可以等于大于或等于1的任何数。参考像素可以基于第一区域来确定。索贝尔滤波器可以应用于参考像素。可以计算参考像素的斜度。利用计算的斜度,可以生成斜度的直方图。从斜度的直方图中,可以选择具有最大值的斜度。通过将选择的斜度映射到帧内预测模式,可以推导第一区域的帧内预测模式。
在一个示例中,从这样的斜度的直方图中,可以选择具有最大值的N个斜度。N个斜度可以各自映射到N个帧内预测模式。利用N个帧内预测模式,可以生成用于第一区域的N个帧内预测块。可以生成用于第一区域的N个帧内预测块的加权平均值,以生成第一区域的最终帧内预测块。权重值可以是任意的。
参考图17b,可以根据几何分区模式将当前块分区为第一区域和第二区域。可以存在从左到右延伸的分区边界。参考像素可以存在于第一区域的外围。M可以等于大于或等于1的任何数。参考像素可以基于第一区域来确定。索贝尔滤波器可以应用于参考像素。可以计算参考像素的斜度。利用计算的斜度,可以生成斜度的直方图。可以从斜度的直方图中选择具有最大值的斜度。通过将选择的斜度映射到帧内预测模式,可以推导第一区域的帧内预测模式。
在一个示例中,从这样的斜度的直方图中,可以选择具有最大值的N个斜度。N个斜度可以各自映射到N个帧内预测模式。利用N个帧内预测模式,可以生成用于第一区域的N个帧内预测块。可以生成用于第一区域的N个帧内预测块的加权平均值,以生成第一区域的最终帧内预测块。权重值可以是任意的。
图18是示出根据本发明的至少一个实施方案的几何分区模式下应用模式直方图的当前块的相邻块的示意图。对于基于模式直方图推导帧内预测模式的方法,本发明可以通过利用当前块的相邻块的帧内预测模式来生成模式直方图。从模式直方图中,可以选择最频繁出现的帧内预测模式。选择的帧内预测模式可以推导为当前块的帧内预测模式。
参考图18,可以根据几何分区模式将当前块分区为第一区域和第二区域。在当前块的外围可以有多个相邻块。当前块的相邻块可以是A块到Q块。当前块的相邻块可以等同于存储关于帧内预测模式的信息的最小块单元。利用A块到Q块中的帧内预测模式,可以生成模式直方图。从模式直方图中,可以选择最频繁出现的帧内预测模式。选择的帧内预测模式可以推导为第一区域的帧内预测模式。可以任意确定用于生成模式直方图的相邻块的数量和位置。即,可以使用A块到Q块中的任何位置和任何数量的块。
在一个示例中,从这样的模式直方图中,可以选择具有高出现频率的N个帧内预测模式。利用N个帧内预测模式,可以生成用于第一区域的N个帧内预测块。通过对第一区域的N个帧内预测块进行加权平均,可以生成第一区域的最终帧内预测块。可以通过利用帧内预测模式的出现频率来确定权重值。
图19a、图19b、图19c和图19d是示出根据本发明的其他实施方案的几何分区模式下应用模式直方图的当前块的相邻块的示意图。
参考图19a,根据几何分区模式,当前块可以分区为第一区域和第二区域。在第一区域的外围可以有多个相邻块。可以存在从上到下延伸的分区边界。第一区域的相邻块可以是A块到C块、I块到L块以及Q块。第一区域的相邻块可以是存储关于帧内预测模式的信息的最小块单元。利用A块到C块、I块到L块以及Q块的帧内预测模式,可以生成模式直方图。从模式直方图中,可以选择最频繁出现的帧内预测模式。选择的帧内预测模式可以推导为第一区域的帧内预测模式。可以任意确定用于生成模式直方图的相邻块的数量和位置。即,可以在A块到C块、I块到L块以及Q块中使用任何位置和任何数量的块。
在一个示例中,从这样的模式直方图中,可以选择具有高出现频率的N个帧内预测模式。利用N个帧内预测模式,可以生成用于第一区域的N个帧内预测块。可以通过对第一区域的N个帧内预测块进行加权平均来生成第一区域的最终帧内预测块。可以通过利用帧内预测模式的出现频率来确定权重值。
参考图19b,根据几何分区模式,当前块可以分区为第一区域和第二区域。在第一区域的外围可以有多个相邻块。可以存在从左到右延伸的分区边界。第一区域的相邻块可以是A块到D块、I到K块以及Q块。第一区域的相邻块可以是存储关于帧内预测模式的信息的最小块单元。利用A块到D块、I块到K块以及Q块的帧内预测模式,可以生成模式直方图。从模式直方图中,可以选择最频繁出现的帧内预测模式。选择的帧内预测模式可以推导为第一区域的帧内预测模式。可以任意确定用于生成模式直方图的相邻块的数量和位置。即,可以使用A块到D块、I块到K块以及Q块中的任何位置和任何数量的块。
在一个示例中,从这样的模式直方图中,可以选择具有高出现频率的N个帧内预测模式。利用N个帧内预测模式,可以生成用于第一区域的N个帧内预测块。可以通过对第一区域的N个帧内预测块进行加权平均来生成第一区域的最终帧内预测块。可以通过利用帧内预测模式的出现频率来确定权重值。
参考图19c,根据几何分区模式,当前块可以分区为第一区域和第二区域。在第一区域的外围可以有多个相邻块。可以存在从上到下延伸的分区边界。第一区域的相邻块可以是A块到C块、I块到P块以及Q块。第一区域的相邻块可以是存储关于帧内预测模式的信息的最小块单元。利用A块到C块、I块到P块以及Q块的帧内预测模式,可以生成模式直方图。从模式直方图中,可以选择最频繁出现的帧内预测模式。选择的帧内预测模式可以推导为第一区域的帧内预测模式。可以任意确定用于生成模式直方图的相邻块的数量和位置。即,可以在A块到C块、I块到P块以及Q块中使用任何位置和任何数量的块。
在一个示例中,从这样的模式直方图中,可以选择具有高出现频率的N个帧内预测模式。利用N个帧内预测模式,可以生成用于第一区域的N个帧内预测块。可以通过对第一区域的N个帧内预测块进行加权平均来生成第一区域的最终帧内预测块。可以通过利用帧内预测模式的出现频率来确定权重值。
参考图19d,根据几何分区模式,当前块可以分区为第一区域和第二区域。在第一区域的外围可以有多个相邻块。可以存在从左到右延伸的分区边界。第一区域的相邻块可以是A块到H块、I块到K块以及Q块。第一区域的相邻块可以是存储关于帧内预测模式的信息的最小块单元。利用A块到H块、I块到K块以及Q块的帧内预测模式,可以生成模式直方图。从模式直方图中,可以选择最频繁出现的帧内预测模式。选择的帧内预测模式可以推导为第一区域的帧内预测模式。可以任意确定用于生成模式直方图的相邻块的数量和位置。即,可以使用A块到H块、I块到K块和Q块中的任何位置和数量的块。
在一个示例中,从这样的模式直方图中,可以选择具有高出现频率的N个帧内预测模式。利用N个帧内预测模式,可以生成用于第一区域的N个帧内预测块。可以通过对第一区域的N个帧内预测块进行加权平均来生成第一区域的最终帧内预测块。可以通过利用帧内预测模式的出现频率来确定权重值。
图20是示出根据本发明的至少一个实施方案的几何分区模式下组合帧内预测模式和帧间预测模式的方法的示意图。在几何分区模式下,某些预测模式可以是固定的,并且不在第一区域和第二区域中使用。从率失真优化(rate-distortion optimization,RDO)角度来看,可以在第一区域和第二区域中使用最优预测模式。
参考图20,当索引为0时,第一区域可以使用帧间预测模式,并且第二区域可以使用帧间预测模式。如果索引为1,则第一区域可以使用帧内预测模式,并且第二区域可以使用帧间预测模式。如果索引为2,则第一区域可以使用帧间预测模式,并且第二区域可以使用帧内预测模式。如果索引为3,则第一区域可以使用帧内预测模式,并且第二区域可以使用帧内预测模式。如果第一区域和第二区域无限制地利用预测模式,则可以提高预测块的准确性,并且可以提高编解码效率。本发明不限于这些说明性实施方案,并且第一区域和第二区域中的预测模式的组合可以被分配任意索引。可以任意确定第一区域和第二区域中的预测模式的组合。
如果第一区域和第二区域使用随机预测模式,并且特定区域使用帧内预测模式,则该特定区域可以使用图14到图19中描述的基于模板的帧内预测模式推导、基于索贝尔运算的帧内预测模式推导或基于模式直方图的帧内预测模式推导。
在一个示例中,本实施方案可以排除第一区域和第二区域都利用帧内预测模式的情况。例如,本实施方案可以仅允许第一区域和第二区域都利用帧间预测模式、第一区域利用帧内预测模式并且第二区域利用帧间预测模式、以及第一区域利用帧间预测模式并且第二区域利用帧内预测模式的情况。
图21是示出根据本发明的至少一个实施方案的几何分区模式下组合帧内预测模式和帧间预测模式的语法的示意图。本实施方案可以传输或解析与第一区域和第二区域在几何分区模式下使用的帧内预测和帧间预测模式的各种组合相关联的语法。
参考图21,可以用信号通知指示由第一区域和第二区域使用的帧内预测模式和帧间预测模式的组合的信息(例如,merge_gpm_mode_idx)。可以通过利用2比特的固定长度编解码(Fixed Length Coding,FLC)或cMax为3的截断二进制编解码来用信号通知merge_gpm_mode_idx。组合的数量可以确定merge_gpm_mode_idx中的比特的数量。通过merge_gpm_mode_idx,可以确定由第一区域和第二区域使用的预测模式。可以用信号通知merge_gpm_partition_idx。分区的形式可以通过merge_gpm_partition_idx来确定。
图22是示出根据本发明的至少一个实施方案的几何分区模式下的帧内预测模式的语法的示意图。
参考图22,可以用信号通知merge_gpm_idxX_mpm_flag和merge_gpm_idxX_mpm_idx,或者merge_gpm_idxX_mpm_flag和merge_gpm_idxX_remainder。这里,在_idxX_中,X可以设置为0和1。如果X为0,则_idx0_可以指示与第一区域相关的语法。如果X为1,则_idx1_可以代表与第二区域相关的语法。如果第一区域利用帧内预测模式,则可以用信号通知merge_gpm_idx0_mpm_flag和merge_gpm_idx0_mpm_idx,或者merge_gpm_idx0_mpm_flag和merge_gpm_idx0_remainder。如果第二区域利用帧内预测模式,则可以用信号通知merge_gpm_idx1_mpm_flag和merge_gpm_idx1_mpm_idx,或者merge_gpm_idx1_mpm_flag和merge_gpm_idx1_remainder。
图23是示出根据本发明的至少一个实施方案的几何分区模式下的帧间预测模式的语法的示意图。
参考图23,可以用信号通知merge_gpm_idxX。这里,在_idxX_中,X可以设置为0和1。如果X为0,则_idx0_可以指示与第一区域相关的语法。如果X为1,则_idx1_可以代表与第二区域相关的语法。如果第一区域利用帧间预测模式,则可以用信号通知merge_gpm_idx0。如果第二区域利用帧间预测模式,则可以用信号通知merge_gpm_idx1。
图24是示出根据本发明的至少一个实施方案的视频解码过程的示意图。
参考图24,视频解码装置可以将当前块分区为第一区域和第二区域(S2410)。视频解码装置可以确定第一区域是否利用帧内预测模式或帧间预测模式(S2420)。视频解码装置可以确定第二区域是否利用帧内预测模式或帧间预测模式(S2430)。视频解码装置可以生成用于利用帧内预测模式的任何区域的帧内预测块(S2440)。可以基于最可能模式(MPM)列表、与当前块邻近的一个或更多个块的帧内预测模式、与当前块邻近的一个或更多个参考像素以及与当前块邻近的第三区域的至少一个来生成用于利用帧内预测模式的任何区域的帧内预测块。视频解码装置可以生成用于利用帧间预测模式的任何区域的帧间预测块(S2450)。利用帧内预测模式的任何区域可以是当前块的左上方区域,并且利用帧间预测模式的任何区域可以是当前块的右下方区域。可以基于利用帧内预测模式的任何区域或与当前块邻近的至少一个或更多个参考块来生成MPM列表。
生成用于利用帧内预测模式的任何区域的帧内预测块的步骤可以包括以下步骤:通过将MPM列表中的一个或更多个候选模式应用于与当前块邻近的第三区域中的一个或更多个参考像素来生成一个或更多个预测像素,计算一个或更多个预测像素与第三区域的一个或更多个重构像素之间的绝对变换差值和,以及基于绝对变换差值和推导利用帧内预测模式的任何区域的帧内预测块。可以基于当前块或利用帧内预测模式的任何区域来确定第三区域。
生成利用帧内预测模式的任何区域的帧内预测块的步骤可以包括以下步骤:通过将索贝尔运算应用于与当前块邻近的一个或更多个参考像素来生成斜度列表,以及基于斜度列表推导用于利用帧内预测模式的任何区域的帧内预测块。可以基于斜度幅度推导用于利用帧内预测模式的任何区域的帧内预测块。可以基于当前块或利用帧内预测模式的任何区域来确定与当前块邻近的一个或更多个参考像素。
生成用于利用帧内预测模式的任何区域的帧内预测块的步骤可以包括以下步骤:基于与当前块邻近的一个或更多个块的帧内预测模式来生成帧内预测模式的列表,以及基于帧内预测模式的列表来推导用于利用帧内预测模式的任何区域的帧内预测块。可以基于当前块或利用帧内预测模式的任何区域来确定与当前块邻近的一个或更多个块。基于帧内预测模式的出现频率来推导用于利用帧内预测模式的任何区域的帧内预测块。视频解码装置可以基于为第一区域生成的预测块和为第二区域生成的预测块来生成当前块的预测块(S2460)。
图25是示出根据本发明的至少一个实施方案的视频编码过程的示意图。
参考图25,视频编码装置可以将当前块分区为第一区域和第二区域(S2510)。视频编码装置可以确定第一区域是否利用帧内预测模式或帧间预测模式(S2520)。视频编码装置可以确定第二区域是否利用帧内预测模式或帧间预测模式(S2530)。视频编码装置可以生成用于利用帧内预测模式的任何区域的帧内预测块(S2540)。可以基于最可能模式(MPM)列表、与当前块邻近的一个或更多个块的帧内预测模式、与当前块邻近的一个或更多个参考像素以及与当前块邻近的第三区域的至少一个来生成用于利用帧内预测模式的任何区域的帧内预测块。视频编码装置可以生成利用帧间预测模式的任何区域的帧间预测块(S2550)。利用帧内预测模式的任何区域可以是当前块的左上方区域,并且利用帧间预测模式的任何区域可以是当前块的右下方区域。可以基于利用帧内预测模式的任何区域或与当前块邻近的至少一个或更多个参考块来生成MPM列表。
生成用于利用帧内预测模式的任何区域的帧内预测块的步骤可以包括以下步骤:通过将MPM列表中的一个或更多个候选模式应用于与当前块邻近的第三区域中的一个或更多个参考像素来生成一个或更多个预测像素,计算一个或更多个预测像素与第三区域的一个或更多个重构像素之间的绝对变换差值和,以及基于绝对变换差值和来确定利用帧内预测模式的任何区域的帧内预测块。可以基于当前块或利用帧内预测模式的任何区域来确定第三区域。
生成利用帧内预测模式的任何区域的帧内预测块的步骤可以包括以下步骤:通过将索贝尔运算应用于与当前块邻近的一个或更多个参考像素来生成斜度列表,以及基于斜度列表来确定用于利用帧内预测模式的任何区域的帧内预测块。可以基于斜度幅度来确定用于利用帧内预测模式的任何区域的帧内预测块。可以基于当前块或利用帧内预测模式的任何区域来确定与当前块邻近的一个或更多个参考像素。
生成用于利用帧内预测模式的任何区域的帧内预测块的步骤可以包括以下步骤:基于与当前块邻近的一个或更多个块的帧内预测模式来生成帧内预测模式的列表,以及基于帧内预测模式的列表来确定用于利用帧内预测模式的任何区域的帧内预测块。可以基于当前块或利用帧内预测模式的任何区域来确定与当前块邻近的一个或更多个块。可以基于帧内预测模式的出现频率来确定用于利用帧内预测模式的任何区域的帧内预测块(S2560)。
尽管描述了顺序执行的各个流程图中的步骤,但这些步骤仅仅例示了本发明的一些实施方案的技术思想。因此,本发明所属领域的普通技术人员可以通过改变在各个附图中描述的顺序或通过并行地执行两个或更多个步骤来执行步骤。因此,各个流程图中的步骤不限于所示的按发生时间排列的顺序。
应当理解,上述描述呈现了可以以各种其他方式实现的说明性实施方案。在一些实施方案中描述的功能可以通过硬件、软件、固件和/或它们的组合来实现。还应当理解,本说明书中描述的功能组件标记为“……单元”,以突出强调它们独立实现的可能性。
另一方面,在一些实施方案中描述的各种方法或功能可以实现为存储在非易失性记录介质中的指令,所述指令可以由一个或更多个处理器读取和执行。非易失性记录介质可以包括例如以计算机系统可读取的形式存储数据的各种类型的记录装置。例如,非易失性记录介质可以包括存储介质,例如可擦除可编程只读存储器(EPROM)、闪存驱动器、光盘驱动器、磁性硬盘驱动器和固态驱动器(SSD)等等。
尽管出于说明的目的描述了本发明的示例性实施方案,但是本发明所属领域的普通技术人员应当理解,在不脱离本发明的思想和范围的情况下,可以进行各种修改、添加和替换。因此,出于简洁和清楚起见描述了本发明的实施方案。本发明的实施方案的技术思想的范围不受例示的限制。相应地,本发明所属领域的普通技术人员应当理解,本发明的范围不受上述明确描述的实施方案的限制,而是受权利要求及其等同形式的限制。
相关申请的交叉引用
本申请要求于2021年10月6日提交的韩国专利申请No.10-2021-0132512以及于2022年10月5日提交的韩国专利申请No.10-2022-0127389的优先权,其每个的全部内容通过引用结合于本文中。
Claims (20)
1.一种视频解码方法,包括:
将当前块分区为第一区域和第二区域;
确定第一区域是否利用帧内预测模式或帧间预测模式;
确定第二区域是否利用帧内预测模式或帧间预测模式;
基于最可能模式(MPM)列表、与当前块邻近的一个或更多个块的帧内预测模式、与当前块邻近的一个或更多个参考像素以及与当前块邻近的第三区域的至少一个来生成用于第一区域与第二区域之间的利用帧内预测模式的任何区域的帧内预测块;
生成用于第一区域与第二区域之间的利用帧间预测模式的任何区域的帧间预测块;以及
基于用于第一区域的预测块和用于第二区域的预测块来生成当前块的预测块。
2.根据权利要求1所述的视频解码方法,其中,利用帧内预测模式的任何区域是当前块的左上方区域,并且利用帧间预测模式的任何区域是当前块的右下方区域。
3.根据权利要求1所述的视频解码方法,其中,基于利用帧内预测模式的任何区域或与当前块邻近的至少一个或更多个参考块来生成MPM列表。
4.根据权利要求1所述的视频解码方法,其中,生成用于利用帧内预测模式的任何区域的帧内预测块包括:
通过将MPM列表中的一个或更多个候选模式应用于与当前块邻近的第三区域的一个或更多个参考像素来生成一个或更多个预测像素;
计算一个或更多个预测像素与第三区域的一个或更多个重构像素之间的绝对变换差值和;以及
基于绝对变换差值和来推导利用帧内预测模式的任何区域的帧内预测块。
5.根据权利要求4所述的视频解码方法,其中,基于当前块或利用帧内预测模式的任何区域来确定第三区域。
6.根据权利要求1所述的视频解码方法,其中,生成用于利用帧内预测模式的任何区域的帧内预测块包括:
通过将索贝尔运算应用于与当前块邻近的一个或更多个参考像素来生成斜度列表;以及
基于斜度列表推导用于利用帧内预测模式的任何区域的帧内预测块,
其中,基于斜度幅度推导用于利用帧内预测模式的任何区域的帧内预测块。
7.根据权利要求6所述的视频解码方法,其中,基于当前块或利用帧内预测模式的任何区域来确定与当前块邻近的一个或更多个参考像素。
8.根据权利要求1所述的视频解码方法,其中,生成用于利用帧内预测模式的任何区域的帧内预测块包括:
基于与当前块邻近的一个或更多个块的帧内预测模式来生成帧内预测模式的列表;以及
基于帧内预测模式的列表来推导用于利用帧内预测模式的任何区域的帧内预测块。
9.根据权利要求8所述的视频解码方法,其中,基于当前块或利用帧内预测模式的任何区域来确定与当前块邻近的一个或更多个块。
10.根据权利要求8所述的视频解码方法,其中,基于出现频率来推导用于利用帧内预测模式的任何区域的帧内预测块。
11.一种视频编码方法,包括:
将当前块分区为第一区域和第二区域;
确定第一区域是否利用帧内预测模式或帧间预测模式;
确定第二区域是否利用帧内预测模式或帧间预测模式;
基于最可能模式(MPM)列表、与当前块邻近的一个或更多个块的帧内预测模式、与当前块邻近的一个或更多个参考像素以及与当前块邻近的第三区域的至少一个来生成用于第一区域与第二区域之间的利用帧内预测模式的任何区域的帧内预测块;
生成用于第一区域与第二区域之间的利用帧间预测模式的任何区域的帧间预测块;以及
基于用于第一区域的预测块和用于第二区域的预测块来生成当前块的预测块。
12.根据权利要求11所述的视频编码方法,其中,利用帧内预测模式的任何区域是当前块的左上方区域,并且利用帧间预测模式的任何区域是当前块的右下方区域。
13.根据权利要求11所述的视频编码方法,其中,基于利用帧内预测模式的任何区域或与当前块邻近的至少一个或更多个参考块来生成MPM列表。
14.根据权利要求11所述的视频编码方法,其中,生成用于利用帧内预测模式的任何区域的帧内预测块包括:
通过将MPM列表中的一个或更多个候选模式应用于与当前块邻近的第三区域的一个或更多个参考像素来生成一个或更多个预测像素;
计算一个或更多个预测像素与第三区域的一个或更多个重构像素之间的绝对变换差值和;以及
基于绝对变换差值和来确定利用帧内预测模式的任何区域的帧内预测块。
15.根据权利要求14所述的视频编码方法,其中,基于当前块或利用帧内预测模式的任何区域来确定第三区域。
16.根据权利要求11所述的视频编码方法,其中,生成用于利用帧内预测模式的任何区域的帧内预测块包括:
通过将索贝尔运算应用于与当前块邻近的一个或更多个参考像素来生成斜度列表;以及
基于斜度列表确定用于利用帧内预测模式的任何区域的帧内预测块,
其中,基于斜度幅度确定用于利用帧内预测模式的任何区域的帧内预测块。
17.根据权利要求16所述的视频编码方法,其中,基于当前块或利用帧内预测模式的任何区域来确定与当前块邻近的一个或更多个参考像素。
18.根据权利要求11所述的视频编码方法,其中,生成用于利用帧内预测模式的任何区域的帧内预测块包括:
基于与当前块邻近的一个或更多个块的帧内预测模式来生成帧内预测模式的列表;以及
基于帧内预测模式的列表来确定用于利用帧内预测模式的任何区域的帧内预测块,
其中,基于出现频率确定用于利用帧内预测模式的任何区域的帧内预测块。
19.根据权利要求18所述的视频编码方法,其中,基于当前块或利用帧内预测模式的任何区域来确定与当前块邻近的一个或更多个块。
20.一种计算机可读记录介质,其存储由视频编码方法生成的比特流,其中,所述视频编码方法包括:
将当前块分区为第一区域和第二区域;
确定第一区域是否利用帧内预测模式或帧间预测模式;
确定第二区域是否利用帧内预测模式或帧间预测模式;
基于最可能模式(MPM)列表、与当前块邻近的一个或更多个块的帧内预测模式、与当前块邻近的一个或更多个参考像素以及与当前块邻近的第三区域的至少一个来生成用于第一区域与第二区域之间的利用帧内预测模式的任何区域的帧内预测块;
生成用于第一区域与第二区域之间的利用帧间预测模式的任何区域的帧间预测块;以及
基于用于第一区域的预测块和用于第二区域的预测块来生成当前块的预测块。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0132512 | 2021-10-06 | ||
KR10-2022-0127389 | 2022-10-05 | ||
KR1020220127389A KR20230049568A (ko) | 2021-10-06 | 2022-10-05 | 기하학적 분할 모드를 이용한 비디오 부호화/복호화 방법 및 장치 |
PCT/KR2022/015048 WO2023059100A1 (ko) | 2021-10-06 | 2022-10-06 | 기하학적 분할 모드를 이용한 비디오 부호화/복호화 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118056399A true CN118056399A (zh) | 2024-05-17 |
Family
ID=91054182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280066941.8A Pending CN118056399A (zh) | 2021-10-06 | 2022-10-06 | 利用几何分区模式的视频编码/解码的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118056399A (zh) |
-
2022
- 2022-10-06 CN CN202280066941.8A patent/CN118056399A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240214556A1 (en) | Video encoding/decoding method and apparatus | |
CN116472709A (zh) | 用于视频编码和解码的装置和方法 | |
CN116530082A (zh) | 利用帧内预测的视频编码的方法和装置 | |
CN113892268A (zh) | 基于预测模式估计的帧内预测装置和方法 | |
KR20230049568A (ko) | 기하학적 분할 모드를 이용한 비디오 부호화/복호화 방법 및 장치 | |
CN116941241A (zh) | 利用基于矩阵的交叉分量预测的视频编解码方法和装置 | |
KR20220118351A (ko) | 인트라 예측 신호와 인터 예측 신호의 가중 합을 이용한 예측 블록을 생성하는 방법 및 이를 이용한 장치 | |
CN116134812A (zh) | 使用任意块划分的视频编码和解码 | |
CN118056399A (zh) | 利用几何分区模式的视频编码/解码的方法和装置 | |
US20230283768A1 (en) | Method for predicting quantization parameter used in a video encoding/decoding apparatus | |
US20240114131A1 (en) | Video encoding/decoding method and apparatus | |
US20230396795A1 (en) | Inter prediction-based video encoding and decoding | |
US20230300325A1 (en) | Video coding method and apparatus using intra prediction | |
US20240137528A1 (en) | Video encoding/decoding method and apparatus | |
US20240179303A1 (en) | Video encoding/decoding method and apparatus | |
US20230291928A1 (en) | Video encoding and decoding method and apparatus using selective subblock split information signaling | |
US20230412811A1 (en) | Method and apparatus for video coding using spiral scan order | |
US20240236301A9 (en) | Video encoding/decoding method and apparatus | |
US20230388494A1 (en) | Method for generating prediction block by using weighted-sum of intra prediction signal and inter prediction signal, and device using same | |
US20240007623A1 (en) | Block splitting structure for efficient prediction and transform, and method and appartus for video encoding and decoding using the same | |
CN117581535A (zh) | 用于编码/解码视频的方法和装置 | |
CN118044185A (zh) | 将利用运动矢量差的合并模式应用于组合的帧间/帧内预测模式或几何分区模式的视频编码/解码方法和装置 | |
CN117917072A (zh) | 视频编码/解码方法和装置 | |
CN117581534A (zh) | 视频编码/解码方法和装置 | |
CN117044200A (zh) | 利用螺旋扫描顺序的视频编解码的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |