CN117581535A - 用于编码/解码视频的方法和装置 - Google Patents
用于编码/解码视频的方法和装置 Download PDFInfo
- Publication number
- CN117581535A CN117581535A CN202280046444.1A CN202280046444A CN117581535A CN 117581535 A CN117581535 A CN 117581535A CN 202280046444 A CN202280046444 A CN 202280046444A CN 117581535 A CN117581535 A CN 117581535A
- Authority
- CN
- China
- Prior art keywords
- block
- intra
- prediction
- distortion
- inter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 145
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 description 48
- 238000010586 diagram Methods 0.000 description 25
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000013139 quantization Methods 0.000 description 12
- 238000005192 partition Methods 0.000 description 11
- 238000001914 filtration Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 4
- 230000008707 rearrangement Effects 0.000 description 4
- 238000000638 solvent extraction Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000000691 measurement method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000023320 Luma <angiosperm> Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 108010063123 alfare Proteins 0.000 description 1
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
提供了用于编码/解码视频的方法和装置。根据本发明的用于解码视频的方法可以包括以下步骤:基于与当前块相对应并存在于参考图像中的参考块,生成当前块的帧间预测块;基于参考块和与参考块邻近的第一参考像素,生成当前块的帧内预测块;基于不使用当前块进行失真计算,推导分配给帧间预测块和帧内预测块的加权值;以及基于加权值、帧间预测块和帧内预测块,生成当前块的组合的帧间/帧内预测(CIIP)块。
Description
技术领域
本发明涉及一种视频编码/解码方法和视频编码/解码装置,更具体地,本发明涉及这样一种视频编码/解码方法和视频编码/解码装置,其利用组合的帧间/帧内预测(combined inter/intra prediction,CIIP)模式生成当前块的预测块。
背景技术
下面描述的内容仅提供与本实施方案有关的背景技术信息,并不构成现有技术。
由于视频数据量大于语音数据量或静止影像数据量,因此在不处理压缩的视频数据的情况下存储或传输视频数据需要大量的硬件资源,包括存储器。
相应地,在存储或传输视频数据时,通常利用编码器来压缩视频数据,以便于存储或传输视频数据。然后,解码器接收压缩的视频数据,解压并再现视频数据。用于这样的视频的压缩技术包括H.264/AVC和高效率视频编解码(High Efficiency Video Coding,HEVC)以及多功能视频编解码(Versatile Video Coding,VVC),所述多功能视频编解码(VVC)比HEVC的编解码效率提高了大约30%或更多。
然而,视频大小、分辨率和帧速率逐渐增加,并且因此要编码的数据量也在增加。因此,需要一种与现有压缩技术相比具有更好的编码效率和更高的影像质量的新压缩技术。
CIIP模式是通过执行帧内预测信号和帧间预测信号的加权平均来生成当前块的预测块的方法。当执行CIIP时,需要使用各种帧内预测模式并且使用各种加权值。
发明内容
技术问题
本发明的目的是提供用于基于组合的帧间/帧内预测(CIIP)模式生成当前块的预测块的方法和装置。
本发明的另一个目的是提供用于在CIIP模式下确定各种帧内预测模式的方法和装置。
本发明的另一个目的是提供用于在CIIP模式下确定各种加权值的方法和装置。
本发明的另一个目的是提供用于在CIIP模式下传输各种加权值的方法和装置。
本发明的另一个目的是提供用于提高视频编码/解码效率的方法和装置。
本发明的另一个目的是提供存储由本发明的视频编码/解码方法或视频编码/解码装置生成的比特流的记录介质。
本发明的另一个目的是提供用于传输由本发明的视频编码/解码方法或装置生成的比特流的方法和装置。
技术方案
根据本发明,一种视频解码方法包括:基于与当前块相对应并存在于参考图像中的参考块,生成当前块的帧间预测块;基于参考块和与参考块邻近的第一参考像素,生成当前块的帧内预测块;基于不使用当前块进行失真计算,推导分配给帧间预测块和帧内预测块的加权值;以及基于加权值、帧间预测块和帧内预测块,生成当前块的组合的帧间/帧内预测(CIIP)块。
在根据本发明的视频解码方法中,其中,生成当前块的帧内预测块包括:基于与参考块邻近的第一参考像素来生成第一帧内预测块;基于第一帧内预测块的失真和参考块来推导帧内预测模式;以及基于帧内预测模式和与当前块邻近的第二参考像素来生成帧内预测块。
在根据本发明的视频解码方法中,其中,基于与当前块邻近的相邻块是否是帧内预测编码的和帧间预测编码的来推导加权值。
在根据本发明的视频解码方法中,其中,推导分配给帧间预测块和帧内预测块的加权值包括:推导帧间预测信号的失真;推导帧内预测信号的失真;以及基于帧间预测信号的失真和帧内预测信号的失真来推导加权值。
在根据本发明的视频解码方法中,其中,基于与当前块邻近的第二参考像素和与参考块邻近的第一参考像素之间的差来推导帧间预测信号的失真。
在根据本发明的视频解码方法中,其中,推导帧内预测信号的失真包括:基于帧内预测模式和与参考块邻近的第一参考像素来生成第二帧内预测块;以及基于第二帧内预测块的失真和参考块来推导帧内预测信号的失真。
在根据本发明的视频解码方法中,其中,推导帧内预测信号的失真包括:基于帧内预测模式和与当前块邻近的第二参考像素来生成第三帧内预测块;以及基于第三帧内预测块的失真和参考块来推导帧内预测信号的失真。
在根据本发明的视频解码方法中,其中,推导帧内预测信号的失真包括:基于平面模式和与当前块邻近的第二参考像素来生成第四帧内预测块;以及基于第四帧内预测块的失真和参考块来推导帧内预测信号的失真。
在根据本发明的视频解码方法中,进一步包括:基于在失真计算中利用当前块,获得分配给帧间预测块和帧内预测块的加权值;以及基于加权值、帧间预测块和帧内预测块,生成当前块的CIIP预测块,其中,基于加权值映射到的索引信息来获得加权值。
在根据本发明的视频解码方法中,其中,基于帧内预测的误差分布和帧间预测的误差分布的至少一个来推导加权值。
根据本发明,一种视频编码方法包括:基于与当前块相对应并存在于参考图像中的参考块,生成当前块的帧间预测块;基于参考块和与参考块邻近的第一参考像素,生成当前块的帧内预测块;确定分配给帧间预测块和帧内预测块的加权值;以及基于加权值、帧间预测块和帧内预测块,生成当前块的组合的帧间/帧内预测(CIIP)块。
在根据本发明的视频编码方法中,其中,生成当前块的帧内预测块包括:基于与参考块邻近的第一参考像素来生成第一帧内预测块;基于第一帧内预测块的失真和参考块来确定帧内预测模式;以及基于帧内预测模式和与当前块邻近的第二参考像素来生成帧内预测块。
在根据本发明的视频编码方法中,其中,基于与当前块邻近的相邻块是否是帧内预测编码的和帧间预测编码的来确定加权值。
在根据本发明的视频编码方法中,其中,确定分配给帧间预测块和帧内预测块的加权值包括:确定帧间预测信号的失真;确定帧内预测信号的失真;以及基于帧间预测信号的失真和帧内预测信号的失真来确定加权值。
在根据本发明的视频编码方法中,其中,基于与当前块邻近的第二参考像素和与参考块邻近的第一参考像素之间的差来确定帧间预测信号的失真,以及确定帧内预测信号的失真包括:基于帧内预测模式和与参考块邻近的第一参考像素来生成第二帧内预测块;以及基于第二帧内预测块的失真和参考块来确定帧内预测信号的失真。
在根据本发明的视频编码方法中,其中,确定帧内预测信号的失真包括:基于帧内预测模式和与当前块邻近的第二参考像素来生成第三帧内预测块;以及基于第三帧内预测块的失真和参考块来确定帧内预测信号的失真。
在根据本发明的视频编码方法中,其中,确定帧内预测信号的失真包括:基于平面模式和与当前块邻近的第二参考像素来生成第四帧内预测块;以及基于第四帧内预测块的失真和参考块来确定帧内预测信号的失真。
在根据本发明的视频编码方法中,其中,基于当前块与参考块之间的差来确定帧间预测信号的失真,并且确定帧内预测信号的失真包括:基于帧内预测模式和与当前块邻近的第二参考像素来生成第三帧内预测块;以及基于第三帧内预测块的失真和当前块来确定帧内预测信号的失真。
在根据本发明的视频编码方法中,其中,确定帧内预测信号的失真包括:基于平面模式和与当前块邻近的第二参考像素来生成第四帧内预测块;以及基于第四帧内预测块的失真和当前块来确定帧内预测信号的失真。
在根据本发明的视频编码方法中,进一步包括:对加权值映射到的索引信息进行编码。
此外,根据本发明,可以提供一种传输由根据本发明的视频编码方法或装置生成的比特流的方法。
此外,根据本发明,可以提供存储由根据本发明的视频编码方法或装置生成的比特流的记录介质。
此外,根据本发明,可以提供存储由根据本发明的视频解码装置接收和解码的比特流并将其用于重构视频的记录介质。
有益效果
根据本发明,可以提供用于基于组合的帧间/帧内预测(CIIP)模式生成当前块的预测块的方法和装置。
此外,根据本发明,可以提供用于在CIIP模式下确定各种帧内预测模式的方法和装置。
此外,根据本发明,可以提供用于在CIIP模式下确定各种加权值的方法和装置。
此外,根据本发明,可以提供用于在CIIP模式下传输各种加权值的方法和装置。
此外,根据本发明,可以提供用于提高视频编码/解码效率的方法和装置。
可以通过本发明获取的效果不限于上述效果,并且本领域普通技术人员可以通过下面的描述清楚地理解未提及的其他效果。
附图说明
图1是可以实现本发明技术的视频编码装置的框图。
图2示出利用四叉树加二叉树三叉树(QTBTTT)结构来对块进行分区的方法。
图3a和图3b示出包括宽角度帧内预测模式的多个帧内预测模式。
图4示出当前块的相邻块。
图5是可以实现本发明技术的视频解码装置的框图。
图6是示出根据本发明实施方案的在组合的帧间/帧内预测(combined inter/intra prediction,CIIP)模式下生成当前块的预测块的方法的示意图。
图7是示出根据本发明实施方案的在CIIP模式下被参考以确定加权值的相邻块的示意图。
图8是示出根据本发明实施方案的在CIIP模式下确定加权值的方法的示意图。
图9是示出根据本发明实施方案的在CIIP模式下利用各种帧内预测模式的方法的示意图。
图10是示出根据本发明实施方案的在CIIP模式下确定各种帧内预测模式的过程的示意图。
图11是示出根据本发明另一个实施方案的在CIIP模式下被参考以确定加权值的相邻块的示意图。
图12是示出根据本发明另一个实施方案的在CIIP模式下确定加权值的方法的示意图。
图13是示出根据本发明另一个实施方案的在CIIP模式下确定加权值的方法的示意图。
图14是示出根据本发明另一个实施方案的根据索引的加权值的示意图。
图15是示出根据本发明实施方案的将固定长度码分配到加权值的索引的方法的示意图。
图16是示出根据本发明实施方案的将分阶段(phased-in)码分配到加权值的索引的方法的示意图。
图17是示出根据本发明实施方案的将可变长度码分配到加权值的索引的方法的示意图。
图18a和图18b是示出根据本发明实施方案的帧间预测的误差分布和帧内预测的误差分布的示意图。
图19a和图19b是示出根据本发明实施方案的8×8块的帧内预测的加权值和8×8块的帧间预测的加权值的示意图。
图19c和图19d是示出根据本发明另一个实施方案的8×8块的帧内预测的加权值的示意图。
图20是示出根据本发明实施方案的视频解码过程的示意图。
图21是示出根据本发明实施方案的视频编码过程的示意图。
具体实施方式
在下文中,将参考所附说明性附图对本发明的一些实施方案进行详细描述。在下面的描述中,相同的附图标记表示相同的元件,尽管元件在不同的附图中示出。此外,在一些实施方案的以下描述中,当认为相关的已知组件和功能的详细描述模糊了本发明的主题时,为了清楚和简洁起见,已经省略对相关的已知组件和功能的详细描述。
图1是可以实现本发明技术的视频编码装置的框图。在下文中,参考图1的图示,对视频编码装置以及该装置的组件进行描述。
编码装置可以包括:图像分割器110、预测器120、减法器130、变换器140、量化器145、重排单元150、熵编码器155、逆量化器160、逆变换器165、加法器170、环路滤波单元180和存储器190。
编码装置的每个组件可以实现为硬件或软件,或者实现为硬件和软件的组合。另外,每个组件的功能可以实现为软件,并且微处理器也可以实现为执行对应于每个组件的软件的功能。
一个视频由包括多个图像的一个或更多个序列组成。每个图像分割为多个区域,并且对每个区域执行编码。例如,一个图像分割为一个或更多个瓦片(tile)或/和切片(slice)。这里,一个或更多个瓦片可以定义为瓦片组。每个瓦片或/和切片分割为一个或更多个编码树单元(coding tree unit,CTU)。另外,每个CTU通过树结构分割为一个或更多个编码单元(coding unit,CU)。应用于每个CU的信息被编码为CU的语法,并且共同应用于包括在一个CTU中的CU的信息被编码为CTU的语法。另外,共同应用于一个切片中的所有块的信息被编码为切片头的语法,而应用于构成一个或更多个图像的所有块的信息被编码为图像参数集(Picture Parameter Set,PPS)或图像头。此外,多个图像共同参考的信息被编码为序列参数集(Sequence Parameter Set,SPS)。另外,一个或更多个SPS共同参考的信息被编码为视频参数集(Video Parameter Set,VPS)。此外,共同应用于一个瓦片或瓦片组的信息也可以被编码为瓦片或瓦片组头的语法。包括在SPS、PPS、切片头、瓦片或瓦片组头中的语法可以称为高级语法。
图像分割器110确定编码树单元(CTU)的大小。关于CTU的大小(CTU尺寸)的信息被编码为SPS或PPS的语法,并且被传送至视频解码装置。
图像分割器110将构成视频的每个图像分割为具有预定大小的多个编码树单元(CTU),然后通过利用树结构递归地分割CTU。树结构中的叶节点成为编码单元(CU),所述CU是编码的基本单元。
树结构可以是四叉树(quadtree,QT),其中较高节点(或父节点)被分割为具有相同大小的四个较低节点(或子节点)。树结构也可以是二叉树(binarytree,BT),其中较高的节点分割为两个较低的节点。树结构还可以是三叉树(ternarytree,TT),其中较高的节点以1:2:1的比率分割为三个较低的节点。树结构还可以是QT结构、BT结构和TT结构中的两个或更多个结构混合的结构。例如,可以使用四叉树加二叉树(quadtree plus binarytree,QTBT)结构,或者可以使用四叉树加二叉树三叉树(quadtree plus binarytreeternarytree,QTBTTT)结构。这里,BTTT被添加到树结构以称为多类型树(multiple-typetree,MTT)。
图2是用于描述通过利用QTBTTT结构来对块进行分割的方法的示意图。
如图2所示,CTU可以首先分割为QT结构。四叉树分割可以是递归的,直到分割块的大小达到QT中允许的叶节点的最小块大小(MinQTSize)。由熵编码器155对指示QT结构的每个节点是否被分割为下层的四个节点的第一标志(QT_split_flag)进行编码,并将其用信号通知视频解码装置。当QT的叶节点不大于BT中允许的根节点的最大块大小(MaxBTSize)时,可以将叶节点进一步分割为BT结构或TT结构的至少一个。在BT结构和/或TT结构中可以存在多个分割方向。例如,可以存在两个方向,即,水平地分割相应节点的块的方向以及竖直地分割相应节点的块的方向。如图2所示,当MTT分割开始时,由熵编码器155对指示节点是否被分割的第二标志(mtt_split_flag)、以及在节点被分割的情况下额外指示分割方向(竖直或水平)的标志和/或指示分割类型(二叉或三叉)的标志进行编码,并将其用信号通知视频解码装置。
替选地,在对指示每个节点是否被分割为下层的四个节点的第一标志(QT_split_flag)进行编码之前,还可以对指示节点是否被分割的CU分割标志(split_cu_flag)进行编码。当CU分割标志(split_cu_flag)的值指示出每个节点没有被分割时,相应节点的块成为分割树结构中的叶节点并成为CU,CU是编码的基本单元。当CU分割标志(split_cu_flag)的值指示出每个节点被分割时,视频编码装置以上述方案对第一标志首先开始编码。
当QTBT用作树结构的另一个示例时,可以存在两种类型,即,将相应节点的块水平地分割为具有相同大小的两个块的类型(即,对称水平分割)以及将相应节点的块竖直地分割为具有相同大小的两个块的类型(即,对称竖直分割)。由熵编码器155对指示BT结构的每个节点是否被分割为下层的块的分割标志(split_flag)和指示分割类型的分割类型信息进行编码,并将其传送至视频解码装置。另一方面,可以另外存在相应节点的块被分割为彼此非对称形式的两个块的类型。非对称形式可以包括相应节点的块被分割为大小比率为1:3的两个矩形块的形式,或者还可以包括相应节点的块在对角线方向上被分割的形式。
CU可以根据从CTU分割的QTBT或QTBTTT而具有各种大小。在下文中,与要编码或解码的CU(即,QTBTTT的叶节点)相对应的块称为“当前块”。当采用QTBTTT分割时,除了正方形形状之外,当前块的形状也可以是矩形形状。
预测器120对当前块进行预测以生成预测块。预测器120包括帧内预测器122和帧间预测器124。
通常,可以对图像中的当前块的每个进行预测地编码。通常,可以通过利用帧内预测技术(其利用来自包括当前块的图像的数据)或帧间预测技术(其利用来自在包括当前块的图像之前编码的图像的数据)执行当前块的预测。帧间预测包括单向预测和双向预测两者。
帧内预测器122通过利用在包括当前块的当前图像中位于当前块邻近的像素(参考像素)来预测当前块中的像素。根据预测方向,存在多个帧内预测模式。例如,如图3a所示,多个帧内预测模式可以包括包含平面(Planar)模式和DC模式的两种非方向模式,并且可以包括65种方向模式。根据每种预测模式不同地定义要使用的相邻像素和算法等式。
为了对具有矩形形状的当前块进行高效的方向预测,可以额外地使用图3b中虚线箭头所示的方向模式(#67至#80,帧内预测模式#-1至#-14)。方向模式可以称为“宽角度帧内预测模式(wide angle intra-prediction modes)”。在图3b中,箭头指示用于预测的相应参考样本,而非代表预测方向。预测方向与箭头指示的方向相反。在当前块具有矩形形状时,宽角度帧内预测模式是在没有额外比特传输的情况下在与特定方向模式相反的方向上执行预测的模式。在这种情况下,在宽角度帧内预测模式中,可以通过具有矩形形状的当前块的宽度与高度的比率来确定可用于当前块的一些宽角度帧内预测模式。例如,在当前块具有高度小于宽度的矩形形状时,具有小于45度的角度的宽角度帧内预测模式(帧内预测模式#67至#80)是可用的。在当前块具有宽度大于高度的矩形形状时,具有大于-135度的角度的宽角度帧内预测模式是可用的。
帧内预测器122可以确定要用于对当前块进行编码的帧内预测。在一些示例中,帧内预测器122可以通过利用多个帧内预测模式来对当前块进行编码,并且还可以从测试模式中选择要使用的适当的帧内预测模式。例如,帧内预测器122可以通过利用对多个测试的帧内预测模式的率失真(rate-distortion)分析来计算率失真值,并且还可以在测试模式中选择具有最佳率失真特性的帧内预测模式。
帧内预测器122在多个帧内预测模式中选择一个帧内预测模式,并且通过利用根据选择的帧内预测模式确定的相邻像素(参考像素)和算法等式来预测当前块。由熵编码器155对关于选择的帧内预测模式的信息进行编码并将其传送至视频解码装置。
帧间预测器124通过利用运动补偿处理来生成当前块的预测块。帧间预测器124在比当前图像更早已被编码和解码的参考图像中搜索与当前块最相似的块,并且通过利用搜索到的块来生成当前块的预测块。另外,生成运动矢量(motion vector,MV),所述运动矢量与当前图像中的当前块和参考图像中的预测块之间的位移(displacement)相对应。通常,对亮度(luma)分量执行运动估计,并且基于亮度分量计算的运动矢量用于亮度分量和色度分量两者。由熵编码器155对包括参考图像的信息和关于用于预测当前块的运动矢量的信息的运动信息进行编码,并将其传送至视频解码装置。
帧间预测器124还可以执行参考图像或参考块的插值,以增加预测的准确性。换句话说,通过向包括两个整数样本的多个连续整数样本应用滤波器系数来在两个连续整数样本之间插值子样本。在对插值的参考图像执行搜索与当前块最相似的块的处理时,对于运动矢量可以表示小数单位精度而不是整数样本单位精度。对于要编码的每个目标区域,例如,诸如切片、瓦片、CTU、CU等的单元,可以不同地设置运动矢量的精度或分辨率。当应用这种自适应运动矢量分辨率(adaptive motion vector resolution,AMVR)时,应该针对每个目标区域用信号通知关于要应用于每个目标区域的运动矢量分辨率的信息。例如,当目标区域是CU时,用信号通知关于应用于每个CU的运动矢量分辨率的信息。关于运动矢量分辨率的信息可以是代表要在以下描述的运动矢量差的精度的信息。
另一方面,帧间预测器124可以通过利用双向预测来执行帧间预测。在双向预测的情况下,使用两个参考图像和代表与每个参考图像中的当前块最相似的块位置的两个运动矢量。帧间预测器124分别从参考图像列表0(RefPicList0)和参考图像列表1(RefPicList1)选择第一参考图像和第二参考图像。帧间预测器124还搜索与相应参考图像中的当前块最相似的块,以生成第一参考块和第二参考块。此外,通过对第一参考块和第二参考块进行平均或加权平均来生成当前块的预测块。此外,包括关于用于预测当前块的两个参考图像的信息和关于两个运动矢量的信息的运动信息被传送至熵编码器155。这里,参考图像列表0可以由预重构图像中按显示顺序在当前图像之前的图像构成,并且参考图像列表1可以由预重构图像中按显示顺序在当前图像之后的图像构成。然而,尽管不特别限于此,但可以将显示顺序中在当前图像之后的预重构图像额外地包括在参考图像列表0中。相反,在当前图像之前的预重构图像也可以额外地包括在参考图像列表1中。
为了最小化用于编码运动信息所消耗的比特量,可以使用各种方法。
例如,在当前块的参考图像和运动矢量与相邻块的参考图像和运动矢量相同时,能够识别相邻块的信息被编码以将当前块的运动信息传送至视频解码装置。这种方法称为合并模式(merge mode)。
在合并模式中,帧间预测器124从当前块的相邻块选择预定数量的合并候选块(在下文中,称为“合并候选”)。
作为用于推导合并候选的相邻块,可以使用与当前图像中的当前块邻近的左侧块A0、左下侧块A1、上侧块B0、右上侧块B1和左上侧块B2的全部或一些,如图4所示。此外,除了当前块所在的当前图像之外,位于参考图像内的块(其可以与用于预测当前块的参考图像相同或不同)也可以用作合并候选。例如,参考图像内的当前块的同位块(co-locatedblock)或与该同位块邻近的块可以额外地用作合并候选。如果通过上述方法选择的合并候选的数量小于预设数量,则将零矢量添加到合并候选。
帧间预测器124通过利用相邻块来配置包括预定数量的合并候选的合并列表。从合并列表中包括的合并候选之中选择要用作当前块的运动信息的合并候选,并且生成用于识别选择的候选的合并索引信息。由熵编码器155对生成的合并索引信息进行编码并将其传送至视频解码装置。
合并跳过模式是合并模式的特例。在量化之后,在用于熵编码的所有变换系数都接近零时,仅传输相邻块选择信息而不传输残差信号。通过利用合并跳过模式,对于具有轻微运动的影像、静止影像、屏幕内容影像等可以实现相对较高的编码效率。
此后,合并模式和合并跳过模式统称为合并/跳过模式。
用于编码运动信息的另一种方法是高级运动矢量预测(advanced motion vectorprediction,AMVP)模式。
在AMVP模式中,帧间预测器124通过利用当前块的相邻块来推导用于当前块的运动矢量的运动矢量预测候选。作为用于推导运动矢量预测候选的相邻块,可以使用与图4所示的当前图像中的当前块邻近的左侧块A0、左下侧块A1、上侧块B0、右上侧块B1和左上侧块B2的全部或一些。此外,除了当前块所在的当前图像之外,位于参考图像(其可以与用于预测当前块的参考图像相同或不同)内的块也可以用作用于推导运动矢量预测候选的相邻块。例如,可以使用参考图像内的当前块的同位块或与该同位块邻近的块。如果通过上述方法选择的运动矢量候选的数量小于预设数量,则将零矢量添加到运动矢量候选。
帧间预测器124通过利用相邻块的运动矢量来推导运动矢量预测候选,并且通过利用运动矢量预测候选来确定当前块的运动矢量的运动矢量预测。另外,通过将当前块的运动矢量减去运动矢量预测来计算运动矢量差。
可以通过将预定义函数(例如,中值和平均值计算等)应用于运动矢量预测候选来获取运动矢量预测。在这种情况下,视频解码装置还知道预定义功能。此外,由于用于推导运动矢量预测候选的相邻块是已经完成编码和解码的块,所以视频解码装置也可能已经知道相邻块的运动矢量。因此,视频编码装置不需要对用于识别运动矢量预测候选的信息进行编码。相应地,在这种情况下,对关于运动矢量差的信息和关于用于预测当前块的参考图像的信息进行编码。
另一方面,还可以通过选择运动矢量预测候选的任何一个的方案来确定运动矢量预测。在这种情况下,用于识别选择的运动矢量预测候选的信息与用于预测当前块的关于运动矢量差的信息以及关于参考图像的信息共同进行额外的编码。
减法器130通过将当前块减去由帧内预测器122或帧间预测器124生成的预测块来生成残差块。
变换器140将具有空域的像素值的残差块中的残差信号变换为频域的变换系数。变换器140可以通过利用残差块的整个大小作为变换单元来变换残差块中的残差信号,或者也可以将残差块分割为多个子块,并且可以通过利用子块作为变换单元来执行变换。替选地,将残差块划分成两个子块,即变换区域和非变换区域,以通过仅利用变换区域子块作为变换单元来变换残差信号。这里,变换区域子块可以是基于水平轴线(或竖直轴线)的具有大小比率为1:1的两个矩形块的一个。在这种情况下,由熵编码器155对指示出仅变换子块的标志(cu_sbt_flag)、以及方向(竖直/水平)信息(cu_sbt_horizontal_flag)和/或位置信息(cu_sbt_pos_flag)进行编码,并将其用信号通知视频解码装置。另外,变换区域子块的大小基于水平轴线(或竖直轴线)可以具有1:3的大小比率。在这种情况下,由熵编码器155对划分相应分割的标志(cu_sbt_quad_flag)进行额外地编码,并将其用信号通知视频解码装置。
另一方面,变换器140可以在水平方向和竖直方向上单独地执行残差块的变换。对于该变换,可以使用各种类型的变换函数或变换矩阵。例如,用于水平变换和竖直变换的成对变换函数可以定义为多变换集(multiple transform set,MTS)。变换器140可以选择MTS中具有最高变换效率的一个变换函数对,并且可以在水平方向和竖直方向的每个上变换残差块。由熵编码器155对关于MTS中的变换函数对的信息(mts_idx)进行编码,并将其用信号通知视频解码装置。
量化器145利用量化参数对从变换器140输出的变换系数进行量化,并且将量化的变换系数输出到熵编码器155。量化器145还可以对相关的残差块立即进行量化,而无需对任何块或帧进行变换。量化器145还可以根据变换块中的变换系数的位置来应用不同的量化系数(缩放值)。可以对应用于布置为二维的量化的变换系数的量化矩阵进行编码,并将其用信号通知视频解码装置。
重排单元150可以对量化的残差值执行系数值的重新排列。
重排单元150可以通过利用系数扫描将2D系数阵列改变为1D系数序列。例如,重排单元150可以利用锯齿形扫描(zig-zag scan)或对角线扫描(diagonal scan)来扫描DC系数到高频区域的系数以输出1D系数序列。根据变换单元的大小和帧内预测模式,也可以利用在列方向上扫描2D系数阵列的竖直扫描和在行方向上扫描2D块类型系数的水平扫描来代替锯齿形扫描。换句话说,根据变换单元的大小和帧内预测模式,可以在锯齿形扫描、对角线扫描、竖直扫描和水平扫描中确定要使用的扫描方法。
熵编码器155通过利用包括基于上下文的自适应二进制算术编码(Context-basedAdaptive Binary Arithmetic Code,CABAC)、指数哥伦布(Exponential Golomb)等的各种编码方案来对从重排单元150输出的1D量化的变换系数的序列进行编码,以生成比特流。
此外,熵编码器155对与块分割相关的信息(例如,CTU大小、CTU分割标志、QT分割标志、MTT分割类型和MTT分割方向等)进行编码,以使得视频解码装置能够等同于视频编码装置来分割块。此外,熵编码器155对关于指示当前块是由帧内预测编码还是由帧间预测编码的预测类型的信息进行编码。熵编码器155根据预测类型对帧内预测信息(即,关于帧内预测模式的信息)或帧间预测信息(在合并模式的情况下的合并索引,以及在AMVP模式的情况下的关于参考图像索引和运动矢量差的信息)进行编码。此外,熵编码器155对与量化相关的信息(即,关于量化参数的信息和关于量化矩阵的信息)进行编码。
逆量化器160对从量化器145输出的量化的变换系数进行逆量化,以生成变换系数。逆变换器165将从逆量化器160输出的变换系数从频域变换到空域,以重构残差块。
加法器170将重构的残差块和由预测器120生成的预测块相加,以重构当前块。在对下一个块进行帧内预测时,重构的当前块中的像素用作参考像素。
环路滤波单元180对重构的像素执行滤波,以减少由于基于块的预测和变换/量化而发生的块伪影(blocking artifacts)、振铃伪影(ringing artifacts)、模糊伪影(blurring artifacts)等。作为环内滤波器的环路滤波单元180可以包括去块滤波器182、样本自适应偏移(sample adaptive offset,SAO)滤波器184和自适应环路滤波器(adaptive loop filter,ALF)186的全部或一些。
去块滤波器182对重构的块之间的边界进行滤波,以去除由于块单元编码/解码而发生的块伪影(blocking artifacts),并且SAO滤波器184和ALF 186对去块滤波的视频进行额外的滤波。SAO滤波器184和ALF 186是用于补偿由于有损编码(lossy coding)而发生的重构的像素与原始像素之间的差异的滤波器。SAO滤波器184应用偏移作为CTU单位,以增强主观图像质量和编码效率。另一方面,ALF 186执行块单元滤波,并且通过划分相应块的边界和变化量的程度来应用不同的滤波器以补偿失真。可以对关于要用于ALF的滤波器系数的信息进行编码,并将其用信号通知视频解码装置。
通过去块滤波器182、SAO滤波器184和ALF 186滤波的重构的块存储在存储器190中。当一个图像中的所有块被重构时,重构的图像可以用作用于对随后要被编码的图像内的块进行帧间预测的参考图像。
图5是可以实现本发明技术的视频解码装置的功能框图。在下文中,参考图5,描述了视频解码装置和该装置的组件。
视频解码装置可以包括熵解码器510、重排单元515、逆量化器520、逆变换器530、预测器540、加法器550、环路滤波单元560和存储器570。
类似于图1的视频编码装置,视频解码装置的每个组件可以实现为硬件或软件,或者实现为硬件和软件的组合。另外,每个组件的功能可以实现为软件,并且微处理器也可以实现为执行对应于每个组件的软件的功能。
熵解码器510通过解码由视频编码装置生成的比特流来提取与块分割相关的信息,以确定要解码的当前块,并且提取恢复当前块所需的预测信息和关于残差信号的信息。
熵解码器510通过从序列参数集(SPS)或图像参数集(PPS)提取关于CTU大小的信息来确定CTU的大小,并且将图像分割为具有确定大小的CTU。此外,CTU被确定为树结构的最高层(即,根节点),并且提取CTU的分割信息以通过利用树结构来分割CTU。
例如,当通过利用QTBTTT结构来分割CTU时,首先提取与QT的分割相关的第一标志(QT_split_flag),以将每个节点分割为下层的四个节点。另外,相对于与QT的叶节点相对应的节点来提取与MTT的分割相关的第二标志(mtt_split_flag)、分割方向(竖直/水平)和/或分割类型(二叉/三叉),以将相应的叶节点分割为MTT结构。结果,QT的叶节点下方的每个节点被递归地分割为BT或TT结构。
作为另一个示例,当通过利用QTBTTT结构来分割CTU时,提取指示是否分割CU的CU分割标志(split_cu_flag)。当分割相应块时,还可以提取第一标志(QT_split_flag)。在分割过程期间,对于每个节点,在递归QT分割0次或更多次之后可能发生0次或更多次的递归MTT分割。例如,对于CTU,MTT分割可以立即发生,或者相反,也可以仅发生多次QT分割。
作为另一个示例,当通过利用QTBT结构来分割CTU时,提取与QT的分割相关的第一标志(QT_split_flag),以将每个节点分割为下层的四个节点。另外,提取指示将与QT的叶节点相对应的节点是否进一步分割为BT的分割标志(split_flag)以及分割方向信息。
另一方面,当熵解码器510通过利用树结构的分割来确定要解码的当前块时,熵解码器510提取关于指示当前块是被帧内预测还是被帧间预测的预测类型的信息。当预测类型信息指示帧内预测时,熵解码器510提取用于当前块的帧内预测信息(帧内预测模式)的语法元素。当预测类型信息指示帧间预测时,熵解码器510提取代表帧间预测信息的语法元素的信息,即,运动矢量和运动矢量参考的参考图像。
此外,熵解码器510提取量化相关的信息并且提取关于量化的当前块的变换系数的信息作为关于残差信号的信息。
重排单元515可以以由视频编码装置执行的系数扫描顺序的相反顺序,将由熵解码器510熵解码的1D量化的变换系数的序列再次改变为2D系数阵列(即,块)。
逆量化器520对量化的变换系数进行逆量化,并且通过利用量化参数对量化的变换系数进行逆量化。逆量化器520还可以向布置为2D的量化的变换系数应用不同的量化系数(缩放值)。逆量化器520可以通过将来自视频编码装置的量化系数(缩放值)的矩阵应用于量化的变换系数的2D阵列来执行逆量化。
逆变换器530通过将逆量化的变换系数从频域逆变换到空域来恢复残差信号,以生成当前块的残差块。
此外,当逆变换器530对变换块的部分区域(子块)进行逆变换时,逆变换器530提取仅对变换块的子块进行变换的标志(cu_sbt_flag)、子块的方向(竖直/水平)信息(cu_sbt_horizontal_flag)和/或子块的位置信息(cu_sbt_pos_flag)。逆变换器530还将相应子块的变换系数从频域逆变换到空域以重构残差信号,并且用值“0”填充未被逆变换的区域作为残差信号,以生成当前块的最终残差块。
此外,当应用MTS时,逆变换器530通过利用从视频编码装置用信号通知的MTS信息(mts_idx)来确定在水平方向和竖直方向的每个上要应用的变换索引或变换矩阵。逆变换器530还通过利用确定的变换函数在水平方向和竖直方向上对变换块中的变换系数执行逆变换。
预测器540可以包括帧内预测器542和帧间预测器544。在当前块的预测类型是帧内预测时,激活帧内预测器542,而在当前块的预测类型是帧间预测时,激活帧间预测器544。
帧内预测器542根据从熵解码器510提取的帧内预测模式的语法元素来确定多个帧内预测模式中当前块的帧内预测模式。帧内预测器542还根据帧内预测模式通过利用当前块的相邻参考像素来预测当前块。
帧间预测器544通过利用从熵解码器510提取的帧间预测模式的语法元素来确定当前块的运动矢量和运动矢量参考的参考图像。
加法器550通过将从逆变换器530输出的残差块与从帧间预测器544或帧内预测器542输出的预测块相加来重构当前块。在对后续要被解码的块进行帧内预测时,重构的当前块内的像素用作参考像素。
作为环内滤波器的环路滤波单元560可以包括去块滤波器562、SAO滤波器564和ALF 566。去块滤波器562对重构的块之间的边界执行去块滤波,以便去除由于块单元解码而发生的块伪影。SAO滤波器564和ALF 566在去块滤波之后对重构的块执行额外的滤波,以便补偿由于有损编码而发生的重构的像素与原始像素之间的差异。通过利用关于从比特流解码的滤波器系数的信息来确定ALF的滤波器系数。
通过去块滤波器562、SAO滤波器564和ALF 566滤波的重构的块存储在存储器570中。当一个图像中的所有块被重构时,重构的图像可以用作用于对随后要被编码的图像内的块进行帧间预测的参考图像。
图6是示出根据本发明实施方案的在组合的帧间/帧内预测(CIIP)模式下生成当前块的预测块的方法的示意图。图像内预测模式可以具有与帧内预测模式相同的含义。图像内预测模式和帧内预测模式可以互换地使用。图像内预测模式可以具有与帧间预测模式相同的含义。图像内预测模式和帧间预测模式可以互换地使用。CIIP模式可以具有与组合的帧内/帧间预测模式相同的含义。组合的帧内/帧间预测模式和CIIP模式可以互换地使用。在CIIP模式下,可以以与一般合并模式下的方式相同的方式生成帧间预测块。可以通过将平面模式应用于与当前块邻近的参考像素来生成帧内预测块。可以通过将加权值应用于生成的帧间预测块和帧内预测块来生成最终的基于CIIP的预测块。
参考图6,可以基于合并模式来推导参考图像内的参考块(Pinter)。平面模式可以应用于与当前块邻近的参考像素,以生成帧内预测块(PPlanar)。可以通过将加权值应用于相应的参考块(Pinter)和帧内预测块(PPlanar)来生成基于CIIP的预测块(PCIIP)。可以利用等式PCIIP=((4-w)×Pinter+w×PPlanar+2)>2来生成基于CIIP的预测块(PCIIP)。
图7是示出根据本发明实施方案的在CIIP模式下被参考以确定加权值的相邻块的示意图。在CIIP模式下,可以通过考虑与当前块邻近的相邻块是否编码帧内预测模式来确定加权值。
参考图7,在CIIP模式下,可以通过考虑与当前块邻近的顶部相邻块A和左侧相邻块L是否编码帧内预测模式来确定加权值。
图8是示出根据本发明实施方案的在CIIP模式下确定加权值的方法的示意图。在与当前块邻近的相邻块编码许多帧内预测模式时,可以将较大的加权值分配给帧内预测块。相反,在与当前块邻近的相邻块编码较少的帧内预测模式时,可以将较小的加权值分配给帧内预测块。
参考图8,在图7的当前块的顶部相邻块A和左侧相邻块L编码帧内预测模式时,分配给帧内预测块的加权值可以对应于3。当顶部相邻块A编码帧内预测模式并且左侧相邻块L不编码帧内预测模式时,分配给帧内预测块的加权值可以对应于2。当顶部相邻块A不编码帧内预测模式并且左侧相邻块L编码帧内预测模式时,分配给帧内预测块的加权值可以对应于2。当顶部相邻块A不编码帧内预测模式并且左侧相邻块L不编码帧内预测模式时,分配给帧内预测块的加权值可以对应于1。
以上参考图6至图8描述的CIIP模式使用固定到平面模式的帧内预测模式,因此不使用存在于当前块周围的方向信息。此外,由于根据特定位置块是否使用帧内预测模式来确定加权值,因此在确定加权值方面存在限制。
图9是示出根据本发明实施方案的在CIIP模式下利用各种帧内预测模式的方法的示意图。
参考图9,可以利用合并模式来推导用于当前块的参考块(Pinter)。可以利用与相应参考块(Pinter)邻近的第一参考像素来生成帧内预测块(Pintra 1)。可以通过将帧内预测块(Pintra 1)的失真和参考块(Pinter)进行比较来确定最佳帧内预测模式。这里,失真可以通过各种相关测量方法来计算,例如绝对差之和(Sum of Absolute Differences,SAD)或误差平方和(Sum of Square Error,SSE)。通过将帧内预测块(Pintra 1)的失真和参考块(Pinter)进行比较,可以将具有最小失真的帧内预测模式确定为最佳帧内预测模式。可以通过将确定的最佳帧内预测模式应用于第二参考像素来生成帧内预测块(Pintra 2)。帧内预测块(Pintra 2)可以对应于最终帧内预测块。
图10是示出根据本发明实施方案的在CIIP模式下确定各种帧内预测模式的示意图。
参考图10,编码装置可以利用合并模式来确定与当前块相对应的参考块(S1010)。编码装置可以基于与参考块邻近的第一参考像素来生成帧内预测块(S1020)。编码装置可以通过将生成的帧内预测块的失真和参考块进行比较来确定最佳帧内预测模式(S1030)。编码装置可以基于确定的最佳帧内预测模式和第二参考像素来生成最终帧内预测块(S1040)。根据本发明的CIIP模式使用各种帧内预测模式,因此,编解码效率可以增加。
图11是示出根据本发明另一个实施方案的在CIIP模式下被参考以确定加权值的相邻块的示意图。在CIIP模式下,与当前块邻近的所有相邻块的信息可以用于确定加权值。在这种情况下,编码装置和解码装置执行相同的处理以确定加权值,因此编码装置不需要向解码装置发送加权值信息。这可以对应于隐式方法。
参考图11,可以利用与当前块邻近的相邻块A1-A8、L1-L8和AL的信息来确定加权值。可以根据相邻块的帧内预测编解码和帧间预测编解码的比率按比例分布来确定相应的加权值。然而,本发明不限于这些实施方案。可以利用任意位置和任意数量的相邻块而不是所有相邻块来确定加权值。如果执行帧内预测编解码的相邻块的数量是Nintra,并且执行帧间预测编解码的相邻块的数量是Ninter,则分配给帧内预测块的加权值Wintra可以计算为并且分配给帧间预测块的加权值Winter可以计算为/>根据本发明的确定加权值的方法可以具有较高精度,这是因为加权值是利用与当前块邻近的所有相邻块来计算的。相应地,可以提高CIIP模式的编解码效率。
图12是示出根据本发明另一个实施方案的在CIIP模式下确定加权值的方法的示意图。在CIIP模式下,可以利用失真来计算加权值。可以基于帧内预测信号的失真和帧间预测信号的失真来计算相应的加权值。在这种情况下,编码装置和解码装置执行相同的处理以确定加权值,因此编码装置不需要向解码装置发送加权值信息。这可以对应于隐式方法。
参考图12,可以通过计算在合并模式下确定的与当前块邻近的第二参考像素和与参考块(Pinter)邻近的第一参考像素之间的差来确定帧间预测信号的失真。
可以根据三种方法来计算帧内预测信号的失真。参考第一种方法,可以利用与参考块(Pinter)邻近的第一参考像素来生成帧内预测块。可以通过将相应帧内预测块的失真和参考块(Pinter)进行比较来确定最佳帧内预测模式。可以通过将确定的最佳帧内预测模式应用于第一参考像素来生成帧内预测块(Pintra 1)。可以通过计算帧内预测块(Pintra 1)的失真与参考块(Pinter)来计算帧内预测信号的失真。
参考第二种方法,可以利用与参考块(Pinter)邻近的第一参考像素来生成帧内预测块。可以通过将帧内预测块的失真和参考块(Pinter)进行比较来确定最佳帧内预测模式。可以通过将确定的最佳帧内预测模式应用于第二参考像素来生成帧内预测块(Pintra 2)。可以通过计算帧内预测块(Pintra 2)的失真和参考块(Pinter)来计算帧内预测信号的失真。
参考第三种方法,可以通过将平面模式应用于第二参考像素来生成基于平面模式的帧内预测块(Pplanar)。可以通过基于平面模式和参考块(Pinter)计算帧内预测块(Pplanar)的失真来计算帧内图像预测信号的失真。
可以通过选择上述三种方法的任一种来计算帧内预测信号的失真。当帧间预测信号的失真为Dinter并且帧内预测信号的失真为Dintra时,分配给帧间预测信号的加权值Winter可以计算为并且分配给帧内预测信号的加权值Wintra可以计算为分配给帧间预测信号的加权值Winter可以利用帧内预测信号的失真Dintra来计算,并且分配给帧内预测信号的加权值Wintra可以利用帧间预测信号的失真Dinter来计算。这考虑到,由于失真值降低,所以预测的信号与原始信号之间的相似性增加,并且由于失真值增加,所以预测的信号与原始信号之间的相似性降低。这里,可以通过各种相关测量方法(例如,SAD或SSE)来计算失真。根据本发明的基于失真计算加权值的方法可以通过精确地计算加权值来提高编码效率。
图13是示出根据本发明另一个实施方案的在CIIP模式下确定加权值的方法的示意图。在CIIP模式下,可以利用失真来计算加权值。可以基于帧内预测信号的失真和帧间预测信号的失真来计算相应的加权值。在这种情况下,编码装置可以利用当前块的信息来计算失真,当前块是解码装置不能使用的原始信号。相应地,编码装置应该将关于利用失真计算的加权值的信息发送到解码装置。这可以对应于显式方法。
参考图13,可以通过计算当前块与参考块(Pinter)之间的差来确定帧间预测信号的失真。编码装置可以使用关于解码装置不能使用的当前块的信息。
可以根据两种方法来计算帧内预测信号的失真。参考第一种方法,可以利用与参考块(Pinter)邻近的第一参考像素来生成帧内预测块。可以通过将帧内预测块的失真和参考块(Pinter)进行比较来确定最佳帧内预测模式。可以通过将确定的最佳帧内预测模式应用于第二参考像素来生成帧内预测块(Pintra)。可以通过计算当前块的失真和帧内预测块(Pintra)来计算帧内预测信号的失真。
参考第二种方法,可以通过将平面模式应用于第二参考像素来生成基于平面模式的帧内预测块(Pplanar)。可以通过基于平面模式和当前块计算帧内预测块(Pplanar)的失真来计算帧内预测信号的失真。
可以通过选择上述两种方法的任一种来计算帧内预测信号的失真。当帧间预测信号的失真为Dinter并且帧内预测信号的失真为Dintra时,分配给帧间预测信号的加权值Winter可以计算为并且分配给帧内预测信号的加权值Wintra可以计算为分配给帧间预测信号的加权值Winter可以利用作为帧内预测信号的失真Dintra来计算,并且分配给帧内预测信号的加权值Wintra可以利用作为帧间预测信号的失真Dinter来计算。这考虑到,随着失真值降低,预测的信号与原始信号之间的相似性增加,随着失真值增加,预测的信号与原始信号之间的相似性降低。这里,可以通过各种相关测量方法(例如,SAD或SSE)来计算失真。根据本发明的基于失真计算加权值的方法可以通过精确计算加权值来提高编码效率。
图14是示出根据本发明另一个实施方案的根据索引的加权值的示意图。在根据图13基于失真计算加权值的情况下,编码装置可以利用关于解码装置不能使用的当前块的信息来计算失真。相应地,编码装置应该将关于根据失真计算的加权值的信息发送到解码装置。通常,加权值可以对应于0和1之间的任何十进制值。可能需要许多比特来传输对应于十进制值的加权值。编码装置可以将关于具有十进制值的加权值的信息映射到预定义的表,并且将相应的索引发送到解码装置。相应地,可以减少传输比特。
参考图14,将加权值映射到索引有三种方法。方法1可以对应于利用0.25、0.5和0.75三个加权值以及从1到3的索引的方法。方法2可以对应于利用以0.125为间隔的从0.125到0.875的总共7个加权值以及利用从1到7的索引的方法。方法3可以对应于利用以0.1为间隔的从0.1到0.9的总共9个加权值并且利用从1到9的索引的方法。然而,本发明不限于这些实施方案。加权值可以使用任何数字和任何值。
可以将图13中计算的加权值与从图14中的三种方法中选择的一种方法中使用的加权值进行比较。作为比较的结果,可以确定具有最相似加权值的索引。CIIP模式下的预测可以利用确定的索引的帧内预测信号的加权值Wintra和帧间预测信号的加权值Winter来执行。编码装置可以将确定的索引发送到解码装置。例如,当计算的帧内预测信号的加权值Wintra和帧间预测信号的加权值Winter分别为0.358和0.642,并且在图14中选择方法2时,确定的索引为3,并且帧内预测信号的加权值Wintra和对应于索引3的加权值Winter可以分别对应于0.375和0.625。相应地,CIIP模式下的预测可以利用用于帧内预测信号的加权值0.375和用于帧间预测信号的加权值0.625来执行。此外,编码装置可以将索引3发送到解码装置。
图15是示出根据本发明实施方案的将固定长度码分配到加权值的索引的方法的示意图。可以确定加权值的索引,并且可以利用固定长度码(fixed length code,FLC)来传输确定的索引。在利用固定长度码传输索引的情况下,具有相同长度的码字可以分配给所有索引。
参考图15,方法1可以将2位固定长度码分配给索引。方法2可以将3位固定长度码分配给索引。方法3可以将4位固定长度码分配给索引。每种方法都没有充分地使用相应比特可用的码字。方法1不使用码字11。方法2不使用码字111。方法3不使用码字1001、1010、1011、1100、1101、1110和1111。相应地,编解码效率可以降低。然而,本发明不限于这些实施方案。可以任意地确定利用固定长度码将码字映射到索引的方法。
图16是示出根据本发明实施方案的将分阶段码分配到加权值的索引的方法的示意图。为了解决图15中较低的编解码效率的问题,可以利用分阶段码将码字分配给索引。
参考图16,当使用分阶段码时,即使在使用固定长度码时,也可以将码分配给索引而不浪费码字。虽然分阶段码是固定长度码,仍可以使用不同长度的码。相应地,短码字可以分配给具有高出现频率的索引,并且长码字可以被分配给具有低出现频率的索引。由于没有浪费码字,所以可以提高编解码效率。然而,本发明不限于这些实施方案。可以任意地确定利用分阶段码将码字映射到索引的方法。
图17是示出根据本发明实施方案的将可变长度码分配到加权值的索引的方法的示意图。将可变长度码分配给加权值的索引的方法可以对应于将不同长度的码字分配给索引的方法。短码字可以分配给具有高出现频率的索引,并且长码字可以分配给具有低出现频率的索引。相应地,可以提高编解码效率。基于离线训练,可以检查每个索引的出现频率。
参考图17,可以利用截断莱斯(truncated rice,TR)码来分配码字。方法1可以利用cMAX=2和cRiceParam=0的TR码来生成码字。方法2可以利用cMAX=6和cRiceParam=0的TR码来生成码字。方法3可以利用cMAX=8和cRiceParam=0的TR码来生成码字。生成的码字可以按顺序分配给索引。然而,本发明不限于这些实施方案。可以利用TR码以外的任何码将可变长度码分配给索引。基于离线训练,可以将较小的索引分配给具有高出现频率的加权值,并且可以将较大的索引分配给具有低出现频率的加权值。因此,短码字可以分配给具有高出现频率的加权值,并且长码字可以分配给具有低出现频率的加权值。相应地,可以提高编解码效率。
图18a和图18b是示出根据本发明实施方案的帧间预测的误差分布和帧内预测的误差分布的示意图。
参考图18a,帧间预测的误差分布可以根据水平/竖直坐标值出现。在帧间预测,可以基于当前块的中心来使用运动矢量。相应地,帧间预测中的误差可能随着远离当前块的中心增大而增加。
参考图18b,帧内预测的误差分布可以根据水平/竖直坐标值出现。在帧内预测,在预测期间使用的参考块可以在当前块的左上方。相应地,帧内预测中的误差可以从左上方到右下方增加。
图19a和图19b是示出根据本发明实施方案的8×8块的帧内预测的加权值和8×8块的帧间预测的加权值的示意图。在帧内预测,在预测期间使用的参考块可以在当前块的左上方。相应地,在当前块的左上方区域,可以将较大的加权值分配给帧内预测信号,并且在当前块的右下方区域,可以将较大的加权值分配给帧间预测信号。
参考图19a,在8×8块的左上方区域,可以将较大的加权值分配给帧内预测信号,并且在右下方区域,可以将较小的加权值分配给帧内预测信号。
参考图19b,在8×8块的右下方区域,可以将较大的加权值分配给帧内预测信号,并且在左上方区域,可以将较小的加权值分配给帧内预测信号。然而,本发明不限于这些实施方案。块的大小和形状可以对应于一定的大小和形状。分配的加权值可以对应于某个加权值。
图19c和图19d是示出根据本发明另一个实施方案的8×8块的帧内预测的加权值的示意图。在帧内预测,在预测期间使用的参考块可以存在于当前块的顶部和左侧。相应地,在靠近当前块的顶部参考块和左侧参考块的区域,可以将较大的加权值分配给帧内预测信号。
参考图19c,在8×8大小块的顶部区域,可以将较大的加权值分配给帧内预测信号,而在底部区域,可以将较小的加权值分配给帧内预测信号。
参考图19d,在8×8块的左侧区域,可以将较大的加权值分配给帧内预测信号,并且在右侧区域,可以将较小的加权值分配给帧内预测信号。然而,本发明不限于这些实施方案。块的大小和形状可以对应于一定的大小和形状。分配的加权值可以对应于某个加权值。
图20是示出根据本发明实施方案的视频解码过程的示意图。
参考图20,解码装置可以基于与当前块相对应并且存在于参考图像中的参考块来生成当前块的帧间预测块(S2010)。此外,解码装置可以基于参考块和与参考块邻近的第一参考像素来生成当前块的帧内预测块(S2020)。生成当前块的帧内预测块可以包括:基于与参考块邻近的第一参考像素来生成第一帧内预测块;基于参考块和第一帧内预测块的失真来推导帧内预测模式;以及基于帧内预测模式和与当前块邻近的第二参考像素来生成帧内预测块。
此外,解码装置可以基于不使用当前块进行失真计算来推导分配给帧间预测块和帧内预测块的加权值(S2030)。可以基于与当前块邻近的相邻块是否是帧内预测编码的和帧间预测编码的来推导加权值。推导分配给帧间预测块和帧内预测块的加权值可以包括:推导帧间预测信号的失真;推导帧内预测信号的失真;以及基于帧间预测信号的失真和帧内预测信号的失真来推导加权值。可以基于与当前块邻近的第二参考像素和与参考块邻近的第一参考像素之间的差来推导帧间预测信号的失真。
推导帧内预测信号的失真可以包括:基于帧内预测模式和与参考块邻近的第一参考像素来生成第二帧内预测块;以及基于第二帧内预测块的失真和参考块来推导帧内预测信号的失真。推导帧内预测信号的失真可以包括:基于帧内预测模式和与当前块邻近的第二参考像素来生成第三帧内预测块,以及基于参考块和第三帧内预测块来推导帧内预测信号的失真。推导帧内预测信号的失真可以包括:基于平面模式和与当前块邻近的第二参考像素来生成第四帧内预测块,以及基于参考块和第四帧内预测块的失真来推导帧内预测信号的失真。解码装置可以基于利用当前块进行失真计算来获得分配给帧间预测块和帧内预测块的加权值。可以基于加权值映射到的索引信息来获得相应的加权值。可以基于帧内预测的误差分布和帧间预测的误差分布的至少一个来推导加权值。此外,解码装置可以基于加权值、帧间预测块和帧内预测块来生成当前块的CIIP预测块(S2040)。
图21是示出根据本发明实施方案的视频编码过程的示意图。
参考图21,编码装置可以基于与当前块相对应并且存在于参考图像中的参考块来生成当前块的帧间预测块(S2110)。此外,编码装置可以基于参考块和与参考块邻近的第一参考像素来生成当前块的帧内预测块(S2120)。生成当前块的帧内预测块可以包括:基于与参考块邻近的第一参考像素来生成第一帧内预测块,基于参考块和第一帧内预测块的失真来推导帧内预测模式,以及基于帧内预测模式和与当前块邻近的第二参考像素来生成帧内预测块。
此外,编码装置可以基于不使用当前块进行失真计算来确定分配给帧间预测块和帧内预测块的加权值(S2130)。可以基于与当前块邻近的相邻块是否是帧内预测编码的和帧间预测编码的来确定加权值。确定分配给帧间预测块和帧内预测块的加权值可以包括:确定帧间预测信号的失真;确定帧内预测信号的失真;以及基于帧间预测信号的失真和帧内预测信号的失真来确定加权值。可以基于与当前块邻近的第二参考像素和与参考块邻近的第一参考像素之间的差来确定帧间预测信号的失真。
确定帧内预测信号的失真可以包括:基于帧内预测模式和与参考块邻近的第一参考像素来生成第二帧内预测块,以及基于参考块和第二帧内预测块的失真来确定帧内预测信号的失真。确定帧内预测信号的失真可以包括:基于帧内预测模式和与当前块邻近的第二参考像素来生成第三帧内预测块,以及基于参考块和第三帧内预测块来确定帧内预测信号的失真。确定帧内预测信号的失真可以包括:基于平面模式和与当前块邻近的第二参考像素来生成第四帧内预测块,以及基于参考块和第四帧内预测块来确定帧内预测信号的失真。
可以基于当前块与参考块之间的差来确定帧间预测信号的失真。确定帧内预测信号的失真可以包括:基于帧内预测模式和与当前块邻近的第二参考像素来生成第三帧内预测块,以及基于当前块和第三帧内预测块来确定帧内预测信号的失真。确定帧内预测信号的失真可以包括:基于平面模式和与当前块邻近的第二参考像素来生成第四帧内预测块,以及基于当前块和第四帧内预测块来确定帧内预测信号的失真。可以包括对加权值映射到的索引信息进行编码。此外,编码装置可以基于加权值、帧间预测块和帧内预测块来生成当前块的CIIP预测块(S2140)。
尽管描述了顺序执行的各个流程图中的步骤,但这些步骤仅仅例示了本发明的一些实施方案的技术思想。因此,本发明所属领域的普通技术人员可以通过改变在各个附图中描述的顺序或通过并行地执行两个或更多个步骤来执行步骤。因此,各个流程图中的步骤不限于所示的按发生时间排列的顺序。
应当理解,上述描述呈现了可以以各种其他方式实现的说明性实施方案。在一些实施方案中描述的功能可以通过硬件、软件、固件和/或它们的组合来实现。还应当理解,本说明书中描述的功能组件标记为“……单元”,以突出强调它们独立实现的可能性。
另一方面,在一些实施方案中描述的各种方法或功能可以实现为存储在非易失性记录介质中的指令,所述指令可以由一个或更多个处理器读取和执行。非易失性记录介质可以包括例如以计算机系统可读取的形式存储数据的各种类型的记录装置。例如,非易失性记录介质可以包括存储介质,例如可擦除可编程只读存储器(EPROM)、闪存驱动器、光盘驱动器、磁性硬盘驱动器和固态驱动器(SSD)等等。
尽管出于说明的目的描述了本发明的示例性实施方案,但是本发明所属领域的普通技术人员应当理解,在不脱离本发明的思想和范围的情况下,可以进行各种修改、添加和替换。因此,出于简洁和清楚起见描述了本发明的实施方案。本发明的实施方案的技术思想的范围不受例示的限制。相应地,本发明所属领域的普通技术人员应当理解,本发明的范围不受上述明确描述的实施方案的限制,而是受权利要求及其等同形式的限制。
相关申请的交叉引用
本申请要求2021年7月2日提交的韩国专利申请No.10-2021-0086881以及2022年6月28日提交的韩国专利申请No.10-2022-0079202的优先权,其全部内容通过引用结合于本文中。
Claims (21)
1.一种视频解码方法,包括:
基于与当前块相对应并存在于参考图像中的参考块,生成当前块的帧间预测块;
基于参考块和与参考块邻近的第一参考像素,生成当前块的帧内预测块;
基于不使用当前块进行失真计算,推导分配给帧间预测块和帧内预测块的加权值;以及
基于加权值、帧间预测块和帧内预测块,生成当前块的组合的帧间/帧内预测(CIIP)块。
2.根据权利要求1所述的视频解码方法,其中,
生成当前块的帧内预测块包括:
基于与参考块邻近的第一参考像素,生成第一帧内预测块;
基于第一帧内预测块的失真和参考块,推导帧内预测模式;以及
基于帧内预测模式和与当前块邻近的第二参考像素,生成帧内预测块。
3.根据权利要求1所述的视频解码方法,其中,
基于与当前块邻近的相邻块是否是帧内预测编码的和帧间预测编码的来推导加权值。
4.根据权利要求2所述的视频解码方法,其中,
推导分配给帧间预测块和帧内预测块的加权值包括:
推导帧间预测信号的失真;
推导帧内预测信号的失真;以及
基于帧间预测信号的失真和帧内预测信号的失真,推导加权值。
5.根据权利要求4所述的视频解码方法,其中,
基于与当前块邻近的第二参考像素和与参考块邻近的第一参考像素之间的差来推导帧间预测信号的失真。
6.根据权利要求4所述的视频解码方法,其中,
推导帧内预测信号的失真包括:
基于帧内预测模式和与参考块邻近的第一参考像素,生成第二帧内预测块;以及
基于第二帧内预测块的失真和参考块,推导帧内预测信号的失真。
7.根据权利要求4所述的视频解码方法,其中,
推导帧内预测信号的失真包括:
基于帧内预测模式和与当前块邻近的第二参考像素,生成第三帧内预测块;以及
基于第三帧内预测块的失真和参考块,推导帧内预测信号的失真。
8.根据权利要求4所述的视频解码方法,其中,
推导帧内预测信号的失真包括:
基于平面模式和与当前块邻近的第二参考像素,生成第四帧内预测块;以及
基于第四帧内预测块的失真和参考块,推导帧内预测信号的失真。
9.根据权利要求1所述的视频解码方法,进一步包括:
基于在失真计算中利用当前块,获得分配给帧间预测块和帧内预测块的加权值;以及
基于加权值、帧间预测块和帧内预测块,生成当前块的CIIP预测块,
其中,基于加权值映射到的索引信息来获得加权值。
10.根据权利要求2所述的视频解码方法,其中,
基于帧内预测的误差分布和帧间预测的误差分布的至少一个来推导加权值。
11.一种视频编码方法,包括:
基于与当前块相对应并存在于参考图像中的参考块,生成当前块的帧间预测块;
基于参考块和与参考块邻近的第一参考像素,生成当前块的帧内预测块;
确定分配给帧间预测块和帧内预测块的加权值;以及
基于加权值、帧间预测块和帧内预测块,生成当前块的组合的帧间/帧内预测(CIIP)块。
12.据权利要求11所述的视频编码方法,其中,
生成当前块的帧内预测块包括:
基于与参考块邻近的第一参考像素,生成第一帧内预测块;
基于第一帧内预测块的失真和参考块,确定帧内预测模式;以及
基于帧内预测模式和与当前块邻近的第二参考像素,生成帧内预测块。
13.根据权利要求11所述的视频编码方法,其中,
基于与当前块邻近的相邻块是否是帧内预测编码的和帧间预测编码的来确定加权值。
14.根据权利要求12所述的视频编码方法,其中,
确定分配给帧间预测块和帧内预测块的加权值包括:
确定帧间预测信号的失真;
确定帧内预测信号的失真;以及
基于帧间预测信号的失真和帧内预测信号的失真,确定加权值。
15.根据权利要求14所述的视频编码方法,其中,
基于与当前块邻近的第二参考像素和与参考块邻近的第一参考像素之间的差来确定帧间预测信号的失真,
其中,确定帧内预测信号的失真包括:
基于帧内预测模式和与参考块邻近的第一参考像素,生成第二帧内预测块;以及
基于第二帧内预测块的失真和参考块,确定帧内预测信号的失真。
16.根据权利要求14所述的视频编码方法,其中,
确定帧内预测信号的失真包括:
基于帧内预测模式和与当前块邻近的第二参考像素,生成第三帧内预测块;以及
基于第三帧内预测块的失真和参考块,确定帧内预测信号的失真。
17.根据权利要求14所述的视频编码方法,其中,
确定帧内预测信号的失真包括:
基于平面模式和与当前块邻近的第二参考像素,生成第四帧内预测块;以及
基于第四帧内预测块的失真和参考块,确定帧内预测信号的失真。
18.根据权利要求14所述的视频编码方法,其中,
基于当前块与参考块之间的差来确定帧间预测信号的失真,以及
确定帧内预测信号的失真包括:
基于帧内预测模式和与当前块邻近的第二参考像素,生成第三帧内预测块;以及
基于第三帧内预测块的失真和当前块,确定帧内预测信号的失真。
19.根据权利要求14所述的视频编码方法,其中
确定帧内预测信号的失真包括:
基于平面模式和与当前块邻近的第二参考像素,生成第四帧内预测块;以及
基于第四帧内预测块的失真和当前块,确定帧内预测信号的失真。
20.根据权利要求18所述的视频编码方法,进一步包括:
对加权值映射到的索引信息进行编码。
21.一种计算机可读记录介质,其存储由视频编码方法生成的比特流,其中,所述视频编码方法包括:
基于与当前块相对应并存在于参考图像中的参考块,生成当前块的帧间预测块;
基于参考块和与参考块邻近的第一参考像素,生成当前块的帧内预测块;
确定分配给帧间预测块和帧内预测块的加权值;以及
基于加权值、帧间预测块和帧内预测块,生成当前块的组合的帧间/帧内预测(CIIP)块。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0086881 | 2021-07-02 | ||
KR1020220079202A KR20230006396A (ko) | 2021-07-02 | 2022-06-28 | 비디오 부호화/복호화 방법 및 장치 |
KR10-2022-0079202 | 2022-06-28 | ||
PCT/KR2022/009403 WO2023277603A1 (ko) | 2021-07-02 | 2022-06-30 | 비디오 부호화/복호화 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117581535A true CN117581535A (zh) | 2024-02-20 |
Family
ID=89890503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280046444.1A Pending CN117581535A (zh) | 2021-07-02 | 2022-06-30 | 用于编码/解码视频的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117581535A (zh) |
-
2022
- 2022-06-30 CN CN202280046444.1A patent/CN117581535A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113812147B (zh) | 使用块内复制的图像编码和解码 | |
US20240214556A1 (en) | Video encoding/decoding method and apparatus | |
US20240015308A1 (en) | Apparatus and method for video encoding and decoding | |
CN116472709A (zh) | 用于视频编码和解码的装置和方法 | |
CN117597924A (zh) | 利用改进的交叉分量线性模型预测的视频编解码方法和装置 | |
CN116941241A (zh) | 利用基于矩阵的交叉分量预测的视频编解码方法和装置 | |
CN117581535A (zh) | 用于编码/解码视频的方法和装置 | |
US20230283768A1 (en) | Method for predicting quantization parameter used in a video encoding/decoding apparatus | |
US20240137528A1 (en) | Video encoding/decoding method and apparatus | |
US20240259570A1 (en) | Method and apparatus for video encoding/decoding using a geometric partitioning mode | |
US20240114131A1 (en) | Video encoding/decoding method and apparatus | |
US20230421753A1 (en) | Method and apparatus for video coding based on mapping | |
US20240179303A1 (en) | Video encoding/decoding method and apparatus | |
US20230388494A1 (en) | Method for generating prediction block by using weighted-sum of intra prediction signal and inter prediction signal, and device using same | |
CN117917072A (zh) | 视频编码/解码方法和装置 | |
CN118056399A (zh) | 利用几何分区模式的视频编码/解码的方法和装置 | |
CN118339835A (zh) | 在多变换选择中调整多变换选择候选的数量的视频编码/解码方法和装置 | |
CN117581534A (zh) | 视频编码/解码方法和装置 | |
CN117917073A (zh) | 视频编码/解码方法和装置 | |
CN118160304A (zh) | 使用各种块划分结构的视频编码方法和设备 | |
CN118339833A (zh) | 利用双向帧内预测模式的视频编码/解码方法和装置 | |
CN118451706A (zh) | 用于色度分量的基于模板的帧内模式推导的方法 | |
CN117044200A (zh) | 利用螺旋扫描顺序的视频编解码的方法和装置 | |
CN118489244A (zh) | 利用改进的amvp-merge模式的视频编解码的方法和装置 | |
CN118044185A (zh) | 将利用运动矢量差的合并模式应用于组合的帧间/帧内预测模式或几何分区模式的视频编码/解码方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |