CN114503577B - 视频比特流中子图片信令通知的语法 - Google Patents

视频比特流中子图片信令通知的语法 Download PDF

Info

Publication number
CN114503577B
CN114503577B CN202080069970.0A CN202080069970A CN114503577B CN 114503577 B CN114503577 B CN 114503577B CN 202080069970 A CN202080069970 A CN 202080069970A CN 114503577 B CN114503577 B CN 114503577B
Authority
CN
China
Prior art keywords
picture
sub
syntax element
video
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080069970.0A
Other languages
English (en)
Other versions
CN114503577A (zh
Inventor
张凯
邓智玭
刘鸿彬
张莉
许继征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Original Assignee
Beijing ByteDance Network Technology Co Ltd
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd, ByteDance Inc filed Critical Beijing ByteDance Network Technology Co Ltd
Priority claimed from PCT/CN2020/119932 external-priority patent/WO2021063421A1/en
Publication of CN114503577A publication Critical patent/CN114503577A/zh
Application granted granted Critical
Publication of CN114503577B publication Critical patent/CN114503577B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种视频处理的示例方法,包括:执行在包括一个或多个子图片的视频的图片和视频的比特流表示之间的转换。比特流表示符合格式规则,该格式规则基于以下中的至少一个来指定关于子图片的信息被包括在比特流表示中:(1)子图片的一个或多个角位置,或(2)子图片的维度。该格式规则还指定,在关于比特流表示中的编解码树块的信息之后定位关于子图片的信息。

Description

视频比特流中子图片信令通知的语法
相关申请的交叉引用
根据适用的专利法和/或巴黎公约的规定,提出本申请是为了及时要求2019年10月2日提交的国际专利申请No.PCT/CN2019/109809的优先权和权益。出于法律的所有目的,上述申请的全部公开内容通过引用并入为本申请的部分公开内容。
技术领域
本文档涉及视频和图像编码和解码技术。
背景技术
数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连接的用户设备的数目增加,预计对数字视频使用的带宽需求将继续增长。
发明内容
所公开的技术可以由视频或图像解码器或编码器实施例使用,在其中执行基于子图片的编码或解码。
在一个示例方面,公开了一种视频处理的方法。该方法包括:执行在包括一个或多个图片的视频和视频的比特流表示之间的转换。比特流表示要求符合格式规则,该格式规则指定将每个图片编解码为一个或多个条带,并且其中,格式规则禁止图片中的样点被一个或多个条带中的任何一个覆盖。
在另一示例方面,公开了一种视频处理的方法。该方法包括:对于在视频的图片和视频的比特流表示之间的转换,根据与图片中的片的数目或砖的数目相关联的规则,确定信令通知图片中的一个或多个条带的信息的方式。该方法还包括基于确定来执行转换。
在另一示例方面,公开了一种视频处理的方法。该方法包括:根据规则,执行在视频的图片和视频的比特流表示之间的转换。在比特流表示中图片被编解码为一个或多个条带,并且规则指定在比特流表示中是否或如何包括图片的条带的地址。
在另一示例方面,公开了一种视频处理的方法。该方法包括:对于在视频的图片和视频的比特流表示之间的转换,基于图片中片的数目或砖的数目,确定比特流表示中是否包括语法元素,该语法元素指示启用访问图片中多个砖上的样点的滤波操作。该方法还包括基于确定来执行转换。
在另一示例方面,公开了一种视频处理的方法。该方法包括在视频的图片和视频的比特流表示之间执行转换,其中图片包括一个或多个子图片,并且其中一个或多个子图片的数量由语法元素指示为比特流表示。
在另一示例方面,公开了一种视频处理的方法。该方法包括:执行在包括一个或多个子图片的视频的图片和视频的比特流表示之间的转换。比特流表示符合格式规则,该格式规则基于以下中的至少一个来指定关于子图片的信息被包括在比特流表示中:(1)子图片的一个或多个角位置,或(2)子图片的维度。
在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的图片和视频的比特流表示之间的转换,由于图片被分为一个或多个子图片,确定启用参考图片重采样工具。该方法还包括基于确定来执行转换。
在另一示例方面,公开了一种视频处理的方法。该方法包括:执行在包括视频图片的视频和视频的比特流表示之间的转换,该视频图片包括一个或多个子图片,该子图片包括一个或多个条带。比特流表示符合格式规则,该格式规则指定对于子图片和条带,如果在条带的头中包括标识子图片的索引,则条带的地址字段指示子图片中的条带的地址。
在另一示例方面,公开了一种视频处理的方法。该方法包括:对于视频的第一视频区域中的视频块,确定对于使用仿射模式在视频块和当前视频块的比特流表示之间的转换确定时域运动矢量预测器的位置是否在第二视频区域内;以及基于确定来执行转换。
在另一示例方面,公开了另一种视频处理方法。该方法包括:对于视频的第一视频区域中的视频块,确定对于在视频块和当前视频块的比特流表示之间的转换获取参考图片中的整数样点的位置是否在第二视频区域内,其中在转换期间,参考图片不用于插值过程;以及基于确定来执行转换。
在另一示例方面,公开了另一种视频处理的方法。该方法包括:对于视频的第一视频区域中的视频块,确定对于在视频块和当前视频块的比特流表示之间的转换获取重构亮度样点值的位置是否在第二视频区域内;以及基于确定来执行转换。
在另一示例方面,公开了另一种视频处理的方法。该方法包括:对于视频的第一视频区域中的视频块,确定在视频块和当前视频块的比特流表示之间的转换期间执行的关于对于视频块的划分、深度导出或划分标志信令通知的检查的位置是否在第二视频区域内;以及基于确定来执行转换。
在另一示例方面,公开了另一种视频处理的方法。该方法包括:执行在包括一个或多个视频图片的视频和视频的编解码表示之间的转换,视频图片包括一个或多个视频块,其中编解码表示遵守编解码语法要求,即转换在视频单元内不使用子图片编码/解码和动态分辨率转换编码/解码工具或参考图片重采样工具。
在另一示例方面,公开了另一种视频处理的方法。该方法包括:执行在包括一个或多个视频图片的视频和视频的编解码表示之间的转换,视频图片包括一个或多个视频块,其中编解码表示遵守编解码语法要求,即第一语法元素subpic_grid_idx[i][j]不大于第二语法元素max_subpics_minus1。
在又一示例方面,上述方法可以由包括处理器的视频编码器装置实现。
在又一示例方面,上述方法可以由包括处理器的视频解码器装置实现。
在又一示例方面,这些方法可以以处理器可执行指令的形式实施并储存在计算机可读程序介质上。
本文档中进一步描述的这些和其他方面。
附图说明
图1示出了时域运动矢量预测(TMVP)和子块TMVP中的区域约束的示例。
图2示出了分层运动估计方案的示例。
图3是用于实现本文档中描述的技术的硬件平台的示例的框图。
图4是用于视频处理的示例方法的流程图。
图5示出了具有18乘12个亮度CTU的图片的示例,该图片被分割为12个片和3个栅格扫描条带(信息性)。
图6示出了具有18乘12个亮度CTU的图片的示例,该图片被分割为24个片和9个矩形条带(信息性)。
图7示出了图片的示例,该图片被分割为4个片、11个砖和4个矩形条带(信息性)。
图8是示出可在其中实现本文所公开的各种技术的示例视频处理系统的框图。
图9是图示示例视频编解码系统的框图。
图10是图示根据本公开的一些实施例的编码器的框图。
图11是图示根据本公开的一些实施例的解码器的框图。
图12是根据本技术的用于视频处理的方法的流程表示。
图13是根据本技术的用于视频处理的另一种方法的流程表示。
图14是根据本技术的用于视频处理的另一种方法的流程表示。
图15是根据本技术的用于视频处理的另一种方法的流程表示。
图16是根据本技术的用于视频处理的另一种方法的流程表示。
图17是根据本技术的用于视频处理的另一种方法的流程表示。
图18是根据本技术的用于视频处理的另一种方法的流程表示。
图19是根据本技术的用于视频处理的又一种方法的流程表示。
具体实施方式
本文档提供了可以由图像或视频比特流的解码器使用的各种技术,以提高解压缩或解码的数字视频或图像的质量。为了简洁起见,术语“视频”在本文中用于包括图片序列(传统上称为视频)和各个图像。此外,视频编码器还可在编码过程期间实现这些技术,以便重构用于进一步编码的解码帧。
在本文档中使用章节标题是为了易于理解,并且不将实施例和技术限于对应的章节。这样,一个章节的实施例可以与其他章节的实施例组合。
1.概要
该文档与视频编解码技术有关。具体地,它涉及在视频编解码中采用基于基色的表示的调色板编解码。它可以应用于现有的视频编解码标准(例如HEVC)或要最终确定的标准(通用视频编解码)。它也可能适用于将来的视频编解码标准或视频编解码器。
2.初步讨论
视频编解码标准主要通过公知的ITU-T和ISO/IEC标准的发展而演进。ITU-T制作了H.261和H.263,ISO/IEC制作了MPEG-1和MPEG-4 Visual,这两个组织联合制作了H.262/MPEG-2视频和H.264/MPEG-4高级视频编解码(AVC)和H.265/HEVC标准[1,2]。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用了时域预测加变换编解码。为了探索HEVC以外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索小组(JVET)。此后,JVET采纳了许多新方法并将其引入到名为“联合探索模型”(JEM)的参考软件中。2018年4月,VCEG(Q6/16)和ISO/IEC JTC1SC29/WG11(MPEG)之间的联合视频专家团队(JVET)创建,致力于VVC标准,目标是与HEVC相比降低50%的比特率。
2.1 VVC中的TMVP和子块TMVP中的区域约束
图1图示了TMVP和子块TMVP中的示例区域约束。在TMVP和子块TMVP中,如图1所示,约束时域MV只能从并置的CTU加4×4块的列中获取。
2.2示示例图片
在一些实施例中,可以实现基于灵活分片方法的基于子图片的编解码技术。基于子图片的编解码技术的概要包括以下:
(1)图片可以被分为子图片。
(2)在SPS中指示子图片存在的指示以及子图片的其他序列级信息。
(3)可以通过比特流来控制在解码过程(不包括环路滤波操作)中是否将子图片视为图片。
(4)可以通过每个子图片的比特流来控制是否禁用跨子图片边界的环路滤波。更新了DBF、SAO和ALF过程以控制跨子图片边界的环路滤波操作。
(5)为了简单起见,在SPS中以亮度样点为单位信令通知子图片的宽度、高度、水平偏移和垂直偏移。子图片边界被约束为条带边界。
(6)通过略微更新coding_tree_unit()语法来指定在解码过程(不包括环路滤波操作)中将子图片视为图片,并更新至以下解码过程:
-用于(高级)时域亮度运动矢量预测的导出过程
-亮度样点双线性插值过程
-亮度样点8抽头插值滤波过程
-色度样点插值过程
(7)子图片ID在SPS中被明确地指定,并且被包括在片组头中,以使得能够在无需改变VCL NAL单元的情况下提取子图片序列。
(8)提出输出子图片集合(OSPS)以指定子图片及其集合的标准提取和一致性点。
2.3通用视频编解码中的示示例图片
序列参数集RBSP语法
subpics_present_flag等于1指示在SPS RBSP语法中当前存在子图片参数。subpics_present_flag等于0指示在SPS RBSP语法中当前不存在子图片参数。
注2–当比特流是子比特流提取过程的结果并且仅包含子比特流提取过程的输入比特流的子图片的子集时,可能需要在SPS的RBSP中将subpics_present_flag的值设置为等于为1。
max_subpics_minus1加1指定CVS中可能存在的最大子图片数目。max_subpics_minus1应在0到254的范围内。255的值保留给ITU-T|ISO/IEC供将来使用。
subpic_grid_col_width_minus1加1指定以4个样点为单位的子图片标识符网格的每个元素的宽度。语法元素的长度为Ceil(Log2(pic_width_max_in_luma_samples/4))比特。
变量NumSubPicGridCols导出如下:
subpic_grid_row_height_minus1加1指定以4个样点为单位的子图片标识符网格中每个元素的高度。语法元素的长度为Ceil(Log2(pic_height_max_in_luma_samples/4))比特。
变量NumSubPicGridRows导出如下:
NumSubPicGridRows=(pic_height_max_in_luma_samples+subpic_grid_row_height_minus1*4+3)/(subpic_grid_row_height_minus1*4+4) (7-6)
subpic_grid_idx[i][j]指定网格位置(i,j)的子图片索引。语法元素的长度为Ceil(Log2(max_subpics_minus1+1))比特。
变量SubPicTop[subpic_grid_idx[i][j]]、SubPicLeft[subpic_grid_idx[i][j]]、SubPicWidth[subpic_grid_idx[i][j]]、SubPicHeight[subpic_grid_idx[i][j]]和NumSubPics导出如下:
subpic_treated_as_pic_flag[i]等于1指定将CVS中每个编解码图片的第i个子图片在不包括环路滤波操作的解码过程中视为图片。subpic_treated_as_pic_flag[i]等于0指定CVS中每个编解码图片的第i个子图片在不包括环路滤波操作的解码过程中不视为图片。当不存在时,将subpic_aged_as_pic_flag[i]的值推断为等于0。
loop_filter_across_subpic_enabled_flag[i]等于1指定可以在CVS中每个编解码图片中的第i个子图片的边界上执行环路滤波操作。
loop_filter_cross_subic_enabled_flag[i]等于0指定在CVS中每个编解码图片的第i个子图片的边界上不执行环路滤波操作。当不存在时,loop_filter_across_subpic_enabled_pic_flag[i]的值推断为等于1。
比特流一致性要求应用以下约束:
-对于任何两个子图片subpicA和subpicB,当subpicA的索引小于subpicB的索引时,subPicA的任何编解码NAL单元将在解码顺序上应接续subPicB的任何编解码NAL单元。
-子图片的形状应使得每个子图片在解码时,其整个左边界和整个顶边界由图片边界构成,或者由先前解码的子图片的边界构成。
对于从0到PicSizeInCtbsY-1范围(含端值)的ctbAddrRs,列表CtbToSubPicIdx[ctbAddrRs]指定从图片栅格扫描中的CTB地址到子图片索引的转换,导出如下:
num_bricks_in_slice_minus1(当存在时)指定条带中的砖(brick)的数目减1。num_bricks_in_slice_minus1的值应该在0到NumBricksInPic-1范围(含端值)内。当rect_slice_flag等于0且single_brick_per_slice_flag等于1时,num_bricks_in_slice_minus1的值推断为等于0。当single_brick_per_slice_flag等于1时,num_bricks_in_slice_minus1的值推断为等于0。
指定当前条带中的砖的数目的变量NumBricksInCurrSlice和指定当前条带中第i个砖的砖索引的SliceBrickIdx[i]导出如下:
变量SubPicIdx、SubPicLeftBoundaryPos、SubPicTopBoundaryPos、SubPicRightBoundaryPos和SubPicBotBoundaryPos导出如下:
时域亮度运动矢量预测的导出过程
此过程的输入是:
-与当前图片的左顶亮度样点相对的当前亮度编解码块的左顶样点的亮度位置(xCb,yCb),
-变量cbWidth,指定亮度样点中当前编解码块的宽度,
-变量cbHeight,指定亮度样点中当前编解码块的高度,
-参考索引refIdxLX,其中X为0或1。
此过程的输出是:
-1/16分数样点准确度的运动矢量预测mvLXCol,
-可用性标志availableFlagLXCol。
变量currCb指定在亮度位置(xCb,yCb)处的当前亮度编解码块。
变量mvLXCol和availableFlagLXCol导出如下:
-如果slice_temporal_mvp_enabled_flag等于0或(cbWidth*cbHeight)小于或等于32,则mvLXCol的两个分量均设置为等于0,且availableFlagLXCol设置为等于0。
-否则(slice_temporal_mvp_enabled_flag等于1),将应用以下有序步骤:
1.右底并置运动矢量以及底部和右部边界样点位置导出如下:
xColBr=xCb+cbWidth (8-421)
yColBr=yCb+cbHeight (8-422)
rightBoundaryPos=subpic_treated_as_pic_flag[SubPicIdx]?SubPicRightBoundaryPos:pic_width_in_luma_samples-1 (8-423)
botBoundaryPos=subpic_treated_as_pic_flag[SubPicIdx]?SubPicBotBoundaryPos:pic_height_in_luma_samples-1 (8-424)
-如果yCb>>CtbLog2SizeY等于yColBr>>CtbLog2SizeY,yColBr小于或等于botBoundaryPos,且xColBr小于或等于rightBoundaryPos,则应用以下:
-变量colCb指定亮度编解码块,该亮度编解码块覆盖由ColPic指定的并置图片内的由((xColBr>>3)<<3,(yColBr>>3)<<3)给出的修改位置。
-亮度位置(xColCb,yColCb)设置为等于与由ColPic指定的并置图片的左顶亮度样点相对的由colCb指定的并置亮度编解码块的左顶样点。
-调用条款8.5.2.12中指定的并置运动矢量的导出过程,其中currCb、colCb、(xColCb,yColCb)、refIdxLX和sbFlag设置为等于0作为输入,输出分配给mvLXCol和availableFlagLXCol。
否则,mvLXCol的两个分量均设置为等于0,且availableFlagLXCol设置为等于0。
亮度样点双线性插值过程
此过程的输入是:
-以全样点为单位的亮度位置(xIntL,yIntL),
-以分数样点为单位的亮度位置(xFracL,yFracL),
-亮度参考样点阵列refPicLXL
此过程的输出是预测的亮度样点值predSampleLXL
变量shift1、shift2、shift3、shift4、offset1、offset2和offset3导出如下:
shift1=BitDepthY-6 (8-453)
offset1=1<<(shift1-1) (8-454)
shift2=4 (8-455)
offset2=1<<(shift2-1) (8-456)
shift3=10-BitDepthY (8-457)
shift4=BitDepthY-10 (8-458)
offset4=1<<(shift4-1) (8-459)
变量picW设置为等于pic_width_in_luma_samples,且变量picH设置为等于pic_height_in_luma_samples。
表8-10中指定了p等于xFracL或yFracL的每个1/16分数样点位置的亮度插值滤波器系数fbL[p]。
对于i=0..1,以全样点为单位的亮度位置(xInti,yInti)导出如下:
-如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应用以下:
xInti=Clip3(SubPicLeftBoundaryPos,SubPicRightBoundaryPos,xIntL+i)(8-460)
yInti=Clip3(SubPicTopBoundaryPos,SubPicBotBoundaryPos,yIntL+i) (8-461)
-否则(subpic_aged_as_pic_flag[SubPicIdx]等于0),应用以下:
yInti=Clip3(0,picH-1,yIntL+i) (8-463)
基于子块的时域Merge候选的导出过程
此过程的输入是:
-与当前图片的左顶亮度样点相对的当前亮度编解码块的左顶样点的亮度位置(xCb,yCb),
-变量cbWidth,指定亮度样点中当前编解码块的宽度,
-变量cbHeight,指定亮度样点中当前编解码块的高度。
-邻域编解码单元的可用性标志availableFlagA1
-邻域编解码单元的参考索引refIdxLXA1,其中X为0或1,
-邻域编解码单元的预测列表利用标志predFlagLXA1,其中X为0或1,
-邻域编解码单元的1/16分数样点准确度的运动矢量mvLXA1,其中X为0或1。
此过程的输出是:
-可用性标志availableFlagSbCol,
-水平方向numSbX和垂直方向numSbY上的亮度编解码子块的数目,
-参考索引refIdxL0SbCol和refIdxL1SbCol,
-1/16分数样点准确度的亮度运动矢量mvL0SbCol[xSbIdx][ySbIdx]和mvL1SbCol[xSbIdx][ySbIdx],其中xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1,
-预测列表利用标志predFlagL0SbCol[xSbIdx][ySbIdx]和predFlagL1SbCol[xSbIdx][ySbIdx],其中xSbIdx=0..numSbX-1,ySbIdx=0..numSbY-1。
可用性标志availableFlagSbCol导出如下。
-如果以下条件中的一个或多个为真,则availableFlagSbCol设置为等于0。
-slice_temporal_mvp_enabled_flag等于0。
-sps_sbtmvp_enabled_flag等于0。
-cbWidth小于8。
-cbHeight小于8。
-否则,应用以下有序步骤:
1.包含当前编解码块的亮度编解码树块的左顶样点的位置(xCtb,yCtb)和当前亮度编解码块的右下中心样点的位置(xCtr,yCtr)导出如下:
xCtb=(xCb>>CtuLog2Size)<<CtuLog2Size (8-542)
yCtb=(yCb>>CtuLog2Size)<<CtuLog2Size (8-543)
xCtr=xCb+(cbWidth/2) (8-544)
yCtr=yCb+(cbHeight/2) (8-545)
2.亮度位置(xColCtrCb,yColCtrCb)设置为等于,与由ColPic指定的并置图片的左顶亮度样点相对的覆盖ColPic内部的由(xCtr,yCtr)给出的位置的并置亮度编解码块的左顶样点。
3.调用条款8.5.5.4中指定的基于子块的时域Merge基本运动数据的导出过程,其中,位置(xCtb,yCtb)、位置(xColCtrCb,yColCtrCb)、可用性标志availableFlagA1和预测列表利用标志predFlagLXA1和参考索引refIdxLXA1以及运动矢量mvLXA1(其中X为0和1)作为输入,并置块的运动矢量ctrMvLX和预测列表利用标志ctrPredFlagLX(其中X为0和1)以及时域运动矢量tempMv作为输出。
4.变量availableFlagSbCol导出如下:
-如果ctrPredFlagL0和ctrPredFlagL1两者均等于0,则availableFlagSbCol设置为等于0。
-否则,availableFlagSbCol设置为等于1。
当availableFlagSbCol等于1时,应用以下:
-变量numSbX、numSbY、sbWidth、sbHeight和refIdxLXSbCol导出如下:
numSbX=cbWidth>>3 (8-546)
numSbY=cbHeight>>3 (8-547)
sbWidth=cbWidth/numSbX (8-548)
sbHeight=cbHeight/numSbY (8-549)
refIdxLXSbCol=0 (8-550)
-对于xSbIdx=0..numSbX-1和ySbIdx=0..numSbY-1,运动矢量mvLXSbCol[xSbIdx][ySbIdx]和预测列表利用标志predFlagLXSbCol[xSbIdx][ySbIdx]导出如下:
-指定与当前图片的左顶亮度样点相对的当前编解码子块的左顶样点的亮度位置(xSb,ySb)导出如下:
xSb=xCb+xSbIdx*sbWidth+sbWidth/2 (8-551)
ySb=yCb+ySbIdx*sbHeight+sbHeight/2 (8-552)
-ColPic内部的并置子块的位置(xColSb,yColSb)导出如下。
-应用以下:
-如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应用以下:
-否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下:
基于子块的时域Merge基本运动数据的导出过程
此过程的输入是:
-包含当前编解码块的亮度编解码树块的左顶样点的位置(xCtb,yCtb),
-覆盖右下中心样点的并置亮度编解码块的左顶样点的位置(xColCtrCb,yColCtrCb)。
-邻域编解码单元的可用性标志availableFlagA1
-邻域编解码单元的参考索引refIdxLXA1
-邻域编解码单元的预测列表利用标志predFlagLXA1
-邻域编解码单元的1/16分数样点准确度的运动矢量mvLXA1
此过程的输出是:
-运动矢量ctrMvL0和ctrMvL1,
-预测列表利用标志ctrPredFlagL0和ctrPredFlagL1,
-时域运动矢量tempMv。
变量tempMv设置如下:
tempMv[0]=0 (8-558)
tempMv[1]=0 (8-559)
变量currPic指定当前图片。
当availableFlagA1等于真(TRUE)时,应用以下:
-如果以下所有条件均为真,则tempMv设置为等于mvL0A1
-predFlagL0A1等于1,
-DiffPicOrderCnt(ColPic,RefPicList[0][refIdxL0 A 1])等于0,
–否则,如果以下所有条件均为真,则tempMv设置为等于mvL1A1
-slice_type等于B,
-predFlagL1A1等于1,
-DiffPicOrderCnt(ColPic,RefPicList[1][refIdxL1A1])等于0。
ColPic内部的并置块的位置(xColCb,yColCb)导出如下。
-应用以下:
-如果subpic_treated_as_pic_flag[SubPicIdx]等于1,应用以下:
-否则(subpic_treated_as_pic_flag[SubPicIdx]等于0,应用以下:
亮度样点插值滤波过程
此过程的输入是:
-以全样点为单位的亮度位置(xIntL,yIntL),
-以分数样点为单位的亮度位置(xFracL,yFracL),
-以全样点为单位的亮度位置(xSbIntL,ySbIntL),指定与参考图片的左顶亮度样点相对的用于参考样点填充的界限块的左顶样点,
-亮度参考样点阵列refPicLXL
-半样点插值滤波器索引hpelIfIdx,
-变量sbWidth,指定当前子块的宽度,
-变量sbHeight,指定当前子块的高度,
-亮度位置(xSB,ySB),指定与当前图片的左顶亮度样点相对的当前子块的左顶样点,
此过程的输出是预测的亮度样点值predSampleLXL
变量shift1、shift2和shift3导出如下:
-变量shift1设置为等于Min(4,BitDepthY-8),变量shift2设置为等于6,变量shift3设置为等于Max(2,14-BitDepthY)。
-变量picW设置为等于pic_width_in_luma_samples,变量picH设置为等于pic_height_in_luma_samples。
p等于xFracL或yFracL的每个1/16分数样点位置的亮度插值滤波器系数fL[p]导出如下:
-如果MotionModelIdc[xSb][ySb]大于0,并且sbWidth和sbHeight均等于4,则亮度插值滤波器系数fL[p]在表8-12中指定。
-否则,取决于hpelIfIdx在表8-11中指定亮度插值滤波器系数fL[p]。
对于i=0..7,以全样点为单位的亮度位置(xInti,yInti)导出如下:
-如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应有以下:
xInti=Clip3(SubPicLeftBoundaryPos,SubPicRightBoundaryPos,xIntL+i-3)(8-771)
yInti=Clip3(SubPicTopBoundaryPos,SubPicBotBoundaryPos,yIntL+i-3)(8-772)
-否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下:
yInti=Clip3(0,picH-1,yIntL+i-3) (8-774)
色度样点插值过程
此过程的输入是:
-以全样点为单位的色度位置(xIntC,yIntC),
-以1/32分数样点为单位的色度位置(xFracC,yFracC),
-以全样点为单位的色度位置(xSbIntC,ySbIntC),指定与参考图片的左顶色度样点相对的用于参考样点填充的界限块的左顶样点,
-变量sbWidth,指定当前子块的宽度,
-变量sbHeight,指定当前子块的高度,
-色度参考样点阵列refPicLXC
此过程的输出是预测的色度样点值predSampleLXC
变量shift1、shift2和shift3导出如下:
-变量shift1设置为等于Min(4,BitDepthC-8),变量shift2设置为等于6,变量shift3设置为等于Max(2,14-BitDepthC)。
-变量picWC设置为等于pic_width_in_luma_samples/SubWidthC,变量picHC设置为等于pic_height_in_luma_samples/SubHeightC。
表8-13中指定了p等于xFracC或yFracC的每个1/32分数样点位置的色度插值滤波器系数fC[p]。
变量xOffset设置为等于(sps_ref_wraparound_offset_minus1+1)*MinCbSizeY)/SubWidthC。
对于i=0..3,以全样点为单位的色度位置(xInti,yInti)导出如下:
-如果subpic_treated_as_pic_flag[SubPicIdx]等于1,则应用以下:
xInti=Clip3(SubPicLeftBoundaryPos/SubWidthC,SubPicRightBoundaryPos/SubWidthC,xIntL+i) (8-785)
yInti=Clip3(SubPicTopBoundaryPos/SubHeightC,SubPicBotBoundaryPos/SubHeightC,yIntL+i) (8-786)
-否则(subpic_treated_as_pic_flag[SubPicIdx]等于0),应用以下:
yInti=Clip3(0,picHC-1,yIntC+i-1) (8-788)
2.4示例仅编码器的基于GOP的时域滤波器
在一些实施例中,可以实现仅编码器的时域滤波器。作为预处理步骤,在编解码器侧进行滤波。读取要编解码的所选图片之前和之后的源图片,并将与所选图片相对的基于块的运动补偿方法应用于这些源图片。使用运动补偿后的样点值对所选图片中的样点进行时域滤波。
取决于所选图片的时域子层以及QP设置总体滤波器强度。仅对时域子层0和1处的图片进行滤波,由比层1的图片更强的滤波器对层0的图片进行滤波。取决于所选图片中的样点值与运动补偿图片中的并置样点之间的差异来调整每个样点滤波器强度,使得运动补偿图片与所选图片之间的小差异进行比较大的差异更强的滤波。
基于GOP的时域滤波器
在读取图片之后且在编码之前直接引入时域滤波器。以下是更详细描述的步骤。
操作1:由编解码器读取图片
操作2:如果图片在编解码分层结构中足够低,则在编解码之前对其进行滤波。否则,图片在不进行滤波的情况下被编码。对具有POC%8==0的RA图片和具有POC%4==0的LD图片进行滤波。从不对AI图片进行滤波。
根据用于RA的以下等式来设置总体滤波器强度。
其中,n是读取的图片的数目。
对于LD情况,使用so(n)=0.95。
操作3:读取所选图片(以下称为原始图片)之前和/或之后的两张图片。在边缘情况下,例如如果是第一张图片或接近最后一张图片,则仅读取可用图片。
操作4:每个8x8图片块估算之前和之后读取的图片相对于原始图片的运动。
使用分层运动估计方案,并且在图2中图示了层L0、L1和L2。通过对所有读取图片和原始图片(例如图2中的L1)的每个2×2块进行平均来生成子采样的图片。使用相同的子采样方法从L1导出L2。
图2示出了分层运动估计的不同层的示例。L0是原始分辨率。L1是L0的子采样版本。L2是L1的子采样版本。
首先,对L2中的每个16x16块进行运动估计。针对每个所选运动矢量计算平方差,并且选择与最小差相对应的运动矢量。然后,在估计L1中的运动时,将所选运动矢量用作初始值。然后,对于估计L0中的运动进行相同的操作。最后一步,通过使用L0上的插值滤波器为每个8x8块估计子像素运动。
VTM 6抽头插值滤波器可以使用:
操作5:根据每个块的最佳匹配运动,对原始图片之前和之后的图片应用运动补偿,例如,使得每个块中原始图片的样点坐标在参考图片中具有最佳匹配坐标。
操作6:亮度和色度通道一个接一个地处理的样点,如以下步骤所述。
操作7:使用以下公式计算新样点值In
其中Io是原始样点的样点值,Ir(i)是运动补偿图片i的对应样点的强度,wr(i,a)是当可用的运动补偿图片的数目是a时动作补偿图片i的权重。
在亮度通道中,权重wr(i,a)定义如下:
其中
sl=0.4
对于i和a的所有其他情况:sr(i,a)=0.3
σl(QP)=3*(QP-10)
ΔI(i)=Ir(i)-Io
对于色度通道,权重wr(i,a)定义如下:
其中sc=0.55和σc=30
操作8:将滤波器应用于当前样点。所得到的样点值分开储存。
操作9:对滤波的图片进行编码。
2.5示例图片分割(片、砖、条带)
在一些实施例中,图片被分为一个或多个片行和一个或多个片列。片是覆盖图片的矩形区域的CTU序列。
片被分为一个或多个砖,每个砖由片内的多个CTU行构成。
未分割为多个砖的片也称为砖。然而,作为片的真子集的砖不称为片。
条带包含图片的多个片或片的多个砖。
子图片包含共同覆盖的图片的矩形区域的一个或多个条带。
支持条带的两种模式,即,栅格扫描条带模式和矩形条带模式。在栅格扫描条带模式下,条带包含图片的片栅格扫描中的片序列。在矩形条带模式下,条带包含共同形成图片的矩形区域的图片的多个砖。矩形条带内的砖按条带的砖栅格扫描顺序。
图5示出了图片的栅格扫描条带分割的示例,其中,图片被分为12个片和3个栅格扫描条带。
图6示出了图片的矩形条带分割的示例,其中图片被分为24个片(6个片列和4个片行)和9个矩形条带。
图7示出了被分割为片、砖和矩形条带的图片的示例,其中该图片被分为4个片(2个片列和2个片行)、11个砖(左顶片包含1个砖,右顶片包含5个块砖,左底片包含2个砖,右底片包含3个砖)和4个矩形条带。
图片参数集RBSP语法
single_tile_in_pic_flag等于1指定在参考PPS的每个图片中仅存在一个片。single_tile_in_pic_flag等于0指定在参考PPS的每个图片中存在多于一个片。
注–如果在片内不存在进一步的砖划分,则将整个片被称为砖。当图片仅包含单个片而没有进一步的砖划分时,则称为单个砖。
比特流一致性要求,对于CVS内编解码图片所参考的所有PPS,single_tile_in_pic_flag的值均应该相同。
uniform_tile_spacing_flag等于1指定片列边界和同样的片行边界在图片上均匀分布,并使用语法元素tile_cols_width_minus1和tile_rows_height_minus1信令通知。Uniform_tile_spacing_flag等于0指定片列边界和同样的片行边界在图片上可以均匀分布或可以不均匀分布,并使用语法元素num_tile_columns_minus1和num_tile_rows_minus1以及语法元素对tile_column_width_minus1[i]和tile_row_height_minus1[i]列表信令通知。当不存在时,uniform_tile_spacing_flag的值推断为等于1。
tile_cols_width_minus1加1指定当uniform_tile_spacing_flag等于1时以CTB为单位的图片的最右片列以外的片列的宽度。tile_cols_width_minus1的值应该在0到PicWidthInCtbsY-1范围(含端值)内。当不存在时,tile_cols_width_minus1的值推断为等于PicWidthInCtbsY-1。
tile_rows_height_minus1加1指定当uniform_tile_spacing_flag等于1时以CTB为单位的图片的底部片行以外的片行的高度。tile_rows_height_minus1的值应该在0到PicHeightInCtbsY-1范围(含端值)内。当不存在时,tile_rows_height_minus1的值推断为等于PicHeightInCtbsY-1。
num_tile_columns_minus1加1指定当unique_tile_spacing_flag等于0时分割图片的片列的数目。num_tile_columns_minus1的值应该在0到PicWidthInCtbsY-1范围(含端值)内。如果single_tile_in_pic_flag等于1,则num_tile_columns_minus1的值推断为等于0。否则,当uniform_tile_spacing_flag等于1时,则num_tile_columns_minus1的值按条款6.5.1中指定来推断。
num_tile_rows_minus1加1指定当uniform_tile_spacing_flag等于0时分割图片的片行的数目。num_tile_rows_minus1的值应该在0到PicHeightInCtbsY-1范围(含端值)内。如果single_tile_in_pic_flag等于1,则num_tile_rows_minus1的值推断为等于0。否则,当uniform_tile_spacing_flag等于1时,则num_tile_rows_minus1的值按条款6.5.1中指定来推断。
变量NumTilesInPic设置为等于(num_tile_columns_minus1+1)*(num_tile_rows_minus1+1)。
当single_tile_in_pic_flag等于0时,NumTilesInPic应该大于1。
tile_column_width_minus1[i]加1指定以CTB为单位的第i个片列的宽度。
tile_row_height_minus1[i]加1指定以CTB为单位的第i个片行的高度。
brick_splitting_present_flag等于1指定参考PPS的图片的一个或多个片可以被分为两个或更多个砖。brick_splitting_present_flag等于0指定参考PPS的图片的片均没有被分为两个或更多个砖。
num_tiles_in_pic_minus1加1指定参考PPS的每个图片中的片的数目。num_tiles_in_pic_minus1的值应该等于NumTilesInPic–1。当不存在时,num_tiles_in_pic_minus1的值推断为等于NumTilesInPic-1。
brick_split_flag[i]等于1指定第i个片被分为两个或更多个砖。brick_split_flag[i]等于0指定第i个片未被分为两个或更多个砖。当不存在时,brick_split_flag[i]的值推断为等于0。在一些实施例中,通过添加语法条件“if(RowHeight[i]>1)”来引入对SPS的PPS解析依赖性(例如,类似地,对于uniform_brick_spacing_flag[i])。
uniform_brick_spacing_flag[i]等于1指定水平砖边界在第i个片上均匀分布,并使用语法元素brick_height_minus1[i]信令通知。uniform_brick_spacing_flag[i]等于0指定水平砖边界在第i个片上可以均匀分布或可以不均匀分布,并使用语法元素num_brick_rows_minus2[i]和语法元素brick_row_height_minus1[i][j]的列表信令通知。当不存在时,uniform_brick_spacing_flag[i]的值推断为等于1。
brick_height_minus1[i]加1指定当uniform_brick_spacing_flag[i]等于1时以CTB为单位的第i个片中的底部砖以外的砖行的高度。当存在时,brick_height_minus1的值应该在0到RowHeight[i]-2范围(含端值)内。当不存在时,brick_height_minus1[i]的值推断为等于RowHeight[i]-1。
num_brick_rows_minus2[i]加2指定当unique_brick_spacing_flag[i]等于0时分割第i个片的砖的数目。当存在时,num_brick_rows_minus2[i]的值应该在0到RowHeight[i]–2范围(含端值)内。如果brick_split_flag[i]等于0,则num_brick_rows_minus2[i]的值推断为等于-1。否则,当uniform_brick_spacing_flag[i]等于1时,则num_brick_rows_minus2[i]的值按6.5.1中指定来推断。
brick_row_height_minus1[i][j]加1指定当uniform_tile_spacing_flag等于0时以CTB为单位的第i个片中第j个砖的高度。
导出以下变量,并且当uniform_tile_spacing_flag等于1时,推断num_tile_columns_minus1和num_tile_rows_minus1的值,并且对于从0到NumTilesInPic-1范围(含端值)的每个i,当uniform_brick_spacing_flag[i]等于1时,通过调用条款6.5.1中指定的CTB栅格和砖扫描转换过程来推断num_brick_rows_minus2[i]的值:
–对于从0到num_tile_rows_minus1范围(含端值)的j,列表RowHeight[j]指定以CTB为单位的第j个片行的高度,
–对于从0到PicSizeInCtbsY–1范围(含端值)的ctbAddrRs,列表CtbAddrRsToBs[ctbAddrRs]指定从图片的CTB栅格扫描中的CTB地址到砖扫描中的CTB地址的转换,
–对于从0到PicSizeInCtbsY–1范围(含端值)的ctbAddrB,列表CtbAddrBsToRs[ctbAddrBs]指定从砖扫描中的CTB地址到图片的CTB栅格扫描中的CTB地址的转换,
–对于从0到PicSizeInCtbsY–1范围(含端值)的ctbAddrB,列表BrickId[ctbAddrBs]指定从砖扫描中的CTB地址到砖ID的转换,
–对于从0到NumBricksInPic–1范围(含端值)的BrickIdx,列表NumCtusInBrick[brickIdx]指定从砖索引到砖中的CTU的数目的转换,
–对于从0到NumBricksInPic–1范围(含端值)的BrickIdx,列表FirstCtbAddrBs[brickIdx]指定从砖ID到砖中第一个CTB的砖扫描中的CTB地址的转换。
single_brick_per_slice_flag等于1指定参考此PPS的每个条带包括一个砖。single_brick_per_slice_flag等于0指定参考此PPS的条带可以包括多于一个砖。当不存在时,single_brick_per_slice_flag的值推断为等于1。
rect_slice_flag等于0指定每个条带中的砖按栅格扫描顺序,并且条带信息未在PPS中信令通知。rect_slice_flag等于1指定每个条带内的砖覆盖图片的矩形区域,并且在PPS中信令通知条带信息。当brick_splitting_present_flag等于1时,rect_slice_flag的值应该等于1。当不存在时,rect_slice_flag推断为等于1。
num_slices_in_pic_minus1加1指定参考PPS的每个图片中的条带的数目。num_slices_in_pic_minus1的值应该在0到NumBricksInPic–1范围(含端值)内。当不存在且single_brick_per_slice_flag等于1时,num_slices_in_pic_minus1的值推断为等于NumBricksInPic-1。
bottom_right_brick_idx_length_minus1加1指定用于表示语法元素bottom_right_brick_idx_delta[i]的比特的数目。bottom_right_brick_idx_length_minus1的值应该在0到Ceil(Log2(NumBricksInPic))-1范围(含端值)内。
bottom_right_brick_idx_delta[i]当i大于0时指定位于第i个条带的右底角的砖的砖索引与第(i–1)个条带的右底角的砖索引之间的差。bottom_right_brick_idx_delta[0]指定第0个条带的右底角的砖索引。当single_brick_per_slice_flag等于1时,bottom_right_brick_idx_delta[i]的值推断为等于1。BottomRightBrickIdx[num_slices_in_pic_minus1]的值推断为等于NumBricksInPic–1。bottom_right_brick_idx_delta[i]语法元素的长度是bottom_right_brick_idx_length_minus1+1个比特。
brick_idx_delta_sign_flag[i]等于1指示bottom_right_brick_idx_delta[i]的正号。brick_idx_delta_sign_flag[i]等于0指示bottom_right_brick_idx_delta[i]的负号。
比特流一致性要求,条带应该包括多个完整片或仅包括一个片的完整砖的连续序列。
变量TopLeftBrickIdx[i]、BottomRightBrickIdx[i]、NumBricksInSlice[i]和BricksToSliceMap[j],指定位于第i个条带的左顶角的砖的砖索引、位于第i个条带的右底角的砖的砖索引、第i个条带中的砖的数目和砖到条带的映射,导出如下:
一般条带头语义
当存在时,条带头语法元素slice_pic_parameter_set_id、non_reference_picture_flag、colour_plane_id、slice_pic_order_cnt_lsb、recovery_poc_cnt、no_output_of_prior_pics_flag、pic_output_flag和slice_temporal_mvp_enabled_flag中的每一个的值在编解码图片的所有条带头中应该相同。
变量CuQpDeltaVal,指定包含cu_qp_delta_abs的编解码单元的亮度量化参数与其预测之间的差,设置为等于0。变量CuQpOffsetCb、CuQpOffsetCr和CuQpOffsetCbCr,指定当确定包含cu_chroma_qp_offset_flag的编解码单元的Qp′Cb、Qp′Cr和Qp′CbCr量化参数的相应值时要使用的值,均设置为等于0。
slice_pic_parameter_set_id指定正在使用的PPS的pps_pic_parameter_set_id的值。slice_pic_parameter_set_id的值应该在0到63范围(含端值)内。
比特流一致性要求,当前图片的TemporalId的值应该大于或等于PPS的TemporalId的值,该PPS的pps_pic_parameter_set_id等于slice_pic_parameter_set_id。
slice_address指定条带的条带地址。当不存在时,slice_address的值推断为等于0。
如果rect_slice_flag等于0,则应用以下:
-条带地址是砖ID,如等式(7-59)指定。
-slice_address的长度是Ceil(Log2(NumBricksInPic))比特。
-slice_address的值应该在0到NumBricksInPic–1范围(含端值)内。
否则(rect_slice_flag等于1),应用以下:
-条带地址是条带的条带ID。
-slice_address的长度是signalled_slice_id_length_minus1+1比特。
-如果signalled_slice_id_flag等于0,则slice_address的值应该在0到num_slices_in_pic_minus1范围(含端值)内。否则,slice_address的值应该在0到2(signalled _slice_id_length_minus1+1)-1范围(含端值)内。
比特流一致性要求应用以下约束:
-slice_address的值应该不等于相同编解码图片的任何其它编解码条带NAL单元的slice_address的值。
-当rect_slice_flag等于0时,图片的条带应该按其slice_address值的升序。
-图片的条带的形状应该使得每个砖在解码时,其整个左边界和整个顶部边界由图片边界或由先前解码的(一个或多个)砖的边界构成。
num_bricks_in_slice_minus1(当存在时)指定条带中的砖的数目减1。num_bricks_in_slice_minus1的值应该在0到NumBricksInPic-1范围(含端值)内。当rect_slice_flag等于0且single_brick_per_slice_flag等于1时,num_bricks_in_slice_minus1的值推断为等于0。当single_brick_per_slice_flag等于1时,num_bricks_in_slice_minus1的值推断为等于0。
指定当前条带中的砖的数目的变量NumBricksInCurrSlice和指定当前条带中第i个砖的砖索引的SliceBrickIdx[i]导出如下:
变量SubPicIdx、SubPicLeftBoundaryPos、SubPicTopBoundaryPos、SubPicRightBoundaryPos和SubPicBotBoundaryPos导出如下:
3.通过公开的实施例解决的技术问题的示例
(1)存在一些可能违反子图片约束的设计。
A.仿射构造的候选中的TMVP可能获取并置图片中在当前子图片的范围之外的MV。
B.当导出双向光流(BDOF)和预测细化光流(PROF)中的梯度时,需要获取整数参考样点的两个扩展行和两个扩展列。这些参考样点可能在当前子图片的范围之外。
C.当在亮度映射色度缩放(LMCS)中导出色度残差缩放因子时,所访问的重构的亮度样点可能在当前子图片的范围的范围之外。
D.当导出亮度帧内预测模式、用于帧内预测的参考样点、用于CCLM的参考样点、用于Merge/AMVP/CIIP/IBC/LMCS的空间邻域候选的邻域块可用性、量化参数、CABAC初始化过程、使用左方和上方语法元素的ctxInc导出以及语法元素mtt_split_cu_vertical_flag的ctxInc时,邻域块可能在当前子图片的范围之外。子图片的表示可能导致具有不完整CTU的子图片。CTU分割和CU划分过程可能需要考虑不完整的CTU。
(2)与子图片有关的信令通知的语法元素可以任意大,这可能引起溢出问题。
(3)子图片的表示可能导致非矩形子图片。
(4)当前,以4个样点为单位定义子图片和子图片网格。并且,语法元素的长度取决于图片高度除以4。然而,由于当前pic_width_in_luma_samples和pic_height_in_luma_samples应该是Max(8,MinCbSizeY)的整数倍,所以可能需要以8个样点为单位定义子图片网格。
(5)可能需要将SPS语法、pic_width_max_in_luma_samples和pic_height_max_in_luma_samples限制为不小于8。
(6)在当前设计中未考虑参考图片重采样/可缩放性与子图片之间的交互。
(7)在时域滤波中,可能需要跨不同子图片的样点。
(8)当信令通知条带时,在一些情况下,可能在不信令通知的情况下推断信息。
(9)可能所有定义的条带都不能覆盖整个图片或子图片。
4.示例技术和实施例
以下详细列表应被视为示例以解释一般概念。这些项目不应狭义地解释。此外,这些项目可以任何方式组合。在下文中,时域滤波器用于表示需要其他图片中的样点的滤波器。Max(x,y)返回x和y中较大的一个。Min(x,y)返回x和y中较小的一个。
1.假设所需子图片的左顶角坐标是(xTL,yTL),并且所需子图片的右底坐标是(xBR,yBR),则在图片中获取时域MV预测器以生成仿射运动候选(例如,构造的仿射Merge候选)的位置(命名为位置RB)必须在所需子图片中。
a.在一个示例中,所需子图片是覆盖当前块的子图片。
b.在一个示例中,如果具有坐标(x,y)的位置RB在所需子图片之外,则将时域MV预测器视为不可用。
i.在一个示例中,如果x>xBR,则位置RB在所需子图片之外。
ii.在一个示例中,如果y>yBR,则位置RB在所需子图片之外。
iii.在一个示例中,如果x<xTL,则位置RB在所需子图片之外。
iv.在一个示例中,如果y<yTL,则位置RB在所需子图片之外。
c.在一个示例中,位置RB如果在所需子图片之外,则利用RB的替换。
i.替代地,此外,替换位置应该在所需的子图片中。
d.在一个示例中,位置RB被裁剪为在所需子图片中。
i.在一个示例中,x被裁剪为x=Min(x,xBR)。
ii.在一个示例中,y被裁剪为y=Min(y,yBR)。
iii.在一个示例中,x被裁剪为x=Max(x,xTL)。
iv.在一个示例中,y被裁剪为y=Max(y,yTL)。
e.在一个示例中,位置RB可以是在并置图片中的当前块的对应块内的右底位置。
f.所提出的方法可以用于需要从不同于当前图片的图片访问运动信息的其他编解码工具中。
g.在一个示例中,是否应用以上方法(例如,位置RB必须在所需子图片中(例如,按照1.a和/或1.b所要求的进行))可以取决于在VPS/DPS/SPS/PPS/APS/条带头/片组头中信令通知的一个或多个语法元素。例如,语法元素可以是subpic_treated_as_pic_flag[SubPicIdx],其中SubPicIdx是覆盖当前块的子图片的子图片索引。
2.假设所需子图片的左顶角坐标是(xTL,yTL),并且所需子图片的右底角坐标是(xBR,yBR),则在插值过程中未使用的参考中获取整数样点的位置(命名为位置S)必须在所需子图片中。
a.在一个示例中,所需子图片是覆盖当前块的子图片。
b.在一个示例中,如果具有坐标(x,y)的位置S在所需子图片之外,则将参考样点视为不可用。
i.在一个示例中,如果x>xBR,则位置S在所需子图片之外。
ii.在一个示例中,如果y>yBR,则位置S在所需子图片之外。
iii.在一个示例中,如果x<xTL,则位置S在所需子图片之外。
iv.在一个示例中,如果y<yTL,则位置S在所需子图片之外。
c.在一个示例中,位置S被裁剪为在所需子图片中。
i.在一个示例中,x被裁剪为x=Min(x,xBR)。
ii.在一个示例中,y被裁剪为y=Min(y,yBR)。
iii.在一个示例中,x被裁剪为x=Max(x,xTL)。
iv.在一个示例中,y被裁剪为y=Max(y,yTL)。
d.在一个示例中,位置S是否必须在所需子图片中(例如,按照2.a和/或2.b所要求的进行)可以取决于在VPS/DPS/SPS/PPS/APS/条带头/片组头中信令通知的一个或多个语法元素。例如,语法元素可以是subpic_treated_as_pic_flag[SubPicIdx],其中SubPicIdx是覆盖当前块的子图片的子图片索引。
e.在一个示例中,所获取的整数样点用于生成BDOF和/或PORF中的梯度。
3.假设所需子图片的左顶角坐标是(xTL,yTL),并且所需子图片的右底坐标是(xBR,yBR),则获取重构的亮度样点值的位置(命名为位置R)可以在所需子图片中。
a.在一个示例中,所需子图片是覆盖当前块的子图片。
b.在一个示例中,如果具有坐标(x,y)的位置R在所需子图片之外,则将参考样点视为不可用。
i.在一个示例中,如果x>xBR,则位置R在所需子图片之外。
ii.在一个示例中,如果y>yBR,则位置R在所需子图片之外。
iii.在一个示例中,如果x<xTL,则位置R在所需子图片之外。
iv.在一个示例中,如果y<yTL,则位置R在所需子图片之外。
c.在一个示例中,位置R被裁剪为在所需子图片中。
i.在一个示例中,x被裁剪为x=Min(x,xBR)。
ii.在一个示例中,y被裁剪为y=Min(y,yBR)。
iii.在一个示例中,x被裁剪为x=Max(x,xTL)。
iv.在一个示例中,y被裁剪为y=Max(y,yTL)。
d.在一个示例中,位置R是否必须在所需子图片中(例如,如4.a和/或4.b所要求的进行)可以取决于在VPS/DPS/SPS/PPS/APS/条带头/片组头中信令通知的一个或多个语法元素。例如,语法元素可以是subpic_treated_as_pic_flag[SubPicIdx],其中SubPicIdx是覆盖当前块的子图片的子图片索引。
e.在一个示例中,所获取的亮度样点被用于导出LMCS中的(一个或多个)色度分量的缩放因子。
4.假设所需子图片的左顶角坐标是(xTL,yTL),并且所需子图片的右底坐标是(xBR,yBR),则图片边界检查BT/TT/QT划分、BT/TT/QT深度导出、和/或CU划分标志信令通知的位置(命名为位置N)必须在所需子图片中。
a.在一个示例中,所需子图片是覆盖当前块的子图片。
b.在一个示例中,如果具有坐标(x,y)的位置N在所需子图片之外,则将参考样点视为不可用。
i.在一个示例中,如果x>xBR,则位置N在所需子图片之外。
ii.在一个示例中,如果y>yBR,则位置N在所需子图片之外。
iii.在一个示例中,如果x<xTL,则位置N在所需子图片之外。
iv.在一个示例中,如果y<yTL,则位置N在所需子图片之外。
c.在一个示例中,位置N被裁剪为在所需子图片中。
i.在一个示例中,x被裁剪为x=Min(x,xBR)。
ii.在一个示例中,y被裁剪为y=Min(y,yBR)。
iii.在一个示例中,x被裁剪为x=Max(x,xTL)。
d.在一个示例中,y被裁剪为y=Max(y,yTL)。在一个示例中,位置N是否必须在所需子图片中(例如,按照5.a和/或5.b所要求的进行)可以取决于在VPS/DPS/SPS/PPS/APS/条带头/片组头中信令通知的一个或多个语法元素。例如,语法元素可以是subpic_treated_as_pic_flag[SubPicIdx],其中SubPicIdx是覆盖当前块的子图片的子图片索引。
5.基于历史的运动矢量预测(HMVP)表可以在解码一个图片中的新子图片之前被重置。
a.在一个示例中,可以重置用于IBC编解码的HMVP表
b.在一个示例中,可以重置用于帧间编解码的HMVP表
c.在一个示例中,可以重置用于帧内编解码的HMVP表
6.可以以N个样点(例如,N=8、32等)为单位定义子图片语法元素。
a.在一个示例中,子图片标识符网格的每个元素的宽度以N个样点为单位。
b.在一个示例中,子图片标识符网格的每个元素的高度以N个样点为单位。
c.在一个示例中,N设置为CTU的宽度和/或高度。
7.图片宽度和图片高度的语法元素可以被限制为不小于K(K>=8)。
a.在一个示例中,可能需要将图片宽度限制为不小于8。
b.在一个示例中,可能需要将图片高度限制为不小于8。
8.一致性比特流应该满足:不允许为一个视频单元(例如,序列)启用子图片编解码和自适应分辨率转换(ARC)/动态分辨率转换(DRC)/参考图片重采样(RPR)。
a.在一个示例中,启用子图片编解码的信令通知可以在不允许ARC/DRC/RPR的条件下进行。
i.在一个示例中,当启用子图片时,诸如subpics_present_flag等于1,其中此SPS是活跃的所有图片的pic_width_in_luma_samples等于max_width_in_luma_samples。
b.可替代地,可以为一个视频单元(例如,序列)启用子图片编解码和ARC/DRC/RPR两者。
i.在一个示例中,一致性比特流应该满足:由于ARC/DRC/RPR导致的下采样的子图片仍应该为宽度为K个CTU且高度为M个CTU的形式,其中K和M均为整数。
ii.在一个示例中,一致性比特流应该满足:对于未位于图片边界(例如,右边界和/或底部边界)的子图片,由于ARC/DRC/RPR导致的下采样的子图片仍应该为宽度为K个CTU且高度为M个CTU的形式,其中K和M均为整数。
iii.在一个示例中,可以基于图片分辨率来自适应地改变CTU尺寸。
1)在一个示例中,可以在SPS中信令通知最大CTU尺寸。对于分辨率较低的每个图片,可以基于降低的分辨率相应地改变CTU尺寸。
2)在一个示例中,可以在SPS和PPS和/或子图片级中信令通知CTU尺寸。
9.语法元素subpic_grid_col_width_minus1和subpic_grid_row_height_minus1可能受到约束。
a.在一个示例中,subpic_grid_col_width_minus1必须不大于(或必须小于)T1。
b.在一个示例中,subpic_grid_row_height_minus1必须不大于(或必须小于)T2。
c.在一个示例中,在一致性比特流中,subpic_grid_col_width_minus1和/或subpic_grid_row_height_minus1必须遵循诸如项目符号3.a或3.b的约束。
d.在一个示例中,3.a中的T1和/或3.b中的T2可以取决于视频编解码标准的配置文件/级别/层级(tier)。
e.在一个示例中,3.a中的T1可以取决于图片宽度。
i.例如,T1等于pic_width_max_in_luma_samples/4或pic_width_max_in_luma_samples/4+Off。Off可以是1、2,-1,-2等。
f.在一个示例中,3.b中的T2可以取决于图片宽度。
i.例如,T2等于pic_height_max_in_luma_samples/4或pic_height_max_in_luma_samples/4-1+Off。Off可以是1、2、-1、-2等。
10.约束的是,两个子图片之间的边界必须是两个CTU之间的边界。
a.换言之,CTU不能被多于一个子图片覆盖。
b.在一个示例中,subpic_grid_col_width_minus1的单位可以是CTU宽度(诸如32、64、128),而不是VVC中的4。子图片网格宽度应该为(subpic_grid_col_width_minus1+1)*CTU宽度。
c.在一个示例中,subpic_grid_col_height_minus1的单位可以是CTU高度(诸如32、64、128),而不是VVC中的4。子图片网格高度应该为(subpic_grid_col_height_minus1+1)*CTU高度。
d.在一个示例中,在一致性比特流中,如果应用子图片方法,则必须满足约束。
11.约束的是,子图片的形状必须为矩形。
a.在一个示例中,在一致性比特流中,如果应用子图片方法,则必须满足约束。
b.子图片可以仅包含矩形条带。例如,在一致性比特流中,如果应用子图片方法,则必须满足约束。
12.约束的是,两个子图片不能重叠。
a.在一个示例中,在一致性比特流中,如果应用子图片方法,则必须满足约束。
b.可替代地,两个子图片可以彼此重叠。
13.约束的是,图片中的任何位置必须被一个且仅一个子图片覆盖。
a.在一个示例中,在一致性比特流中,如果应用子图片方法,则必须满足约束。
b.可替代地,一个样点可以不属于任何子图片。
c.可替代地,一个样点可以属于多于一个子图片。
14.可以约束的是,映射到以相同序列呈现的每个分辨率的SPS中定义的子图片应该服从上述约束的位置和/或尺寸。
a.在一个示例中,映射到以相同序列呈现的分辨率的SPS中定义的子图片的宽度和高度,应该是N(诸如8、16、32)个亮度样点的整数倍。
b.在一个示例中,可以为某一层定义子图片并且可以将子图片映射到其他层。
i.例如,可以为序列中具有最高分辨率的层定义子图片。
ii.例如,可以为序列中具有最低分辨率的层定义子图片。
iii.可以在SPS/VPS/PPS/条带头中信令通知为哪个层定义子图片。
c.在一个示例中,当应用子图片和不同的分辨率两者时,所有分辨率(例如,宽度和/或高度)可以是给定的分辨率的整数倍。
d.在一个示例中,在SPS中定义的子图片的宽度和/或高度可以是CTU尺寸的整数倍(例如,M)。
e.可替代地,序列中的子图片和不同的分辨率可以不被同时允许。
15.子图片可能仅应用于某一(某些)层
a.在一个示例中,在SPS中定义的子图片可以仅应用于序列中具有最高分辨率的层。
b.在一个示例中,在SPS中定义的子图片可以仅应用于序列中具有最低时域id的层。
c.可以通过SPS/VPS/PPS中的一个或多个语法元素来指示子图片可以应用于哪一(哪些)层。
d.可以通过SPS/VPS/PPS中的一个或多个语法元素来指示子图片不能应用于哪一(哪些)层。
16.在一个示例中,可以在不使用subpic_grid_idx的情况下信令通知子图片的位置和/或维度。
a.在一个示例中,可以信令通知子图片的左顶位置。
b.在一个示例中,可以信令通知子图片的右底位置。
c.在一个示例中,可以信令通知子图片的宽度。
d.在一个示例中,可以信令通知子图片的高度。
17.对于时域滤波器,当执行样点的时域滤波时,仅可以使用当前样点所属的相同子图片内的样点。所需样点可能在当前样点所属的相同图片中,也可能在其他图片中。
18.在一个示例中,是否应用和/或如何应用分割方法(诸如QT、水平BT、垂直BT、水平TT、垂直TT或不划分等)可以取决于当前块(或分割)是否跨越子图片的一个或多个边界。
a.在一个示例中,当图片边界被子图片边界代替时,也可以应用用于在VVC中进行分割的图片边界处理方法。
b.在一个示例中,是否解析表示分割方法(诸如QT、水平BT、垂直BT、水平TT、垂直TT或不划分等)的语法元素(例如,标志)可以取决于当前块(或分割)是否跨越子图片的一个或多个边界。
19.不是将一个图片划分为多个子图片,每个子图片独立编解码,而是提出将图片划分为至少两个子区域集合,第一集合包括多个子图片,并且第二集合包括所有剩余样点。
a.在一个示例中,第二集合中的样点不在任何子图片中。
b.可替代地,此外,可以基于第一集合的信息来对第二集合进行编解码/解码。
c.在一个示例中,可以利用默认值来标记样点/MxK子区域是否属于第二集合。
i.在一个示例中,可以将默认值设置为等于(max_subpics_minus1+K),其中K是大于1的整数。
ii.可以将默认值分配给subpic_grid_idx[i][j],以指示网格属于第二集合。
20.提出的是,语法元素subpic_grid_idx[i][j]不能大于max_subpics_minus1。
a.例如,约束的是,在一致性比特流中,subpic_grid_idx[i][j]不能大于max_subpics_minus1。
b.例如,用于对subpic_grid_idx[i][j]进行编解码的码字不能大于max_subpics_minus1。
21.提出的是,从0到max_subpics_minus1的任何整数必须等于至少一个subpic_grid_idx[i][j]。
22.可以在解码一个图片中的新的子图片之前重置IBC虚拟缓冲器。
a.在一个示例中,IBC虚拟缓冲器中的所有样点可以被重置为-1。
23.可以在解码一个图片中的新的子图片之前重置调色板条目列表。
a.在一个示例中,可以在解码一个图片中的新的子图片之前将PredictorPaletteSize设置为等于0。
24.是否信令通知条带的信息(例如,条带的数目和/或条带的范围)可以取决于片的数目和/或砖的数目。
a.在一个示例中,如果图片中的砖的数目为1,则不信令通知num_slices_in_pic_minus1并将其推断为0。
b.在一个示例中,如果图片中的砖的数目为1,则可以不信令通知条带的信息(例如,条带的数目和/或条带的范围)。
c.在一个示例中,如果图片中的砖的数目为1,则条带的数目可以推断为1。并且,条带覆盖整个图片。在一个示例中,如果图片中的砖的数目为1,则不信令通知single_brick_per_slice_flag并将其推断为1。
i.可替代地,如果图片中的砖的数目为1,则single_brick_per_slice_flag必须为1。
d.示例性语法设计如下:
25.是否信令通知slice_address可以与是否信令通知条带为矩形(例如,rect_slice_flag是等于0还是1)分离。
a.示例性语法设计如下:
if([[rect_slice_flag||]]NumBricksInPic>1)
slice_address u(v)
26.是否信令通知slice_address可以取决于当条带被信令通知为矩形时条带的数目。
27.是否信令通知num_bricks_in_slice_minus1可以取决于slice_address和/或图片中的砖的数目。
a.示例性语法设计如下:
28.是否信令通知loop_filter_across_bricks_enabled_flag可以取决于片的数目和/或砖的数目。
a.在一个示例中,如果砖的数目小于2,则不信令通知loop_filter_across_bricks_enabled_flag。
b.示例性语法设计如下:
29.比特流一致性要求图片的所有条带必须覆盖整个图片。
a.当信令通知条带为矩形(例如rect_slice_flag等于1)时,必须满足该要求。
30.比特流一致性要求子图片的所有条带必须覆盖整个子图片。
a.当信令通知条带为矩形(例如rect_slice_flag等于1)时,必须满足该要求。
31.比特流一致性要求条带不能与多于一个子图片重叠。
32.比特流一致性要求片不能与多于一个子图片重叠。
33.比特流一致性要求砖不能与多于一个子图片重叠。
在下面的讨论中,维度为CW×CH的基本单元块(BUB)是矩形区域。例如,BUB可以是编解码树块(CTB)。
34.在一个示例中,可以信令通知子图片的数目(表示为N)。
a.如果使用子图片(例如,subpics_present_flag等于1),则一致性比特流可以要求在图片中存在至少两个子图片。
b.可替代地,可以信令通知N减去d(即N-d),其中d是整数,诸如0、1或2。
c.例如,可以使用固定长度编解码(例如u(x))来编解码N-d。
i.在一个示例中,x可以是诸如8的固定数。
ii.在一个示例中,可以在信令通知N-d之前信令通知x或x-dx,其中dx是诸如0、1或2的整数。信令通知的x可以不大于一致性比特流中的最大值。
iii.在一个示例中,x可以即时导出。
1)例如,x可以导出为图片中BUB的总数(表示为M)的函数。
例如,x=Ceil(log2(M+d0))+d1,其中d0和d1是两个整数,诸如-2、-1、0、1、2等。
2)M可以导出为M=Ceiling(W/CW)×Ceiling(H/CH),其中W和H表示图片的宽度和高度,CW和CH表示BUB的宽度和高度。
d.例如,可以使用一元代码或截短一元代码来对N-d进行编解码。
e.在一个示例中,允许的N-d的最大值可以是固定数。
i.可替代地,允许的N-d的最大值可以导出为图片中BUB的总数(表示为M)的函数。例如,x=Ceil(log2(M+d0))+d1,其中d0和d1是两个整数,诸如-2、-1、0、1、2等。
35.在一个示例中,可以由一个或多个其所选位置(例如,左顶/右顶/左底/右底位置)和/或其宽度和/或其高度的指示来信令通知子图片。
a.在一个示例中,可以以维度为CW×CH的基本单元块(BUB)的粒度来信令通知子图片的左顶位置。
i.例如,可以信令通知根据子图片的左顶BUB的BUB的列索引(表示为Col)。
1)例如,可以信令通知Col-d,其中d是整数,诸如0、1或2。
a)可替代地,d可以等于先前编解码的子图片的Col加d1,其中d1是整数,诸如-1、0或1。
b)可以信令通知Col-d的符号。
ii.例如,可以信令通知根据子图片的左顶BUB的BUB的行索引(表示为Row)。
1)例如,可以信令通知Row-d,其中d是整数,诸如0、1或2。
a)可替代地,d可以等于先前编解码的子图片的Row加d1,其中d1是整数,诸如-1、0或1。
b)可以信令通知Row-d的符号。
iii.上面提到的行/列索引(表示为Row)可以以编解码树块(CTB)单元表示,例如,相对于图片左顶位置的x或y坐标可以除以CTB尺寸并信令通知。
iv.在一个示例中,是否信令通知子图片的位置可以取决于子图片索引。
1)在一个示例中,对于图片内的第一子图片,可以不信令通知左顶位置。
a)可替代地,此外,左顶位置可以推断为例如(0,0)。
2)在一个示例中,对于图片内的最后子图片,可以不信令通知左顶位置。
a)可以取决于先前信令通知的子图片的信息来推断左顶位置。
b.在一个示例中,可以使用截短一元/截短二进制/一元/固定长度/第K个EG编解码(例如,K=0、1、2、3)来信令通知子图片的宽度/高度/所选位置的指示。
c.在一个示例中,可以以维度为CW×CH的BUB的粒度来信令通知子图片的宽度。
i.例如,可以信令通知子图片中的BUB的列数(表示为W)。
ii.例如,可以信令通知W-d,其中d是整数,诸如0、1或2。
1)可替代地,d可以等于先前编解码的子图片的W加d1,其中d1是整数,诸如-1、0或1。
2)可以信令通知W-d的符号。
d.在一个示例中,可以以维度为CW×CH的BUB的粒度来信令通知子图片的高度。
i.例如,可以信令通知子图片中的BUB的行数(表示为H)。
ii.例如,可以信令通知H-d,其中d是整数,诸如0、1或2。
1)可替代地,d可以等于先前编解码的子图片的H加d1,其中d1是整数,诸如-1、0或1。
2)可以信令通知H-d的符号。
e.在一个示例中,可以使用固定长度编解码(例如u(x))来编解码Col-d。
i.在一个示例中,x可以是诸如8的固定数。
ii.在一个示例中,可以在信令通知Col-d之前信令通知x或x-dx,其中dx是诸如0、1或2的整数。信令通知的x可以不大于一致性比特流中的最大值。
iii.在一个示例中,x可以即时导出。
1)例如,x可以导出为图片中BUB列的总数(表示为M)的函数。例如,x=Ceil(log2(M+d0))+d1,其中d0和d1是两个整数,诸如-2,-1、0、1、2等。
2)M可以导出为M=Ceiling(W/CW),其中W表示图片的宽度,CW表示BUB的宽度。
f.在一个示例中,可以使用固定长度编解码(例如u(x))来编解码Row-d。
i.在一个示例中,x可以是诸如8的固定数。
ii.在一个示例中,可以在信令通知Row-d之前信令通知x或x-dx,其中dx是诸如0、1或2的整数。信令通知的x可以不大于一致性比特流中的最大值。
iii.在一个示例中,x可以即时导出。
1)例如,x可以导出为图片中BUB行的总数(表示为M)的函数。例如,x=Ceil(log2(M+d0))+d1,其中d0和d1是两个整数,诸如-2,-1、0、1、2等。
2)M可以导出为M=Ceiling(H/CH),其中H表示图片的高度,并且CH表示BUB的高度。
g.在一个示例中,可以使用固定长度编解码(例如u(x))来编解码W-d。
i.在一个示例中,x可以是诸如8的固定数。
ii.在一个示例中,可以在信令通知W-d之前信令通知x或x-dx,其中dx是诸如0、1或2的整数。信令通知的x可以不大于一致性比特流中的最大值。
iii.在一个示例中,x可以即时导出。
1)例如,x可以导出为图片中BUB列的总数(表示为M)的函数。例如,x=Ceil(log2(M+d0))+d1,其中d0和d1是两个整数,诸如-2、-1、0、1、2等。
2)M可以导出为M=Ceiling(W/CW),其中W表示图片的宽度,CW表示BUB的宽度。
h.在一个示例中,可以使用固定长度编解码(例如u(x))来编解码H-d。
i.在一个示例中,x可以是诸如8的固定数。
ii.在一个示例中,可以在信令通知H-d之前信令通知x或x-dx,其中dx是诸如0、1或2的整数。信令通知的x可以不大于一致性比特流中的最大值。
iii.在一个示例中,x可以即时导出。
1)例如,x可以导出为图片中BUB行的总数(表示为M)的函数。例如,x=Ceil(log2(M+d0))+d1,其中d0和d1是两个整数,诸如-2、-1、0、1、2等。
2)M可以导出为M=Ceiling(H/CH),其中H表示图片的高度,CH表示BUB的高度。
i.可以为所有子图片信令通知Col-d和/或Row-d。
i.可替代地,可以不为所有子图片信令通知Col-d和/或Row-d。
1)如果子图片的数目小于2(等于1),则可以不信令通知col-d和/或Row-d。
2)例如,可以不为第一子图片信令通知Col-d和/或Row-d(例如,子图片索引(或子图片ID)等于0)。
a)当不信令通知它们时,它们可以推断为0。
3)例如,可以不为最后子图片信令通知Col-d和/或Row-d(例如,子图片索引(或子图片ID)等于NumSubPics-1)。
a)当不信令通知它们时,可以取决于已经信令通知的子图片的位置和维度来推断它们。
j.可以为所有子图片信令通知W-d和/或H-d。
i.可替代地,可以不为所有子图片信令通知W-d和/或H-d。
1)如果子图片的数目小于2(等于1),则可以不信令通知W-d和/或H-d。
2)例如,可以不为最后子图片信令通知W-d和/或H-d(例如,子图片索引(或子图片ID)等于NumSubPics-1)。
a)当不信令通知它们时,可以取决于已经信令通知的子图片的位置和维度来推断它们。
k.在上述项目符号中,BUB可以是编解码树块(CTB)。
36.在一个示例中,应当在已经信令通知CTB尺寸的信息(例如log2_ctu_size_minus5)之后信令通知子图片的信息。
37.可以不为每个子图片信令通知subpic_treated_as_pic_flag[i]。代替地,信令通知一个subpic_treated_as_pic_flag来控制是否将子图片视为所有子图片的图片。
38.可以不为每个子图片信令通知loop_filter_across_subpic_enabled_flag[i]。代替地,信令通知一个loop_filter_across_subpic_enabled_flag来控制是否可以在所有子图片的子图片上应用环路滤波器。
39.可以有条件地信令通知subpic_treated_as_pic_flag[i](subpic_aged_as_pic_flag)和/或loop_filter_across_subpic_enabled_flag[i](loop_filter_across_subpic_enabled_flag)。
a.在一个示例中,如果子图片的数目小于2(等于1),则可以不信令通知subpic_treated_as_pic_flag[i]和/或loop_filter_across_subpic_enabled_flag[i]。
40.当使用子图片时,可以应用RPR。
a.在一个示例中,当使用子图片时,RPR中的缩放比率可以被约束为有限的集合,诸如{1∶1,1∶2和/或2∶1}或{1∶1,1∶2和/或2∶1,1∶4和/或4∶1},{1∶1,1∶2和/或2∶1,1∶4和/或4∶1,1∶8和/或8∶1}。
b.在一个示例中,如果图片A和图片B的分辨率不同,则图片A的CTB尺寸和图片B的CTB尺寸可以不同。
c.在一个示例中,假设维度为SAW×SAH的子图片SA在图片A中,并且维度为SBW×SBH的子图片SB在图片B中,SA对应于SB,并且图片A和图片B之间的缩放比率是沿水平和垂直方向的Rw和Rh,则
i.SAW/SBW或SBW/SAW应当等于Rw。
ii.SAH/SBH或SBH/SAH应当等于Rh。
41.当使用子图片(例如sub_pics_present_flag为真)时,可以在条带头中信令通知子图片索引(或子图片ID),并且条带地址作为子图片中的地址而不是整个图片的地址被中断。
5.实施例
在以下实施例中,新添加的文本以粗体斜体显示,并且删除的文本以“[[]]”标记。
5.1实施例1:对仿射构造的Merge候选的子图片约束
8.5.5.6构造的仿射控制点运动矢量Merge候选的导出过程
此过程的输入是:
-亮度位置(xCb,yCb),指定与当前图片的左顶亮度样点相对的当前亮度编解码块的左顶样点,
-两个变量cbWidth和cbHeight,指定当前亮度编解码块的宽度和高度,
-可用性标志availableA0、availableA1、availableA2、availableB0、availableB1、availableB2、availableB3
-样点位置(xNbA0,yNbA0)、(xNbA1,yNbA1)、(xNbA2,yNbA2)、(xNbB0,yNbB0)、(xNbB1,yNbB1)、(xNbB2,yNbB2)和(xNbB3,yNbB3)。
此过程的输出是:
-构造的仿射控制点运动矢量Merge候选的可用性标志availableFlagConstK,其中K=1..6,
-参考索引refIdxLXConstK,其中K=1..6,X为0或1,
-预测列表利用标志predFlagLXConstK,其中K=1..6,X为0或1,
-仿射运动模型索引motionModelIdcConstK,其中K=1..6,
-双向预测权重索引bcwIdxConstK,其中K=1..6,
-构造的仿射控制点运动矢量cpMvLXConstK[cpIdx],其中cpIdx=0..2,K=1..6,X为0或1。
第四(并置右底)控制点运动矢量cpMvLXCorner[3],参考索引refIdxLXCorner[3],预测列表利用标志predFlagLXCorner[3]和可用性标志availableFlagCorner[3],其中X为0和1,导出如下:
-时域Merge候选的参考索引refIdxLXCorner[3]设置为等于0,其中X为0或1。
-变量mvLXCol和availableFlagLXCol,其中X为0或1,导出如下:
-如果slice_temporal_mvp_enabled_flag等于0,则mvLXCol的两个分量均设置为等于0,且availableFlagLXCol设置为等于0。
-否则(slice_temporal_mvp_enabled_flag等于1),应用以下:
xColBr=xCb+cbWidth (8-601)
yColBr=yCb+cbHeight (8-602)
rightBoundaryPos=subpic_treated_as_pic_flag[SubPicIdx]?
SubPicRightBoundaryPos:pic_width_in_luma_samples-1
botBoundaryPos=subpic_treated_as_pic_flag[SubPicIdx]?
SubPicBotBoundaryPos:pic_height_in_luma_samples–1
-如果yCb>>CtbLog2SizeY等于yColBr>>CtbLog2SizeY,yColBr小于或等于 botBoundaryPos,xColBr小于或等于rightBoundaryPos,则应用以下:
-变量colCb指定亮度编解码块,该亮度编解码块覆盖由ColPic指定的并置图片内的由((xColBr>>3)<<3,(yColBr>>3)<<3)给出的修改位置。
-亮度位置(xColCb,yColCb)设置为等于,与由ColPic指定的并置图片的左顶亮度样点相对的由colCb指定的并置亮度编解码块的左顶样点。
-调用条款8.5.2.12中指定的并置运动矢量的导出过程,其中currCb、colCb、(xColCb,yColCb)、refIdxLXCorner[3]和sbFlag设置为等于0作为输入,并且输出分配给mvLXCol和availableFlagLXCol。
-否则,mvLXCol的两个分量均设置为等于0,且availableFlagLXCol设置为等于0。
5.2实施例2:对仿射构造的Merge候选的子图片约束
8.5.5.6构造的仿射控制点运动矢量Merge候选的导出过程
此过程的输入是:
-亮度位置(xCb,yCb),指定与当前图片的左顶亮度样点相对的当前亮度编解码块的左顶样点,
-两个变量cbWidth和cbHeight,指定当前亮度编解码块的宽度和高度,
-可用性标志availableA0、availableA1、availableA2、availableB0、availableB1、availableB2、availableB3
-样点位置(xNbA0,yNbA0)、(xNbA1,yNbA1)、(xNbA2,yNbA2)、(xNbB0,yNbB0)、(xNbB1,yNbB1)、(xNbB2,yNbB2)和(xNbB3,yNbB3)。
此过程的输出是:
-构造的仿射控制点运动矢量Merge候选的可用性标志availableFlagConstK,其中K=1..6,
-参考索引refIdxLXConstK,其中K=1..6,X为0或1,
-预测列表利用标志predFlagLXConstK,其中K=1..6,X为0或1,
-仿射运动模型索引motionModelIdcConstK,其中K=1..6,
-双向预测权重索引bcwIdxConstK,其中K=1..6,
-构造的仿射控制点运动矢量cpMvLXConstK[cpIdx],其中cpIdx=0..2,K=1..6,X为0或1。
第四(并置右底)控制点运动矢量cpMvLXCorner[3],参考索引refIdxLXCorner[3],预测列表利用标志predFlagLXCorner[3]和可用性标志availableFlagCorner[3],其中X为0和1,导出如下:
-时域Merge候选的参考索引refIdxLXCorner[3],其中X为0或1,设置为等于0。
-变量mvLXCol和availableFlagLXCol,其中X为0或1,导出如下:
-如果slice_temporal_mvp_enabled_flag等于0,则mvLXCol的两个分量均设置为等于0,且availableFlagLXCol设置为等于0。
-否则(slice_temporal_mvp_enabled_flag等于1),应用以下:
xColBr=xCb+cbWidth (8-601)
yColBr=yCb+cbHeight (8-602)
rightBoundaryPos=subpic_treated_as_pic_flag[SubPicIdx]?
SubPicRightBoundaryPos:pic_widthinlumasamples-1
botBoundaryPos=subpictreated_as_pic_flag[SubPicIdx]?
SubPicBotBoundaryPos:pic_height_in_luma_samples–1
xColBr=Min(rightBoundaryPos,xColBr)
yColBr=Min(botBoundaryPos,yColBr)
-如果yCb>>CtbLog2SizeY等于yColBr>>CtbLog2SizeY,[[yColBr小于pic_height_in_luma_samples,xColBr小于pic_width_in_luma_samples,则应用以下]]:
-变量colCb指定亮度编解码块,该亮度编解码块覆盖由ColPic指定的并置图片内的由((xColBr>>3)<<3,(yColBr>>3)<<3)给出的修改位置。
-亮度位置(xColCb,yColCb)设置为等于,与由ColPic指定的并置图片的左顶亮度样点相对的由colCb指定的并置亮度编解码块的左顶样点。
-调用条款8.5.2.12中指定的并置运动矢量的导出过程,其中currCb、colCb、(xColCb,yColCb)、refIdxLXCorner[3]和sbFlag设置为等于0作为输入,并且输出分配给mvLXCol和availableFlagLXCol。
-否则,mvLXCol的两个分量均设置为等于0,且availableFlagLXCol设置为等于0。
5.3实施例3:在子图片约束下获取整数样点
8.5.6.3.3亮度整数样点获取过程
此过程的输入是:
–以全样点为单位的亮度位置(xIntL,yIntL),
-亮度参考样点阵列refPicLXL
此过程的输出是预测的亮度样点值predSampleLXL
变量移位设置为等于Max(2,14-BitDepthY)。
变量picW设置为等于pic_width_in_luma_samples,变量picH设置为等于pic_height_in_luma_samples。
以全样点为单位的亮度位置(xInt,yInt)导出如下:
-如果subpic_treated_as_pic_flag[SubPicIdx]等于1,应用以下:
xInt=Clip3(SubPicLeftBoundaryPos,SubPicRightBoundaryPos,xInt)
yInt=Clip3(SubPicTopBoundaryPos,SubPicBotBoundaryPos,yInt)
-否则:
xInt=Clip3(0,picW-1,sps_ref_wraparound_enabled_flag? (8-782)
ClipH((sps_ref_wraparound_offset_minus1+1)*MinCbSizeY,picW,xIntL):xIntL)
yInt=Clip3(0,picH-1,yIntL) (8-783)
预测的亮度样点值predSampleLXL导出如下:
predSampleLXL=refPicLXL[xInt][yInt]<<shift3 (8-784)
5.4实施例4:导出LMCS的色度残差缩放中的变量invAvgLuma
8.7.5.3使用亮度相关色度残差缩放过程对色度样点进行图片重构
此过程的输入是:
-与当前图片的左顶色度样点相对的当前色度变换块的左顶色度样点的色度位置(xCurr,yCurr),
-变量nCurrSw,指定色度变换块的宽度,
-变量nCurrSh,指定色度变换块的高度,
-变量tuCbfChroma,指定当前色度变换块的编解码块标志,
-(nCurrSw)x(nCurrSh)阵列predSamples,指定当前块的色度预测样点,
-(nCurrSw)x(nCurrSh)阵列resSamples,指定当前块的色度残差样点,
此过程的输出是重构的色度图片样点阵列recSamples。
变量sizeY设置为等于Min(CtbSizeY,64)。
对于i=0..nCurrSw-1,j=0..nCurrSh-1,重构的色度图片样点recSamples导出如下:
-…
-否则,应用以下:
-…
-变量currPic指定当前图片中重构的亮度样点的阵列。
-对于变量varScale的导出,应用以下有序步骤:
1.变量invAvgLuma导出如下:
-阵列recLuma[i](其中i=0..(2*sizeY-1))和变量cnt导出如下:
-变量cnt设置为等于0。
-变量rightBoundaryPos和botBoundaryPos导出如下:
rightBoundaryPos=subpic_treated_as_pic_flag[SubPicIdx]?
SubPicRightBoundaryPos:pic_width_in_luma_samples-1
botBoundaryPos=subpic_treated_as_pic_flag[SubPicIdx]?
SubPicBotBoundaryPos:pic_height_in_luma_samples–1
-当availL等于真(TRUE)时,阵列recLuma[i](其中i=0..sizeY-1)设置为等于currPic[xCuCb-1][Min(yCuCb+i,[[pic_height_in_luma_samples–1]]botBoundaryPos)](其中i=0..sizeY-1),cnt设置为等于sizeY。
-当availT等于真时,阵列recLuma[cnt+i](其中i=0..sizeY–1)设置为等于currPic[Min(xCuCb+i,[[pic_width_in_luma_samples-1]]rightBoundaryPos)][yCuCb-1](其中i=0..sizeY-1),且cnt设置为等于(cnt+sizeY)。
-变量invAvgLuma导出如下:
-如果cnt大于0,则应用以下:
-否则(cnt等于0),应用以下:
invAvgLuma=1<<(BitDepthY–1) (8-1014)
5.5实施例5:以除4个样点之外的N个样点(诸如,N=8或32)为单位定义子图片元素的示例
7.4.3.3序列参数集RBSP语义
subpic_grid_col_width_minus1加1指定以4-N个样点为单位的子图片标识符网格的每个元素的宽度。语法元素的长度为Ceil(Log2(pic_width_max_in_luma_samples/4- N))比特。
变量NumSubPicGridCols导出如下:
NumSubPicGridCols=
(pic_width_max_in_luma_samples+subpic_grid_col_width_minus1*[[4
+3]]N+N-1)/
(subpic_grid_col_width_minus1*[[4+3]]N+N-1) (7-5)
subpic_grid_row_height_minus1加1指定以4个样点为单位的子图片标识符网格中每个元素的高度。语法元素的长度为Ceil(Log2(pic_height_max_in_luma_samples/4- N))比特。
变量NumSubPicGridRows导出如下:
NumSubPicGridRows=
(pic_height_max_in_luma_samples+subpic_grid_row_height_minus1*4
N+N-1)/
(subpic_grid_row_height_minus1*[[4+3]N+N-1)
7.4.7.1一般条带头语义
变量SubPicIdx、SubPicLeftBoundaryPos、SubPicTopBoundaryPos、SubPicRightBoundaryPos和SubPicBotBoundaryPos导出如下:
5.6实施例6:将图片宽度和图片高度限制为等于或大于8
7.4.3.3序列参数集RBSP语义
pic_width_max_in_luma_samples指定参考SPS的每个解码图片的最大宽度(以亮度样点为单位)。pic_width_max_in_luma_samples不应等于0,并且应为[[MinCbSizeY]]Max(8,MinCbSizeY)的整数倍。
pic_height_max_in_luma_samples指定参考SPS的每个解码图片的最大高度(以亮度样点为单位)。pic_height_max_in_luma_samples不应等于0,并且应为[[MinCbSizeY]]Max(8,MinCbSizeY)的整数倍。
5.7实施例7:用于BT/TT/QT划分、BT/TT/QT深度导出和/或CU划分标志的信令通知的子图片边界检查
6.4.2允许的二进制划分过程
变量allowBtSplit导出如下:
-…
-否则,如果以下所有条件均为真,则allowBtSplit设置为等于假(FALSE)
-btSplit等于SPLIT_BT_VER
-y0+cbHeight大于[[pic_height_in_luma_samples]]subpic_treated_as_pic_ flag[SubPicIdx]?SubPicBotBoundaryPos+1:pic_height_in_luma_samples
-否则,如果以下所有条件均为真,则allowBtSplit设置为等于假
-btSplit等于SPLIT_BT_VER
-cbHeight大于MaxTbSizeY
-x0+cbWidth大于[[pic_height_in_luma_samples]]subpic_treated_as_pic_ flag[SubPicIdx]?SubPicBotBoundaryPos+1:pic_height_in_luma_samples
-否则,如果以下所有条件均为真,则allowBtSplit设置为等于假
-btSplit等于SPLIT_BT_HOR
-cbWidth大于MaxTbSizeY
-y0+cbHeight大于[[pic_height_in_luma_samples]]subpic_treated_as_pic_ flag[SubPicIdx]?SubPicBotBoundaryPos+1:pic_height_in_luma_samples
-否则,如果以下所有条件均为真,则allowBtSplit设置为等于假
-x0+cbWidth大于[[pic_width_in_luma_samples]]subpic treated_as_pic_ flag[SubPicIdx]?SubPicRightBoundaryPos+1:pic_width_in_luma_samples
-y0+cbHeight大于[[pic_height_in_luma_samples]]subpic_treated_as_pic_ flag[SubPicIdx]?SubPicBotBoundaryPos+1:pic_height_in_luma_samples
-cbWidth大于minQtSize
-否则,如果以下所有条件均为真,则allowBtSplit设置为等于假
-btSplit等于SPLIT_BT_HOR
-x0+cbWidth大于[[pic_width_in_luma_samples]]subpic_treated_aspic_flag [SubPicIdx]?SubPicRightBoundaryPos+1:pic_width_in_luma_samples
-y0+cbHeight小于或等于y0+cbHeight is less than or equal to[[pic_height_in_luma_samples]]subpic_treated_as_pic_flag[SubPicIdx]? SubPicBotBoundaryPos+1:pic_height_in_luma_samples
6.4.2允许的三元划分过程
变量allowTtSplit导出如下:
-如果以下条件中的一个或多个为真,则allowTtSplit设置为等于假:
-cbSize小于或等于2*MinTtSizeY
-cbWidth大于Min(MaxTbSizeY,maxTtSize)
-cbHeight大于Min(MaxTbSizeY,maxTtSize)
-mttDepth大于或等于maxMttDepth
-x0+cbWidth大于[[pic_width_in_luma_samples]]subpic treated as_pic_ flag[SubPicIdx]?SubPicRightBoundaryPos+1:pic width in luma samples
-y0+cbHeight大于[[pic_height_in_luma_samples]]subpic treated as_pic_ flag[SubPicIdx]?SubPicBotBoundaryPos+1:pic_height_in_luma_samples
-treeType等于DUAL_TREE_CHROMA,并且(cbWidth/SubWidthC)*(cbHeight/SubHeightC)小于或等于32。
-treeType等于DUAL_TREE_CHROMA,并且modeType等于MODE_TYPE_INTRA。
-否则,allowTtSplit设置为等于真。
7.3.8.2编解码树单元语法
7.3.8.4编解码树语法
5.8实施例8:定义子图片的示例
5.9实施例9:定义子图片的示例
5.10实施例10:定义子图片的示例
5.11实施例11:定义子图片的示例
NumSubPics=num_subpics_minus2+2。
图3是视频处理装置300的框图。装置300可以用于实现本文描述的一种或多种方法。装置300可以实施在智能手机、平板计算机、计算机、物联网(IoT)接收器等中。装置300可以包括一个或多个处理器302,一个或多个存储器304和视频处理硬件306。(一个或多个)处理器302可以被配置为实现在本文档中描述的一种或多种方法。(一个或多个)存储器304可以用于储存用于实现本文描述的方法和技术的数据和代码。视频处理硬件306可以用于在硬件电路中实现本文档中描述的一些技术。
图4是用于处理视频的方法400的流程图。方法400包括对于视频的第一视频区域中的视频块,确定使用仿射模式对于视频块和当前视频块的比特流表示之间的转换确定时域运动矢量预测器的位置是否在第二视频区域内(402),以及基于确定来执行转换(404)。
在一些实施例中,以下解决方案可以被实现为优选解决方案。
以下解决方案可以与先前章节中列出的项目(例如,项目1)中描述的附加技术一起实现。
1.一种视频处理的方法,包括:对于视频的第一视频区域中的视频块,确定使用仿射模式对于视频块和当前视频块的比特流表示之间的转换确定时域运动矢量预测器的位置是否在第二视频区域内;以及基于确定来执行转换。
2.根据解决方案1的方法,其中,视频块被第一区域和第二区域覆盖。
3.根据解决方案1-2中的任一项的方法,其中,如果时域运动矢量预测器的位置在第二视频区域之外,则时域运动矢量预测器被标记为不可用并且在转换中不被使用。
以下解决方案可以与在先前章节中列出的项目(例如,项目2)中描述的附加技术一起实现。
4.一种视频处理的方法,包括:对于视频的第一视频区域中的视频块,确定对于视频块和当前视频块的比特流表示之间的转换获取参考图片中的整数样点的位置是否在第二视频区域内,其中,在转换期间,参考图片不用于插值过程;以及基于确定来执行转换。
5.根据解决方案4的方法,其中,视频块被第一区域和第二区域覆盖。
6.根据解决方案4-5中任一项的方法,其中,如果样点的位置在第二视频区域之外,则样点被标记为不可用并且在转换中不被使用。
以下解决方案可以与先前章节中列出的项目(例如,项目3)中描述的附加技术一起实现。
7.一种视频处理的方法,包括:对于视频的第一视频区域中的视频块,确定对于视频块和当前视频块的比特流表示之间的转换获取重构亮度样点值的位置是否在第二视频区域内;以及基于确定来执行转换。
8.根据解决方案7的方法,其中,亮度样品被第一区域和第二区域覆盖。
9.根据解决方案7-8中的任一项的方法,其中,如果亮度样点的位置在第二视频区域之外,则亮度样点被标记为不可用并且在转换中不被使用。
以下解决方案可以与先前章节中列出的项目(例如,项目4)中描述的附加技术一起实现。
10.一种视频处理的方法,包括:对于视频的第一视频区域中的视频块,确定在视频块和当前视频块的比特流表示之间的转换期间执行的关于对于视频块的划分、深度导出或划分标志信令通知的检查的位置是否在第二视频区域内;以及基于确定来执行转换。
11.根据解决方案10的方法,其中,位置被第一区域和第二区域覆盖。
12.根据解决方案10-11中的任一项的方法,其中,如果位置在第二视频区域之外,则亮度样点被标记为不可用并且在转换中不被使用。
以下解决方案可以与先前章节中列出的项目(例如,项目8)中描述的附加技术一起实现。
13.一种视频处理的方法,包括:执行在包括一个或多个视频图片的视频和视频的编解码表示之间的转换,该一个或多个视频图片包括一个或多个视频块;其中,编解码表示遵守编解码语法要求,转换在视频单元内不使用子图片编解码/解码和动态分辨率转换编码/解码工具或参考图片重采样工具。
14.根据解决方案13的方法,其中,视频单元对应于一个或多个视频图片的序列。
15.根据解决方案13-14中的任一项的方法,其中,动态分辨率转换编码/解码工具包括自适应分辨率转换编码/解码工具。
16.根据解决方案13-14中的任一项的方法,其中,动态分辨率转换编码/解码工具包括动态分辨率转换编码/解码工具。
17.根据解决方案13-16中的任一项的方法,其中,编解码表示指示视频单元遵守编解码语法要求。
18.根据解决方案17的方法,其中,编解码表示指示视频单元使用子图片编解码。
19.根据解决方案17的方法,其中,编解码表示指示视频单元使用动态分辨率转换编码/解码工具或参考图片重采样工具。
以下解决方案可以与先前章节中列出的项目(例如,项目10)中描述的附加技术一起实现。
20.根据解决方案1-19中的任一项的方法,其中,第二视频区域包括视频子图片,并且其中,第二视频区域的边界和另一视频区域的边界也是两个编解码树单元之间的边界。
21.根据解决方案1-19中的任一项的方法,其中,第二视频区域包括视频子图片,并且其中,第二视频区域的边界和另一视频区域的边界也是两个编解码树单元之间的边界。
以下解决方案可以与先前章节中列出的项目(例如,项目11)中描述的附加技术一起实现。
22.根据解决方案1-21中的任一项的方法,其中,第一视频区域和第二视频区域具有矩形形状。
以下解决方案可以与先前章节中列出的项目(例如,项目12)中描述的附加技术一起实现。
23.根据解决方案1-22中的任一项的方法,其中,第一视频区域和第二视频区域是不重叠的。
以下解决方案可以与先前章节中列出的项目(例如,项目13)中描述的附加技术一起实现。
24.根据解决方案1-23中的任一项的方法,其中,视频图片被分为视频区域,使得视频图片中的像素被一个且仅一个视频区域覆盖。
以下解决方案可以与先前章节中列出的项目(例如,项目15)中描述的附加技术一起实现。
25.根据解决方案1-24中的任一项的方法,其中,由于视频图片在视频序列的具体层中,所以视频图片被划分为第一视频区域和第二视频区域。
以下解决方案可以与先前章节中列出的项目(例如,项目10)中描述的附加技术一起实现。
26.一种视频处理的方法,包括:执行在包括一个或多个视频图片的视频和视频的编解码表示之间的转换,一个或多个视频图片包括一个或多个视频块,其中,编解码表示遵守编解码语法要求,第一语法元素subpic_grid_idx[i][j]不大于第二语法元素max_subpics_minus1。
27.根据解决方案26的方法,其中,表示第一语法元素的码字不大于表示第二语法元素的码字。
28.根据解决方案1-27中的任一项的方法,其中,第一视频区域包括视频子图片。
29.根据解决方案1-28中的任一项的方法,其中,第二视频区域包括视频子图片。
30.根据解决方案1至29中的任一项的方法,其中,转换包括将视频编码为编解码表示。
31.根据解决方案1至29中的任一项的方法,其中,转换包括对编解码表示进行解码以生成视频的像素值。
32.一种视频解码装置,包括处理器,该处理器被配置为实现解决方案1至31中的一项或多项中所述的方法。
33.一种视频编码装置,包括处理器,该处理器被配置为实现解决方案1至31中的一项或多项中所述的方法。
34.一种其上储存有计算机代码的计算机程序产品,该代码在由处理器执行时使得处理器实现解决方案1至31中任何一项所述的方法。
35.本文档中描述的一种方法、装置或系统。
图8是示出其中可以实现本文中所公开的各种技术的示例视频处理系统800的框图。各种实现方式可以包括系统800的一些或所有组件。系统800可以包括用于接收视频内容的输入802。视频内容可以以原始或未压缩的格式(例如8或10比特多分量像素值)接收,或者可以以压缩或编码的格式接收。输入802可以表示网络接口、外围总线接口或储存接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统800可以包括编解码组件804,其可以实现本文档中描述的各种编解码或编码方法。编解码组件804可以将来自输入802的视频的平均比特率降低到编解码组件804的输出,以产生视频的编解码表示。因此,编解码技术有时称为视频压缩或视频转码技术。如组件806所表示的,编解码组件804的输出可以被储存或经由所连接的通信来发送。在输入802处接收的视频的储存或传送的比特流(或编解码)表示可以由组件808使用,以生成像素值或可显示视频,该像素值或可显示视频被发送到显示接口810。从比特流表示中生成用户可见视频的过程有时称为视频解压缩。此外,虽然某些视频处理操作称为“编解码”操作或工具,但是应当理解,在编码器处使用编解码工具或操作,并且由解码器执行与编解码结果相反的对应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清多媒体接口(HDMI)或显示端口(Displayport)等。储存接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以实施在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其他能够执行数字数据处理和/或视频显示的设备。
图9是图示可以利用本公开的技术的示例视频编解码系统100的框图。
如图9所示,视频编解码系统100可以包括源设备110和目的地设备120。源设备110生成编码视频数据,该源设备110可以称为视频编码设备。目的地设备120可以对由源设备110生成的编码视频数据进行解码,该目的地设备120可以称为视频解码设备。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备的源,从视频内容提供商接收视频数据的接口和/或用于生成视频数据的计算机图形系统,或者这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关联的数据。编解码图片是图片的编解码表示。相关联的数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发送器。编码的视频数据可以通过网络130a经由I/O接口116直接发送到目的地设备120。编码视频数据也可以储存在储存介质/服务器130b上,以供目的地设备120访问。
目的地设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或储存介质/服务器130b获得编码视频数据。视频解码器124可以对编码视频数据进行解码。显示设备122可以将解码视频数据显示给用户。显示设备122可以与目的地设备120集成在一起,或者可以在被配置为与外部显示设备接口连接的目的地设备120的外部。
视频编码器114和视频解码器124可以根据诸如高效视频编解码(HEVC)标准、通用视频编解码(VVC)标准和其他当前和/或将来标准的视频压缩标准来操作。
图10是图示视频编码器200的示例的框图,视频编码器200可以图9所示的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或所有技术。在图10的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分割单元201,预测单元202,其可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206,残差生成单元207,变换单元208,量化单元209,逆量化单元210,逆变换单元211,重构单元212,缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以在IBC模式下执行预测,其中至少一个参考图片是当前视频块位于的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以高度集成,但是出于解释的目的,在图5的示例中分开表示。
分割单元201可以将图片分割为一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以例如基于错误结果而选择帧内或帧间编解码模式之一,并将所得到的帧内或帧间编解码块提供给残差生成单元207以生成残差块数据,并且将所得到的帧内或帧间编解码块提供给重构单元212以重构编码块从而用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测(CIIP)模式的组合,其中,预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下,模式选择单元203还可以为该块选择运动矢量的分辨率(例如,子像素或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较来生成当前视频块的运动信息。运动补偿单元205可以基于运动信息和来自缓冲器213的除与当前视频块相关联的图片之外的图片的解码样点来确定当前视频块的预测视频块。
运动估计单元204和运动补偿单元205可以例如取决于当前视频块是I条带、P条带还是B条带来对当前视频块执行不同的操作。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以在列表0或列表1的参考图片中搜索当前视频块的参考视频块。然后,运动估计单元204可以生成指示列表0或列表1中的参考图片的参考索引,该列表0或列表1包含参考视频块以及指示当前视频块和参考视频块之间的空间位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以对当前视频块执行双向预测,运动估计单元204可以在列表0中的参考图片中搜索当前视频块的参考视频块,并且还可以在列表1的参考图片中搜索当前视频块的另一参考视频块。然后,运动估计单元204可以生成指示列表0和列表1中包含参考视频块的参考图片的参考索引以及指示参考视频块和当前视频块之间的空间位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出运动信息的全集以用于解码器的解码过程。
在一些实例中,运动估计单元204可以不输出当前视频的运动信息的全集。而是,运动估计单元204可以参考另一视频块的运动信息来信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与邻域视频块的运动信息充分相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示向视频解码器300指示当前视频块具有与另一视频块相同的运动信息的值。
在另一示例中,运动估计单元204可以在与当前视频块相关联的语法结构中识别另一视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量和指示的视频块的运动矢量之间的差。视频解码器300可以使用指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所述,视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实现的预测性信令通知技术的两个示例包括高级运动矢量预测(AMVP)和Merge模式信令通知。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于相同图片中其他视频块的解码样点来生成针对当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由负号指示)当前视频块的(一个或多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中的样点的不同样点分量的残差视频块。
在其他示例中,对于当前视频块,例如在跳过模式下,可能不存在当前视频块的残差数据,并且残差生成单元207可以不执行减去操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来为当前视频块生成一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以分别将逆量化和逆变换应用于变换系数视频块,以从变换系数视频块重构残差视频块。重构单元212可以将重构的残差视频块添加到由预测单元202生成的一个或多个预测视频块的对应样点中,以产生与当前块相关联的重构的视频块,以储存在缓冲器213中。
在重构单元212重构视频块之后,可以执行环路滤波操作以减少视频块中的视频块伪像。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收数据时,熵编码单元214可以执行一个或多个熵编码操作以生成熵编码的数据并输出包括熵编码的数据的比特流。
图11是图示视频解码器300的示例的框图,视频解码器300可以是图9所示的系统100中的视频解码器114。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图11的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各个组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图11的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305以及重构单元306和缓冲器307。在一些示例中,视频解码器300可以执行一般与相对于视频编码器200(例如,图10)描述的编码阶段相反的解码阶段。
熵解码单元301可以检索编码的比特流。编码的比特流可以包括熵编解码的视频数据(例如,视频数据的编码的块)。熵解码单元301可以对熵编解码的视频数据进行解码,并且运动补偿单元302可以从熵解码的视频数据中确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302可以例如通过执行AMVP和Merge模式来确定这样的信息。
运动补偿单元302可以产生运动补偿块,可能基于插值滤波器执行插值。语法元素中可以包括要与子像素精度一起使用的插值滤波器的标识符。
运动补偿单元302可以使用在视频块的编码期间由视频编码器200使用的插值滤波器,以计算参考块的子整数像素的插值。运动补偿单元302可以根据接收到的语法信息确定由视频编码器200使用的插值滤波器,并使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于对编码的视频序列的(一个或多个)帧和/或(一个或多个)条带进行编码的块的尺寸,描述如何对编码视频序列的图片的每个宏块进行分割的分割信息,指示如何对每个分割进行编码的模式,每个帧间编码块的一个或多个参考帧(和参考帧列表),以及用于解码编码的视频序列的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式,以从空间上相邻的块形成预测块。逆量化单元303对在比特流中提供并由熵解码单元301解码的量化的视频块系数进行逆量化,即,去量化。逆变换单元303应用逆变换。
重构单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的对应预测块加和,以形成解码的块。如果需要,还可以应用去块滤波器来对解码的块进行滤波,以移除块状伪影。然后,将解码的视频块储存在缓冲器307中,该缓冲器307为后续的运动补偿/帧内预测提供参考块,并且还产生解码的视频以在显示设备上呈现。
图12是根据本技术的用于视频处理的方法的流程表示。方法1200包括,在操作1210处,执行在包括一个或多个图片的视频和视频的比特流表示之间的转换。比特流表示要求符合格式规则,该格式规则指定每个图片被编解码为一个或多个条带。格式规则禁止图片中的样点被一个或多个条带中的任何一个覆盖。
在一些实施例中,图片包括多个子图片,并且格式规则还指定图片的子图片的多个条带覆盖整个子图片。在一些实施例中,比特流表示包括指示多个条带具有矩形形状的语法元素。在一些实施例中,条带与图片的最多一个子图片重叠。在一些实施例中,视频的片与图片的最多一个子图片重叠。在一些实施例中,视频的砖与图片的最多一个子图片重叠。
图13是根据本技术的用于视频处理的方法的流程表示。方法1300包括,在操作1310处,对于在视频的图片和视频的比特流表示之间的转换,根据与图片中的片的数目或砖的数目相关联的规则,确定信令通知图片中的一个或多个条带的信息的方式。方法1300包括,在操作1320处,基于确定来执行转换。
在一些实施例中,图片的一个或多个条带的信息至少包括一个或多个条带的数目或一个或多个条带的范围。在一些实施例中,规则指定如果图片中的砖的数目为1,则在比特流表示中排除图片中的一个或多个条带的信息。在一些实施例中,图片中的一个或多个条带的数目被认为是1。在一些实施例中,条带覆盖了整个图片。在一些实施例中,每个条带的砖的数目被认为是1。
图14是根据本技术的用于视频处理的方法的流程表示。方法1400包括,在操作1410处,根据规则,执行在视频的图片和视频的比特流表示之间的转换。在比特流表示中图片被编解码为一个或多个条带。规则指定在比特流表示中是否或如何包括图片的条带的地址。
在一些实施例中,规则指定条带的地址的信令通知独立于条带是否具有矩形形状的信令通知。在一些实施例中,规则指定如果条带为矩形形状,则条带的地址的信令通知取决于图片中的条带的数目。在一些实施例中,是否信令通知条带中的砖的数目至少部分地基于条带的地址。在一些实施例中,是否信令通知条带中的砖的数目还基于图片中砖的数目。
图15是根据本技术的用于视频处理的方法的流程表示。方法1500包括,在操作1510处,对于在视频的图片和视频的比特流表示之间的转换,基于图片中片的数目或砖的数目,确定比特流表示中是否包括语法元素,该语法元素指示启用访问图片中多个砖上的样点的滤波操作。方法1500包括,在操作1520处,基于确定来执行转换。在一些实施例中,如果图片中的砖的数目小于2,则在比特流表示中排除语法元素。
图16是根据本技术的用于视频处理的方法的流程表示。方法1600包括,在操作1610处,执行在视频的图片和视频的比特流表示之间的转换。图片包括一个或多个子图片,并且一个或多个子图片的数目由比特流表示中的语法元素指示。
在一些实施例中,多个子图片的数目被表示为N,并且语法元素包括(N-d)的值,N和d是整数。在一些实施例中,d是0、1或2。在一些实施例中,使用一元编解码方案或截短一元编解码方案对(N-d)的值进行编解码。在一些实施例中,使用固定长度编解码方案将(N-d)的值编解码为具有固定长度。在一些实施例中,固定长度是8比特。在一些实施例中,固定长度被表示为x-dx,x和dx是正整数。x等于或小于基于一致性规则确定的最大值,并且dx为0、1或2。在一些实施例中,信令通知x-dx。在一些实施例中,基于图片中的基本单元块的数目来确定固定长度。在一些实施例中,固定长度被表示为x,基本单元块的数目被表示为M,并且x=Ceil(log2(M+d0))+d1,d0和d1是整数。
在一些实施例中,预先确定(N-d)的最大值。在一些实施例中,基于图片中的基本单元块的数目来确定(N-d)的最大值。在一些实施例中,图片中的基本单元块的数目被表示为M,M是整数,并且N-d的最大值是M-d。在一些实施例中,基本单元块包括条带。在一些实施例中,基本单元块包括编解码树单元。在一些实施例中,d0或d1中的至少一个是-2、-1、0、1或2。
图17是根据本技术的用于视频处理的方法的流程表示。方法1700包括,在操作1710处,执行在包括一个或多个子图片的视频的图片和视频的比特流表示之间的转换。比特流表示符合格式规则,该格式规则基于以下中的至少一个来指定关于子图片的信息被包括在比特流表示中:(1)子图片的一个或多个角位置,或(2)子图片的维度。
在一些实施例中,格式规则还指定关于子图片的信息定位在关于比特流表示中的编解码树块的尺寸的信息之后。在一些实施例中,使用子图片中的块的粒度在比特流表示中信令通知子图片的一个或多个角位置。在一些实施例中,块包括基本单元块或编解码树块。
在一些实施例中,块的索引用于指示子图片的角位置。在一些实施例中,索引包括列索引或行索引。在一些实施例中,块的索引被表示为I,并且在比特流表示中信令通知(I-d)的值,d是0、1或2。在一些实施例中,基于先前编解码的子图片的索引和另一整数d1来确定d,d1等于-1、0或1。在一些实施例中,在比特流表示中信令通知(I-d)的符号。
在一些实施例中,是否在比特流表示中信令通知子图片的位置是基于子图片的索引。在一些实施例中,如果子图片是图片中的第一子图片,则在比特流表示中省略子图片的位置。在一些实施例中,子图片的左顶位置被确定为(0,0)。在一些实施例中,如果子图片是图片中的最后一个子图片,则在比特流表示中省略子图片的位置。在一些实施例中,基于关于先前转换的子图片的信息来确定子图片的左顶位置。在一些实施例中,关于子图片的信息包括子图片的左顶位置和维度。使用截短一元编解码方案、截短二进制编解码方案、一元编解码方案、固定长度编解码方案,或第K个EG编解码方案对信息进行编解码。
在一些实施例中,使用子图片中的块的粒度在比特流表示中信令通知子图片的维度。在一些实施例中,维度包括子图片的宽度或高度。在一些实施例中,维度被表示为子图片中的块的列数或行数。在一些实施例中,块的列数或行数被表示为I,并且在比特流表示中信令通知(I-d)的值,d为0、1或2。在一些实施例中,基于先前编解码的子图片的块的维度和另一整数d1来确定d,d1等于-1、0或1。在一些实施例中,在比特流表示中信令通知(I-d)的符号。
在一些实施例中,使用固定长度编解码方案将(I-d)的值编解码为具有固定长度。在一些实施例中,固定长度是8比特。在一些实施例中,固定长度被表示为x-dx,x和dx是正整数。x等于或小于基于一致性规则确定的最大值,并且dx为0、1或2。在一些实施例中,基于图片中的基本单元块的数目来确定固定长度。在一些实施例中,固定长度被表示为x,基本单元块的数目被表示为M,并且x=Ceil(log2(M+d0))+d1,d0和d1是整数。在一些实施例中,d0或d1中的至少一个是-2、-1、0、1或2。在一些实施例中,针对图片的所有子图片信令通知(I-d)。在一些实施例中,针对图片的子图片的子集信令通知(I-d)。在一些实施例中,如果子图片的数目等于1,则在比特流表示中省略(I-d)的值。在一些实施例中,如果子图片是图片的第一子图片,则在比特流表示中省略(I-d)的值。在一些实施例中,(I-d)的值被确定为0。在一些实施例中,如果子图片是图片中的最后一个子图片,则在比特流表示中省略(I-d)的值。在一些实施例中,基于关于先前转换的子图片的信息来确定(I-d)的值。
在一些实施例中,单个语法元素有条件地包括在比特流表示中以指示是否将图片的所有子图片均处理为图片。在一些实施例中,单个语法元素有条件地包括在比特流表示中,以指示对于所有子图片,环路滤波器是否适用于图片的子图片。在一些实施例中,如果图片的子图片的数目等于1,则在比特流表示中省略单个语法元素。
图18是根据本技术的用于视频处理的方法的流程表示。方法1800包括,在操作1810处,对于视频的图片和视频的比特流表示之间的转换,由于图片被分为一个或多个子图片,确定启用参考图片重采样工具。方法1800还包括,在操作1820处,基于确定来执行转换。
在一些实施例中,基于比率的集合来确定在参考图片重采样编解码工具中使用的缩放比率。在一些实施例中,比率的集合包括以下中的至少一个:{1∶1,1∶2},{1∶1,2∶1},{1∶1,1∶2,1∶4},{1∶1,1∶2,4∶1},{1∶1,2∶1,1∶4},{1∶1,2∶1,4∶1},{1∶1,1∶2,1∶4,1∶8},{1∶1,1∶2,1∶4,8∶1},{1∶1,1∶2,4∶1,1∶8},{1∶1,1∶2,4∶1,8∶1},{1∶1,2∶1,1∶4,1∶8},{1∶1,2∶1,1∶4,8∶1},{1∶1,2∶1,4∶1,1∶8}或{1∶1,2∶1,4∶1,8∶1}。在一些实施例中,如果图片的分辨率与第二图片的分辨率不同,则图片的编解码树块的尺寸与第二图片的编解码树块的尺寸不同。在一些实施例中,图片的子图片的维度为SAW×SAH,并且视频的第二图片的子图片的维度为SBW×SBH。在图片和第二图片之间的缩放比率是沿水平方向和垂直方向的Rw和Rh。SAW/SBW或SBW/SAW等于Rw,而SAH/SBH或SBH/SAH等于Rh。
图19是根据本技术的用于视频处理的方法的流程表示。方法1900包括,在操作1910处,执行在包括视频图片的视频和视频的比特流表示之间的转换,该视频图片包括一个或多个子图片,该一个或多个子图片包括一个或多个条带。比特流表示符合格式规则,该格式规则指定对于子图片和条带,如果在条带的头中包括标识子图片的索引,则条带的地址字段指示子图片中的条带的地址。
在一些实施例中,转换从比特流表示生成视频。在一些实施例中,转换从视频生成比特流表示。
所公开技术的一些实施例包括做出决定或确定以启用视频处理工具或模式。在示例中,当启用视频处理工具或模式时,编码器将在视频块的处理中使用或实现该工具或模式,但是不一定基于工具或模式的使用来修改所得到的比特流。换言之,当基于决定或确定而启用视频处理工具或模式时,从视频块到视频的比特流表示的转换将使用视频处理工具或模式。在另一示例中,当启用视频处理工具或模式时,解码器将在知道比特流已经基于视频处理工具或模式被修改的情况下处理比特流。换言之,从视频的比特流表示到视频块的转换将使用基于决定或确定而启用的视频处理工具或模式来执行。
所公开技术的一些实施例包括做出决定或确定以禁用视频处理工具或模式。在示例中,当禁用视频处理工具或模式时,编码器将在视频块到视频的比特流表示的转换中不使用该工具或模式。在另一示例中,当禁用视频处理工具或模式时,解码器将在知道比特流没有使用基于决定或确定而启用的视频处理工具或模式被修改的情况下处理比特流。
本文档中描述的公开的和其他的方案、示例、实施例、模块和功能操作可以在数字电子电路中或者在计算机软件、固件或硬件(包括本文档中公开的结构以及其结构的等同)中,或者在其一个或多个的组合中实现。所公开的和其它的实施例可以实现为一个或多个计算机程序产品,例如,在计算机可读介质上编码的一个或多个计算机程序指令模块,用于由数据处理装置执行或控制数据处理装置的操作。该计算机可读介质可以是机器可读储存设备、机器可读储存基板、存储器设备、影响机器可读可传播信号的物质组分、或其一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或者其一个或多个的组合的代码。传播信号是人工生成的信号,例如机器生成的电信号、光信号或电磁信号,其被生成以对信息进行编码以便传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式来部署计算机程序,包括作为独立程序或作为模块、组件、子例程或其它适合在计算环境中使用的单元。计算机程序不一定对应于文件系统中的文件。程序可以储存在文件的保存其他程序或数据的一部分中(例如,储存在标记语言文档中的一个或多个脚本)、在专用于所讨论的程序的单个文件中、或在多个协同文件中(例如储存一个或多个模块、子程序或代码的一部分的文件)。计算机程序可以部署为在一个计算机上或者在多个计算机上执行,该多个计算机位于一个站点处或者分布跨越多个站点并由通信网络互连。
可以由执行一个或多个计算机程序的一个或多个可编程处理器来执行在本文档中所描述的过程和逻辑流,以通过在输入数据上操作并且生成输出来执行功能。也可以由专用逻辑电路(例如FPGA(现场可编程门阵列)或ASIC(专用集成电路))执行过程和逻辑流,并且设备可以实现为专用逻辑电路(例如FPGA(现场可编程门阵列)或ASIC(专用集成电路))。
适合于计算机程序的执行的处理器包括例如通用和专用微处理器两者,以及任何种类的数字计算机的任何一个或多个处理器。一般,处理器将从只读存储器或随机存取存储器或者该两者接收指令和数据。计算机的必要元件是用于执行指令的处理器和用于储存指令和数据的一个或多个存储器设备。一般,计算机还将包括用于储存数据的一个或多个大容量储存设备(例如磁、磁光盘或光盘),或者可操作地耦接以从一个或多个大容量储存设备(例如磁、磁光盘或光盘)接收数据或者将数据传输到一个或多个大容量储存设备(例如磁、磁光盘或光盘),或者以上两者。然而,计算机不需要具有这样的设备。适用于储存计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪速存储器设备)、磁盘(例如内部硬盘或可移除磁盘)、磁光盘,以及CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充,或者并入专用逻辑电路。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何主题或可要求保护的范围的限制,而是作为特定于特定技术的特定实施例的特征的描述。在本专利文档中,在分开的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反地,在单个实施例的上下文中所描述的各种特征还可以分别在多个实施例中实现或者以各种合适的子组合实现。此外,尽管特征可以如上文描述为以某些组合起作用并且甚至最初这样要求,但是在某些情况下来自所要求保护的组合的一个或多个特征可以从组合中去除,并且所要求保护的组合可以针对子组合或子组合的变型。
类似地,尽管在附图中以特定次序描绘了操作,但这不应当理解为要求按所示的特定次序或顺序次序执行这样的操作或者执行所有示出的操作,以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分开不应被理解为在所有实施例中都要求这种分开。
仅描述了几个实现方式和示例,并且可以基于本专利文档中描述和示出的内容来作出其它实现方式、增强和变型。

Claims (84)

1.一种视频处理方法,包括:
对于视频的图片和所述视频的比特流之间的转换,将所述图片分割为一个或多个子图片;以及
至少基于所述分割执行所述转换,
其中,所述比特流包括指示所述一个或多个子图片的数目的第一语法元素,并且
其中,所述第一语法元素是使用具有ue(v)的描述符的方案编解码的,
其中,所述一个或多个子图片的子图片通过在所述比特流中包括以下语法元素来指示:以CtbSizeY为单位指示所述子图片的左顶编解码树块(CTB)的水平位置的第二语法元素、以CtbSizeY为单位指示所述子图片的左顶CTB的垂直位置的第三语法元素,以CtbSizeY为单位指示所述子图片的宽度的第四语法元素,以CtbSizeY为单位指示所述子图片的高度的第五语法元素,并且
其中,CtbSizeY表示编解码树块的尺寸。
2.根据权利要求1所述的方法,其中,所述一个或多个子图片的数目表示为N,所述第一语法元素的值表示为(N-1),并且N是整数。
3.根据权利要求1所述的方法,其中,用于所述图片的所述第一语法元素的允许最大值是固定值。
4.根据权利要求1所述的方法,其中,当所述子图片为所述图片内的第一子图片时,所述比特流中不包括所述第二语法元素和所述第三语法元素,并且所述第二语法元素和所述第三语法元素的值推断为0。
5.根据权利要求1所述的方法,其中,所述第二语法元素是使用固定长度编解码来编解码的,
其中,所述第二语法元素的长度是基于Ceil(Log2(V1))导出的,并且
其中,V1是基于与所述图片的宽度和CtbSizeY相关的变量确定的,并且
其中,Ceil(x)表示大于或等于x的最小整数。
6.根据权利要求1所述的方法,其中,所述第三语法元素是用固定长度编解码来编解码的,
其中,所述第三语法元素的长度是基于Ceil(Log2(V2))导出的,
其中,V2是基于与所述图片的高度和CtbSizeY相关的变量确定的,并且
其中,Ceil(x)表示大于或等于x的最小整数。
7.根据权利要求1所述的方法,其中,所述第四语法元素是使用固定长度编解码来编解码的,
其中,第四语法元素的长度是基于Ceil(Log2(V1))导出的,
其中,V1是基于与所述图片的宽度和CtbSizeY相关的变量确定的,并且
其中,Ceil(x)表示大于或等于x的最小整数。
8.根据权利要求1所述的方法,其中,所述第五语法元素是使用固定长度编解码来编解码的,
其中,第五语法元素的长度是基于Ceil(Log2(V2))导出的,
其中,V2是基于与所述图片的高度和CtbSizeY相关的变量确定的,并且
其中,Ceil(x)表示大于或等于x的最小整数。
9.根据权利要求1所述的方法,其中,在包括第六语法元素之后,所述比特流中包括所述第一语法元素、所述第二语法元素、所述第三语法元素、所述第四语法元素和所述第五语法元素,并且
其中,所述第六语法元素加5的值与编解码树单元尺寸有关。
10.根据权利要求9所述的方法,其中,在包括所述第一语法元素、所述第二语法元素、所述第三语法元素、所述第四语法元素和所述第五语法元素之后,所述比特流中包括指示在排除环路滤波操作的过程中是否将所述子图片视为图片的子图片视为图片的标志。
11.根据权利要求9所述的方法,其中,在包括所述第一语法元素、所述第二语法元素、所述第三语法元素、所述第四语法元素和所述第五语法元素之后,所述比特流中包括指示是否可以跨所述子图片的边界执行环路滤波操作的启用跨子图片环路滤波的标志。
12.根据权利要求1至11中任一项所述的方法,其中,具有ue(v)的描述符的方案是0阶Exp-Golomb编解码方案。
13.根据权利要求1至11中任一项所述的方法,其中,所述转换包括将所述图片编码到所述比特流中。
14.根据权利要求1至11中任一项所述的方法,其中,所述转换包括从所述比特流解码所述图片。
15.一种用于处理视频数据的装置,包括处理器和其上带有指令的非暂时性存储器,其中,所述指令在由所述处理器执行时使所述处理器:
对于视频的图片和所述视频的比特流之间的转换,将所述图片分割为一个或多个子图片;以及
至少基于所述分割执行所述转换,
其中,所述比特流包括指示所述一个或多个子图片的数目的第一语法元素,并且
其中,所述第一语法元素是使用具有ue(v)的描述符的方案编解码的,
其中,所述一个或多个子图片的子图片通过在所述比特流中包括以下语法元素来指示:以CtbSizeY为单位指示所述子图片的左顶编解码树块(CTB)的水平位置的第二语法元素、以CtbSizeY为单位指示所述子图片的左顶CTB的垂直位置的第三语法元素,以CtbSizeY为单位指示所述子图片的宽度的第四语法元素,以CtbSizeY为单位指示所述子图片的高度的第五语法元素,并且
其中,CtbSizeY表示编解码树块的尺寸。
16.根据权利要求15所述的装置,其中,所述一个或多个子图片的数目表示为N,所述第一语法元素的值表示为(N-1),并且N是整数。
17.一种存储指令的非暂时性计算机可读存储介质,所述指令使处理器:
对于视频的图片和所述视频的比特流之间的转换,将所述图片分割为一个或多个子图片;以及
至少基于所述分割执行所述转换,
其中,所述比特流包括指示所述一个或多个子图片的数目的第一语法元素,并且
其中,所述第一语法元素是使用具有ue(v)的描述符的方案编解码的,
其中,所述一个或多个子图片的子图片通过在所述比特流中包括以下语法元素来指示:以CtbSizeY为单位指示所述子图片的左顶编解码树块(CTB)的水平位置的第二语法元素、以CtbSizeY为单位指示所述子图片的左顶CTB的垂直位置的第三语法元素,以CtbSizeY为单位指示所述子图片的宽度的第四语法元素,以CtbSizeY为单位指示所述子图片的高度的第五语法元素,并且
其中,CtbSizeY表示编解码树块的尺寸。
18.根据权利要求17所述的非暂时性计算机可读存储介质,其中,所述一个或多个子图片的数目表示为N,所述第一语法元素的值表示为(N-1),并且N是整数。
19.根据权利要求17所述的非暂时性计算机可读存储介质,其中,当所述子图片为所述图片内的第一子图片时,所述比特流中不包括所述第二语法元素和所述第三语法元素,并且所述第二语法元素和所述第三语法元素的值推断为0。
20.一种存储视频的比特流的方法,所述方法包括:
对于视频的图片,将所述图片分割为一个或多个子图片;
至少基于所述分割生成所述比特流;以及
在非暂时性计算机可读记录介质中存储所述比特流,
其中,所述比特流包括指示所述一个或多个子图片的数目的第一语法元素,并且
其中,所述第一语法元素是使用具有ue(v)的描述符的方案编解码的,
其中,所述一个或多个子图片的子图片通过在所述比特流中包括以下语法元素来指示:以CtbSizeY为单位指示所述子图片的左顶编解码树块(CTB)的水平位置的第二语法元素、以CtbSizeY为单位指示所述子图片的左顶CTB的垂直位置的第三语法元素,以CtbSizeY为单位指示所述子图片的宽度的第四语法元素,以CtbSizeY为单位指示所述子图片的高度的第五语法元素,并且
其中,CtbSizeY表示编解码树块的尺寸。
21.根据权利要求20所述的方法,其中,所述一个或多个子图片的数目表示为N,所述第一语法元素的值表示为(N-1),并且N是整数。
22.一种视频处理的方法,包括:
执行视频的图片和所述视频的比特流表示之间的转换,其中,所述图片包括一个或多个子图片,并且其中,所述一个或多个子图片的数目由所述比特流表示中的语法元素指示,
其中,所述一个或多个子图片的子图片通过在所述比特流中包括以下语法元素来指示:以CtbSizeY为单位指示所述子图片的左顶编解码树块(CTB)的水平位置的第二语法元素、以CtbSizeY为单位指示所述子图片的左顶CTB的垂直位置的第三语法元素,以CtbSizeY为单位指示所述子图片的宽度的第四语法元素,以CtbSizeY为单位指示所述子图片的高度的第五语法元素,并且
其中,CtbSizeY表示编解码树块的尺寸。
23.根据权利要求22所述的方法,其中,所述多个子图片的数目被表示为N,并且其中,所述语法元素包括(N-d)的值,N和d是整数。
24.根据权利要求23所述的方法,其中,d是0、1或2。
25.根据权利要求23所述的方法,其中,使用一元编解码方案或截短一元编解码方案对所述(N-d)的值进行编解码。
26.根据权利要求23所述的方法,其中,使用固定长度编解码方案将所述(N-d)的值编解码为具有固定长度。
27.根据权利要求26所述的方法,其中,所述固定长度是8比特。
28.根据权利要求26所述的方法,其中,所述固定长度被表示为x-dx,x和dx是正整数,其中,x等于或小于基于一致性规则确定的最大值,并且其中,dx为0、1或2。
29.根据权利要求28所述的方法,其中,信令通知x-dx。
30.根据权利要求26所述的方法,其中,基于所述图片中的基本单元块的数目来确定所述固定长度。
31.根据权利要求30所述的方法,其中,所述固定长度被表示为x,其中,基本单元块的数目被表示为M,并且其中,x = Ceil(log2(M+d0)) + d1,d0和d1是整数。
32.根据权利要求23至31中任一项所述的方法,其中,预先确定(N-d)的最大值。
33.根据权利要求23至31中任一项所述的方法,其中,基于所述图片中的基本单元块的数目来确定(N-d)的最大值。
34.根据权利要求33所述的方法,其中,所述图片中的基本单元块的数目被表示为M,M是整数,并且其中,所述N-d的最大值是M-d。
35.根据权利要求34所述的方法,其中,基本单元块包括条带。
36.根据权利要求34所述的方法,其中,基本单元块包括编解码树单元。
37.根据权利要求31所述的方法,其中,d0或d1中的至少一个是-2、-1、0、1或2。
38.一种视频处理的方法,包括:
执行在包括一个或多个子图片的视频的图片和所述视频的比特流表示之间的转换,
其中,所述比特流表示符合格式规则;并且
其中,所述格式规则基于以下中的至少一个来指定关于子图片的信息被包括在所述比特流表示中:(1)所述子图片的一个或多个角位置,或(2)所述子图片的维度,
其中,所述一个或多个子图片的子图片通过在所述比特流中包括以下语法元素来指示:以CtbSizeY为单位指示所述子图片的左顶编解码树块(CTB)的水平位置的第二语法元素、以CtbSizeY为单位指示所述子图片的左顶CTB的垂直位置的第三语法元素,以CtbSizeY为单位指示所述子图片的宽度的第四语法元素,以CtbSizeY为单位指示所述子图片的高度的第五语法元素,并且
其中,CtbSizeY表示编解码树块的尺寸。
39.根据权利要求38所述的方法,其中,所述格式规则还指定,在关于所述比特流表示中的编解码树块的尺寸的信息之后定位关于所述子图片的信息。
40.根据权利要求38所述的方法,其中,使用所述子图片中的块的粒度在所述比特流表示中信令通知所述子图片的一个或多个角位置。
41.根据权利要求40所述的方法,其中,所述块包括基本单元块或编解码树块。
42.根据权利要求38所述的方法,其中,块的索引用于指示所述子图片的角位置。
43.根据权利要求42所述的方法,其中,所述索引包括列索引或行索引。
44.根据权利要求42所述的方法,其中,所述块的索引被表示为I,并且其中,在所述比特流表示中信令通知(I-d)的值,d是0、1或2。
45.根据权利要求43所述的方法,其中,基于先前编解码的子图片的索引和另一整数d1来确定d,d1等于-1、0或1。
46.根据权利要求43所述的方法,其中,在所述比特流表示中信令通知(I-d)的符号。
47.根据权利要求38所述的方法,其中,是否在所述比特流表示中信令通知所述子图片的位置是基于所述子图片的索引。
48.根据权利要求47所述的方法,其中,如果所述子图片是所述图片中的第一子图片,则在所述比特流表示中省略所述子图片的位置。
49.根据权利要求48所述的方法,其中,所述子图片的左顶位置被确定为(0,0)。
50.根据权利要求47所述的方法,其中,如果所述子图片是所述图片中的最后一个子图片,则在所述比特流表示中省略所述子图片的位置。
51.根据权利要求50所述的方法,其中,基于关于先前转换的子图片的信息来确定所述子图片的左顶位置。
52.根据权利要求38所述的方法,其中,关于所述子图片的信息包括所述子图片的左顶位置和维度,并且其中,使用截短一元编解码方案、截短二进制编解码方案、一元编解码方案、固定长度编解码方案,或第K个EG编解码方案对所述信息进行编解码。
53.根据权利要求38所述的方法,其中,使用所述子图片中的块的粒度在所述比特流表示中信令通知所述子图片的维度。
54.根据权利要求53所述的方法,其中,所述维度包括所述子图片的宽度或高度。
55.根据权利要求52所述的方法,其中,所述维度被表示为所述子图片中的块的列数或行数。
56.根据权利要求55所述的方法,其中,所述块的列数或行数被表示为I,并且其中,在所述比特流表示中信令通知(I-d)的值,d为0、1或2。
57.根据权利要求56所述的方法,其中,基于先前编解码的子图片的块的维度和另一整数d1来确定d,d1等于-1、0或1。
58.根据权利要求56所述的方法,其中,在所述比特流表示中信令通知(I-d)的符号。
59.根据权利要求44所述的方法,其中,使用固定长度编解码方案将所述(I-d)的值编解码为具有固定长度。
60.根据权利要求59所述的方法,其中,所述固定长度是8比特。
61.根据权利要求59所述的方法,其中,所述固定长度被表示为x-dx,x和dx是正整数,其中,x等于或小于基于一致性规则确定的最大值,并且其中,dx为0、1或2。
62.根据权利要求59所述的方法,其中,基于所述图片中的基本单元块的数目来确定所述固定长度。
63.根据权利要求62所述的方法,其中,所述固定长度被表示为x,其中,所述基本单元块的数目被表示为M,并且其中,x = Ceil(log2(M+d0)) + d1,d0和d1是整数。
64.根据权利要求63所述的方法,其中,d0或d1中的至少一个是-2、-1、0、1或2。
65.根据权利要求44所述的方法,其中,针对所述图片的所有子图片信令通知(I-d)。
66.根据权利要求44所述的方法,其中,针对所述图片的子图片的子集信令通知(I-d)。
67.根据权利要求66所述的方法,其中,如果所述子图片的数目等于1,则在所述比特流表示中省略所述(I-d)的值。
68.根据权利要求66所述的方法,其中,如果所述子图片是所述图片的第一子图片,则在所述比特流表示中省略所述(I-d)的值。
69.根据权利要求68所述的方法,其中,所述(I-d)的值被确定为0。
70.根据权利要求66所述的方法,其中,如果所述子图片是所述图片中的最后一个子图片,则在所述比特流表示中省略所述(I-d)的值。
71.根据权利要求70所述的方法,其中,基于关于先前转换的子图片的信息来确定所述(I-d)的值。
72.根据权利要求38至71中的任一项所述的方法,其中,单个语法元素有条件地包括在所述比特流表示中,以指示是否将所述图片的所有子图片均处理为图片。
73.根据权利要求38至71中的任一项所述的方法,其中,单个语法元素有条件地包括在所述比特流表示中,以指示对于所有子图片,环路滤波器是否适用于所述图片的子图片。
74.根据权利要求72所述的方法,其中,如果所述图片的子图片的数目等于1,则在所述比特流表示中省略所述单个语法元素。
75.一种视频处理的方法,包括:
对于视频的图片和所述视频的比特流表示之间的转换,由于所述图片被分为一个或多个子图片,确定启用参考图片重采样工具;以及
基于所述确定来执行所述转换,
其中,所述一个或多个子图片的子图片通过在所述比特流中包括以下语法元素来指示:以CtbSizeY为单位指示所述子图片的左顶编解码树块(CTB)的水平位置的第二语法元素、以CtbSizeY为单位指示所述子图片的左顶CTB的垂直位置的第三语法元素,以CtbSizeY为单位指示所述子图片的宽度的第四语法元素,以CtbSizeY为单位指示所述子图片的高度的第五语法元素,并且
其中,CtbSizeY表示编解码树块的尺寸。
76.根据权利要求75所述的方法,其中,基于比率的集合来确定在所述参考图片重采样编解码工具中使用的缩放比率。
77.根据权利要求76所述的方法,其中,所述比率的集合包括以下中的至少一个:{1:1,1:2},{1:1,2:1},{1:1,1:2,1:4},{1:1,1:2,4:1},{1:1,2:1,1:4},{1:1,2:1,4:1},{1:1,1:2,1:4,1:8},{1:1,1:2,1:4,8:1},{1:1,1:2,4:1,1:8},{1:1,1:2,4:1,8:1},{1:1,2:1,1:4,1:8},{1:1,2:1,1:4,8:1},{1:1,2:1,4:1,1:8}或{1:1,2:1,4:1,8:1}。
78.根据权利要求75至77中的任一项所述的方法,其中,如果所述图片的分辨率与第二图片的分辨率不同,则所述图片的编解码树块的尺寸与所述第二图片的编解码树块的尺寸不同。
79.根据权利要求75至77中的任一项所述的方法,其中,所述图片的子图片的维度为SAW×SAH,并且所述视频的第二图片的子图片的维度为SBW×SBH,其中,在所述图片和所述第二图片之间的缩放比率是沿水平方向和垂直方向的RW和Rh,其中,SAW/SBW或SBW/SAW等于Rw,并且其中,SAH/SBH或SBH/SAH等于Rh。
80.一种视频处理的方法,包括:
执行在包括视频图片的视频和所述视频的比特流表示之间的转换,所述视频图片包括一个或多个子图片,所述子图片包括一个或多个条带,
其中,所述比特流表示符合格式规则,
其中,所述格式规则指定,对于子图片和条带,如果在所述条带的头中包括标识所述子图片的索引,则所述条带的地址字段指示所述子图片中的所述条带的地址,
其中,所述一个或多个子图片的子图片通过在所述比特流中包括以下语法元素来指示:以CtbSizeY为单位指示所述子图片的左顶编解码树块(CTB)的水平位置的第二语法元素、以CtbSizeY为单位指示所述子图片的左顶CTB的垂直位置的第三语法元素,以CtbSizeY为单位指示所述子图片的宽度的第四语法元素,以CtbSizeY为单位指示所述子图片的高度的第五语法元素,并且
其中,CtbSizeY表示编解码树块的尺寸。
81.根据权利要求80所述的方法,其中,所述转换从所述比特流表示生成所述视频。
82.根据权利要求80所述的方法,其中,所述转换从所述视频生成所述比特流表示。
83.一种视频处理装置,包括处理器,所述处理器被配置为实现根据权利要求22至82中任一项所述的方法。
84.一种其上储存有代码的计算机可读介质,所述代码当执行时使得处理器实现根据权利要求22至82中任一项所述的方法。
CN202080069970.0A 2019-10-02 2020-10-09 视频比特流中子图片信令通知的语法 Active CN114503577B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CNPCT/CN2019/109809 2019-10-02
CN2019109809 2019-10-02
PCT/CN2020/119932 WO2021063421A1 (en) 2019-10-02 2020-10-09 Syntax for subpicture signaling in a video bitstream

Publications (2)

Publication Number Publication Date
CN114503577A CN114503577A (zh) 2022-05-13
CN114503577B true CN114503577B (zh) 2024-07-05

Family

ID=

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Versatile Video Coding (Draft 6);Benjamin Bross;Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 15th Meeting: Gothenburg, SE, 3–12 July 2019, JVET-O2001-vE;第30-88页 *

Similar Documents

Publication Publication Date Title
CN114208165B (zh) 子图片解码中的缓冲器管理
CN114631321B (zh) 子图片与环路滤波之间的相互影响
KR102609308B1 (ko) 비디오 비트스트림에서의 서브픽처 시그널링을 위한 신택스
JP2023511059A (ja) ビデオコーディング及び復号の制約
CN113841402A (zh) 视频编解码中大块的变换设计
CN114503577B (zh) 视频比特流中子图片信令通知的语法
CN115362677A (zh) 在视频比特流中以子图片级别信令通知参数
CN115280768A (zh) 视频编解码中的子图片边界滤波

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant