CN115486063A - 视频编解码中的一致性窗口参数 - Google Patents

视频编解码中的一致性窗口参数 Download PDF

Info

Publication number
CN115486063A
CN115486063A CN202180026946.3A CN202180026946A CN115486063A CN 115486063 A CN115486063 A CN 115486063A CN 202180026946 A CN202180026946 A CN 202180026946A CN 115486063 A CN115486063 A CN 115486063A
Authority
CN
China
Prior art keywords
video
picture
unit
bitstream
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180026946.3A
Other languages
English (en)
Inventor
王业奎
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of CN115486063A publication Critical patent/CN115486063A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2381Adapting the multiplex stream to a specific network, e.g. an Internet Protocol [IP] network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6125Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了用于视频处理的方法和装置。视频处理可以包括视频编码、视频解码或视频转码。一种示例视频处理方法包括根据格式规则来执行包括视频单元中的图片的视频和视频的比特流之间的转换。格式规则指定,响应于图片的宽度等于视频单元中的最大允许图片宽度并且图片的高度等于视频单元中的最大允许图片高度,对应于图片的图片参数集中的一致性窗口标志被设置为0值。

Description

视频编解码中的一致性窗口参数
相关申请的交叉引用
根据适用的专利法和/或依据巴黎公约的规则,本申请适时要求于2020年3月30日提交的美国临时专利申请第63/002,064号的优先权和权益。出于根据法律的所有目的,前述申请的全部公开通过引用而并入作为本申请的公开的一部分。
技术领域
本专利文档涉及图像和视频处理。
背景技术
数字视频占了互联网和其他数字通信网络上的最大带宽使用。随着能够接收和显示视频的连接用户设备的数量增加,预计对数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了可以由视频编码器和解码器用于使用对视频的编解码表示的解码有用的控制信息来处理编解码表示的技术。
在一个示例方面,公开了一种视频处理方法。该方法包括执行包括包含一个或多个条带的一个或多个图片的视频和视频的比特流之间的转换,其中比特流符合格式规则;其中格式规则指定是否或如何在比特流中指示一个或多个条带中的条带的条带类型依赖于条件,其中该条件基于通用约束标志、网络抽象层单元类型、或者条带是否在访问单元的第一个图片中。
在另一个示例方面,公开了一种视频处理方法。该方法包括执行包括包含多个条带的图片的视频和视频的比特流之间的转换,其中比特流符合指定图片标头中的标志控制图片中的所有条带的自适应环路滤波的应用性的格式规则。
在另一个示例方面,公开了一种视频处理方法。该方法包括根据格式规则来执行包括包含一个或多个条带的一个或多个图片的视频和视频的比特流之间的转换,其中格式规则指定与视频相关联的参数集的重复时间。
在另一个示例方面,公开了一种视频处理方法。该方法包括根据格式规则来执行包括视频单元中的图片的视频和视频的比特流之间的转换,其中格式规则指定,响应于图片的宽度等于视频单元中的最大允许图片宽度并且图片的高度等于视频单元中的最大允许图片高度,对应于图片的图片参数集中的一致性窗口标志被设置为0值。
在另一个示例方面,公开了一种视频处理方法。该方法包括执行包括包含一个或多个条带的一个或多个图片的视频和视频的编解码表示之间的转换,其中编解码表示符合指定编解码表示中的字段的条件针对视频条带控制对条带类型的约束或者条带类型是否被包括在编解码表示中的格式规则,其中该字段包括通用约束标志、网络抽象层单元类型、或者视频条带是否在访问单元的第一个视频图片中。
在另一个示例方面,公开了另一种视频处理方法。该方法包括执行包括包含一个或多个条带的一个或多个图片的视频和视频的编解码表示之间的转换,其中编解码表示符合指定基于视频图片的图片标头中的标志的值来禁用视频图片中的所有条带的自适应环路滤波的格式规则。
在另一个示例方面,公开了另一种视频处理方法。该方法包括执行包括包含一个或多个条带的一个或多个图片的视频和视频的编解码表示之间的转换,其中编解码表示符合指定在当前图片的高度和宽度等于视频中的最大高度和最大宽度的情况下将一致性窗口标志设置为禁用模式的格式规则。
在另一个示例方面,公开了另一种视频处理方法。该方法包括执行包括包含一个或多个条带的一个或多个图片的视频和视频的编解码表示之间的转换,其中编解码表示符合指定参数集的重复时间的格式规则。
在又一个示例方面,公开了一种视频编码器装置。视频编码器包括被配置为实施上述方法的处理器。
在又一个示例方面,公开了一种视频解码器装置。视频解码器包括被配置为实施上述方法的处理器。
在又一示例方面,公开了一种存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现本文描述的方法之一。
这些以及其他特征将在本文档中描述。
附图说明
图1是示例视频处理系统的框图。
图2是视频处理装置的框图。
图3是视频处理的示例方法的流程图。
图4是示出根据本公开的一些实施例的视频编解码系统的框图。
图5是示出根据本公开的一些实施例的编码器的框图。
图6是示出根据本公开的一些实施例的解码器的框图。
图7示出了自适应环路滤波器(ALF)滤波器形状(色度:5×5菱形,亮度:7×7菱形)的示例。
图8示出了ALF和CC-ALF示图的示例。
图9-图11示出了视频处理的示例方法的流程图。
具体实施方式
在本文档中使用章节标题以易于理解,并且不将每个章节中公开的技术和实施例的应用性仅限制于该章节。此外,在一些描述中使用H.266技术术语仅仅是为了易于理解,而不是为了限制所公开的技术的范围。因此,本文描述的技术也适用于其他视频编解码器协议和设计。
1.引言
本文档涉及视频编解码技术。具体地,它关于对条带类型的信令、ALF和一致性窗口以及对一些非VCL NAL单元(包括VPS、SPS、PPS、APS和DCI NAL单元)的重复的改进。这些思想可以单独或以各种组合被应用于支持多层视频编解码的任何视频编解码标准或非标准视频编解码器,例如正在开发的多功能视频编解码(VVC)。
2.缩写
ALF 自适应环路滤波器
APS 自适应参数集
AU 访问单元
AUD 访问单元分隔符
AVC 高级视频编解码
CLVS 编解码层视频序列
CPB 编解码图片缓冲区
CRA 完全随机访问
CTU 编解码树单元
CVS 编解码视频序列
DCI 解码能力信息
DPB 解码图片缓冲区
DU 解码单元
EOB 比特流结尾
EOS 序列结尾
GDR 逐渐解码刷新
HEVC 高效视频编解码
HRD 假设参考解码器
IDR 即时解码刷新
JEM 联合探索模型
LMCS 亮度映射与色度缩放
MCTS 运动约束片集
NAL 网络抽象层
OLS 输出层集
PH 图片标头
PPS 图片参数集
PTL 档次、层和级别
PU 图片单元
RADL 随机访问可解码前置(图片)
RAP 随机访问点
RASL 随机访问跳过前置(图片)
RBSP 原始字节序列有效载荷
RPL 参考图片列表
SAO 样点自适应偏移
SEI 辅助增强信息
SPS 序列参数集
STSA 逐步时域子层访问
SVC 可缩放视频编解码
VCL 视频编解码层
VPS 视频参数集
VTM VVC测试模型
VUI 视频可用性信息
VVC 多功能视频编解码
3.初步讨论
视频编解码标准主要是通过开发公知的ITU-T和ISO/IEC标准而演变的。ITU-T开发了H.261和H.263,ISO/IEC开发了MPEG-1和MPEG-4 Visual,并且两个组织联合开发了H.262/MPEG-2视频、H.264/MPEG-4高级视频编解码(Advanced Video Coding,AVC)和H.265/HEVC[1]标准。自H.262以来,视频编解码标准基于混合视频编解码结构,其中采用了时域预测加变换编解码。为探索HEVC之外的未来视频编解码技术,VCEG和MPEG于2015年联合成立了联合视频探索团队(Joint Video Exploration Team,JVET)。从那时起,JVET已经采用了许多新的方法,并将其放入了名为联合探索模型(Joint Exploration Model,JEM)[2]的参考软件中。JVET会议每季度同时举行一次,新编解码标准的目标是与HEVC相比降低50%的比特率。新视频编解码标准在2018年4月的JVET会议上被正式命名为多功能视频编解码(VVC),第一版VVC测试模型(VTM)也在当时发布。由于对VVC标准化的持续努力,新的编解码技术在每次JVET会议上都被采用到VVC标准中。VVC的工作草案和测试模型VTM在每次会议后都会更新。VVC项目现在的目标是在2020年7月的会议上技术上完成(FDIS)。
3.1.参数集
AVC、HEVC和VVC指定了参数集。参数集的类型包括SPS、PPS、APS和VPS。在AVC、HEVC和VVC中的全部中都支持SPS和PPS。VPS从HEVC开始引入,并且被包括在HEVC和VVC中。APS没有被包括在AVC或HEVC中,但是被包括在最新的VVC草案文本中。
SPS被设计为携带序列级别标头信息,并且PPS被设计为携带不频繁改变的图片级别标头信息。利用SPS和PPS,不频繁改变的信息不需要针对每个序列或图片重复,因此可以避免该信息的冗余信令。此外,SPS和PPS的使用实现了重要标头信息的带外传输,因此不仅避免了对冗余传输的需要,还提高了容错性。
引入VPS用于携带对多层比特流中的所有层共同的序列级别标头信息。
引入APS用于携带这样的图片级别或条带级别信息,该信息需要相当多的比特来编解码,可以由多个图片共享,并且在序列中可以有相当多的不同变化。
3.2.VVC中的条带标头和图片标头
与HEVC中类似,VVC中的条带标头传递特定条带的信息。这包括条带地址、条带类型、条带QP、图片顺序计数(POC)最低有效位(LSB)、RPS和RPL信息、加权预测参数、环路滤波参数、片和WPP的条目偏移等。
VVC引入了图片标头(PH),其包含特定图片的标头参数。每个图片必须具有一个或仅一个PH。PH基本上携带如果没有引入PH就在条带标头中的那些参数,但是每个参数对于图片的所有条带具有相同的值。这些包括IRAP/GDR图片指示、帧间/帧内条带允许标志、POCLSB并且可选地POC MSB、关于RPL、去方块、SAO、ALF、QP增量和加权预测的信息、编解码块分割信息、虚拟边界、并置图片信息等。经常出现的情况是,整个图片序列中的每个图片仅包含一个条带。为了在这种情况下允许对于每个图片不具有至少两个NAL单元,允许PH语法结构被包括在PH NAL单元或条带标头中。
在VVC中,在图片标头或条带标头中信令通知用于时域运动矢量预测的关于并置图片的信息。
3.3.序列内的图片分辨率改变
在AVC和HEVC中,图片的空域分辨率不能改变,除非使用新SPS的新序列以IRAP图片开始。VVC在不编码IRAP图片的位置处启用序列内的图片分辨率改变,该IRAP图片总是被帧内编解码。该特征有时被称为参考图片重采样(RPR),因为当参考图片具有与正被解码的当前图片不同的分辨率时,该特征需要对用于帧间预测的参考图片的重采样。
缩放比例被限制为大于或等于1/2(从参考图片到当前图片的2倍下采样)、并且小于或等于8(8倍上采样)。指定了具有不同频率截止的三个重采样滤波器集合来处理参考图片和当前图片之间的各种缩放比例。三个重采样滤波器集合分别被应用于范围从1/2到1/1.75、从1/1.75到1/1.25和从1/1.25到8的缩放比例。每个重采样滤波器集合具有用于亮度的16个相位和用于色度的32个相位,这与运动补偿插值滤波器的情况相同。实际上,正常的MC插值过程是重采样过程的特殊情况,其中缩放比例的范围从1/1.25到8。水平和垂直缩放比例是基于图片宽度和高度以及为参考图片和当前图片指定的左、右、顶部和底部缩放偏移来推导的。
支持该特征的VVC设计与HEVC不同的其它方面包括:i)图片分辨率和对应的一致性窗口在PPS中而不是在SPS中被信令通知,而在SPS中,最大图片分辨率被信令通知。ii)对于单层比特流,每个图片存储(DPB中用于存储一个解码图片的槽)占用存储具有最大图片分辨率的解码图片所需的缓冲区尺寸。
3.4.自适应环路滤波器(ALF)
两个菱形滤波器形状(如图7所示)用于基于块的ALF。7×7菱形被应用于亮度分量,并且5×5菱形被应用于色度分量。基于局部梯度的方向和活动,为每个4×4块选择多达25个滤波器中的一个。图片中的每个4×4块根据方向性和活动性进行分类。在对每个4×4块进行滤波之前,可以根据为该块计算的梯度值,对滤波器系数应用简单的几何变换,诸如旋转或对角和垂直翻转。这相当于将这些变换应用于滤波器支持区域中的样点。这个想法是通过对齐ALF被应用于的不同块的方向性来使不同块更类似。基于块的分类不应用于色度分量。
ALF滤波器参数在自适应参数集(APS)中被信令通知。在一个APS中,可以信令通知多达25个亮度滤波器系数和裁剪值索引的集合、以及多达8个色度滤波器系数和裁剪值索引的集合。为了减少比特开销,可以合并亮度分量的不同分类的滤波器系数。在图片或条带标头中,可以信令通知多达7个APS的ID,以指定用于当前图片或条带的亮度滤波器集。滤波过程在CTB级别被进一步控制。亮度CTB可以在16个固定滤波器集和APS中信令通知的滤波器集当中选择滤波器集。对于色度分量,在图片或条带标头中信令通知APS ID,以指示用于当前图片或条带的色度滤波器集。在CTB级别,如果在APS中有多于一个色度滤波器集,则针对每个色度CTB信令通知滤波器索引。当对CTB启用ALF时,对于CTB内的每个样点,执行利用信令通知的权重的菱形滤波器,其中裁剪操作被应用来裁剪邻近样点和当前样点之间的差。裁剪操作引入了非线性,以通过减少与当前样点值相差太大的邻近样点值的影响来使ALF更高效。
跨分量自适应环路滤波器(CC-ALF)可以在先前描述的ALF之上进一步增强每个色度分量。CC-ALF的目标是使用亮度样点值来细化每个色度分量。这通过应用菱形高通线性滤波器、然后将该滤波操作的输出用于色度细化来实现。图8提供了关于其他环路滤波器的CC-ALF过程的系统级示图。如图8所示,CC-ALF使用与亮度ALF相同的输入,以避免整个环路滤波过程的附加步骤。
4.通过所公开的解决方案解决的技术问题
最新的VVC文本中(JVET-Q2001-vE/v15中)的现有设计有以下问题:
1)slice_type的值被约束如下:
当nal_unit_type在IDR_W_RADL到CRA_NUT的范围(包括IDR_W_RADL和CRA_NUT)内并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应当等于2。
然而,在以下两个条件下,slice_type的值也必须等于2:i)当intra_only_constraint_flag等于1时;以及ii)当NAL单元类型是IRAP NAL单元类型并且当前图片是当前AU中的第一个图片时。
2)如下定义的ph_alf_enabled_flag的语义是不明确的。
ph_alf_enabled_flag等于1指定对与PH相关联的所有条带启用自适应环路滤波器,并且该自适应环路滤波器可以被应用于条带中的Y、Cb或Cr色彩分量。ph_alf_enabled_flag等于0指定可以对与PH相关联的一个或多个或所有条带禁用自适应环路滤波器。当不存在时,ph_alf_enabled_flag被推断为等于0。
3)始终在PPS中信令通知一致性窗口参数,包括当图片宽度和高度与在PPS所参考的SPS中信令通知的最大图片宽度和高度相同时。另一方面,也在SPS中信令通知具有最大图片宽度和高度的图片的一致性窗口参数。PPS中的具有最大图片宽度和高度的图片的一致性窗口参数的信令是冗余的。
4)大多数SEI消息的重复被限制为在PU或DU内至多4次。不允许PH、AUD、EOS和EOBNAL单元的重复。需要允许填充数据NAL单元重复所需的次数(例如,为了实现恒定的比特率)。然而,对其他非VCL NAL单元(即,VPS、SPS、PPS、APS和DCI NAL单元)的重复次数没有限制。
5.技术解决方案的列表
为了解决以上问题以及其他问题,公开了如下总结的方法。本发明应该被认为是解释一般概念的示例,而不应该以狭隘的方式解释。此外,这些发明可以被单独应用或者以任何方式被组合。
1)为了解决问题1,对slice_type和/或slice_type的信令的约束可以依赖于与通用约束标志/NAL单元类型/当前图片是否是当前AU中的第一个图片有关的条件。
a.在一个示例中,该条件可以包括:
i.当intra_only_constraint_flag等于1。
ii.当NAL单元类型是IRAP NAL单元类型并且当前图片是当前AU中的第一个图片时。
iii.当指示(例如,SPS标志)告知在图片(或包含当前图片的CLVS、或包含当前图片的任何其他图片集合)中仅允许帧内条带时。
b.可以更新对slice_type值的约束,使得附加地在前两个条件中的一个或所有以上条件中的一个为真的情况下,也要求slice_type的值等于2。
c.可替代地,当前两个条件中的一个或所有以上条件中的一个为真时,slice_type的信令可以被跳过,并被推断为I条带(即,slice_type为2)。
d.此外,当NAL单元类型是IRAP NAL单元类型并且当前层是独立层时,slice_type的信令也可以被跳过,并被推断为I条带。
2)为了解决问题2,可以指定ph_alf_enabled_flag等于0指定对当前图片的所有条带禁用ALF。
3)为了解决问题3,可以要求当图片宽度和高度是最大图片宽度和高度时,pps_conformance_window_flag的值应当等于0。
a.此外,可以指定,如果图片宽度和高度是最大图片宽度和高度,则将PPS一致性窗口语法元素的值推断为与在SPS中信令通知的值相同,否则,将其推断为等于0。
4)为了解决问题4,可以指定以下约束中的一个或多个,以提供对VPS、SPS、PPS、APS和DCI NAL单元的重复时间的一些限制,同时不影响如随机访问的功能:
对VPS
a.当具有vps_video_parameter_set_id的特定值的VPS NAL单元存在于CVS中时,VPS NAL单元应当存在于CVS的第一个AU中,可以存在于有具有在IDR_W_RADL到GDR_NUT的范围(包括IDR_W_RADL和GDR_NUT)内的nal_unit_type的至少一个VCL NAL单元的任何AU中,并且不应当存在于任何其他AU中。
i.可替代地,上面的“IDR_W_RADL到GDR_NUT”被改变为“IDR_W_RADL到RSV_IRAP_12”。
b.PU中具有vps_video_parameter_set_id的特定值的VPS NAL单元的数量不应当大于1。
对SPS
c.设CLVS的相关联AU集是从包含CLVS按照解码顺序的第一个图片的AU开始到包含CLVS按照解码顺序的最后一个图片的AU(包括该两个AU)的AU集合。
d.当具有sps_seq_parameter_set_id的特定值的SPS NAL单元存在于参考SPS的CLVS的相关联AU集associatedAuSet中时,SPS NAL单元应当存在于associatedAuSet的第一个AU中,并且可以存在于有具有在IDR_W_RADL到GDR_NUT的范围(包括IDR_W_RADL和GDR_NUT)内的nal_unit_type的至少一个VCL NAL单元的、associatedAuSet的任何AU中,并且不应当存在于任何其他AU中。
i.可替代地,当具有sps_seq_parameter_set_id的特定值的SPS NAL单元存在于CLVS中时,其应当存在于CLVS的第一个PU中,并且可以存在于有具有在IDR_W_RADL到GDR_NUT的范围(包括IDR_W_RADL和GDR_NUT)内的nal_unit_type的至少一个编解码条带NAL单元的任何PU中,并且不应当存在于任何其他PU中。
ii.可替代地,在第4.d或4.d.i项中,将“IDR_W_RADL到GDR_NUT”改变为“IDR_W_RADL到RSV_IRAP_12”。
e.PU中具有sps_seq_parameter_set_id的特定值的SPS NAL单元的数量不应当大于1。
对PPS
f.PU中具有pps_pic_parameter_set_id的特定值的PPS NAL单元的数量不应当大于1。
对APS
g.PU中具有adaptation_parameter_set_id的特定值和aps_params_type的特定值的APS NAL单元的数量不应当大于1。
i.可替代地,DU中具有adaptation_parameter_set_id的特定值和aps_params_type的特定值的APS NAL单元的数量不应当大于1。
对DCI
h.当DCI NAL单元存在于比特流中时,其应当存在于比特流的第一个CVS中。
i.当DCI NAL单元存在于CVS中时,它应当存在于CVS的第一个AU中,可以存在于有具有在IDR_W_RADL到GDR_NUT的范围(包括IDR_W_RADL和GDR_NUT)内的nal_unit_type的至少一个VCL NAL单元的任何AU中,并且不应当存在于任何其他AU中。
j.PU中的DCI NAL单元的数量不应当大于1。
6.实施例示例
以下是上面在第5节中总结的本发明的一些方面的一些示例实施例,其可以被应用于VVC规范。改变的文本基于JVET-Q2001-vE/v15中的最新的VVC文本。已经被添加或修改的最相关部分以粗体斜体突出显示,并且删除的部分中的一些用双方括号以粗体突出显示。有一些其他改变在本质上是编辑性的或者不是本发明的一部分,因此没有突出显示。
6.1.第一实施例
该实施例针对第1项。
以下约束:
当nal_unit_type在IDR_W_RADL到CRA_NUT的范围(包括IDR_W_RADL和CRA_NUT)内并且vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于1时,slice_type应当等于2。
被改变如下:
当intra_only_constraint_flag等于1或者以下两个条件都为真时,slice_type的值应当等于2:
-nal_unit_type的值在IDR_W_RADL到CRA_NUT的范围(包括IDR_W_RADL和CRA_NUT)内。
-vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]的值等于1或者当前图片是当前AU中的第一个图片。
6.2.第二实施例
该实施例针对第2项。
提出ph_alf_enabled_flag的语义被更新如下:
ph_alf_enabled_flag等于0指定[[可以]]对与PH相关联的[[一个,或多个,或]]所有条带禁用自适应环路滤波器。
6.3.第三实施例
该实施例针对第3项。
7.4.3.4图片参数集RBSP语义
...
pps_conformance_window_flag等于1指定[[指示]]一致性裁剪窗口偏移参数在PPS中跟在之后。pps_conformance_window_flag等于0指定[[指示]]一致性裁剪窗口偏移参数不存在于PPS中。当pic_width_in_luma_samples等于pic_width_max_in_luma_samples并且pic_height_in_luma_samples等于pic_height_max_in_luma_samples时,pps_conformance_window_flag的值应当等于0。
pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset指定CLVS中从解码过程输出的图片的样点,按照用于输出的图片坐标中指定的矩形区域。
当pps_conformance_window_flag等于0时,以下适用:
-如果pic_width_in_luma_samples等于pic_width_max_in_luma_samples,并且pic_height_in_luma_samples等于pic_height_max_in_luma_samples,则pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset的值分别被推断为等于sps_conf_win_left_offset、sps_conf_win_right_offset、sps_conf_win_top_offset和sps_conf_win_bottom_offset。
-否则,pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset的值被推断为等于0。
一致性裁剪窗口包含亮度样点,其中水平图片坐标从SubWidthC*pps_conf_win_left_offset到pic_width_in_luma_samples-(SubWidthC*pps_conf_win_right_offset+1)(包括SubWidthC*pps_conf_win_left_offset和pic_width_in_luma_samples-(SubWidthC*pps_conf_win_right_offset+1)),并且垂直图片坐标从SubHeightC*pps_conf_win_top_offset到pic_height_in_luma_samples-(SubHeightC*pps_conf_win_bottom_offset+1)(包括SubHeightC*pps_conf_win_top_offset和pic_height_in_luma_samples-(SubHeightC*pps_conf_win_bottom_offset+1))。
SubWidthC*(pps_conf_win_left_offset+pps_conf_win_right_offset)的值应当小于pic_width_in_luma_samples,并且SubHeightC*(pps_conf_win_top_offset+pps_conf_win_bottom_offset)的值应当小于pic_height_in_luma_samples。
当ChromaArrayType不等于0时,两个色度阵列的对应指定样点是具有图片坐标(x/SubWidthC,y/SubHeightC)的样点,其中(x,y)是指定亮度样点的图片坐标。
注2–仅在输出应用一致性裁剪窗口偏移参数。所有内部解码过程都被应用于未剪裁的图片尺寸。
设ppsA和ppsB是参考相同SPS的任何两个PPS。比特流一致性的要求是,当ppsA和ppsB分别具有pic_width_in_luma_samples和pic_height_in_luma_samples的相同值时,ppsA和ppsB应当分别具有pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset的相同值。
当pic_width_in_luma_samples等于pic_width_max_in_luma_samples并且pic_height_in_luma_samples等于pic_height_max_in_luma_samples时,比特流一致性的要求是pps_conf_win_left_offset、pps_conf_win_right_offset、pps_conf_win_top_offset和pps_conf_win_bottom_offset分别等于sps_conf_win_left_offset、sps_conf_win_right_offset、sps_conf_win_top_offset和sps_conf_win_bottom_offset。
图1是示出可以在其中实施本文公开的各种技术的示例视频处理系统1900的框图。各种实施方式可以包括系统1900的一些或所有组件。系统1900可以包括用于接收视频内容的输入1902。视频内容可以以例如8或10比特多分量像素值的原始或未压缩格式而接收,或者可以是压缩或编码格式。输入1902可以表示网络接口、外围总线接口或存储接口。网络接口的示例包括诸如以太网、无源光网络(PON)等的有线接口和诸如Wi-Fi或蜂窝接口的无线接口。
系统1900可以包括可以实施本文档中描述的各种编解码或编码方法的编解码组件1904。编解码组件1904可以将来自输入1902的视频的平均比特率减小到编解码组件1904的输出,以产生视频的编解码表示。编解码技术因此有时被称为视频压缩或视频转码技术。编解码组件1904的输出可以被存储,或者经由如组件1906所表示的通信连接来发送。在输入1902处接收的视频的存储或通信传送的比特流(或编解码)表示可以由组件1908用于生成像素值或传送到显示接口1910的可显示视频。从比特流表示生成用户可视视频的过程有时被称为视频解压缩。此外,虽然某些视频处理操作被称为“编解码”操作或工具,但是将理解,编解码工具或操作在编码器处被使用,并且反转编解码结果的对应的解码工具或操作将由解码器执行。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)、或高清晰度多媒体接口(HDMI)、或显示端口(Displayport)等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以体现在各种电子设备中,诸如移动电话、膝上型电脑、智能电话、或能够执行数字数据处理和/或视频显示的其他设备。
图2是视频处理装置3600的框图。装置3600可以用于实施本文描述的一种或多种方法。装置3600可以体现在智能手机、平板电脑、计算机、物联网(IoT)接收器等中。装置3600可以包括一个或多个处理器3602、一个或多个存储器3604和视频处理硬件3606。(多个)处理器3602可以被配置为实施本文档中描述的一种或多种方法。存储器(多个存储器)3604可以用于存储用于实施本文描述的方法和技术的数据和代码。视频处理硬件3606可以用于在硬件电路系统中实施本文档中描述的一些技术。
图4是示出可以利用本公开的技术的示例视频编解码系统100的框图。
如图4所示,视频编解码系统100可以包括源设备110和目标设备120。源设备110生成编码视频数据,其中该源设备110可以被称为视频编码设备。目标设备120可以解码由源设备110生成的编码视频数据,其中该目标设备120可以被称为视频解码设备。
源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括源,诸如视频捕捉设备、从视频内容提供器接收视频数据的接口、和/或用于生成视频数据的计算机图形系统、或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码,以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关数据。编解码图片是图片的编解码表示。相关数据可以包括序列参数集、图片参数集和其他语法结构。I/O接口116可以包括调制器/解调器(调制解调器)和/或发送器。编码视频数据可以通过网络130a经由I/O接口116直接发送到目标设备120。编码视频数据也可以存储在存储介质/服务器130b上,以供目标设备120访问。
目标设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码视频数据。视频解码器124可以对编码视频数据进行解码。显示设备122可以向用户显示解码视频数据。显示设备122可以与目标设备120集成,或者可以在被配置为与外部显示设备接口的目标设备120的外部。
视频编码器114和视频解码器124可以根据视频压缩标准进行操作,例如高效视频编解码(HEVC)标准、多功能视频编解码(VVC)标准和其他当前和/或另外的标准。
图5是示出视频编码器200的示例的框图,该视频编码器200可以是图4所示的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或所有技术。在图5的示例中,视频编码器200包括多个功能组件。本公开中描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
视频编码器200的功能组件可以包括分割单元201、预测单元202(其可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重构单元212、缓冲区213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在示例中,预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以执行IBC模式下的预测,其中至少一个参考图片是当前视频块所在的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以高度集成,但是出于解释的目的,在图5的示例中被单独表示。
分割单元201可以将图片分割为一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以基于误差结果选择编解码模式(例如,帧内或帧间)之一,并且将作为结果的帧内编解码块或帧间编解码块提供给残差生成单元207以生成残差块数据,以及提供给重构单元212以重构编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测模式的组合(CIIP),其中预测基于帧间预测信号和帧内预测信号。在帧间预测的情况下,模式选择单元203还可以选择块的运动矢量的分辨率(例如,子像素或整数像素精度)。
为了对当前视频块执行帧间预测,运动估计单元204可以通过将来自缓冲区213的一个或多个参考帧与当前视频块进行比较,来生成当前视频块的运动信息。运动补偿单元205可以基于运动信息和来自缓冲区213的除了与当前视频块相关联的图片之外的图片的解码样点,来确定当前视频块的预测视频块。
运动估计单元204和运动补偿单元205可以对当前视频块执行不同的操作,例如,依赖于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可以对当前视频块执行单向预测,并且运动估计单元204可以为当前视频块的参考视频块搜索列表0或列表1的参考图片。运动估计单元204然后可以生成指示列表0或列表1中的参考图片的参考索引,该参考索引包含参考视频块和指示当前视频块和参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以对当前视频块执行双向预测,运动估计单元204可以在列表0中的参考图片中搜索当前视频块的参考视频块,并且还可以在列表1中搜索当前视频块的另一个参考视频块。运动估计单元204然后可以生成参考索引,该参考索引指示包含参考视频块的列表0和列表1中的参考图片以及指示参考视频块和当前视频块之间的空域位移的运动矢量。运动估计单元204可以输出当前视频块的参考索引和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出完整的运动信息集,以用于解码器的解码处理。
在一些示例中,运动估计单元204可以不输出当前视频的完整的运动信息集。而是运动估计单元204可以参考另一个视频块的运动信息信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与邻近视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示值,该值向视频解码器300指示当前视频块具有与另一个视频块相同的运动信息。
在另一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中标识另一视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量和所指示的视频块的运动矢量之间的差。视频解码器300可以使用所指示的视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所讨论的,视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实施的预测信令通知技术的两个示例包括高级运动矢量预测(AMVP)和Merge模式信令通知。
帧内预测单元206可以对当前视频块执行帧内预测。当帧内预测单元206对当前视频块执行帧内预测时,帧内预测单元206可以基于相同图片中的其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由减号指示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括与当前视频块中样点的不同样点分量相对应的残差视频块。
在其他示例中,例如在跳过模式下,对于当前视频块可能没有残差数据,并且残差生成单元207可能不执行减去操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来为当前视频块生成一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以分别对变换系数视频块应用逆量化和逆变换,以从变换系数视频块重构残差视频块。重构单元212可以将重构后的残差视频块添加到来自预测单元202生成的一个或多个预测视频块的对应样点,以产生与当前块相关联的重构视频块,用于存储在缓冲区213中。
在重构单元212重构视频块之后,可以执行环路滤波操作,以减少视频块中的视频块效应。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收到数据时,熵编码单元214可以执行一个或多个熵编码操作,以生成熵编码数据,并输出包括该熵编码数据的比特流。
图6是示出视频解码器300的示例的框图,该视频解码器300可以是图4所示的系统100中的视频解码器114。
视频解码器300可以被配置为执行本公开的任何或所有技术。在图6的示例中,视频解码器300包括多个功能组件。本公开中描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中,处理器可以被配置为执行本公开中描述的任何或所有技术。
在图6的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305、重构单元306和缓冲区307。在一些示例中,视频解码器300可以执行通常与针对视频编码器200(图5)描述的编码过程相反的解码过程。
熵解码单元301可以检索编码比特流。编码比特流可以包括熵编解码的视频数据(例如,视频数据的编码块)。熵解码单元301可以对熵编解码的视频数据进行解码,并且从熵解码的视频数据中,运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302可以例如通过执行AMVP和Merge模式来确定这样的信息。
运动补偿单元302可以产生运动补偿块,可以基于插值滤波器执行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。
运动补偿单元302可以使用如视频编码器200在视频块的编码期间所使用的插值滤波器来计算参考块的子整数像素的插值。运动补偿单元302可以根据所接收的语法信息确定视频编码器200使用的插值滤波器,并使用该插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸、描述编码视频序列的图片的每个宏块如何被分割的分割信息、指示每个分割如何被编码的模式、每个帧间编码块的一个或多个参考帧(和参考帧列表)、以及用于对编码视频序列进行解码的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空域上相邻的块形成预测块。逆量化单元303对在比特流中提供并由熵解码单元301解码的量化后的视频块系数进行逆量化,即,反量化。逆变换单元303应用逆变换。
重构单元306可以将残差块与由运动补偿单元202或帧内预测单元303生成的对应预测块相加,以形成解码块。如果需要,还可以应用去方块滤波器对解码块进行滤波,以便移除块效应。解码视频块然后被存储在缓冲区307中,为随后的运动补偿/帧内预测提供参考块,并且还产生解码视频以在显示设备上呈现。
接下来提供一些实施例优选的解决方案的列表。
以下解决方案示出了在前一节(例如,第1项)中讨论的技术的示例实施例。
1.一种视频处理方法(例如,图3中示出的方法3000),包括执行包括包含一个或多个条带的一个或多个图片的视频和视频的编解码表示之间的转换(3002),其中编解码表示符合指定编解码表示中的字段的条件针对视频条带控制对条带类型的约束或者条带类型是否被包括在编解码表示中的格式规则,其中该字段包括通用约束标志、网络抽象层单元类型、或者视频条带是否在访问单元的第一个视频图片中。
2.根据解决方案1所述的方法,其中,格式规则指定条件是已经对视频条带启用了仅帧内约束。
以下解决方案示出了在前一节(例如,第2项)中讨论的技术的示例实施例。
3.一种视频处理方法,包括:执行包括包含一个或多个条带的一个或多个图片的视频和视频的编解码表示之间的转换,其中编解码表示符合指定基于视频图片的图片标头中的标志的值来禁用视频图片中的所有条带的自适应环路滤波的格式规则。
以下解决方案示出了在前一节(例如,第3项)中讨论的技术的示例实施例。
4.一种视频处理方法,包括:执行包括包含一个或多个条带的一个或多个图片的视频和视频的编解码表示之间的转换,其中编解码表示符合指定在当前图片的高度和宽度等于视频中的最大高度和最大宽度的情况下将一致性窗口标志设置为禁用模式的格式规则。
以下解决方案示出了在前一节(例如,第4项)中讨论的技术的示例实施例。
5.一种视频处理方法,包括:执行包括包含一个或多个条带的一个或多个图片的视频和视频的编解码表示之间的转换,其中编解码表示符合指定参数集的重复时间的格式规则。
6.根据解决方案5所述的方法,其中,参数集是自适应参数集的视频参数集或序列参数集或图片参数集。
7.根据解决方案5所述的方法,其中,参数集是解码能力信息网络抽象层单元(DCINAL)。
8.根据解决方案6所述的方法,其中,参数集是视频参数集,并且其中格式规则指定,在视频参数集包括标识符字段的特定值的情况下,视频参数集被包括在编解码视频表示的第一个访问单元中。
9.根据解决方案8所述的方法,其中,格式规则还指定,当且仅当另一个访问单元具有在两个预先指定的值之间的范围内的网络抽象层类型时,包括具有标识符字段的特定值的视频参数集。
10.根据解决方案6所述的方法,其中,参数集是序列参数集,并且其中格式规则指定编解码表示被组织为视频序列的一个或多个编解码层的一个或多个访问单元,并且其中格式规则指定将包括具有特定标识符值的序列参数集的网络抽象层包括在参考序列参数集的访问单元集合中的第一个访问单元中。
11.根据解决方案7所述的方法,其中,格式规则指定,在DCI NAL被包括在视频的编解码表示中的情况下,DCI NAL被包括在视频的第一个编解码视频序列中。
12.根据解决方案7或11所述的方法,其中,格式规则还指定将预测单元中的DCINAL单元的数量限制为一个。
13.根据解决方案1至12中任一项所述的方法,其中,该转换包括将视频编码为编解码表示。
14.根据解决方案1至12中任一项所述的方法,其中,该转换包括对编解码表示进行解码以生成视频的像素值。
15.一种视频解码装置,包括被配置为实施根据解决方案1至14中的一项或多项所述的方法的处理器。
16.一种视频编码装置,包括被配置为实施根据解决方案1至14中的一项或多项所述的方法的处理器。
17.一种存储有计算机代码的计算机程序产品,该代码在由处理器执行时使得处理器实施根据解决方案1至14中任一项所述的方法。
18.一种本文档中描述的方法、装置或系统。
以下列表提供了通过一些实施例实施的第二优选解决方案集合。
以下解决方案示出了在前一节(例如,第1项)中讨论的技术的示例实施例。
1.一种视频处理方法(例如,图3中描绘的方法3000),包括:执行包括包含一个或多个条带的一个或多个图片的视频和视频的比特流之间的转换(3002),其中比特流符合格式规则;其中格式规则指定是否或如何在比特流中指示一个或多个条带中的条带的条带类型依赖于条件,其中该条件基于以下中的至少一个:通用约束标志、网络抽象层单元类型、或者条带是否在访问单元的第一个图片中。
2.根据解决方案1所述的方法,其中,该条件包括或对应于通用约束标志指示对条带的仅帧内约束。
3.根据解决方案1所述的方法,其中,该条件包括或对应于条带在访问单元的第一个图片中并且网络抽象层单元类型具有特定类型,其中特定类型指示帧内随机访问点类型。
4.根据解决方案1所述的方法,其中,该条件包括或对应于比特流指示在包括图片的图片集合中仅准许帧内条带。
5.根据解决方案4所述的方法,其中,图片集合对应于该图片。
6.根据解决方案4所述的方法,其中,图片集合对应于包括该图片的编解码层视频序列(CLVS)。
7.根据解决方案1-6中任一项所述的方法,其中,格式规则指定响应于(a)通用约束标志或网络抽象层单元类型满足该条件,或者(b)条带在访问单元的第一个图片中,在比特流中指示条带类型值2。
8.根据解决方案1所述的方法,其中,格式规则指定条带类型具有值2,并且响应于(a)通用约束标志或网络抽象层单元类型满足该条件,或者(b)条带在访问单元的第一个图片中,条带类型的指示从比特流中省略。
9.根据解决方案1所述的方法,其中,格式规则指定条带类型具有值2,并且响应于(a)网络抽象层单元类型是帧内随机访问点类型,以及(b)包含条带的图片所属的层是独立可解码层,条带类型的指示从比特流中省略。
以下解决方案示出了在前一节(例如,第2和4项)中讨论的技术的示例实施例的附加示例。
1.一种视频处理方法(例如,图9中描绘的方法900),包括:执行包括包含多个条带的图片的视频和视频的比特流之间的转换(902),其中比特流符合指定图片标头中的标志控制图片中的所有条带的自适应环路滤波的应用性的格式规则。
2.根据解决方案1所述的方法,其中,标志的0值指示对图片中的所有条带禁用自适应环路滤波。
3.根据解决方案1所述的方法,其中,标志的1值指示对图片中的所有条带启用自适应环路滤波。
4.一种视频处理方法(例如,图10中描绘的方法1000),包括:根据格式规则来执行包括包含一个或多个条带的一个或多个图片的视频和视频的比特流之间的转换(1002),其中格式规则指定与视频相关联的参数集的重复时间。
5.根据解决方案4所述的方法,其中,参数集是视频参数集(VPS)。
6.根据解决方案5所述的方法,其中,格式规则指定,响应于包含具有特定标识符值的VPS的编解码视频序列(CVS)的VPS网络抽象层(NAL)单元,VPS NAL单元被包括在CVS的第一个访问单元(AU)中,并且基于CVS的另一个AU中的另一个VPS NAL单元的值被选择性地包括在另一个AU中,并且从CVS的剩余AU中排除。
7.根据解决方案6所述的方法,其中,另一个AU中的另一个VPS NAL单元的值在IDR_W_RADL到GDR_NUT的范围内。
8.根据解决方案6所述的方法,其中,另一个AU中的另一个VPS NAL单元的值在IDR_W_RADL到RSV_IRAP_12的范围内。
9.根据解决方案5-8中任一项所述的方法,其中,格式规则还指定给定标识符值的不多于一个VPS NAL单元被包括在比特流中的图片单元(PU)中。
10.根据解决方案4所述的方法,其中,参数集是序列参数集(SPS)。
11.根据解决方案10所述的方法,其中,比特流中的编解码层视频序列(CLVS)包括相关联的访问单元(AU)集,相关联的AU集包括从包含CLVS按照解码顺序的第一个图片的第一个AU开始和包含CLVS按照解码顺序的最后一个图片的最后一个AU的AU。
12.根据解决方案11所述的方法,其中,格式规则指定,响应于SPS网络抽象层(NAL)单元包含具有特定标识符值的SPS,SPS NAL单元被包括在相关联的AU集中的第一个AU中,并且基于相关联的集中的另一个AU中的另一个SPS NAL单元的值被选择性地包括在另一个AU中,并且从CVS的剩余AU中排除。
13.根据解决方案11所述的方法,其中,格式规则指定,响应于编解码层视频序列(CVLS)在CVLS的第一个图片单元(PU)中包含具有特定标识符值的SPS,SPS NAL单元基于CVLS的另一个PU中的条带NAL单元的值被选择性地包括在另一个PU中,并且从CVLS的剩余PU中排除。
14.根据解决方案12所述的方法,其中,另一个AU中的另一个SPS NAL单元的值在IDR_W_RADL到GDR_NUT的范围内。
15.根据解决方案13所述的方法,其中,另一个PU中的条带NAL单元的值在IDR_W_RADL到GDR_NUT的范围内。
16.根据解决方案12所述的方法,其中,另一个AU中的另一个SPS NAL单元的值在IDR_W_RADL到RSV_IRAP_12的范围内。
17.根据解决方案13所述的方法,其中,另一个PU中的条带NAL单元的值在IDR_W_RADL到RSV_IRAP_12的范围内。
18.根据解决方案11-17中任一项所述的方法,其中,格式规则还指定给定标识符值的不多于一个SPS NAL单元被包括在比特流中的图片单元(PU)中。
19.根据解决方案4所述的方法,其中,参数集是图片参数集(PPS),并且其中格式规则还指定给定标识符值的不多于一个PPS网络抽象层(NAL)单元被包括在比特流中的图片单元(PU)中。
20.根据解决方案4所述的方法,其中,参数集是自适应参数集(APS)。
21.根据解决方案20所述的方法,其中,格式规则还指定给定标识符值和参数类型的特定值的不多于一个APS网络抽象层(NAL)单元被包括在比特流中的图片单元(PU)中。
22.根据解决方案20所述的方法,其中,格式规则还指定给定标识符值和参数类型的特定值的不多于一个APS网络抽象层(NAL)单元被包括在比特流中的解码单元(DU)中。
23.根据解决方案4所述的方法,其中,参数集是解码能力信息网络抽象层单元(DCI NAL)。
24.根据解决方案23所述的方法,其中,格式规则指定,当存在时,不允许DCI NAL单元包括在比特流中不是比特流中的第一个编解码视频序列(CVS)的CVS中。
25.根据解决方案23所述的方法,其中,格式规则指定,响应于编解码视频序列(CVS)包括DCI NAL单元,DCI NAL单元在CVS的第一个访问单元(AU)中,并且选择性地基于另一个AU是否包括具有特定NAL单元标识符值的视频编解码层(VCL)NAL单元而选择性地存在于另一个AU中,并且从CVS的剩余AU中排除,。
26.根据解决方案21所述的方法,其中,特定标识符值在IDR_W_RADL到GDR_NUT的范围内。
27.根据解决方案23-26中任一项所述的方法,其中,格式规则指定图片单元(PU)包括至多一个DCI NAL单元。
以下解决方案示出了在前一节(例如,第3项)中讨论的技术的优选实施例的附加示例。
1.一种视频处理方法(例如,图11中描绘的方法1100),包括:根据格式规则来执行包括视频单元中的图片的视频和视频的比特流之间的转换(1102),其中格式规则指定,响应于图片的宽度等于视频单元中的最大允许图片宽度并且图片的高度等于视频单元中的最大允许图片高度,对应于图片的图片参数集中的一致性窗口标志被设置为0值。
2.根据解决方案1所述的方法,其中,最大允许图片宽度和最大允许图片高度在视频单元所参考的序列参数集中被指示。
3.根据解决方案2所述的方法,其中,格式规则指定,响应于图片的宽度等于视频单元中的最大允许图片宽度并且图片的高度等于视频单元中的最大允许图片高度,一致性窗口语法元素从图片参数集中排除,并且被推断为具有与序列参数集中指示的相同的值。
4.根据解决方案2所述的方法,其中,格式规则指定,响应于图片的宽度不等于视频单元中的最大允许图片宽度或者图片的高度不等于视频单元中的最大允许图片高度,一致性窗口语法元素被推断为具有0值。
在上面列出的解决方案中,该转换包括将视频编码为比特流。
在上面列出的解决方案中,该转换包括从比特流生成视频。
在一些实施例中,一种视频解码装置可以包括处理器,该处理器被配置为实施根据上述解决方案中的一项或多项所述的方法。
在一些实施例中,一种包括处理器的视频编码装置可以被配置为实施根据上述解决方案中的一项或多项所述的方法。
在一些实施例中,一种计算机可读介质可以在其上存储有代码,该代码在由处理器执行时使得处理器实施根据上述解决方案中任一项所述的方法。
在一些实施例中,一种视频处理的方法包括根据上述解决方案中的任一项或多项所述的方法来生成比特流,并且将比特流存储在计算机可读介质上。
在一些实施例中,一种计算机可读介质可以在其上存储有比特流,该比特流是根据上述解决方案中的任一项或多项所述的方法从视频生成的。
在本文档中,术语“视频处理”可以指视频编码、视频解码、视频压缩或视频解压缩。例如,在从视频的像素表示到对应的比特流表示的转换期间,可以应用视频压缩算法,反之亦然。如语法所定义的,当前视频块的比特流表示可以例如对应于并置或者散布在比特流内的不同地方的比特。例如,可以按照变换和编解码的误差残差值并且还使用比特流中的标头和其他字段中的比特对宏块进行编码。此外,在转换期间,解码器可以基于该确定,在知道一些字段可能存在或不存在的情况下解析比特流,如以上解决方案所描述的。类似地,编码器可以确定包括或不包括特定语法字段,并通过包括语法字段或从编解码表示中排除语法字段来相应地生成编解码表示。
本文档中描述的所公开的以及其他解决方案、示例、实施例、模块和功能操作可以在数字电子电路中、或者在计算机软件、固件或硬件(包括本文档中公开的结构及其结构等同物)中、或者在它们中的一个或多个的组合中被实施。所公开的以及其他实施例可以被实施为一个或多个计算机程序产品,即在计算机可读介质上编码的计算机程序指令的一个或多个模块,该计算机程序指令用于由数据处理装置执行或控制数据处理装置的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读传播信号的物质的组合、或它们中的一个或多个的组合。术语“数据处理装置”包含用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机、或多个处理器或计算机。除了硬件之外,装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或它们中的一个或多个的组合的代码。传播信号是被生成以对信息进行编码以用于发送到合适的接收器装置的人工生成的信号,例如机器生成的电信号、光学信号或电磁信号。
计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言(包括编译或解释语言)编写,并且其可以以任何形式部署,包括作为独立程序或作为适合在计算环境中使用的模块、组件、子例程或其他单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在保存其他程序或数据(例如,存储在标记语言文档中的一个或多个脚本)的文件的一部分中,存储在专用于所讨论的程序的单个文件中,或存储在多个协调文件中(例如,存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以被部署为在一个计算机上或在位于一个站点上或跨多个站点分布并通过通信网络互连的多个计算机上执行。
本文档书中描述的过程和逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过对输入数据进行操作并生成输出来执行功能。过程和逻辑流程也可以由专用逻辑电路执行,并且装置也可以被实施为专用逻辑电路,例如,FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适合于执行计算机程序的处理器包括例如通用和专用微处理器、以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的基本元件是用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备(例如,磁盘、磁光盘或光盘),或可操作地耦合以从该一个或多个大容量存储设备接收数据或向该一个或多个大容量存储设备传递数据、或者从其接收数据并向其传递数据。然而,计算机不需要这样的设备。适用于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可换式盘;磁光盘;以及CD ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
虽然本专利文档包含许多细节,但这些细节不应被解释为对任何主题或可能要求保护的范围的限制,而是作为指定于特定技术的特定实施例的特征的描述。在本专利文档中在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实施。相反,在单个实施例的上下文中描述的各种特征也可以单独在多个实施例中或以任何合适的子组合实施。此外,尽管特征可以在上面描述为以某些组合起作用并且甚至最初如此要求保护,但是在一些情况下可以从组合排除来自所要求保护的组合的一个或多个特征,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应该被理解为需要以所示的特定顺序或以先后顺序执行这样的操作或者执行所有示出的操作以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分离不应被理解为在所有实施例中都需要这样的分离。
仅描述了一些实施方式和示例,并且可以基于本专利文档中描述和示出的内容来进行其他实施方式、增强和变化。

Claims (12)

1.一种视频处理方法,包括:
根据格式规则来执行包括视频单元中的图片的视频和所述视频的比特流之间的转换,
其中,所述格式规则指定,响应于图片的宽度等于所述视频单元中的最大允许图片宽度并且所述图片的高度等于所述视频单元中的最大允许图片高度,对应于所述图片的图片参数集中的一致性窗口标志被设置为0值。
2.根据权利要求1所述的方法,其中,所述最大允许图片宽度和所述最大允许图片高度在所述视频单元所参考的序列参数集中被指示。
3.根据权利要求2所述的方法,其中,所述格式规则指定,响应于图片的宽度等于所述视频单元中的最大允许图片宽度并且所述图片的高度等于所述视频单元中的最大允许图片高度,一致性窗口语法元素从所述图片参数集中排除,并且被推断为具有与所述序列参数集中指示的相同的值。
4.根据权利要求2所述的方法,其中,所述格式规则指定,响应于图片的宽度不等于所述视频单元中的最大允许图片宽度或者所述图片的高度不等于所述视频单元中的最大允许图片高度,一致性窗口语法元素被推断为具有0值。
5.根据权利要求1至4中任一项所述的方法,其中,所述转换包括从所述比特流生成所述视频。
6.根据权利要求1至4中任一项所述的方法,其中,所述转换包括将所述视频编码为所述比特流。
7.一种视频解码装置,包括被配置为实施根据权利要求1至5中的一项或多项所述的方法的处理器。
8.一种视频编码装置,包括被配置为实施根据权利要求1至6中的一项或多项所述的方法的处理器。
9.一种其上存储有代码的计算机可读介质,所述代码在由处理器执行时使得所述处理器实施根据权利要求1至6中任一项所述的方法。
10.一种视频处理的方法,包括:
根据权利要求1至6中任一项或多项所述的方法来生成比特流,以及
将所述比特流存储在计算机可读介质上。
11.一种其上存储有比特流的计算机可读介质,所述比特流是根据权利要求1至6中任一项或多项所述的方法从视频生成的。
12.一种本文档中描述的方法、装置、比特流或系统。
CN202180026946.3A 2020-03-30 2021-03-29 视频编解码中的一致性窗口参数 Pending CN115486063A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063002064P 2020-03-30 2020-03-30
US63/002,064 2020-03-30
PCT/US2021/024675 WO2021202393A1 (en) 2020-03-30 2021-03-29 Conformance window parameters in video coding

Publications (1)

Publication Number Publication Date
CN115486063A true CN115486063A (zh) 2022-12-16

Family

ID=77930148

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202180025544.1A Pending CN115380525A (zh) 2020-03-30 2021-03-29 图片标头中的高级别语法
CN202180026946.3A Pending CN115486063A (zh) 2020-03-30 2021-03-29 视频编解码中的一致性窗口参数
CN202180026561.7A Pending CN115398898A (zh) 2020-03-30 2021-03-29 视频编解码中的条带类型

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202180025544.1A Pending CN115380525A (zh) 2020-03-30 2021-03-29 图片标头中的高级别语法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180026561.7A Pending CN115398898A (zh) 2020-03-30 2021-03-29 视频编解码中的条带类型

Country Status (7)

Country Link
US (2) US11902558B2 (zh)
EP (2) EP4115611A4 (zh)
JP (3) JP7415038B2 (zh)
KR (2) KR20220160576A (zh)
CN (3) CN115380525A (zh)
BR (1) BR112022019770A2 (zh)
WO (3) WO2021202387A1 (zh)

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2702765A1 (en) * 2011-04-28 2014-03-05 Koninklijke Philips N.V. Method and apparatus for generating an image coding signal
US20120294353A1 (en) * 2011-05-16 2012-11-22 Mediatek Inc. Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components
WO2013128010A2 (en) * 2012-03-02 2013-09-06 Canon Kabushiki Kaisha Method and devices for encoding a sequence of images into a scalable video bit-stream, and decoding a corresponding scalable video bit-stream
US20140079138A1 (en) * 2012-09-14 2014-03-20 Sony Corporation Simplifiication of pic_order_cnt_lsb calculation in hm8
WO2014112354A1 (en) * 2013-01-15 2014-07-24 Sharp Kabushiki Kaisha Video decoder with signaling
JP2017500787A (ja) 2013-11-21 2017-01-05 エルジー エレクトロニクス インコーポレイティド 信号送受信装置及び信号送受信方法
US9641851B2 (en) * 2014-04-18 2017-05-02 Qualcomm Incorporated Conformance window information in multi-layer coding
TWI689196B (zh) * 2014-06-19 2020-03-21 美商Vid衡器股份有限公司 在3維基礎彩色映射中模型參數最佳化系統及方法
KR101663668B1 (ko) * 2014-06-27 2016-10-07 삼성전자주식회사 영상 패딩영역의 비디오 복호화 및 부호화 장치 및 방법
CN107113457B (zh) * 2014-12-29 2020-12-04 索尼公司 发送装置、发送方法、接收装置和接收方法
CN113613009A (zh) * 2015-02-27 2021-11-05 索尼公司 发送装置、发送方法、接收装置和接收方法
US10244249B2 (en) * 2015-09-21 2019-03-26 Qualcomm Incorporated Fixed point implementation of range adjustment of components in video coding
US10129558B2 (en) * 2015-09-21 2018-11-13 Qualcomm Incorporated Supplement enhancement information (SEI) messages for high dynamic range and wide color gamut video coding
US10200701B2 (en) * 2015-10-14 2019-02-05 Qualcomm Incorporated HDR and WCG coding architecture with SDR backwards compatibility in a single bitstream for video coding
JP6710970B2 (ja) * 2015-12-28 2020-06-17 ソニー株式会社 送信装置および送信方法
WO2017129793A1 (en) 2016-01-28 2017-08-03 Koninklijke Philips N.V. Encoding and decoding hdr videos
US11102495B2 (en) * 2016-05-17 2021-08-24 Qualcomm Incorporated Methods and systems for generating and processing content color volume messages for video
CN108370451B (zh) * 2016-10-11 2021-10-01 索尼公司 发送装置、发送方法、接收装置以及接收方法
PL3389278T3 (pl) * 2016-11-22 2023-03-13 Saturn Licensing, Llc Urządzenie nadawcze, sposób nadawania, urządzenie odbiorcze i sposób odbioru
US10812820B2 (en) 2016-11-30 2020-10-20 Qualcomm Incorporated Systems and methods for signaling and constraining a high dynamic range (HDR) video system with dynamic metadata
US11153579B2 (en) * 2018-03-23 2021-10-19 Qualcomm Incorporated Deriving dynamic range adjustment (DRA) parameters for video coding
CA3146230A1 (en) 2019-07-08 2020-10-22 Huawei Technologies Co., Ltd. Handling of multiple picture size and conformance windows for reference picture resampling in video coding
GB201913403D0 (en) * 2019-09-17 2019-10-30 Canon Kk Method and apparatus for encoding and decoding a video stream with subpictures
CN114600462A (zh) * 2019-10-25 2022-06-07 夏普株式会社 用于在视频编码中发送信号通知图片信息的系统和方法
JP2023011955A (ja) 2019-12-03 2023-01-25 シャープ株式会社 動画像符号化装置、動画像復号装置
GB2590634A (en) 2019-12-20 2021-07-07 Canon Kk High Level syntax for video coding and decoding
US11778215B2 (en) * 2020-02-28 2023-10-03 Qualcomm Incorporated Coding output layer set data and conformance window data of high level syntax for video coding
US11375212B2 (en) * 2020-04-18 2022-06-28 Qualcomm Incorporated Flexible chroma processing for dynamic range adjustment

Also Published As

Publication number Publication date
WO2021202393A1 (en) 2021-10-07
JP2023519938A (ja) 2023-05-15
BR112022019770A2 (pt) 2022-11-16
US11902557B2 (en) 2024-02-13
EP4115611A4 (en) 2023-06-28
KR20220160576A (ko) 2022-12-06
EP4115608A1 (en) 2023-01-11
EP4115608A4 (en) 2023-05-24
WO2021202391A1 (en) 2021-10-07
JP7416974B2 (ja) 2024-01-17
CN115380525A (zh) 2022-11-22
JP2024038255A (ja) 2024-03-19
US20230052835A1 (en) 2023-02-16
KR20220159987A (ko) 2022-12-05
JP7415038B2 (ja) 2024-01-16
JP2023519939A (ja) 2023-05-15
WO2021202387A1 (en) 2021-10-07
CN115398898A (zh) 2022-11-25
EP4115611A1 (en) 2023-01-11
US20230034593A1 (en) 2023-02-02
US11902558B2 (en) 2024-02-13

Similar Documents

Publication Publication Date Title
CN114846786A (zh) 对视频比特流中的假设参考解码器参数的信令的约束
CN114868399A (zh) 条带类型和视频层的信令通知
WO2021188453A1 (en) Gradual decoding refresh access unit in scalable video coding
US20230112181A1 (en) Signaling of subpicture level and buffering information
WO2021259223A1 (en) Signaling of quantization information in coded video
WO2021244563A1 (en) Reference picture resampling
CN115299063A (zh) 变换跳过残差编解码
US11902558B2 (en) Conformance window parameters in video coding
US20240187627A1 (en) Slice type in video coding
KR102616383B1 (ko) 비디오 픽처 헤더의 필터 파라미터 시그널링
WO2021197407A1 (en) Video coding using adaptation parameter sets
CN115462085A (zh) 视频编解码中滤波的高级控制

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination