CN115836526A - 编解码视频中的序列结束指示 - Google Patents

编解码视频中的序列结束指示 Download PDF

Info

Publication number
CN115836526A
CN115836526A CN202180042173.8A CN202180042173A CN115836526A CN 115836526 A CN115836526 A CN 115836526A CN 202180042173 A CN202180042173 A CN 202180042173A CN 115836526 A CN115836526 A CN 115836526A
Authority
CN
China
Prior art keywords
picture
layer
video
bitstream
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180042173.8A
Other languages
English (en)
Inventor
王业奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ByteDance Inc
Original Assignee
ByteDance Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ByteDance Inc filed Critical ByteDance Inc
Publication of CN115836526A publication Critical patent/CN115836526A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • H04N9/8045Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了使用序列结束指示的方法、系统和设备。视频处理的示例方法包括根据格式规则执行视频和视频的比特流之间的转换,其中,比特流包括多个访问单元AU中的多个层,该多个访问单元AU包括一个或多个图片,其中格式规则规定,响应于比特流中的第一访问单元(AU)中存在第一层的序列结束(EOS)网络抽象层(NAL)单元,比特流中的第一AU之后的AU中的第一层的一个或多个较高层中的每一个的后续图片是编解码层视频序列开始(CLVSS)图片。

Description

编解码视频中的序列结束指示
相关申请的交叉参考
根据巴黎公约适用的专利法和/或规则,提出本申请是为了及时要求2020年6月12日提交的美国临时专利申请No.US 63/038,601的优先权和权益。出于法律规定的所有目的,上述申请的全部公开内容通过引用并入作为本申请的公开内容的部分。
技术领域
该专利文档涉及图像和视频编码和解码。
背景技术
数字视频占互联网和其他数字通信网络上最大的带宽使用。随着能够接收和显示视频的连接用户设备数量的增加,预计数字视频使用的带宽需求将继续增长。
发明内容
本文档公开了序列结束指示的技术,视频编解码器和解码器可以使用这些技术来执行视频编码、解码或处理。
在一个示例方面,公开了一种视频处理方法。该方法包括执行包括一个或多个图片的视频和视频的比特流之间的转换,其中比特流符合格式规则,其中格式规则规定对第一语法元素的值的约束,第一语法元素规定第二语法元素是否存在于当前图片的图片标头语法结构中,并且其中第二语法元素规定当前图片的图片顺序计数(POC)最高有效位(MSB)周期的值。
在另一个示例方面,公开了一种视频处理方法。该方法包括执行包括一个或多个图片的视频与视频的比特流之间的转换,其中比特流符合格式规则,其中,格式规则规定在不存在语法元素的情况下图片顺序计数(POC)的推导,并且其中,语法元素规定当前图片的POC最高有效位(MSB)周期的值。
在又一示例方面,公开了一种视频处理方法。该方法包括执行视频和视频的比特流之间的转换,其中比特流包括访问单元AU,访问单元AU包括根据规则的图片,其中规则规定响应于AU的输出顺序不同于AU的解码顺序,在比特流中不允许逐步解码刷新(GDR)图片。
在又一示例方面,公开了一种视频处理方法。该方法包括执行视频和视频的比特流之间的转换,其中根据格式规则,比特流包括多个访问单元AU中的多个层,多个访问单元AU包括一个或多个图片,其中格式规则规定,响应于比特流中的第一访问单元(AU)中存在第一层的序列结束(EOS)网络抽象层(NAL)单元,比特流中的第一AU之后的AU中的第一层的一个或多个较高层中的每一个的后续图片是编解码层视频序列开始(CLVSS)图片。
在又一示例方面,公开了一种视频处理方法。该方法包括执行视频和视频的比特流之间的转换,其中根据格式规则,比特流包括多个访问单元AU中的多个层,多个访问单元AU包括一个或多个图片,其中,格式规则规定,响应于第一访问单元中的第一图片是编解码层视频序列开始(CLVSS)图片,第二图片是CLVSS图片,编解码层视频序列开始(CLVSS)图片是清洁随机访问(CRA)图片或逐步解码刷新(GDR)图片。
在又一示例方面,公开了一种视频处理方法。该方法包括根据规则执行包括一个或多个图片的视频与视频的比特流之间的转换,其中规则规定比特流至少包括输出的第一图片,其中第一图片在输出层中,其中第一图片包括等于一的语法元素,并且其中语法元素影响与假设参考解码器(HRD)相关联的解码图片输出和移除过程。
在又一示例方面,公开了一种视频编码器装置。视频编码器包括被配置为实现上述方法的处理器。
在又一示例方面,公开了一种视频解码器装置。视频解码器包括被配置为实现上述方法的处理器。
在又一个示例方面,公开了一种其上存储有代码的计算机可读介质。该代码以处理器可执行代码的形式体现了本文描述的方法之一。
这些和其他特征在整个本文档中都进行了描述。
附图说明
图1是示出了实现本文公开的各种技术的示例视频处理系统的框图。
图2是用于视频处理的示例硬件平台的框图。
图3是示出了可实现本公开的一些实施例的示例视频编解码系统的框图。
图4是示出了可实现本公开的一些实施例的编码器示例的框图。
图5是示出了可实现本公开的一些实施例的解码器示例的框图。
图6至图11示出了视频处理的示例方法的流程图。
具体实施方式
本文档中使用章节标题是为了易于理解并且不将各章节中公开的技术和实施例的适用性仅限制于该章节。此外,在一些描述中使用H.266术语仅仅是为了易于理解,而不是为了限制所公开技术的范围。因此,本文描述的技术也适用于其他视频编解码器协议和设计。
1.介绍
本文档涉及视频编解码技术。具体而言,它是关于为支持单层视频编解码和多层视频编解码两者的视频编解码器定义级别和比特流一致性。它可以应用于支持单层视频编解码和多层视频编解码的任何视频编解码标准或非标准视频编解码器,例如正在开发的多功能视频编解码(VVC)。
2.缩写
APS 自适应参数集
AU 访问单元
AUD 访问单元分隔符
AVC 高级视频编解码
CLVS 编解码层视频序列
CLVSS 编解码层视频序列开始
CPB 编解码图片缓冲器
CRA 清洁随机访问
CTU 编解码树单元
CVS 编解码视频序列
DCI 解码能力信息
DPB 解码图片缓冲器
EOB 比特流结束
EOS 序列结束
GDR 逐步解码刷新
HEVC 高效视频编解码
HRD 假设参考解码器
IDR 即时解码刷新
ILP 层间预测
ILRP 层间参考图片
JEM 联合探索模型
LTRP 长期参考图片
MCTS 运动约束的片集
NAL 网络抽象层
OLS 输出层集
PH 图片标头
POC 图片顺序计数
PPS 图片参数集
PTL 档次、层次、级别
PU 图片单元
RAP 随机访问点
RBSP 原始字节序列有效负载
SEI 补充增强信息
SLI 子图片级别信息
SPS 序列参数集
STRP 短期参考图片
SVC 可缩放视频编解码
VCL 视频编解码层
VPS 视频参数集
VTM VVC测试模型
VUI 视频可用性信息
VVC 多功能视频编解码
3.初步讨论
视频编解码标准主要是通过众所周知的ITU-T和ISO/IEC标准的发展而得以演进。ITU-T制作了H.261和H.263标准,ISO/IEC制作了MPEG-1和MPEG-4Visual标准,并且两个组织联合制作了H.262/MPEG-2视频标准和H.264/MPEG-4高级视频编解码(AVC)标准和H.265/HEVC标准。从H.262开始,视频编解码标准基于混合视频编解码结构,其中利用时域预测加变换编解码。为了探索HEVC之外的未来视频编解码技术,由VCEG和MPEG于2015年联合成立联合视频探索团队(JVET)。从那时起,JVET采用了许多新方法并将其纳入名为联合探索模型(JEM)的参考软件。JVET会议每季度同时举行一次,新编解码标准的目标是与HEVC相比降低50%比特率。新的视频编解码标准在2018年4月的JVET会议上被正式命名为多功能视频编码(VVC),并且第一版VVC测试模型(VTM)也在当时发布。随着VVC标准化的不断努力,新的编解码技术在每次JVET会议上都被采用到VVC标准中。VVC的工作草案和测试模型VTM在每次会议后都会更新。VVC项目现在的目标是在2020年7月的会议上技术完成(FDIS)。
3.1.HEVC和VVC中的随机访问及其支持
随机访问是指从按照解码顺序不是比特流的第一个图片的图片开始访问和解码比特流。为了支持广播/多播和多方视频会议中的调谐和通道切换、本地回放和流式传输中的搜索、以及流式传输中的流自适应,比特流需要包括间隔近的随机访问点,其通常是帧内编解码图片,但也可以是帧间编解码图片(例如,在逐渐解码刷新的情况下)。
HEVC通过NAL单元类型在NAL单元标头中包括帧内随机访问点(IRAP)图片的信令通知。支持三种类型的IRAP图片,即即时解码器刷新(IDR)、清洁随机访问(CRA)和断开链接访问(BLA)图片。IDR图片将帧间图片预测结构约束为不参考当前图片组(GOP)之前的任何图片,该当前图片组(GOP)传统上被称为封闭GOP随机访问点。通过允许特定图片参考当前GOP之前的图片,CRA图片限制更少,其中在随机访问的情况下,所有图片都被丢弃。CRA图片传统上被称为开放GOP随机访问点。BLA图片通常源于CRA图片处两个比特流或其一部分的拼接,例如在流切换期间。为了更好地使得系统能够使用IRAP图片,总共定义了六个不同的NAL单元以信令通知IRAP图片的属性,这可以用于更好地匹配在ISO基本媒体文件格式(ISOBMFF)中定义的流访问点类型[7],该流访问点类型用于基于HTTP的动态自适应流(DASH)中的随机访问支持[8]。
VVC支持三种类型的IRAP图片、两种类型的IDR图片(一种类型具有或者另一种类型不具有相关联的RADL图片)以及一种类型的CRA图片。这些与HEVC中基本相同。HEVC中的BLA图片类型不包括在VVC中,主要由于两个原因:i)BLA图片的基本功能可以通过CRA图片加上序列结束NAL单元来实现,其存在指示后续图片在单层比特流中开始新的CVS。ii)在开发VVC期间,期望规定比HEVC更少的NAL单元类型,如通过针对NAL单元标头中的NAL单元类型字段使用5比特而不是6比特所指示的。
VVC和HEVC之间在随机访问支持中的另一个关键差异是VVC中以更规范的方式支持GDR。在GDR中,对比特流的解码可以从帧间编解码图片开始,并且尽管在开始时不是整个图片区域都可以被正确解码,但是在多个图片之后,整个图片区域将是正确的。使用恢复点SEI消息来信令通知GDR随机访问点和恢复点,AVC和HEVC也支持GDR。在VVC中,新的NAL单元类型被规定用于GDR图片的指示,并且恢复点在图片标头语法结构中被信令通知。允许CVS和比特流以GDR图片开始。这意味着允许整个比特流仅包含帧间编解码图片,而没有单个帧内编解码图片。以这种方式规定GDR支持的主要益处是提供GDR的一致性行为。GDR使得编码器能够通过在多个图片中分布帧内编解码的条带或块来平滑比特流的比特率,与对整个图片进行帧内编解码相反,从而允许显著的端到端延迟降低,随着如无线显示、在线游戏、基于无人机的应用的超低延迟应用变得更流行,这在当今被认为比以前更重要。
VVC中的另一个GDR相关特征是虚拟边界信令通知。GDR图片与其恢复点之间的图片处的刷新区域(即,正确解码的区域)和未刷新区域之间的边界可以被信令通知作为虚拟边界,并且当被信令通知时,将不会应用跨边界的环路滤波,因此将不会出现边界处或边界附近的一些样点的解码失配。当应用确定在GDR过程期间显示正确解码的区域时,这可以是有用的。
IRAP图片和GDR图片可以被统称为随机访问点(RAP)图片。
3.2.序列内的图片分辨率变化
在AVC和HEVC中,图片的空域分辨率不能改变,除非使用新SPS的新序列以IRAP图片开始。VVC允许在不编码IRAP图片的位置改变序列内的图片分辨率,IRAP图片总是被帧内编解码。此特征有时称为参考图片重采样(RPR),因为当参考图片具有与正在解码的当前图片不同的分辨率时,该特征需要对用于帧间预测的参考图片进行重采样。
缩放比率被限制为大于或等于1/2(从参考图片到当前图片的2倍下采样),并且小于或等于8(8倍上采样)。规定了具有不同频率截止的三组重采样滤波器来处理参考图片和当前图片之间的各种缩放比率。三组重采样滤波器分别应用于范围从1/2到1/1.75、从1/1.75到1/1.25和从1/1.25到8的缩放比率。每组重采样滤波器具有用于亮度的16个相位和用于色度的32个相位,这与运动补偿插值滤波器的情况相同。实际上正常的MC插值过程是重采样过程的一种特殊情况,其中缩放比率范围从1/1.25到8。水平和垂直缩放比率是基于图片宽度和高度以及为参考图片和当前图片规定的左、右、顶部和底部缩放偏移而推导的。
与HEVC不同的支持此功能的VVC设计的其他方面包括:i)在PPS中而不是在SPS中信令通知的图片分辨率和对应的一致性窗口,而在SPS中信令通知最大图片分辨率。ii)对于单层比特流,每个图片存储(DPB中用于存储一个解码图片的槽)占用存储具有最大图片分辨率的解码图像所需的缓冲器尺寸。
3.3.一般和VVC中的可缩放视频编解码(SVC)
可缩放视频编解码(SVC,有时也称为视频编解码中的可缩放性)是指使用基础层(BL)(有时称为参考层(RL))和一个或多个可缩放增强层(EL)的视频编解码。在SVC中,基础层可以携带具有基础质量级别的视频数据。一个或多个增强层可以携带额外的视频数据以支持例如更高的空域、时域和/或信噪比(SNR)级别。可以相对于先前编码的层来定义增强层。例如,底层可以用作BL,而顶层可以用作EL。中间层可以用作EL或RL,或两者兼而有之。例如,中间层(例如,既不是最低层也不是最高层的层)可以是中间层下方的层(例如基础层或任何居间的增强层)的EL,并且同时用作中间层上方的一个或多个增强层的RL。类似地,在HEVC标准的Multiview或3D扩展中,可能存在多个视图,并且一个视图的信息可以用于编解码(例如,编码或解码)另一个视图的信息(例如,运动估计、运动矢量预测和/或其他冗余)。
在SVC中,编码器或解码器使用的参数基于它们可以在其中使用的编解码级别(例如,视频级别、序列级别、图片级别、条带级别等)被分组成参数集。例如,可以由比特流中不同层的一个或多个编解码视频序列使用的参数可以包括在视频参数集(VPS)中,并且可以由编解码视频序列中的一个或多个图片使用的参数包含在序列参数集(SPS)中。类似地,由图片中的一个或多个条带使用的参数可以包括在图片参数集(PPS)中,并且特定于单个条带的其他参数可以包括在条带标头中。类似地,可以在各种编解码级别提供特定层在给定时间使用哪个(哪些)参数集的指示。
由于VVC中对参考图片重采样(RPR)的支持,可以在不需要任何额外的信令通知处理级别编解码工具的情况下设计对包含多层的比特流的支持,例如,在VVC中具有SD和HD分辨率的两个层,因为空域可缩放性支持所需的上采样可仅使用RPR上采样滤波器。然而,为了支持可缩放性,需要高级别的语法变化(与不支持可缩放性相比)。VVC版本1中规定了可缩放性支持。与任何早期视频编解码标准中的可缩放性支持不同,包括AVC和HEVC的扩展,VVC可缩放性的设计已尽可能地对单层解码器设计友好。多层比特流的解码能力是以好像比特流中只有单层的方式来规定的。例如,以独立于要解码的比特流中的层的数量的方式指定诸如DPB尺寸的解码能力。基本上,为单层比特流设计的解码器不需要太多改变就能够解码多层比特流。与AVC和HEVC的多层扩展的设计相比,HLS方面在牺牲一些灵活性的情况下得到了显著简化。例如,IRAP AU需要包含CVS中存在的每个层的图片。
3.4.参数集
AVC、HEVC和VVC规定参数集。参数集的类型包括SPS、PPS、APS和VPS。所有AVC、HEVC和VVC都支持SPS和PPS。VPS是从HEVC开始引入的,并且包含在HEVC和VVC两者中。APS未包含在AVC或HEVC中,但包含在最新的VVC草案文本中。
SPS被设计为携带序列级别标头信息,并且PPS被设计为携带不经常变化的图片级别标头信息。使用SPS和PPS,不需要为每个序列或图片重复不经常变化的信息,因此可以避免该信息的冗余信令通知。此外,使用SPS和PPS实现了重要标头信息的带外传输,从而不仅避免了冗余传输的需要,而且还提高了错误恢复能力。
引入VPS是为了携带多层比特流中所有层共同的序列级别标头信息。
引入APS是为了携带这样的图片级别或条带级别信息,这些信息需要相当多的位进行编解码,可以由多个图片共享,并且在序列中可以有很多不同的变化。
4.由所公开的技术解决方案解决的技术问题
VVC中的POC、GDR、EOS和静止图片档次的最新设计存在以下问题:
1)当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0并且当前层的参考层中的当前AU中存在图片时,要求ph_poc_msb_cycle_present_flag应等于0。然而,参考层中的这种图片可以通过条款C.6中规定的通用子比特流提取过程来移除。因此,POC推导将是不正确的。
2)ph_poc_msb_cycle_present_flag的值用于POC推导过程,而标志可能不存在并且在这种情况下没有推断值。
3)GDR特征主要用于低端到端延迟应用。因此,当比特流以不适合低端到端延迟应用的方式编码时,不允许使用它是有意义的。
4)当层的EOS NAL单元存在于多层比特流的AU中时,这将意味着存在跳转到该AU的搜索操作,或者该AU是比特流拼接点。对于这两种情况中的任何一种,对于相同的内容,这一层是不连续的,而在相同比特流的另一层中,内容是连续的,这是没有意义的,不管层之间是否存在层间依赖性。
5)比特流可能没有要输出的图片。这应该是不允许的,通常对于所有档次,或者仅对于静止图片档次。
5.实施例和解决方案的列表
为了解决上述问题和其他问题,公开了总结如下的方法。这些项目应被视为解释通用概念的示例,并且不应以狭义的方式进行解释。此外,这些项目可以单独应用或以任何方式组合应用。
1)为了解决问题1,当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0并且当前层的参考层中的当前AU中存在图片时,不是要求ph_poc_msb_cycle_present_flag等于0,而是在更严格的条件下,可以要求ph_poc_msb_cycle_present_flag的值等于0。
a.在一个示例中,当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0并且在当前图片的条带的RefPicList[0]或RefPicList[1]中存在ILRP条目时,要求ph_poc_msb_cycle_present_flag的值等于0。
b.在一个示例中,当vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0并且存在nuh_layer_id等于refpicLayerId的图片在当前层的参考层中的当前AU中并且具有小于或等于Max(0,vps_max_tid_il_ref_pics_plus1[currLayerIdx][refLayerIdx]-1)的TemporalId时,要求ph_poc_msb_cycle_present_flag的值等于0,其中currLayerIdx和refLayerIdx分别等于GeneralLayerIdx[nuh_layer_id]和GeneralLayerIdx[refpicLayerId]。
c.在一个示例中,ph_poc_msb_cycle_present_flag的值从不需要等于0。
2)为了解决问题2,在POC推导过程中不使用“ph_poc_msb_cycle_present_flag等于1(0)”,而是使用“ph_poc_msb_cycle_val存在(不存在)”。
3)为了解决问题3,假设GDR图片仅用于低端到端延迟应用,并且当AU的输出顺序和解码顺序不同时,GDR图片可以是不允许的。
a.在一个示例中,要求当sps_gdr_enabled_flag等于1时,CLVS中所有图片的解码顺序和输出顺序必须相同。请注意,此约束还将要求AU的解码顺序和输出顺序在多层比特流中相同,因为AU内的所有图片按照解码顺序都需要是连续的,并且AU内的所有图片具有相同的输出顺序。
b.在一个示例中,要求当对于CVS中的图片所参考的SPS,sps_gdr_enabled_flag等于1时,CVS中所有AU的解码顺序和输出顺序应相同。
c.在一个示例中,要求当对于图片所参考的SPS,sps_gdr_enabled_flag等于1时,比特流中所有AU的解码顺序和输出顺序应相同。
d.在一个示例中,要求当对于比特流中存在的SPS,sps_gdr_enabled_flag等于1时,比特流中所有AU的解码顺序和输出顺序应当相同。
e.在一个示例中,要求当对于(通过在比特流中或通过外部手段提供的)比特流的SPS,sps_gdr_enabled_flag等于1时,比特流中所有AU的解码顺序和输出顺序应相同。
4)为解决问题4,当层的EOS NAL单元存在于多层比特流的AU中时,要求所有或特定较高层中的每个层中的下一个图片为CLVSS图片。
a.在一个示例中,规定当AU auA在层layerA中包含EOS NAL单元时,对于存在于CVS中且将layerA作为参考层的每个层layerB,按照解码顺序在auA之后的AU中按照解码顺序的layerB中的第一图片应是CLVSS图片。
b.或者,在一个示例中,规定当AU auA包含层layerA中的EOS NAL单元时,对于CVS中存在且比layerA更高的层的每个层layerB,按照解码顺序在auA之后的AU中按照解码顺序的layerB中的第一图片应是CLVSS图片。
c.或者,在一个示例中,规定当AU auA中的一个图片是CLVSS图片,该CLVSS图片是CRA或GDR图片时,对于CVS中存在的每个层layerA,如果auA中存在layerA的图片picA,则picA应该是CLVSS图片,否则(auA中没有layerA的图片),按照解码顺序在auA之后的AU中的layerA的按照解码顺序的第一图片应该是CLVSS图片。
d.或者,在一个示例中,规定当AU auA中的层layerB中的图片为CLVSS图片,该CLVSS图片是CRA或GDR图片时,对于CVS中存在的高于layerB的每个层layerA,如果auA中存在layerA的图片picA,则picA应该是CLVSS图片,否则(auA中没有layerA的图片),按照解码顺序在auA之后的AU中的layerA的按照解码顺序的第一图片应该是CLVSS图片。
e.或者,在一个示例中,规定当AU auA中的层layerB中的图片是CLVSS图片,该CLVSS图片是CRA或GDR图片时,对于将layerB作为参考层的CVS中存在的每个层layerA,如果auA中存在layerA的图片picA,则picA应该是CLVSS图片,否则(auA中没有layerA的图片),按照解码顺序在auA之后的AU中的layerA的按照解码顺序的第一图片应该是CLVSS图片。
f.或者,在一个示例中,规定当AU中存在EOS NAL单元时,对于CVS中存在的每个层,AU中应存在EOS NAL单元。
g.或者,在一个示例中,规定当AU中的层layerB中存在EOS NAL单元时,对于CVS中存在的高于layerB的每个层,AU中应存在EOS NAL单元。
h.或者,在一个示例中,规定当AU中的层layerB中存在EOS NAL单元时,对于将layerB为参考层的CVS中存在的每个层,AU中应存在EOS NAL单元。
i.或者,在一个示例中,规定当AU中的图片是CLVSS图片,该CLVSS图片是CRA或GDR图片时,AU中的所有图片均应为CLVSS图片。
j.或者,在一个示例中,规定当AU中的层layerB中的图片为CLVSS图片,该CLVSS图片是CRA或GDR图片时,高于layerB的所有层中的AU中的图片应是CLVSS图片。
k.或者,在一个示例中,规定当AU中的层layerB的图片为CLVSS图片,该CLVSS图片是CRA或GDR图片时,将layerB为参考层的所有层中的AU中的图片应是CLVSS图片。
l.或者,在一个示例中,规定当AU中的图片是CLVSS图片,该CLVSS图片是CRA或GDR图片时,AU应具有CVS中存在的每个层的图片,并且AU中的所有图片应是CLVSS图片。
m.或者,在一个示例中,规定当AU中的层layerB中的图片是CLVSS图片,该CLVSS图片是CRA或GDR图片时,AU应具有将layerB为参考层的CVS中存在的每个层的图片,并且AU中的所有图片都应为CLVSS图片。
n.或者,在一个示例中,规定当AU中的层layerB中的图片是CLVSS图片,该CLVSS图片是CRA或GDR图片时,AU应当具有CVS中存在的将layerB为参考层的每个层的图片,并且AU中的所有图片都应是CLVSS图片。
5)为解决问题5,规定比特流应该具有至少一个输出的图片。
a.在一个示例中,规定当比特流仅包含一个图片时,图片应具有等于1的ph_pic_output_flag。
b.在一个示例中,规定比特流应具有至少一个处于输出层中且ph_pic_output_flag等于1的图片。
c.在示例中,上述约束中的任一个被规定为一个或多个静止图片档次的定义的一部分,例如,主10静止图片档次和主4:4:4 10静止图片档次。
d.在示例中,上述约束中的任一个被规定都不是档次的定义的一部分,因此它适用于任何档次。
6.实施例
下面是上面章节5中总结的一些发明方面的一些示例实施例,其可以应用于VVC规范。更改的文本基于JVET-S0152-v5中的最新VVC文本。已添加或修改的大部分相关部分均以粗体、下划线和斜体显示,例如“使用A
Figure BDA0003993434220000131
”,而一些删除的部分则以斜体显示并用粗体双括号括起来,例如“基于[[A和]]B”。
6.1.第一实施例
本实施例针对项目1和5及其一些子项目。
7.4.3.7图片标头结构语义
...
Figure BDA0003993434220000132
等于1规定语法元素ph_poc_msb_cycle_val存在于PH中。ph_poc_msb_cycle_present_fl ag等于0规定语法元素ph_poc_msb_cycle_val不存在于PH中。当vps_inde pendent_layer_flag[GeneralLayerIdx[nuh_layer_id]]等于0且[[当前层的参考层中的当前AU中]]
Figure BDA0003993434220000133
存在[[图片]]
Figure BDA0003993434220000134
ph_poc_msb_cycle_present_flag的值应等于0。
...
Figure BDA0003993434220000137
影响附录C中规定的解码图片输出和移除过程。当ph_pic_output_flag不存在时,推断它等于1。
Figure BDA0003993434220000135
ic_output_flag等于1。
注5–比特流中没有ph_non_ref_pic_flag等于1且ph_pic_output_flag等于0的图片。
...
8.3.1图片顺序计数的解码过程
...
Figure BDA0003993434220000136
[[ph_poc_msb_cycle_present_flag等于0]]且当前图片不是CLVSS图片,推导变量prevPicOrderCntLsb和prevPicOrderC ntMsb如下:
–设prevTid0Pic是按照解码顺序的前一个图片,其nuh_layer_id等于当前图片的nuh_layer_id,TemporalId和ph_non_ref_pic_flag都等于0,并且该前一个图片不是RASL或RADL图片。
–变量prevPicOrderCntLsb被设置为等于prevTid0Pic的ph_pic_order_cnt_lsb。
–变量prevPicOrderCntMsb被设置为等于prevTid0Pic的PicOrderCntMsb。当前图片的变量PicOrderCntMsb推导如下:
–如果
Figure BDA0003993434220000141
[[_ph_poc_msb_cycle_present_flag等于1]],PicOrderCntMsb被设置为等于ph_poc_msb_cycle_val*MaxPicOrderCntLsb。
–否则(
Figure BDA0003993434220000142
[[ph_poc_msb_cycle_present_flag等于0]]),如果当前图片是CLVSS图片,则PicOrderCntMsb被设置为等于0。
...
7.4.3.3序列参数集RBSP语义
...
Figure BDA0003993434220000143
等于1规定GDR图片已启用并且可能存在于CLVS中。sps_gdr_enabled_flag等于0规定GDR图片被禁用并且不存在于CLVS中。
Figure BDA0003993434220000144
...
7.4.3.10序列结束RBSP语义
...
Figure BDA0003993434220000145
...
图1是可实现本文中所公开的各种技术的示例视频处理系统1000的框图。各种实现方式可以包括系统1000中的一些或全部组件。系统1000可以包括用于接收视频内容的输入1002。视频内容可以以原始或未压缩的格式(例如8或10比特多分量像素值)接收,或者可以以压缩或编码的格式接收。输入1002可以代表网络接口、外围总线接口或存储接口。网络接口的示例包括有线接口(诸如以太网、无源光网络(PON)等)和无线接口(诸如Wi-Fi或蜂窝接口)。
系统1000可以包括可以实现本文档中描述的各种编解码或编码方法的编解码组件1004。编解码组件1004可以减少从输入1002到编解码组件1004的输出的视频的平均比特率,以产生视频的编解码表示。因此,编解码技术有时称为视频压缩或视频转码技术。编解码组件1004的输出可以被存储或经由所连接的通信来发送,如组件1006所表示的。在输入1002处接收的视频的存储或通信的比特流(或编解码)表示可以由组件1008使用,以生成被发送到显示接口1010的像素值或可显示视频。从比特流表示中生成用户可见的视频的过程有时称为视频解压缩。此外,尽管某些视频处理操作被称为“编解码”操作或工具,但是应当理解,在编码器处使用编解码工具或操作,并且将由解码器进行反演编解码的结果的对应解码工具或操作。
外围总线接口或显示接口的示例可以包括通用串行总线(USB)或高清晰度多媒体接口(HDMI)或Displayport等。存储接口的示例包括SATA(串行高级技术附件)、PCI、IDE接口等。本文档中描述的技术可以实施在各种电子设备中,诸如移动电话、膝上型计算机、智能电话或其它能够进行数字数据处理和/或视频显示的设备。
图2是视频处理装置2000的框图。装置2000可以用于实现本文中所述的方法中的一个或多个。装置2000可以实施在智能电话、平板电脑、计算机、物联网(IoT)接收器等中。装置2000可以包括一个或多个处理器2002、一个或多个存储器2004和视频处理硬件2006。(多个)处理器2002可以配置为实现本文档(例如,在图6-9中)中所述的一个或多个方法。(多个)存储器2004可以用于存储数据和代码,该代码用于实现本文所描述的方法和技术。视频处理硬件2006可以用于在硬件电路中实现本文档中所描述的一些技术。在一些实施例中,硬件2006可以部分或全部在一个或多个处理器2002中,例如图形处理器。
图3是示出可利用本公开的技术的示例视频编解码系统100的框图。如图3所示,视频编解码系统100可以包括源设备110和目的地设备120。源设备110生成编码的视频数据,其可以被称为视频编码设备。目的地设备120可以解码由源设备110生成的编码的视频数据,该目的地设备120可以被称为视频解码设备。源设备110可以包括视频源112、视频编码器114和输入/输出(I/O)接口116。
视频源112可以包括诸如视频捕获设备的源、从视频内容提供者接收视频数据的接口、和/或生成视频数据的计算机图形系统,或这些源的组合。视频数据可以包括一个或多个图片。视频编码器114对来自视频源112的视频数据进行编码以生成比特流。比特流可以包括形成视频数据的编解码表示的比特序列。比特流可以包括编解码图片和相关联的数据。编解码图片是图片的编解码表示。相关联的数据可以包括序列参数集、图片参数集和其他语法元素。I/O接口116包括调制器/解调器(调制解调器)和/或发送器。可以将编码的视频数据经由I/O接口116通过网络130a直接发送到目的地设备120。还可以将编码的视频数据存储到存储介质/服务器130b上,用于由目的地设备120存取。
目的地设备120可以包括I/O接口126、视频解码器124和显示设备122。
I/O接口126可以包括接收器和/或调制解调器。I/O接口126可以从源设备110或存储介质/服务器130b获取编码的视频数据。视频解码器124可以对编码的视频数据进行解码。显示设备122可以向用户显示解码的视频数据。显示设备122可以与目的地设备120集成,或可以在配置为与外置显示设备相接的目的地设备120外部。
视频编码器114和视频解码器124可以根据视频压缩标准(诸如,高效视频编解码(HEVC)标准、多功能视频编解码(VVC)标准和其他当前和/或其他标准)进行操作。
图4是示出视频编码器200的示例的框图,该视频编码器200可以是图3中示出的系统100中的视频编码器114。
视频编码器200可以被配置为执行本公开的任何或全部技术。在图4的示例中,视频编码器200包括多个功能组件。本公开所描述的技术可以在视频编码器200的各种组件之间共享。在一些示例中,处理器可以配置为进行本公开中描述的任何或全部技术。
视频编码器200的功能组件可以包括分割单元201、预测单元202(其可以包括模式选择单元203、运动估计单元204、运动补偿单元205和帧内预测单元206)、残差生成单元207、变换单元208、量化单元209、逆量化单元210、逆变换单元211、重建单元212、缓冲器213和熵编码单元214。
在其他示例中,视频编码器200可以包括更多、更少或不同的功能组件。在一个示例中,预测单元202可以包括帧内块复制(IBC)单元。IBC单元可以以IBC模式进行预测,其中至少一个参考图片是当前视频块所位于的图片。
此外,诸如运动估计单元204和运动补偿单元205的一些组件可以被高度集成,但是出于解释的目的在图4的示例中分开表示。
分割单元201可以将图片分割成一个或多个视频块。视频编码器200和视频解码器300可以支持各种视频块尺寸。
模式选择单元203可以例如基于误差结果选择帧内或帧间的编解码模式中的一个,并且将得到的帧内或帧间编解码块提供到残差生成单元207来生成残差块数据而且提供到重建单元212来重建编码块以用作参考图片。在一些示例中,模式选择单元203可以选择帧内和帧间预测的组合(CIIP)模式,其中预测是基于帧间预测信号和帧内预测信号。模式选择单元203还可以为帧间预测情况下的块选择运动矢量的分辨率(例如子像素或整像素精度)。
为了对当前视频块进行帧间预测,运动估计单元204可以通过将来自缓冲器213的一个或多个参考帧与当前视频块进行比较,生成当前视频块的运动信息。运动补偿单元205可以基于来自缓冲器213的图片(而不是与当前视频块相关联的图片)的运动信息和解码样点来为当前视频块确定预测的视频块。
运动估计单元204和运动补偿单元205可以为当前视频块进行不同操作,例如执行不同操作取决于当前视频块是在I条带、P条带还是B条带中。
在一些示例中,运动估计单元204可以进行当前视频块的单向预测,并且运动估计单元204可以在列表0或列表1的参考图片中搜索当前视频块的参考视频块。运动估计单元204然后可以生成指示列表0或列表1的参考图片中含有参考视频块的参考索引以及指示在当前视频块与参考视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引、预测方向指示符、和运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前块的预测视频块。
在其他示例中,运动估计单元204可以进行当前视频块的双向预测,运动估计单元204可以在列表0的参考图片中搜索当前视频块的参考视频块并且还可以在列表1的参考图片中搜索当前视频块的另一个参考视频块。运动估计单元204然后可以生成指示列表0或列表1的参考图片中含有参考视频块的参考索引以及指示在参考视频块与当前视频块之间的空域位移的运动矢量。运动估计单元204可以输出参考索引和当前视频块的运动矢量作为当前视频块的运动信息。运动补偿单元205可以基于由当前视频块的运动信息指示的参考视频块来生成当前视频块的预测视频块。
在一些示例中,运动估计单元204可以输出运动信息的全部集合,用于解码器的解码处理。
在一些示例中,运动估计单元204可以不输出当前视频的运动信息的全部集合。而是,运动估计单元204可以参考另一个视频块的运动信息来信令通知当前视频块的运动信息。例如,运动估计单元204可以确定当前视频块的运动信息与相邻视频块的运动信息足够相似。
在一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中指示:向视频解码器300指示当前视频块具有与另一个视频块相同的运动信息的值。
在另一个示例中,运动估计单元204可以在与当前视频块相关联的语法结构中标识另一个视频块和运动矢量差(MVD)。运动矢量差指示当前视频块的运动矢量与指示视频块的运动矢量之间的差。视频解码器300可以使用指示视频块的运动矢量和运动矢量差来确定当前视频块的运动矢量。
如上所讨论的,视频编码器200可以预测性地信令通知运动矢量。可以由视频编码器200实现的预测性的信令通知技术的两个示例包括高级运动矢量预测(AMVP)和merge模式信令通知。
帧内预测单元206可以对当前视频块进行帧内预测。当帧内预测单元206对当前视频块进行帧内预测时,帧内预测单元206可以基于相同图片中其他视频块的解码样点来生成当前视频块的预测数据。当前视频块的预测数据可以包括预测视频块和各种语法元素。
残差生成单元207可以通过从当前视频块中减去(例如,由减号表示)当前视频块的(多个)预测视频块来生成当前视频块的残差数据。当前视频块的残差数据可以包括对应于当前视频块中样点的不同样点分量的残差视频块。
在其他示例中,例如在跳过模式下,对于当前视频块可能不存在当前视频块的残差数据,并且残差生成单元207可以不进行减去操作。
变换处理单元208可以通过将一个或多个变换应用于与当前视频块相关联的残差视频块来生成当前视频块的一个或多个变换系数视频块。
在变换处理单元208生成与当前视频块相关联的变换系数视频块之后,量化单元209可以基于与当前视频块相关联的一个或多个量化参数(QP)值来量化与当前视频块相关联的变换系数视频块。
逆量化单元210和逆变换单元211可以将逆量化和逆变换分别应用于变换系数视频块,来从变换系数视频块重建残差视频块。重建单元212可以将重建的残差视频块添加到来自由预测单元202生成的一个或多个预测视频块的对应样点,以产生与当前块相关联的重建视频块用于存储在缓冲器213中。
在重建单元212重建视频块之后,可以进行环路滤波操作以降低视频块中视频块化伪影。
熵编码单元214可以从视频编码器200的其他功能组件接收数据。当熵编码单元214接收数据时,熵编码单元214可以进行一个或多个熵编码操作以生成熵编码数据并且输出包括熵编码数据的比特流。
图5是示出视频解码器300的示例的框图,该视频解码器300可以是图3中示出的系统100中的视频解码器114。
视频解码器300可以被配置为进行本公开的任何或全部技术。在图5的示例中,视频解码器300包括多个功能组件。本公开所描述的技术可以在视频解码器300的各种组件之间共享。在一些示例中,处理器可以配置为进行本公开中描述的任何或全部技术。
在图5的示例中,视频解码器300包括熵解码单元301、运动补偿单元302、帧内预测单元303、逆量化单元304、逆变换单元305以及重建单元306和缓冲器307。在一些示例中,视频解码器300可以进行与关于视频编码器200(图4)所描述的编码过程总体反演的解码过程。
熵解码单元301可以检索编码比特流。编码比特流可以包括熵编解码视频数据(例如,视频数据的编码块)。熵解码单元301可以对熵编解码视频进行解码,并且根据熵解码视频数据,运动补偿单元302可以确定包括运动矢量、运动矢量精度、参考图片列表索引和其他运动信息的运动信息。运动补偿单元302例如可以通过进行AMVP和merge模式确定此类信息。
运动补偿单元302可以产生运动补偿块,可能地基于插值滤波器进行插值。要以子像素精度使用的插值滤波器的标识符可以包括在语法元素中。
运动补偿单元302可以使用由视频编码器200在编码视频块的期间所使用的插值滤波器,来计算出参考块的子整数个像素的插值的值。运动补偿单元302可以根据接收的语法信息确定由视频编码器200所使用的插值滤波器并且使用插值滤波器来产生预测块。
运动补偿单元302可以使用一些语法信息来确定:用于对编码视频序列的(多个)帧和/或(多个)条带进行编码的块的尺寸,描述编码视频序列的图片的每个宏块如何被分割的分割信息,指示如何编码每个分割的模式,每个帧间编码块的一个或多个参考帧(和参考帧列表),以及对编码视频序列进行解码的其他信息。
帧内预测单元303可以使用例如在比特流中接收的帧内预测模式来从空域相邻块形成预测块。逆量化单元303逆量化(即,去量化)在比特流中提供的且由熵解码单元301解码的量化的视频块系数。逆变换单元303应用逆变换。
重建单元306可以用由运动补偿单元202或帧内预测单元303生成的对应预测块求和残差块,以形成解码块。如所期望的,去块滤波器还可以应用于滤波解码块以便移除块效应伪影。解码视频块然后存储在缓冲器307中,该缓冲器307提供用于随后的运动补偿/帧内预测的参考块,并且还产生用于在显示设备上呈现的解码视频。
图6-11显示了可在例如图1-5所示的实施例中实现上述技术解决方案的示例方法。
图6示出视频处理的示例方法600的流程图。方法600包括,在操作610,执行包括一个或多个图片的视频和视频的比特流之间的转换,比特流符合格式规则,该格式规则规定对第一语法元素的值的约束,第一语法元素规定第二语法元素是否存在于当前图片的图片标头语法结构中,并且第二语法元素规定当前图片的图片顺序计数(POC)最高有效位(MSB)周期的值。
图7示出视频处理的示例方法700的流程图。方法700包括,在操作710,执行包括一个或多个图片的视频与视频的比特流之间的转换,比特流符合格式规则,格式规则规定在不存在语法元素的情况下图片顺序计数(POC)的推导,其中,语法元素规定当前图片的POC最高有效位(MSB)周期的值。
图8示出视频处理的示例方法800的流程图。方法800包括,在操作810,根据规则执行视频和视频的比特流之间的转换,比特流包括访问单元AU,访问单元AU包括图片,该规则规定响应于AU的输出顺序不同于AU的解码顺序,在比特流中不允许逐步解码刷新(GDR)图片。
图9示出视频处理的示例方法900的流程图。方法900包括,在操作910,根据格式规则执行视频和视频的比特流之间的转换,比特流包括多个访问单元AU中的多个层,多个访问单元AU包括一个或多个图片,格式规则规定,响应于比特流中的第一访问单元(AU)中存在第一层的序列结束(EOS)网络抽象层(NAL)单元,比特流中的第一AU之后的AU中的第一层的一个或多个较高层中的每一个的后续图片是编解码层视频序列开始(CLVSS)图片。
图10示出视频处理的示例方法1000的流程图。方法1000包括,在操作1010,根据格式规则执行视频和视频的比特流之间的转换,比特流包括多个访问单元AU中的多个层,多个访问单元AU包括一个或多个图片,格式规则规定,响应于第一访问单元中的第一图片是编解码层视频序列开始(CLVSS)图片,第二图片是CLVSS图片,编解码层视频序列开始(CLVSS)图片是清洁随机访问(CRA)图片或逐步解码刷新(GDR)图片。
图11示出视频处理的示例方法1100的流程图。方法1100包括,在操作1110,根据规则执行包括一个或多个图片的视频与视频的比特流之间的转换,规则规定比特流至少包括输出的第一图片,第一图片在输出层中,第一图片包括等于一的语法元素,并且语法元素影响与假设参考解码器(HRD)相关联的解码图片输出和移除过程。
以下解决方案显示了上一章节中讨论的技术的示例实施例(例如,项目1-5)。
接下来提供一些实施例优选的解决方案的列表。
A1.一种视频处理的方法,包括:执行包括一个或多个图片的视频和视频的比特流之间的转换,其中比特流符合格式规则,其中格式规则规定对第一语法元素的值的约束,第一语法元素规定第二语法元素是否存在于当前图片的图片标头语法结构中,并且其中第二语法元素规定当前图片的图片顺序计数(POC)最高有效位(MSB)周期的值。
A2.根据解决方案A1所述的方法,其中响应于标志的值等于零以及层间参考图片(ILRP)条目在当前图片的条带的参考图片列表中,第一语法元素的值等于零,并且其中标志规定索引层是否使用层间预测。
A3.根据解决方案A2所述的方法,其中,参考图片列表包括第一参考图片列表(RefPicList[0])或第二参考图片列表(RefPicList[1])。
A4.根据解决方案A2所述的方法,其中第一语法元素的值等于零规定第二语法元素不存在于图片标头语法结构中。
A5.根据解决方案A2所述的方法,其中标志的值等于零规定允许索引层使用层间预测。
A6.根据解决方案A1所述的方法,其中响应于标志的值等于零和图片具有(i)第一标识符等于当前层的参考层中的当前访问单元(AU)中的第二标识符,以及(ii)第三标识符小于或等于阈值,其中标志规定索引层是否使用层间预测,其中第一标识符规定视频编解码层(VCL)网络抽象层(NAL)单元所属的层,其中第二标识符规定参考图片所属的层,其中第三标识符是时域标识符,并且其中阈值基于第二语法元素,第二语法元素规定索引层中既不是帧内随机访问图片(IRAP)图片也不是逐步解码刷新(GDR)图片的图片是否被用作层间参考图片(IRLP)以用于解码索引层中的图片。
A7.根据解决方案A6所述的方法,其中第一标识符是nuh_layer_id,第二标识符是refpicLayerId,并且第三标识符是TemporalId,并且其中第二语法元素是vps_max_tid_il_ref_pics_plus1。
A8.根据解决方案A1所述的方法,其中,第一语法元素从不需要为零。
A9.根据解决方案A2至A8中任一项所述的方法,其中,第一语法元素是ph_poc_msb_cycle_present_flag,标志是vps_independent_layer_flag,并且其中,第二语法元素是ph_poc_msb_cycle_val。
A10.一种视频处理的方法,包括:执行包括一个或多个图片的视频与视频的比特流之间的转换,其中比特流符合格式规则,其中,格式规则规定在不存在语法元素的情况下图片顺序计数(POC)的推导,并且其中,语法元素规定当前图片的POC最高有效位(MSB)周期的值。
A11.根据解决方案A10所述的方法,其中,语法元素是ph_poc_msb_cycle_val。
A12.一种视频处理的方法,包括:根据规则执行视频和视频的比特流之间的转换,其中比特流包括访问单元AU,访问单元AU包括图片,其中规则规定响应于AU的输出顺序不同于AU的解码顺序,在比特流中不允许逐步解码刷新(GDR)图片。
A13.根据解决方案A12所述的方法,其中,响应于标志等于一,编解码层视频序列(CLVS)中的所有图片的输出顺序和解码顺序相同,并且其中,标志规定GDR图片是否被启用。
A14.根据解决方案A12所述的方法,其中响应于由编解码视频序列(CVS)中的图片所参考的序列参数集(SPS)的标志等于一,AU的输出顺序和解码顺序相同,并且其中标志规定是否启用GDR图片。
A15.根据解决方案A12所述的方法,其中响应于图片所参考的序列参数集(SPS)的标志等于一,AU的输出顺序和解码顺序相同,并且其中标志规定GDR图片是否被启用。
A16.根据解决方案A12所述的方法,其中响应于比特流中的序列参数集(SPS)的标志等于一,AU的输出顺序和解码顺序相同,并且其中标志规定GDR图片是否被启用。
A17.根据解决方案A13至A16中任一项所述的方法,其中,标志是sps_gdr_enabled_flag。
接下来提供一些实施例优选的解决方案的另一列表。
B1.一种视频处理的方法,包括:根据格式规则执行视频和视频的比特流之间的转换,其中,比特流包括多个访问单元AU中的多个层,多个访问单元AU包括一个或多个图片,其中格式规则规定,响应于比特流中的第一访问单元(AU)中存在第一层的序列结束(EOS)网络抽象层(NAL)单元,比特流中的第一AU之后的AU中的第一层的一个或多个较高层中的每一个的后续图片是编解码层视频序列开始(CLVSS)图片。
B2.根据解决方案B1所述的方法,其中,格式规则进一步规定,对于使用第一层作为参考层的第二层,按照解码顺序的第一图片是CLVSS图片,第二层存在于包括第一层的编解码视频序列(CVS)中。
B3.根据解决方案B1所述的方法,其中一个或多个较高层包括所有或特定较高层。
B4.根据解决方案B1所述的方法,其中,格式规则进一步规定,对于作为比第一层更高的层的第二层,按照解码顺序的第一图片是CLVSS图片,第二层存在于包括第一层的编解码视频序列(CVS)中。
B5.根据解决方案B1所述的方法,其中,格式规则进一步规定EOS NAL单元存在于比特流中的编解码视频序列(CVS)的每一层中。
B6.根据解决方案B1所述的方法,其中,格式规则进一步规定比第一层更高的层的第二层包括EOS NAL单元,第二层存在于包括第一层的编解码视频序列(CVS)中。
B7.根据解决方案B1所述的方法,其中,格式规则进一步规定使用第一层作为参考层的第二层包括EOS NAL单元,第二层存在于包括第一层的编解码视频序列(CVS)中。
B8.一种视频处理的方法,包括:根据格式规则执行视频和视频的比特流之间的转换,其中,比特流包括多个访问单元AU中的多个层,多个访问单元AU包括一个或多个图片,其中,格式规则规定,响应于第一访问单元中的第一图片是编解码层视频序列开始(CLVSS)图片,第二图片是CLVSS图片,编解码层视频序列开始(CLVSS)图片是清洁随机访问(CRA)图片或逐步解码刷新(GDR)图片。
B9.根据解决方案B8所述的方法,其中,第二图片是用于第一访问单元中的层的图片。
B10.根据解决方案B8所述的方法,其中第一层包括第一图片,并且其中第二图片是比第一层更高的第二层中的图片。
B11.根据解决方案B8所述的方法,其中第一层包括第一图片,并且其中第二图片是使用第一层作为参考层的第二层中的图片。
B12.根据解决方案B8所述的方法,其中,第二图片是在第一访问单元之后的第二访问单元中按照解码顺序的第一图片。
B13.根据解决方案B8所述的方法,其中,第二图片是第一访问单元中的任意图片。
B14.根据解决方案B1至B13中任一项所述的方法,其中,CLVSS图片是具有等于一的标志的编解码图片,编解码图片是(IRAP)图片或(GDR)图片,其中标志等于一指示在确定关联图片包括对比特流中不存在的图片的参考时,解码器不输出关联图片。
接下来提供一些实施例优选的解决方案的又一列表。
C1.一种视频处理的方法,包括:根据规则执行包括一个或多个图片的视频与视频的比特流之间的转换,其中规则规定比特流至少包括输出的第一图片,其中第一图片在输出层中,其中第一图片包括等于一的语法元素,并且其中语法元素影响与假设参考解码器(HRD)相关联的解码图片输出和移除过程。
C2.根据解决方案C1所述的方法,其中,规则适用于所有档次并且比特流被允许符合任何档次。
C3.根据解决方案C2所述的方法,其中,语法元素是ph_pic_output_flag。
C4.根据解决方案C2所述的方法,其中,档次是主10静止图片档次或主4:4:4 10静止图片档次。
以下解决方案列表适用于上面列举的每个解决方案。
O1.根据前述解决方案中任一项所述的方法,其中转换包括从比特流解码视频。
O2.根据前述解决方案中任一项所述的方法,其中转换包括将视频编码成比特流。
O3.一种将表示视频的比特流存储到计算机可读记录介质的方法,包括根据前述解决方案中的任何一项或多项中描述的方法从视频生成比特流,以及将比特流存储在计算机可读记录介质中。
O4.一种视频处理装置,包括被配置为实现一项或多项前述解决方案中任一项或多项所述的方法的处理器。
O5.一种其上存储有指令的计算机可读介质,该指令在被执行时使处理器实现在一项或多项前述解决方案中所述的方法。
O6.一种存储根据任何一项或多项前述解决方案生成的比特流的计算机可读介质。
O7.一种用于存储比特流的视频处理装置,其中该视频处理装置被配置为实现在前述解决方案中的任何一项或多项中所述的方法。
接下来提供一些实施例优选的解决方案的又一列表。
P1.一种视频处理方法,包括执行包括一个或多个图片的视频和该视频的编解码表示之间的转换,其中该编解码表示符合格式规则,其中该格式规则规定对语法元素的值的约束,该语法元素指示视频的图片中的图片顺序计数的最高有效位周期的存在。
P2.根据解决方案P1所述的方法,其中格式规则规定当独立值标志被设置为零值并且图片的至少一个条带使用其参考列表中的层间参考图片时,语法元素的值为0。
P3.根据解决方案P1至P2中任一项所述的方法,其中格式规则规定通过在编解码表示中不包括语法元素来指示语法元素的零值。
P4.一种视频处理方法,包括执行包括一个或多个图片的视频与视频的编解码表示之间的转换,其中该转换符合规定规则,该规则规定在访问单元的输出顺序不同于访问单元的解码顺序的情况下不允许逐渐解码刷新图片。
P5.一种视频处理方法,包括执行包括包含一个或多个视频图片的视频层的视频与视频的编解码表示之间的转换,其中编解码表示符合格式规则,其中格式规则规定如果指示视频序列结束的第一网络抽象层单元(NAL)存在于层的访问单元中,则编解码表示中的每个较高层的下一个图片必须具有编解码层视频序列开始类型。
P6.根据解决方案P5所述的方法,其中,格式规则还规定,使用该层作为参考层的第二层的按照解码顺序的第一图片应该具有编解码层视频序列开始类型。
P7.根据解决方案P1至P5中任一项所述的方法,其中执行转换包括对视频进行编码以生成编解码表示。
P8.根据解决方案P1至P5中任一项所述的方法,其中执行转换包括解析和解码编解码表示以生成视频。
P9.一种视频解码装置,包括被配置为实现解决方案P1至P8中的一项或多项中所述的方法的处理器。
P10.一种视频编码装置,包括被配置为实现解决方案P1至P8中的一项或多项中所述的方法的处理器。
P11.一种其上存储有计算机代码的计算机程序产品,该代码在由处理器执行时使处理器实现在解决方案P1至P8中的任一项中所述的方法。
在本文档中,术语“视频处理”可指视频编码、视频解码、视频压缩或视频解压缩。例如,在从视频的像素表示到对应的比特流表示的转换期间,可以应用视频压缩算法,反之亦然。如语法所定义,当前视频块的比特流表示(或简称为比特流)可(例如)对应于共位或散布在比特流内不同位置的比特。例如,可以根据变换和编解码的误差残差值并且还使用标头中的比特和比特流中的其他字段,对宏块进行编码。
本文档中所述的公开和其他方案、示例、实施例、模块和功能操作可以被实现在数字电子电路中或者在计算机软件、固件或硬件中,含有本文档中所公开的结构以及其结构的等同物,或者它们中的一个或多个的组合。所公开的和其他实施例可以被实现为计算机可读介质上所编码的一个或多个计算机程序产品,即一个或多个计算机程序指令模块,用于由数据处理装置执行或者控制数据处理装置的操作。该计算机可读介质可以是机器可读存储设备、机器可读存储基板、存储器设备、影响机器可读可传播信号的复合物,或其一个或多个的组合。术语“数据处理装置”涵盖用于处理数据的所有装置、设备和机器,包括例如可编程处理器、计算机或多个处理器或计算机。除了硬件之外,该装置还可以包括为所讨论的计算机程序创建执行环境的代码,例如,构成处理器固件、协议栈、数据库管理系统、操作系统、或者它们中的一个或多个的组合的代码。传播信号是人工生成的信号,例如,机器生成的电、光或电磁信号,其被生成来编码信息以传输到合适的接收器装置。
计算机程序(也称为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式来部署计算机程序,包括独立程序或适合在计算环境中使用的模块、组件、子例程或其它单元。计算机程序不必须对应于文件系统中的文件。程序可以存储在保存其他程序或数据的文件的部分中(例如,在标记语言文档中存储的一个或多个脚本)、在专用于所讨论的程序的单个文件中、或在多个协同文件中(例如存储一个或多个模块、子程序或代码部分的文件)。计算机程序可以部署为在一个计算机上或者在多个计算机上执行,该多个计算机位于一个站点处或者分布跨多个站点并由通信网络互连。
可以由执行一个或多个计算机程序的一个或多个可编程处理器来进行在本文档中所描述的过程和逻辑流,以通过在输入数据上操作并且生成输出来进行功能。也可以由专用逻辑电路(例如,现场可编程门阵列(FPGA)或专用集成电路(ASIC))进行过程和逻辑流,并且装置可以实现为专用逻辑电路(例如FPGA或ASIC)。
适合于计算机程序的执行的处理器包括例如通用和专用微处理器两者,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或者该两者接收指令和数据。计算机的基本元件是用于进行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个海量存储设备(例如磁、磁光盘或光盘),或者可操作地耦合以从海量存储设备(例如磁、磁光盘或光盘)接收数据或者将数据传输到海量存储设备(例如磁、磁光盘或光盘),或者以上两者。但是,计算机不必具有此类设备。适用于存储计算机程序指令和数据的计算机可读介质含有所有形式的非易失性存储器、介质和存储器设备,含有例如半导体存储器设备(例如EPROM、EEPROM和闪速存储器设备);磁盘(例如内部硬盘或可移动磁盘);磁光盘;和CD ROM和DVD-ROM磁盘。处理器和存储器可以由专用逻辑电路补充,或者合并在专用逻辑电路中。
虽然本专利文档含有许多细节,但这些细节不应被解释为对任何主题或可要求保护的范围的限制,而是作为规定于特定技术的特定实施例的特征的描述。在本专利文档中,在单独的实施例的上下文中描述的某些特征也可以在单个实施例中组合实现。相反地,在单个实施例的上下文中所描述的各种特征还可以分别在多个实施例中来实现或者以各种合适的子组合来实现。此外,尽管特征可以如上文描述为以某些组合起作用并且甚至最初同样地要求,但是在某些情况下来自所要求保护的组合的一个或多个特征可以从组合中去除,并且所要求保护的组合可以针对子组合或子组合的变化。
类似地,尽管在附图中以特定顺序描绘了操作,但这不应当理解为要求按所示的特定次序或顺序次序进行此类操作或者进行所有示出的操作,以实现期望的结果。此外,在本专利文档中描述的实施例中的各种系统组件的分开不应被理解为在所有实施例中都要求这种分开。
仅描述了几个实现方式和示例,并且可以基于本专利文档中描述和示出的内容来作出其它实现方式、增强和变型。

Claims (21)

1.一种视频处理的方法,包括:
根据格式规则执行视频和所述视频的比特流之间的转换,
其中,所述比特流包括多个访问单元AU中的多个层,所述多个访问单元AU包括一个或多个图片,
其中,所述格式规则规定,响应于所述比特流中的第一访问单元AU中存在第一层的序列结束EOS网络抽象层NAL单元,所述比特流中的所述第一AU之后的AU中的所述第一层的一个或多个较高层中的每一个的后续图片是编解码层视频序列开始CLVSS图片。
2.根据权利要求1所述的方法,其中,所述格式规则还规定,对于使用所述第一层作为参考层的第二层,按照解码顺序的第一图片是CLVSS图片,所述第二层存在于包括所述第一层的编解码视频序列CVS中。
3.根据权利要求1所述的方法,其中,所述一个或多个较高层包括所有或特定较高层。
4.根据权利要求1所述的方法,其中,所述格式规则还规定,对于作为比所述第一层更高的层的第二层,按照解码顺序的第一图片是CLVSS图片,所述第二层存在于包括所述第一层的编解码视频序列CVS中。
5.根据权利要求1所述的方法,其中,所述格式规则还规定所述EOS NAL单元存在于所述比特流中的编解码视频序列CVS的每一层中。
6.根据权利要求1所述的方法,其中,所述格式规则还规定比所述第一层更高的层的第二层包括所述EOS NAL单元,所述第二层存在于包括所述第一层的编解码视频序列CVS中。
7.根据权利要求1所述的方法,其中,所述格式规则还规定使用所述第一层作为参考层的第二层包括所述EOS NAL单元,所述第二层存在于包括所述第一层的编解码视频序列CVS中。
8.一种视频处理的方法,包括:
根据格式规则执行视频和所述视频的比特流之间的转换,
其中,所述比特流包括多个访问单元AU中的多个层,所述多个访问单元AU包括一个或多个图片,
其中,所述格式规则规定,响应于第一访问单元中的第一图片是编解码层视频序列开始CLVSS图片,第二图片是CLVSS图片,所述编解码层视频序列开始CLVSS图片是清洁随机访问CRA图片或逐步解码刷新GDR图片。
9.根据权利要求8所述的方法,其中,所述第二图片是所述第一访问单元中的层的图片。
10.根据权利要求8所述的方法,其中,第一层包括所述第一图片,并且其中所述第二图片是比所述第一层更高的第二层中的图片。
11.根据权利要求8所述的方法,其中,第一层包括所述第一图片,并且其中所述第二图片是使用所述第一层作为参考层的第二层中的图片。
12.根据权利要求8所述的方法,其中,所述第二图片是在所述第一访问单元之后的第二访问单元中按照解码顺序的第一图片。
13.根据权利要求8所述的方法,其中,所述第二图片是所述第一访问单元中的任意图片。
14.根据权利要求1至13中任一项所述的方法,其中,所述CLVSS图片是具有等于一的标志的编解码图片,所述编解码图片是IRAP图片或GDR图片,其中所述标志等于一指示在确定关联图片包括对所述比特流中不存在的图片的参考时,解码器不输出所述关联图片。
15.根据权利要求1至14中任一项所述的方法,其中,所述转换包括从所述比特流解码所述视频。
16.根据权利要求1至14中任一项所述的方法,其中所述转换包括将所述视频编码成所述比特流。
17.一种将表示视频的比特流存储到计算机可读记录介质的方法,包括:
根据权利要求1至14中任一项或多项所述的方法从所述视频生成所述比特流;以及
将所述比特流存储在所述计算机可读记录介质中。
18.一种视频处理装置,包括被配置为实现权利要求1至17中任一项或多项所述的方法的处理器。
19.一种其上存储有指令的计算机可读介质,所述指令在被执行时使处理器实现根据权利要求1至17中的一项或多项所述的方法。
20.一种计算机可读介质,存储根据权利要求1至17中的任一项或多项生成的所述比特流。
21.一种用于存储比特流的视频处理装置,其中,所述视频处理装置被配置为实现根据权利要求1至17中的任一项或多项所述的方法。
CN202180042173.8A 2020-06-12 2021-06-11 编解码视频中的序列结束指示 Pending CN115836526A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063038601P 2020-06-12 2020-06-12
US63/038,601 2020-06-12
PCT/US2021/037121 WO2021252976A1 (en) 2020-06-12 2021-06-11 End of sequence indication in coded video

Publications (1)

Publication Number Publication Date
CN115836526A true CN115836526A (zh) 2023-03-21

Family

ID=78845938

Family Applications (3)

Application Number Title Priority Date Filing Date
CN202180042176.1A Pending CN115918067A (zh) 2020-06-12 2021-06-11 多层视频编解码的图片标头约束
CN202180042173.8A Pending CN115836526A (zh) 2020-06-12 2021-06-11 编解码视频中的序列结束指示
CN202180042695.8A Pending CN115885512A (zh) 2020-06-12 2021-06-11 视频比特流中图片输出顺序的约束

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202180042176.1A Pending CN115918067A (zh) 2020-06-12 2021-06-11 多层视频编解码的图片标头约束

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202180042695.8A Pending CN115885512A (zh) 2020-06-12 2021-06-11 视频比特流中图片输出顺序的约束

Country Status (6)

Country Link
US (4) US20230113199A1 (zh)
EP (1) EP4150901A4 (zh)
JP (1) JP7513764B2 (zh)
KR (1) KR20230021664A (zh)
CN (3) CN115918067A (zh)
WO (3) WO2021252973A1 (zh)

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005071970A1 (en) * 2004-01-16 2005-08-04 General Instrument Corporation Method and apparatus for determining timing information from a bit stream
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
SG10201606621XA (en) * 2012-01-20 2016-09-29 Ge Video Compression Llc Coding Concept Allowing Parallel Processing, Transport Demultiplexer and Video Bitstream
US10021394B2 (en) * 2012-09-24 2018-07-10 Qualcomm Incorporated Hypothetical reference decoder parameters in video coding
US9602841B2 (en) * 2012-10-30 2017-03-21 Texas Instruments Incorporated System and method for decoding scalable video coding
CN109729364A (zh) * 2013-04-07 2019-05-07 杜比国际公司 用信号通知输出层集的改变
US9621919B2 (en) * 2013-10-23 2017-04-11 Qualcomm Incorporated Multi-layer video file format designs
US20160295211A1 (en) * 2013-12-27 2016-10-06 Sony Corporation Decoding device and decoding method, and encoding device and encoding method
US20150264404A1 (en) * 2014-03-17 2015-09-17 Nokia Technologies Oy Method and apparatus for video coding and decoding
US11388441B2 (en) * 2014-03-18 2022-07-12 Qualcomm Incorporated Derivation of SPS temporal ID nesting information for multi-layer bitstreams
US10136152B2 (en) * 2014-03-24 2018-11-20 Qualcomm Incorporated Use of specific HEVC SEI messages for multi-layer video codecs
US10356415B2 (en) * 2014-06-20 2019-07-16 Qualcomm Incorporated Systems and methods for constraining representation format parameters for a parameter set
WO2016098056A1 (en) * 2014-12-18 2016-06-23 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
US20170105004A1 (en) * 2015-10-07 2017-04-13 Qualcomm Incorporated Methods and systems of coding a predictive random access picture using a background picture
US10623755B2 (en) 2016-05-23 2020-04-14 Qualcomm Incorporated End of sequence and end of bitstream NAL units in separate file tracks
BR112022005413A2 (pt) 2019-09-24 2022-06-21 Huawei Tech Co Ltd Sinalização de cabeçalho de imagem em codificação de vídeo
AU2021201606A1 (en) * 2020-01-14 2022-08-11 Huawei Technologies Co., Ltd. Method and apparatus of signaling the number of candidates for merge mode
US11546623B2 (en) 2020-03-10 2023-01-03 Qualcomm Incorporated Coded video sequence start access unit in video coding
US11611778B2 (en) 2020-05-20 2023-03-21 Sharp Kabushiki Kaisha Systems and methods for signaling general constraint information in video coding
US11418814B2 (en) 2020-05-22 2022-08-16 Tencent America LLC Constraint on syntax elements for still picture profiles
JP2023526461A (ja) * 2020-05-22 2023-06-21 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化ビデオの出力レイヤセットの処理
CN115699768A (zh) * 2020-05-27 2023-02-03 Lg电子株式会社 在视频或图像编码系统中基于poc信息和非参考图片标志的图像编码方法
US11503342B2 (en) 2020-06-10 2022-11-15 Sharp Kabushiki Kaisha Systems and methods for signaling sequence parameter information in video coding
CN115769571A (zh) * 2020-06-17 2023-03-07 字节跳动有限公司 视频编解码中的解码的图片缓冲器管理和子图片

Also Published As

Publication number Publication date
CN115918067A (zh) 2023-04-04
EP4150901A1 (en) 2023-03-22
US20230104910A1 (en) 2023-04-06
CN115885512A (zh) 2023-03-31
US20230105096A1 (en) 2023-04-06
WO2021252973A1 (en) 2021-12-16
US20240121441A1 (en) 2024-04-11
KR20230021664A (ko) 2023-02-14
JP2023529198A (ja) 2023-07-07
JP7513764B2 (ja) 2024-07-09
US11943483B2 (en) 2024-03-26
EP4150901A4 (en) 2023-10-18
WO2021252976A1 (en) 2021-12-16
US20230113199A1 (en) 2023-04-13
US11930221B2 (en) 2024-03-12
WO2021252978A1 (en) 2021-12-16

Similar Documents

Publication Publication Date Title
JP7518204B2 (ja) 映像ビットストリーム処理におけるピクチャタイプの制約
WO2021188453A1 (en) Gradual decoding refresh access unit in scalable video coding
CN115804091A (zh) 访问单元分隔符,以及视频编解码中的通用约束信息
CN115699731A (zh) 参考图片重采样
EP4154523A1 (en) Constraints of slice count in a coded video picture
CN115769580A (zh) 在视频子比特流提取中处理不同nal类型
CN115668908A (zh) 视频子比特流提取过程中访问单元的处理
US11943483B2 (en) Constraints on picture output ordering in a video bitstream
CN115668933A (zh) 编解码视频中nal单元的排序

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination