CN114697663B - 对编码视频位流进行解码的方法,解码设备以及译码系统 - Google Patents

对编码视频位流进行解码的方法,解码设备以及译码系统 Download PDF

Info

Publication number
CN114697663B
CN114697663B CN202111390353.3A CN202111390353A CN114697663B CN 114697663 B CN114697663 B CN 114697663B CN 202111390353 A CN202111390353 A CN 202111390353A CN 114697663 B CN114697663 B CN 114697663B
Authority
CN
China
Prior art keywords
reference picture
list
slice
picture list
refpiclist
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111390353.3A
Other languages
English (en)
Other versions
CN114697663A (zh
Inventor
王业奎
弗努·亨德里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202111390353.3A priority Critical patent/CN114697663B/zh
Publication of CN114697663A publication Critical patent/CN114697663A/zh
Application granted granted Critical
Publication of CN114697663B publication Critical patent/CN114697663B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44004Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving video buffer management, e.g. video decoder buffer or video display buffer
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/60Memory management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

提供了一种由视频解码器实施的对编码视频位流进行解码的方法,解码设备,译码装置,系统。该方法包括解析编码视频位流中表示的参数集。该参数集包含一组语法元素,该组语法元素包括一组参考图像列表结构。该方法还包括解析编码视频位流中表示的当前切片的切片头。该切片头包含参数集中的该组参考图像列表结构中的参考图像列表结构的索引。该方法还包括基于参数集中的该组语法元素和参考图像列表结构的索引,导出当前切片的参考图像列表。该方法还包括基于参考图像列表,获得当前切片的至少一个重构块。

Description

对编码视频位流进行解码的方法,解码设备以及译码系统
相关申请的交叉关联
本申请要求王业奎等人的于2018年8月17日提交的申请号为62/719,360、发明名称为“视频译码中的参考图像管理”的美国临时专利申请的优先权,其内容结合于此作为参考。
技术领域
本公开总体上涉及视频译码中的参考图像管理技术。更具体地,本公开描述了参考图像列表构造技术和参考图像标记技术。
背景技术
即使描述较短的视频,所需的视频数据量也可能很大,这可能会导致在带宽容量有限的通信网络上流式传输或以其他方式传送数据时产生困难。因此,视频数据在现代电信网络上传送之前通常会被压缩。因为存储资源可能有限,所以在视频存储在存储设备上时,视频的尺寸也可能是个问题。在传输或存储之前,视频数据通常在源处由视频压缩设备使用软件和/或硬件进行编码,从而减少表示数字视频图像所需的数据量。然后,压缩数据在目的地处由对视频数据进行解码的视频解压缩设备接收。由于网络资源有限且对更高视频质量的需求不断增长,需要一种在几乎不牺牲图像质量的情况下提高压缩率的改进的压缩和解压缩技术。
发明内容
第一方面涉及一种对编码视频位流进行解码的方法。该方法包括:解析编码视频位流中表示的参数集,其中,该参数集包括一组语法元素,该组语法元素包括一组参考图像列表结构;解析编码视频位流中表示的当前切片的切片头,其中,切片头包括参数集中的该组参考图像列表结构中的参考图像列表结构的索引;基于参数集中的该组语法元素和参考图像列表结构的索引,导出当前切片的参考图像列表;以及基于参考图像列表,获得当前切片的至少一个重构块。
该方法提供了一种简化参考图像列表的信令并提高上述信令的效率的技术。因此,改进了整个译码过程。
在根据第一方面的方法的第一实施方式中,参考图像列表结构中的条目的顺序与参考图像列表中的对应参考图像的顺序相同。
在根据第一方面或第一方面的任何先前实施方式的方法的第二实施方式中,顺序为从零到指示值。
在根据第一方面或第一方面的任何先前实施方式的方法的第三实施方式中,指示值为从零到由sps_max_dec_pic_buffering_minus1指示的值。
在根据第一方面或第一方面的任何先前实施方式的方法的第四实施方式中,参考图像列表被指定为(designated)RefPictList[0]。
在根据第一方面或第一方面的任何先前实施方式的方法的第五实施方式中,参考图像列表被指定为RefPictList[1]。
在根据第一方面或第一方面的任何先前实施方式的方法的第六实施方式中,上述至少一个重构块用于生成在电子设备的显示器上显示的图像。
在根据第一方面或第一方面的任何先前实施方式的方法的第七实施方式中,参考图像列表包括用于帧间预测的参考图像的列表。
在根据第一方面或第一方面的任何先前实施方式的方法的第八实施方式中,帧间预测针对P切片或针对B切片。
在根据第一方面或第一方面的任何先前实施方式的方法的第九实施方式中,参数集包括序列参数集(SPS)。
在根据第一方面或第一方面的任何先前实施方式的方法的第十实施方式中,来自参数集的该组语法元素设置在网络抽象层(NAL)单元的原始字节序列有效载荷(RBSP)中。
在根据第一方面或第一方面的任何先前实施方式的方法的第十一实施方式中,参考图像列表被指定为RefPictList[0]或RefPictList[1],并且参考图像列表结构中的条目的顺序与参考图像列表中的对应参考图像的顺序相同。
在根据第一方面或第一方面的任何先前实施方式的方法的第十二实施方式中,该方法还包括:解析编码视频位流中表示的参数集,其中,该参数集包括一组语法元素,该组语法元素包括一组参考图像列表结构;获得编码视频位流中表示的参考图像列表结构;基于参考图像列表结构,导出当前切片的第一参考图像列表,其中,第一参考图像列表包括至少一个激活条目和至少一个非激活条目,其中,上述至少一个非激活条目关联虽不用于当前切片的帧间预测、但由第二参考图像列表中的激活条目关联的参考图像,并且其中,第二参考图像列表是按照解码顺序在当前切片之后的切片的参考图像列表,或按照解码顺序在当前图像之后的图像的参考图像列表;以及基于第一参考图像列表的至少一个激活条目,获得当前切片的至少一个重构块。
第二方面涉及一种解码设备,该编码设备包括:接收器,用于接收编码视频位流;耦合到接收器的存储器,存储器存储指令;以及耦合到存储器的处理器,处理器用于执行存储在存储器中的指令以使处理器:解析编码视频位流中表示的参数集,其中,参数集包括一组语法元素,该组语法元素包括一组参考图像列表结构;解析编码视频位流中表示的当前切片的切片头,其中,切片头包括参数集中的该组参考图像列表结构中的参考图像列表结构的索引;基于参数集中的该组语法元素和参考图像列表结构的索引,导出当前切片的参考图像列表;以及基于参考图像列表,获得当前切片的至少一个重构块。
该解码设备提供了一种简化参考图像列表的信令并提高上述信令的效率的技术。因此,改进了整个译码过程。
在根据第二方面的解码设备的第一实施方式中,解码设备还包括显示器,该显示器用于显示基于上述至少一个重构块生成的当前图像。
第三方面涉及一种译码装置,该译码装置包括:接收器,用于接收位流以进行解码;耦合到接收器的发射器,发射器用于将解码图像发送到显示器;耦合到接收器或发射器中的至少一个的存储器,存储器用于存储指令;以及耦合到存储器的处理器,处理器用于执行存储在存储器中的指令,以执行前述方面或实施方式中的任何一个中的方法。
第四方面涉及一种系统,该系统包括编码器和与编码器通信的解码器。编码器或解码器包括前述方面或实施方式中的任何一个的解码设备或译码装置。
该系统提供了一种简化参考图像列表的信令并提高上述信令的效率的技术。因此,改进了整个译码过程。
第五方面涉及一种译码装置,该译码装置包括:接收装置,用于接收图像以进行编码或接收位流以进行解码;耦合到接收装置的发射装置,该发射装置用于将位流发送到解码器或将解码图像发送到显示装置;耦合到接收装置或发射装置中的至少一个的存储装置,该存储装置用于存储指令;以及耦合到存储装置的处理装置,该处理装置用于执行存储在存储装置中的指令,以执行前述方面或实施方式中的任何一个中的方法。
该译码装置提供了一种简化参考图像列表的信令并提高上述信令的效率的技术。因此,改进了整个译码过程。
附图说明
为了更透彻地理解本公开,现在结合附图和具体实施方式参考以下简要描述,在附图中,相似的附图标记表示相似的部分:
图1为示出可以利用双向预测技术的示例译码系统的框图。
图2为示出可以实施双向预测技术的示例视频编码器的框图。
图3为示出可以实施双向预测技术的示例视频解码器的框图。
图4为示出具有在参考图像集(RPS)的所有子集中具有条目的图像的RPS的示意图。
图5为对编码视频位流进行解码的方法的实施例。
图6为视频译码设备的示意图。
图7为译码装置的实施例的示意图。
具体实施方式
图1为示出可以利用本文所述的视频译码技术的示例译码系统10的框图。如图1所示,译码系统10包括源设备12,该源设备12提供编码视频数据,该编码视频数据将稍后由目的地设备14进行解码。具体而言,源设备12可以通过计算机可读介质16向目的地设备14提供视频数据。源设备12和目的地设备14可以包括以下多种设备中的任何设备,包括台式电脑、笔记本电脑(例如膝上型电脑)、平板电脑、机顶盒、“智能”电话等手机、“智能”平板、电视机、照相机、显示设备、数字媒体播放器、视频游戏机、视频流设备等。在一些情况下,可以配备源设备12和目的地设备14用于无线通信。
目的地设备14可以通过计算机可读介质16接收待解码的编码视频数据。计算机可读介质16可以包括能够将编码视频数据从源设备12转移到目的地设备14的任何类型的介质或设备。在一个示例中,计算机可读介质16可以包括通信介质,以使源设备12能够直接向目的地设备14实时发送编码视频数据。编码视频数据可以根据无线通信协议等通信标准进行调制,并且可以发送到目的地设备14。通信介质可以包括任何无线通信介质或有线通信介质,例如射频(radio frequency,RF)频谱或一个或多个物理传输线。通信介质可以形成局域网、广域网、或诸如互联网之类的全球网络等分组网络的一部分。通信介质可以包括路由器、交换机、基站、或可用于促进源设备12到目的地设备14的通信的任何其他设备。
在一些示例中,编码数据可以从输出接口22输出到存储设备。类似地,可以通过输入接口从存储设备访问编码数据。存储设备可以包括多种分布式或本地访问的数据存储介质中的任何一种,例如硬盘驱动器、蓝光光盘、数字视频光盘(digital video disk,DVD)、光盘只读存储器(compact disc read-only memory,CD-ROM)、闪存、易失性或非易失性存储器、或用于存储编码视频数据的任何其他合适的数字存储介质。在另一示例中,存储设备可以对应于文件服务器或可存储由源设备12生成的编码视频的另一中间存储设备。目的地设备14可通过流式传输或下载从存储设备中访问存储的视频数据。文件服务器可以是能够存储编码视频数据并将编码视频数据发送到目的地设备14的任何类型的服务器。示例文件服务器包括网络服务器(例如用于网站)、文件传输协议(file transfer protocol,FTP)服务器、网络附加存储(network attached storage,NAS)设备、或本地磁盘驱动器。目的地设备14可以通过包括互联网连接在内的任何标准数据连接来访问编码视频数据。这些数据连接可以包括适合于访问存储在文件服务器上的编码视频数据的无线信道(例如Wi-Fi连接)、有线连接(例如数字用户线路(digital subscriber line,DSL)、电缆调制解调器等)、或无线信道和有线连接的组合。来自存储设备的编码视频数据的传输可以是流式传输、下载传输、或流式传输和下载传输的组合。
本公开的技术不限于无线应用或设置。这些技术可应用于视频译码以支持各种多媒体应用中的任何一种,例如空中电视广播、有线电视传输、卫星电视传输、互联网流式视频传输,例如基于HTTP的动态自适应流式传输(dynamic adaptive streaming over HTTP,DASH)、编码到数据存储介质上的数字视频、存储在数据存储介质上的数字视频的解码、或其他应用。在一些示例中,译码系统10可以用于支持单向或双向视频传输,以支持视频流式传输、视频回放、视频广播、和/或视频电话等应用。
在图1的示例中,源设备12包括视频源18、视频编码器20、以及输出接口22。目的地设备14包括输入接口28、视频解码器30、以及显示设备32。根据本公开,源设备12中的视频编码器20和/或目的地设备14中的视频解码器30可以用于应用视频译码技术。在其他示例中,源设备和目的地设备可以包括其他组件或布置。例如,源设备12可以从外部摄像机等外部视频源接收视频数据。同样,目的地设备14可以与外部显示设备连接,而不包括集成显示设备。
图1所示的译码系统10仅是一个示例。视频译码技术可以由任何数字视频编码和/或解码设备来执行。尽管本发明的技术通常由视频译码设备执行,但这些技术还可以由通常称为“CODEC”的视频编码器/解码器执行。此外,本公开的技术也可以由视频预处理器执行。视频编码器和/或解码器可以是图形处理器(graphics processing unit,GPU)或类似设备。
源设备12和目的地设备14仅是以下这种译码设备的示例:其中,源设备12生成编码视频数据以传输到目的地设备14。在一些示例中,源设备12和目的地设备14可以以基本对称的方式操作,使得源设备12和目的地设备14各自包括视频编码组件和视频解码组件。因此,译码系统10可以支持视频设备12与视频设备14之间的单向或双向视频传输,例如以进行视频流式传输、视频回放、视频广播、或视频电话。
源设备12中的视频源18可以包括视频捕获设备(例如摄像机)、包含先前捕获的视频的视频档案库、和/或用于从视频内容提供商接收视频的视频馈送接口。在另一替代方案中,视频源18可以生成基于计算机图形的数据作为源视频,或者生成直播视频、存档视频、以及计算机生成视频的组合。
在一些情况下,当视频源18是摄像机时,源设备12和目的地设备14可以形成所谓的拍照手机或视频手机。然而,如上所述,本公开中描述的技术通常可以应用于视频译码,并且可以应用于无线应用和/或有线应用。在每种情况下,可以由视频编码器20对捕获、预捕获、或计算机生成的视频进行编码。然后,可以由输出接口22将编码视频信息输出到计算机可读介质16上。
计算机可读介质16可以包括无线广播或有线网络传输等暂时性介质,或硬盘、闪存驱动器、光盘、数字视频光盘、蓝光光盘、或其他计算机可读介质等存储介质(即非暂时性存储介质)。在一些示例中,网络服务器(未示出)可以从源设备12接收编码视频数据并且例如通过网络传输将编码视频数据提供给目的地设备14。类似地,光盘冲压设施等媒体生产设施的计算设备可以从源设备12接收编码视频数据,并且产生包含该编码视频数据的光盘。因此,在各种示例中,计算机可读介质16可理解为包括各种形式的一个或多个计算机可读介质。
目的地设备14的输入接口28从计算机可读介质16接收信息。计算机可读介质16的信息可以包括由视频编码器20定义并由视频解码器30使用的语法信息,该语法信息包括描述块和其他编码单元(例如图像组(group of picture,GOP))的特征和/或处理的语法元素。显示设备32向用户显示解码视频数据,并且可以包括多种显示设备中的任何一种,例如阴极射线管(cathode ray tube,CRT)、液晶显示器(liquid crystal display,LCD)、等离子显示器、有机发光二极管(organic light emitting diode,OLED)显示器、或其他类型的显示设备。
视频编码器20和视频解码器30可以根据目前正在开发的高效视频译码(highefficiency video coding,HEVC)标准等视频译码标准操作,并且可以符合HEVC测试模型(HEVC test model,HM)。或者,视频编码器20和视频解码器30的操作可以根据其他专有或行业标准,例如国际电信联盟电信标准化部门(international telecommunicationsunion telecommunication standardization sector,ITU-T)的H.264标准(或称为运动图像专家组(moving picture expert group,MPEG)-4,第10部分,高级视频编码(advancedvideo coding,AVC),H.265/HEVC)或这些标准的扩展。然而,本公开的技术不限于任何特定的译码标准。视频译码标准的其他示例包括MPEG-2和ITU-T H.263。尽管在图1中未示出,但是在一些方面,视频编码器20和视频解码器30可以分别与音频编码器和音频解码器集成并且可以包括适当的复用器-解复用器(multiplexer-demultiplexer,MUX-DEMUX)单元或其他硬件及软件,以对公共数据流或单独数据流中的音频和视频进行编码处理。如果适用,MUX-DEMUX单元可以符合ITU H.223复用器协议或用户数据报协议(user datagramprotocol,UDP)等其他协议。
视频编码器20和视频解码器30可以各自实施为各种合适的编码器电路中的任何一种,例如一个或多个微处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammable gate array,FPGA)、离散逻辑、软件、硬件、固件、或其任何组合。当这些技术部分地在软件中实施时,设备可以将软件的指令存储在合适的非暂时性计算机可读介质中,并且使用一个或多个处理器在硬件中执行这些指令,从而执行本公开的技术。视频编码器20和视频解码器30可以各自包括在一个或多个编码器或解码器中,其中,这两者中的任何一个可以作为组合式编码器/解码器(combined encoder/decoder,CODEC)的一部分集成在相应设备中。包括视频编码器20和/或视频解码器30的设备可以包括集成电路、微处理器、和/或蜂窝电话等无线通信设备。
图2为示出可以实施视频译码技术的视频编码器20的示例的框图。视频编码器20可对视频切片内的视频块执行帧内编码和帧间编码。帧内编码依靠空间预测来减少或消除给定视频帧或图像内视频中的空间冗余。帧间编码依靠时间预测来减少或消除视频序列的相邻帧或图像内视频中的时间冗余。帧内模式(I模式)可以指几种基于空间的译码模式中的任何一种。诸如单向预测(uni-directional prediction,也称为uni prediction)(P模式)或双向预测(bi-prediction,也称为bi prediction)(B模式)之类的帧间模式可以指几种基于时间的译码模式中的任何一种。
如图2所示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的示例中,视频编码器20包括模式选择单元40、参考帧存储器64、求和器50、变换处理单元52、量化单元54、以及熵译码单元56。模式选择单元40又包括运动补偿单元44、运动估计单元42、帧内预测(intra-prediction,也称为intra prediction)单元46、以及分割单元48。对于视频块重构,视频编码器20还包括逆量化单元58、逆变换单元60、以及求和器62。还可以包括去块滤波器(图2中未示出)用于对块边界进行滤波,从而去除重构的视频中的块效应伪影。如果需要,去块滤波器则通常会对求和器62的输出进行滤波。除去块滤波器之外,还可以使用附加(环内或环后)滤波器。为了简洁起见,没有示出这些滤波器,但是如果需要,则这些滤波器可以(作为环内滤波器)对求和器50的输出进行滤波。
在编码过程中,视频编码器20接收待编码的视频帧或切片。帧或切片可以分成多个视频块。运动估计单元42和运动补偿单元44相对于一个或多个参考帧中的一个或多个块对接收到的视频块执行帧间预测译码,从而提供时间预测。或者,帧内预测单元46可以相对于与待编码的块相同的帧或切片中的一个或多个相邻块,对接收到的视频块执行帧内预测译码,从而提供空间预测。视频编码器20可执行多个译码通道,从而例如为视频数据的每个块选择适当的译码模式。
此外,分割单元48可以基于对先前编码通道中的先前分割方案进行的评估将视频数据的块分割成子块。例如,分割单元48可以先将帧或切片分割成最大译码单元(largestcoding unit,LCU),然后基于率失真分析(例如率失真优化)将每个LCU分割成子编码单元(sub-coding unit,sub-CU)。模式选择单元40可以进一步产生四叉树数据结构以指示将LCU分割成子CU。四叉树的叶节点CU可以包括一个或多个预测单元(prediction unit,PU)以及一个或多个变换单元(transform unit,TU)。
本公开使用术语“块”来指代HEVC情况下的CU、PU、或TU中的任何一个,或其他标准场景下的类似数据结构(例如在H.264/AVC下的宏块及其子块)。CU包括译码节点、与译码节点相关的PU和TU。CU的尺寸对应于译码节点的尺寸并且是正方形。CU的尺寸范围可以从8×8像素到树块尺寸(最大值为64×64像素或更大)。每个CU可以包含一个或多个PU以及一个或多个TU。与CU关联的语法数据可以描述例如将CU分割成一个或多个PU。无论是跳过CU还是对CU进行直接模式编码、帧内预测模式编码、或帧间预测(inter-prediction,也称为inter prediction)模式编码,所使用的分割模式都可能存在差异。可以将PU分割为非正方形。与CU关联的语法数据还可以描述例如根据四叉树将CU分割成一个或多个TU。TU的形状可以是正方形或非正方形(例如矩形)。
模式选择单元40可以例如基于误差结果选择译码模式之一(帧内或帧间),并将得到的帧内或帧间编码块提供给求和器50以生成残差块数据,并提供给求和器62来重构编码块用作参考帧。模式选择单元40还向熵译码单元56提供语法元素,例如运动向量、帧内模式指示符、分割信息、以及其他此类语法信息。
运动估计单元42和运动补偿单元44可以高度集成,但是出于概念目的而被分别示出。运动估计单元42执行的运动估计是生成运动向量的过程,这些运动向量估计视频块的运动。例如,运动向量可以指示当前视频帧或图像内的视频块的PU相对于参考帧(或其他编码单元)内的预测块的位移,其中,上述参考帧内的预测块是相对于当前帧(或其他编码单元)内正在编码的当前块的。预测块是发现在像素差方面与待编码的块紧密匹配的块,像素差可以通过绝对差和(sum of absolute difference,SAD)、平方差和(sum of squaredifference,SSD)、或其他差度量确定。在一些示例中,视频编码器20可以计算参考帧存储器64中存储的参考图像的子整数(sub-integer)像素位置的值。例如,视频编码器20可以内插参考图像的四分之一像素位置、八分之一像素位置、或其他分数像素位置的值。因此,运动估计单元42可以执行相当于全像素位置和分数像素位置的运动搜索,并输出具有分数像素精度的运动向量。
运动估计单元42通过将PU的位置与参考图像中的预测块的位置进行比较来计算帧间编码切片中的视频块的PU的运动向量。参考图像可以从第一参考图像列表(列表0)或第二参考图像列表(列表1)中选择,每个列表标识存储在参考帧存储器64中的一个或多个参考图像。运动估计单元42将计算得到的运动向量发送到熵译码单元56和运动补偿单元44。
由运动补偿单元44执行的运动补偿可能涉及基于由运动估计单元42确定的运动向量提取或生成预测块。同样,在一些示例中,运动估计单元42和运动补偿单元44可以在功能上集成。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可以定位参考图像列表之一中运动向量所指向的预测块。求和器50通过从正在编码的当前视频块的像素值中减去预测块的像素值来形成残差视频块,从而如下所述形成像素差值。通常,运动估计单元42执行相对于亮度分量的运动估计,运动补偿单元44将基于亮度分量计算的运动向量用于色度分量和亮度分量。模式选择单元40还可以生成与视频块和视频切片关联的语法元素,以供视频解码器30在解码视频切片的视频块时使用。
帧内预测单元46可以对当前块进行帧内预测,作为如上所述由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案。具体而言,帧内预测单元46可以确定用于对当前块进行编码的帧内预测模式。在一些示例中,帧内预测单元46可以例如在单独的编码通道期间,使用各种帧内预测模式对当前块进行编码,帧内预测单元46(在一些示例中,模式选择单元40)可从测试的模式中选择适当的帧内预测模式来使用。
例如,帧内预测单元46可以使用针对各种测试的帧内预测模式的率失真分析来计算率失真值,并从测试的模式中选择具有最佳率失真特性的帧内预测模式。率失真分析通常确定编码块和编码以产生编码块的原始未编码块之间的失真(或误差)量,以及确定用于产生编码块的码率(即位数)。帧内预测单元46可以根据各种编码块的失真和速率计算比率,以确定哪个帧内预测模式表现出该块的最佳率失真值。
此外,帧内预测单元46可以用于使用深度建模模式(depth modeling mode,DMM)对深度图中的深度块进行编码。模式选择单元40可以例如使用率失真优化(rate-distortion optimization,RDO)来确定可用DMM模式是否比帧内预测模式和其他DMM模式产生更好的译码结果。对应于深度图的纹理图像的数据可以存储在参考帧存储器64中。运动估计单元42和运动补偿单元44还可以用于对深度图中的深度块进行帧间预测。
在为块选择帧内预测模式(例如,传统帧内预测模式或DMM模式之一)之后,帧内预测单元46可以将指示该块的所选帧内预测模式的信息提供给熵译码单元56。熵译码单元56可以对指示所选帧内预测模式的信息进行编码。视频编码器20可以将配置数据包括在发送的位流中,配置数据可以包括多个帧内预测模式索引表和多个修改的帧内预测模式索引表(也称为码字映射表)、对各种块的编码上下文的定义、以及用于每个上下文的最可能的帧内预测模式、帧内预测模式索引表、以及修改的帧内预测模式索引表的指示。
视频编码器20通过从正在编码的原始视频块中减去来自模式选择单元40的预测数据来形成残差视频块。求和器50表示执行这种减法运算的一个或多个组件。
变换处理单元52对残差块进行离散余弦变换(discrete cosine transform,DCT)或概念上类似的变换等变换,从而产生包括残差变换系数值的视频块。变换处理单元52可以执行概念上类似于DCT的其他变换。还可以使用小波变换、整数变换、子带变换、或其他类型的变换。
变换处理单元52对残差块进行变换,从而产生具有残差变换系数的块。该变换可以将残差信息从像素值域转换到变换域,例如频域。变换处理单元52可以将得到的变换系数发送给量化单元54。量化单元54对变换系数进行量化以进一步降低码率。量化过程可以降低与部分或全部系数关联的位深度。量化的程度可以通过调整量化参数进行修改。在一些示例中,量化单元54然后可以对包括量化变换系数的矩阵执行扫描。或者,熵译码单元56可以执行扫描。
量化之后,熵译码单元56对量化变换系数进行熵译码。例如,熵译码单元56可以执行上下文自适应可变长译码(context adaptive variable length coding,CAVLC)、上下文自适应二进制算术译码(context adaptive binary arithmetic coding,CABAC)、基于语法的上下文自适应二进制算术译码(syntax-based context-adaptive binaryarithmetic coding,SBAC)、概率区间划分熵(probability interval partitioningentropy,PIPE)译码、或另一熵译码技术。在基于上下文的熵译码中,上下文可以基于相邻块。在熵译码单元56进行熵译码后,可以将编码位流发送给另一设备(例如视频解码器30),或将其归档以供后续的传输或检索。
逆量化单元58和逆变换单元60分别应用逆量化和逆变换以在像素域中重构残差块,例如以便之后用作参考块。运动补偿单元44可以通过将残差块添加到参考帧存储器64中的其中一个帧的预测块来计算参考块。运动补偿单元44还可以将一个或多个内插滤波器应用于重构残差块,从而计算用于运动估计的子整数像素值。求和器62将重构的残差块添加到由运动补偿单元44产生的运动补偿预测块中,以产生重构的视频块以存储在参考帧存储器64中。重构的视频块可以由运动估计单元42和运动补偿单元44用作参考块,以对后续视频帧中的块进行帧间编码。
图3为示出可以实施视频译码技术的视频解码器30的示例的框图。在图3的示例中,视频解码器30包括熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、参考帧存储器82、以及求和器80。在一些示例中,视频解码器30可以执行通常与参考视频编码器20(图2)描述的编码通道相反的解码通道。运动补偿单元72可以基于从熵解码单元70接收的运动向量来生成预测数据,而帧内预测单元74可以基于从熵解码单元70接收的帧内预测模式指示符来生成预测数据。
在解码过程中,视频解码器30从视频编码器20接收表示编码视频切片中的视频块的编码视频位流和关联的语法元素。视频解码器30的熵解码单元70对位流进行熵解码以生成量化系数、运动向量、或帧内预测模式指示符、以及其他语法元素。熵解码单元70将运动向量和其他语法元素转发给运动补偿单元72。视频解码器30可以在视频切片级别和/或视频块级别接收语法元素。
在视频切片编码为帧内编码(I)切片时,帧内预测单元74可以基于信令通知的帧内预测模式和当前帧或图像中的先前解码的块的数据,来生成当前视频切片中的视频块的预测数据。在视频帧编码为帧间编码(即B、P、或GPB)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量和其他语法元素,为当前视频切片的视频块产生预测块。可以从参考图像列表之一内的参考图像之一产生预测块。视频解码器30可以基于存储在参考帧存储器82中的参考图像使用默认构造技术来构造参考帧列表,即列表0和列表1。
运动补偿单元72通过解析运动向量和其他语法元素来确定当前视频切片的视频块的预测信息,并使用该预测信息为正在解码的当前视频块产生预测块。例如,运动补偿单元72使用接收的语法元素中的一些语法元素来确定用于对视频切片的视频块进行编码的预测模式(例如帧内或帧间预测)、帧间预测切片类型(例如B切片、P切片、或GPB切片)、切片的一个或多个参考图像列表的构造信息、切片的每个帧间编码视频块的运动向量、切片的每个帧间编码视频块的帧间预测状态、以及用于对当前视频切片中的视频块进行解码的其他信息。
运动补偿单元72还可以基于内插滤波器来执行内插。运动补偿单元72可以使用视频编码器20在视频块编码期间使用的内插滤波器来计算参考块的子整数像素的内插值。在这种情况下,运动补偿单元72可以从接收到的语法元素中确定视频编码器20所使用的内插滤波器,并使用该内插滤波器来产生预测块。
对应于深度图的纹理图像的数据可以存储在参考帧存储器82中。运动补偿单元72还可以用于对深度图中的深度块进行帧间预测。
图像和视频压缩快速发展,从而产生了各种译码标准。这种视频译码标准包括ITU-T H.261、ISO/IEC运动图像专家组(motion picture experts group,MPEG)-1第2部分、ITU-T H.262、或国际标准化组织(international organization forstandardization,ISO)/国际电工委员会(international electrotechnicalcommission,IEC)MPEG-2第2部分、ITU-T H.263、ISO/IEC MPEG-4第2部分、高级视频译码(AVC)(也称为ITU-T H.264或ISO/IEC MPEG-4第10部分)、以及高效视频译码(HEVC)(也称为ITU-T H.265或MPEG-H第2部分)。AVC包括扩展,例如可伸缩视频译码(scalable videocoding,SVC)、多视点视频译码(multiview video coding,MVC)、以及多视点视频译码加深度(multiview video coding plus depth,MVC+D)、以及3D AVC(3D-AVC)。HEVC包括扩展,例如可伸缩HEVC(scalable HEVC,SHVC)、多视点HEVC(MV-HEVC)、以及3D HEVC(3D-HEVC)。
通用视频译码(versatile video coding,VVC)是由ISO/IEC和ITU-T的联合视频专家小组(joint video experts team,JVET)开发中的新视频译码标准。在撰写时,JVET-K1001-v1中包括最新的VVC工作草案(working draft,WD)。JVET文档JVET-K0325-v3包括对VVC高级语法的更新。
总体上,本公开描述了基于开发中的VVC标准的技术。然而,这些技术也适用于其他视频/媒体编解码器规范。
视频压缩技术执行空间(图像内)预测和/或时间(图像间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可以将视频切片(例如,视频图像或视频图像的一部分)分割为视频块,视频块也可以称为树块、译码树块(coding tree block,CTB)、译码树单元(coding tree unit,CTU)、译码单元(coding unit,CU)、和/或译码节点。使用相对于同一图像中的相邻块中的参考样本的空间预测对图像的帧内编码(I)切片中的视频块进行编码。图像的帧间编码(P或B)切片中的视频块可以使用相对于同一图像中的相邻块中的参考样本的空间预测,或使用相对于其他参考图像中的参考样本的时间预测。图像可以称为帧,参考图像可以称为参考帧。
空间预测或时间预测产生了待编码的块的预测块。残差数据表示待编码的原始块和预测块之间的像素差。根据指向形成预测块的参考样本的块的运动向量以及指示编码块和预测块之间的差异的残差数据,对帧间编码块进行编码。根据帧内译码模式和残差数据对帧内编码块进行编码。为了进一步压缩,可以将残差数据从像素域变换到变换域,从而产生残差变换系数,然后可以对残差变换系数进行量化。可以扫描最初排列在二维阵列中的量化的变换系数,以产生变换系数的一维向量,并且可以应用熵译码来实现进一步的压缩。
在视频编解码器规范中,将图像标识为用于多种目的,这些目的包括用作帧间预测中的参考图像、用于从解码图像缓冲区(decoded picture buffer,DPB)输出图像、用于缩放运动向量、用于加权预测等。在AVC和HEVC中,图像可以由图像顺序计数(pictureorder count,POC)标识。在AVC和HEVC中,DPB中的图像可以标记为“用于短期参考”、“用于长期参考”、或“不用于参考”。一旦图像标记为“不用于参考”,则该图像将不再用于预测。当图像不再由输出所需时,可以从DPB中移除该图像。
在AVC中,存在两种类型的参考图像:短期参考图像和长期参考图像。当参考图像不再由预测参考所需时,可以将该参考图像标记为“不用于参考”。这三种状态(短期、长期、以及不用于参考)之间的转换通过解码参考图像标记过程控制。有两种替代的解码参考图像标记机制:隐式滑动窗口过程和显式存储器管理控制操作(memory management controloperation,MMCO)过程。当参考帧的数量等于给定最大数量(序列参数集(sequenceparameter set,SPS)中的max_num_ref_frames)时,滑动窗口过程会将短期参考图像标记为“不用于参考”。短期参考图像以先进先出的方式存储,以便将最新解码的短期图像保存在DPB中。
显式MMCO过程可以包括多个MMCO命令。MMCO命令可以将一个或多个短期或长期参考图像标记为“不用于参考”,可以将所有图像标记为“不用于参考”,或者可以将当前参考图像或现有的短期参考图像标记为长期,然后为该长期参考图像分配长期图像索引。
在AVC中,参考图像标记操作以及从DPB输出图像的过程和从DPB移除图像的过程在解码图像之后执行。
HEVC引入了不同的参考图像管理方法,称为参考图像集(reference pictureset,RPS)。RPS概念与AVC的MMCO/滑动窗口过程相比的最根本区别在于,对于每个特定切片,将提供当前图像或任何后续图像使用的完整的参考图像集。因此,信令通知需要保留在DPB中以供当前图像或将来图像使用的所有图像的完整集。这与仅信令通知相对于DPB的变化的AVC方案不同。使用RPS概念,无需来自在解码顺序上较早的图像的信息即可维持DPB中的参考图像的正确状态。
与AVC相比,HEVC中的图像解码和DPB操作的顺序有所改变,以便利用RPS的优点并提高错误恢复能力。在AVC中,通常在解码当前图像之后应用图像标记和缓冲区操作(从DPB输出解码图像以及从DPB移除解码图像)。在HEVC中,首先从当前图像的切片头解码RPS,然后通常在解码当前图像之前应用图像标记和缓冲区操作。
HEVC中的每个切片头需要包括用于对包含切片的图像的RPS进行信令通知的参数。唯一的例外是,不为即时解码刷新(instantaneous decoding refresh,IDR)切片信令通知RPS。而是推断RPS为空。对于不属于IDR图像的I切片,因为可能存在按照解码顺序在该I图像之后并且使用基于按照解码顺序在该I图像之前的图像的帧间预测的图像,所以即使上述I切片属于I图像,也可以提供RPS。RPS中的图像数量不应超过SPS中sps_max_dec_pic_buffering语法元素指定的DPB尺寸限制。
每个图像与表示输出顺序的POC值关联。切片头包含定长码字pic_order_cnt_lsb,该定长码字表示完整POC值的最低有效位(least significant bit,LSB),也称为POCLSB。码字的长度在SPS中信令通知,并且可以例如在4到16位之间。RPS概念使用POC标识参考图像。除了其自身的POC值外,每个切片头还直接包含或从SPS继承RPS中每个图像的POC值(或LSB)的编码表示。
每个图像的RPS包括五个不同的参考图像列表,也称为五个RPS子集。RefPicSetStCurrBefore包括按照解码顺序和输出顺序均在当前图像之前,并且可以用于当前图像的帧间预测的所有短期参考图像。RefPicSetStCurrAfter包括按照解码顺序在当前图像之前,按照输出顺序在当前图像之后,并且可以用于当前图像的帧间预测的所有短期参考图像。RefPicSetStFoll包括可以用于按照解码顺序在当前图像之后的一个或多个图像的帧间预测而不用于当前图像的帧间预测的所有短期参考图像。RefPicSetLtCurr包括可以用于当前图像的帧间预测的所有长期参考图像。RefPicSetLtFoll包括可以用于按照解码顺序在当前图像之后的一个或多个图像的帧间预测而不用于当前图像的帧间预测的所有长期参考图像。
使用多达三次循环对以下不同类型的参考图像进行迭代来信令通知RPS;POC值比当前图像小的短期参考图像、POC值比当前图像大的短期参考图像、以及长期参考图像。此外,为每个参考图像发送标志(used_by_curr_pic_X_flag),该标志指示该参考图像是由当前图像用于参考(包括在列表RefPicSetStCurrBefore、RefPicSetStCurrAfter、或RefPicSetLtCurr之一中),还是不由当前图像用于参考(包括在列表RefPicSetStFoll或RefPicSetLtFoll之一中)。
图4示出了具有在RPS 400的所有子集402中具有条目(例如图像)的当前图像B14的RPS 400。在图4的示例中,当前图像B14正好在5个子集402(也称为RPS子集)中的每个子集402中包含一个图像。因为图像P8按照输出顺序在前并由B14使用,所以P8是称为RefPicSetStCurrBefore的子集402中的图像。因为图像P12在输出顺序在后并由B14使用,所以P12是称为RefPicSetStCurrAfter的子集402中的图像。因为图像P13是未由B14使用(但因为由B15使用,所以必须保留在DPB中)的短期参考图像,所以P13是称为RefPicSetStFoll的子集402中的图像。因为图像P4是B14使用的长期参考图像,所以P4是称为RefPicSetLtCurr的子集402中的图像。因为图像I0是未由当前图像使用(但因为由B15使用,所以必须保留在DPB中)的长期参考图像,所以I0是称为RefPicSetLtFoll的子集402中的图像。
RPS 400的短期部分可以直接包括在切片头中。或者,切片头可以只包含表示索引的语法元素,该索引关联在激活SPS中发送的RPS的预定义列表。RPS 402的短期部分可以使用两种不同方案之一信令通知;帧间(inter)RPS(如下所述)或帧内(intra)RPS(如此处所述)。当使用帧内RPS时,信令通知表示两个不同参考图像列表的长度的num_negative_pics和num_positive_pics。这些列表分别包含具有与当前图像相比的负POC差和正POC差的参考图像。这些列表中的每个元素用表示POC值相对于列表中先前元素的差减一的长度可变的码进行编码。对于每个列表中的第一图像,信令相对于当前图像的POC值减一。
在将重复RPS编码在序列参数集中时,可以参考已编码在序列参数集中的另一RPS来编码一个RPS(例如RPS 400)的元素。这称为帧间RPS。由于该序列参数集的所有RPS在同一网络抽象层(network abstraction layer,NAL)单元中,因此不存在与该方法相关的错误鲁棒性问题。帧间RPS语法利用了以下事实:可以从先前解码的图像的RPS预测当前图像的RPS。这是因为当前图像的所有参考图像不是先前图像的参考图像就是先前解码的图像本身。仅需要指示这些图像中哪些应作为参考图像并用于当前图像的预测。因此,语法包括以下内容:指向将用作预测变量的RPS的索引、将添加到预测变量的delta_POC以获得当前RPS的增量(delta)POC的delta_POC、以及指示哪些图像是参考图像以及这些图像是否只用于预测未来图像的一组指示符。
想要利用长期参考图像的编码器需将SPS语法元素long_term_ref_pics_present_flag设置为1。然后,可以通过定长码字poc_lsb_lt在切片头中信令通知长期参考图像,该定长码字表示每个长期图像的完整POC值的最低有效位。每个poc_lsb_lt是针对特定的长期图像信令通知的pic_order_cnt_lsb码字的副本。还可以在SPS中信令通知作为POC LSB值的列表的一组长期图像。然后,可以在切片头中信令通知作为该列表的索引的长期图像的POC LSB。
可以另外信令通知delta_poc_msb_cycle_lt_minus1语法元素,从而能够计算长期参考图像相对于当前图像的完整POC距离。对于具有与RPS中的任何其他参考图像相同的POC LSB值的每个长期参考图像,需要信令通知码字delta_poc_msb_cycle_lt_minus1。
对于HEVC中的参考图像标记,在图像解码之前,DPB中通常将存在许多图像。一些图像可能可用于预测,因此标记为“用于参考”。其他图像可能不可用于预测但正在等待输出,因此标记为“不用于参考”。在已解析切片头时,在对切片数据进行解码之前执行图像标记过程。DPB中存在并标记为“用于参考”但不包括在RPS中的图像标记为“不用于参考”。在used_by_curr_pic_X_flag等于0时,忽略DPB中不存在但包括在参考图像集中的图像。但是,在used_by_curr_pic_X_flag等于1时,该参考图像本可用于当前图像的预测但丢失了。然后,可以推断出意外图像丢失,并且解码器应采取适当的行动。
在解码当前图像之后,将其标记为“用于短期参考”。
然后,讨论HEVC中的参考图像列表构造。在HEVC中,术语“帧间预测”用于表示从参考图像而非当前解码的图像的数据元素(例如样本值或运动向量)导出的预测。类似于AVC中,可以从多个参考图像预测图像。用于帧间预测的参考图像被整理在一个或多个参考图像列表中。参考索引标识列表中应用于创建预测信号的参考图像。
单个参考图像列表(列表0)用于P切片,两个参考图像列表(列表0和列表1)用于B切片。类似于AVC,HEVC中的参考图像列表构造包括参考图像列表初始化和参考图像列表修改。
在AVC中,列表0的初始化过程对于P切片(使用解码顺序)和B切片(使用输出顺序)是不同的。在HEVC中,两种情况均使用输出顺序。
参考图像列表初始化基于三个RPS子集RefPicSetStCurrBefore、RefPicSetStCurrAfter、RefPicSetLtCurr创建默认列表0和列表1(如果切片是B切片)。首先将输出顺序较早(较晚)的短期图像以到当前图像的POC距离的升序插入列表0(列表1),然后将输出顺序较晚(较早)的短期图像以到当前图像的POC距离的升序插入列表0(列表1),最后将长期图像插入在末尾。对于RPS,对于列表0,将RefPicSetStCurrBefore中的条目插入初始列表,然后将RefPicSetStCurrAfter中的条目插入。之后附加RefPicSetLtCurr中的条目(如果可用)。
在HEVC中,在列表中的条目的数量小于激活参考图像的目标数量(在图像参数集或切片头中信令通知)时,重复上述过程(再次添加已添加到参考图像列表的参考图像)。在条目的数量大于目标数量时,将该列表截断。
在已初始化参考图像列表之后,可以基于参考图像列表修改命令对该列表进行修改,从而当前图像的参考图像可以以任何顺序排列,包括一个特定参考图像可能出现在列表中的多个位置的情况。在指示列表修改的存在的标志设置为1时,信令通知固定数量(等于参考图像列表中的条目的目标数量)的命令,并且每个命令为参考图像列表插入一个条目。在该命令中,参考图像由从RPS信令导出的当前图像的参考图像列表的索引标识。这与H.264/AVC中的参考图像列表修改不同,在H.264/AVC中,图像由图像号(从frame_num语法元素导出)或长期参考图像索引标识,例如对于交换初始列表的前两个条目的或在初始列表的起始处插入一个条目并移动其他条目,其需要的命令可能更少。
参考图像列表不允许包括任何TemporalId大于当前图像的参考图像。HEVC位流可以由多个时间子层组成。每个NAL单元属于如TemporalId(等于temporal_id_plus1-1)指定的特定子层。
参考图像管理直接基于参考图像列表。JCT-VC文档JCTVC-G643包括一种直接使用三个参考图像列表(参考图像列表0、参考图像列表1、空闲参考图像列表)管理DPB中的参考图像,从而避免对信令过程和解码过程的需要的方法,上述过程包括:1)AVC中的滑动窗口和MMCO过程以及参考图像列表初始化和修改过程,或2)HEVC中的参考图像集以及参考图像列表的初始化和修改过程。
参考图像管理方法可能具有几个问题。AVC方法涉及滑动窗口、MMCO过程、以及参考图像列表初始化和修改过程,这些过程十分复杂。此外,图像丢失可能会导致DPB状态丢失,上述DPB状态与哪些图像应在DPB中以用于进一步的帧间预测参考有关。HEVC方法不存在DPB状态丢失问题。然而,HEVC方法涉及复杂的参考图像集信令和导出过程以及参考图像列表初始化和修改过程,这些过程十分复杂。JCTVC-G643中直接使用三个参考图像列表(参考图像列表0、参考图像列表1、空闲参考图像列表)管理DPB中的参考图像的方法涉及以下方面:第三参考图像列表,即空闲参考图像列表;POC差的两部分译码(two-part coding)(“短期”部分和ue(v)编码的“长期”部分);POC差译码的基于TemporalId的POC粒度,使用POC差的两部分译码确定“用于短期参考”或“用于长期参考”之间的标记;参考图像列表子集描述,使得能够通过从某个较早参考图像列表描述的尾部移除参考图像来指定参考图像列表;语法元素ref_pic_list_copy_flag启用的参考图像列表复制模式;以及参考图像列表描述过程。前述每个方面都使该方法过于复杂。此外,JCTVC-G643中用于参考图像列表的解码过程也十分复杂。信令通知长期参考图像可能需要在切片头中信令通知POC周期。这是低效的。
为了解决上面列出的问题,本文公开了以下解决方案,每个解决方案可以单独使用,并且其中一些解决方案可以组合使用。1)参考图像标记直接基于两个参考图像列表,即参考图像列表0和参考图像列表1。1a)基于SPS、PPS、和/或切片头中的语法元素和语法结构信令通知用于导出这两个参考图像列表的信息。1b)图像的两个参考图像列表中的每个列表均在参考图像列表结构中显式信令通知。1b.i)可以在SPS中信令通知一个或多个参考图像列表结构,每个参考图像列表结构可以由切片头中的索引关联。1b.ii)参考图像列表0和参考图像列表1中的每个列表可以直接在切片头中信令通知。2)针对所有类型的切片(即B(双向预测)切片、P(单向预测)切片、I(帧内)切片)信令通知用于导出两个参考图像列表的信息。术语“切片”是指译码树单元的集合,例如HEVC或最新VVC WD中的切片;其也可以指译码树单元的其他集合,例如HEVC中的块(tile)。3)针对所有类型的切片(即B切片、P切片、I切片)生成两个参考图像列表。4)直接构造两个参考图像列表,而无需使用参考图像列表初始化过程和参考图像列表修改过程。5)在两个参考图像列表中的每个列表中,可以用于当前图像的帧间预测的参考图像只能由列表起始处的多个条目关联。这些条目称为列表中的激活条目,而其他条目称为列表中的非激活条目。可以导出列表中的总条目数量和激活条目数量。6)由参考图像列表中的非激活条目关联的图像不允许由参考图像列表中的另一条目或另一参考图像列表中的任何条目关联。7)长期参考图像仅由一定数量的POC LSB标识,该数量可能大于在切片头中信令通知的用于导出POC值的POC LSB的数量,并且该数量在SPS中指示。8)仅在切片头中信令通知参考图像列表结构,短期参考图像和长期参考图像均由其POC LSB标识,上述POC LSB可以由与用于表示切片头中信令通知的用于导出POC值的POC LSB的位的数量不同的数量的位表示,并且用于表示用于标识短期参考图像和长期参考图像的POC LSB的位的数量可能不同。9)仅在切片头中信令通知参考图像列表结构,短期参考图像和长期参考图像没有区别,所有参考图像均称为参考图像,并且参考图像由其POCLSB标识,上述POC LSB可以由与用于表示切片头中信令通知的用于导出POC值的POC LSB的位的数量不同的数量的位表示。
提供了本公开的第一实施例。该描述相对于最新的VVC WD。在该实施例中,在SPS中信令通知两组参考图像列表结构,一组用于参考图像列表0,一组用于参考图像列表1。
提供了本文使用的一些术语的定义。帧内随机接入点(intra random accesspoint,IRAP)图像:一种编码图像,每个视频译码层(video coding layer,VCL)NAL单元的nal_unit_type等于IRAP_NUT。非IRAP图像:一种编码图像,每个VCL NAL单元的nal_unit_type等于NON_IRAP_NUT。参考图像列表:参考图像的列表,用于P切片或B切片的帧间预测。针对非IRAP图像的每个切片生成两个参考图像列表,即参考图像列表0和参考图像列表1。与图像关联的两个参考图像列表中的所有条目关联的唯一图像集由以下组成:所有可以用于关联图像或按照解码顺序在关联图像之后的任何图像的帧间预测的参考图像。为了解码P切片的切片数据,仅使用参考图像列表0进行帧间预测。为了解码B切片的切片数据,使用两个参考图像列表进行帧间预测。为了解码I切片的切片数据,不使用参考图像列表进行帧间预测。长期参考图像(long-term reference picture,LTRP):标记为“用于长期参考”的图像。短期参考图像(short-term reference picture,STRP):标记为“用于短期参考”的图像。
在VVC的第8.3.3节“参考图像标记的解码过程”、HEVC的第8.3.2节“参考图像集的解码过程”、以及AVC的第7.4.3.3节“解码的参考图像标记语义”中定义了术语“用于短期参考”、“用于长期的参考”、或“不用于参考”。如本文所用的,这些术语具有相同的含义。
下面提供第一实施例的相关语法和语义。
NAL单元头语法。
序列参数集原始字节序列有效载荷(raw byte sequence payload,RBSP)语法。
/>
图像参数集RBSP语法。
切片头语法。
/>
参考图像列表结构语法。
NAL单元头语义。
forbidden_zero_bit应等于0。nal_unit_type指定NAL单元中包含的RBSP数据结构的类型。
表7-1–NAL单元类型码和NAL单元类型类
/>
nuh_temporal_id_plus1减1指定NAL单元的时间标识符。nuh_temporal_id_plus1的值不应等于0。如下指定变量TemporalId:TemporalId=nuh_temporal_id_plus1-1。当nal_unit_type等于IRAP_NUT时,编码切片属于IRAP图像,TemporalId应等于0。访问单元的所有VCL NAL单元的TemporalId的值应相同。访问单元或编码图像的TemporalId的值是访问单元或编码图像的VCL NAL单元的TemporalId的值。非VCL NAL单元的TemporalId值将受到以下约束:如果nal_unit_type等于SPS_NUT,则TemporalId应等于0,并且包含NAL单元的访问单元的TemporalId应等于0。否则,如果nal_unit_type等于EOS_NUT或EOB_NUT,则TemporalId应等于0。否则,TemporalId应大于或等于包含NAL单元的访问单元的TemporalId。当NAL单元是非VCL NAL单元时,TemporalId的值等于非VCL NAL单元适用的所有访问单元的TemporalId值的最小值。当nal_unit_type等于PPS_NUT时,因为所有图像参数集(picture parameter set,PPS)可能包括在位流的起始处,所以TemporalId可以大于或等于包含访问单元(containing access unit)的TemporalId,其中第一编码图像的TemporalId等于0。当nal_unit_type等于PREFIX_SEI_NUT或SUFFIX_SEI_NUT时,因为SEINAL单元可能包含适用于位流子集的信息,该位流子集包括TemporalId值大于包含SEI NAL单元的访问单元的TemporalId的访问单元,所以TemporalId可以大于或等于包含访问单元的TemporalId。nuh_reserved_zero_7bits应等于“0000000”。ITU T|ISO/IEC将来可能会指定nuh_reserved_zero_7bits的其他值。解码器应忽略(即,从位流中移除并丢弃)nuh_reserved_zero_7bits值不等于“0000000”的NAL单元。
序列参数集RBSP语义。
log2_max_pic_order_cnt_lsb_minus4如下指定在图像顺序计数的解码过程中使用的变量MaxPicOrderCntLsb的值:MaxPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4)。log2_max_pic_order_cnt_lsb_minus4的值的范围应为0到12(包括端值)。sps_max_dec_pic_buffering_minus1加1指定以图像存储缓冲区为单位的CVS的解码图像缓冲区的最大所需尺寸。sps_max_dec_pic_buffering_minus1的值的范围应为0到MaxDpbSize-1(包括端值),其中MaxDpbSize在其他地方指定。long_term_ref_pics_flag等于0表示不存在用于CVS中的任何编码图像的帧间预测的LTRP。long_term_ref_pics_flag等于1表示LTRP可以用于CVS中的一个或多个编码图像的帧间预测。additional_lt_poc_lsb如下指定在参考图像列表的解码过程中使用的变量MaxLtPicOrderCntLsb的值:MaxLtPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4+additional_lt_poc_lsb)。additional_lt_poc_lsb的值的范围应为0到32-log2_max_pic_order_cnt_lsb_minus4-4(包括端值)。如果不存在,则推断additional_lt_poc_lsb的值等于0。num_ref_pic_lists_in_sps[i]指定SPS中包括的listIdx等于i的ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构的数量。num_ref_pic_lists_in_sps[i]的值的范围应为0到64(包括端值)。对于listIdx的每个值(等于0或1),因为可能存在直接在当前图像的切片头中信令通知的一个ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构,所以解码器应为总共num_ref_pic_lists_in_sps[i]+1个ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构分配内存。
图像参数集RBSP语义。
在i等于0时,num_ref_idx_default_active_minus1[i]加1指定num_ref_idx_active_override_flag等于0的P切片或B切片的变量NumRefIdxActive[0]的推断值,在i等于1时,num_ref_idx_default_active_minus1[i]加1指定num_ref_idx_active_override_flag等于0的B切片的NumRefIdxActive[1]的推断值。num_ref_idx_default_active_minus1[i]的值的范围应为0到14(包括端值)。
切片头语义。
当存在时,切片头语法元素slice_pic_parameter_set_id和slice_pic_order_cnt_lsb中的每个的值在编码图像的所有切片头中应相同。...slice_type根据表7-2指定切片的译码类型。
表7-2–名称与slice_type的关联
slice_type slice_type的名称
0 B(B切片)
1 P(P切片)
2 I(I切片)
当nal_unit_type等于IRAP_NUT(即,图像是IRAP图像)时,slice_type应等于2。...slice_pic_order_cnt_lsb指定当前图像的以MaxPicOrderCntLsb为模的图像顺序计数。slice_pic_order_cnt_lsb语法元素的长度为log2_max_pic_order_cnt_lsb_minus4+4位。slice_pic_order_cnt_lsb的值的范围应为0到MaxPicOrderCntLsb-1(包括端值)。如果不存在slice_pic_order_cnt_lsb,则推断slice_pic_order_cnt_lsb等于0。ref_pic_list_sps_flag[i]等于1表示基于激活SPS中listIdx等于i的ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构之一导出当前图像的参考图像列表i。ref_pic_list_sps_flag[i]等于0表示基于直接包括在当前图像的切片头中的listIdx等于i的ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构导出当前图像的参考图像列表i。当num_ref_pic_lists_in_sps[i]等于0时,ref_pic_list_sps_flag[i]的值应等于0。ref_pic_list_idx[i]指定:激活SPS中包括的listIdx等于i的ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构的列表的索引;用于导出当前图像的参考图像列表i的listIdx等于i的ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构的列表的索引。语法元素ref_pic_list_idx[i]由Ceil(Log2(num_ref_pic_lists_in_sps[i]))个位表示。如果不存在,则推断ref_pic_list_idx[i]的值等于0。ref_pic_list_idx[i]的值的范围应为0到num_ref_pic_lists_in_sps[i]-1(包括端值)。num_ref_idx_active_override_flag等于1表示P切片和B切片存在语法元素num_ref_idx_active_minus1[0],并且B切片存在语法元素num_ref_idx_active_minus1[1]。num_ref_idx_active_override_flag等于0表示不存在语法元素num_ref_idx_active_minus1[0]和num_ref_idx_active_minus1[1]。当num_ref_idx_active_minus1[i]存在时,其如下指定变量NumRefIdxActive[i]的值:NumRefIdxActive[i]=num_ref_idx_active_minus1[i]+1。num_ref_idx_active_minus1[i]的值的范围应为0到14(包括端值)。
NumRefIdxActive[i]-1的值指定可以用于解码切片的参考图像列表i的最大参考索引。在NumRefIdxActive[i]的值等于0时,不存在可以用于对切片进行解码的参考图像列表i的参考索引。对于i等于0或1,在当前切片为B切片并且num_ref_idx_active_override_flag等于0时,推断NumRefIdxActive[i]等于num_ref_idx_default_active_minus1[i]+1。在当前切片为P切片并且num_ref_idx_active_override_flag等于0时,推断NumRefIdxActive[0]等于num_ref_idx_default_active_minus1[0]+1。在当前切片为P切片时,推断NumRefIdxActive[1]等于0。在当前切片为I切片时,推断NumRefIdxActive[0]和NumRefIdxActive[1]均等于0。
或者,对于i等于0或1,在上述之后以下适用:设rplsIdx1等于ref_pic_list_sps_flag[i]?ref_pic_list_idx[i]:num_ref_pic_lists_in_sps[i],numRpEntries[i]等于num_strp_entries[i][rplsIdx1]+num_ltrp_entries[i][rplsIdx1]。在NumRefIdxActive[i]大于numRpEntries[i]时,NumRefIdxActive[i]的值设置为等于numRpEntries[i]。
参考图像列表结构语义。
ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构可以存在于SPS或切片头中。取决于语法结构是包括在切片头还是SPS中,以下适用:如果存在于切片头中,则ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构指定当前图像(包含该切片的图像)的参考图像列表listIdx。否则(存在于SPS中),ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构指定参考图像列表listIdx的候选,本节其余部分指定的语义中的术语“当前图像”是指满足以下条件的每个图像:1)具有包含等于SPS中包括的ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构的列表的索引的ref_pic_list_idx[listIdx]的一个或多个切片,2)在具有作为激活SPS的SPS的CVS中。num_strp_entries[listIdx][rplsIdx]指定ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的STRP条目的数量。num_ltrp_entries[listIdx][rplsIdx]指定ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的LTRP条目的数量。如果不存在,则推断num_ltrp_entries[listIdx][rplsIdx]的值等于0。如下导出变量NumEntriesInList[listIdx][rplsIdx]:NumEntriesInList[listIdx][rplsIdx]=num_strp_entries[listIdx][rplsIdx]+num_ltrp_entries[listIdx][rplsIdx]。NumEntriesInList[listIdx][rplsIdx]的值的范围应为0到sps_max_dec_pic_buffering_minus1(包括端值)。lt_ref_pic_flag[listIdx][rplsIdx][i]等于1表示ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的第i个条目是LTRP条目。lt_ref_pic_flag[listIdx][rplsIdx][i]等于0表示ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的第i个条目是STRP条目。如果不存在,则推断lt_ref_pic_flag[listIdx][rplsIdx][i]的值等于0。对位流一致性(bitstream conformance)的要求为:所有i值在0到NumEntriesInList[rplsIdx]-1(包括端值)范围内的lt_ref_pic_flag[rplsIdx][i]的总和应等于num_ltrp_entries[rplsIdx]。在第i个条目是ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的第一个STRP条目时,delta_poc_st[listIdx][rplsIdx][i]指定当前图像和第i个条目关联的图像的图像顺序计数值之差,或者,在第i个条目是STRP条目而非ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的第一个STRP条目时,delta_poc_st[listIdx][rplsIdx][i]指定第i个条目关联的图像和ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的先前STRP条目关联的图像的图像顺序计数值之差。delta_poc_st[listIdx][rplsIdx][i]的值的范围应为-215到215-1(包括端值)。poc_lsb_lt[listIdx][rplsIdx][i]指定图像顺序计数以ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的第i个条目关联的图像的MaxLtPicOrderCntLsb为模的值。poc_lsb_lt[listIdx][rplsIdx][i]语法元素的长度为Log2(MaxLtPicOrderCntLsb)位。
讨论解码过程。对于当前图像CurrPic,解码过程如下操作。以下指定NAL单元的解码。以下过程指定以下使用以上和切片头层中的语法元素的解码过程。导出与图像顺序计数有关的变量和函数。仅需要为图像的第一切片调用此过程。在非IRAP图像的每个切片的解码过程开始时,调用参考图像列表构造的解码过程,以导出参考图像列表0(RefPicList[0])和参考图像列表1(RefPicList[1])。调用参考图像标记的解码过程,其中,参考图像可以标记为“不用于参考”或“用于长期参考”。仅需要为图像的第一切片调用此过程。调用译码树单元、缩放、变换、环路滤波等的解码过程。在对当前图像的所有切片进行解码之后,将当前解码图像标记为“用于短期参考”。
讨论NAL单元解码过程。该过程的输入是当前图像的NAL单元及其关联的非VCLNAL单元。该过程的输出是封装在NAL单元内的解析的RBSP语法结构。每个NAL单元的解码过程从NAL单元提取RBSP语法结构,然后解析RBSP语法结构。
讨论切片解码过程,该解码过程包括图像顺序计数的解码过程。该过程的输出是PicOrderCntVal,即当前图像的图像顺序计数。图像顺序计数用于标识图像,以用于导出合并模式下的运动参数和运动向量预测,并用于解码器一致性检查。每个编码图像与图像顺序计数变量(表示为PicOrderCntVal)关联。在当前图像不是IRAP图像时,变量prevPicOrderCntLsb和prevPicOrderCntMsb如下导出:假设prevTid0Pic是按照解码顺序在前的TemporalId等于0的图像。变量prevPicOrderCntLsb设置为等于prevTid0Pic的slice_pic_order_cnt_lsb。变量prevPicOrderCntMsb设置为等于prevTid0Pic的PicOrderCntMsb。
如下导出当前图像的变量PicOrderCntMsb:如果当前图像是IRAP图像,则PicOrderCntMsb设置为等于0。否则,如下导出PicOrderCntMsb:
如下导出PicOrderCntVal:PicOrderCntVal=PicOrderCntMsb+slice_pic_order_cnt_lsb。
因为对于IRAP图像,推断slice_pic_order_cnt_lsb为0,并且prevPicOrderCntLsb和prevPicOrderCntMsb均设置为0,所以所有IRAP图像的PicOrderCntVal都将等于0。PicOrderCntVal的值的范围应为-231到231-1(包括端值)。在一个CVS中,任何两个编码图像的PicOrderCntVal的值均不应相同。
在解码过程期间的任何时刻,DPB中的任何两个参考图像的PicOrderCntVal&(MaxLtPicOrderCntLsb-1)的值均不应相同。如下指定函数PicOrderCnt(picX):PicOrderCnt(picX)=图像picX的PicOrderCntVal。如下指定函数DiffPicOrderCnt(picA,picB):DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)-PicOrderCnt(picB)。位流不应包含使得在解码过程中使用的DiffPicOrderCnt(picA,picB)的值不在-215到215-1(包括端值)范围内的数据。假设X是当前图像,Y和Z是同一编码视频序列(coded videosequence,CVS)中的另外两个图像,则当DiffPicOrderCnt(X,Y)和DiffPicOrderCnt(X,Z)均为正或均为负时,Y和Z视为相对于X在同一输出顺序方向上。
讨论参考图像列表构造的解码过程。在非IRAP图像的每个切片的解码过程开始时,调用此过程。参考图像通过参考索引寻址。参考索引是参考图像列表的索引。在解码I切片时,参考图像列表不用于切片数据的解码。在解码P切片时,仅参考图像列表0(即,RefPicList[0])用于切片数据的解码。在解码B切片时,参考图像列表0和参考图像列表1(即,RefPicList[1])均用于切片数据的解码。在非IRAP图像的每个切片的解码过程开始时,导出参考图像列表RefPicList[0]和RefPicList[1]。参考图像列表用于参考图像的标记或切片数据的解码。对于不是图像的第一切片的非IRAP图像的I切片,可以为了进行位流一致性检查而导出RefPicList[0]和RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。对于不是图像的第一切片的P切片,可以为了进行位流一致性检查而导出RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
对于每个i等于0或1,以下适用:RefPicList[i]中的第一NumRefIdxActive[i]条目称为RefPicList[i]中的激活条目,而RefPicList[i]中的其他条目称为RefPicList[i]中的非激活条目。如果lt_ref_pic_flag[i][RplsIdx[i]][j]等于0,则j在0到NumEntriesInList[i][RplsIdx[i]]-1(包括端值)范围内的RefPicList[i][j]中的每个条目都称为STRP条目,否则称为LTRP条目。特定图像可能由RefPicList[0]中的条目和RefPicList[1]中的条目关联。特定图像也可能由RefPicList[0]中的一个以上的条目或RefPicList[1]中的一个以上的条目关联。RefPicList[0]中的激活条目和RefPicList[1]中的激活条目共同关联可以用于当前图像和按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。RefPicList[0]中的非激活条目和RefPicList[1]中的非激活条目共同关联不用于当前图像的帧间预测,但可以用于按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。因为DPB中不存在相应的图像,所以RefPicList[0]或RefPicList[1]中可能存在等于“无参考图像(no reference picture)”的一个或多个条目。RefPicList[0]或RefPicList[0]中等于“无参考图像”的每个非激活条目都应忽略。对于RefPicList[0]或RefPicList[1]中等于“无参考图像”的每个激活条目,应推断出意外图像丢失。
对位流一致性的要求为适用以下约束:对于每个i等于0或1,NumEntriesInList[i][RplsIdx[i]]不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。图像的切片的RefPicList[0]或RefPicList[1]中的STRP条目和同一切片或同一图像的不同切片的RefPicList[0]或RefPicList[1]中的LTRP条目不应关联同一图像。RefPicList[0]或RefPicList[1]中的任何条目不应关联当前图像本身。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的LTRP条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,并且setOfRefPics对于图像的所有切片应相同。
参考图像标记的解码过程。
在切片头的解码和切片的参考图像列表构造的解码过程之后,但是在切片数据的解码之前,每个图像调用一次该过程。该过程可能使得DPB中的一个或多个参考图像标记为“不用于参考”或“用于长期参考”。DPB中的解码图像可以标记为“不用于参考”、“用于短期参考”、或“用于长期参考”,但是在解码过程的操作期间的任何给定时刻,仅标记为这三者之一。在适用的情况下,为图像分配其中一个标记将隐式移除其中另一标记。在图像标记为“用于参考”时,统称为图像标记为“用于短期参考”或“用于长期参考”(但不能同时标记为两者)。在当前图像是IRAP图像时,当前在DPB中的所有参考图像(如果存在)均标记为“不用于参考”。STRP由其PicOrderCntVal值标识。LTRP由其PicOrderCntVal值的Log2(MaxLtPicOrderCntLsb)LSB标识。以下适用:对于RefPicList[0]或RefPicList[1]中的每个LTRP条目,在参考图像为STRP时,该图像标记为“用于长期参考”。DPB中未由RefPicList[0]和RefPicList[1]中的任何条目关联的每个参考图像均标记为“不用于参考”。
提供了本公开的第二实施例的具体实施方式。本节记录了如上所述的本公开的第二实施例。该描述相对于最新的VVC WD。在该实施例中,在SPS中信令通知一组参考图像列表结构,该组参考图像列表结构由参考图像列表0和参考图像列表1共享。
序列参数集RBSP语法。
图像参数集RBSP语法。
切片头语法。
参考图像列表结构语法。
讨论NAL单元头语义。
序列参数集RBSP语义。
log2_max_pic_order_cnt_lsb_minus4如下指定在图像顺序计数的解码过程中使用的变量MaxPicOrderCntLsb的值:MaxPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4)。log2_max_pic_order_cnt_lsb_minus4的值的范围应为0到12(包括端值)。sps_max_dec_pic_buffering_minus1加1指定以图像存储缓冲区为单位的CVS的解码图像缓冲区的最大所需尺寸。sps_max_dec_pic_buffering_minus1的值的范围应为0到MaxDpbSize-1(包括端值),其中MaxDpbSize在其他地方指定。num_ref_pic_lists_in_sps指定SPS中包括的ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构的数量。num_ref_pic_lists_in_sps的值的范围应为0到128(包括端值)。因为可能存在直接在当前图像的切片头中信令通知的两个ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构,所以解码器应为总共num_short_term_ref_pic_sets+2个ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构分配内存。long_term_ref_pics_flag等于0表示不存在用于CVS中的任何编码图像的帧间预测的LTRP。long_term_ref_pics_flag等于1表示LTRP可以用于CVS中的一个或多个编码图像的帧间预测。additional_lt_poc_lsb如下指定在参考图像列表的解码过程中使用的变量MaxLtPicOrderCntLsb的值:MaxLtPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4+additional_lt_poc_lsb)。additional_lt_poc_lsb的值的范围应为0到32-log2_max_pic_order_cnt_lsb_minus4-4(包括端值)。如果不存在,则推断additional_lt_poc_lsb的值等于0。
讨论图像参数集RBSP语义。
切片头语义。
当存在时,切片头语法元素slice_pic_parameter_set_id和slice_pic_order_cnt_lsb中的每个的值在编码图像的所有切片头中应相同。slice_type根据表7-3指定切片的译码类型。
表7-3–名称与slice_type的关联
slice_type slice_type的名称
0 B(B切片)
1 P(P切片)
2 I(I切片)
当nal_unit_type等于IRAP_NUT(即,图像是IRAP图像)时,slice_type应等于2。...slice_pic_order_cnt_lsb指定当前图像的以MaxPicOrderCntLsb为模的图像顺序计数。slice_pic_order_cnt_lsb语法元素的长度为log2_max_pic_order_cnt_lsb_minus4+4位。slice_pic_order_cnt_lsb的值的范围应为0到MaxPicOrderCntLsb-1(包括端值)。如果不存在slice_pic_order_cnt_lsb,则推断slice_pic_order_cnt_lsb等于0。ref_pic_list_sps_flag[i]等于1表示基于激活SPS中的ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构之一导出当前图像的参考图像列表i。ref_pic_list_sps_flag[i]等于0表示基于直接包括在当前图像的切片头中的ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构导出当前图像的参考图像列表i。当num_ref_pic_lists_in_sps等于0时,ref_pic_list_sps_flag[i]的值应等于0。ref_pic_list_idx[i]指定:激活SPS中包括的ref_pic_list_struct(rplsIdx,ltpicFlag)语法结构的列表的索引、用于导出当前图像的参考图像列表i的ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构的列表的索引。语法元素ref_pic_list_idx[i]由Ceil(Log2(num_ref_pic_lists_in_sps))个位表示。如果不存在,则推断ref_pic_list_idx[i]的值等于0。ref_pic_list_idx[i]的值的范围应为0到num_ref_pic_lists_in_sps-1(包括端值)。num_ref_idx_active_override_flag等于1表示P切片和B切片存在语法元素num_ref_idx_active_minus1[0],并且B切片存在语法元素num_ref_idx_active_minus1[1]。num_ref_idx_active_override_flag等于0表示不存在语法元素num_ref_idx_active_minus1[0]和num_ref_idx_active_minus1[1]。
当num_ref_idx_active_minus1[i]存在时,其如下指定变量NumRefIdxActive[i]的值:NumRefIdxActive[i]=num_ref_idx_active_minus1[i]+1。num_ref_idx_active_minus1[i]的值的范围应为0到14(包括端值)。NumRefIdxActive[i]-1的值指定可以用于解码切片的参考图像列表i的最大参考索引。在NumRefIdxActive[i]的值等于0时,不存在可以用于对切片进行解码的参考图像列表i的参考索引。对于i等于0或1,在当前切片为B切片并且num_ref_idx_active_override_flag等于0时,推断NumRefIdxActive[i]等于num_ref_idx_default_active_minus1[i]+1。在当前切片为P切片并且num_ref_idx_active_override_flag等于0时,推断NumRefIdxActive[0]等于num_ref_idx_default_active_minus1[0]+1。在当前切片为P切片时,推断NumRefIdxActive[1]等于0。在当前切片为I切片时,推断NumRefIdxActive[0]和NumRefIdxActive[1]均等于0。
或者,对于i等于0或1,在上述之后以下适用:设rplsIdx1等于ref_pic_list_sps_flag[i]?ref_pic_list_idx[i]:num_ref_pic_lists_in_sps[i],numRpEntries[i]等于num_strp_entries[i][rplsIdx1]+num_ltrp_entries[i][rplsIdx1]。在NumRefIdxActive[i]大于numRpEntries[i]时,NumRefIdxActive[i]的值设置为等于numRpEntries[i]。
参考图像列表结构语义。
ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构可以存在于SPS或切片头中。取决于语法结构是包括在切片头还是SPS中,以下适用:如果存在于切片头中,则ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构指定当前图像(包含该切片的图像)的参考图像列表。否则(存在于SPS中),ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构指定候选参考图像列表,本节其余部分指定的语义中的术语“当前图像”是指满足以下条件的每个图像:1)具有包含等于SPS中包括的ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构的列表的索引的ref_pic_list_idx[i]的一个或多个切片,2)在具有作为激活SPS的SPS的CVS中。num_strp_entries[rplsIdx]指定ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的STRP条目的数量。num_ltrp_entries[rplsIdx]指定ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的LTRP条目的数量。如果不存在,则推断num_ltrp_entries[rplsIdx]的值等于0。
如下导出变量NumEntriesInList[rplsIdx]:NumEntriesInList[rplsIdx]=num_strp_entries[rplsIdx]+num_ltrp_entries[rplsIdx]。NumEntriesInList[rplsIdx]的值的范围应为0到sps_max_dec_pic_buffering_minus1(包括端值)。lt_ref_pic_flag[rplsIdx][i]等于1表示ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的第i个条目是LTRP条目。lt_ref_pic_flag[rplsIdx][i]等于0表示ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的第i个条目是STRP条目。如果不存在,则推断lt_ref_pic_flag[rplsIdx][i]的值等于0。对位流一致性的要求为:所有i值在0到NumEntriesInList[rplsIdx]-1(包括端值)范围内的lt_ref_pic_flag[rplsIdx][i]的总和应等于num_ltrp_entries[rplsIdx]。在第i个条目是ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的第一个STRP条目时,delta_poc_st[rplsIdx][i]指定当前图像和第i个条目关联的图像的图像顺序计数值之差,或者,在第i个条目是STRP条目而非ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的第一个STRP条目时,delta_poc_st[rplsIdx][i]指定第i个条目关联的图像和ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的先前STRP条目关联的图像的图像顺序计数值之差。delta_poc_st[rplsIdx][i]的值的范围应为0到215-1(包括端值)。poc_lsb_lt[rplsIdx][i]指定图像顺序计数以ref_pic_list_struct(rplsIdx,ltrpFlag)语法结构中的第i个条目关联的图像的MaxLtPicOrderCntLsb为模的值。poc_lsb_lt[rplsIdx][i]语法元素的长度为Log2(MaxLtPicOrderCntLsb)位。
指定为本公开的第一实施例的具体实施方式的一部分的一般解码过程适用。描述了NAL单元解码过程。指定为本公开的第一实施例的具体实施方式的一部分的NAL单元解码过程适用。
提供了切片解码过程。
图像顺序计数的解码过程。
指定为本公开的第一实施例的具体实施方式的一部分的图像顺序计数解码过程适用。
参考图像列表构造的解码过程。
在非IRAP图像的每个切片的解码过程开始时,调用此过程。参考图像通过参考索引寻址。参考索引是参考图像列表的索引。在解码I切片时,参考图像列表不用于切片数据的解码。在解码P切片时,仅参考图像列表0(即,RefPicList[0])用于切片数据的解码。在解码B切片时,参考图像列表0和参考图像列表1(即,RefPicList[1])均用于切片数据的解码。在非IRAP图像的每个切片的解码过程开始时,导出参考图像列表RefPicList[0]和RefPicList[1]。参考图像列表用于参考图像的标记或切片数据的解码。对于不是图像的第一切片的非IRAP图像的I切片,可以为了进行位流一致性检查而导出RefPicList[0]和RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。对于不是图像的第一切片的P切片,可以为了进行位流一致性检查而导出RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。
参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
/>
对于每个i等于0或1,以下适用:RefPicList[i]中的第一NumRefIdxActive[i]条目称为RefPicList[i]中的激活条目,而RefPicList[i]中的其他条目称为RefPicList[i]中的非激活条目。如果lt_ref_pic_flag[RplsIdx[i]][j]等于0,则j在0到NumEntriesInList[RplsIdx[i]]-1(包括端值)范围内的每个条目RefPicList[i][j]都称为STRP条目,否则称为LTRP条目。特定图像可能由RefPicList[0]中的条目和RefPicList[1]中的条目关联。特定图像也可能由RefPicList[0]中的一个以上的条目或RefPicList[1]中的一个以上的条目关联。RefPicList[0]中的激活条目和RefPicList[1]中的激活条目共同关联可以用于当前图像和按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。RefPicList[0]中的非激活条目和RefPicList[1]中的非激活条目共同关联不用于当前图像的帧间预测,但可以用于按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。因为DPB中不存在相应的图像,所以RefPicList[0]或RefPicList[1]中可能存在等于“无参考图像”的一个或多个条目。RefPicList[0]或RefPicList[1]中等于“无参考图像”的每个非激活条目都应忽略。对于RefPicList[0]或RefPicList[1]中等于“无参考图像”的每个激活条目,应推断出意外图像丢失。
对位流一致性的要求为适用以下约束:对于每个i等于0或1,NumEntriesInList[RplsIdx[i]]不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。图像的切片的RefPicList[0]或RefPicList[1]中的STRP条目和同一切片或同一图像的不同切片的RefPicList[0]或RefPicList[1]中的LTRP条目不应关联同一图像。RefPicList[0]或RefPicList[1]中的任何条目不应关联当前图像本身。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的LTRP条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,并且setOfRefPics对于图像的所有切片应相同。
讨论参考图像标记的解码过程。
在切片头的解码和切片的参考图像列表构造的解码过程之后,但是在切片数据的解码之前,每个图像调用一次该过程。该过程可能使得DPB中的一个或多个参考图像标记为“不用于参考”或“用于长期参考”。DPB中的解码图像可以标记为“不用于参考”、“用于短期参考”、或“用于长期参考”,但是在解码过程的操作期间的任何给定时刻,仅标记为这三者之一。在适用的情况下,为图像分配其中一个标记将隐式移除其中另一标记。在图像标记为“用于参考”时,统称为图像标记为“用于短期参考”或“用于长期参考”(但不能同时标记为两者)。在当前图像是IRAP图像时,当前在DPB中的所有参考图像(如果存在)均标记为“不用于参考”。STRP由其PicOrderCntVal值标识。LTRP由其PicOrderCntVal值的Log2(MaxLtPicOrderCntLsb)LSB标识。
以下适用:对于RefPicList[0]或RefPicList[1]中的每个LTRP条目,在参考图像为STRP时,该图像标记为“用于长期参考”。DPB中未由RefPicList[0]和RefPicList[1]中的任何条目关联的每个参考图像均标记为“不用于参考”。
图5是由视频解码器(例如视频解码器30)实施的对编码视频位流进行解码的方法500的实施例。可以在已直接或间接从视频编码器(例如视频编码器20)接收到解码位流之后执行方法500。可以执行方法500以改进解码过程,例如使解码过程比传统解码过程更高效且更快等。因此,实际上可以提高编解码器的性能,从而带来更好的用户体验。
在框502中,解析编码视频位流中表示的参数集。在实施例中,参数集包括一组语法元素,该组语法元素包括一组参考图像列表结构。
在框504中,解析编码视频位流中表示的当前切片的切片头。在实施例中,切片头包括参数集中的该组参考图像列表结构中的参考图像列表结构的索引。
在框506中,导出当前切片的参考图像列表。在实施例中,基于参数集中的该组语法元素和参考图像列表结构的索引,导出参考图像列表。在实施例中,参考图像列表结构中的条目的顺序与参考图像列表中的对应参考图像的顺序相同。在实施例中,顺序为从零到指示值。在实施例中,该指示值为从零到由sps_max_dec_pic_buffering_minus1指示的值。
在框508中,获得当前切片的至少一个重构块。在实施例中,基于参考图像列表重构当前切片的至少一个重构块。在重构过程之后,视频解码器能够输出视频或图像。在实施例中,该视频或图像可以在电子设备(例如智能电话、平板电脑、膝上型电脑等)的显示器上显示。
在实施例中,参考图像列表被指定为RefPictList[0]或RefPictList[1]。在实施例中,参考图像列表包括用于帧间预测的参考图像的列表。在实施例中,帧间预测针对P切片或针对B切片。在实施例中,来自参数集的该组语法元素设置在网络抽象层(NAL)单元的原始字节序列有效载荷(RBSP)中。
提供了基于第一实施例和第二实施例的替代实施例的概述。
本节提供了本公开的其他替代实施例的简要概述。这些概述相对于第一实施例的描述。然而,以下替代实施例的本公开的基本概念也适用于在本公开的第二实施例之上的实施方式。这种实施方式与如何在第一实施例之上实现各方面的精神相同。
短期参考图像条目的增量POC的语义。
在本公开的一个替代实施例中,指定参考图像列表结构ref_pic_list_struct()中的第i个条目的增量POC的语法元素的语义被定义为当前图像和与第i个条目关联的参考图像之间的POC差。本文使用的一些描述相对于当前标准草案(例如VVC工作草案),其中,仅示出或描述了新增内容。删除的文本用删除线表示,突出显示了任何添加的文本。
delta_poc_st[listIdx][rplsIdx][i]的语义的定义如下:delta_poc_st[listIdx][rplsIdx][i]指定当前图像和第i个条目关联的图像的图像顺序计数值之差。delta_poc_st[listIdx][rplsIdx][i]的值的范围应为-215到215-1(包括端值)。
需要更新参考图像列表构造过程中的等式。参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
长期参考图像条目的信令。
在本公开的一个替代实施例中,不在包含短期参考图像条目的同一参考图像列表结构中信令通知长期参考图像条目。在单独的结构中信令通知长期参考图像条目,并且对于该结构中的每个条目,都存在描述长期参考图像条目的预期位置的语法元素,以便导出最终参考图像列表中的对应条目索引。
序列参数集RBSP语法。
切片头语法。
/>
参考图像列表结构语法。
长期参考图像列表结构语法。
序列参数集RBSP语义。
num_ref_pic_lists_lt_in_sps指定SPS中包括的ref_pic_list_lt_struct(ltRplsIdx)语法结构的数量。num_ref_pic_lists_lt_in_sps的值的范围应为0到64(包括端值)。如果不存在,则推断num_ref_pic_lists_lt_in_sps的值等于0。
切片头语义。
ref_pic_list_lt_idx[i]指定激活SPS中包括的ref_pic_list_lt_struct(ltRplsIdx)语法结构的列表的索引,该索关联于导出当前图像的参考图像列表i。语法元素ref_pic_list_lt_idx[i]由Ceil(Log2(num_ref_pic_lists_lt_in_sps))个位表示。ref_pic_list_lt_idx的值的范围应为0到num_ref_pic_lists_lt_in_sps-1(包括端值)。
参考图像列表结构语义。
ref_pic_list_struct(listIdx,rplsIdx)语法结构可以存在于SPS或切片头中。取决于语法结构是包括在切片头还是SPS中,以下适用:如果存在于切片头中,则ref_pic_list_struct(listIdx,rplsIdx)语法结构指定当前图像(包含该切片的图像)的短期参考图像列表listIdx。否则(存在于SPS中),ref_pic_list_struct(listIdx,rplsIdx)语法结构指定短期参考图像列表listIdx的候选,本节其余部分指定的语义中的术语“当前图像”是指满足以下条件的每个图像:1)具有包含等于SPS中包括的ref_pic_list_struct(listIdx,rplsIdx)语法结构的列表的索引的ref_pic_list_idx[listIdx]的一个或多个切片,2)在具有作为激活SPS的SPS的CVS中。num_strp_entries[listIdx][rplsIdx]指定ref_pic_list_struct(listIdx,rplsIdx)语法结构中的STRP条目的数量。
在第i个条目是ref_pic_list_struct(listIdx,rplsIdx)语法结构中的第一个STRP条目时,delta_poc_st[listIdx][rplsIdx][i]指定当前图像和第i个条目关联的图像的图像顺序计数值之差,或者,在第i个条目是STRP条目而非ref_pic_list_struct(listIdx,rplsIdx)语法结构中的第一个STRP条目时,delta_poc_st[listIdx][rplsIdx][i]指定第i个条目关联的图像和ref_pic_list_struct(listIdx,rplsIdx)语法结构中的先前STRP条目关联的图像的图像顺序计数值之差。delta_poc_st[listIdx][rplsIdx][i]的值的范围应为-215到215-1(包括端值)。
/>
长期参考图像列表结构语义。
ref_pic_list_lt_struct(ltRplsIdx)语法结构可以存在于SPS或切片头中。取决于语法结构是包括在切片头还是SPS中,以下适用:如果存在于切片头中,则ref_pic_list_lt_struct(ltRplsIdx)语法结构指定当前图像(包含该切片的图像)的长期参考图像列表。否则(存在于SPS中),ref_pic_list_struct(listIdx,rplsIdx)语法结构指定长期参考图像列表的候选,本节其余部分指定的语义中的术语“当前图像”是指满足以下条件的每个图像:1)具有包含等于SPS中包括的ref_pic_list_lt_struct(ltRplsIdx)语法结构的列表的索引的ref_pic_list_lt_idx[i]的一个或多个切片,2)在具有作为激活SPS的SPS的CVS中。num_ltrp_entries[ltRplsIdx]指定ref_pic_list_lt_struct(ltRplsIdx)语法结构中的LTRP条目的数量。poc_lsb_lt[rplsIdx][i]指定图像顺序计数以ref_pic_list_lt_struct(rplsIdx)语法结构中的第i个条目关联的图像的MaxLtPicOrderCntLsb为模的值。poc_lsb_lt[rplsIdx][i]语法元素的长度为Log2(MaxLtPicOrderCntLsb)位。lt_pos_idx[rplsIdx][i]指定在参考图像列表构造之后的参考图像列表中的ref_pic_list_lt_struct(rplsIdx)语法结构中的第i个条目的索引。lt_pos_idx[rplsIdx][i]语法元素的长度为Log2(sps_max_dec_pic_buffering_minus1+1)位。在num_ltrp_entries[ltRplsIdx]大于1时,poc_lsb_lt[rplsIdx][i]和lt_pos_idx[rplsIdx][i]应按lt_pos_idx[rplsIdx][i]值的降序排列。
描述了解码过程。
参考图像列表构造的解码过程。
在非IRAP图像的每个切片的解码过程开始时,调用此过程。参考图像通过参考索引寻址。参考索引是参考图像列表的索引。在解码I切片时,参考图像列表不用于切片数据的解码。在解码P切片时,仅参考图像列表0(即,RefPicList[0])用于切片数据的解码。在解码B切片时,参考图像列表0和参考图像列表1(即,RefPicList[1])均用于切片数据的解码。在非IRAP图像的每个切片的解码过程开始时,导出参考图像列表RefPicList[0]和RefPicList[1]。参考图像列表用于参考图像的标记或切片数据的解码。对于不是图像的第一切片的非IRAP图像的I切片,可以为了进行位流一致性检查而导出RefPicList[0]和RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。对于不是图像的第一切片的P切片,可以为了进行位流一致性检查而导出RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
/>
对于每个i等于0或1,以下适用:RefPicList[i]中的第一NumRefIdxActive[i]条目称为RefPicList[i]中的激活条目,而RefPicList[i]中的其他条目称为RefPicList[i]中的非激活条目。如果lt_ref_pic_flag[i][RplsIdx[i]][j]等于0,则j在0到NumEntriesInList[i][RplsIdx[i]]-1(包括端值)范围内的RefPicList[i][j]中的每个条目都称为STRP条目,否则称为LTRP条目。特定图像可能由RefPicList[0]中的条目和RefPicList[1]中的条目关联。特定图像也可能由RefPicList[0]中的一个以上的条目或RefPicList[1]中的一个以上的条目关联。RefPicList[0]中的激活条目和RefPicList[1]中的激活条目共同关联可以用于当前图像和按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。RefPicList[0]中的非激活条目和RefPicList[1]中的非激活条目共同关联不用于当前图像的帧间预测,但可以用于按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。因为DPB中不存在相应的图像,所以RefPicList[0]或RefPicList[1]中可能存在等于“无参考图像”的一个或多个条目。RefPicList[0]或RefPicList[0]中等于“无参考图像”的每个非激活条目都应忽略。对于RefPicList[0]或RefPicList[1]中等于“无参考图像”的每个激活条目,应推断出意外图像丢失。
对位流一致性的要求为适用以下约束:对于每个i等于0或1,RefPicList[i]中的条目的数量不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。图像的切片的RefPicList[0]或RefPicList[1]中的STRP条目和同一切片或同一图像的不同切片的RefPicList[0]或RefPicList[1]中的LTRP条目不应关联同一图像。RefPicList[0]或RefPicList[1]中的任何条目不应关联当前图像本身。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的LTRP条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,并且setOfRefPics对于图像的所有切片应相同。
讨论短期参考图像条目的数量的信令。
在本公开的一个替代实施例中,指定参考图像列表结构ref_pic_list_struct()中与短期参考图像关联的条目数量的语法元素被定义为num_strp_entries_minus1[listIdx][rplsIdx]而非num_strp_entries[listIdx][rplsIdx]。该改变对于参考图像列表的信令具有两个效果:在使用ue(v)对元素进行编码时,可以节省用于信令通知参考图像列表结构中与短期参考图像关联的条目的数量的位。其隐含了对每个参考图像列表应包含至少一个短期参考图像的约束。为了适应这个想法,需要相对于第一实施例作出一些改变。
对于切片头中的参考图像列表信令,根据切片类型,仅信令通知必要的参考图像列表,即,对于I切片或P切片,信令通知一个参考图像列表(即,参考图像列表0),对于B切片,信令通知两个参考图像列表(即,参考图像列表0和参考图像列表1)。切片头语法改变如下:
/>
通过对切片头应用以上改变(即参考图像列表0用于I切片或P切片;参考图像0和参考图像1用于B切片),可以避免该方案出现以下问题:对于一个P切片,只存在一个短期参考图像。然而,不能在参考图像列表0和参考图像列表1中信令通知重复的短期参考图像,其中,因为参考图像列表1中的激活条目的数量必须等于0,所以参考图像列表1中的条目是非激活条目。num_strp_entries_minus1[listIdx][rplsIdx]的语义改变如下:num_strp_entries_minus1[listIdx][rplsIdx]加1指定ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的STRP条目的数量。如下导出变量NumEntriesInList[listIdx][rplsIdx]:NumRefPicEntriesInRpl[listIdx][rplsIdx]=num_strp_entries_minus1[listIdx][rplsIdx]+1+num_ltrp_entries[listIdx][rplsIdx]。NumRefPicEntries[listIdx][rplsIdx]的值的范围应为1到sps_max_dec_pic_buffering_minus1(包括端值)。
允许将当前图像包括在参考图像列表中。
在本公开的一个替代实施例中,允许将当前图像包括在其参考图像列表中。为了支持该特征,相对于第一实施例和第二实施例中的那些描述,不需要语法和语义上的改变。然而,在参考图像列表构造的解码过程中描述的位流一致性约束需要进行如下修改:对位流一致性的要求为适用以下约束:对于每个i等于0或1,NumEntriesInList[i][RplsIdx[i]]不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。图像的切片的RefPicList[0]或RefPicList[1]中的STRP条目和同一切片或同一图像的不同切片的RefPicList[0]或RefPicList[1]中的LTRP条目不应关联同一图像。在当前图像由RefPicList[i]中的条目关联时,对于i等于0或1,条目索引应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的LTRP条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。如果当前图像不包括在setOfRefPics中,则setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,否则,setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1+1。setOfRefPics对于图像的所有切片应相同。
为参考图像列表中的LTRP条目使用不同的POC LSB位。
在本公开的一个替代实施例中,对于参考图像列表0和参考图像列表1,参考图像列表结构中用于标识长期参考图像的位的数量可以不同。为了支持此特征,需要进行以下改变:
additional_lt_poc_lsb[i]如下指定在listIdx等于i的参考图像列表的解码过程中使用的变量MaxLtPicOrderCntLsb[i]的值:MaxLtPicOrderCntLsb[i]=2(log2_max_pic_order_cnt_lsb_minus4+4+additional_lt_poc_lsb[i])。additional_lt_poc_lsb[i]的值的范围应为0到32-log2_max_pic_order_cnt_lsb_minus4-4(包括端值)。如果不存在,则推断another_lt_poc_lsb[i]的值等于0。
poc_lsb_lt[listIdx][rplsIdx][i]指定图像顺序计数以ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的第i个条目关联的图像的MaxLtPicOrderCntLsb[listIdx]为模的值。poc_lsb_lt[listIdx][rplsIdx][i]语法元素的长度为Log2(MaxLtPicOrderCntLsb[listIdx])位。
参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
将同一ref_pic_list_sps_flag用于参考图像列表0和参考图像列表1。
在本公开的一个替代实施例中,不是将两个标志用于指示是否基于激活SPS中的ref_pic_list_struct()语法结构导出参考图像列表0和参考图像列表1,而是将一个标志用于两个参考图像列表。这种替代约束为:两个参考图像列表均基于激活SPS中的ref_pic_list_struct()导出,或者两个参考图像列表均基于直接包括在当前图像的切片头中的ref_pic_list_struct()语法结构导出。为了支持此特征,需要进行以下改变:
/>
ref_pic_list_sps_flag等于1表示基于激活SPS中/>ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构/>导出当前图像的参考图像列表/>ref_pic_list_sps_flag/>等于0表示基于直接包括在当前图像的切片头中的ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构导出当前图像的参考图像列表/>在num_ref_pic_lists_in_sps[0]或num_ref_pic_lists_in_sps[1]等于0时,ref_pic_list_sps_flag/>的值应等于0。pic_lists_in_sps[1]等于0,则ref_pic_list_sps_flag的值应等于0。
参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
长期参考图像条目的增量POC最高有效位(most significant bit,MSB)的信令。
在本公开的一个替代实施例中,不是在ref_pic_list_struct()中使用附加位表示长期参考图像条目的POC LSB,而是信令通知POC MSB周期以区分长期参考图像。在信令通知时,在ref_pic_list_struct()中为关联参考长期参考图像的每个条目信令通知POCMSB周期信息。ref_pic_list_struct()语法结构不是在SPS中信令通知,而是仅在切片头中信令通知。为了支持此特征,需要进行以下改变:
/>
ref_pic_list_struct(listIdx,ltrpFlag)语法结构可以存在于切片头中。在其存在于切片头中时,ref_pic_list_struct(listIdx,ltrpFlag)语法结构指定当前图像(包含该切片的图像)的参考图像列表listIdx。num_strp_entries[listIdx]指定ref_pic_list_struct(listIdx,/>ltrpFlag)语法结构中的STRP条目的数量。num_ltrp_entries[listIdx]/>指定ref_pic_list_struct(listIdx,/>ltrpFlag)语法结构中的LTRP条目的数量。如果不存在,则推断num_ltrp_entries[listIdx][rplsIdx]的值等于0。
如下导出变量NumEntriesInList[listIdx]
NumRefPicEntriesInRpl[listIdx]=num_strp_entries[listIdx]+num_ltrp_entries[listIdx]/>
NumRefPicEntries[listIdx]的值的范围应为0到sps_max_dec_pic_buffering_minus1(包括端值)。lt_ref_pic_flag[listIdx]/>[i]等于1表示ref_pic_list_struct(listIdx,/>ltrpFlag)语法结构中的第i个条目是LTRP条目。lt_ref_pic_flag[listIdx]/>[i]等于0表示ref_pic_list_struct(listIdx,ltrpFlag)语法结构中的第i个条目是STRP条目。如果不存在,则推断lt_ref_pic_flag[listIdx]/>[i]的值等于0。位流一致性的要求为:所有i值在0到NumRefPicEntries[listIdx]/>-1(包括端值)范围内的lt_ref_pic_flag[listIdx]/>[i]的总和应等于num_ltrp_entries[listIdx]/>。在第i个条目是ref_pic_list_struct(listIdx/>,ltrpFlag)语法结构中的第一个STRP条目时,delta_poc_st[listIdx]/>[i]指定当前图像和第i个条目关联的图像的图像顺序计数值之差,或者,在第i个条目是STRP条目而非ref_pic_list_struct(listIdx/> ,ltrpFlag)语法结构中的第一个STRP条目时,delta_poc_st[listIdx][i]指定第i个条目关联的图像和ref_pic_list_struct(listIdx/>,ltrpFlag)语法结构中的先前STRP条目关联的图像的图像顺序计数值之差。delta_poc_st[listIdx]/>[i]的值的范围应为-215到215-1(包括端值)。poc_lsb_lt[listIdx][i]指定图像顺序计数以ref_pic_list_struct(listIdx/>,ltrpFlag)语法结构中的第i个条目关联的图像的MaxLtPicOrderCntLsb为模的值。poc_lsb_lt[listIdx]/>[i]语法元素的长度为Log2(Max/>PicOrderCntLsb)位。delta_poc_msb_present_flag[listIdx][i]等于1表示存在delta_poc_msb_cycle_lt[listIdx][i]。delta_poc_msb_present_flag[listIdx][i]等于0表示不存在delta_poc_msb_cycle_lt[listIdx][i]。在num_ltrp_entries[listIdx]大于0,并且在解码以MaxPicOrderCntLsb为模的PicOrderCntVal等于poc_lsb_lt[listIdx][i]的切片头时DPB中存在多个参考图像时,delta_poc_msb_present_flag[listIdx][i]应等于1。如果不存在,则推断delta_poc_msb_cycle_lt[listIdx][i]的值等于0。delta_poc_msb_cycle_lt[listIdx][i]用于确定ref_pic_list_struct(listIdx,ltrpFlag)语法结构中的第i个条目的图像顺序计数值的最高有效位的值。如果不存在delta_poc_msb_cycle_lt[listIdx][i],则推断其等于0。图像顺序计数的解码过程的改变:/> />
参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
或者,delta_poc_msb_cycle_lt[listIdx][i]的语义可以表示为增量delta,从而可以如下更新参考图像列表构造:参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
/>
对位流一致性的要求为适用以下约束:对于每个i等于0或1,NumEntriesInList[i][RplsIdx[i]]不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。图像的切片的RefPicList[0]或RefPicList[1]中的STRP条目和同一切片或同一图像的不同切片的RefPicList[0]或RefPicList[1]中的LTRP条目不应关联同一图像。RefPicList[0]或RefPicList[1]中的任何条目不应关联当前图像本身。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的LTRP条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,并且setOfRefPics对于图像的所有切片应相同。
每个STRP由其PicOrderCntVal值标识。对于每个LTRP,如果其由delta_poc_msb_present_flag[listIdx][i]等于1的RefPicList[0]或RefPicList[1]中的条目关联,则其由其PicOrderCntVal值标识,否则,其由其PicOrderCntVal值的Log2(MaxPicOrderCntLsb)LSB标识。
长期参考图像条目的增量POC MSB的信令的替代方案1。
该实施例提供了上一节中描述的实施例的替代方案。与上一节中的思想类似,不是在ref_pic_list_struct()中使用附加位表示长期参考图像的POC LSB,而是信令通知POC MSB周期以区分长期参考图像。然而,在该替代方案中,在信令通知时,不是在ref_pic_list_struct()内信令通知POC MSB周期信息,而是在需要POC MSB周期信息时,在切片头中信令通知该信息。可以在SPS和切片头中信令通知ref_pic_list_struct()语法结构。
/>
delta_poc_msb_present_flag[i][j]等于1表示存在delta_poc_msb_cycle_lt[i][j]。delta_poc_msb_present_flag[i][j]等于0表示不存在delta_poc_msb_cycle_lt[i][j]。在NumLtrpEntries[i]大于0,并且对于ref_pic_list_struct(i,rplsIdx,1)语法结构中的第j个LTRP条目,在解码以MaxPicOrderCntLsb为模的PicOrderCntVal等于poc_lsb_lt[i][rplsIdx][jj](其中,jj是作为ref_pic_list_struct(i,rplsIdx,1)语法结构中的第j个LTRP条目的ref_pic_list_struct(i,rplsIdx,1)语法结构中的条目的条目索引)的切片头时,DPB中存在多个参考图像时,delta_poc_msb_present_flag[i][j]应等于1。如果不存在,则推断delta_poc_msb_cycle_lt[i][j]的值等于0。delta_poc_msb_cycle_lt[i][j]用于确定ref_pic_list_struct(i,rplsIdx,1)语法结构中的第j个LTRP条目的图像顺序计数值的最高有效位的值。如果不存在delta_poc_msb_cycle_lt[i][j],则推断其等于0。
/>
delta_poc_msb_present_flag[i][j]等于1表示存在delta_poc_msb_cycle_lt[i][j]。delta_poc_msb_present_flag[i][j]等于0表示不存在delta_poc_msb_cycle_lt[i][j]。在NumLtrpEntries[i]大于0,并且在解码以MaxPicOrderCntLsb为模的PicOrderCntVal等于poc_lsb_lt[i][rplsIdx][j]的切片头时DPB中存在多个参考图像时,delta_poc_msb_present_flag[i][j]应等于1。如果不存在,则推断delta_poc_msb_cycle_lt[i][j]的值等于0。delta_poc_msb_cycle_lt[i][j]用于确定ref_pic_list_struct(i,rplsIdx,1)语法结构中的第j个条目的图像顺序计数值的最高有效位的值。如果不存在delta_poc_msb_cycle_lt[i][j],则推断其等于0。poc_lsb_lt[listIdx][rplsIdx][i]指定图像顺序计数以ref_pic_list_struct(listIdx,rplsIdx,ltrpFlag)语法结构中的第i个条目关联的图像的MaxPicOrderCntLsb为模的值。poc_lsb_lt[listIdx][rplsIdx][i]语法元素的长度为Log2(/>MaxPicOrderCntLsb)位。
图像顺序计数的解码过程的改变:
对于切片头设计1,参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
或者,对于切片头设计1,delta_poc_msb_cycle_lt[listIdx][i]的语义可以表示为增量delta,从而可以如下更新参考图像列表构造:参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
对于切片头设计2,参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
/>
或者,对于切片头设计2,delta_poc_msb_cycle_lt[listIdx][i]的语义可以表示为增量delta,从而可以如下更新参考图像列表构造:参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
/>
对位流一致性的要求为适用以下约束:对于每个i等于0或1,NumEntriesInList[i][RplsIdx[i]]不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。图像的切片的RefPicList[0]或RefPicList[1]中的STRP条目和同一切片或同一图像的不同切片的RefPicList[0]或RefPicList[1]中的LTRP条目不应关联同一图像。RefPicList[0]或RefPicList[1]中的任何条目不应关联当前图像本身。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的LTRP条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,并且setOfRefPics对于图像的所有切片应相同。
每个STRP由其PicOrderCntVal值标识。对于每个LTRP,如果其由delta_poc_msb_present_flag[i][j]等于1的RefPicList[0]或RefPicList[1]中的条目关联,则其由其PicOrderCntVal值标识,否则,其由其PicOrderCntVal值的Log2(MaxPicOrderCntLsb)LSB标识。
长期参考图像条目的增量POC MSB的信令的替代方案2。
在本公开的一个替代实施例中,第一实施例或第二实施例中描述的本公开可以与上述实施例组合,并且分别称为“长期参考图像条目的增量POC MSB的信令”和“长期参考图像条目的增量POC MSB的信令的替代方案1”。组合本公开的以下方面:additional_lt_poc_lsb(即,来自第一实施例或第二实施例)和POC MSB周期信息(即,来自上述实施例并称为“长期参考图像条目的增量POC MSB的信令”或“长期参考图像条目的增量POC MSB的信令的替代方案1”)的信令。以下描述了如下组合第一实施例和上述称为“长期参考图像条目的增量POC MSB的信令的替代方案1”的实施例的一个示例:
delta_poc_msb_present_flag[i][j]等于1表示存在delta_poc_msb_cycle_lt[i][j]。delta_poc_msb_present_flag[i][i]等于0表示不存在delta_poc_msb_cycle_lt[i][j]。在NumLtrpEntries[i]大于0,并且对于ref_pic_list_struct(i,rplsIdx,1)语法结构中的第j个LTRP条目,在解码以MaxPicOrderLtCntLsb为模的PicOrderCntVal等于poc_lsb_lt[i][rplsIdx][jj](其中,jj是作为ref_pic_list_struct(i,rplsIdx,1)语法结构中的第j个LTRP条目的ref_pic_list_struct(i,rplsIdx,1)语法结构中的条目的条目索引)的切片头时,DPB中存在多个参考图像时,delta_poc_msb_present_flag[i][j]应等于1。如果不存在,则推断delta_poc_msb_cycle_lt[i][j]的值等于0。delta_poc_msb_cycle_lt[i][j]用于确定ref_pic_list_struct(i,rplsIdx,1)语法结构中的第j个LTRP条目的图像顺序计数值的最高有效位的值。如果不存在delta_poc_msb_cycle_lt[i][j],则推断其等于0。
图像顺序计数的解码过程的改变:
参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
/>
或者,delta_poc_msb_cycle_lt[listIdx][i]的语义可以表示为增量delta,从而可以如下更新参考图像列表构造:参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
/>
对位流一致性的要求为适用以下约束:对于每个i等于0或1,NumEntriesInList[i][RplsIdx[i]]不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。图像的切片的RefPicList[0]或RefPicList[1]中的STRP条目和同一切片或同一图像的不同切片的RefPicList[0]或RefPicList[1]中的LTRP条目不应关联同一图像。RefPicList[0]或RefPicList[1]中的任何条目不应关联当前图像本身。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的LTRP条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,并且setOfRefPics对于图像的所有切片应相同。
每个STRP由其PicOrderCntVal值标识。对于每个LTRP,如果其由delta_poc_msb_present_flag[i][j]等于1的RefPicList[0]或RefPicList[1]中的条目关联,则其由其PicOrderCntVal值标识,否则,其由其PicOrderCntVal值的Log2(MaxLtPicOrderCntLsb)LSB标识。
通常在切片头中信令通知参考图像列表并区分了短期参考图像和长期参考图像。
本节描述了本公开的另一替代实施例。该描述相对于最新的VVC WD(即,仅描述相对于JVET-K1001-v1中最新VVC WD的新增内容,而未在下文提及的最新VVC WD中的文本照原样适用)。该替代实施例概述如下:仅在切片头中信令通知参考图像列表结构。短期参考图像和长期参考图像均由其POC LSB标识,上述POC LSB可以由与用于表示切片头中信令通知的用于导出POC值的POC LSB的位的数量不同的数量的位表示。此外,用于表示标识短期参考图像和长期参考图像的POC LSB的位的数量可以不同。
NAL单元头语法。
序列参数集RBSP语法。
图像参数集RBSP语法。
切片头语法。
/>
参考图像列表结构语法。
NAL单元头语义。
forbidden_zero_bit应等于0。nal_unit_type指定NAL单元中包含的RBSP数据结构的类型。
表7-4–NAL单元类型码和NAL单元类型类
/>
nuh_temporal_id_plus1减1指定NAL单元的时间标识符。nuh_temporal_id_plus1的值不应等于0。如下指定变量TemporalId:TemporalId=nuh_temporal_id_plus1-1。
当nal_unit_type等于IRAP_NUT时,编码切片属于IRAP图像,TemporalId应等于0。访问单元的所有VCL NAL单元的TemporalId的值应相同。访问单元或编码图像的TemporalId的值是访问单元或编码图像的VCL NAL单元的TemporalId的值。非VCL NAL单元的TemporalId值将受到以下约束:如果nal_unit_type等于SPS_NUT,则TemporalId应等于0,并且包含NAL单元的访问单元的TemporalId应等于0。否则,如果nal_unit_type等于EOS_NUT或EOB_NUT,则TemporalId应等于0。否则,TemporalId应大于或等于包含NAL单元的访问单元的TemporalId。当NAL单元是非VCL NAL单元时,TemporalId的值等于非VCL NAL单元适用的所有访问单元的TemporalId值的最小值。当nal_unit_type等于PPS_NUT时,因为所有图像参数集(PPS)可能包括在位流的起始处,所以TemporalId可以大于或等于包含访问单元的TemporalId,其中第一编码图像的TemporalId等于0。当nal_unit_type等于PREFIX_SEI_NUT或SUFFIX_SEI_NUT时,因为补充增强信息(supplemental enhancementinformation,SEI)NAL单元可能包含适用于位流子集的信息,该位流子集包括TemporalId值大于包含SEI NAL单元的访问单元的TemporalId的访问单元,所以TemporalId可以大于或等于包含访问单元的TemporalId。nuh_reserved_zero_7bits应等于“0000000”。ITU T|ISO/IEC将来可能会指定nuh_reserved_zero_7bits的其他值。解码器应忽略(即,从位流中移除并丢弃)nuh_reserved_zero_7bits值不等于“0000000”的NAL单元。
序列参数集RBSP语义。
log2_max_pic_order_cnt_lsb_minus4如下指定在图像顺序计数的解码过程中使用的变量MaxPicOrderCntLsb的值:
MaxPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4)
log2_max_pic_order_cnt_lsb_minus4的值的范围应为0到12(包括端值)。sps_max_dec_pic_buffering_minus1加1指定以图像存储缓冲区为单位的CVS的解码图像缓冲区的最大所需尺寸。sps_max_dec_pic_buffering_minus1的值的范围应为0到MaxDpbSize-1(包括端值),其中MaxDpbSize在其他地方指定。additional_st_poc_lsb如下指定在参考图像列表的解码过程中使用的变量MaxStPicOrderCntLsb的值:
MaxStPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4+additional_st_poc_lsb)
additional_st_poc_lsb的值的范围应为0到32-log2_max_pic_order_cnt_lsb_minus4-4(包括端值)。long_term_ref_pics_flag等于0表示不存在用于CVS中的任何编码图像的帧间预测的LTRP。long_term_ref_pics_flag等于1表示LTRP可以用于CVS中的一个或多个编码图像的帧间预测。additional_lt_poc_lsb如下指定在参考图像列表的解码过程中使用的变量MaxLtPicOrderCntLsb的值:
MaxLtPicOrderCntLsb=2(log2 _max_pic_order_cnt_lsb_minus4+4+additional_st_poc_lsb+additional_lt_poc_lsb)
additional_lt_poc_lsb的值的范围应为0到32-log2_max_pic_order_cnt_lsb_minus4-4-additional_st_poc_lsb(包括端值)。如果不存在,则推断additional_lt_poc_lsb的值等于0。
图像参数集RBSP语义。
在i等于0时,num_ref_idx_default_active_minus1[i]加1指定num_ref_idx_active_override_flag等于0的P切片或B切片的变量NumRefIdxActive[0]的推断值,在i等于1时,num_ref_idx_default_active_minus1[i]加1指定num_ref_idx_active_override_flag等于0的B切片的NumRefIdxActive[1]的推断值。num_ref_idx_default_active_minus1[i]的值的范围应为0到14(包括端值)。
切片头语义。
当存在时,切片头语法元素slice_pic_parameter_set_id和slice_pic_order_cnt_lsb中的每个的值在编码图像的所有切片头中应相同。slice_type根据表7-5指定切片的译码类型。
表7-5–名称与slice_type的关联
slice_type slice_type的名称
0 B(B切片)
1 P(P切片)
2 I(I切片)
当nal_unit_type等于IRAP_NUT(即,图像是IRAP图像)时,slice_type应等于2。
slice_pic_order_cnt_lsb指定当前图像的以MaxPicOrderCntLsb为模的图像顺序计数。slice_pic_order_cnt_lsb语法元素的长度为log2_max_pic_order_cnt_lsb_minus4+4位。slice_pic_order_cnt_lsb的值的范围应为0到MaxPicOrderCntLsb-1(包括端值)。如果不存在slice_pic_order_cnt_lsb,则推断slice_pic_order_cnt_lsb等于0。num_ref_idx_active_override_flag等于1表示P切片和B切片存在语法元素num_ref_idx_active_minus1[0],并且B切片存在语法元素num_ref_idx_active_minus1[1]。num_ref_idx_active_override_flag等于0表示不存在语法元素num_ref_idx_active_minus1[0]和num_ref_idx_active_minus1[1]。当num_ref_idx_active_minus1[i]存在时,其如下指定变量NumRefIdxActive[i]的值:
NumRefIdxActive[i]=num_ref_idx_active_minus1[i]+1
num_ref_idx_active_minus1[i]的值的范围应为0到14(包括端值)。NumRefIdxActive[i]-1的值指定可以用于解码切片的参考图像列表i的最大参考索引。在NumRefIdxActive[i]的值等于0时,不存在可以用于对切片进行解码的参考图像列表i的参考索引。对于i等于0或1,在当前切片为B切片并且num_ref_idx_active_override_flag等于0时,推断NumRefIdxActive[i]等于num_ref_idx_default_active_minus1[i]+1。在当前切片为P切片并且num_ref_idx_active_override_flag等于0时,推断NumRefIdxActive[0]等于num_ref_idx_default_active_minus1[0]+1。在当前切片为P切片时,推断NumRefIdxActive[1]等于0。在当前切片为I切片时,推断NumRefIdxActive[0]和NumRefIdxActive[1]均等于0。或者,对于i等于0或1,在上述之后以下适用:设rplsIdx1等于ref_pic_list_sps_flag[i]?ref_pic_list_idx[i]:num_ref_pic_lists_in_sps[i],numRpEntries[i]等于num_strp_entries[i][rplsIdx1]+num_ltrp_entries[i][rplsIdx1]。在NumRefIdxActive[i]大于numRpEntries[i]时,NumRefIdxActive[i]的值设置为等于numRpEntries[i]。
参考图像列表结构语义。
ref_pic_list_struct(listIdx,ltrpFlag)语法结构可以存在于切片头中。如果其存在于切片头中,则ref_pic_list_struct(listIdx,ltrpFlag)语法结构指定当前图像(包含该切片的图像)的参考图像列表listIdx。num_strp_entries[listIdx]指定ref_pic_list_struct(listIdx,ltrpFlag)语法结构中的STRP条目的数量。num_ltrp_entries[listIdx]指定ref_pic_list_struct(listIdx,ltrpFlag)语法结构中的LTRP条目的数量。如果不存在,则推断num_ltrp_entries[listIdx]的值等于0。如下导出变量NumEntriesInList[listIdx]:
NumEntriesInList[listIdx]=
num_strp_entries[listIdx]+num_ltrp_entries[listIdx]
NumEntriesInList[listIdx]的值的范围应为0到sps_max_dec_pic_buffering_minus1(包括端值)。lt_ref_pic_flag[listIdx][i]等于1表示ref_pic_list_struct(listIdx,ltrpFlag)语法结构中的第i个条目是LTRP条目。lt_ref_pic_flag[listIdx][i]等于0表示ref_pic_list_struct(listIdx,ltrpFlag)语法结构中的第i个条目是STRP条目。如果不存在,则推断lt_ref_pic_flag[listIdx][i]的值等于0。对位流一致性的要求为:所有i值在0到NumEntriesInList[listIdx]-1(包括端值)范围内的lt_ref_pic_flag[listIdx][i]的总和应等于num_ltrp_entries[listIdx]。在lt_ref_pic_flag[listIdx][i]等于0时,poc_lsb_st[listIdx][i]指定图像顺序计数以ref_pic_list_struct(listIdx,ltrpFlag)语法结构中的第i个条目关联的图像的MaxStPicOrderCntLsb为模的值。poc_lsb_st[listIdx][i]语法元素的长度为Log2(MaxStPicOrderCntLsb)位。在lt_ref_pic_flag[listIdx][i]等于1时,poc_lsb_lt[listIdx][i]指定图像顺序计数以ref_pic_list_struct(listIdx,ltrpFlag)语法结构中的第i个条目关联的图像的MaxLtPicOrderCntLsb为模的值。poc_lsb_lt[listIdx][i]语法元素的长度为Log2(MaxLtPicOrderCntLsb)位。
讨论解码过程。
一般解码过程。
对于当前图像CurrPic,解码过程如下操作:以下指定NAL单元的解码。以下过程指定以下使用以上和切片头层中的语法元素的解码过程:导出与图像顺序计数有关的变量和函数。仅需要为图像的第一切片调用此过程。在非IRAP图像的每个切片的解码过程开始时,调用参考图像列表构造的解码过程,以导出参考图像列表0(RefPicList[0])和参考图像列表1(RefPicList[1])。调用参考图像标记的解码过程,其中,参考图像可以标记为“不用于参考”或“用于长期参考”。仅需要为图像的第一切片调用此过程。调用译码树单元、缩放、变换、环路滤波等的解码过程。在对当前图像的所有切片进行解码之后,将当前解码图像标记为“用于短期参考”。
NAL单元解码过程。
该过程的输入是当前图像的NAL单元及其关联的非VCL NAL单元。该过程的输出是封装在NAL单元内的解析的RBSP语法结构。每个NAL单元的解码过程从NAL单元提取RBSP语法结构,然后解析RBSP语法结构。
切片解码过程。
图像顺序计数的解码过程。
该过程的输出是PicOrderCntVal,即当前图像的图像顺序计数。图像顺序计数用于标识图像,以用于导出合并模式下的运动参数和运动向量预测,并用于解码器一致性检查。每个编码图像与图像顺序计数变量(表示为PicOrderCntVal)关联。在当前图像不是IRAP图像时,变量prevPicOrderCntLsb和prevPicOrderCntMsb如下导出:假设prevTid0Pic是按照解码顺序在前的TemporalId等于0的图像。变量prevPicOrderCntLsb设置为等于prevTid0Pic的slice_pic_order_cnt_lsb。变量prevPicOrderCntMsb设置为等于prevTid0Pic的PicOrderCntMsb。如下导出当前图像的变量PicOrderCntMsb:如果当前图像是IRAP图像,则PicOrderCntMsb设置为等于0。否则,如下导出PicOrderCntMsb:
如下导出PicOrderCntVal:
PicOrderCntVal=PicOrderCntMsb+slice_pic_order_cnt_lsb
因为对于IRAP图像,推断slice_pic_order_cnt_lsb为0,并且prevPicOrderCntLsb和prevPicOrderCntMsb均设置为0,所以所有IRAP图像的PicOrderCntVal都将等于0。PicOrderCntVal的值的范围应为-231到231-1(包括端值)。在一个CVS中,任何两个编码图像的PicOrderCntVal的值均不应相同。在解码过程期间的任何时刻,DPB中的任何两个短期参考图像的PicOrderCntVal&(MaxStPicOrderCntLsb-1)的值均不应相同。在解码过程期间的任何时刻,DPB中的任何两个参考图像的PicOrderCntVal&(MaxLtPicOrderCntLsb-1)的值均不应相同。
如下指定函数PicOrderCnt(picX):
PicOrderCnt(picX)=图像picX的PicOrderCntVal
如下指定函数DiffPicOrderCnt(picA,picB):
DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)-PicOrderCnt(picB)
位流不应包含使得在解码过程中使用的DiffPicOrderCnt(picA,picB)的值不在-215到215-1(包括端值)范围内的数据。假设X是当前图像,Y和Z是同一CVS中的另外两个图像,则当DiffPicOrderCnt(X,Y)和DiffPicOrderCnt(X,Z)均为正或均为负时,Y和Z视为相对于X在同一输出顺序方向上。
参考图像列表构造的解码过程。
在非IRAP图像的每个切片的解码过程开始时,调用此过程。参考图像通过参考索引寻址。参考索引是参考图像列表的索引。在解码I切片时,参考图像列表不用于切片数据的解码。在解码P切片时,仅参考图像列表0(即,RefPicList[0])用于切片数据的解码。在解码B切片时,参考图像列表0和参考图像列表1(即,RefPicList[1])均用于切片数据的解码。在非IRAP图像的每个切片的解码过程开始时,导出参考图像列表RefPicList[0]和RefPicList[1]。参考图像列表用于参考图像的标记或切片数据的解码。对于不是图像的第一切片的非IRAP图像的I切片,可以为了进行位流一致性检查而导出RefPicList[0]和RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。对于不是图像的第一切片的P切片,可以为了进行位流一致性检查而导出RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。
参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
对于每个i等于0或1,以下适用:
RefPicList[i]中的第一NumRefIdxActive[i]条目称为RefPicList[i]中的激活条目,而RefPicList[i]中的其他条目称为RefPicList[i]中的非激活条目。如果lt_ref_pic_flag[i][j]等于0,则j在0到NumEntriesInList[i]-1(包括端值)范围内的RefPicList[i][j]中的每个条目都称为STRP条目,否则称为LTRP条目。特定图像可能由RefPicList[0]中的条目和RefPicList[1]中的条目关联。特定图像也可能由RefPicList[0]中的一个以上的条目或RefPicList[1]中的一个以上的条目关联。RefPicList[0]中的激活条目和RefPicList[1]中的激活条目共同关联可以用于当前图像和按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。RefPicList[0]中的非激活条目和RefPicList[1]中的非激活条目共同关联不用于当前图像的帧间预测,但可以用于按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。因为DPB中不存在相应的图像,所以RefPicList[0]或RefPicList[1]中可能存在等于“无参考图像”的一个或多个条目。RefPicList[0]或RefPicList[0]中等于“无参考图像”的每个非激活条目都应忽略。对于RefPicList[0]或RefPicList[1]中等于“无参考图像”的每个激活条目,应推断出意外图像丢失。
对位流一致性的要求为适用以下约束:对于每个i等于0或1,NumEntriesInList[i]不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。图像的切片的RefPicList[0]或RefPicList[1]中的STRP条目和同一切片或同一图像的不同切片的RefPicList[0]或RefPicList[1]中的LTRP条目不应关联同一图像。RefPicList[0]或RefPicList[1]中的任何条目不应关联当前图像本身。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的LTRP条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,并且setOfRefPics对于图像的所有切片应相同。
参考图像标记的解码过程。
在切片头的解码和切片的参考图像列表构造的解码过程之后,但是在切片数据的解码之前,每个图像调用一次该过程。该过程可能使得DPB中的一个或多个参考图像标记为“不用于参考”或“用于长期参考”。DPB中的解码图像可以标记为“不用于参考”、“用于短期参考”、或“用于长期参考”,但是在解码过程的操作期间的任何给定时刻,仅标记为这三者之一。在适用的情况下,为图像分配其中一个标记将隐式移除其中另一标记。在图像标记为“用于参考”时,统称为图像标记为“用于短期参考”或“用于长期参考”(但不能同时标记为两者)。在当前图像是IRAP图像时,当前在DPB中的所有参考图像(如果存在)均标记为“不用于参考”。STRP由其PicOrderCntVal值的Log2(MaxStPicOrderCntLsb)LSB标识。LTRP由其PicOrderCntVal值的Log2(MaxLtPicOrderCntLsb)LSB标识。
以下适用:对于RefPicList[0]或RefPicList[1]中的每个LTRP条目,在参考图像为STRP时,该图像标记为“用于长期参考”。DPB中未由RefPicList[0]和RefPicList[1]中的任何条目关联的每个参考图像均标记为“不用于参考”。
通常在切片头中信令通知参考图像列表而未区分短期参考图像和长期参考图像。
本节描述了本公开的另一替代实施例。该描述相对于最新的VVC WD(即,仅描述相对于JVET-K1001-v1中最新VVC WD的新增内容,而未在下文提及的最新VVC WD中的文本照原样适用)。该替代实施例概述如下:仅在切片头中信令通知参考图像列表结构。未区分短期参考图像和长期参考图像。所有参考图像仅称为参考图像。参考图像由其POC LSB标识,上述POC LSB可以由与用于表示切片头中信令通知的用于导出POC值的POC LSB的位的数量不同的数量的位表示。
缩写。VVC WD第4节中的上下文适用。
NAL单元头语法。
序列参数集RBSP语法。
图像参数集RBSP语法。
切片头语法。
参考图像列表结构语法。
NAL单元头语义。
forbidden_zero_bit应等于0。nal_unit_type指定NAL单元中包含的RBSP数据结构的类型。
表7-6–NAL单元类型码和NAL单元类型类
nuh_temporal_id_plus1减1指定NAL单元的时间标识符。nuh_temporal_id_plus1的值不应等于0。如下指定变量TemporalId:
TemporalId=nuh_temporal_id_plus1-1
当nal_unit_type等于IRAP_NUT时,编码切片属于IRAP图像,TemporalId应等于0。访问单元的所有VCL NAL单元的TemporalId的值应相同。访问单元或编码图像的TemporalId的值是访问单元或编码图像的VCL NAL单元的TemporalId的值。非VCL NAL单元的TemporalId值将受到以下约束:
如果nal_unit_type等于SPS_NUT,则TemporalId应等于0,并且包含NAL单元的访问单元的TemporalId应等于0。否则,如果nal_unit_type等于EOS_NUT或EOB_NUT,则TemporalId应等于0。否则,TemporalId应大于或等于包含NAL单元的访问单元的TemporalId。当NAL单元是非VCL NAL单元时,TemporalId的值等于非VCL NAL单元适用的所有访问单元的TemporalId值的最小值。当nal_unit_type等于PPS_NUT时,因为所有图像参数集(PPS)可能包括在位流的起始处,所以TemporalId可以大于或等于包含访问单元的TemporalId,其中第一编码图像的TemporalId等于0。当nal_unit_type等于PREFIX_SEI_NUT或SUFFIX_SEI_NUT时,因为SEI NAL单元可能包含适用于位流子集的信息,该位流子集包括TemporalId值大于包含SEI NAL单元的访问单元的TemporalId的访问单元,所以TemporalId可以大于或等于包含访问单元的TemporalId。nuh_reserved_zero_7bits应等于“0000000”。ITU T|ISO/IEC将来可能会指定nuh_reserved_zero_7bits的其他值。解码器应忽略(即,从位流中移除并丢弃)nuh_reserved_zero_7bits值不等于“0000000”的NAL单元。
序列参数集RBSP语义。
log2_max_pic_order_cnt_lsb_minus4如下指定在图像顺序计数的解码过程中使用的变量MaxPicOrderCntLsb的值:
MaxPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4)
log2_max_pic_order_cnt_lsb_minus4的值的范围应为0到12(包括端值)。sps_max_dec_pic_buffering_minus1加1指定以图像存储缓冲区为单位的CVS的解码图像缓冲区的最大所需尺寸。sps_max_dec_pic_buffering_minus1的值的范围应为0到MaxDpbSize-1(包括端值),其中MaxDpbSize在其他地方指定。additional_ref_poc_lsb如下指定在参考图像列表的解码过程中使用的变量MaxRefPicOrderCntLsb的值:
MaxRefPicOrderCntLsb=2(log2_max_pic_order_cnt_lsb_minus4+4+additional_ref_poc_lsb)
additional_ref_poc_lsb的值的范围应为0到32-log2_max_pic_order_cnt_lsb_minus4-4(包括端值)。
图像参数集RBSP语义。
在i等于0时,num_ref_idx_default_active_minus1[i]加1指定num_ref_idx_active_override_flag等于0的P切片或B切片的变量NumRefIdxActive[0]的推断值,在i等于1时,num_ref_idx_default_active_minus1[i]加1指定num_ref_idx_active_override_flag等于0的B切片的NumRefIdxActive[1]的推断值。num_ref_idx_default_active_minus1[i]的值的范围应为0到14(包括端值)。
切片头语义。
当存在时,切片头语法元素slice_pic_parameter_set_id和slice_pic_order_cnt_lsb中的每个的值在编码图像的所有切片头中应相同。...slice_type根据表7-7指定切片的译码类型。
表7-7–名称与slice_type的关联
slice_type slice_type的名称
0 B(B切片)
1 P(P切片)
2 I(I切片)
当nal_unit_type等于IRAP_NUT(即,图像是IRAP图像)时,slice_type应等于2。...slice_pic_order_cnt_lsb指定当前图像的以MaxPicOrderCntLsb为模的图像顺序计数。slice_pic_order_cnt_lsb语法元素的长度为log2_max_pic_order_cnt_lsb_minus4+4位。slice_pic_order_cnt_lsb的值的范围应为0到MaxPicOrderCntLsb-1(包括端值)。如果不存在slice_pic_order_cnt_lsb,则推断slice_pic_order_cnt_lsb等于0。num_ref_idx_active_override_flag等于1表示P切片和B切片存在语法元素num_ref_idx_active_minus1[0],并且B切片存在语法元素num_ref_idx_active_minus1[1]。num_ref_idx_active_override_flag等于0表示不存在语法元素num_ref_idx_active_minus1[0]和num_ref_idx_active_minus1[1]。当num_ref_idx_active_minus1[i]存在时,其如下指定变量NumRefIdxActive[i]的值:
NumRefIdxActive[i]=num_ref_idx_active_minus1[i]+1
num_ref_idx_active_minus1[i]的值的范围应为0到14(包括端值)。NumRefIdxActive[i]-1的值指定可以用于解码切片的参考图像列表i的最大参考索引。在NumRefIdxActive[i]的值等于0时,不存在可以用于对切片进行解码的参考图像列表i的参考索引。对于i等于0或1,在当前切片为B切片并且num_ref_idx_active_override_flag等于0时,推断NumRefIdxActive[i]等于num_ref_idx_default_active_minus1[i]+1。在当前切片为P切片并且num_ref_idx_active_override_flag等于0时,推断NumRefIdxActive[0]等于num_ref_idx_default_active_minus1[0]+1。在当前切片为P切片时,推断NumRefIdxActive[1]等于0。在当前切片为I切片时,推断NumRefIdxActive[0]和NumRefIdxActive[1]均等于0。或者,对于i等于0或1,在上述之后以下适用:设rplsIdx1等于ref_pic_list_sps_flag[i]?ref_pic_list_idx[i]:num_ref_pic_lists_in_sps[i],numRpEntries[i]等于num_strp_entries[i][rplsIdx1]+num_ltrp_entries[i][rplsIdx1]。在NumRefIdxActive[i]大于numRpEntries[i]时,NumRefIdxActive[i]的值设置为等于numRpEntries[i]。
参考图像列表结构语义。
ref_pic_list_struct(listIdx)语法结构可以存在于切片头中。如果其存在于切片头中,则ref_pic_list_struct(listIdx)语法结构指定当前图像(包含该切片的图像)的参考图像列表listIdx。num_ref_entries[listIdx]指定ref_pic_list_struct(listIdx)语法结构中的条目的数量。如下导出变量NumEntriesInList[listIdx]:
NumRefPicEntriesInRpl[listIdx]=num_ref_entries[listIdx]
NumRefPicEntries[listIdx]的值的范围应为0到sps_max_dec_pic_buffering_minus1(包括端值)。poc_ref_lsb[listIdx][i]指定图像顺序计数以ref_pic_list_struct(listIdx)语法结构中的第i个条目关联的图像的MaxRefPicOrderCntLsb为模的值。poc_ref_lsb[listIdx][i]语法元素的长度为Log2(MaxRefPicOrderCntLsb)位。
讨论解码过程。
一般解码过程。
对当前图像CurrPic,解码过程如下操作:以下指定NAL单元的解码。以下过程指定以下使用以上和切片头层中的语法元素的解码过程:导出与图像顺序计数有关的变量和函数。仅需要为图像的第一切片调用此过程。在非IRAP图像的每个切片的解码过程开始时,调用参考图像列表构造的解码过程,以导出参考图像列表0(RefPicList[0])和参考图像列表1(RefPicList[1])。调用参考图像标记的解码过程,其中,参考图像可以标记为“不用于参考”。仅需要为图像的第一切片调用此过程。调用译码树单元、缩放、变换、环路滤波等的解码过程。在对当前图像的所有切片进行解码之后,将当前解码图像标记为“用于参考”。
NAL单元解码过程。
该过程的输入是当前图像的NAL单元及其关联的非VCL NAL单元。该过程的输出是封装在NAL单元内的解析的RBSP语法结构。每个NAL单元的解码过程从NAL单元提取RBSP语法结构,然后解析RBSP语法结构。
切片解码过程。
图像顺序计数的解码过程。
该过程的输出是PicOrderCntVal,即当前图像的图像顺序计数。图像顺序计数用于标识图像,以用于导出合并模式下的运动参数和运动向量预测,并用于解码器一致性检查。每个编码图像与图像顺序计数变量(表示为PicOrderCntVal)关联。在当前图像不是IRAP图像时,变量prevPicOrderCntLsb和prevPicOrderCntMsb如下导出:假设prevTid0Pic是按照解码顺序在前的TemporalId等于0的图像。变量prevPicOrderCntLsb设置为等于prevTid0Pic的slice_pic_order_cnt_lsb。变量prevPicOrderCntMsb设置为等于prevTid0Pic的PicOrderCntMsb。如下导出当前图像的变量PicOrderCntMsb:如果当前图像是IRAP图像,则PicOrderCntMsb设置为等于0。否则,如下导出PicOrderCntMsb:
如下导出PicOrderCntVal:
PicOrderCntVal=PicOrderCntMsb+slice_pic_order_cnt_lsb
因为对于IRAP图像,推断slice_pic_order_cnt_lsb为0,并且prevPicOrderCntLsb和prevPicOrderCntMsb均设置为0,所以所有IRAP图像的PicOrderCntVal都将等于0。PicOrderCntVal的值的范围应为-231到231-1(包括端值)。在一个CVS中,任何两个编码图像的PicOrderCntVal的值均不应相同。在解码过程期间的任何时刻,DPB中任何两个参考图像的PicOrderCntVal&(MaxRefPicOrderCntLsb-1)的值均不应相同。
如下指定PicOrderCnt(picX):
PicOrderCnt(picX)=图像picX的PicOrderCntVal
如下指定函数DiffPicOrderCnt(picA,picB):
DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)-PicOrderCnt(picB)
位流不应包含使得在解码过程中使用的DiffPicOrderCnt(picA,picB)的值不在-215到215-1(包括端值)范围内的数据。假设X是当前图像,Y和Z是同一CVS中的另外两个图像,则当DiffPicOrderCnt(X,Y)和DiffPicOrderCnt(X,Z)均为正或均为负时,Y和Z视为相对于X在同一输出顺序方向上。
参考图像列表构造的解码过程。
在非IRAP图像的每个切片的解码过程开始时,调用此过程。参考图像通过参考索引寻址。参考索引是参考图像列表的索引。在解码I切片时,参考图像列表不用于切片数据的解码。在解码P切片时,仅参考图像列表0(即,RefPicList[0])用于切片数据的解码。在解码B切片时,参考图像列表0和参考图像列表1(即,RefPicList[1])均用于切片数据的解码。在非IRAP图像的每个切片的解码过程开始时,导出参考图像列表RefPicList[0]和RefPicList[1]。参考图像列表用于参考图像的标记或切片数据的解码。对于不是图像的第一切片的非IRAP图像的I切片,可以为了进行位流一致性检查而导出RefPicList[0]和RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。对于不是图像的第一切片的P切片,可以为了进行位流一致性检查而导出RefPicList[1],但是其导出对于当前图像或按照解码顺序在当前图像之后的图像的解码不是必须的。参考图像列表RefPicList[0]和RefPicList[1]的构造如下:
对于每个i等于0或1,RefPicList[i]中的第一NumRefIdxActive[i]条目称为RefPicList[i]中的激活条目,而RefPicList[i]中的其他条目称为RefPicList[i]中的非激活条目。特定图像可能由RefPicList[0]中的条目和RefPicList[1]中的条目关联。特定图像也可能由RefPicList[0]中的一个以上的条目或RefPicList[1]中的一个以上的条目关联。RefPicList[0]中的激活条目和RefPicList[1]中的激活条目共同关联可以用于当前图像和按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。RefPicList[0]中的非激活条目和RefPicList[1]中的非激活条目共同关联不用于当前图像的帧间预测,但可以用于按照解码顺序在当前图像之后的一个或多个图像的帧间预测的所有参考图像。因为DPB中不存在相应的图像,所以RefPicList[0]或RefPicList[1]中可能存在等于“无参考图像”的一个或多个条目。RefPicList[0]或RefPicList[0]中等于“无参考图像”的每个非激活条目都应忽略。对于RefPicList[0]或RefPicList[1]中等于“无参考图像”的每个激活条目,应推断出意外图像丢失。
对位流一致性的要求为适用以下约束:对于每个i等于0或1,NumEntriesInList[i]不应小于NumRefIdxActive[i]。RefPicList[0]或RefPicList[1]中的每个激活条目关联的图像应存在于DPB中,并且其TemporalId应小于或等于当前图像的TemporalId。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的任何非激活条目的条目索引均不应用作用于解码当前图像的参考索引。可选地,可以进一步指定以下约束:RefPicList[0]或RefPicList[1]中的非激活条目不应关联与RefPicList[0]或RefPicList[1]中的任何其他条目相同的图像。RefPicList[0]或RefPicList[1]中的任何条目不应关联当前图像本身。RefPicList[0]或RefPicList[1]中不应存在当前图像的PicOrderCntVal与该条目关联的图像的PicOrderCntVal之差大于或等于224的条目。假设setOfRefPics为RefPicList[0]中的所有条目和RefPicList[1]中的所有条目关联的唯一图像集。setOfRefPics中图像的数量应小于或等于sps_max_dec_pic_buffering_minus1,并且setOfRefPics对于图像的所有切片应相同。
参考图像标记的解码过程。
在切片头的解码和切片的参考图像列表构造的解码过程之后,但是在切片数据的解码之前,每个图像调用一次该过程。该过程可能使得DPB中的一个或多个参考图像标记为“不用于参考”。DPB中的解码图像可以标记为“不用于参考”或“用于参考”,但是在解码过程的操作期间的任何给定时刻,仅标记为这两者之一。在适用的情况下,为图像分配其中一个标记将隐式移除其中另一标记。在当前图像是IRAP图像时,当前在DPB中的所有参考图像(如果存在)均标记为“不用于参考”。DPB中的参考图像由其PicOrderCntVal值的Log2(MaxRefPicOrderCntLsb)LSB标识。DPB中未由RefPicList[0]和RefPicList[1]中的任何条目关联的每个参考图像均标记为“不用于参考”。
另一替代实施例。
本节描述了以上指定的称为“通常在切片头中信令通知参考图像列表并区分了短期参考图像和长期参考图像”的方法的替代实施例。在该替代实施例中,在切片头中,类似于HEVC或上述方法,可以为每个LTRP条目信令通知POC MSB周期,并且移除了以下约束:在解码过程期间的任何时刻,DPB中的任何两个参考图像的PicOrderCntVal&(MaxLtPicOrderCntLsb-1)的值均不应相同。
图6为根据本公开实施例的视频译码设备600(例如视频编码器20或视频解码器30)的示意图。视频译码设备600适于实现本文描述的公开的实施例。视频译码设备600包括用于接收数据的入口端口610和接收器单元(Rx)620;用于处理数据的处理器、逻辑单元、或中央处理单元(central processing unit,CPU)630;用于发送数据的发射器单元(Tx)640和出口端口650;用于存储数据的存储器660。视频编码装置600还可以包括耦合到入口端口610、接收器单元620、发射器单元640、以及出口端口650的用于光信号或电信号进出的光电(optical-to-electrical,OE)组件和电光(electrical-to-optical,EO)组件。
处理器630由硬件和软件实现。处理器630可以实现为一个或多个CPU芯片、核(例如,作为多核处理器)、现场可编程门阵列(field-programmable gate array,FPGA)、专用集成电路(application specific integrated circuit,ASIC)、以及数字信号处理器(digital signal processor,DSP)。处理器630与入口端口610、接收器单元620、发射器单元640、出口端口650、以及存储器660通信。处理器630包括译码模块670。译码模块670实现上述公开的实施例。例如,译码模块670实现、处理、准备、或提供各种联网功能。因此,包括译码模块670对视频译码设备600的功能提供了实质改进,并且实现了视频译码设备600到不同状态的转换。或者,译码模块670实现为存储在存储器660中并且由处理器630执行的指令。
视频译码设备600还可以包括用于与用户进行数据通信的输入和/或输出(inputand/or output,I/O)设备680。I/O设备680可以包括输出设备,例如用于显示视频数据的显示器、用于输出音频数据的扬声器等。I/O设备680还可以包括输入设备,例如键盘、鼠标、轨迹球等、和/或用于与这种输出设备交互的相应接口。
存储器660包括一个或多个磁盘、磁带驱动器、以及固态驱动器,并且可以用作溢出数据存储设备,用于在选择要执行的程序时存储这些程序,并且用于存储在程序执行期间读取的指令和数据。存储器660可以是易失性的和/或非易失性的,并且可以是只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、三态内容可寻址存储器(ternary content-addressable memory,TCAM)、和/或静态随机存取存储器(static random-access memory,SRAM)。
图7为译码装置700的实施例的示意图。在实施例中,译码装置700实现在视频译码设备702(例如视频编码器20或视频解码器30)中。视频译码设备702包括接收装置701。接收装置701用于接收待编码的图像或接收待解码的位流。视频译码设备702包括耦合到接收装置701的发射装置707。发射装置707用于将位流发送到解码器或将解码图像发送到显示装置(例如I/O装置680之一)。
视频译码设备702包括存储装置703。存储装置703耦合到接收装置701或发射装置707中的至少一个。存储装置703用于存储指令。视频译码设备702还包括处理装置705。处理装置705耦合到存储装置703。处理装置705用于执行存储在存储装置703中的指令以执行本文公开的方法。
虽然本公开中已提供多个实施例,但是应理解,在不脱离本公开的精神或范围的情况下,可以以许多其他特定形式实现所公开的系统和方法。本示例视为说明性而非限制性的,并且本发明不限于本文给出的细节。例如,各种元件或组件可以组合或集成在另一系统中,或者某些特征可以省略或不实现。
此外,在各种实施例中描述并示出为离散或分离的技术、系统、子系统、以及方法在不脱离本公开的范围的情况下可以与其他系统、模块、技术、或方法组合或集成。示出或讨论为相互耦合或直接耦合或通信的其他项目可以通过某接口、设备、或中间组件,以电气、机械、或其他方式间接耦合或通信。改变、替换、以及变更的其他示例可以由本领域技术人员确定,并且可以在不脱离本文公开的精神和范围的情况下做出。

Claims (29)

1.一种由视频解码器实施的对编码视频位流进行解码的方法,所述方法包括:
解析所述编码视频位流中表示的参数集,其中,所述参数集包括序列参数集SPS,所述SPS包括一组参考图像列表结构ref_pic_list_struct(listIdx,rplsIdx),其中rplsIdx指定参考图像列表结构的索引,listIdx用于指定参考图像列表,其中listIdx的值等于0或1;
解析所述编码视频位流中表示的当前切片的切片头,其中,所述切片头包括所述参数集中的所述一组参考图像列表结构中的参考图像列表结构的索引;
基于所述参数集中的所述一组参考图像列表结构和所述参考图像列表结构的所述索引,导出所述当前切片的参考图像列表;以及
基于所述参考图像列表,获得所述当前切片的至少一个重构块。
2.根据权利要求1所述的方法,其中,所述参数集包括一组语法元素,所述一组语法元素包括一组所述参考图像列表结构,所述参考图像列表结构中的条目的顺序与所述参考图像列表中的对应参考图像的顺序相同,所述参考图像列表结构中的每个条目用于确定所述参考图像列表中的对应参考图像。
3.根据权利要求2所述的方法,其中,所述顺序为从零到指示值。
4.根据权利要求3所述的方法,其中,所述指示值为从零到由sps_max_dec_pic_buffering_minus1指示的值。
5.根据权利要求1至4中任一项所述的方法,其中,所述参考图像列表被指定为RefPictList[0]。
6.根据权利要求1至4中任一项所述的方法,其中,所述参考图像列表被指定为RefPictList[1]。
7.根据权利要求1至4中任一项所述的方法,其中,所述至少一个重构块用于生成在电子设备的显示器上显示的图像。
8.根据权利要求1至4中任一项所述的方法,其中,所述参考图像列表包括用于帧间预测的参考图像的列表。
9.根据权利要求8所述的方法,其中,所述帧间预测针对P切片或针对B切片。
10.根据权利要求1所述的方法,其中,所述参数集包括序列参数集(SPS)。
11.根据权利要求2所述的方法,其中,来自所述参数集的所述一组语法元素设置在网络抽象层(NAL)单元的原始字节序列有效载荷(RBSP)中。
12.根据权利要求7所述的方法,其中,所述参考图像列表被指定为RefPictList[0]或RefPictList[1],并且所述参考图像列表结构中的条目的顺序与所述参考图像列表中的对应参考图像的顺序相同。
13.根据权利要求1所述的方法,还包括:
解析所述编码视频位流中表示的参数集,其中,所述参数集包括一组语法元素,所述一组语法元素包括一组参考图像列表结构;
获得所述编码视频位流中表示的参考图像列表结构;
基于所述参考图像列表结构,导出当前切片的第一参考图像列表,其中,所述第一参考图像列表包括至少一个激活条目和至少一个非激活条目,其中,所述至少一个非激活条目关联虽不用于所述当前切片的帧间预测、但由第二参考图像列表中的激活条目关联的参考图像,并且其中,所述第二参考图像列表是按照解码顺序在所述当前切片之后的切片的参考图像列表,或按照解码顺序在当前图像之后的图像的参考图像列表;以及
基于所述第一参考图像列表的至少一个激活条目,获得所述当前切片的至少一个重构块。
14.一种解码设备,包括:
接收器,用于接收编码视频位流;
耦合到所述接收器的存储器,所述存储器存储指令;以及
耦合到所述存储器的处理器,所述处理器用于执行存储在所述存储器中的所述指令以使所述处理器:
解析所述编码视频位流中表示的参数集,其中,所述参数集包括序列参数集SPS,所述SPS包括一组语法元素,所述一组语法元素包括一组参考图像列表结构ref_pic_list_struct(listIdx,rplsIdx),其中rplsIdx为参考图像列表结构的索引,listIdx用于指定参考图像列表,其中listIdx的值等于0或1;
解析所述编码视频位流中表示的当前切片的切片头,其中,所述切片头包括所述参数集中的所述一组参考图像列表结构中的参考图像列表结构的索引;
基于所述参数集中的所述一组参考图像列表结构和所述参考图像列表结构的所述索引,导出所述当前切片的参考图像列表;以及
基于所述参考图像列表,获得所述当前切片的至少一个重构块。
15.根据权利要求14所述的解码设备,其中,所述参考图像列表结构中的条目的顺序与所述参考图像列表中的对应参考图像的顺序相同,所述参考图像列表结构中的每个条目用于确定所述参考图像列表中的对应参考图像。
16.根据权利要求15所述的解码设备,其中,所述顺序为从零到指示值。
17.根据权利要求16所述的解码设备,其中,所述指示值为从零到由sps_max_dec_pic_buffering_minus1指示的值。
18.根据权利要求14至17中任一项所述的解码设备,其中,所述参考图像列表被指定为RefPictList[0]。
19.根据权利要求14至17中任一项所述的解码设备,其中,所述参考图像列表被指定为RefPictList[1]。
20.根据权利要求14至17中任一项所述的解码设备,其中,所述至少一个重构块用于生成在电子设备的显示器上显示的图像。
21.根据权利要求14至17中任一项所述的解码设备,其中,所述参考图像列表包括用于帧间预测的参考图像的列表。
22.根据权利要求21所述的解码设备,其中,所述帧间预测针对P切片或针对B切片。
23.根据权利要求14至17中任一项所述的解码设备,其中,所述参数集包括序列参数集(SPS)。
24.根据权利要求14至17中任一项所述的解码设备,其中,来自所述参数集的所述一组语法元素设置在网络抽象层(NAL)单元的原始字节序列有效载荷(RBSP)中。
25.根据权利要求20所述的解码设备,其中,所述参考图像列表被指定为RefPictList[0]或RefPictList[1],并且所述参考图像列表结构中的条目的顺序与所述参考图像列表中的对应参考图像的顺序相同。
26.根据权利要求14至17中任一项所述的解码设备,其中,所述处理器还用于:
解析所述编码视频位流中表示的参数集,其中,所述参数集包括一组语法元素,所述一组语法元素包括一组参考图像列表结构;
获得所述编码视频位流中表示的参考图像列表结构;
基于所述参考图像列表结构,导出当前切片的第一参考图像列表,其中,所述第一参考图像列表包括至少一个激活条目和至少一个非激活条目,其中,所述至少一个非激活条目关联虽不用于所述当前切片的帧间预测、但由第二参考图像列表中的激活条目关联的参考图像,并且其中,所述第二参考图像列表是按照解码顺序在所述当前切片之后的切片的参考图像列表,或按照解码顺序在当前图像之后的图像的参考图像列表;以及
基于所述第一参考图像列表的至少一个激活条目,获得所述当前切片的至少一个重构块。
27.根据权利要求14所述的解码设备,还包括显示器,所述显示器用于基于所述至少一个重构块显示图像。
28.一种译码装置,包括:
接收器,用于接收位流以进行解码;
耦合到所述接收器的发射器,所述发射器用于将解码图像发送到显示器;
耦合到所述接收器或所述发射器中的至少一个的存储器,所述存储器用于存储指令;以及
耦合到所述存储器的处理器,所述处理器用于执行存储在所述存储器中的所述指令,以执行根据权利要求1至13中任一项所述的方法。
29.一种译码系统,包括:
编码器;以及
与所述编码器通信的解码器,其中,所述解码器包括根据权利要求14至27中任一项所述的解码设备或根据权利要求28所述的译码装置。
CN202111390353.3A 2018-08-17 2019-08-16 对编码视频位流进行解码的方法,解码设备以及译码系统 Active CN114697663B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111390353.3A CN114697663B (zh) 2018-08-17 2019-08-16 对编码视频位流进行解码的方法,解码设备以及译码系统

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862719360P 2018-08-17 2018-08-17
US62/719,360 2018-08-17
CN202111390353.3A CN114697663B (zh) 2018-08-17 2019-08-16 对编码视频位流进行解码的方法,解码设备以及译码系统
CN201980053796.8A CN112567744A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
PCT/US2019/046928 WO2020037273A1 (en) 2018-08-17 2019-08-16 Reference picture management in video coding

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980053796.8A Division CN112567744A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理

Publications (2)

Publication Number Publication Date
CN114697663A CN114697663A (zh) 2022-07-01
CN114697663B true CN114697663B (zh) 2024-01-30

Family

ID=69525847

Family Applications (12)

Application Number Title Priority Date Filing Date
CN202111289546.XA Active CN114554196B (zh) 2018-08-17 2019-08-16 对经译码的码流解码方法,设备以及系统
CN201980054208.2A Pending CN113141784A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN202111390353.3A Active CN114697663B (zh) 2018-08-17 2019-08-16 对编码视频位流进行解码的方法,解码设备以及译码系统
CN201980053797.2A Pending CN112567746A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN202111390366.0A Active CN114501018B (zh) 2018-08-17 2019-08-16 参考图像管理的解码方法、设备和系统
CN202111341983.1A Active CN114584775B (zh) 2018-08-17 2019-08-16 经译码的视频码流的解码方法,解码设备,译码系统
CN201980054191.0A Pending CN113412620A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN202111341982.7A Active CN114584774B (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN201980054199.7A Pending CN112585974A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN201980053796.8A Pending CN112567744A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN202111340765.6A Active CN114205590B (zh) 2018-08-17 2019-08-16 对经译码的视频码流进行解码的方法,装置以及存储介质
CN201980054198.2A Pending CN112585973A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN202111289546.XA Active CN114554196B (zh) 2018-08-17 2019-08-16 对经译码的码流解码方法,设备以及系统
CN201980054208.2A Pending CN113141784A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理

Family Applications After (9)

Application Number Title Priority Date Filing Date
CN201980053797.2A Pending CN112567746A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN202111390366.0A Active CN114501018B (zh) 2018-08-17 2019-08-16 参考图像管理的解码方法、设备和系统
CN202111341983.1A Active CN114584775B (zh) 2018-08-17 2019-08-16 经译码的视频码流的解码方法,解码设备,译码系统
CN201980054191.0A Pending CN113412620A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN202111341982.7A Active CN114584774B (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN201980054199.7A Pending CN112585974A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN201980053796.8A Pending CN112567744A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理
CN202111340765.6A Active CN114205590B (zh) 2018-08-17 2019-08-16 对经译码的视频码流进行解码的方法,装置以及存储介质
CN201980054198.2A Pending CN112585973A (zh) 2018-08-17 2019-08-16 视频译码中的参考图像管理

Country Status (18)

Country Link
US (8) US20210168360A1 (zh)
EP (7) EP4336832A3 (zh)
JP (13) JP7223118B2 (zh)
KR (12) KR20240058947A (zh)
CN (12) CN114554196B (zh)
AU (1) AU2019322914B2 (zh)
BR (6) BR112021002832A2 (zh)
CA (1) CA3109799C (zh)
CL (1) CL2021000397A1 (zh)
DK (1) DK3831064T3 (zh)
FI (1) FI3831064T3 (zh)
IL (1) IL280944A (zh)
MX (4) MX2021001745A (zh)
NZ (1) NZ773625A (zh)
PH (1) PH12021550312A1 (zh)
SG (6) SG11202101404WA (zh)
WO (6) WO2020037272A1 (zh)
ZA (1) ZA202100951B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117294837A (zh) 2018-04-02 2023-12-26 深圳市大疆创新科技有限公司 用于图像处理的方法和图像处理装置
EP4336832A3 (en) * 2018-08-17 2024-05-22 Huawei Technologies Co., Ltd. Reference picture management in video coding
WO2020059687A1 (en) * 2018-09-21 2020-03-26 Sharp Kabushiki Kaisha Systems and methods for signaling reference pictures in video coding
CN113597768A (zh) * 2019-01-28 2021-11-02 Op方案有限责任公司 扩展长期参考图片保留的在线和离线选择
US11395006B2 (en) * 2019-03-06 2022-07-19 Tencent America LLC Network abstraction layer unit header
KR20220156827A (ko) 2020-03-19 2022-11-28 바이트댄스 아이엔씨 레퍼런스 픽처 리스트 엔트리에 대한 제약들
EP3942802A4 (en) * 2020-05-20 2022-10-05 Tencent America Llc TECHNIQUES FOR RANDOM ACCESS POINT INDICATION AND IMAGE OUTPUT IN AN ENCODED VIDEO STREAM
US11558630B2 (en) 2020-05-20 2023-01-17 Tencent America LLC Techniques for random access point indication and picture output in coded video stream
US11533472B2 (en) 2020-05-21 2022-12-20 Alibaba Group Holding Limited Method for reference picture processing in video coding
US11695938B2 (en) * 2021-01-05 2023-07-04 Dish Network Technologies India Private Limited Method and apparatus for thumbnail generation for a video device
CN116781907A (zh) * 2022-03-11 2023-09-19 华为技术有限公司 编解码方法及电子设备
WO2023234133A1 (en) * 2022-05-31 2023-12-07 Sharp Kabushiki Kaisha Systems and methods for signaling reference picture list entry information in video coding

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013070028A1 (ko) * 2011-11-11 2013-05-16 엘지전자 주식회사 영상 정보 전송 방법 및 장치와 이를 이용한 복호화 방법 및 장치
CA2873419A1 (en) * 2012-06-07 2013-12-12 Adarsh Krishnan RAMASUBRAMONIAN Signaling data for long term reference pictures for video coding
WO2014103529A1 (ja) * 2012-12-28 2014-07-03 シャープ株式会社 画像復号装置、およびデータ構造
CN105453562A (zh) * 2013-07-30 2016-03-30 株式会社Kt 支持多个层的图像编码和解码方法以及使用该方法的装置
WO2016048834A1 (en) * 2014-09-26 2016-03-31 Vid Scale, Inc. Intra block copy coding with temporal block vector prediction
WO2016059290A1 (en) * 2014-10-14 2016-04-21 Nokia Technologies Oy An apparatus, a method and a computer program for image sequence coding and decoding
WO2016173519A1 (en) * 2015-04-29 2016-11-03 Hfi Innovation Inc. Method and apparatus for intra block copy reference list construction
CN106664424A (zh) * 2014-01-03 2017-05-10 诺基亚技术有限公司 参数集编码
CN108347606A (zh) * 2012-07-01 2018-07-31 夏普株式会社 电子设备及方法

Family Cites Families (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005022923A2 (en) * 2003-08-26 2005-03-10 Thomson Licensing S.A. Method and apparatus for minimizing number of reference pictures used for inter-coding
FI115589B (fi) * 2003-10-14 2005-05-31 Nokia Corp Redundanttien kuvien koodaaminen ja dekoodaaminen
CN102761744B (zh) * 2006-10-13 2015-10-28 汤姆逊许可公司 用于多视点视频编码的参考图像列表管理语法
WO2010086500A1 (en) 2009-01-28 2010-08-05 Nokia Corporation Method and apparatus for video coding and decoding
JP5574345B2 (ja) 2009-03-26 2014-08-20 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化方法、エラー検出方法、復号方法、符号化装置、エラー検出装置及び復号装置
US20120050475A1 (en) * 2009-05-01 2012-03-01 Dong Tian Reference picture lists for 3dv
KR101752418B1 (ko) 2010-04-09 2017-06-29 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
US9008176B2 (en) * 2011-01-22 2015-04-14 Qualcomm Incorporated Combined reference picture list construction for video coding
US8934552B2 (en) 2011-03-31 2015-01-13 Qualcomm Incorporated Combined reference picture list construction and mapping
KR101911012B1 (ko) 2011-04-26 2018-12-19 엘지전자 주식회사 참조 픽쳐 리스트 관리 방법 및 이러한 방법을 사용하는 장치
PT3091744T (pt) * 2011-06-30 2017-08-31 ERICSSON TELEFON AB L M (publ) Sinalização de imagem de referência
US9521418B2 (en) 2011-07-22 2016-12-13 Qualcomm Incorporated Slice header three-dimensional video extension for slice header prediction
US9420307B2 (en) * 2011-09-23 2016-08-16 Qualcomm Incorporated Coding reference pictures for a reference picture set
EP3754982B1 (en) * 2011-09-29 2024-05-01 SHARP Kabushiki Kaisha Image decoding device, image decoding method, image encoding method and image encoding device for performing bi-prediction to uni-prediction conversion
US9451284B2 (en) * 2011-10-10 2016-09-20 Qualcomm Incorporated Efficient signaling of reference picture sets
US9264717B2 (en) * 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
JP5768662B2 (ja) * 2011-10-31 2015-08-26 富士通株式会社 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム
US10003817B2 (en) * 2011-11-07 2018-06-19 Microsoft Technology Licensing, Llc Signaling of state information for a decoded picture buffer and reference picture lists
EP3576412B1 (en) * 2011-11-08 2021-09-01 Nokia Technologies Oy Reference picture handling
US20130114710A1 (en) * 2011-11-08 2013-05-09 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by prediction using reference picture list, and method and apparatus for decoding video by performing compensation using reference picture list
US9392235B2 (en) 2011-11-18 2016-07-12 Google Technology Holdings LLC Explicit way for signaling a collocated reference picture for video coding
KR101606661B1 (ko) * 2011-11-18 2016-03-25 모토로라 모빌리티 엘엘씨 고효율 비디오 코딩(hevc)을 위한 병치된 화상을 시그널링하기 위한 명시적 방법
US9485503B2 (en) * 2011-11-18 2016-11-01 Qualcomm Incorporated Inside view motion prediction among texture and depth view components
US9258559B2 (en) * 2011-12-20 2016-02-09 Qualcomm Incorporated Reference picture list construction for multi-view and three-dimensional video coding
CN104054351B (zh) 2012-01-17 2017-07-14 瑞典爱立信有限公司 参考画面列表处理
US8867852B2 (en) * 2012-01-19 2014-10-21 Sharp Kabushiki Kaisha Decoding a picture based on a reference picture set on an electronic device
US20130188709A1 (en) 2012-01-25 2013-07-25 Sachin G. Deshpande Video decoder for tiles with absolute signaling
KR101652928B1 (ko) * 2012-01-31 2016-09-01 브이아이디 스케일, 인크. 스케일러블 고효율 비디오 코딩(hevc)을 위한 참조 픽처 세트(rps) 시그널링
US9369710B2 (en) * 2012-02-06 2016-06-14 Qualcomm Incorporated Reference picture list modification for video coding
US20150071351A1 (en) * 2012-04-15 2015-03-12 Samsung Electronics Co., Ltd. Inter prediction method in which reference picture lists can be changed and apparatus for the same
US9426459B2 (en) * 2012-04-23 2016-08-23 Google Inc. Managing multi-reference picture buffers and identifiers to facilitate video data coding
US20150124877A1 (en) 2012-04-25 2015-05-07 Samsung Electronics Co., Ltd. Multiview video encoding method using reference picture set for multiview video prediction and device therefor, and multiview video decoding method using reference picture set for multiview video prediction and device therefor
US9762903B2 (en) 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
US9591303B2 (en) 2012-06-28 2017-03-07 Qualcomm Incorporated Random access and signaling of long-term reference pictures in video coding
WO2014008402A1 (en) 2012-07-05 2014-01-09 Vid Scale, Inc. Layer dependency and priority signaling design for scalable video coding
US9167248B2 (en) * 2012-07-13 2015-10-20 Qualcomm Incorporated Reference picture list modification for video coding
US9398284B2 (en) * 2012-08-16 2016-07-19 Qualcomm Incorporated Constructing reference picture lists for multi-view or 3DV video coding
US9584825B2 (en) * 2012-09-27 2017-02-28 Qualcomm Incorporated Long-term reference picture signaling in video coding
KR101981712B1 (ko) * 2012-11-21 2019-05-24 엘지전자 주식회사 영상 디코딩 방법 및 이를 이용하는 장치
US9992513B2 (en) 2012-12-21 2018-06-05 Sony Corporation Image processing efficient transmission or reception of encoded information
CN104919803B (zh) * 2013-01-15 2017-09-12 华为技术有限公司 一种用于解码视频比特流的方法
CN105122816A (zh) * 2013-04-05 2015-12-02 夏普株式会社 层间参考图像集的解码和参考图像列表构建
US9532067B2 (en) * 2013-04-05 2016-12-27 Sharp Kabushiki Kaisha Decoding of inter-layer reference picture set and reference picture list construction
US9860529B2 (en) 2013-07-16 2018-01-02 Qualcomm Incorporated Processing illumination compensation for video coding
WO2015006922A1 (en) * 2013-07-16 2015-01-22 Mediatek Singapore Pte. Ltd. Methods for residual prediction
US9560358B2 (en) * 2013-07-22 2017-01-31 Qualcomm Incorporated Device and method for scalable coding of video information
US9762909B2 (en) * 2013-07-30 2017-09-12 Kt Corporation Image encoding and decoding method supporting plurality of layers and apparatus using same
WO2015052939A1 (en) 2013-10-10 2015-04-16 Sharp Kabushiki Kaisha Alignment of picture order count
US9942546B2 (en) * 2013-12-12 2018-04-10 Qualcomm Incorporated POC value design for multi-layer video coding
US10110925B2 (en) 2014-01-03 2018-10-23 Hfi Innovation Inc. Method of reference picture selection and signaling in 3D and multi-view video coding
US10432928B2 (en) * 2014-03-21 2019-10-01 Qualcomm Incorporated Using a current picture as a reference for video coding
US9756355B2 (en) * 2014-06-20 2017-09-05 Qualcomm Incorporated Value ranges for syntax elements in video coding
US10412387B2 (en) 2014-08-22 2019-09-10 Qualcomm Incorporated Unified intra-block copy and inter-prediction
US9918105B2 (en) 2014-10-07 2018-03-13 Qualcomm Incorporated Intra BC and inter unification
CA2985872C (en) 2015-05-29 2020-04-14 Hfi Innovation Inc. Method of decoded picture buffer management for intra block copy mode
US10638140B2 (en) 2015-05-29 2020-04-28 Qualcomm Incorporated Slice level intra block copy and other video coding improvements
US10516891B2 (en) * 2015-11-20 2019-12-24 Intel Corporation Method and system of reference frame caching for video coding
US10555002B2 (en) 2016-01-21 2020-02-04 Intel Corporation Long term reference picture coding
US10652571B2 (en) 2018-01-25 2020-05-12 Qualcomm Incorporated Advanced motion vector prediction speedups for video coding
EP4336832A3 (en) 2018-08-17 2024-05-22 Huawei Technologies Co., Ltd. Reference picture management in video coding
KR20230145226A (ko) 2018-09-12 2023-10-17 후아웨이 테크놀러지 컴퍼니 리미티드 참조 화상 리스트 구조를 위한 인덱스 시그널링
US11375184B2 (en) 2018-12-10 2022-06-28 Sharp Kabushiki Kaisha Systems and methods for signaling reference pictures in video coding
EP3928511A4 (en) * 2019-03-11 2022-06-22 Huawei Technologies Co., Ltd. STEP-BY-STEP DECODE REFRESH IN VIDEO ENCODING
US10986353B2 (en) * 2019-03-15 2021-04-20 Tencent America LLC Decoded picture buffer management for video coding
JP7273193B2 (ja) 2019-05-12 2023-05-12 北京字節跳動網絡技術有限公司 参照ピクチャ再サンプリングのための信号通知
US11418813B2 (en) 2019-09-20 2022-08-16 Tencent America LLC Signaling of inter layer prediction in video bitstream
CN114600462A (zh) 2019-10-25 2022-06-07 夏普株式会社 用于在视频编码中发送信号通知图片信息的系统和方法
WO2021117644A1 (en) * 2019-12-11 2021-06-17 Sharp Kabushiki Kaisha Systems and methods for signaling output layer set information in video coding
EP4088463A4 (en) * 2020-02-14 2023-05-10 Beijing Bytedance Network Technology Co., Ltd. USING GENERAL STRESS INDICATORS IN VIDEO BITSTREAMS
US11496771B2 (en) * 2020-02-24 2022-11-08 Qualcomm Incorporated Reference picture list and collocated picture signaling in video coding
AR121127A1 (es) * 2020-02-29 2022-04-20 Beijing Bytedance Network Tech Co Ltd Señalización de información de imagen de referencia en un flujo de bits de video
US11743503B2 (en) 2020-05-14 2023-08-29 Qualcomm Incorporated Reference picture list constraints and signaling in video coding
EP4140140A4 (en) * 2020-05-21 2023-07-05 ByteDance Inc. PROGRESSIVE DECODING REFRESH SIGNALING AND REFERENCE PICTURE LISTS
US11533472B2 (en) * 2020-05-21 2022-12-20 Alibaba Group Holding Limited Method for reference picture processing in video coding
WO2021242716A1 (en) * 2020-05-26 2021-12-02 Bytedance Inc. Identification of inter-layer reference pictures in coded video
CN115769586A (zh) * 2020-05-28 2023-03-07 抖音视界有限公司 视频编解码中的参考图片列表信令通知
US11882270B2 (en) * 2020-06-09 2024-01-23 Hfi Innovation Inc. Method and apparatus for video coding with constraints on reference picture lists of a RADL picture
JP2023068781A (ja) 2021-11-04 2023-05-18 株式会社日立製作所 異常検出装置、異常検出システム、及び異常検出方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013070028A1 (ko) * 2011-11-11 2013-05-16 엘지전자 주식회사 영상 정보 전송 방법 및 장치와 이를 이용한 복호화 방법 및 장치
CA2873419A1 (en) * 2012-06-07 2013-12-12 Adarsh Krishnan RAMASUBRAMONIAN Signaling data for long term reference pictures for video coding
CN108347606A (zh) * 2012-07-01 2018-07-31 夏普株式会社 电子设备及方法
WO2014103529A1 (ja) * 2012-12-28 2014-07-03 シャープ株式会社 画像復号装置、およびデータ構造
CN105453562A (zh) * 2013-07-30 2016-03-30 株式会社Kt 支持多个层的图像编码和解码方法以及使用该方法的装置
CN106664424A (zh) * 2014-01-03 2017-05-10 诺基亚技术有限公司 参数集编码
WO2016048834A1 (en) * 2014-09-26 2016-03-31 Vid Scale, Inc. Intra block copy coding with temporal block vector prediction
WO2016059290A1 (en) * 2014-10-14 2016-04-21 Nokia Technologies Oy An apparatus, a method and a computer program for image sequence coding and decoding
WO2016173519A1 (en) * 2015-04-29 2016-11-03 Hfi Innovation Inc. Method and apparatus for intra block copy reference list construction

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AHG21: On reference picture list construction and reference picture marking,JCTVC-G643r1;Miska M. Hannuksela等;《Joint Collaborative Team on Video Coding (JCT-VC)》;20111124;第1-17页 *
AHG21: On reference picture list construction and reference picture marking;Miska M. Hannuksela等;Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC,1/SC29/WG11,7th Meeting: Geneva, CH, 21-30 November, 2011,JCTVC-G643r1;第1-17页 *
JCTVC-F803_d5_RPS_r2_with_JCTVC-G641r2_reduced;Benjamin Bross等;《Joint Collaborative Team on Video Coding (JCT-VC)》;20111124;第20-52,89-95页 *
Miska M. Hannuksela等.AHG21: On reference picture list construction and reference picture marking.Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC,1/SC29/WG11,7th Meeting: Geneva, CH, 21-30 November, 2011,JCTVC-G643r1.2011,第1-17页. *

Also Published As

Publication number Publication date
FI3831064T3 (fi) 2024-05-08
JP7223118B2 (ja) 2023-02-15
US20220201284A1 (en) 2022-06-23
JP2023088995A (ja) 2023-06-27
CN114554196B (zh) 2023-04-28
KR102610094B1 (ko) 2023-12-04
KR20230169440A (ko) 2023-12-15
JP2023095887A (ja) 2023-07-06
EP3831054A1 (en) 2021-06-09
CL2021000397A1 (es) 2021-12-10
SG11202101404WA (en) 2021-03-30
KR20210036399A (ko) 2021-04-02
EP3831055A4 (en) 2021-10-13
CN114584775A (zh) 2022-06-03
US11956420B2 (en) 2024-04-09
BR112021002491A2 (pt) 2021-08-10
CN112585974A (zh) 2021-03-30
EP3831064A4 (en) 2021-10-06
US11991349B2 (en) 2024-05-21
EP3831057A1 (en) 2021-06-09
IL280944A (en) 2021-04-29
CA3109799A1 (en) 2020-02-20
CN112567746A (zh) 2021-03-26
JP2023065392A (ja) 2023-05-12
KR102610093B1 (ko) 2023-12-04
US20210168359A1 (en) 2021-06-03
CN114697663A (zh) 2022-07-01
JP2021534668A (ja) 2021-12-09
CN114501018B (zh) 2024-01-09
CN114554196A (zh) 2022-05-27
EP4336832A3 (en) 2024-05-22
PH12021550312A1 (en) 2021-10-11
US11979553B2 (en) 2024-05-07
CN114205590A (zh) 2022-03-18
KR20210036400A (ko) 2021-04-02
WO2020037277A1 (en) 2020-02-20
CN114205590B (zh) 2023-06-06
EP3831057A4 (en) 2021-09-22
EP3831064B1 (en) 2024-02-07
AU2019322914A1 (en) 2021-03-18
EP3831070A4 (en) 2022-02-16
NZ773625A (en) 2022-12-23
JP2023085317A (ja) 2023-06-20
BR112021002501A2 (pt) 2021-07-27
KR20210036398A (ko) 2021-04-02
EP4336832A2 (en) 2024-03-13
ZA202100951B (en) 2023-07-26
US20210168360A1 (en) 2021-06-03
KR20230169439A (ko) 2023-12-15
EP3831070A1 (en) 2021-06-09
US20210258567A1 (en) 2021-08-19
DK3831064T3 (da) 2024-05-13
EP3831064A1 (en) 2021-06-09
KR20230169435A (ko) 2023-12-15
KR20210036401A (ko) 2021-04-02
JP2021534676A (ja) 2021-12-09
US11758123B2 (en) 2023-09-12
MX2021001743A (es) 2021-06-23
JP7278366B2 (ja) 2023-05-19
CN114501018A (zh) 2022-05-13
KR102610089B1 (ko) 2023-12-04
EP3831055A1 (en) 2021-06-09
JP2024032732A (ja) 2024-03-12
KR102610092B1 (ko) 2023-12-04
MX2021001744A (es) 2021-07-16
KR20210036402A (ko) 2021-04-02
KR102659936B1 (ko) 2024-04-22
CN113412620A (zh) 2021-09-17
MX2021001745A (es) 2021-07-16
KR20210041062A (ko) 2021-04-14
KR102609949B1 (ko) 2023-12-04
JP2021534670A (ja) 2021-12-09
CN114584774A (zh) 2022-06-03
US11997257B2 (en) 2024-05-28
US20210185308A1 (en) 2021-06-17
JP2023086737A (ja) 2023-06-22
MX2021001838A (es) 2021-05-13
WO2020037276A1 (en) 2020-02-20
US11477438B2 (en) 2022-10-18
US20210176489A1 (en) 2021-06-10
KR20230165889A (ko) 2023-12-05
SG11202101399VA (en) 2021-03-30
SG11202100648RA (en) 2021-02-25
EP3831056A1 (en) 2021-06-09
CN114584775B (zh) 2023-04-11
CN112585973A (zh) 2021-03-30
CN112567744A (zh) 2021-03-26
US20230128843A1 (en) 2023-04-27
SG11202100647TA (en) 2021-02-25
BR112021002483A2 (pt) 2021-07-27
JP2021534677A (ja) 2021-12-09
EP3831056A4 (en) 2021-10-13
JP2021534671A (ja) 2021-12-09
AU2019322914B2 (en) 2023-06-29
WO2020037278A1 (en) 2020-02-20
SG11202101407QA (en) 2021-03-30
BR112021002486A2 (pt) 2021-07-27
WO2020037274A1 (en) 2020-02-20
WO2020037273A1 (en) 2020-02-20
CN114584774B (zh) 2023-05-09
CN113141784A (zh) 2021-07-20
BR112021002832A2 (pt) 2021-05-04
KR20240058947A (ko) 2024-05-03
CA3109799C (en) 2024-04-23
SG11202101406PA (en) 2021-03-30
US20210258568A1 (en) 2021-08-19
BR112021002499A2 (pt) 2021-07-27
WO2020037272A1 (en) 2020-02-20
KR20230170122A (ko) 2023-12-18
JP2023095886A (ja) 2023-07-06
JP2021534673A (ja) 2021-12-09
EP3831054A4 (en) 2021-10-13

Similar Documents

Publication Publication Date Title
CN114697663B (zh) 对编码视频位流进行解码的方法,解码设备以及译码系统
CN112840651B (zh) 指示图像顺序编号增量的符号值和绝对值
JP2023086737A5 (zh)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant