CN111263147A - 帧间预测方法和相关装置 - Google Patents

帧间预测方法和相关装置 Download PDF

Info

Publication number
CN111263147A
CN111263147A CN201811467538.8A CN201811467538A CN111263147A CN 111263147 A CN111263147 A CN 111263147A CN 201811467538 A CN201811467538 A CN 201811467538A CN 111263147 A CN111263147 A CN 111263147A
Authority
CN
China
Prior art keywords
prediction
information group
information
image block
lic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811467538.8A
Other languages
English (en)
Other versions
CN111263147B (zh
Inventor
杨海涛
牟凡
张恋
马祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201811467538.8A priority Critical patent/CN111263147B/zh
Priority to CN201980076612.XA priority patent/CN113170141B/zh
Priority to PCT/CN2019/122458 priority patent/WO2020114356A1/zh
Priority to EP19892023.3A priority patent/EP3883244A4/en
Priority to JP2021531579A priority patent/JP7331105B2/ja
Publication of CN111263147A publication Critical patent/CN111263147A/zh
Priority to US17/337,556 priority patent/US11601667B2/en
Application granted granted Critical
Publication of CN111263147B publication Critical patent/CN111263147B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请提供一种帧间预测方法和相关装置,该方法包括:解析码流以确定待处理图像块的预测信息,其中,当该预测信息指示该待处理图像块的预测方向为双向预测时,该码流中不包含目标标识信息,其中,该目标标识信息用于指示对该待处理图像块进行局部亮度补偿LIC;根据该预测信息,获得该待处理图像块的预测值。上述技术方案可以在对视频质量没有较大影响的情况下,加快视频解码速度。

Description

帧间预测方法和相关装置
技术领域
本申请涉及图像处理技术领域,更具体地,涉及帧间预测方法和相关装置。
背景技术
随着信息技术的发展,高清晰度电视,网络会议等视频业务迅速发展。视频信号以其 直观性和高效性等优势成为人们日常生活中获取信息最主要的方式。由于视频信号包含的 数据量大,需要占用大量的传输带宽和存储空间。为了有效的传输和存储视频信号,需要 对视频信号进行压缩编码,视频压缩技术越来越成为视频应用领域不可或缺的关键技术。 目前,广泛使用的视频编码标准是H.264(也可以称为动态图像专家组(MovingPicture Experts Group,MPEG)-4第10部分(Part 10),高级视频编码(Advanced VideoCoding, AVC),或者,H.264/AVC)以及H.265(也可以称为MPEG-H第二部分,或者,高效率 视频编码(High Efficiency Video Coding,HEVC),或者H.265/HEVC)。
视频编码过程主要包括帧内预测(Intra Prediction)、帧间预测(InterPrediction)、 变换(Transform)、量化(Quantization)、熵编码(Entropy encode)、环内滤波(in-loop filtering)等环节。视频解码则相当于视频编码的逆过程。例如,首先利用熵解码反量化反 变换得到残差信息,根据解码码流确定当前块使用的是帧内预测还是帧间预测。如果是帧 内编码,则利用当前图像内周围已重建区域内像素点的像素值按照所使用的帧内预测方法 构建预测信息。如果是帧间编码,则需要解析出运动信息,并使用所解析出的运动信息在 已重建的图像中确定参考块,并将参考块内像素点的像素值作为预测信息(此过程称为运 动补偿(motion compensation,MC))。使用预测信息加上残差信息经过滤波操作便可以 得到重建信息。
局部亮度补偿(local illumination compensation,LIC)技术是一种用于补偿当前块和 参考块之间的亮度差异的帧间预测方法。LIC技术使用当前块的相邻已重建像素和参考块 的相邻已重建像素的线性模型导出当前块的预测值。虽然LIC技术可以有效地补偿当前块 与参考块之间的亮度差异,但是使用LIC模式编解码的复杂度较高,会大量消耗运算资源, 并降低编解码速度。
发明内容
本申请提供一种帧间预测方法和相关装置,上述技术方案可以在对视频质量没有较大 影响的情况下,加快视频解码速度。
第一方面,本申请实施例提供一种帧间预测的方法,该方法包括:解析码流以确定待 处理图像块的预测信息,其中,当该预测信息指示该待处理图像块的预测方向为双向预测 时,该码流中不包含目标标识信息,其中,该目标标识信息用于指示对该待处理图像块进 行局部亮度补偿LIC;根据该预测信息,获得该待处理图像块的预测值。基于上述技术方案,在对该待处理图像块进行解码的过程中,若该待处理图像块的预测方向为双向预测,则可以直接确定无需对该待处理图像块进行LIC。这样,可以降低解码端运算资源的消耗,提高解码速度。并且不对预测方向为双向预测的待处理图像块进行LIC也不会对视频质量有较大影响。所以,上述技术方案可以在对视频质量没有较大影响的情况下,加快视频解码速度。
结合第一方面,在第一方面的一种可能的实现方式中,当该待处理图像块的预测信息 指示该待处理图像块的预测模式为融合模式时,在该根据该预测信息,获得该待处理图像 块的预测值之前,该方法还包括:确定至少一个第一信息组,其中,每个该第一信息组包 括运动矢量、预测方向和LIC标识;当该第一信息组的数量少于目标预设值时,根据该至少一个第一信息组,确定至少一个第二信息组,其中,每个该第二信息组包括运动矢量、 预测方向和LIC标识;该根据该预测信息,获得该待处理图像块的预测值,包括:根据该 预测信息、该至少一个第一信息组和该至少一个第二信息组,获得该待处理图像块的预测 值。
结合第一方面,在第一方面的一种可能的实现方式中,该至少一个第一信息组包括第 一选择信息组和第二选择信息组,该至少一个第二信息组包括第一合成信息组,该根据该 至少一个第一信息组,确定至少一个第二信息组,包括:将该第一选择信息组的运动矢量 和该第二选择信息组的运动矢量的平均值作为该第一合成信息组的运动矢量。
结合第一方面,在第一方面的一种可能的实现方式中,该预测方向包括双向预测和单 向预测,该单向预测包括第一向预测和第二向预测,该至少一个第一信息组包括第一选择 信息组和第二选择信息组,该至少一个第二信息组包括第一合成信息组,该根据该至少一 个第一信息组,确定至少一个第二信息组,包括:根据该第一选择信息组的预测方向和该 第二选择信息组的预测方向,确定该第一合成信息组的预测方向。
结合第一方面,在第一方面的一种可能的实现方式中,当该待处理图像块进行LIC时, 该待处理图像块的LIC标识为第一数值,当该待处理图像块不进行LIC时,该待处理图像 块的LIC标识取第二数值,该根据该至少一个第一信息组,确定至少一个第二信息组,包括:当该第一合成信息组的预测方向为双向预测时,确定该第一合成信息组的LIC标识为该第二数值;当该第一合成信息组的预测方向为单向预测,且,该第一选择信息组和该第二选择信息组的LIC标识均为该第二数值时,确定该第一合成信息组的LIC标识为该第二数值;当该第一合成信息组的预测方向为单向预测,且,该第一选择信息组和/或该第二 选择信息组的LIC标识为该第一数值时,确定该第一合成信息组的LIC标识为该第一数值。 基于上述技术方案,该至少一个第二信息组中,预测方向为双向预测的第二信息组的LIC 标识为第二标识。在此情况下,若预测方向为双向预测的第二信息组被用于确定该待处理 图像块的预测值,则在确定过程中无需对该待处理图像块进行LIC。这样,可以降低解码 端运算资源的消耗,提高解码速度。并且不进行LIC也不会对视频质量有较大影响。所以, 上述技术方案可以在对视频质量没有较大影响的情况下,加快视频解码速度。
结合第一方面,在第一方面的一种可能的实现方式中,当该待处理图像块的预测信息 指示该待处理图像块的预测模式为融合模式时,在该根据该预测信息,获得该待处理图像 块的预测值之前,该方法还包括:确定至少一个第三信息组,其中,每个该第三信息组包 括运动矢量和LIC标识;当该第三信息组的数量少于目标预设值时,根据该至少一个第三 信息组,确定至少一个第四信息组,其中,每个该第四信息组包括运动矢量和LIC标识;该根据该预测信息,获得该待处理图像块的预测值,包括:根据该预测信息、该至少一个 第三信息组和该至少一个第四信息组,获得该待处理图像块的预测值。
结合第一方面,在第一方面的一种可能的实现方式中,该预测方向包括双向预测和单 向预测,该单向预测包括第一向预测和第二向预测,该至少一个第三信息组包括第三选择 信息组和第四选择信息组,该至少一个第四信息组包括第二合成信息组,该根据该至少一 个第三信息组,确定至少一个第四信息组,包括:将该第三选择信息组对应第一向预测的 运动矢量作为该第二合成信息组对应第一向预测的运动矢量,且,将该第四选择信息组对 应第二向预测的运动矢量作为该第二合成信息组对应第二向预测的运动矢量;或者,将该 第三选择信息组对应第二向预测的运动矢量作为该第二合成信息组对应第一向预测的运 动矢量,且,将该第四选择信息组对应第一向预测的运动矢量作为该第二合成信息组对应 第二向预测的运动矢量。
结合第一方面,在第一方面的一种可能的实现方式中,当该待处理图像块进行LIC时, 该待处理图像块的LIC标识取第一数值,当该待处理图像块不进行LIC时,该待处理图像 块的LIC标识取第二数值,该根据该至少一个第三信息组,确定至少一个第四信息组,包括:确定该至少一个第四信息组中的每个第四信息组的LIC标识为该第二数值。基于上述技术方案,该至少一个第四信息组中的每个第四信息组的LIC标识为第二标识。在此情况下,若该至少一个第四信息组中一个第四信息组被用于确定该待处理图像块的预测值,则在确定过程中无需对该待处理图像块进行LIC。这样,可以降低解码端运算资源的消耗, 提高解码速度。并且不进行LIC也不会对视频质量有较大影响。所以,上述技术方案可以 在对视频质量没有较大影响的情况下,加快视频解码速度。
结合第一方面,在第一方面的一种可能的实现方式中,该至少一个第一信息组包括第 五选择信息组,该确定至少一个第一信息组,包括:确定与该待处理图像块所在图像帧时 域相邻的已重构图像帧中的目标图像块;根据该目标图像块,确定该第五选择信息组的预 测方向;当该第五选择信息组的预测方向为双向预测时,确定该第五选择信息组的LIC标 识为该第二数值。基于上述技术方案,该第五选择信息组的LIC标识为第二标识。在此情 况下,若该第五选择信息组被用于确定该待处理图像块的预测值,则在确定过程中无需对 该待处理图像块进行LIC。这样,可以降低解码端运算资源的消耗,提高解码速度。并且 不进行LIC也不会对视频质量有较大影响。所以,上述技术方案可以在对视频质量没有较 大影响的情况下,加快视频解码速度。
结合第一方面,在第一方面的一种可能的实现方式中,该至少一个第一信息组的数量 和该至少一个第二信息组的数量之和少于该目标预设值时,在该根据该预测信息,获得该 待处理图像块的预测值之前,该方法还包括:确定至少一个第五信息组,其中,该第五信 息组的LIC标识为该第二数值,该至少一个第一信息组的数量、该至少一个第二信息组的 数量和该至少一个第五信息组的数量之和等于该目标预设值;该根据该预测信息,获得该 待处理图像块的预测值,包括:根据该预测信息、该至少一个第一信息组、该至少一个第二信息组和该至少一个第五信息组,获得该待处理图像块的预测值。基于上述技术方案,该至少一个第五信息组中的每个第五信息组的LIC标识为第二标识。在此情况下,若该至少一个第五信息组中的一个第五信息组被用于确定该待处理图像块的预测值,则在确定过程中无需对该待处理图像块进行LIC。这样,可以降低解码端运算资源的消耗,提高解码 速度。并且不进行LIC也不会对视频质量有较大影响。所以,上述技术方案可以在对视频 质量没有较大影响的情况下,加快视频解码速度。
结合第一方面,在第一方面的一种可能的实现方式中,当该至少一个第三信息组的数 量和该至少一个第四信息组的数量之和少于该目标预设值时,在该根据该预测信息,获得 该待处理图像块的预测值之前,该方法还包括:确定至少一个第六信息组,其中,该第六 信息组的LIC标识为该第二数值,该至少一个第三信息组的数量、该至少一个第四信息组 的数量和该至少一个第六信息组的数量之和等于该目标预设值;该根据该预测信息,获得 该待处理图像块的预测值,包括:根据该预测信息、该至少一个第三信息组、该至少一个第四信息组和该至少一个第六信息组,获得该待处理图像块的预测值。基于上述技术方案,该至少一个第六信息组中的每个第六信息组的LIC标识为第二标识。在此情况下,若该至少一个第六信息组中的一个第六信息组被用于确定该待处理图像块的预测值,则在确定过程中无需对该待处理图像块进行LIC。这样,可以降低解码端运算资源的消耗,提高解码 速度。并且不进行LIC也不会对视频质量有较大影响。所以,上述技术方案可以在对视频 质量没有较大影响的情况下,加快视频解码速度。
第二方面,本申请实施例提供一种帧间预测的方法,该方法包括:确定待处理图像块 的预测信息;根据该待处理图像块的预测信息,确定码流,当该预测信息指示该待处理图 像块的预测方向为双向预测时,该码流中不包含目标标识信息,其中该目标标识信息用于 指示对该待处理图像块进行LIC。当该预测信息指示该待处理图像块的预测方向为单向预 测且不为融合模式时,该码流中包含该目标标识信息。基于上述技术方案,当该预测信息 指示该待处理图像块的预测方向为双向预测时,对该待处理图像块在编码过程中也不需要 进行LIC,这样可以降低编码端运算资源的消耗,提高编码速度。并且不对该待处理图像 块进行LIC也不会对视频质量有较大影响。所以,上述技术方案可以在对视频质量没有较 大影响的情况下,加快视频编码速度。
结合第二方面,在第二方面的一种可能的实现方式中,当该待处理图像块的预测信息 指示该待处理图像块的预测模式为融合模式时,在该根据该待处理图像块的预测信息,确 定码流之前,该方法还包括:确定至少一个第一信息组,其中,每个该第一信息组包括运 动矢量、预测方向和LIC标识;当该第一信息组的数量少于目标预设值时,根据该至少一 个第一信息组,确定至少一个第二信息组,其中,每个该第二信息组包括运动矢量、预测方向和LIC标识;该根据该待处理图像块的预测信息,确定码流,包括:根据该预测信息、 该至少一个第一信息组和该至少一个第二信息组,确定码流。
结合第二方面,在第二方面的一种可能的实现方式中,该至少一个第一信息组包括第 一选择信息组和第二选择信息组,该至少一个第二信息组包括第一合成信息组,该根据该 至少一个第一信息组,确定至少一个第二信息组,包括:将该第一选择信息组的运动矢量 和该第二选择信息组的运动矢量的平均值作为该第一合成信息组的运动矢量。
结合第二方面,在第二方面的一种可能的实现方式中,该预测方向包括双向预测和单 向预测,该单向预测包括第一向预测和第二向预测,该至少一个第一信息组包括第一选择 信息组和第二选择信息组,该至少一个第二信息组包括第一合成信息组,该根据该至少一 个第一信息组,确定至少一个第二信息组,包括:根据该第一选择信息组的预测方向和该 第二选择信息组的预测方向,确定该第一合成信息组的预测方向。
结合第二方面,在第二方面的一种可能的实现方式中,当该待处理图像块进行LIC时, 该待处理图像块的LIC标识为第一数值,当该待处理图像块不进行LIC时,该待处理图像 块的LIC标识取第二数值,该根据该至少一个第一信息组,确定至少一个第二信息组,包括:当该第一合成信息组的预测方向为双向预测时,确定该第一合成信息组的LIC标识为该第二数值;当该第一合成信息组的预测方向为单向预测,且,该第一选择信息组和该第二选择信息组的LIC标识均为该第二数值时,确定该第一合成信息组的LIC标识为该第二数值;当该第一合成信息组的预测方向为单向预测,且,该第一选择信息组和/或该第二 选择信息组的LIC标识为该第一数值时,确定该第一合成信息组的LIC标识为该第一数值。 基于上述技术方案,该至少一个第二信息组中,预测方向为双向预测的第二信息组的LIC 标识为第二标识。在此情况下,若预测方向为双向预测的第二信息组被用于作为最优的运 动信息,则在确定过程中无需进行LIC。这样,可以降低编码端运算资源的消耗,提高编 码速度。并且不进行LIC也不会对视频质量有较大影响。所以,上述技术方案可以在对视 频质量没有较大影响的情况下,加快视频编码速度。
结合第二方面,在第二方面的一种可能的实现方式中,当该待处理图像块的预测信息 指示该待处理图像块的预测模式为融合模式时,在该根据该预测信息,确定码流之前,该 方法还包括:确定至少一个第三信息组,其中,每个该第三信息组包括运动矢量和LIC标 识;当该第三信息组的数量少于目标预设值时,根据该至少一个第三信息组,确定至少一 个第四信息组,其中,每个该第四信息组包括运动矢量和LIC标识;该根据该预测信息, 确定码流,包括:根据该预测信息、该至少一个第三信息组和该至少一个第四信息组,确 定码流。
结合第二方面,在第二方面的一种可能的实现方式中,该预测方向包括双向预测和单 向预测,该单向预测包括第一向预测和第二向预测,该至少一个第三信息组包括第三选择 信息组和第四选择信息组,该至少一个第四信息组包括第二合成信息组,该根据该至少一 个第三信息组,确定至少一个第四信息组,包括:将该第三选择信息组对应第一向预测的 运动矢量作为该第二合成信息组对应第一向预测的运动矢量,且,将该第四选择信息组对 应第二向预测的运动矢量作为该第二合成信息组对应第二向预测的运动矢量;或者,将该 第三选择信息组对应第二向预测的运动矢量作为该第二合成信息组对应第一向预测的运 动矢量,且,将该第四选择信息组对应第一向预测的运动矢量作为该第二合成信息组对应 第二向预测的运动矢量。
结合第二方面,在第二方面的一种可能的实现方式中,当该待处理图像块进行LIC时, 该待处理图像块的LIC标识取第一数值,当该待处理图像块不进行LIC时,该待处理图像 块的LIC标识取第二数值,该根据该至少一个第三信息组,确定至少一个第四信息组,包括:确定该至少一个第四信息组中的每个第四信息组的LIC标识为该第二数值。基于上述技术方案,该至少一个第四信息组中的每个第四信息组的LIC标识为第二标识。在此情况下,若该至少一个第四信息组中一个第四信息组被用于作为最优的运动信息,则在确定过程中无需进行LIC。这样,可以降低编码端运算资源的消耗,提高编码速度。并且不进行 LIC也不会对视频质量有较大影响。所以,上述技术方案可以在对视频质量没有较大影响 的情况下,加快视频编码速度。
结合第二方面,在第二方面的一种可能的实现方式中,该至少一个第一信息组包括第 五选择信息组,该确定至少一个第一信息组,包括:确定与该待处理图像块所在图像帧时 域相邻的已重构图像帧中的目标图像块;根据该目标图像块,确定该第五选择信息组的预 测方向;当该第五选择信息组的预测方向为双向预测时,确定该第五选择信息组的LIC标 识为该第二数值。基于上述技术方案,该第五选择信息组的LIC标识为第二标识。在此情 况下,若该第五选择信息组被用于作为最优的运动信息,则在确定过程中无需进行LIC。 这样,可以降低编码端运算资源的消耗,提高编码速度。并且不进行LIC也不会对视频质 量有较大影响。所以,上述技术方案可以在对视频质量没有较大影响的情况下,加快视频 编码速度。
结合第二方面,在第二方面的一种可能的实现方式中,该至少一个第一信息组的数量 和该至少一个第二信息组的数量之和少于该目标预设值时,在该根据该预测信息,确定码 流之前,该方法还包括:确定至少一个第五信息组,其中,该第五信息组的LIC标识为该 第二数值,该至少一个第一信息组的数量、该至少一个第二信息组的数量和该至少一个第 五信息组的数量之和等于该目标预设值;该根据该预测信息,确定码流,包括:根据该预测信息、该至少一个第一信息组、该至少一个第二信息组和该至少一个第五信息组,确定码流。基于上述技术方案,该至少一个第五信息组中的每个第五信息组的LIC标识为第二标识。在此情况下,若该至少一个第五信息组中的一个第五信息组被用于作为最优的运动信息,则在确定过程中无需进行LIC。这样,可以降低编码端运算资源的消耗,提高编码 速度。并且不进行LIC也不会对视频质量有较大影响。所以,上述技术方案可以在对视频 质量没有较大影响的情况下,加快视频编码速度。
结合第二方面,在第二方面的一种可能的实现方式中,当该至少一个第三信息组的数 量和该至少一个第四信息组的数量之和少于该目标预设值时,在该根据该预测信息,获得 该待处理图像块的预测值之前,该方法还包括:确定至少一个第六信息组,其中,该第六 信息组的LIC标识为该第二数值,该至少一个第三信息组的数量、该至少一个第四信息组 的数量和该至少一个第六信息组的数量之和等于该目标预设值;该根据该预测信息,获得 该待处理图像块的预测值,包括:根据该预测信息、该至少一个第三信息组、该至少一个第四信息组和该至少一个第六信息组,获得该待处理图像块的预测值。基于上述技术方案,该至少一个第六信息组中的每个第六信息组的LIC标识为第二标识。在此情况下,若该至少一个第六信息组中的一个第六信息组被用于作为最优的运动信息,则在确定过程中无需进行LIC。这样,可以降低编码端运算资源的消耗,提高编码速度。并且不进行LIC也不 会对视频质量有较大影响。所以,上述技术方案可以在对视频质量没有较大影响的情况下, 加快视频编码速度。
第三方面,本申请实施例提供一种解码装置,该装置包括用于执行第一方面或第一方 面的任一种可能的实现方式的模块。
可以选的,第三方面的解码装置可以为计算机设备,或者可以为可用于计算机设备的 部件(例如芯片或者电路等)。
第四方面,本申请实施例提供一种编码装置,该装置包括用于执行第二方面或第二方 面的任一种可能的实现方式的模块。
可以选的,第四方面的编码装置可以为计算机设备,或者可以为可用于计算机设备的 部件(例如芯片或者电路等)。
第五方面,本申请实施例提供一种存储介质,该存储介质存储用于实现第一方面或第 一方面的任一种可能的实现方式所述的方法的指令。
第六方面,本申请实施例提供一种存储介质,该存储介质存储用于实现第二方面或第 二方面的任一种可能的实现方式所述的方法的指令。
第七方面,本申请提供了一种包含指令的计算机程序产品,当该计算机程序产品在计 算机上运行时,使得计算机执行上述第一方面或第一方面的任一种可能的实现方式所述的 方法。
第八方面,本申请提供了一种包含指令的计算机程序产品,当该计算机程序产品在计 算机上运行时,使得计算机执行上述第二方面或第二方面的任一种可能的实现方式所述的 方法。
附图说明
图1是一个能够应用本申请实施例提供的帧间预测的方法的系统架构示意图。
图2是根据本申请实施例提供的帧间预测的方法示意性流程图。
图3是根据本申请实施例提供的构建融合候选列表的示意图。
图4示出了待处理图像块和相邻图像块的位置关系。
图5是根据本申请实施例提供的另一构建融合候选列表的示意图。
图6是根据本申请实施例提供的帧间预测的方法示意性流程图。
图7是根据本申请实施例提供的一种解码装置的示意性结构框图。
图8是根据本发明实施例提供的计算机设备的结构框图。
图9是根据本申请实施例提供的一种编码装置的示意性结构框图。
图10是根据本发明实施例提供的计算机设备的结构框图。
图11是根据本发明实施例提供的一种视频译码系统框图。
图12是根据本发明实施例提供的一种视频编码器的系统框图。
图13是根据本发明实施例提供的一种视频解码器的系统框图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示: 单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字 符“/”一般表示前后关联对象是一种“或”的关系。“以下中的至少一项(个)”或其类似 表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如, a,b或c中的至少一项(个),可以表示:a、b、c、a-b、a-c、b-c、或a-b-c,其中a、b、 c可以是单个,也可以是多个。另外,在本申请的实施例中,“第一”、“第二”等字样 并不对数量和执行次序进行限定。
需要说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释 为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如” 等词旨在以具体方式呈现相关概念。
本申请实施例中的计算机设备是能够进行视频编码和/或视频解码的任何计算机设 备。例如,可以是计算机、笔记本电脑、移动终端、平板电脑等。
在本申请实施例中,计算机设备可以包括硬件层、运行在硬件层之上的操作系统层, 以及运行在操作系统层上的应用层。该硬件层包括中央处理器(central processingunit, CPU)、内存管理单元(memory management unit,MMU)和内存(也称为主存)等硬件。该操作系统可以是任意一种或多种通过进程(process)实现业务处理的计算机操作系统,例如,Linux操作系统、Unix操作系统、Android操作系统、iOS操作系统或windows操 作系统等。该应用层包含浏览器、通讯录、文字处理软件、即时通信软件等应用。并且, 本申请实施例并未对本申请实施例提供的方法的执行主体的具体结构特别限定,只要能够 通过运行记录有本申请实施例的提供的方法的代码的程序,以根据本申请实施例提供的方 法进行通信即可,例如,本申请实施例提供的方法的执行主体可以是终端设备或网络设备, 或者,是终端设备或网络设备中能够调用程序并执行程序的功能模块。
另外,本申请的各个方面或特征可以实现成方法、装置或使用标准编程和/或工程技 术的制品。本申请中使用的术语“制品”涵盖可从任何计算机可读器件、载体或介质访问的计算机程序。例如,计算机可读介质可以包括,但不限于:磁存储器件(例如,硬盘、 软盘或磁带等),光盘(例如,压缩盘(compact disc,CD)、数字通用盘(digital versatiledisc,DVD)等),智能卡和闪存器件(例如,可擦写可编程只读存储器(erasableprogrammable read-only memory,EPROM)、卡、棒或钥匙驱动器等)。另外,本文描述的各种存储介 质可代表用于存储信息的一个或多个设备和/或其它机器可读介质。术语“机器可读介质” 可包括但不限于,无线信道和能够存储、包含和/或承载指令和/或数据的各种其它介质。
为了帮助本领域技术人员更好地理解本申请的技术方案,首先对本申请实施例中所涉 及到的一些关键概念进行介绍。
图像块:视频编解码过程中以图像块为基本单元进行各种类型的编码操作,例如基于 块的预测、变换、熵编码等等。图像块也可以称为图像单元,编码单元等。图像块指一个 二维采样点阵列,可以是正方形阵列,也可以是矩形阵列,例如一个4x4大小的图像块可看做4x4共16个采样点构成的方形采样点阵列。
图像块内信号指图像块内采样点的采样值。采样点还可以称为像素点或者像素。相应 的,采样点的值也可以称为像素值。
当前块(也可以称为待处理图像块、当前图像块、当前编码单元)指当前正在处理的 图像块。例如在编码中,指当前正在编码的图像块;在解码中,指当前正在解码的图像块。
参考块(也可以称为参考图像块、参考编码单元)指为当前块提供参考信号的图像块。 在搜索过程中,需要遍历多个参考块,寻找最佳参考块。
预测块(也可以称为预测图像块、预测编码单元)是为当前块提供预测的块称为预测 块。例如,在遍历多个参考块以后,找到了最佳参考块,此最佳参考块将为当前块提供预测,此块称为预测块。
预测模式可以分为帧内预测和帧间预测两种。
帧间预测:帧间预测是在已是在已重建的图像中,为当前图像中的当前编码块寻找匹 配的参考块,将参考块中的像素点的像素值作为当前编码块中像素点的像素值的预测值 (此过程可以称为运动估计(motion estimation,ME))。
帧间预测有两种预测模式,分别为先进的运动矢量预测(Advanced MotionVector Prediction,AMVP)模式和融合(Merge)模式。
预测方向:预测方向可以分为单向预测和双向预测。更具体地,单向预测可以分为第 一向预测和第二向预测,其中第一向预测和第二向预测不同。可选的,在一些实施例中,第一向预测可以是前向预测,第二向预测可以是后向预测。可选的,在另一些实施例中, 第一向预测可以是后向预测。
前向预测是指当前图像块从第一参考图像集合中选择一个参考图像获取参考块。后向 预测是指当前图像块从第二参考图像集合中选择一个参考图像获取参考块。
第一参考图像集合是参考图像列表0(reference picture list 0,简称list0),第二参考 图像集合是参考图像列表1(reference picture list 1,简称list1)。或者第一参考图像集合 是list1,第二参考图像集合是list0。
双向预测是指从第一和第二参考图像集合中各选择一个参考图像获取参考块。当使用 双向预测方法时,当前图像块会存在两个参考块,每个参考块各自需要运动矢量和参考帧 索引进行指示,然后根据两个参考块内像素点的像素值确定当前图像块内像素点像素值的 预测值。
图1是一个能够应用本申请实施例提供的帧间预测的方法的系统架构示意图。如图1 所示,现有视频传输系统通常由采集、编码、发送、接收、解码、和显示这些部分组成。采集模块包含摄像头或摄像头组以及前处理,将光信号转化为数字化的视频序列。接着视频序列经编码器编码,转化为码流。然后码流由发送模块经网络发送至接收模块,经接收模块转化为码流后经解码器解码重建为视频序列。最后重建视频序列经渲染等后处理送至显示设备显示。本申请实施例的提供的帧间预测的方法可以应用于视频编码过程中和视频解码过程中。为便于描述,视频传输系统中生成视频码流并发送码流的计算机设备可以称为源设备、编码设备、编码装置等,接收该视频码流并对该码流进行解码的计算机设备可以称为目的设备、解码设备、解码装置等。
图2是根据本申请实施例提供的帧间预测的方法示意性流程图。图2所示的方法可以 由目的设备执行。
201,获取码流。
202,解析码流以确定待处理图像块的预测信息。
该待处理图像块的预测信息中可以包括该待处理图像块的预测模式。可以理解的是由 于图2所示的实施例是帧间预测的方法的实施例,因此步骤202中得到的该预测信息中的 该待处理图像块的预测模式是帧间预测。
该待处理图像块的预测信息中还可以包括该待处理图像块的预测方向。当该预测信息 指示该待处理图像块的预测方向为双向预测时,该码流中不包含目标标识信息,其中该目 标标识信息用于指示对该待处理图像块进行LIC。当该预测信息指示该待处理图像块的预 测方向为单向预测时,该码流中包含该目标标识信息。
203,根据该预测信息,获得该待处理图像块的预测值。
本申请实施例对如何根据该预测信息,获得该待处理图像块的预测值的具体实现方 式,以及获取到该预测值后如何处理该待处理图像块的具体操作并不进行限定。
可选的,在一些实施例中,该预测模式还可以进一步指示预测模式为融合模式。在此 情况下,在执行步骤203之前,还可以构建融合候选列表。
图3是根据本申请实施例提供的构建融合候选列表的示意图。
301,确定至少一个第一信息组,其中每个该第一信息组包括运动矢量、预测方向和 LIC标识。该每个第一信息组还可以包括参考帧索引。
该至少一个第一信息组可以是根据该待处理图像块空域相邻的图像块的图像块信息 和与该待处理图像块时域相邻的图像块的图像块信息确定的。图像块信息可以包括运动矢 量、预测方向、LIC标识和参考帧索引。
具体地,确定该至少一个第一信息组可以通过以下步骤实现:
步骤1:获取N个图像块信息,根据该N个图像块信息,确定该融合候选列表中的图像块信息。该N个图像块信息是与该待处理图像块空域相邻的N个图像块的图像块信息, N为大于或等于1的正整数。为便于描述,以下将与待处理图像块空域相邻的图像块简称 为空域相邻图像块。该N个空域相邻图像块的大小可以相同,也可以不同。该N个空域 相邻图像块的大小可以与该待处理图像块相同,也可以与该待处理图像块不同。例如,该 待处理图像块可以大于该空域相邻图像块。
例如,图4示出了待处理图像块和相邻图像块的位置关系。N取值可以为4,该N个空域相邻图像块可以分别为A0、A1、B0和B1。可以理解的是,图4仅是为了帮助本领 域技术人员更好地理解待处理图像块与空域相邻图像块的位置关系,而非对空域相邻图像 块数目以及待处理图像块与空域相邻图像块的位置关系的限定。例如,在一些实施例中, N的取值可以大于4。在另一些实施例中,N的取值可以小于4。例如,图4中,A0和位 于该待处理图像块的左下,在一些实施例中,A0也可以位于该待处理图像块的左上(即 图4中B2所在的位置)。
删除该N个图像块信息中重复的图像块信息。可选的,在一些实施例中,若两个或两 个以上图像块信息的内容完全相同,就可以确定这些图像块信息是重复的图像块信息。在 此情况下,可以只保留一个图像块信息。可选的,在另一些实施例中,若两个或两个以上图像块信息的有重复的内容,就可以确定这写图像块信息是重复的图像块信息。在此情况下,可以随机保留这些图像块信息中的一个图像块信息。
删除该N个图像块信息中的不可用图像块信息。不可用图像块信息可以是指图像块信 息所包括的全部信息均为空(null)。还以图4为例。假设该待处理图像块位于图像的左 上角。在此情况下,相邻图像块A0和A1的位置并没有像素点。这是,可以将图像块A0 和图像块A1的图像块信息均设置为空。
在完成删除重复图像块信息和不可用图像块信息后,将剩余的图像块信息作为融合候 选列表中的图像块信息。为便于描述,假设剩余的图像块信息数目为N1,N1可以是大于或等于1的正整数。
步骤2:确定N1是否小于N。
若N1等于N,则直接执行步骤3。
若N1小于N,则还可以获取另一个与该待处理图像块空域相邻的图像块的图像块信 息。若该图像块信息非不可用图像块信息且不是重复的图像块信息(即该图像块信息与该 N1个图像块信息中的任一个图像块信息均不相同),则将该图像块信息作为该融合候选列 表中的一个图像块信息。
步骤3:获取与该待处理图像块时域相邻的已重构图像帧中的目标图像块,确定对应 于该目标图像块的图像块信息,并将对应于该目标图像块的图像块信息作为该融合候选列 表中的一个图像块信息。
可选的,在一些实施例中,与该待处理图像块时域相邻的已重构图像帧可以包括前向 时域相邻的已重构图像帧(为便于描述,以下简称前向已重构图像帧)以及后向时域相邻 的已重构图像帧(为便于描述,以下简称后向已重构图像帧)。在此情况下,可以从该前 向已重构图像帧中确定一个目标图像块(以下简称前向目标图像块),从该后向已重构图 像帧中确定一个目标图像块(以下简称后向目标图像块)。换句话说,步骤3中确定的该目标图像块可以包括前向目标图像块和后向目标图像块。
可选的,在另一些实施例中,与该待处理图像块时域相邻的已重构图像帧可能只包括 前向已重构图像帧。相应的步骤3中确定的该目标图像块为前向目标图像块。
可选的,在另一些实施例中,与该待处理图像块时域相邻的已重构图像帧可能只包括 后向已重构图像帧。相应的步骤3中确定的该目标图像块为后向目标图像块。
为了区分对应于该目标图像块的图像块信息和该目标图像块的图像块信息,以下将对 应于该目标图像块的图像块信息称为第五选择信息组。
该第五选择信息组的预测方向可以根据该目标图像块确定。
例如,若该目标图像块包括前向目标图像块和后向目标图像块,则该第五选择信息组 中的预测方向为双向预测。该第五选择信息组的LIC标识为第二数值。当该待处理图像块 进行LIC时,该待处理图像块的LIC标识取第一数值,当该待处理图像块不进行LIC时,该待处理图像块的LIC标识取第二数值。该第五选择组信息中的参考帧索引可以与前向目标图像块的图像块信息中的参考帧索引相同,也可以与后向目标图像块的图像块信息中的参考帧索引相同。类似的,该第五选择组信息中的运动矢量可以与前向目标图像块的图像块信息中的运动矢量相同,也可以与后向目标图像块的图像块信息中的运动矢量相同。
又如,若该目标图像块为前向目标图像块,则该第五选择信息组中的预测方向为前向 预测。该第五选择信息组的LIC标识为第二数值。该第五选择组信息中的参考帧索引可以 与前向目标图像块的图像块信息中的参考帧索引相同。该第五选择组信息中的运动矢量可 以与前向目标图像块的图像块信息中的运动矢量相同。
又如,若该目标图像块为后向目标图像块,则该第五选择信息组中的预测方向为后向 预测。该第五选择信息组的LIC标识为第二数值。该第五选择组信息中的参考帧索引可以 与后向目标图像块的图像块信息中的参考帧索引相同。该第五选择组信息中的运动矢量可 以与后向目标图像块的图像块信息中的运动矢量相同。
图4还示出了该目标图像块与该待处理图像块的位置关系。图4所示的该目标图像块 可以是前向目标图像块,也可以是后向目标图像块。如图4所示图像块T是一个该目标图像块。如图4所示,图像块T是在与该待处理图像块时域相邻的已重构图像帧中与该待处 理图像块位置相同的图像块空域相邻的一个图像块。为便于描述,以下简称已重构图像帧 中与该待处理图像块位置相同的图像块为镜像待处理图像块。
在一些实施例中,图像块T可能并不存在。例如,镜像待处理图像块可以能位于图像 帧的右下角。在此情况下,可以将该镜像待处理图像块中一个图像块作为该目标图像块, 例如该目标图像块可以是如图4所示的图像块C。可以理解的是,该目标图像块还可以是 位于除如图4所示的图像块C所在位置的其他位置的图像块,只有该目标图像块在该镜像 待处理图像块的范围内即可。
为便于描述,以下假设在经过上述步骤1至步骤3后,该融合候选列表中共包括N2个图像块信息,N2为大于或等于1的正整数。该N2个图像块信息就是步骤301中确定的 至少一个第一信息组。换句话说,该融合候选列表中的经过上述步骤1至步骤3确定的图 像块信息可以称为第一信息组。
表1是一个通过步骤301确定的该融合候选列表的示意。
表1
Figure BDA0001890189120000111
Figure BDA0001890189120000121
如表1所示,表1中共包括三个第一信息组,为便于描述,表1中以MV 1、MV 2 和MV3分别表示三个第一信息组中的运动矢量,以PRED 1、PRED 2和PRED 3分别表 示三个第一信息组中的预测方向,以RI 1、RI 2和RI 3分别表示三个第一信息组中的参 考帧索引。从表1中可以看出,第一信息组0(即表1中的第一个第一信息组)的LIC标 识为0,第一信息组1(即表1中的第二个第一信息组)的LIC标识为1,第一信息组2 (即表1中的第三个第一信息组)的LIC标识为0。可选的,在一些实施例中,LIC标识 (LIC flag)为0可以表示不使用LIC模式,LIC标识为1可以表示使用LIC模式。可选 的,在另一些实施例中,LIC标识(LIC flag)为1可以表示不使用LIC模式,LIC标识 为0可以表示使用LIC模式。进一步,如表1所示,三个第一信息组中的每个第一信息组 有一个索引。
可选的,在另一些实施例中,融合候选列表中也可以不包括索引。换句话说,该融合 候选列表也可以不包括如表1所示的索引列。
302,确定该第一信息组的数量是否少于目标预设值。为便于描述,以下假设该目标 预设值为Nmax
如上所述,在执行了步骤301后,该融合候选列表中共N2个第一信息组。因此,步骤302也可以表述为确定N2是否小于Nmax
若N2等于Nmax,则根据步骤301确定的融合候选列表就是最终的融合候选列表。
若N2小于Nmax,则执行步骤303。
303,根据该至少一个第一信息组,确定至少一个第二信息组,其中该每个第二信息 组包括运动矢量、预测方向和LIC标识。该每个第二信息组还可以包括参考帧索引。
该至少一个第二信息组中的一个第二信息组是根据该至少一个第一信息组中的两个 第一信息组确定的。为便于描述,以下以一个第二信息组为例,简述如何确定该第二信息 组。为便于描述,可以称作为示例的第二信息组为第一合成信息组。将用于确定该第一合 成信息组的两个第一信息组分别称为第一选择信息组和第二选择信息组。
可选的,在一些实施例中,可以根据预设的索引组合从该至少一个第一信息组中确定 该第一选择信息组和该第二选择信息组。例如表2是一个索引组合列表。
表2
索引组合
0,1
0,2
1,2
0,3
1,3
2,3
如表2所示的索引组合列表中共包括六个索引组合。以第一个索引组合为例,(0,1) 表示确定该第一信息组中的索引值为0和索引值为1的两个第一信息组确定一个第二信息 组。用于确定第二信息组的两个第一信息组可以是按照表2的顺序自上向下确定的。例如, 该至少一个第二信息组中的第1个第二信息组是根据该至少一个第一信息组中的索引值 为0和索引值为1的两个第一信息组确定的;该至少一个第二信息组中的第2个第二信息组是根据该至少一个第一信息组中索引值为0和索引值为2的两个第一信息组确定的;该至少一个第二信息组中的第3个第二信息组是根据该至少一个第一信息组中索引值为1和索引值为2的两个第一信息组确定的,以此类推。
可以理解的是,表2只是一个预设索引组合的示意。该索引组合列表中的索引组合的 排序、数量以及组合方式等还可以是其他组合,在此就不一一列举。
可选的,在另一些实施例中,该第一选择信息组和该第二选择信息组还可以是任意确 定的两个第一信息组。例如,假设Nmax与N2的差值为1,则可以从该至少一个第一信息组中随机确定两个第一信息组作为该第一选择信息组和该第二选择信息组。
可选的,在另一些实施例中,该第一选择信息组和该第二选择信息组还可以是按照一 个预设规律而非一个预设的索引组合列表确定的。在此情况下,目的设备可以无需存储一 个索引组合列表。例如,如上所述,该至少一个第一信息组中共包括N2个第一信息组,那么该至少一个第二信息组中第1个第二信息组可以根据该N2个第一信息组中的第1个 第一信息组和第2个第一信息组确定;第2个第二信息组可以根据该N2个第一信息组中 的第1个第一信息组和第3个第一信息组确定;第N2-1个第二信息组可以根据该N2个第 一信息组中的第1个第一信息组和第N2个第一信息组确定;第N2个第二信息组可以根据 该N2个第一信息组中的第2个第一信息组和第3个第一信息组确定,以此类推。
可选的,在一些实施例中,该第一合成信息组的运动矢量可以是该第一选择信息组的 运动矢量和该第二选择信息组的运动矢量的平均值。更具体地,该平均值可以是算数平均 值。
可选的,在一些实施例中,该第一合成信息组的预测方向可以根据该第一选择信息组 的预测方向和该第二选择信息组的预测方向确定。
可选的,在一些实施例中,若该第一选择信息组的预测方向与该第二选择信息组的预 测方向一致,则该第一合成信息组的预测方向与该第一选择信息组的预测方向相同。
例如,若该第一选择信息组的预测方向为前向预测,该第二选择信息组的预测方向为 前向预测,则该第一合成信息组的预测方向为前向预测。
又如,若该第一选择信息组的预测方向为后向预测,该第二选择信息组的预测方向为 后向预测,则该第一合成信息组的预测方向为后向预测。
又如,若该第一选择信息组的预测方向为双向预测,该第二选择信息组的预测方向为 双向预测,则该第一合成信息组的预测方向为双向预测。
可选的,在另一些实施例中,若该第一选择信息组的预测方向与该第二选择信息组的 预测方向不同,则该第一合成信息组的预测方向与该第一选择信息组的预测方向相同。
例如,若该第一选择信息组的预测方向为前向预测,该第二选择信息组的预测方向为 后向预测,则该第一合成信息组的预测方向为前向预测。
又如,若该第一选择信息组的预测方向为后向预测,该第二选择信息组的预测方向为 前向预测,则该第一合成信息组的预测方向为后向预测。
又如,若该第一选择信息组的预测方向为双向预测,该第二选择信息组的预测方向为 前向或后向预测,则该第一合成信息组的预测方向为双向预测。
可选的,在另一些实施例中,若该第一选择信息组的预测方向与该第二选择信息组的 预测方向不同,则该第二合成信息组的预测方向与该第二选择信息组的预测方向相同。
例如,若该第一选择信息组的预测方向为前向预测,该第二选择信息组的预测方向为 后向预测,则该第一合成信息组的预测方向为后向预测。
又如,若该第一选择信息组的预测方向为后向预测,该第二选择信息组的预测方向为 前向预测,则该第一合成信息组的预测方向为前向预测。
又如,若该第一选择信息组的预测方向为双向预测,该第二选择信息组的预测方向为 前向预测,则该第一合成信息组的预测方向为前向预测。
又如,若该第一选择信息组的预测方向为双向预测,该第二选择信息组的预测方向为 后向预测,则该第一合成信息组的预测方向为后向预测。
可选的,在另一些实施例中,若该第一选择信息组的预测方向与该第二选择信息组的 预测方向不同,则该第二合成信息组的预测方向为双向预测。
例如,若该第一选择信息组的预测方向为前向预测,该第二选择信息组的预测方向为 后向预测,则该第一合成信息组的预测方向为双向预测。
又如,若该第一选择信息组的预测方向为后向预测,该第二选择信息组的预测方向为 前向预测,则该第一合成信息组的预测方向为双向预测。
又如,若该第一选择信息组的预测方向为双向预测,该第二选择信息组的预测方向为 前向或后向预测,则该第一合成信息组的预测方向为双向预测。
又如,若该第一选择信息组的预测方向为前向或后向预测,该第二选择信息组的预测 方向为双向预测,则该第一合成信息组的预测方向为双向预测。
可选的,在一些实施例中,当该待处理图像块进行LIC时,该待处理图像块的LIC标识为第一数值,当该待处理图像块不进行LIC时,该待处理图像块的LIC标识取第二数值,该根据该至少一个第一信息组,确定至少一个第二信息组,包括:当该第一合成信息 组的预测方向为双向预测时,确定该第一合成信息组的LIC标识为该第二数值;当该第一 合成信息组的预测方向为单向预测,且,该第一选择信息组和该第二选择信息组的LIC标 识均为该第二数值时,确定该第一合成信息组的LIC标识为该第二数值;当该第一合成信 息组的预测方向为单向预测,且,该第一选择信息组和/或该第二选择信息组的LIC标识 为该第一数值时,确定该第一合成信息组的LIC标识为该第一数值。
假设该第一数值为1,该第二数值为0。若该第一合成信息组的预测方向为双向预测, 则可以确定该第一合成信息组的LIC标识为0。若该第一合成信息组的预测方向为单向预 测,且,该第一选择信息组和该第二选择信息组的LIC标识均为0,则确定该第一合成信息组的LIC标识为0;若该第一合成信息组的预测方向为单向预测,且,该第一选择信息 组和/或该第二选择信息组的LIC标识为1时,确定该第一合成信息组的LIC标识为1。
换句话说,若该至少一个第二信息组中的一个或多个第二信息组的预测方向为双向预 测,则该一个或多个第二信息组的LIC标识为该第二数值。
该第一合成信息组的参考帧索引可以根据该第一选择信息组的参考帧索引和第二选 择信息组的参考帧索引确定。
例如,第一合成信息前向参考帧索引可以根据以下方式确定:如果第一选择信息组和 第二选择信息组的前向都存在(即预测方向为前向或双向),则第一合成信息前向参考帧 索引为第一选择信息组的前向参考帧索引;如果第一选择信息组的前向存在,第二选择信 息组的前向不存在(即预测方向为后向),则第一合成信息前向参考帧索引为第一选择信 息组的前向参考帧索引;如果第一选择信息组的前向不存在,第二选择信息组的前向存在, 则第一合成信息前向参考帧索引为第二选择信息组的前向参考帧索引;如果第一选择信息 组和第二选择信息组的后向都存在(即预测方向为后向或双向),则第一合成信息后向参 考帧索引为第一选择信息组的后向参考帧索引;如果第一选择信息组的后向存在,第二选 择信息组的后向不存在(即预测方向为前向),则第一合成信息后向参考帧索引为第一选 择信息组的后向参考帧索引;如果第一选择信息组的后向不存在,第二选择信息组的后向 存在,则第一合成信息后向参考帧索引为第二选择信息组的后向参考帧索引。
在确定出了该至少一个第二信息组后,可以将该至少一个第二信息组插入该融合候选 列表。为便于描述,以下假设该至少一个第二信息组的数量为N3。另外,为便于描述,统一将该候选信息列表中第一信息组和第二信息组称为图像块信息。在经过步骤303之后,该融合候选列表中共包括N2+N3个图像块信息。
可选的,在一些实施例中,若根据两个第一信息组确定出的一个第二信息组与该候选 信息列表中已有的图像块信息相同,则可以删除该第二信息组,继续根据其他的第一信息 组确定新的第二信息组。
304,确定该至少一个第一信息组的数量和该至少一个第二信息组的数量之和是否少 于该目标预设值。换句话说,确定N2+N3是否小于Nmax
若N2+N3等于Nmax,则该融合候选列表就是最终的融合候选列表。
若N2+N3小于Nmax,则执行步骤305。
可以理解的是,步骤304可以在执行步骤303的过程中执行。换句话说,在确定该至少一个第二信息组的过程中,若已确定出的第二信息组数量与该至少一个第一信息组的数量之和等于该目标预设值,则可以无需继续确定该第二信息组。已确定出的第二信息组和该至少一个信息组就组成了最终的融合候选列表。
305,确定至少一个第五信息组,其中每个该第五信息组可以包括LIC标识、预测方向、参考帧索引和运动矢量。该至少一个第五信息组中的每个第五信息组的LIC标识为该第二数值。
该至少一个第一信息组的数量、该至少一个第二信息组的数量和该至少一个第五信息 组的数量之和等于该目标预设值。因此,在确定该至少一个第五信息组之前,还可以先确 定需要确定的该至少一个第五信息组的数量。该至少一个第五信息组的数量假设为N3, 则N1+N2+N3等于Nmax
可选的,该第五信息组中除LIC标识外的其他信息可以通过预设的方式确定。
例如,若N3等于1,则确定该第五信息组的运动矢量为0,参考帧索引为-1,预测方向为双向预测。
又如,若N3等于1,则确定该第五信息组的运动矢量为0,参考帧索引为1,预测方向为前向预测。
又如,若N3等于1,则确定该第五信息组的运动矢量为0,参考帧索引为1,预测方向为双向预测。
又如,若N3等于2,则确定该至少一个第五信息组中的第一个第五信息组的运动矢量 为0,参考帧索引为-1,预测方向为双向预测。第二个第五信息组的运动矢量为0,参考帧索引为1,预测方向为前向预测。
又如,若N3等于2,则确定该至少一个第五信息组中的第一个第五信息组的运动矢量 为0,参考帧索引为1,预测方向为双向预测。第二个第五信息组的运动矢量为0,参考 帧索引为1,预测方向为前向预测。
又如,若N3等于2,则确定该至少一个第五信息组中的第一个第五信息组的运动矢量 为0,参考帧索引为1,预测方向为双向预测。第二个第五信息组的运动矢量为0,参考 帧索引为1,预测方向为双向预测。
N3大于或等于3的情况也可以根据预设方式确定出相应的第五信息组,在此就不一一 列举。
完成了步骤305后,可以将确定出的至少一个第五信息组插入到该融合候选列表。另 外,为便于描述,统一将该候选信息列表中第一信息组、第二信息组和第五信息组称为图 像块信息。可以看出,在完成步骤305后,该融合候选列表中包括的图像块信息数目为该目标预设值。在此情况下,该融合候选列表就是最终的融合候选列表。
在完成了构建该融合候选列表的情况下,该根据该预测信息,获得该待处理图像块的 预测值,包括:根据该预测信息、该融合候选列表,获得该待处理图像块的预测值。换句 话说,该根据该预测信息,获得该待处理图像块的预测值,包括:根据该预测信息、该至少一个第一信息组、该至少一个第二信息组和该至少一个第五信息组,获得所述待处理图像块的预测值。根据该预测信息、该融合候选列表,获得该待处理图像块的预测值的具体实现方式与现有技术相同,在此就不必赘述。
图5是根据本申请实施例提供的另一构建融合候选列表的示意图。
501,确定至少一个第三信息组,其中,每个该第三信息组包括运动矢量和LIC标识。 每个该第三信息组还可以包括预测方向和参考帧标识。
步骤501的具体实现方式与步骤301相同,可以参见步骤301的描述,在此就不必赘述。
502,确定该第三信息组的数量是否少于目标预设值。为便于描述,以下假设该目标 预设值为Nmax
如上所述,在执行了步骤501后,该融合候选列表中共N2个第三信息组。因此,步骤502也可以表述为确定N2是否小于Nmax
若N2等于Nmax,则根据步骤501确定的融合候选列表就是最终的融合候选列表。
若N2小于Nmax,则执行步骤503。
503,根据该至少一个第三信息组,确定至少一个第四信息组,其中该每个第四信息 组包括运动矢量和LIC标识。该每个第四信息组还可以包括预测方向和参考帧索引。
该至少一个第四信息组中的一个第四信息组是根据该至少一个第三信息组中的两个 第三信息组确定的。为便于描述,以下以一个第四信息组为例,简述如何确定该第四信息 组。为便于描述,可以称作为示例的第四信息组为第二合成信息组。将用于确定该第二合 成信息组的两个第三信息组分别称为第三选择信息组和第四选择信息组。
确定该第三选择信息和该第四选择信息的实现方式可以参考图3所示实施例中确定 第一选择信息和第二选择信息的实现方式,在此就不必赘述。
可选的,在一些实施例中,该第二合成信息的运动矢量可以通过以下方式确定:将该 第三选择信息组对应第一向预测的运动矢量作为该第二合成信息组对应第一向预测的运 动矢量,且,将该第四选择信息组对应第二向预测的运动矢量作为该第二合成信息组对应 第二向预测的运动矢量。可选的,在一些实施例中,该第一向预测为前向预测,该第二向预测为后向预测。可选的,在另一些实施例中,该第一向预测为后向预测,该第二向预测 为前向预测。
可选的,在另一些实施例中,该第二合成信息的运动矢量可以通过以下方式确定:将 该第三选择信息组对应第二向预测的运动矢量作为该第二合成信息组对应第一向预测的 运动矢量,且,将该第四选择信息组对应第一向预测的运动矢量作为该第二合成信息组对 应第二向预测的运动矢量。可选的,在一些实施例中,该第一向预测为前向预测,该第二向预测为后向预测。可选的,在另一些实施例中,该第一向预测为后向预测,该第二向预 测为前向预测。
当该待处理图像块进行LIC时,该待处理图像块的LIC标识为第一数值,当该待处理 图像块不进行LIC时,该待处理图像块的LIC标识取第二数值。在此情况下,该根据该至少一个第三信息组,确定至少一个第四信息组,包括:确定该至少一个第四信息组中的每个第四信息组的LIC标识为该第二数值。换句话说,该至少一个第四信息组中的每个第四信息组的LIC标识为该第二数值。
可选的,在一些实施例中,该第二合成信息组的预测方向可以根据该第三合成信息组 的预测方向和该第四合成信息组的预测方向确定。
可选的,在一些实施例中,若该第三合成信息组的预测方向与该第四合成信息组的预 测方向一致,则该第二合成信息组的预测方向与该第三合成信息组的预测方向相同。
例如,若该第三合成信息组的预测方向为前向预测,该第四合成信息组的预测方向为 前向预测,则该第二合成信息组的预测方向为前向预测。
又如,若该第三合成信息组的预测方向为后向预测,该第四合成信息组的预测方向为 后向预测,则该第二合成信息组的预测方向为后向预测。
又如,若该第三合成信息组的预测方向为双向预测,该第四合成信息组的预测方向为 双向预测,则该第二合成信息组的预测方向为双向预测。
可选的,在另一些实施例中,若该第三合成信息组的预测方向与该第四合成信息组的 预测方向不同,则该第二合成信息组的预测方向与该第三合成信息组的预测方向相同。
例如,若该第三合成信息组的预测方向为前向预测,该第四合成信息组的预测方向为 后向预测,则该第二合成信息组的预测方向为前向预测。
又如,若该第三合成信息组的预测方向为后向预测,该第四合成信息组的预测方向为 前向预测,则该第二合成信息组的预测方向为后向预测。
又如,若该第三合成信息组的预测方向为双向预测,该第四合成信息组的预测方向为 前向或后向预测,则该第二合成信息组的预测方向为双向预测。
可选的,在另一些实施例中,若该第三合成信息组的预测方向与该第四合成信息组的 预测方向不同,则该第二合成信息组的预测方向与该第四合成信息组的预测方向相同。
例如,若该第三合成信息组的预测方向为前向预测,该第四合成信息组的预测方向为 后向预测,则该第二合成信息组的预测方向为后向预测。
又如,若该第三合成信息组的预测方向为后向预测,该第四合成信息组的预测方向为 前向预测,则该第二合成信息组的预测方向为前向预测。
又如,若该第三合成信息组的预测方向为双向预测,该第四合成信息组的预测方向为 前向预测,则该第二合成信息组的预测方向为前向预测。
又如,若该第三合成信息组的预测方向为双向预测,该第四合成信息组的预测方向为 后向预测,则该第二合成信息组的预测方向为后向预测。
可选的,在另一些实施例中,若该第三合成信息组的预测方向与该第四合成信息组的 预测方向不同,则该第二合成信息组的预测方向为双向预测。
例如,若该第三合成信息组的预测方向为前向预测,该第四合成信息组的预测方向为 后向预测,则该第二合成信息组的预测方向为双向预测。
又如,若该第三合成信息组的预测方向为后向预测,该第四合成信息组的预测方向为 前向预测,则该第二合成信息组的预测方向为双向预测。
又如,若该第三合成信息组的预测方向为双向预测,该第四合成信息组的预测方向为 前向或后向预测,则该第二合成信息组的预测方向为双向预测。
又如,若该第三合成信息组的预测方向为前向或后向预测,该第四合成信息组的预测 方向为双向预测,则该第二合成信息组的预测方向为双向预测。
该第二合成信息组的参考帧索引可以根据该第三选择信息组的参考帧索引和第四选 择信息组的参考帧索引确定。
例如,第二合成信息的前向参考帧索引为第三选择信息组的前向参考帧索引,第二合 成信息的后向参考帧索引为第四选择信息组的后向参考帧索引。
又如,第二合成信息的前向参考帧索引为第四选择信息组的前向参考帧索引,第二合 成信息的后向参考帧索引为第三选择信息组的后向参考帧索引。
在确定出了该至少一个第四信息组后,可以将该至少一个第四信息组插入该融合候选 列表。为便于描述,以下假设该至少一个第四信息组的数量为N3。另外,为便于描述,统一将该候选信息列表中第三信息组和第四信息组称为图像块信息。在经过步骤503之后,该融合候选列表中共包括N2+N3个图像块信息。
可选的,在一些实施例中,若根据两个第四信息组确定出的一个第四信息组与该候选 信息列表中已有的图像块信息相同,则可以删除该第四信息组,继续根据其他的第三信息 组确定新的第四信息组。
504,确定该至少一个第三信息组的数量和该至少一个第四信息组的数量之和是否少 于该目标预设值。换句话说,确定N2+N3是否小于Nmax
若N2+N3等于Nmax,则该融合候选列表就是最终的融合候选列表。
若N2+N3小于Nmax,则执行步骤505。
可以理解的是,步骤504可以在执行步骤503的过程中执行。换句话说,在确定该至少一个第四信息组的过程中,若已确定出的第四信息组数量与该至少一个第三信息组的数量之和等于该目标预设值,则可以无需继续确定该第四信息组。已确定出的第四信息组和该至少一个信息组就组成了最终的融合候选列表。
505,确定至少一个第六信息组,其中每个该第六信息组可以包括LIC标识、预测方向、参考帧索引和运动矢量。该至少一个第六信息组中的每个第六信息组的LIC标识为该第二数值。
该至少一个第三信息组的数量、该至少一个第四信息组的数量和该至少一个第六信息 组的数量之和等于该目标预设值。因此,在确定该至少一个第六信息组之前,还可以先确 定需要确定的该至少一个第六信息组的数量。该至少一个第六信息组的数量假设为N3, 则N1+N2+N3等于Nmax
确定该至少一个第六信息组的实现方式与图3所示实施例中确定该至少一个第五信 息组的实现方式相同,在此就不必赘述。
完成了步骤505后,可以将确定出的至少一个第六信息组插入到该融合候选列表。另 外,为便于描述,统一将该候选信息列表中第三信息组、第四信息组和第六信息组称为图 像块信息。可以看出,在完成步骤505后,该融合候选列表中包括的图像块信息数目为该目标预设值。在此情况下,该融合候选列表就是最终的融合候选列表。
在完成了构建该融合候选列表的情况下,该根据该预测信息,获得该待处理图像块的 预测值,包括:根据该预测信息、该融合候选列表,获得该待处理图像块的预测值。换句 话说,该根据该预测信息,获得该待处理图像块的预测值,包括:根据该预测信息、该至少一个第三信息组、该至少一个第四信息组和该至少一个第六信息组,获得所述待处理图像块的预测值。根据该预测信息、该融合候选列表,获得该待处理图像块的预测值的具体实现方式与现有技术相同,在此就不必赘述。
可以看出,图3所示的构建融合候选列表的方法与图5所示的构建融合候选列表的方 法的不同之处在于如何根据第一/第三信息组确定第二/第四信息组。按照如图3所示的方 式确定第二信息组的方法可以称为配对(PairWise)填充法。按照如图5所示的方法确定第四信息组的方法可以称为组合(Combination)填充法。
可选的,在一些实施例中,目的设备可以根据码流中的代码版本信息确定出采用图3 所示的方法构建该融合候选列表还是图5所示的方法构建该融合候选列表。具体地,该码 流中可以包括代码版本信息,若代码版本信息为多用途视频编码测试模型(Versatilevideo coding Test Model,VTM)3.0或VTM3.0以上版本,则采用图3所示的方法构建该融合候选列表(即利用配对填充法确定需要插入到融合候选列表中的图像块信息);若代码版本信息为其他版本(即除VTM3.0或VTM3.0以上版本外的版本),则采用图5的方法构 建该融合候选列表(即利用组合填充法确定需要插入到融合候选列表中的图像块信息)。
图6是根据本申请实施例提供的帧间预测的方法示意性流程图。图6所示的方法可以 由源设备执行。
601,确定待处理图像块的预测信息。
该待处理图像块的预测信息中可以包括该待处理图像块的预测模式。可以理解的是由 于图6所示的实施例是帧间预测的方法的实施例,因此步骤601中所确定的该待处理图像 块的预测信息中的该待处理图像块的预测模式是帧间预测。
该待处理图像块的预测信息中还可以包括该待处理图像块的预测方向。
该预测信息的具体确定过程与现有技术相同,在此就不详细描述。
602,根据该待处理图像块的预测信息,确定码流。
当该预测信息指示该待处理图像块的预测方向为双向预测时,该码流中不包含目标标 识信息,其中该目标标识信息用于指示对该待处理图像块进行LIC。当该预测信息指示该 待处理图像块的预测方向为单向预测且不为融合模式时,该码流中包含该目标标识信息。
可选的,在一些实施例中,该预测模式还可以进一步指示预测模式为融合模式。在此 情况下,在源设备还可以构建候选运动信息列表。构建候选运动信息列表的具体实现方式 与构建融合候选列表的具体实现方式相同。因此,可以参考图3和图5所示的实施例。
该构建候选运动信息列表可以在步骤602之前执行。在构建了该候选运动信息列表的 情况下,该根据该待处理图像块的预测信息,确定码流,包括:根据该待处理图像块的预 测信息和该候选运动信息列表,确定码流
可选的,在一些实施例中,在构建出该候选运动信息列表后,可以从该候选运动信息 列表中确定一个最优图像块信息,将该最优图像块信息的索引值(以下简称最优索引值) 传递到目的设备。如上所述,该目的设备可以采用同样的方式构建融合候选列表。在完成 该融合候选列表构建后,该目的设备可以根据该最优索引值,从该融合候选列表中选择一 个图像块信息。
图7是根据本申请实施例提供的一种解码装置的示意性结构框图。如图7所示的解码 装置可以是一个计算机设备,也可以使用于计算机设备的部件(例如芯片或者电路)。
如图7所示,解码装置700可以包括获取单元701和处理单元702。获取单元701, 用于获取码流。
处理单元702,用于解析该码流以确定待处理图像块的预测信息,其中,当该预测信 息指示该待处理图像块的预测模式为帧间预测,且,该待处理图像块的预测方向为双向预 测时,该码流中不包含目标标识信息,其中,该目标标识信息用于指示对该待处理图像块 进行局部亮度补偿LIC。
处理单元702,还用于根据该预测信息,获得该待处理图像块的预测值。
如图7所示的解码装置能够实现如图2、图3和图5所示的方法的各个步骤。获取单元701可以由接收器实现,处理单元702可以由处理器实现。获取单元701和处理单元 702的具体功能和有益效果可以参考图2、图3和图5所示的方法,在此就不必赘述。
图8是根据本发明实施例提供的计算机设备的结构框图。如图8所示,计算机设备800包括处理器801、存储器802、收发器803。处理器801可以用于对计算机设备进行控 制,执行软件程序,处理软件程序的数据等。存储器802主要用于存储软件程序和数据。 收发器803可以用于与其他计算机设备进行通信。例如,若该计算机设备是具有无线通信 功能的设备(例如移动终端、平板电脑等)则该收发器803可以包括射频电路和天线。射 频电路主要用于基带信号与射频信号的转换以及对射频信号的处理。天线主要用于收发电 磁波形式的射频信号。除了如图8所示的处理器、存储器和收发器外,计算机设备输入输 出装置,例如触摸屏、显示屏,键盘等主要用于接收用户输入的数据以及对用户输出视频、 数据等。
为便于说明,图8中仅示出了一个存储器和处理器。在实际的计算机设备产品中,可 以存在一个或多个处理器和一个或多个存储器。存储器也可以称为存储介质或者存储设备 等。存储器可以是独立于处理器设置,也可以是与处理器集成在一起,本申请实施例对此 不做限制。
在本申请实施例中,可以将具有收发功能的电路视为计算机设备的收发器803,将具 有处理功能的处理器视为计算机设备的处理单元。收发器也可以称为收发单元、收发机、 收发装置等。处理单元也可以称为处理器,处理单板,处理模块、处理装置等。可选的,可以将收发器803中用于实现接收功能的器件视为接收单元,将收发器803中用于实现发送功能的器件视为发送单元,即收发器803包括接收单元和发送单元。接收单元有时也可以称为接收机、接收器、或接收电路等。发送单元有时也可以称为发射机、发射器或者发 射电路等。
处理器801、存储器802和收发器803之间通过内部连接通路互相通信,传递控制和/或数据信号
上述本发明实施例揭示的方法可以应用于处理器801中,或者由处理器801实现。处 理器801可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器801中的硬件的集成逻辑电路或者软件形式的指令完成。
本申请各实施例所述的处理器可以是通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可 编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或 者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、 步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器 等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或 者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器 (random access memory,RAM)、闪存、只读存储器(read-only memory,ROM)、可 编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储 介质位于存储器,处理器读取存储器中的指令,结合其硬件完成上述方法的步骤。
可选的,在一些实施例中,存储器802可以存储用于执行如图2所示方法的指令。处理器801可以执行存储器802中存储的指令结合其他硬件(例如收发器803)完成如图2 所示方法的步骤,具体工作过程和有益效果可以参见图2所示实施例中的描述。
可选的,在一些实施例中,存储器802可以存储用于执行如图3所示方法的指令。处理器801可以执行存储器802中存储的指令结合其他硬件(例如收发器803)完成如图3 所示方法的步骤,具体工作过程和有益效果可以参见图3所示实施例中的描述。
可选的,在一些实施例中,存储器802可以存储用于执行如图5所示方法的指令。处理器801可以执行存储器802中存储的指令结合其他硬件(例如收发器803)完成如图5 所示方法的步骤,具体工作过程和有益效果可以参见图5所示实施例中的描述。
本申请实施例还提供一种计算机可读存储介质,其上存储有指令,该指令被执行时执 行上述方法实施例中解码侧的方法。
本申请实施例还提供一种包含指令的计算机程序产品,该指令被执行时执行上述方法 实施例中解码侧的方法。
图9是根据本申请实施例提供的一种编码装置的示意性结构框图。如图9所示的编码 装置可以是一个计算机设备,也可以使用于计算机设备的部件(例如芯片或者电路)。
如图9所示,编码装置900可以包括处理单元901和发送单元902。
处理单元901,用于确定待处理图像块的预测信息。
处理单元901,还用于根据该待处理图像块的预测信息,确定码流。
发送单元902,用于将处理单元901确定的码流发送至解码装置。
如图9所示的编码装置能够实现如图6所示的方法的各个步骤。如图9所示的编码装 置也能够基于图3和/或图5所示的方法实现构建候选运动信息列表的各个步骤
处理单元901可以由处理器实现,发送单元902可以由发送器实现。处理单元901和发送单元902的具体功能和有益效果可以参考图6、图3和图5所示的方法,在此就不必 赘述。
图10是根据本发明实施例提供的计算机设备的结构框图。如图10所示,计算机设备 1000包括处理器1001、存储器1002、收发器1003。处理器1001可以用于对计算机设备 进行控制,执行软件程序,处理软件程序的数据等。存储器1002主要用于存储软件程序 和数据。收发器1003可以用于与其他计算机设备进行通信。例如,若该计算机设备是具 有无线通信功能的设备(例如移动终端、平板电脑等)则该收发器1003可以包括射频电 路和天线。射频电路主要用于基带信号与射频信号的转换以及对射频信号的处理。天线主 要用于收发电磁波形式的射频信号。除了如图10所示的处理器、存储器和收发器外,计 算机设备输入输出装置,例如触摸屏、显示屏,键盘等主要用于接收用户输入的数据以及 对用户输出视频、数据等。
为便于说明,图10中仅示出了一个存储器和处理器。在实际的计算机设备产品中,可以存在一个或多个处理器和一个或多个存储器。存储器也可以称为存储介质或者存储设备等。存储器可以是独立于处理器设置,也可以是与处理器集成在一起,本申请实施例对此不做限制。
在本申请实施例中,可以将具有收发功能的电路视为计算机设备的收发器1003,将 具有处理功能的处理器视为终端的处理单元。收发器也可以称为收发单元、收发机、收发 装置等。处理单元也可以称为处理器,处理单板,处理模块、处理装置等。可选的,可以将收发器1003中用于实现接收功能的器件视为接收单元,将收发器1003中用于实现发送功能的器件视为发送单元,即收发器1003包括接收单元和发送单元。接收单元有时也可 以称为接收机、接收器、或接收电路等。发送单元有时也可以称为发射机、发射器或者发 射电路等。
处理器1001、存储器1002和收发器1003之间通过内部连接通路互相通信,传递控制和/或数据信号
上述本发明实施例揭示的方法可以应用于处理器1001中,或者由处理器1001实现。 处理器1001可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1001中的硬件的集成逻辑电路或者软件形式的指令完成。
本申请各实施例所述的处理器可以是通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可 编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或 者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、 步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器 等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或 者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器 (random access memory,RAM)、闪存、只读存储器(read-only memory,ROM)、可 编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储 介质位于存储器,处理器读取存储器中的指令,结合其硬件完成上述方法的步骤。
可选的,在一些实施例中,存储器1002可以存储用于执行如图6所示方法的指令。处理器1001可以执行存储器1002中存储的指令结合其他硬件(例如收发器1003)完成 如图6所示方法的步骤,具体工作过程和有益效果可以参见图6所示实施例中的描述。
可选的,在一些实施例中,存储器1002可以存储用于执行如图3所示方法的指令。处理器1001可以执行存储器1002中存储的指令结合其他硬件(例如收发器1003)完成 如图3所示方法的步骤,具体工作过程和有益效果可以参见图3所示实施例中的描述。可 以理解的是,这里所称的执行如图3所示的方法是基于图3所示的方法构建候选运动信息 列表。
可选的,在一些实施例中,存储器1002可以存储用于执行如图5所示方法的指令。处理器1001可以执行存储器1002中存储的指令结合其他硬件(例如收发器1003)完成 如图5所示方法的步骤,具体工作过程和有益效果可以参见图5所示实施例中的描述。可 以理解的是,这里所称的执行如图5所示的方法是基于图5所示的方法构建候选运动信息 列表。
本申请实施例还提供一种计算机可读存储介质,其上存储有指令,该指令被执行时执 行上述方法实施例中编码侧的方法。
本申请实施例还提供一种包含指令的计算机程序产品,该指令被执行时执行上述方法 实施例中编码侧的方法。
应理解,示例性的,本申请实施例可以应用于图11至图13所示的视频编解码系统中。
图11为本申请实施例中所描述的一种实例的视频译码系统的框图。如本文所使用,术 语“视频译码器”一般是指视频编码器和视频解码器两者。在本申请中,术语“视频译码”或 “译码”可一般地指代视频编码或视频解码。视频译码系统的视频编码器100和视频解码器 200用于根据本申请提出的多种新的帧间预测模式中的任一种所描述的各种方法实例来预 测当前经译码图像块或其子块的运动信息,例如运动矢量,使得预测出的运动矢量最大程 度上接近使用运动估算方法得到的运动矢量,从而编码时无需传送运动矢量差值,从而进 一步的改善编解码性能。
如图11中所示,视频译码系统包含源装置10和目的地装置20。源装置10产生经编码视 频数据。因此,源装置10可被称为视频编码装置。目的地装置20可对由源装置10所产生的 经编码的视频数据进行解码。因此,目的地装置20可被称为视频解码装置。源装置10、目 的地装置20或两个的各种实施方案可包含一或多个处理器以及耦合到所述一或多个处理 器的存储器。所述存储器可包含但不限于RAM、ROM、EEPROM、快闪存储器或可用于 以可由计算机存取的指令或数据结构的形式存储所要的程序代码的任何其它媒体,如本文 所描述。
源装置10和目的地装置20可以包括各种装置,包含桌上型计算机、移动计算装置、笔 记型(例如,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话等电话手 持机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、车载计算机或其类 似者。
目的地装置20可经由链路30从源装置10接收经编码视频数据。链路30可包括能够将经 编码视频数据从源装置10移动到目的地装置20的一或多个媒体或装置。在一个实例中,链 路30可包括使得源装置10能够实时将经编码视频数据直接发射到目的地装置20的一或多 个通信媒体。在此实例中,源装置10可根据通信标准(例如无线通信协议)来调制经编码 视频数据,且可将经调制的视频数据发射到目的地装置20。所述一或多个通信媒体可包含 无线和/或有线通信媒体,例如射频(radio frequency,RF)频谱或一或多个物理传输线。 所述一或多个通信媒体可形成基于分组的网络的一部分,基于分组的网络例如为局域网、 广域网或全球网络(例如,因特网)。所述一或多个通信媒体可包含路由器、交换器、基站或促进从源装置10到目的地装置20的通信的其它设备。
在另一实例中,可将经编码数据从输出接口140输出到存储装置40。类似地,可通过 输入接口240从存储装置40存取经编码数据。存储装置40可包含多种分布式或本地存取的 数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、数字通用光盘(digital videodisc,DVD)、只读光盘(compact disc read-only memory,CD-ROM)、快闪存储器、易失性或非易失性存储器,或用于存储经编码视频数据的任何其它合适的数字存储媒体。
在另一实例中,存储装置40可对应于文件服务器或可保持由源装置10产生的经编码视 频的另一中间存储装置。目的地装置20可经由流式传输或下载从存储装置40存取所存储的 视频数据。文件服务器可为任何类型的能够存储经编码的视频数据并且将经编码的视频数 据发射到目的地装置20的服务器。实例文件服务器包含网络服务器(例如,用于网站)、 文件传输协议(file transfer protocol,FTP)服务器、网络附接式存储(networkattached storage,NAS)装置或本地磁盘驱动器。目的地装置20可通过任何标准数据连接(包含因 特网连接)来存取经编码视频数据。这可包含无线信道(例如,无线保真(wIreless-fidelity, Wi-Fi)连接)、有线连接(例如,数字用户线路(digital subscriberline,DSL)、电缆调 制解调器等),或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编 码视频数据从存储装置40的传输可为流式传输、下载传输或两者的组合。
本申请的运动矢量预测技术可应用于视频编解码以支持多种多媒体应用,例如空中电 视广播、有线电视发射、卫星电视发射、串流视频发射(例如,经由因特网)、用于存储于数据存储媒体上的视频数据的编码、存储在数据存储媒体上的视频数据的解码,或其它应用。在一些实例中,视频译码系统可用于支持单向或双向视频传输以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。
图11中所说明的视频译码系统仅为实例,并且本申请的技术可适用于未必包含编码装 置与解码装置之间的任何数据通信的视频译码设置(例如,视频编码或视频解码)。在其 它实例中,数据从本地存储器检索、在网络上流式传输等等。视频编码装置可对数据进行 编码并且将数据存储到存储器,和/或视频解码装置可从存储器检索数据并且对数据进行 解码。在许多实例中,由并不彼此通信而是仅编码数据到存储器和/或从存储器检索数据 且解码数据的装置执行编码和解码。
在图11的实例中,源装置10包含视频源120、视频编码器100和输出接口140。在一些 实例中,输出接口140可包含调节器/解调器(调制解调器)和/或发射器。视频源120可包括视频捕获装置(例如,摄像机)、含有先前捕获的视频数据的视频存档、用以从视频内 容提供者接收视频数据的视频馈入接口,和/或用于产生视频数据的计算机图形系统,或 视频数据的此些来源的组合。
视频编码器100可对来自视频源120的视频数据进行编码。在一些实例中,源装置10 经由输出接口140将经编码视频数据直接发射到目的地装置20。在其它实例中,经编码视 频数据还可存储到存储装置40上,供目的地装置20以后存取来用于解码和/或播放。
在图11的实例中,目的地装置20包含输入接口240、视频解码器200和显示装置220。 在一些实例中,输入接口240包含接收器和/或调制解调器。输入接口240可经由链路30和/ 或从存储装置40接收经编码视频数据。显示装置220可与目的地装置20集成或可在目的地 装置20外部。一般来说,显示装置220显示经解码视频数据。显示装置220可包括多种显示 装置,例如,液晶显示器(liquid crystal display,LCD)、等离子显示器、有机发光二极 管(organic light-emitting diode,OLED)显示器或其它类型的显示装置。
尽管图11中未图示,但在一些方面,视频编码器100和视频解码器200可各自与音频编 码器和解码器集成,且可包含适当的多路复用器-多路分用器单元或其它硬件和软件,以 处置共同数据流或单独数据流中的音频和视频两者的编码。在一些实例中,如果适用的话, 那么解复用器(MUX-DEMUX)单元可符合国际电信联盟(internationaltelecommunication union,ITU)H.223多路复用器协议,或例如用户数据报协议(userdatagram protocol, UDP)等其它协议。
视频编码器100和视频解码器200各自可实施为例如以下各项的多种电路中的任一者: 一或多个微处理器、数字信号处理器(digital signal processor,DSP)、专用集成电路 (application-specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammable gate array,FPGA)、离散逻辑、硬件或其任何组合。如果部分地以软件来实施本申请,那么 装置可将用于软件的指令存储在合适的非易失性计算机可读存储媒体中,且可使用一或多 个处理器在硬件中执行所述指令从而实施本申请技术。前述内容(包含硬件、软件、硬件 与软件的组合等)中的任一者可被视为一或多个处理器。视频编码器100和视频解码器200 中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成 为相应装置中的组合编码器/解码器(编码解码器)的一部分。
本申请可大体上将视频编码器100称为将某些信息“发信号通知”或“发射”到例如视频 解码器200的另一装置。术语“发信号通知”或“发射”可大体上指代用以对经压缩视频数据 进行解码的语法元素和/或其它数据的传送。此传送可实时或几乎实时地发生。替代地, 此通信可经过一段时间后发生,例如可在编码时在经编码码流中将语法元素存储到计算机 可读存储媒体时发生,解码装置接着可在所述语法元素存储到此媒体之后的任何时间检索 所述语法元素。
JCT-VC开发了H.265高效率视频编码(high efficiency video coding,HEVC)标准。
HEVC标准化基于称作HEVC测试模型(HEVC model,HM)的视频解码装置的演进模型。 H.265的最新标准文档可从http://www.itu.int/rec/T-REC-H.265获得,最新版本的标准文档为 H.265(12/16),该标准文档以全文引用的方式并入本文中。HM假设视频解码装置相 对于ITU-TH.264/AVC的现有算法具有若干额外能力。例如,H.264提供9种帧内预测编码 模式,而HM可提供多达35种帧内预测编码模式。
JVET致力于开发H.266标准。H.266标准化的过程基于称作H.266测试模型的视频解码 装置的演进模型。H.266的算法描述可从http://phenix.int-evry.fr/jvet获得,其中最新的算法 描述包含于JVET-F1001-v2中,该算法描述文档以全文引用的方式并入本文中。同时,可 从https://jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/获得JEM测试模型的参考软件,同 样以全文引用的方式并入本文中。
一般来说,HM的工作模型描述可将视频帧或图像划分成包含亮度及色度样本两者的 树块或最大编码单元(largest coding unit,LCU)的序列,LCU也被称为编码树单元(coding tree unit,CTU)。树块具有与H.264标准的宏块类似的目的。条带包含按解码次序的数个 连续树块。可将视频帧或图像分割成一个或多个条带。可根据四叉树将每一树块分裂成编 码单元。例如,可将作为四叉树的根节点的树块分裂成四个子节点,且每一子节点可又为 母节点且被分裂成另外四个子节点。作为四叉树的叶节点的最终不可分裂的子节点包括解 码节点,例如,经解码视频块。与经解码码流相关联的语法数据可定义树块可分裂的最大 次数,且也可定义解码节点的最小大小。
编码单元包含解码节点及预测块(prediction unit,PU)以及与解码节点相关联的变换 单元(transform unit,TU)。CU的大小对应于解码节点的大小且形状必须为正方形。CU 的大小的范围可为8×8像素直到最大64×64像素或更大的树块的大小。每一CU可含有一个 或多个PU及一个或多个TU。例如,与CU相关联的语法数据可描述将CU分割成一个或多 个PU的情形。分割模式在CU是被跳过或经直接模式编码、帧内预测模式编码或帧间预测模式编码的情形之间可为不同的。PU可经分割成形状为非正方形。例如,与CU相关联的 语法数据也可描述根据四叉树将CU分割成一个或多个TU的情形。TU的形状可为正方形或 非正方形。
HEVC标准允许根据TU进行变换,TU对于不同CU来说可为不同的。TU通常基于针对经分割LCU定义的给定CU内的PU的大小而设定大小,但情况可能并非总是如此。TU的大 小通常与PU相同或小于PU。在一些可行的实施方式中,可使用称作“残余四叉树”(residualqualtree,RQT)的四叉树结构将对应于CU的残余样本再分成较小单元。RQT的叶节点可 被称作TU。可变换与TU相关联的像素差值以产生变换系数,变换系数可被量化。
一般来说,PU包含与预测过程有关的数据。例如,在PU经帧内模式编码时,PU可包含描述PU的帧内预测模式的数据。作为另一可行的实施方式,在PU经帧间模式编码时, PU可包含界定PU的运动矢量的数据。例如,界定PU的运动矢量的数据可描述运动矢量的 水平分量、运动矢量的垂直分量、运动矢量的分辨率(例如,四分之一像素精确度或八分 之一像素精确度)、运动矢量所指向的参考图像,和/或运动矢量的参考图像列表(例如, 列表0、列表1或列表C)。
一般来说,TU使用变换及量化过程。具有一个或多个PU的给定CU也可包含一个或多 个TU。在预测之后,视频编码器100可计算对应于PU的残余值。残余值包括像素差值,像素差值可变换成变换系数、经量化且使用TU扫描以产生串行化变换系数以用于熵解码。 本申请通常使用术语“视频块”来指CU的解码节点。在一些特定应用中,本申请也可使用 术语“视频块”来指包含解码节点以及PU及TU的树块,例如,LCU或CU。
视频序列通常包含一系列视频帧或图像。图像群组(group of picture,GOP)示例性地 包括一系列、一个或多个视频图像。GOP可在GOP的头信息中、图像中的一者或多者的头 信息中或在别处包含语法数据,语法数据描述包含于GOP中的图像的数目。图像的每一条 带可包含描述相应图像的编码模式的条带语法数据。视频编码器100通常对个别视频条带 内的视频块进行操作以便编码视频数据。视频块可对应于CU内的解码节点。视频块可具有固定或变化的大小,且可根据指定解码标准而在大小上不同。
作为一种可行的实施方式,HM支持各种PU大小的预测。假定特定CU的大小为 2N×2N,HM支持2N×2N或N×N的PU大小的帧内预测,及2N×2N、2N×N、N×2N或N×N的 对称PU大小的帧间预测。HM也支持2N×nU、2N×nD、nL×2N及nR×2N的PU大小的帧间预 测的不对称分割。在不对称分割中,CU的一方向未分割,而另一方向分割成25%及75%。 对应于25%区段的CU的部分由“n”后跟着“上(Up)”、“下(Down)”、“左(Left)”或“右 (Right)”的指示来指示。因此,例如,“2N×nU”指水平分割的2N×2NCU,其中2N×0.5NPU 在上部且2N×1.5NPU在底部。
在本申请中,“N×N”与“N乘N”可互换使用以指依照垂直维度及水平维度的视频块的像 素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块将在垂直方向上具有16个像 素(y=16),且在水平方向上具有16个像素(x=16)。同样地,N×N块一股在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。可将块中的像素 排列成行及列。此外,块未必需要在水平方向上与在垂直方向上具有相同数目个像素。例 如,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性解码之后,视频编码器100可计算CU的TU 的残余数据。PU可包括空间域(也称作像素域)中的像素数据,且TU可包括在将变换(例如,离散余弦变换(discrete cosine transform,DCT)、整数变换、小波变换或概念上类似的变换)应用于残余视频数据之后变换域中的系数。残余数据可对应于未经编码图像的像素与对应于PU的预测值之间的像素差。视频编码器100可形成包含CU的残余数据的TU, 且接着变换TU以产生CU的变换系数。
在任何变换以产生变换系数之后,视频编码器100可执行变换系数的量化。量化示例 性地指对系数进行量化以可能减少用以表示系数的数据的量从而提供进一步压缩的过程。 量化过程可减少与系数中的一些或全部相关联的位深度。例如,可在量化期间将n位值降 值舍位到m位值,其中n大于m。
JEM模型对视频图像的编码结构进行了进一步的改进,具体的,被称为“四叉树结合 二叉树”(QTBT)的块编码结构被引入进来。QTBT结构摒弃了HEVC中的CU,PU,TU 等概念,支持更灵活的CU划分形状,一个CU可以正方形,也可以是长方形。一个CTU首 先进行四叉树划分,该四叉树的叶节点进一步进行二叉树划分。同时,在二叉树划分中存 在两种划分模式,对称水平分割和对称竖直分割。二叉树的叶节点被称为CU,JEM的CU 在预测和变换的过程中都不可以被进一步划分,也就是说JEM的CU,PU,TU具有相同的 块大小。在现阶段的JEM中,CTU的最大尺寸为256×256亮度像素。
在一些可行的实施方式中,视频编码器100可利用预定义扫描次序来扫描经量化变换 系数以产生可经熵编码的串行化向量。在其它可行的实施方式中,视频编码器100可执行 自适应性扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器100可根据上下 文自适应性可变长度解码(context-based adaptive variable-length code,CAVLC)、上下文 自适应性二进制算术解码(context-based adaptive binary arithmeticcoding,CABAC)、基 于语法的上下文自适应性二进制算术解码(syntax-based adaptivebinary arithmetic coding, SBAC)、概率区间分割熵(probability intervalpartitioning entropy,PIPE)解码或其他熵 解码方法来熵解码一维向量。视频编码器100也可熵编码与经编码视频数据相关联的语法 元素以供视频解码器200用于解码视频数据。
为了执行CABAC,视频编码器100可将上下文模型内的上下文指派给待传输的符号。 上下文可与符号的相邻值是否为非零有关。为了执行CAVLC,视频编码器100可选择待传 输的符号的可变长度码。可变长度解码(variable-length code,VLC)中的码字可经构建以 使得相对较短码对应于可能性较大的符号,而较长码对应于可能性较小的符号。以这个方 式,VLC的使用可相对于针对待传输的每一符号使用相等长度码字达成节省码率的目的。 基于指派给符号的上下文可以确定CABAC中的概率。
在本申请实施例中,视频编码器可执行帧间预测以减少图像之间的时间冗余。如前文 所描述,根据不同视频压缩编解码标准的规定,CU可具有一个或多个预测单元PU。换句 话说,多个PU可属于CU,或者PU和CU的尺寸相同。在本文中当CU和PU尺寸相同时,CU 的分割模式为不分割,或者即为分割为一个PU,且统一使用PU进行表述。当视频编码器 执行帧间预测时,视频编码器可用信号通知视频解码器用于PU的运动信息。示例性的, PU的运动信息可以包括:参考图像索引、运动矢量和预测方向标识。运动矢量可指示PU 的图像块(也称视频块、像素块、像素集合等)与PU的参考块之间的位移。PU的参考块 可为类似于PU的图像块的参考图像的一部分。参考块可定位于由参考图像索引和预测方 向标识指示的参考图像中。
为了减少表示PU的运动信息所需要的编码比特的数目,视频编码器可根据合并预测 模式或高级运动矢量预测模式过程产生用于PU中的每一者的候选预测运动矢量(Motion Vector,MV)列表。用于PU的候选预测运动矢量列表中的每一候选预测运动矢量可指示 运动信息。由候选预测运动矢量列表中的一些候选预测运动矢量指示的运动信息可基于其 它PU的运动信息。如果候选预测运动矢量指示指定空间候选预测运动矢量位置或时间候 选预测运动矢量位置中的一者的运动信息,则本申请可将所述候选预测运动矢量称作“原 始”候选预测运动矢量。举例来说,对于合并模式,在本文中也称为合并预测模式,可存 在五个原始空间候选预测运动矢量位置和一个原始时间候选预测运动矢量位置。在一些实 例中,视频编码器可通过组合来自不同原始候选预测运动矢量的部分运动矢量、修改原始 候选预测运动矢量或仅插入零运动矢量作为候选预测运动矢量来产生额外候选预测运动 矢量。这些额外候选预测运动矢量不被视为原始候选预测运动矢量且在本申请中可称作人 工产生的候选预测运动矢量。
本申请的技术一般涉及用于在视频编码器处产生候选预测运动矢量列表的技术和用 于在视频解码器处产生相同候选预测运动矢量列表的技术。视频编码器和视频解码器可通 过实施用于构建候选预测运动矢量列表的相同技术来产生相同候选预测运动矢量列表。举 例来说,视频编码器和视频解码器两者可构建具有相同数目的候选预测运动矢量(例如, 五个候选预测运动矢量)的列表。视频编码器和解码器可首先考虑空间候选预测运动矢量 (例如,同一图像中的相邻块),接着考虑时间候选预测运动矢量(例如,不同图像中的 候选预测运动矢量),且最后可考虑人工产生的候选预测运动矢量直到将所要数目的候选 预测运动矢量添加到列表为止。根据本申请的技术,可在候选预测运动矢量列表构建期间 针对某些类型的候选预测运动矢量利用修剪操作以便从候选预测运动矢量列表移除重复, 而对于其它类型的候选预测运动矢量,可能不使用修剪以便减小解码器复杂性。举例来说, 对于空间候选预测运动矢量集合和对于时间候选预测运动矢量,可执行修剪操作以从候选 预测运动矢量的列表排除具有重复运动信息的候选预测运动矢量。然而,当将人工产生的 候选预测运动矢量添加到候选预测运动矢量的列表时,可在不对人工产生的候选预测运动 矢量执行修剪操作的情况下添加人工产生的候选预测运动矢量。
在产生用于CU的PU的候选预测运动矢量列表之后,视频编码器可从候选预测运动矢 量列表选择候选预测运动矢量且在码流中输出候选预测运动矢量索引。选定候选预测运动 矢量可为具有产生最紧密地匹配正被解码的目标PU的预测子的运动矢量的候选预测运动 矢量。候选预测运动矢量索引可指示在候选预测运动矢量列表中选定候选预测运动矢量的 位置。视频编码器还可基于由PU的运动信息指示的参考块产生用于PU的预测性图像块。 可基于由选定候选预测运动矢量指示的运动信息确定PU的运动信息。举例来说,在合并 模式中,PU的运动信息可与由选定候选预测运动矢量指示的运动信息相同。在AMVP模式 中,PU的运动信息可基于PU的运动矢量差和由选定候选预测运动矢量指示的运动信息确 定。视频编码器可基于CU的PU的预测性图像块和用于CU的原始图像块产生用于CU的一或多个残余图像块。视频编码器可接着编码一或多个残余图像块且在码流中输出一或多个残余图像块。
码流可包括识别PU的候选预测运动矢量列表中的选定候选预测运动矢量的数据。视 频解码器可基于由PU的候选预测运动矢量列表中的选定候选预测运动矢量指示的运动信 息确定PU的运动信息。视频解码器可基于PU的运动信息识别用于PU的一或多个参考块。在识别PU的一或多个参考块之后,视频解码器可基于PU的一或多个参考块产生用于PU的预测性图像块。视频解码器可基于用于CU的PU的预测性图像块和用于CU的一或多个残余图像块来重构用于CU的图像块。
为了易于解释,本申请可将位置或图像块描述为与CU或PU具有各种空间关系。此描 述可解释为是指位置或图像块和与CU或PU相关联的图像块具有各种空间关系。此外,本申请可将视频解码器当前在解码的PU称作当前PU,也称为当前待处理图像块。本申请可 将视频解码器当前在解码的CU称作当前CU。本申请可将视频解码器当前在解码的图像称 作当前图像。应理解,本申请同时适用于PU和CU具有相同尺寸,或者PU即为CU的情况, 统一使用PU来表示。
如前文简短地描述,视频编码器100可使用帧间预测以产生用于CU的PU的预测性图像 块和运动信息。在许多例子中,给定PU的运动信息可能与一或多个附近PU(即,其图像块在空间上或时间上在给定PU的图像块附近的PU)的运动信息相同或类似。因为附近PU 经常具有类似运动信息,所以视频编码器100可参考附近PU的运动信息来编码给定PU的运 动信息。参考附近PU的运动信息来编码给定PU的运动信息可减少码流中指示给定PU的运 动信息所需要的编码比特的数目。
视频编码器100可以各种方式参考附近PU的运动信息来编码给定PU的运动信息。举例 来说,视频编码器100可指示给定PU的运动信息与附近PU的运动信息相同。本申请可使用 合并模式来指代指示给定PU的运动信息与附近PU的运动信息相同或可从附近PU的运动 信息导出。在另一可行的实施方式中,视频编码器100可计算用于给定PU的运动矢量差(Motion Vector Difference,MVD)。MVD指示给定PU的运动矢量与附近PU的运动矢量 之间的差。视频编码器100可将MVD而非给定PU的运动矢量包括于给定PU的运动信息中。 在码流中表示MVD比表示给定PU的运动矢量所需要的编码比特少。本申请可使用高级运 动矢量预测模式指代通过使用MVD和识别候选者运动矢量的索引值来用信号通知解码端 给定PU的运动信息。
为了使用合并模式或AMVP模式来用信号通知解码端给定PU的运动信息,视频编码器 100可产生用于给定PU的候选预测运动矢量列表。候选预测运动矢量列表可包括一或多个 候选预测运动矢量。用于给定PU的候选预测运动矢量列表中的候选预测运动矢量中的每 一者可指定运动信息。由每一候选预测运动矢量指示的运动信息可包括运动矢量、参考图 像索引和预测方向标识。候选预测运动矢量列表中的候选预测运动矢量可包括“原始”候选 预测运动矢量,其中每一者指示不同于给定PU的PU内的指定候选预测运动矢量位置中的 一者的运动信息。
在产生用于PU的候选预测运动矢量列表之后,视频编码器100可从用于PU的候选预测 运动矢量列表选择候选预测运动矢量中的一者。举例来说,视频编码器可比较每一候选预 测运动矢量与正被解码的PU且可选择具有所要码率-失真代价的候选预测运动矢量。视频 编码器100可输出用于PU的候选预测运动矢量索引。候选预测运动矢量索引可识别选定候 选预测运动矢量在候选预测运动矢量列表中的位置。
此外,视频编码器100可基于由PU的运动信息指示的参考块产生用于PU的预测性图像 块。可基于由用于PU的候选预测运动矢量列表中的选定候选预测运动矢量指示的运动信 息确定PU的运动信息。举例来说,在合并模式中,PU的运动信息可与由选定候选预测运 动矢量指示的运动信息相同。在AMVP模式中,可基于用于PU的运动矢量差和由选定候选预测运动矢量指示的运动信息确定PU的运动信息。视频编码器100可如前文所描述处理用于PU的预测性图像块。
当视频解码器200接收到码流时,视频解码器200可产生用于CU的PU中的每一者的候 选预测运动矢量列表。由视频解码器200针对PU产生的候选预测运动矢量列表可与由视频 编码器100针对PU产生的候选预测运动矢量列表相同。从码流中解析得到的语法元素可指 示在PU的候选预测运动矢量列表中选定候选预测运动矢量的位置。在产生用于PU的候选 预测运动矢量列表之后,视频解码器200可基于由PU的运动信息指示的一或多个参考块产 生用于PU的预测性图像块。视频解码器200可基于由用于PU的候选预测运动矢量列表中的 选定候选预测运动矢量指示的运动信息确定PU的运动信息。视频解码器200可基于用于PU 的预测性图像块和用于CU的残余图像块重构用于CU的图像块。
应理解,在一种可行的实施方式中,在解码端,候选预测运动矢量列表的构建与从码 流中解析选定候选预测运动矢量在候选预测运动矢量列表中的位置是相互独立,可以任意 先后或者并行进行的。
在另一种可行的实施方式中,在解码端,首先从码流中解析选定候选预测运动矢量在 候选预测运动矢量列表中的位置,根据解析出来的位置构建候选预测运动矢量列表,在该 实施方式中,不需要构建全部的候选预测运动矢量列表,只需要构建到该解析出来的位置 处的候选预测运动矢量列表,即能够确定该位置出的候选预测运动矢量即可。举例来说, 当解析码流得出选定的候选预测运动矢量为候选预测运动矢量列表中索引为3的候选预测 运动矢量时,仅需要构建从索引为0到索引为3的候选预测运动矢量列表,即可确定索引为 3的候选预测运动矢量,可以达到减小复杂度,提高解码效率的技术效果。
图12为本申请实施例中所描述的一种实例的视频编码器100的框图。视频编码器100 用于将视频输出到后处理实体41。后处理实体41表示可处理来自视频编码器100的经编码 视频数据的视频实体的实例,例如媒体感知网络元件(MANE)或拼接/编辑装置。在一些 情况下,后处理实体41可为网络实体的实例。在一些视频编码系统中,后处理实体41和视 频编码器100可为单独装置的若干部分,而在其它情况下,相对于后处理实体41所描述的 功能性可由包括视频编码器100的相同装置执行。在某一实例中,后处理实体41是图11的 存储装置40的实例。
在图12的实例中,视频编码器100包括预测处理单元108、滤波器单元106、经解码图 像缓冲器(decoded picture buffer,DPB)107、求和器112、变换器101、量化器102和熵编 码器103。预测处理单元108包括帧间预测器110和帧内预测器109。为了图像块重构,视频 编码器100还包含反量化器104、反变换器105和求和器111。滤波器单元106既定表示一或 多个环路滤波器,例如去块滤波器、自适应环路滤波器(adaptive loop filter,ALF)和样 本自适应偏移(sample adaptive offset,SAO)滤波器。尽管在图12中将滤波器单元106示出为环路内滤波器,但在其它实现方式下,可将滤波器单元106实施为环路后滤波器。 在一种示例下,视频编码器100还可以包括视频数据存储器、分割单元(图中未示意)。
视频数据存储器可存储待由视频编码器100的组件编码的视频数据。可从视频源120 获得存储在视频数据存储器中的视频数据。DPB 107可为参考图像存储器,其存储用于由 视频编码器100在帧内、帧间译码模式中对视频数据进行编码的参考视频数据。视频数据 存储器和DPB 107可由多种存储器装置中的任一者形成,例如包含同步动态随机存储器(synchronous dynamic random access memory,SDRAM)的动态随机存取存储器(dynamicrandom access memory,DRAM)、磁阻式RAM(magnetic random access memory,MRAM)、 电阻式RAM(resistive random access memory,RRAM),或其它类型的存储器装置。视 频数据存储器和DPB 107可由同一存储器装置或单独存储器装置提供。在各种实例中,视 频数据存储器可与视频编码器100的其它组件一起在芯片上,或相对于那些组件在芯片外。
如图12所示,视频编码器100接收视频数据,并将所述视频数据存储在视频数据存储 器中。分割单元将所述视频数据分割成若干图像块,而且这些图像块可以被进一步分割为 更小的块,例如基于四叉树结构或者二叉树结构的图像块分割。此分割还可包含分割成条 带(slice)、片(tile)或其它较大单元。视频编码器100通常说明编码待编码的视频条带内的图像块的组件。所述条带可分成多个图像块(并且可能分成被称作片的图像块集合)。预测处理单元108可选择用于当前图像块的多个可能的译码模式中的一者,例如多个帧内译码模式中的一者或多个帧间译码模式中的一者。预测处理单元108可将所得经帧内、帧间译码的块提供给求和器112以产生残差块,且提供给求和器111以重构用作参考图像的经编码块。
预测处理单元108内的帧内预测器109可相对于与待编码当前块在相同帧或条带中的 一或多个相邻块执行当前图像块的帧内预测性编码,以去除空间冗余。预测处理单元108 内的帧间预测器110可相对于一或多个参考图像中的一或多个预测块执行当前图像块的帧 间预测性编码以去除时间冗余。
具体的,帧间预测器110可用于确定用于编码当前图像块的帧间预测模式。举例来说, 帧间预测器110可使用码率-失真分析来计算候选帧间预测模式集合中的各种帧间预测模 式的码率-失真值,并从中选择具有最佳码率-失真特性的帧间预测模式。码率失真分析通 常确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差) 的量,以及用于产生经编码块的位码率(也就是说,位数目)。例如,帧间预测器110可确定候选帧间预测模式集合中编码所述当前图像块的码率失真代价最小的帧间预测模式为用于对当前图像块进行帧间预测的帧间预测模式。
帧间预测器110用于基于确定的帧间预测模式,预测当前图像块中一个或多个子块的 运动信息(例如运动矢量),并利用当前图像块中一个或多个子块的运动信息(例如运动 矢量)获取或产生当前图像块的预测块。帧间预测器110可在参考图像列表中的一者中定 位所述运动向量指向的预测块。帧间预测器110还可产生与图像块和视频条带相关联的语 法元素以供视频解码器200在对视频条带的图像块解码时使用。又或者,一种示例下,帧间预测器110利用每个子块的运动信息执行运动补偿过程,以生成每个子块的预测块,从而得到当前图像块的预测块;应当理解的是,这里的帧间预测器110执行运动估计和运动补偿过程。
具体的,在为当前图像块选择帧间预测模式之后,帧间预测器110可将指示当前图像 块的所选帧间预测模式的信息提供到熵编码器103,以便于熵编码器103编码指示所选帧间 预测模式的信息。
帧内预测器109可对当前图像块执行帧内预测。明确地说,帧内预测器109可确定用来 编码当前块的帧内预测模式。举例来说,帧内预测器109可使用码率-失真分析来计算各种 待测试的帧内预测模式的码率-失真值,并从待测试模式当中选择具有最佳码率-失真特性 的帧内预测模式。在任何情况下,在为图像块选择帧内预测模式之后,帧内预测器109可 将指示当前图像块的所选帧内预测模式的信息提供到熵编码器103,以便熵编码器103编码 指示所选帧内预测模式的信息。
在预测处理单元108经由帧间预测、帧内预测产生当前图像块的预测块之后,视频编 码器100通过从待编码的当前图像块减去所述预测块来形成残差图像块。求和器112表示执 行此减法运算的一或多个组件。所述残差块中的残差视频数据可包含在一或多个TU中, 并应用于变换器101。变换器101使用例如离散余弦变换(DCT)或概念上类似的变换等变 换将残差视频数据变换成残差变换系数。变换器101可将残差视频数据从像素值域转换到 变换域,例如频域。
变换器101可将所得变换系数发送到量化器102。量化器102量化所述变换系数以进一 步减小位码率。在一些实例中,量化器102可接着执行对包含经量化的变换系数的矩阵的 扫描。或者,熵编码器103可执行扫描。
在量化之后,熵编码器103对经量化变换系数进行熵编码。举例来说,熵编码器103可执行上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)、 基于语法的上下文自适应二进制算术编码(SBAC)、概率区间分割熵(PIPE)编码或另 一熵编码方法或技术。在由熵编码器103熵编码之后,可将经编码码流发射到视频解码器 200,或经存档以供稍后发射或由视频解码器200检索。熵编码器103还可对待编码的当前 图像块的语法元素进行熵编码。
反量化器104和反变化器105分别应用逆量化和逆变换以在像素域中重构所述残差块, 例如以供稍后用作参考图像的参考块。求和器111将经重构的残差块添加到由帧间预测器 110或帧内预测器109产生的预测块,以产生经重构图像块。滤波器单元106可以适用于经 重构图像块以减小失真,诸如方块效应(block artifacts)。然后,该经重构图像块作为参 考块存储在经解码图像缓冲器107中,可由帧间预测器110用作参考块以对后续视频帧或图 像中的块进行帧间预测。
应当理解的是,视频编码器100的其它的结构变化可用于编码视频流。例如,对于某 些图像块或者图像帧,视频编码器100可以直接地量化残差信号而不需要经变换器101处 理,相应地也不需要经反变换器105处理;或者,对于某些图像块或者图像帧,视频编码器100没有产生残差数据,相应地不需要经变换器101、量化器102、反量化器104和反变换器105处理;或者,视频编码器100可以将经重构图像块作为参考块直接地进行存储而不需要经滤波器单元106处理;或者,视频编码器100中量化器102和反量化器104可以合并在一起。
图13为本申请实施例中所描述的一种实例的视频解码器200的框图。在图13的实例中, 视频解码器200包括熵解码器203、预测处理单元208、反量化器204、反变换器205、求和 器211、滤波器单元206以及DPB 207。预测处理单元208可以包括帧间预测器210和帧内预 测器209。在一些实例中,视频解码器200可执行大体上与相对于来自图12的视频编码器100 描述的编码过程互逆的解码过程。
在解码过程中,视频解码器200从视频编码器100接收表示经编码视频条带的图像块和 相关联的语法元素的经编码视频码流。视频解码器200可从网络实体42接收视频数据,可 选的,还可以将所述视频数据存储在视频数据存储器(图中未示意)中。视频数据存储器 可存储待由视频解码器200的组件解码的视频数据,例如经编码视频码流。存储在视频数 据存储器中的视频数据,例如可从存储装置40、从相机等本地视频源、经由视频数据的有 线或无线网络通信或者通过存取物理数据存储媒体而获得。视频数据存储器可作为用于存 储来自经编码视频码流的经编码视频数据的经解码图像缓冲器(CPB)。因此,尽管在图 13中没有示意出视频数据存储器,但视频数据存储器和DPB 207可以是同一个的存储器, 也可以是单独设置的存储器。视频数据存储器和DPB 207可由多种存储器装置中的任一者 形成,例如:包含同步DRAM(SDRAM)的动态随机存取存储器(DRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM),或其它类型的存储器装置。在各种实例中,视频 数据存储器可与视频解码器200的其它组件一起集成在芯片上,或相对于那些组件设置在 芯片外。
网络实体42可例如为服务器、MANE、视频编辑器/剪接器,或用于实施上文所描述的 技术中的一或多者的其它此装置。网络实体42可包括或可不包括视频编码器,例如视频编 码器100。在网络实体42将经编码视频码流发送到视频解码器200之前,网络实体42可实施 本申请中描述的技术中的部分。在一些视频解码系统中,网络实体42和视频解码器200可 为单独装置的部分,而在其它情况下,相对于网络实体42描述的功能性可由包括视频解码 器200的相同装置执行。在一些情况下,网络实体42可为图11的存储装置40的实例。
视频解码器200的熵解码器203对码流进行熵解码以产生经量化的系数和一些语法元 素。熵解码器203将语法元素转发到预测处理单元208。视频解码器200可接收在视频条带 层级和/或图像块层级处的语法元素。
当视频条带被解码为经帧内解码(I)条带时,预测处理单元208的帧内预测器209可 基于发信号通知的帧内预测模式和来自当前帧或图像的先前经解码块的数据而产生当前 视频条带的图像块的预测块。当视频条带被解码为经帧间解码(即,B或P)条带时,预测处理单元208的帧间预测器210可基于从熵解码器203接收到的语法元素,确定用于对当前视频条带的当前图像块进行解码的帧间预测模式,基于确定的帧间预测模式,对所述当前图像块进行解码(例如执行帧间预测)。具体的,帧间预测器210可确定是否对当前视频 条带的当前图像块采用新的帧间预测模式进行预测,如果语法元素指示采用新的帧间预测模式来对当前图像块进行预测,基于新的帧间预测模式(例如通过语法元素指定的一种新的帧间预测模式或默认的一种新的帧间预测模式)预测当前视频条带的当前图像块或当前图像块的子块的运动信息,从而通过运动补偿过程使用预测出的当前图像块或当前图像块的子块的运动信息来获取或生成当前图像块或当前图像块的子块的预测块。这里的运动信息可以包括参考图像信息和运动矢量,其中参考图像信息可以包括但不限于单向/双向预测信息,参考图像列表号和参考图像列表对应的参考图像索引。对于帧间预测,可从参考图像列表中的一者内的参考图像中的一者产生预测块。视频解码器200可基于存储在DPB207中的参考图像来建构参考图像列表,即列表0和列表1。当前图像的参考帧索引可包含于参考帧列表0和列表1中的一或多者中。在一些实例中,可以是视频编码器100发信号通知指示是否采用新的帧间预测模式来解码特定块的特定语法元素,或者,也可以是发信号通知指示是否采用新的帧间预测模式,以及指示具体采用哪一种新的帧间预测模式来解码特定块的特定语法元素。应当理解的是,这里的帧间预测器210执行运动补偿过程。
反量化器204将在码流中提供且由熵解码器203解码的经量化变换系数逆量化,即去量 化。逆量化过程可包括:使用由视频编码器100针对视频条带中的每个图像块计算的量化 参数来确定应施加的量化程度以及同样地确定应施加的逆量化程度。反变换器205将逆变 换应用于变换系数,例如逆DCT、逆整数变换或概念上类似的逆变换过程,以便产生像素 域中的残差块。
在帧间预测器210产生用于当前图像块或当前图像块的子块的预测块之后,视频解码 器200通过将来自反变换器205的残差块与由帧间预测器210产生的对应预测块求和以得到 重建的块,即经解码图像块。求和器211表示执行此求和操作的组件。在需要时,还可使 用环路滤波器(在解码环路中或在解码环路之后)来使像素转变平滑或者以其它方式改进 视频质量。滤波器单元206可以表示一或多个环路滤波器,例如去块滤波器、自适应环路 滤波器(ALF)以及样本自适应偏移(SAO)滤波器。尽管在图13中将滤波器单元206示 出为环路内滤波器,但在其它实现方式中,可将滤波器单元206实施为环路后滤波器。在 一种示例下,滤波器单元206适用于重建块以减小块失真,并且该结果作为经解码视频流 输出。并且,还可以将给定帧或图像中的经解码图像块存储在DPB 207中,经DPB 207存 储用于后续运动补偿的参考图像。经DPB 207可为存储器的一部分,其还可以存储经解码 视频,以供稍后在显示装置(例如图11的显示装置220)上呈现,或可与此类存储器分 开。
应当理解的是,视频解码器200的其它结构变化可用于解码经编码视频码流。例如, 视频解码器200可以不经滤波器单元206处理而生成输出视频流;或者,对于某些图像块或 者图像帧,视频解码器200的熵解码器203没有解码出经量化的系数,相应地不需要经反量 化器204和反变换器205处理。
如前文所注明,本申请的技术示例性地涉及帧间解码。应理解,本申请的技术可通过 本申请中所描述的视频解码器中的任一者进行,视频解码器包含(例如)如关于图11到3所展示及描述的视频编码器100及视频解码器200。即,在一种可行的实施方式中,关于图12所描述的帧间预测器110可在视频数据的块的编码期间在执行帧间预测时执行下文中所描述的特定技术。在另一可行的实施方式中,关于图13所描述的帧间预测器210可在视频数据的块的解码期间在执行帧间预测时执行下文中所描述的特定技术。因此,对一般性“视频编码器”或“视频解码器”的引用可包含视频编码器100、视频解码器200或另一视频编码或编码单元。
应当理解的是,本申请的编码器100和解码器200中,针对某个环节的处理结果可以 经过进一步处理后,输出到下一个环节,例如,在插值滤波、运动矢量推导或环路滤波等环节之后,对相应环节的处理结果进一步进行Clip或移位shift等操作。
例如,对运动矢量的取值范围进行约束,使其在一定的位宽内。假设允许的运动矢量 的位宽为bitDepth,则运动矢量的范围为-2^(bitDepth-1)~2^(bitDepth-1)-1,其中“^”符 号表示幂次方。如bitDepth为16,则取值范围为-32768~32767。如bitDepth为18,则取 值范围为-131072~131071。可以通过以下两种方式进行约束:
方式1,将运动矢量溢出的高位去除:
ux=(vx+2bitDepth)%2bitDepth
vx=(ux>=2bitDepth-1)?(ux-2bitDepth):ux
uy=(vy+2bitDepth)%2bitDepth
vy=(uy>=2bitDepth-1)?(uy-2bitDepth):uy
例如vx的值为-32769,通过以上公式得到的为32767。因为在计算机中,数值是以二 进制的补码形式存储的,-32769的二进制补码为1,0111,1111,1111,1111(17位),计算机 对于溢出的处理为丢弃高位,则vx的值为0111,1111,1111,1111,则为32767,与通过公式处理得到的结果一致。
方法2,将运动矢量进行Clipping,如以下公式所示:
vx=Clip3(-2bitDepth-1,2bitDepth-1-1,vx)
vy=Clip3(-2bitDepth-1,2bitDepth-1-1,vy)
其中Clip3的定义为,表示将z的值钳位到区间[x,y]之间:
Figure BDA0001890189120000351
帧间预测模块121,示例性的,可以包括运动估计单元和运动补偿单元。在不同的视 频压缩编解码标准中,PU和CU的关系各有不同。帧间预测模块121可根据多个分割模式将 当前CU分割为PU。举例来说,帧间预测模块121可根据2N×2N、2N×N、N×2N和N×N分割模式将当前CU分割为PU。在其他实施例中,当前CU即为当前PU,不作限定。
帧间预测模块121可对PU中的每一者执行整数运动估计(Integer MotionEstimation, IME)且接着执行分数运动估计(Fraction Motion Estimation,FME)。当帧间预测模块121 对PU执行IME时,帧间预测模块121可在一个或多个参考图像中搜索用于PU的参考块。在 找到用于PU的参考块之后,帧间预测模块121可产生以整数精度指示PU与用于PU的参考 块之间的空间位移的运动矢量。当帧间预测模块121对PU执行FME时,帧间预测模块121 可改进通过对PU执行IME而产生的运动矢量。通过对PU执行FME而产生的运动矢量可具 有子整数精度(例如,1/2像素精度、1/4像素精度等)。在产生用于PU的运动矢量之后,帧间预测模块121可使用用于PU的运动矢量以产生用于PU的预测性图像块。
在帧间预测模块121使用AMVP模式用信号通知解码端PU的运动信息的一些可行的实 施方式中,帧间预测模块121可产生用于PU的候选预测运动矢量列表。候选预测运动矢量 列表可包括一个或多个原始候选预测运动矢量和从原始候选预测运动矢量导出的一个或 多个额外候选预测运动矢量。在产生用于PU的候选预测运动矢量列表之后,帧间预测模块121可从候选预测运动矢量列表选择候选预测运动矢量且产生用于PU的运动矢量差(MVD)。用于PU的MVD可指示由选定候选预测运动矢量指示的运动矢量与使用IME和 FME针对PU产生的运动矢量之间的差。在这些可行的实施方式中,帧间预测模块121可输 出识别选定候选预测运动矢量在候选预测运动矢量列表中的位置的候选预测运动矢量索 引。帧间预测模块121还可输出PU的MVD。
除了通过对PU执行IME和FME来产生用于PU的运动信息外,帧间预测模块121还可对 PU中的每一者执行合并(Merge)操作。当帧间预测模块121对PU执行合并操作时,帧间预测模块121可产生用于PU的候选预测运动矢量列表。用于PU的候选预测运动矢量列表可包括一个或多个原始候选预测运动矢量和从原始候选预测运动矢量导出的一个或多个额外候选预测运动矢量。候选预测运动矢量列表中的原始候选预测运动矢量可包括一个或多个空间候选预测运动矢量和时间候选预测运动矢量。空间候选预测运动矢量可指示当前图像中的其它PU的运动信息。时间候选预测运动矢量可基于不同于当前图像的对应的PU的运动信息。时间候选预测运动矢量还可称作时间运动矢量预测(TMVP)。
在产生候选预测运动矢量列表之后,帧间预测模块121可从候选预测运动矢量列表选 择候选预测运动矢量中的一个。帧间预测模块121可接着基于由PU的运动信息指示的参考 块产生用于PU的预测性图像块。在合并模式中,PU的运动信息可与由选定候选预测运动 矢量指示的运动信息相同。
在基于IME和FME产生用于PU的预测性图像块和基于合并操作产生用于PU的预测性 图像块之后,帧间预测模块121可选择通过FME操作产生的预测性图像块或者通过合并操 作产生的预测性图像块。在一些可行的实施方式中,帧间预测模块121可基于通过FME操作产生的预测性图像块和通过合并操作产生的预测性图像块的码率-失真代价分析来选择用于PU的预测性图像块。
在帧间预测模块121已选择通过根据分割模式中的每一者分割当前CU而产生的PU的 预测性图像块之后(在一些实施方式中,编码树单元CTU划分为CU后,不会再进一步划分为更小的PU,此时PU等同于CU),帧间预测模块121可选择用于当前CU的分割模式。 在一些实施方式中,帧间预测模块121可基于通过根据分割模式中的每一者分割当前CU而 产生的PU的选定预测性图像块的码率-失真代价分析来选择用于当前CU的分割模式。帧间 预测模块121可将与属于选定分割模式的PU相关联的预测性图像块输出到残差产生模块 102。帧间预测模块121可将指示属于选定分割模式的PU的运动信息的语法元素输出到熵 编码模块。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及 算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以 硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可 以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本 申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装 置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通 过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显 示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的 部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络 单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各 个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储 在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现 有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机 软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计 算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而 前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的 介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟 悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖 在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (22)

1.一种帧间预测的方法,其特征在于,所述方法包括:
解析码流以确定待处理图像块的预测信息,其中,当所述预测信息指示所述待处理图像块的预测方向为双向预测时,所述码流中不包含目标标识信息,其中,所述目标标识信息用于指示对所述待处理图像块进行局部亮度补偿LIC;
根据所述预测信息,获得所述待处理图像块的预测值。
2.根据权利要求1所述的方法,其特征在于,当所述待处理图像块的预测信息指示所述待处理图像块的预测模式为融合模式时,在所述根据所述预测信息,获得所述待处理图像块的预测值之前,所述方法还包括:
确定至少一个第一信息组,其中,每个所述第一信息组包括运动矢量、预测方向和LIC标识;
当所述第一信息组的数量少于目标预设值时,根据所述至少一个第一信息组,确定至少一个第二信息组,其中,每个所述第二信息组包括运动矢量、预测方向和LIC标识;
所述根据所述预测信息,获得所述待处理图像块的预测值,包括:
根据所述预测信息、所述至少一个第一信息组和所述至少一个第二信息组,获得所述待处理图像块的预测值。
3.根据权利要求2所述的方法,其特征在于,所述至少一个第一信息组包括第一选择信息组和第二选择信息组,所述至少一个第二信息组包括第一合成信息组,所述根据所述至少一个第一信息组,确定至少一个第二信息组,包括:
将所述第一选择信息组的运动矢量和所述第二选择信息组的运动矢量的平均值作为所述第一合成信息组的运动矢量。
4.根据权利要求2所述的方法,其特征在于,所述预测方向包括双向预测和单向预测,所述单向预测包括第一向预测和第二向预测,所述至少一个第一信息组包括第一选择信息组和第二选择信息组,所述至少一个第二信息组包括第一合成信息组,所述根据所述至少一个第一信息组,确定至少一个第二信息组,包括:
根据所述第一选择信息组的预测方向和所述第二选择信息组的预测方向,确定所述第一合成信息组的预测方向。
5.根据权利要求4所述的方法,其特征在于,当所述待处理图像块进行LIC时,所述待处理图像块的LIC标识为第一数值,当所述待处理图像块不进行LIC时,所述待处理图像块的LIC标识取第二数值,
所述根据所述至少一个第一信息组,确定至少一个第二信息组,包括:
当所述第一合成信息组的预测方向为双向预测时,确定所述第一合成信息组的LIC标识为所述第二数值;
当所述第一合成信息组的预测方向为单向预测,且,所述第一选择信息组和所述第二选择信息组的LIC标识均为所述第二数值时,确定所述第一合成信息组的LIC标识为所述第二数值;
当所述第一合成信息组的预测方向为单向预测,且,所述第一选择信息组和/或所述第二选择信息组的LIC标识为所述第一数值时,确定所述第一合成信息组的LIC标识为所述第一数值。
6.根据权利要求1所述的方法,其特征在于,当所述待处理图像块的预测信息指示所述待处理图像块的预测模式为融合模式时,在所述根据所述预测信息,获得所述待处理图像块的预测值之前,所述方法还包括:
确定至少一个第三信息组,其中,每个所述第三信息组包括运动矢量和LIC标识;
当所述第三信息组的数量少于目标预设值时,根据所述至少一个第三信息组,确定至少一个第四信息组,其中,每个所述第四信息组包括运动矢量和LIC标识;
所述根据所述预测信息,获得所述待处理图像块的预测值,包括:
根据所述预测信息、所述至少一个第三信息组和所述至少一个第四信息组,获得所述待处理图像块的预测值。
7.根据权利要求6所述的方法,其特征在于,所述预测方向包括双向预测和单向预测,所述单向预测包括第一向预测和第二向预测,所述至少一个第三信息组包括第三选择信息组和第四选择信息组,所述至少一个第四信息组包括第二合成信息组,所述根据所述至少一个第三信息组,确定至少一个第四信息组,包括:
将所述第三选择信息组对应第一向预测的运动矢量作为所述第二合成信息组对应第一向预测的运动矢量,且,将所述第四选择信息组对应第二向预测的运动矢量作为所述第二合成信息组对应第二向预测的运动矢量;或者,
将所述第三选择信息组对应第二向预测的运动矢量作为所述第二合成信息组对应第一向预测的运动矢量,且,将所述第四选择信息组对应第一向预测的运动矢量作为所述第二合成信息组对应第二向预测的运动矢量。
8.根据权利要求6或7所述的方法,其特征在于,当所述待处理图像块进行LIC时,所述待处理图像块的LIC标识取第一数值,当所述待处理图像块不进行LIC时,所述待处理图像块的LIC标识取第二数值,所述根据所述至少一个第三信息组,确定至少一个第四信息组,包括:确定所述至少一个第四信息组中的每个第四信息组的LIC标识为所述第二数值。
9.根据权利要求5或8所述的方法,其特征在于,所述至少一个第一信息组包括第五选择信息组,所述确定至少一个第一信息组,包括:
确定与所述待处理图像块所在图像帧时域相邻的已重构图像帧中的目标图像块;
根据所述目标图像块,确定所述第五选择信息组的预测方向;
当所述第五选择信息组的预测方向为双向预测时,确定所述第五选择信息组的LIC标识为所述第二数值。
10.根据权利要求5所述的方法,其特征在于,当所述至少一个第一信息组的数量和所述至少一个第二信息组的数量之和少于所述目标预设值时,在所述根据所述预测信息,获得所述待处理图像块的预测值之前,所述方法还包括:
确定至少一个第五信息组,其中,所述第五信息组的LIC标识为所述第二数值,所述至少一个第一信息组的数量、所述至少一个第二信息组的数量和所述至少一个第五信息组的数量之和等于所述目标预设值;
所述根据所述预测信息,获得所述待处理图像块的预测值,包括:
根据所述预测信息、所述至少一个第一信息组、所述至少一个第二信息组和所述至少一个第五信息组,获得所述待处理图像块的预测值。
11.根据权利要求8所述的方法,其特征在于,当所述至少一个第三信息组的数量和所述至少一个第四信息组的数量之和少于所述目标预设值时,在所述根据所述预测信息,获得所述待处理图像块的预测值之前,所述方法还包括:
确定至少一个第六信息组,其中,所述第六信息组的LIC标识为所述第二数值,所述至少一个第三信息组的数量、所述至少一个第四信息组的数量和所述至少一个第六信息组的数量之和等于所述目标预设值;
所述根据所述预测信息,获得所述待处理图像块的预测值,包括:
根据所述预测信息、所述至少一个第三信息组、所述至少一个第四信息组和所述至少一个第六信息组,获得所述待处理图像块的预测值。
12.一种解码装置,其特征在于,所述解码装置包括:
获取单元,用于获取码流;
处理单元,用于解析所述码流以确定待处理图像块的预测信息,其中,当所述预测信息指示所述待处理图像块的预测模式为帧间预测,且,所述待处理图像块的预测方向为双向预测时,所述码流中不包含目标标识信息,其中,所述目标标识信息用于指示对所述待处理图像块进行局部亮度补偿LIC;
所述处理单元,还用于根据所述预测信息,获得所述待处理图像块的预测值。
13.根据权利要求12所述的解码装置,其特征在于,当所述待处理图像块的预测信息指示所述待处理图像块的预测模式为融合模式时,所述处理单元,还用于确定至少一个第一信息组,其中,每个所述第一信息组包括运动矢量、预测方向和LIC标识;
所述处理单元,还用于当确定所述第一信息组的数量少于目标预设值时,根据所述至少一个第一信息组,确定至少一个第二信息组,其中,每个所述第二信息组包括运动矢量、预测方向和LIC标识;
所述处理单元,具体用于根据所述预测信息、所述至少一个第一信息组和所述至少一个第二信息组,获得所述待处理图像块的预测值。
14.根据权利要求13所述的解码装置,其特征在于,所述至少一个第一信息组包括第一选择信息组和第二选择信息组,所述至少一个第二信息组包括第一合成信息组,所述处理单元,具体用于将所述第一选择信息组的运动矢量和所述第二选择信息组的运动矢量的平均值作为所述第一合成信息组的运动矢量。
15.根据权利要求13所述的解码装置,其特征在于,所述预测方向包括双向预测和单向预测,所述单向预测包括第一向预测和第二向预测,所述至少一个第一信息组包括第一选择信息组和第二选择信息组,所述至少一个第二信息组包括第一合成信息组,所述处理单元,具体用于根据所述第一选择信息组的预测方向和所述第二选择信息组的预测方向,确定所述第一合成信息组的预测方向。
16.根据权利要求15所述的解码装置,其特征在于,当所述待处理图像块进行LIC时,所述待处理图像块的LIC标识为第一数值,当所述待处理图像块不进行LIC时,所述待处理图像块的LIC标识取第二数值,
所述处理单元,具体用于当确定所述第一合成信息组的预测方向为双向预测时,确定所述第一合成信息组的LIC标识为所述第二数值;
当确定所述第一合成信息组的预测方向为单向预测,且,所述第一选择信息组和所述第二选择信息组的LIC标识均为所述第二数值时,确定所述第一合成信息组的LIC标识为所述第二数值;
当确定所述第一合成信息组的预测方向为单向预测,且,所述第一选择信息组和/或所述第二选择信息组的LIC标识为所述第一数值时,确定所述第一合成信息组的LIC标识为所述第一数值。
17.根据权利要求12所述的解码装置,其特征在于,当所述待处理图像块的预测信息指示所述待处理图像块的预测模式为融合模式时,所述处理单元,还用于确定至少一个第三信息组,其中,每个所述第三信息组包括运动矢量和LIC标识;
所述处理单元,还用于当确定所述第三信息组的数量少于目标预设值时,根据所述至少一个第三信息组,确定至少一个第四信息组,其中,每个所述第四信息组包括运动矢量和LIC标识;
所述处理单元,具体用于根据所述预测信息、所述至少一个第三信息组和所述至少一个第四信息组,获得所述待处理图像块的预测值。
18.根据权利要求17所述的解码装置,其特征在于,所述预测方向包括双向预测和单向预测,所述单向预测包括第一向预测和第二向预测,所述至少一个第三信息组包括第三选择信息组和第四选择信息组,所述至少一个第四信息组包括第二合成信息组,所述处理单元,具体用于将所述第三选择信息组对应第一向预测的运动矢量作为所述第二合成信息组对应第一向预测的运动矢量,且,将所述第四选择信息组对应第二向预测的运动矢量作为所述第二合成信息组对应第二向预测的运动矢量;或者,
将所述第三选择信息组对应第二向预测的运动矢量作为所述第二合成信息组对应第一向预测的运动矢量,且,将所述第四选择信息组对应第一向预测的运动矢量作为所述第二合成信息组对应第二向预测的运动矢量。
19.根据权利要求17或18所述的解码装置,其特征在于,当所述待处理图像块进行LIC时,所述待处理图像块的LIC标识取第一数值,当所述待处理图像块不进行LIC时,所述待处理图像块的LIC标识取第二数值,所述处理单元,具体用于确定所述至少一个第四信息组中的每个第四信息组的LIC标识为所述第二数值。
20.根据权利要求16或19所述的解码装置,其特征在于,所述至少一个第一信息组包括第五选择信息组,所述处理单元,具体用于:
确定与所述待处理图像块所在图像帧时域相邻的已重构图像帧中的目标图像块;
根据所述目标图像块,确定所述第五选择信息组的预测方向;
当所述第五选择信息组的预测方向为双向预测时,确定所述第五选择信息组的LIC标识为所述第二数值。
21.根据权利要求16所述的解码装置,其特征在于,当所述至少一个第一信息组的数量和所述至少一个第二信息组的数量之和少于所述目标预设值时,所述处理单元,还用于确定至少一个第五信息组,其中,所述第五信息组的LIC标识为所述第二数值,所述至少一个第一信息组的数量、所述至少一个第二信息组的数量和所述至少一个第五信息组的数量之和等于所述目标预设值;
所述处理单元,具体用于根据所述预测信息、所述至少一个第一信息组、所述至少一个第二信息组和所述至少一个第五信息组,获得所述待处理图像块的预测值。
22.根据权利要求19所述的解码装置,其特征在于,当所述至少一个第三信息组的数量和所述至少一个第四信息组的数量之和少于所述目标预设值时,所述处理单元,还用于确定至少一个第六信息组,其中,所述第六信息组的LIC标识为所述第二数值,所述至少一个第三信息组的数量、所述至少一个第四信息组的数量和所述至少一个第六信息组的数量之和等于所述目标预设值;
所述处理单元,具体用于根据所述预测信息、所述至少一个第三信息组、所述至少一个第四信息组和所述至少一个第六信息组,获得所述待处理图像块的预测值。
CN201811467538.8A 2018-12-03 2018-12-03 帧间预测方法和相关装置 Active CN111263147B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201811467538.8A CN111263147B (zh) 2018-12-03 2018-12-03 帧间预测方法和相关装置
CN201980076612.XA CN113170141B (zh) 2018-12-03 2019-12-02 帧间预测方法和相关装置
PCT/CN2019/122458 WO2020114356A1 (zh) 2018-12-03 2019-12-02 帧间预测方法和相关装置
EP19892023.3A EP3883244A4 (en) 2018-12-03 2019-12-02 INTER-FRAME PREDICTION METHOD AND ASSOCIATED DEVICE
JP2021531579A JP7331105B2 (ja) 2018-12-03 2019-12-02 フレーム間予測方法及び関連する装置
US17/337,556 US11601667B2 (en) 2018-12-03 2021-06-03 Inter prediction method and related apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811467538.8A CN111263147B (zh) 2018-12-03 2018-12-03 帧间预测方法和相关装置

Publications (2)

Publication Number Publication Date
CN111263147A true CN111263147A (zh) 2020-06-09
CN111263147B CN111263147B (zh) 2023-02-14

Family

ID=70952048

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201811467538.8A Active CN111263147B (zh) 2018-12-03 2018-12-03 帧间预测方法和相关装置
CN201980076612.XA Active CN113170141B (zh) 2018-12-03 2019-12-02 帧间预测方法和相关装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201980076612.XA Active CN113170141B (zh) 2018-12-03 2019-12-02 帧间预测方法和相关装置

Country Status (5)

Country Link
US (1) US11601667B2 (zh)
EP (1) EP3883244A4 (zh)
JP (1) JP7331105B2 (zh)
CN (2) CN111263147B (zh)
WO (1) WO2020114356A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022174469A1 (zh) * 2021-02-22 2022-08-25 Oppo广东移动通信有限公司 一种光照补偿方法、编码器、解码器及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10911769B2 (en) * 2017-06-23 2021-02-02 Qualcomm Incorporated Motion-based priority for the construction of candidate lists in video coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102934440A (zh) * 2010-05-26 2013-02-13 Lg电子株式会社 用于处理视频信号的方法和设备
US20160366416A1 (en) * 2015-06-09 2016-12-15 Qualcomm Incorporated Systems and methods of determining illumination compensation status for video coding
US20160366415A1 (en) * 2015-06-09 2016-12-15 Qualcomm Incorporated Systems and methods of determining illumination compensation parameters for video coding
US20180241998A1 (en) * 2017-02-21 2018-08-23 Qualcomm Incorporated Deriving motion vector information at a video decoder

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7817865B2 (en) 2006-01-12 2010-10-19 Lg Electronics Inc. Processing multiview video
US20130287106A1 (en) * 2011-01-07 2013-10-31 Samsung Electronics Co., Ltd. Video prediction method capable of performing bilateral prediction and unilateral prediction and a device thereof, video encoding method and device thereof, and video decoding method and device thereof
KR101444675B1 (ko) * 2011-07-01 2014-10-01 에스케이 텔레콤주식회사 영상 부호화 및 복호화 방법과 장치
JP5997363B2 (ja) * 2012-04-15 2016-09-28 サムスン エレクトロニクス カンパニー リミテッド ビデオ復号化方法及びビデオ復号化装置
CN108965871B (zh) * 2015-09-29 2023-11-10 华为技术有限公司 图像预测的方法及装置
US11146821B2 (en) * 2016-05-25 2021-10-12 Arris Enterprises Llc JVET coding block structure with asymmetrical partitioning
US10390015B2 (en) 2016-08-26 2019-08-20 Qualcomm Incorporated Unification of parameters derivation procedures for local illumination compensation and cross-component linear model prediction
CN106454378B (zh) * 2016-09-07 2019-01-29 中山大学 一种基于变形运动模型的帧率上转换视频编码方法及系统
WO2018174618A1 (ko) * 2017-03-22 2018-09-27 한국전자통신연구원 참조 블록을 사용하는 예측 방법 및 장치
US20180310017A1 (en) 2017-04-21 2018-10-25 Mediatek Inc. Sub-prediction unit temporal motion vector prediction (sub-pu tmvp) for video coding
US10904565B2 (en) 2017-06-23 2021-01-26 Qualcomm Incorporated Memory-bandwidth-efficient design for bi-directional optical flow (BIO)
WO2020173477A1 (en) 2019-02-27 2020-09-03 Beijing Bytedance Network Technology Co., Ltd. Regression-based motion vector field based sub-block motion vector derivation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102934440A (zh) * 2010-05-26 2013-02-13 Lg电子株式会社 用于处理视频信号的方法和设备
US20160366416A1 (en) * 2015-06-09 2016-12-15 Qualcomm Incorporated Systems and methods of determining illumination compensation status for video coding
US20160366415A1 (en) * 2015-06-09 2016-12-15 Qualcomm Incorporated Systems and methods of determining illumination compensation parameters for video coding
US20180241998A1 (en) * 2017-02-21 2018-08-23 Qualcomm Incorporated Deriving motion vector information at a video decoder

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
C. W. SEO 等: "Pixel Based Illumination Compensation", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022174469A1 (zh) * 2021-02-22 2022-08-25 Oppo广东移动通信有限公司 一种光照补偿方法、编码器、解码器及存储介质

Also Published As

Publication number Publication date
US11601667B2 (en) 2023-03-07
CN113170141A (zh) 2021-07-23
CN111263147B (zh) 2023-02-14
JP2022511827A (ja) 2022-02-01
EP3883244A4 (en) 2022-04-13
US20210289224A1 (en) 2021-09-16
JP7331105B2 (ja) 2023-08-22
EP3883244A1 (en) 2021-09-22
WO2020114356A1 (zh) 2020-06-11
CN113170141B (zh) 2023-03-03

Similar Documents

Publication Publication Date Title
US11431968B2 (en) Variable number of intra modes for video coding
US9699472B2 (en) Restriction of prediction units in B slices to uni-directional inter prediction
US9426463B2 (en) Restriction of prediction units in B slices to uni-directional inter prediction
US9736489B2 (en) Motion vector determination for video coding
JP5766874B2 (ja) 方向性パーティションを用いたイントラ予測モードコーディング
CN110868587B (zh) 一种视频图像预测方法及装置
CN111200735B (zh) 一种帧间预测的方法及装置
US20130195189A1 (en) Implicit derivation of parallel motion estimation range size
US11601667B2 (en) Inter prediction method and related apparatus
US20210203944A1 (en) Decoding method and decoding apparatus for predicting motion information
JP2021530909A (ja) ルマ・イントラ・モード・シグナリング
CN110876057B (zh) 一种帧间预测的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant