CN118042127A - 视频编码、解码方法及装置 - Google Patents

视频编码、解码方法及装置 Download PDF

Info

Publication number
CN118042127A
CN118042127A CN202410175461.6A CN202410175461A CN118042127A CN 118042127 A CN118042127 A CN 118042127A CN 202410175461 A CN202410175461 A CN 202410175461A CN 118042127 A CN118042127 A CN 118042127A
Authority
CN
China
Prior art keywords
motion vector
list
predicted value
video
predictors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410175461.6A
Other languages
English (en)
Inventor
许晓中
李翔
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent America LLC
Original Assignee
Tencent America LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent America LLC filed Critical Tencent America LLC
Publication of CN118042127A publication Critical patent/CN118042127A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本公开的各方面提供了用于视频编码/解码的方法和装置。在一些示例中,用于视频解码的装置包括处理电路。该处理电路对当前图片中的当前块的预测信息进行解码。处理电路确定当前块的大小是否小于或等于阈值。处理电路构建包括多个运动矢量预测值的运动矢量预测值列表。运动矢量预测值的数目基于当前块的大小是否被确定为小于或等于阈值。处理电路基于运动矢量预测值列表来重建当前块。

Description

视频编码、解码方法及装置
优先权信息
本申请要求于2018年12月10日提交的美国临时申请62/777,735号和2019年8月29日提交的美国专利申请第16/555,549号的优先权,其全部公开内容通过引用并入本文中。
本申请对申请号为201980062823.8,申请日为2019年12月04日,发明名称为“小型编码块的简化合并列表构建”的中国专利申请提出分案申请。
技术领域
本申请涉及视频处理技术领域,具体涉及视频编解码的方法及装置。
背景技术
本文背景技术中的描述目的在于从总体上呈现本申请内容的背景。就此背景技术部分中描述的工作的程度而言,目前署名的发明人的工作以及在提交时可不被另外限定为现有技术的描述,没有被明确地或者隐含地承认为针对本申请内容的现有技术。
可使用具有运动补偿的帧间预测来进行视频编码和解码。未压缩的数字视频可以包括一系列图片,每个图片在空间维度包括例如1920×1080个亮度样本以及相关联的色度样本。一系列图片可以具有例如每秒60个图片或60Hz的固定的或可变的图片速率(也被非正式地称为帧速率)。未压缩的视频对码率的要求较高。例如,每样本8位的1080p60 4:2:0视频(60Hz帧速率下1920×1080亮度样本分辨率)需要接近1.5Gbit/s的带宽。一小时的上述视频需要超过600GB的存储空间。
视频编码和解码的一个目的在于通过压缩来减少输入视频信号的冗余度。压缩可帮助降低上述带宽需求或存储空间需求,在一些情况下可降低两个或更多数量级。可以采用无损压缩、有损压缩及二者的组合。无损压缩是指可以从压缩的视频信号重建出原始信号的精确副本的技术。当使用有损压缩时,重建的信号可能与原始信号不同,但原始信号与重建的信号之间的失真足够小,使得重建的信号可用于目标应用。有损压缩在视频方面得到了广泛应用。容忍的失真量取决于应用,比如,某些消费者流媒体应用的用户可能比电视分配应用的用户能够容忍更高的失真。能够实现的压缩比可反映出:更高的可允许/可容忍的失真能产生更高的压缩比。
视频编码器和解码器可以利用例如包括运动补偿、变换、量化和熵编码等若干大类中的技术。
视频编解码器技术可以包括称为帧内编码的技术。在帧内编码中,在不参考来自先前重建的参考图片的样本或其他数据的情况下表示样本值。在一些视频编解码器中,图片在空间上被细分为样本块。当所有的样本块都以帧内模式编码时,该图片可以是帧内图片。帧内图片及其派生(例如,独立解码器刷新图片)可以用于重置解码器状态,并且可以用作经编码视频比特流和视频会话中的第一图片或用作静止图像。可以使帧内块的样本经受变换,并且可以在熵编码之前对变换系数进行量化。帧内预测可以是在预变换域中使样本值最小化的技术。在一些情况下,变换之后的DC系数越小,并且AC系数越小,在给定量化步长下表示熵编码之后的块所需的比特就越少。
诸如从例如MPEG-2代编码技术已知的传统帧内编码不使用帧内预测。然而,一些较新的视频压缩技术包括试图利用例如在空间上邻近、并且在解码顺序上在前的数据块的编码/解码期间获得的元数据和/或周围样本数据的技术。这样的技术此后被称为“帧内预测”技术。注意,在至少一些情况下,帧内预测仅使用来自重建中的当前图片的参考数据,而不使用来自参考图片的参考数据。
可以存在许多不同形式的帧内预测。当可以在给定视频编码技术中使用多于一种的这样的技术时,使用的技术可以在帧内预测模式下进行编码。在某些情况下,模式可以具有子模式和/或参数,并且这些子模式和/或参数可以被单独编码或被包括在模式码字中。针对给定模式/子模式/参数组合使用何码字,会通过帧内预测对编码效率增益产生影响,并且因此可以对用于将码字转换成比特流的熵编码技术产生影响。
帧内预测的某些模式由H.264引入、在H.265中被细化,并且在诸如联合开发模型(joint exploration model,JEM)、通用视频编码(versatile video coding,VVC)、和基准集(benchmarkset,BMS)的较新编码技术中被进一步细化。可以使用属于已经可用的样本的邻近样本值来形成预测块。根据方向将邻近样本的样本值复制到预测块中。对使用的方向的参考可以被编码在比特流中,或者其本身可以被预测。
参照图1A,在右下方描绘了从H.265的33种可能的预测方向(对应于35种帧内模式的33个角模式)获知的9个预测方向的子集。箭头会聚的点(101)表示被预测的样本。箭头表示对样本进行预测的方向。例如,箭头(102)指示从右上方的与水平成45度角的一个或更多个样本对样本(101)进行预测。类似地,箭头(103)指示从样本(101)左下方的与水平成22.5度角的一个或更多个样本对样本(101)进行预测。
仍然参照图1,在左上方描绘了4×4样本的正方形块(104)(由黑体虚线指示)。方块(104)包括16个样本。每个样本标有“S”、其在Y维度上的位置(例如,行索引)以及其在X维度上的位置(例如列索引)。例如,样本S21是Y维度上(从顶部起)的第二个样本和X维度上(从左侧起)的第一个样本。类似地,样本S44是块(104)中在Y维度和X维度两者上的第四个样本。由于块的大小是4×4个样本,所以S44在右下方。进一步显示的是参考样本,其遵循类似的编号方案。参考样本由R、其相对于块(104)的Y位置(例如,行索引)和X位置(列索引)来标记。在H.264和H.265两者中,预测样本与重建中的块相邻;因此不需要使用负值。
帧内图片预测可以通过从由信号表示的预测方向占用的相邻样本的复制参考样本值来运作。例如,假设编码视频比特流包括信令,针对该块,信令指示与箭头(102)一致的预测方向——即,根据右上方的与水平成45度角的一个或更多个预测样本来对样本进行预测。在这种情况下,根据同一参考样本R05对样本S41、S32、S23和S14进行预测。然后根据参考样本R08预测样品S44。
在某些情况下,多个参考样本的值可以例如通过插值来组合,以便计算参考样本;尤其是当方向不能被45度整除时。
随着视频编码技术的发展,可能的方向的数量也在增加。在H.264(2003年)中,可以表示九个不同的方向。这在H.265(2013年)中增加到33个,并且在公开时JEM/VVC/BMS可以支持最多达65个方向。已经进行了实验来识别最可能的方向,并且熵编码中的某些技术被用于以少量的比特表示那些可能的方向,从而对较不可能的方向接受某些惩罚。此外,有时可以根据在相邻的已解码的块中使用的相邻方向来预测方向本身。
图1B示出了示意图(105),其描绘了根据JEM的65个帧内预测方向,示出随着时间而增加的预测方向的数目。
编码视频比特流中表示方向的帧内预测方向比特的映射可以随着视频编码技术的不同而不同;并且例如可以从预测方向到帧内预测模式到码字的简单直接映射,到涉及最可能模式和类似技术的复杂自适应方案。然而,在所有情况下,均会存在统计上比某些其他方向出现更不可能在视频内容中的某些方向。由于视频压缩的目标是减少冗余,所以在工作良好的视频编码技术中,那些较不可能的方向与更可能的方向相比将通过更大的比特数来表示。
运动补偿可以是有损压缩技术,并且可以涉及以下技术:在运动矢量(以下称为MV)所指示的方向上进行空间移动之后,使用来自先前重建的图片或其一部分(即使用参考图片)的样本数据的块,来预测新重建的图片或其一部分。在一些情况下,参考图片可以与当前被重建的图片相同。MV可以具有X和Y两个维度,也可以具有三个维度,其中第三维度指示使用中的参考图片(后一维度可以间接地为时间维度)。
在一些视频压缩技术中,可用于样本数据的某一区域的MV可以基于其他MV预测得到,例如,可以基于与正被重建的区域在空间上相邻的样本数据的另一区域相关的、且在解码顺序上靠前的MV来得到预测。这样做可以大幅减少编码MV所需的数据量,从而消除冗余度并且提高压缩率。例如,由于在编码从摄像装置导出的输入视频信号(被称为自然视频)时存在统计上的可能性——即比单个MV所适用的区域更大的区域沿相似的方向移动,从而在一些情况下可从相邻区域的MV导出相似的运动矢量来预测该单个MV,因此,MV预测可以有效地发挥作用。以上使得为给定区域寻求的MV与从周围MV预测得到的MV相似或相同,从而在熵编码之后能够使用比直接编码MV时更少的二进制位来表示该MV。在一些情况下,MV预测可以对从原始信号(即样本流)导出的信号(即MV)进行无损压缩。在其他情况下,MV预测本身可以是有损的,其原因例如在基于若干周围MV计算预测值时的舍入误差。
在H.265/HEVC(ITU-T Rec H.265,“高效视频编解码(High Efficiency VideoCoding)”,2016年12月)中描述了各种MV预测机制。在H.265提供的许多MV预测机制中,此处描述了高级运动矢量预测(advanced motion vector prediction,AMVP)模式和合并模式。
在AMVP模式下,当前块的空间和时间相邻块的运动信息可用于预测当前块的运动信息,同时进一步对预测残差进行编码。空间和时间相邻候选的示例分别在图1C和图1D中示出。形成双候选运动矢量预测值列表。如图1C所示,第一候选预测值来自当前块(111)的左下角处的两个块A0(112)、A1(113)的第一可用运动矢量。第二候选预测值来自当前块(111)上方的三个块B0(114)、B1(115)和B2(116)的第一可用运动矢量。如果从校验的位置找不到有效的运动矢量,则列表中将不会填充任何候选。如果两个可用候选具有相同的运动信息,则列表中将仅保留一个候选。如果列表未填满,即列表不具有两个不同的候选,则来自参考图片中的同位块(121)右下角处的C0(122)的时间同位运动矢量(缩放后)将被用作另一个候选,如图1D所示。如果C0(122)位置处的运动信息不可用,则将替代地使用参考图片中的同位块的中心位置C1(123)。在上面的推导中,如果仍然没有足够的运动矢量预测值候选,则将使用零运动矢量来填充列表。在比特流中用信号表示两个标志mvp_l0_flag和mvp_l1_flag,以分别指示MV候选列表L0和L1的AMVP索引(0或1)。
在用于图片间预测的合并模式中,如果将合并标志(包括跳过标志)用信号表示为真(TRUE),则用信号表示合并索引以指示将使用合并候选列表中的哪个候选来指示当前块的运动矢量。在解码器处,基于当前块的空间和时间邻居来构建合并候选列表。如图1C所示,将从五个空间相邻块(A0至B2)导出的最多四个MV添加到合并候选列表中。另外,如图1D所示,将来自参考图片中两个时间同位块(C0和C1)的最多一个MV添加到列表中。附加的合并候选包括组合的双向预测候选和零运动矢量候选。在采用块的运动信息作为合并候选之前,执行冗余校验以检查块是否与当前合并候选列表中的元素相同。如果块与当前合并候选列表中的每个元素都不相同,则将块作为合并候选添加到合并候选列表中。MaxMergeCandsNum被定义为就候选数目而言的合并候选列表的大小。在HEVC中,在比特流中用信号表示MaxMergeCandsNum。可以将跳过模式视为残差为零的特殊合并模式。
在VVC中,类似于HEVC中的时间运动矢量预测(temporalmotion vectorprediction,TMVP),基于子块的时间运动矢量预测(sub-block based temporal motionvector prediction,SbTMVP)方法可以使用同位图片中的运动字段,来改进用于当前图片中的CU的运动矢量预测和合并模式。由TMVP使用的相同的同位图片被用于SbTVMP。SbTMVP在以下两个主要方面不同于TMVP:(1)TMVP预测CU级的运动,但是SbTMVP预测子CU级的运动;(2)TMVP从同位图片中的同位块中获取时间运动矢量(同位块是相对于当前CU的右下或中心块),SbTMVP在从同位图片中获取时间运动信息之前应用了运动移位,其中该运动移位可以从当前CU的空间相邻块之一的运动矢量获得。
在图1E和图1F中示出了SbTVMP处理。SbTMVP分两个步骤预测当前CU内的子CU的运动矢量。在第一步骤中,如图1E所示,以A1(132)、B1(133)、B0(134)和A0(135)的顺序检查当前块(131)的空间邻居。一旦识别出可将同位图片用作其参考图片的运动矢量的第一可用空间相邻块,就将该运动矢量选择为要应用的运动移位。如果没有从空间邻居中识别出这样的运动矢量,则将运动移位设置为(0,0)。
在第二步骤中,应用在第一步骤中识别出的运动移位(即,添加至当前块的坐标),以从如图1F所示的同位图片中获得子CU级运动信息(例如,运动矢量和参考索引)。图1F中的示例假定将运动移位(149)设置为空间相邻块A1(143)的运动矢量。然后,对于当前图片(141)的当前块(142)中的当前子CU(例如,子CU(144)),同位图片(151)的同位块(152)中的对应同位子CU(例如,同位子CU(154))的运动信息)被用于导出当前子CU的运动信息。以与HEVC中的TMVP处理类似的方式,将对应同位子CU(例如,同位子CU(154))的运动信息转换为当前子CU(例如,子CU(144))的运动矢量和参考索引,其中应用时间运动缩放,以将时间运动矢量的参考图片与当前CU的参考图片对准。
在VVC中,可以在基于子块的合并模式下使用既包含SbTVMP候选又包含仿射合并候选的基于合并子块的合并列表。通过序列参数集(SPS)标志启用/禁用SbTVMP模式。如果启用了SbTMVP模式,则将SbTMVP预测值添加为基于子块的合并列表的第一个条目,然后是仿射合并候选。在某些应用中,基于子块的合并列表的最大允许大小为5。例如,SbTMVP中使用的子CU大小固定为8×8。如同仿射合并模式一样,SbTMVP模式仅适用于宽度和高度均大于或等于8的CU。
附加的SbTMVP合并候选的编码逻辑与其他合并候选的编码逻辑相同。也就是说,对于P或B切片中的每个CU,执行附加速率失真(RD)校验以判定是否使用SbTMVP候选。
在VVC中,基于历史的MVP(history-based MVP,HMVP)方法包括被定义为先前编码块的运动信息的HMVP候选。在编码/解码处理期间维护具有多个HMVP候选的表。当遇到新切片时,将表清空。每当存在帧间编码的非仿射块时,相关联的运动信息就会作为新的HMVP候选添加到表的最后一个条目。HMVP方法的编码流程如图1G所示。
表大小S被设置为6,这指示可以将最多6个HMVP候选添加到表中。当将新的运动候选插入表中时,利用约束的FIFO规则,使得首先应用冗余校验以确定表中是否存在相同的HMVP。如果找到,则将相同的HMVP从表中删除,并且将所有HMVP候选向前移动,即索引减小1。图1H示出了将新运动候选插入HMVP表中的示例。
HMVP候选可以在合并候选列表构建处理中使用。按顺序检查表中最新的几个HMVP候选,并将最新的几个HMVP候选插入到TMVP候选之后的候选列表中。对HMVP候选应用修剪,以排除子块运动候选(即ATMVP)以外的空间或时间合并候选。
为了减少修剪操作的次数,将要检查的HMVP候选的数目(用L表示)设置为L=(N<=4)?M:(8-N),其中,N指示可用的非子块合并候选的数目,M指示表中可用的HMVP候选的数目。另外,一旦可用合并候选的总数达到用信号表示的最大允许合并候选减1,就终止对于HMVP列表的合并候选列表构建处理。此外,用于组合双向预测合并候选推导的对数从12减少到6。
HMVP候选也可以在AMVP候选列表构建处理中使用。将表中最后K个HMVP候选的运动矢量插入到TMVP候选之后。仅将具有与AMVP目标参考图片相同的参考图片的HMVP候选用于构建AMVP候选列表。对HMVP候选应用修剪。在某些应用中,将K设置为4,同时AMVP列表大小保持不变,即等于2。
通过对当前合并候选列表中的预定义的候选对求平均,来生成成对平均候选。在VVC中,成对平均候选的数目为6,并且预定义的对被定义为{(0,1),(0,2),(1,2),(0,3),(1,3),(2,3)},其中数字表示合并候选列表的合并索引。针对每个参考列表分别计算平均运动矢量。如果两个运动矢量在一个列表中均可用,则即使这两个运动矢量指向不同的参考图片,仍对其求平均。如果只有一个运动矢量可用,则直接使用该一个运动矢量。如果没有运动矢量可用,则该列表被视为无效。成对平均候选可以替换HEVC标准中的组合候选。
可以将多假设预测应用于改进AMVP模式的单预测。用信号表示一个标志以启用或禁用多假设预测。此外,当该标志为真时,用信号表示一个附加合并索引。以这种方式,多假设预测将单预测转换为双预测,其中一个预测是使用AMVP模式下的原始语法元素获取的,而另一预测是使用合并模式获取的。与双向预测一样,最终预测使用1:1权重将这两个预测组合在一起。首先从排除了子CU候选(例如,仿射替选时间运动矢量预测(ATMVP))的合并模式中导出合并候选列表。接下来,将合并候选列表分为两个单独的列表,一个是包含来自候选的所有L0运动的列表0(L0),另一个是包含所有L1运动的列表1(L1)。在移除冗余并填补空缺后,分别针对L0和L1生成两个合并列表。当应用多假设预测来改进AMVP模式时,存在两个约束。首先,对于亮度编码块(CB)大小大于或等于64的那些CU启用此功能。其次,对于低延迟B图片,仅应用于L1。
对于以非子块模式编码的块,可以构建运动矢量预测值列表,当构建运动矢量预测值列表时,可以执行包括可用性校验和冗余校验的一系列操作。当运动矢量预测值列表很长时,这些操作可能需要多个周期来执行。在一些情况下,图片可以被划分为许多小块,针对所有这些小块构建运动矢量预测值列表所需的周期总数可能大于期望值,例如,用于每个编码块的合并候选列表可以与其相邻块不同。因此,期望减少操作次数,并且简化运动矢量预测值列表的构建处理,特别是对于小的块。
发明内容
本申请公开的各方面提供了视频解码的方法在一些示例中,用于视频解码的方法包括:
对编码视频序列的当前图片中的当前块的预测信息进行解码。确定当前块的大小是否小于或等于阈值。构建包括多个运动矢量预测值的运动矢量预测值列表,运动矢量预测值的数目基于当前块的大小是否小于或等于阈值的确定结果来确定。基于运动矢量预测值列表来重建当前块。
根据本公开的各方面,当确定当前块的大小小于或等于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目是第一数目,当确定当前块的大小大于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目是第二数目,所述第二数目大于第一数目。
根据本公开的各方面,预测信息指示当前块将被进一步划分成多个较小的块。将当前块划分为多个较小的块。确定多个较小块中是否存在至少一个块的大小小于或等于阈值。基于多个较小块中是否存在至少一个块的大小是否小于或等于阈值的确定结果,构建运动矢量预测值列表。当确定多个较小块中存在至少一个块的大小小于或等于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目是第一数目,当确定多个较小块中各个块的大小均大于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目是第二数目。
根据本公开的各方面,预测信息指示当前块的分区大小。确定分区大小是否小于或等于阈值。基于分区大小是否小于或等于阈值的确定结果,构建运动矢量预测值列表。当确定分区大小小于或等于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目是第一数目,当确定分区大小大于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目是第二数目。
在实施例中,阈值是亮度样本的预设数目。
在实施例中,阈值对应于当前图片的图片分辨率。
在实施例中,在编码视频序列中用信号表示阈值。
在实施例中,基于第一组空间或时间运动矢量预测值,构建包括第一数目的运动矢量预测值的运动矢量预测值列表。第一组空间或时间运动矢量预测值小于第二组空间或时间运动矢量预测值,该第二组空间或时间运动矢量预测值用于构建包括第二数目的运动矢量预测值的运动矢量预测值列表。
在实施例中,包括第一数目的运动矢量预测值的运动矢量预测值列表不包括任何空间或时间运动矢量预测值。
在实施例中,执行第一数目的冗余校验,构建包括第一数目的运动矢量预测值的运动矢量预测值列表,执行第二数目的冗余校验,构建包括第二数目的运动矢量预测值的运动矢量预测值列表。
在实施例中,第一数目的冗余校验不包括以下中的至少一个:(i)可能的空间运动矢量预测值与运动矢量预测值列表中的第一现有空间运动矢量预测值之间的比较,(ii)可能的时间运动矢量预测值与运动矢量预测值列表中的第一现有时间运动矢量预测值之间的比较,(iii)可能的基于历史的运动矢量预测值与运动矢量预测值列表中的第一现有空间运动矢量预测值或另一现有空间运动矢量预测值之间的比较,以及(iv)可能的基于历史的运动矢量预测值与运动矢量预测值列表中的第一现有时间运动矢量预测值或另一现有时间运动矢量预测值之间的比较。
在实施例中,构建包括第一数目的运动矢量预测值的运动矢量预测值列表而不执行任何冗余校验。
在实施例中,运动矢量预测值中的至少一个使用当前图片作为参考图片,使得运动矢量预测值中的至少一个的参考块在当前图片内。
本申请公开的各个方面还提供了一种视频解码的装置,该装置包括:
信息解码模块,用于对编码视频序列的当前图片中的当前块的预测信息进行解码;
大小判断模块,用于确定所述当前块的大小是否小于或等于阈值;
列表构建模块,用于构建包括多个运动矢量预测值的运动矢量预测值列表,所述运动矢量预测值的数目基于所述当前块的大小是否小于或等于所述阈值的确定结果来确定;
重建模块,用于基于所述运动矢量预测值列表来重建所述当前块。
本申请公开的各方面还提供了一种非暂态计算机可读介质,该非暂态计算机可读介质存储程序,所述程序由计算机执行,以用于视频解码时使计算机执行上述视频解码的方法中的任何一种或它们的组合。
本申请公开的各个方面还提供了一种计算机设备,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于根据该计算机程序执行上述视频解码的方法中的任何一种或它们的组合。
在上述视频解码的方法中,当将当前块视为小块时,即在当前块的大小小于或等于阈值时,可以简化针对该当前块的运动矢量预测值列表的构建处理,使得包括更少数目的运动矢量预测值,和/或执行更少的可用性校验和/冗余校验的操作。
附图说明
根据以下详细描述和附图,本申请所公开主题的进一步的特征、性质和各种优点将变得更加明显,在附图中:
图1A是帧内预测模式的示例性子集的示意图;
图1B是示例性帧内预测方向的图示;
图1C是一示例中的当前块及其周围的空间合并候选的示意图;
图1D是一个示例中的共位块和时间合并候选的示意图;
图1E是根据一个示例的用于基于子块的时间运动矢量预测(SbTMVP)的当前块及其周围空间合并候选的示意图;
图1F是根据一个示例的导出SbTMVP候选的示例性处理;
图1G是一个示例的基于历史的运动矢量预测(HMVP)方法的解码流程;
图1H是根据一个示例的更新HMVP中的表的示例性处理;
图2是根据实施例的通信系统的简化框图的示意图;
图3是根据实施例的通信系统的简化框图的示意性图示;
图4是根据实施例的一种解码器的简化框图的示意图;
图5是根据实施例的一种编码器的简化框图的示意图;
图6示出了根据另一实施例的另一种编码器的框图;
图7示出了根据另一实施例的另一种解码器的框图;
图8示出了概述根据本公开的一些实施例的示例性处理的流程图;
图9示出了概述根据本公开的一些实施例的示例性处理的另一流程图;
图10是本申请实施例的计算机系统的示意图。
具体实施方式
图2示出了根据本申请公开的实施例的通信系统(200)的简化框图。通信系统(200)包括多个终端装置,所述终端装置可通过例如网络(250)彼此通信。举例来说,通信系统(200)包括通过网络(250)互连的第一终端装置(210)和第二终端装置(220)。在图2的实施例中,第一终端装置(210)和第二终端装置(220)执行单向数据传输。举例来说,第一终端装置(210)可对视频数据(例如由终端装置(210)采集的视频图片流)进行编码,进而通过网络(250)传输到第二终端装置(220)。已编码的视频数据可以以一个或多个已编码视频比特流形式传输。第二终端装置(220)可从网络(250)接收已编码视频数据,对已编码视频数据进行解码以恢复视频数据,并根据恢复的视频数据显示视频图片。单向数据传输在媒体服务等应用中是较常见的。
在另一实施例中,通信系统(200)包括执行已编码视频数据的双向传输的第三终端装置(230)和第四终端装置(240),所述双向传输可例如在视频会议期间发生。对于双向数据传输,第三终端装置(230)和第四终端装置(240)中的每个终端装置可对视频数据(例如由终端装置采集的视频图片流)进行编码,以通过网络(250)传输到第三终端装置(230)和第四终端装置(240)中的另一终端装置。第三终端装置(230)和第四终端装置(240)中的每个终端装置可以接收由第三终端装置(230)和第四终端装置(240)中的另一终端装置传输的已编码视频数据,且可对所述已编码视频数据进行解码以恢复视频数据,且可根据恢复的视频数据在可访问的显示装置上显示视频图片。
在图2的实施例中,第一终端装置(210)、第二终端装置(220)、第三终端装置(230)和第四终端装置(240)可为服务器、个人计算机和智能电话,但本申请公开的原理可不限于此。本申请公开的实施例可用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议装置。网络(250)表示在第一终端装置(210)、第二终端装置(220)、第三终端装置(230)和第四终端装置(240)之间传送已编码视频数据的任意数目的网络,包括例如有线(连线的)和/或无线通信网络。通信网络(250)可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本申请论述的目的,除非在下文中有所解释,否则网络(250)的架构和拓扑对于本申请公开的操作来说可能是无关紧要的。
作为实施例,图3示出视频编码器和视频解码器在流式传输环境中的放置方式。本申请所公开主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字TV、在包括CD、DVD、存储棒等的数字介质上存储压缩视频等等。
流式传输系统可包括采集子系统(313),所述采集子系统可包括数码相机等视频源(301),所述视频源例如创建未压缩的视频图片流(302)。在实施例中,视频图片流(302)包括由数码相机拍摄的样本。相较于已编码的视频数据(304)(或已编码的视频比特流),视频图片流(302)被描绘为粗线以强调高数据量的视频图片流,视频图片流(302)可由电子装置(320)处理,所述电子装置(320)包括耦接到视频源(301)的视频编码器(303)。视频编码器(303)可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图片流(302),已编码的视频数据(304)(或已编码的视频比特流(304))被描绘为细线以强调较低数据量的已编码的视频数据(304)(或已编码的视频比特流(304)),其可存储在流式传输服务器(305)上以供将来使用。一个或多个流式传输客户端子系统,例如图3中的客户端子系统(306)和客户端子系统(308),可访问流式传输服务器(305)以检索已编码的视频数据(304)的副本(307)和副本(309)。客户端子系统(306)可包括例如电子装置(330)中的视频解码器(310)。视频解码器(310)对已编码的视频数据的传入副本(307)进行解码,且产生可在显示器(312)(例如显示屏)或另一呈现装置(未示出)上呈现的输出视频图片流(311)。在一些流式传输系统中,可根据某些视频编码/压缩标准对已编码的视频数据(304)、视频数据(307)和视频数据(309)(例如视频比特流)进行编码。该些标准的实施例包括ITU-T REC H.265。在实施例中,正在开发的视频编码标准非正式地称为VVC。本申请公开的主题可用于VVC标准的上下文中。
应注意,电子装置(320)和电子装置(330)可包括其它组件(未示出)。举例来说,电子装置(320)可包括视频解码器(未示出),且电子装置(330)还可包括视频编码器(未示出)。
图4示出了根据本申请公开的实施例的视频解码器(410)的框图。视频解码器(410)可设置在电子装置(430)中。电子装置(430)可包括接收器(431)(例如接收电路)。视频解码器(410)可用于代替图3实施例中的视频解码器(310)。
接收器(431)可接收将由视频解码器(410)解码的一个或多个已编码视频序列;在同一实施例或另一实施例中,一次接收一个已编码视频序列,其中每个已编码视频序列的解码独立于其它已编码视频序列。可从信道(401)接收已编码视频序列,所述信道可以是通向存储已编码的视频数据的存储装置的硬件/软件链路。接收器(431)可接收已编码的视频数据以及其它数据,例如,可转发到它们各自的使用实体(未标示)的已编码音频数据和/或辅助数据流。接收器(431)可将已编码视频序列与其它数据分开。为了防止网络抖动,缓冲存储器(415)可耦接在接收器(431)与熵解码器/解析器(420)(此后称为“解析器(420)”)之间。在某些应用中,缓冲存储器(415)是视频解码器(410)的一部分。在其他应用中,缓冲存储器(415)可以在视频解码器(410)的外部(未描绘)。而在其它情况下,在视频解码器(410)的外部设置缓冲存储器(未标示)用于防止网络抖动,且在视频解码器(410)的内部可配置另一缓冲存储器(415)以例如处理播出定时。而当接收器(431)从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据时,也可能不需要配置缓冲存储器(415),或可以将所述缓冲存储器做得较小。当然,为了在互联网等业务分组网络上使用,也可能需要缓冲存储器(415),所述缓冲存储器可相对较大且可具有自适应性大小,且可至少部分地实施于操作系统或视频解码器(410)外部的类似元件(未标示)中。
视频解码器(410)可包括解析器(420)以根据已编码视频序列重建符号(421)。这些符号的类别包括用于管理视频解码器(410)的操作的信息,以及用以控制显示装置(412)(例如,显示屏)等显示装置的潜在信息,所述显示装置不是电子装置(430)的组成部分,但可耦接到电子装置(430),如图4中所示。用于显示装置的控制信息可以是辅助增强信息(Supplemental Enhancement Information,SEI消息)或视频可用性信息(VideoUsability Information,VUI)的参数集片段(未标示)。解析器(420)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行,且可遵循各种原理,包括可变长度编码、霍夫曼编码(Huffman coding)、具有或不具有上下文灵敏度的算术编码等等。解析器(420)可基于对应于群组的至少一个参数,从已编码视频序列中提取用于视频解码器的像素的子群中的至少一个子群的子群参数集。子群可包括图片群组(Group ofPictures,GOP)、图片、图块、切片、宏块、编码单元(Coding Unit,CU)、块、变换单元(TransformUnit,TU)、预测单元(Prediction Unit,PU)等等。解析器(420)还可从已编码视频序列中提取信息,例如变换系数、量化器参数值、运动矢量等等。
解析器(420)可对从缓冲存储器(415)接收的视频序列执行熵解码/解析操作,从而创建符号(421)。
符号(421)的重建可涉及多个不同单元,这取决于已编码视频图片或一部分已编码视频图片(例如:帧间图片和帧内图片、帧间块和帧内块)的类型以及其它因素。涉及哪些单元以及涉及方式可由解析器(420)基于从已编码视频序列中解析的子群控制信息控制。为了简洁起见,未描述解析器(420)与下文的多个单元之间的此类子群控制信息流。
除已经提及的功能块以外,视频解码器(410)可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施例中,这些单元中的许多单元彼此紧密交互并且至少部分地可以彼此集成。然而,出于描述所公开主题的目的,概念上细分成下文的功能单元是适当的。
第一单元是缩放器/逆变换单元451。缩放器/逆变换单元(451)从解析器(420)接收作为(一个或更多个)符号(421)的量化变换系数以及控制信息,包括使用哪种变换方式、块尺寸、量化因子、量化缩放矩阵等。缩放器/逆变换单元(451)可输出包括样本值的块,所述样本值可输入到聚合器(455)中。
在一些情况下,缩放器/逆变换单元(451)的输出样本可属于帧内编码块;即:不使用来自先前重建的图片的预测性信息,但可使用来自当前图片的先前重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元(452)提供。在一些情况下,帧内图片预测单元(452)采用从当前图片缓冲器(458)提取的已重建信息,生成大小和形状与正在重建的块相同的周围块。举例来说,当前图片缓冲器(458)缓冲部分重建的当前图片和/或完全重建的当前图片。在一些情况下,聚合器(455)基于每个样本,将帧内预测单元(452)生成的预测信息添加到由缩放器/逆变换单元(451)提供的输出样本信息中。
在其它情况下,缩放器/逆变换单元(451)的输出样本可属于帧间编码和潜在运动补偿块。在此情况下,运动补偿预测单元(453)可访问参考图片存储器(457)以提取用于预测的样本。在根据符号(421)对提取的样本进行运动补偿之后,这些样本可由聚合器(455)添加到缩放器/逆变换单元(451)的输出(在这种情况下被称作残差样本或残差信号),从而生成输出样本信息。运动补偿预测单元(453)从参考图片存储器(457)内的地址获取预测样本可受到运动矢量控制,且所述运动矢量以所述符号(421)的形式提供给运动补偿预测单元(453)使用,所述符号(421)例如可以包括X、Y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时,从参考图片存储器(457)提取的样本值的内插、运动矢量预测机制等等。
聚合器(455)的输出样本可在环路滤波器单元(456)中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术,所述环路内滤波器技术受控于包括在已编码视频序列(也称作已编码视频比特流)中的参数,且所述参数作为来自解析器(420)的符号(421)可用于环路滤波器单元(456),然而,在其他实施例中,视频压缩技术还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息,以及响应于先前重建且经过环路滤波的样本值。
环路滤波器单元(456)的输出可以是样本流,所述样本流可输出到显示装置(412)以及存储在参考图片存储器(457),以用于后续的帧间图片预测。
一旦完全重建,某些已编码图片就可用作参考图片以用于将来预测。举例来说,一旦对应于当前图片的已编码图片被完全重建,且已编码图片(通过例如解析器(420))被识别为参考图片,则当前图片缓冲器(458)可变为参考图片存储器(457)的一部分,且可在开始重建后续已编码图片之前重新分配新的当前图片缓冲器(458)。
视频解码器(410)可根据例如ITU-T Rec.H.265标准中的预定视频压缩技术执行解码操作。在已编码视频序列遵循视频压缩技术、或标准的语法以及视频压缩技术、或标准中记录的配置文件的意义上,已编码视频序列可符合所使用的视频压缩技术或标准指定的语法。具体地说,配置文件可从视频压缩技术或标准中可用的所有工具中,选择某些工具作为在所述配置文件下可供使用的仅有工具。对于合规性,还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下,层级限制最大图片大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图片大小等。在一些情况下,由层级设定的限制可通过假想参考解码器(HypotheticalReference Decoder,HRD)规范和在已编码视频序列中用信号表示的HRD缓冲器管理的元数据来进一步限定。
在实施例中,接收器(431)可连同已编码视频一起接收附加(冗余)数据。所述附加数据可以是已编码视频序列的一部分。所述附加数据可由视频解码器(410)用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(signal noise ratio,SNR)增强层、冗余切片、冗余图片、前向纠错码等形式。
图5是根据本申请公开的实施例的视频编码器(503)的框图。视频编码器(503)设置于电子装置(520)中。电子装置(520)包括传输器(540)(例如传输电路)。视频编码器(503)可用于代替图3实施例中的视频编码器(303)。
视频编码器(503)可从视频源(501)(并非图5实施例中的电子装置(520)的一部分)接收视频样本,所述视频源可采集将由视频编码器(503)编码的视频图像。在另一实施例中,视频源(501)是电子装置(520)的一部分。
视频源(501)可以提供要由视频编码器(503)编码的呈数字视频样本流形式的源视频序列,该数字视频样本流可以具有任何合适的比特深度(例如:8比特、10比特、12比特等)、任何色彩空间(例如,BT.601Y CrCB、RGB等)和任何合适的采样结构(例如Y CrCb 4:2:0、Y CrCb 4:4:4)。在媒体服务系统中,视频源(501)可以是存储先前已准备的视频的存储装置。在视频会议系统中,视频源501可以是捕获本地图像信息作为视频序列的摄像装置。可将视频数据提供为多个单独的图片,当按顺序观看时,这些图片被赋予运动。图片自身可构建为空间像素阵列,其中取决于所用的取样结构、色彩空间等,每个像素可包括一个或多个样本。所属领域的技术人员可以很容易理解像素与样本之间的关系。下文侧重于描述样本。
根据实施例,视频编码器(503)可实时或在由应用所要求的任何其它时间约束下,将源视频序列的图片编码且压缩成已编码视频序列(543)。施行合适编码速度是控制器(550)的一个功能。在一些实施例中,控制器(550)控制如下文所描述的其它功能单元且在功能上耦接到这些单元。为了简洁起见,图中未标示耦接。由控制器(550)设置的参数可包括速率控制相关参数(图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(group of pictures,GOP)布局,最大运动矢量搜索范围等。控制器(550)可用于具有其它合适的功能,这些功能涉及针对某一系统设计优化的视频编码器(503)。
在一些实施例中,视频编码器(503)用于在编码环路中进行操作。作为简单的描述,在实施例中,编码环路可包括源编码器(530)(例如,负责基于待编码的输入图片和参考图片创建符号,例如符号流)和嵌入于视频编码器(503)中的(本地)解码器(533)。解码器(533)以类似于(远程)解码器创建样本数据的方式,重建符号以创建样本数据(因为在本申请所考虑的视频压缩技术中,符号与已编码视频比特流之间的任何压缩是无损的)。将重建的样本流(样本数据)输入到参考图片存储器(534)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果,因此参考图片存储器(534)中的内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说,编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)也用于一些相关技术。
“本地”解码器(533)的操作可与例如已在上文结合图4详细描述的诸如视频解码器(410)的“远程”解码器相同。然而,另外简要参考图4,当符号可用且熵编码器(545)和解析器(420)能够无损地将符号编码/解码为已编码视频序列时,包括缓冲存储器(415)和解析器(420)在内的视频解码器(410)的熵解码部分,可能无法完全在解码器(533)中实施。
此时可以观察到,除存在于解码器中的解析/熵解码之外的任何解码器技术,也必定以基本上相同的功能形式存在于对应的编码器中。出于此原因,本申请侧重于解码器操作。可简化编码器技术的描述,因为编码器技术与全面地描述的解码器技术互逆。仅在某些区域中需要更详细的描述,并且在下文提供。
在操作期间,在一些实施例中,源编码器(530)可执行运动补偿预测编码,参考来自视频序列中被指定为“参考图片”的一个或多个先前已编码图片,所述运动补偿预测编码对输入图片进行预测性编码。以此方式,编码引擎(532)对输入图片的像素块与参考图片的像素块之间的差异进行编码,所述参考图片可被选作所述输入图片的预测参考。
解码器(533)可基于源编码器(530)创建的符号,对可指定为参考图片的已编码视频数据进行解码。编码引擎(532)的操作可为有损过程。当已编码视频数据可在视频解码器(图5中未示出)处被解码时,重建的视频序列通常可以是带有一些误差的源视频序列的副本。解码器(533)复制解码过程,所述解码过程可由视频解码器对参考图片执行,且可使重建的参考图片存储在参考图片存储器(534)中。以此方式,视频编码器(503)可在本地存储重建的参考图片的副本,所述副本与将由远端视频解码器获得的重建参考图片具有共同内容(不存在传输误差)。
预测器(535)可针对编码引擎(532)执行预测搜索。即,对于将要编码的新图片,预测器(535)可在参考图片存储器(534)中搜索可作为所述新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据,例如参考图片运动矢量、块形状等。预测器(535)可基于样本块逐像素块操作,以找到合适的预测参考。在一些情况下,如根据预测器(535)获得的搜索结果确定输入图片,并且可从参考图片存储器(534)中存储的多个参考图片取得预测参考。
控制器(550)可管理源编码器(530)的编码操作,包括例如设置用于对视频数据进行编码的参数和子群参数。
可在熵编码器(545)中对所有上述功能单元的输出进行熵编码。熵编码器(545)根据例如霍夫曼编码、可变长度编码、算术编码等技术,对各种功能单元生成的符号进行无损压缩,从而将所述符号转换成已编码视频序列。
传输器(540)可缓冲由熵编码器(545)创建的已编码视频序列,从而为通过通信信道(560)进行传输做准备,所述通信信道(560)可以是通向将存储已编码的视频数据的存储装置的硬件/软件链路。传输器(540)可将来自视频编码器(503)的已编码视频数据与要传输的其它数据合并,所述其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。
控制器(550)可管理视频编码器(503)的操作。在编码期间,控制器(550)可以为每个已编码图片指定某一已编码图片类型,但这可能影响可应用于相应的图片的编码技术。例如,通常可将图片指定为以下任一种图片类型:
帧内图片(I图片),其可以是不将序列中的任何其它图片用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片,包括例如独立解码器刷新(Independent Decoder Refresh,“IDR”)图片。所属领域的技术人员了解I图片的变体及其相应的应用和特征。
预测性图片(P图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,所述帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。
双向预测性图片(B图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,所述帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地,多个预测性图片可使用多于两个参考图片和相关联元数据以用于重建单个块。
源图片通常可在空间上细分成多个样本块(例如,4×4、8×8、4×8或16×16个样本的块),且逐块进行编码。这些块可参考其它(已编码)块进行预测编码,根据应用于块的相应图片的编码分配来确定所述其它块。举例来说,I图片的块可进行非预测编码,或所述块可参考同一图片的已经编码的块来进行预测编码(空间预测或帧内预测)。P图片的块可参考一个先前编码的参考图片,通过空间预测或通过时域预测进行预测编码。B图片的块可参考一个或两个先前编码的参考图片,通过空间预测或通过时域预测进行预测编码。
视频编码器(503)可以根据诸如ITU-T Rec.H.265建议书预定的视频编码技术或标准执行编码操作。在其操作中,视频编码器(503)可以执行各种压缩操作,包括利用输入视频序列中的时间和空间冗余的预测性编码操作。因此,已编码视频数据可符合所用视频编码技术或标准指定的语法。
在实施例中,传输器(540)可在传输已编码的视频时传输附加数据。源编码器(530)可将此类数据作为已编码视频序列的一部分。附加数据可包括时间/空间/SNR增强层、冗余图片和切片等其它形式的冗余数据、SEI消息、VUI参数集片段等。
采集到的视频可作为呈时间序列的多个源图片(视频图片)。帧内图片预测(常常简化为帧内预测)利用给定图片中的空间相关性,而帧间图片预测则利用图片之间的(时间或其它)相关性。在实施例中,将正在编码/解码的特定图片分割成块,正在编码/解码的特定图片被称作当前图片。在当前图片中的块类似于视频中先前已编码且仍被缓冲的参考图片中的参考块时,可通过运动矢量对当前图片中的块进行编码。所述运动矢量指向参考图片中的参考块,且在使用多个参考图片的情况下,所述运动矢量可识别参考图片的第三维度。
在一些实施例中,双向预测技术可用于帧间图片预测中。根据双向预测技术,使用两个参考图片,例如解码次序都在视频中的当前图片之前(但显示次序可能分别是过去和将来)的第一参考图片和第二参考图片。可通过指向第一参考图片中的第一参考块的第一运动矢量和指向第二参考图片中的第二参考块的第二运动矢量对当前图片中的块进行编码。具体来说,可通过第一参考块和第二参考块的组合来预测所述块。
此外,合并模式技术可用于帧间图片预测,以改进编码效率。
根据本申请公开的一些实施例,帧间图片预测和帧内图片预测等预测的执行以块为单位。例如,根据HEVC标准,视频图片序列中的图片被划分成编码树单元(CTU)以用于压缩,图片中的CTU具有相同大小,例如64×64像素、32×32像素或16×16像素。一般来说,CTU包括三个编码树块(coding tree block,CTB),所述三个编码树块分别是一个亮度CTB和两个色度CTB。更进一步的,还可将每个CTU以四叉树形式递归地拆分为一个或多个编码单元(coding unit,CU)。举例来说,可将64×64像素的CTU拆分为一个64×64像素的CU,或4个32×32像素的CU,或16个16×16像素的CU。在实施例中,分析每个CU以确定适用于该CU的预测类型,例如帧间预测类型或帧内预测类型。此外,取决于时间和/或空间可预测性,将CU拆分为一个或多个预测单元(prediction unit,PU)。通常,每个PU包括亮度预测块(predictionblock,PB)和两个色度PB。在实施例中,编码(编码/解码)中的预测操作以预测块为单位来执行。以使用亮度预测块作为预测块为例,预测块包括像素值(例如,亮度值)的矩阵,例如8×8像素、16×16像素、8×16像素、16×8像素等等。
图6示出了根据本申请公开的另一实施例的视频编码器(603)的图。视频编码器(603)用于接收视频图片序列中的当前视频图片内的样本值的处理块(例如预测块),且将所述处理块编码到作为已编码视频序列的一部分的已编码图片中。在本实施例中,视频编码器(603)用于代替图3实施例中的视频编码器(303)。
在HEVC实施例中,视频编码器(603)接收用于处理块的样本值的矩阵,所述处理块为例如8×8样本的预测块等。视频编码器(603)使用例如率失真(rate-distortion,RD)优化,来确定是否使用帧内模式、帧间模式或双向预测模式来编码所述处理块。当在帧内模式中编码处理块时,视频编码器(603)可使用帧内预测技术将处理块编码到已编码图片中;当在帧间模式或双向预测模式中编码处理块时,视频编码器(603)可分别使用帧间预测或双向预测技术将处理块编码到已编码图片中。在某些视频编码技术中,合并模式可以是帧间图片预测子模式,其中,在不借助预测器外部的已编码运动矢量分量的情况下,从一个或多个运动矢量预测值导出运动矢量。在某些其它视频编码技术中,可存在适用于主题块的运动矢量分量。在实施例中,视频编码器(603)包括其它组件,例如用于确定处理块模式的模式决策模块(未示出)。
在图6的实施例中,视频编码器(603)包括如图6所示的耦接到一起的帧间编码器(630)、帧内编码器(622)、残差计算器(623)、开关(626)、残差编码器(624)、通用控制器(621)和熵编码器(625)。
帧间编码器(630)用于接收当前块(例如处理块)的样本、比较所述块与参考图片中的一个或多个参考块(例如先前图片和后来图片中的块),生成帧间预测信息(例如根据帧间编码技术的冗余信息描述、运动矢量、合并模式信息),以及基于帧间预测信息使用任何合适的技术计算帧间预测结果(例如已预测块)。在一些实施例中,参考图片是基于已编码的视频信息解码的已解码参考图片。
帧内编码器(622)用于接收当前块(例如处理块)的样本、在一些情况下比较所述块与同一图片中已编码的块、在变换之后生成量化系数、以及在一些情况下还生成帧内预测信息(例如根据一个或多个帧内编码技术的帧内预测方向信息)。在实施例中,帧内编码器(622)还基于帧内预测信息和同一图片中的参考块计算帧内预测结果(例如已预测块)。
通用控制器(621)用于确定通用控制数据,且基于所述通用控制数据控制视频编码器(603)的其它组件。在实施例中,通用控制器(621)确定块的模式,且基于所述模式将控制信号提供到开关(626)。举例来说,当所述模式是帧内模式时,通用控制器(621)控制开关(626)以选择供残差计算器(623)使用的帧内模式结果,且控制熵编码器(625)以选择帧内预测信息,且将所述帧内预测信息添加在比特流中;以及当所述模式是帧间模式时,通用控制器(621)控制开关(626)以选择供残差计算器(623)使用的帧间预测结果,且控制熵编码器(625)以选择帧间预测信息且将所述帧间预测信息添加在比特流中。
残差计算器(623)用于计算所接收的块与选自帧内编码器(622)或帧间编码器(630)的预测结果之间的差(残差数据)。残差编码器(624)用于基于残差数据操作,以对残差数据进行编码以生成变换系数。在实施例中,残差编码器(624)用于将残差数据从时域转换到频域,且生成变换系数。变换系数接着经由量化处理以获得量化的变换系数。在各种实施例中,视频编码器(603)还包括残差解码器(628)。残差解码器(628)用于执行逆变换,且生成已解码残差数据。已解码残差数据可适当地由帧内编码器(622)和帧间编码器(630)使用。举例来说,帧间编码器(630)可基于已解码残差数据和帧间预测信息生成已解码块,且帧内编码器(622)可基于已解码残差数据和帧内预测信息生成已解码块。适当处理已解码块以生成已解码图片,且在一些实施例中,所述已解码图片可在存储器电路(未示出)中缓冲并用作参考图片。
熵编码器(625)用于将比特流格式化以产生已编码的块。熵编码器(625)用于根据诸如HEVC标准等合适标准产生各种信息。在实施例中,熵编码器(625)用于获得通用控制数据、所选预测信息(例如帧内预测信息或帧间预测信息)、残差信息和比特流中的其它合适的信息。注意,根据所公开的主题,当在帧间模式或双预测模式的合并子模式中对块进行编码时,不存在残差信息。
图7是根据本申请公开的另一实施例的视频解码器(710)的图。视频解码器(710)用于接收已编码视频序列的一部分的已编码图像,且对所述已编码图像进行解码生成重建的图片。在实施例中,视频解码器(710)用于代替图3实施例中的视频解码器(310)。
在图7实施例中,视频解码器(710)包括如图7中所示耦接到一起的熵解码器(771)、帧间解码器(780)、残差解码器(773)、重建模块(774)和帧内解码器(772)。
熵解码器(771)可用于根据已编码图片来重建某些符号,这些符号构成所述已编码图片的语法元素。此类符号可包括例如用于对所述块进行编码的模式(例如帧内模式、帧间模式、双向预测模式、后两者的合并子模式或另一子模式)、可识别分别供帧内解码器(772)或帧间解码器(780)用以进行预测的某些样本或元数据的预测信息(例如帧内预测信息或帧间预测信息)、呈例如量化的变换系数形式的残差信息等等。在实施例中,当预测模式是帧间或双向预测模式时,将帧间预测信息提供到帧间解码器(780);以及当预测类型是帧内预测类型时,将帧内预测信息提供到帧内解码器(772)。残差信息可经由逆量化并提供到残差解码器(773)。
帧间解码器(780)用于接收帧间预测信息,且基于所述帧间预测信息生成帧间预测结果。
帧内解码器(772)用于接收帧内预测信息,且基于所述帧内预测信息生成预测结果。
残差解码器(773)用于执行逆量化以提取解量化的变换系数,且处理所述解量化的变换系数,以将残差从频域转换到空间域。残差解码器(773)还可能需要某些控制信息(用以获得量化器参数QP),且所述信息可由熵解码器(771)提供(未标示数据路径,因为这可能仅仅是低量控制信息)。
重建模块(774)用于在空间域中组合由残差解码器(773)输出的残差与预测结果(可由帧间预测模块或帧内预测模块输出),以形成重建的块,所述重建的块可以是重建的图片的一部分,所述重建的图片继而可以是重建的视频的一部分。应注意,可执行解块操作等其它合适的操作来改进视觉质量。
应注意,可使用任何合适的技术来实施视频编码器(303)、视频编码器(503)和视频编码器(603)以及视频解码器(310)、视频解码器(410)和视频解码器(710)。在实施例中,可使用一个或多个集成电路来实施视频编码器(303)、视频编码器(503)和视频编码器(603)以及视频解码器(310)、视频解码器(410)和视频解码器(710)。在另一实施例中,可使用执行软件指令的一个或多个处理器来实施视频编码器(303)、视频编码器(503)和视频编码器(603)以及视频解码器(310)、视频解码器(410)和视频解码器(710)。
对于以非子块模式编码的块,可以基于如下参数构建运动矢量预测值列表:(1)来自空间和时间相邻块的候选预测值;(2)来自HMVP缓冲器的候选预测值;(3)来自现有运动矢量预测值的成对平均值的候选预测值;(4)使用不同参考图片的零运动矢量预测值。这些候选预测值的示例如上所述。
当构建运动矢量预测值列表时,可以执行包括可用性校验和冗余校验的一系列操作。可用性校验用于检查是否以帧间预测模式对空间或时间相邻块进行编码。冗余校验用于检查新的运动矢量预测值是否与运动矢量预测值列表中的任何现有运动矢量预测值相同。例如,针对空间和时间候选执行可用性校验和冗余校验,针对现有候选执行冗余校验。此外,针对现有空间/时间候选或者针对来自HMVP缓冲器的候选,执行冗余校验。当运动矢量预测值列表很长时,这些操作可能需要多个周期来执行。在一些情况下,图片可以被划分成许多小块。针对所有这些小块构建运动矢量预测值列表所需的周期总数可能大于期望值。例如,用于每个编码块的合并候选列表可以与其相邻块不同。因此,期望减少操作次数并简化运动矢量预测值列表的构建处理,特别是对于小的块。
本公开提出了当满足某些块大小约束时,用于简化运动矢量预测值列表的构建处理的改进技术(例如,在合并模式、跳过模式或AMVP模式下)。即,当将当前块视为小块时,可以简化针对当前块的运动矢量预测值列表的构建处理,使得包括更少数目的运动矢量预测值,和/或执行更少的可用性校验和/或冗余校验的操作。
各种阈值可用于指示小块。在实施例中,当当前块的块大小小于或等于阈值时,可以将当前块视为小块。在另一实施例中,当要将当前块进一步划分为多个较小的块,并且多个较小的块中存在至少一个小于或等于阈值时,将当前块视为小块。该阈值可以是亮度样本的预设数目,例如32或64个亮度样本。阈值也可以对应于当前图片的图片分辨率。例如,对于具有高分辨率的图片,阈值可以与具有较小分辨率的图片的阈值相比更大。此外,可以在诸如序列参数集(SPS)、图片参数集(PPS)、切片或图块头部等的比特流或编码视频序列中用信号表示阈值。
根据本公开的各方面,当将当前块视为小块时,可以简化对于当前块的运动矢量预测值列表的构建处理,使得该运动矢量预测值列表的构建处理过程与没有视为小块的块的运动矢量预测值列表的构建过程相比,包括更少的运动矢量预测值。
诸如空间运动矢量预测、时间运动矢量预测和基于历史的运动矢量预测等运动矢量预测类别,均可以包括多个运动矢量预测值。在实施例中,当将当前块视为小块时,可以减少来自这些类别的一个或多个的运动矢量预测值的数目。例如,对于每个运动矢量预测类别,将各个运动矢量预测值的子集包括在运动矢量预测值列表中,相比于将所有运动矢量预测值均包括在列表中,上述运动矢量预测值列表更短。运动矢量预测值的子集可以是来自每个类别或某些类别中的前N个(例如N=1,2等)候选,其中N是小于各个类别的所有可能候选的数目的整数。然而,在其他实施例中,可以选择其他预定候选。每个类别或某些类别的数目N可以相同或者不同。此外,每个类别或某些类别的运动矢量预测值的子集的选择可以相同或者不同。在一个示例中,运动矢量预测值列表中仅允许前N个空间和/或时间候选,其中数目N小于所有可能的空间和时间候选的数目。在一些示例中,对于空间和时间候选,N可以不同。
在实施例中,对于空间运动矢量预测类别和时间运动矢量预测类别,空间运动矢量预测值的子集和时间运动矢量预测值的子集被包括在运动矢量预测值列表中,其后是HMVP候选和其他。在另一实施例中,运动矢量预测值列表不包括任何空间和/或时间运动矢量预测值。即,不允许空间和/或时间候选,并且运动矢量预测值列表以HMVP候选开始。
根据本公开的各方面,当将当前块认为是小块时,可以简化对于当前块的运动矢量预测值列表的构建处理,使得执行更少的操作,例如执行更少的冗余校验操作。冗余校验是指将新的运动矢量预测值与运动矢量预测值列表中的任何现有运动矢量预测值进行比较。
在实施例中,可以去除两个空间和时间候选中的一个或多个冗余校验。例如,运动矢量预测值列表可以不针对可能的空间预测矢量值进行冗余校验,即不将可能的空间预测矢量值与运动矢量预测值列表中的现有空间运动矢量预测值进行比较。在另一示例中,运动矢量预测值列表可以不针对可能的时间运动矢量预测值进行冗余校验,即不将可能的时间运动矢量预测值与运动矢量预测值列表中的现有时间运动矢量预测值进行比较。
在实施例中,可以去除来自HMVP缓冲器的候选、与来自空间和/或时间相邻位置的现有候选中的一个或多个冗余校验。例如,运动矢量预测值列表可以不针对可能的基于历史的运动矢量预测值进行冗余校验,即不将可能的基于历史的运动矢量预测值与运动矢量预测值列表中的现有空间运动矢量预测值进行比较。在另一示例中,运动矢量预测值列表可以不针对可能的基于历史的运动矢量预测值进行冗余校验,即不将可能的基于历史的运动矢量预测值与运动矢量预测值列表中的现有时间运动矢量预测值进行比较。
在实施例中,不执行冗余校验。即,构建运动矢量预测值列表而不执行任何冗余校验。
图8示出了根据本公开的一些实施例的概述简化运动矢量预测值列表的构建处理的示例性处理(800)的流程图。在各种实施例中,处理(800)由诸如以下的处理电路执行:终端装置(210)、(220)、(230)和(240)中的处理电路,执行视频编码器(303)的功能的处理电路,执行视频解码器(310)的功能的处理电路,执行视频解码器(410)的功能的处理电路,执行帧内预测模块(452)的功能的处理电路,执行视频编码器(503)的功能的处理电路,执行预测器(535)的功能的处理电路,执行帧内编码器(622)的功能的处理电路,执行帧内解码器(772)的功能的处理电路等。在一些实施例中,处理(800)以软件指令实现,因此,当处理电路执行软件指令时,处理电路执行处理(800)。
处理(800)通常可以在步骤(S801)处开始,其中处理(800)确定当前块是否要被进一步划分。如果当前块被确定为不被进一步划分,则处理(800)将进行到步骤(S802),否则处理(800)将进行到步骤(S803)。
在步骤(S802)处,处理(800)确定当前块的块大小是否小于或等于阈值。如果确定当前块的块大小小于或等于阈值,则处理(800)将进行到步骤(S805),否则处理(800)将进行到步骤(S806)。
在步骤(S803)处,处理(800)将当前块划分为多个较小块,然后进行到步骤(S804)。
在步骤(S804)处,处理(800)确定多个较小块中是否存在至少一个的块大小是否小于或等于阈值。该阈值可以是亮度样本的预设数目,或者可以对应于当前图片的图片分辨率,或者可以在编码视频序列中用信号表示。如果确定多个较小块中存在至少一个的块大小小于或等于阈值,则处理(800)将进行到步骤(S805),否则处理(800)将进行到步骤(S806)。
在一些实施例中,步骤(S801)和/或步骤(S803)是可选的并且可以不执行。例如,如果当前块的解码预测信息指示当前块的分区大小,且该分区大小指示当前块将被进一步划分为多个较小的块。处理(800)将确定分区大小是否小于或等于阈值。该步骤与步骤(S804)相同。如果确定分区大小小于或等于阈值,则处理(800)将进行到步骤(S805),否则,处理将进行到步骤(S806)。在另一实施例中,在已经执行了任何块划分之后,执行块与阈值的比较。
在步骤(S805)处,处理(800)构建包括第一数目的运动矢量预测值的运动矢量预测值列表,然后进行到步骤(S807)。
在步骤(S806)处,处理(800)构建包括第二数目的运动矢量预测值的运动矢量预测值列表。第二数目大于第一数目。即,通过例如以上述方式将运动矢量预测值的第二数目减少到运动矢量预测值的第一数目,来简化运动矢量预测值列表。然后,处理(800)进行到步骤(S807)。
在步骤(S807)处,处理(800)基于运动矢量预测值列表来重建当前块。然后,处理(800)终止。
图9示出了概述根据本公开的一些实施例的示例性处理(900)的流程图。在各种实施例中,处理(900)由诸如以下的处理电路执行:终端装置(210)、(220)、(230)和(240)中的处理电路,执行视频编码器(303)的功能的处理电路,执行视频解码器(310)的功能的处理电路,执行视频解码器(410)的功能的处理电路,执行帧内预测模块(452)的功能的处理电路,执行视频编码器(503)的功能的处理电路,执行预测器(535)的功能的处理电路,执行帧内编码器(622)的功能的处理电路,执行帧内解码器(772)的功能的处理电路等。在一些实施例中,处理(900)以软件指令实现,因此,当处理电路执行软件指令时,处理电路执行处理(900)。
处理(900)通常可以在步骤(S901)处开始,其中处理(900)对作为编码视频序列的一部分的当前图片中的当前块的预测信息进行解码。在对预测信息进行解码之后,处理(900)进行到步骤(S902)。
在步骤(S902)处,处理(900)确定当前块的大小是否小于或等于阈值。然后,处理(900)进行到步骤(S903)。该阈值可以是亮度样本的预设数目,例如32或64个亮度样本。该阈值可以对应于当前图片的图片分辨率。该阈值可以在编码视频序列中用信号表示。
在步骤(S903)处,处理(900)构建包括多个运动矢量预测值的运动矢量预测值列表。运动矢量预测值的数目基于当前块的大小是否被确定为小于或等于阈值。在实施例中,当确定当前块的大小小于或等于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目为第一数目,否则,运动矢量预测值列表中包括的运动矢量预测值的数目为第二数目,第二数目大于第一数目。
在一些实施例中,预测信息指示当前块将被进一步划分为多个较小的块,处理(900)将当前块划分为多个较小的块,并且确定多个较小的块中是否存在至少一个的块大小是否小于或等于阈值。处理(900)还基于多个较小块中是否存在至少一个的块大小小于或等于阈值来构建运动矢量预测值列表。当确定多个较小块中存在至少一个的块大小小于或等于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目为第一数目;否则,运动矢量预测值列表中包括的运动矢量预测值的数目为第二数目。
在一些实施例中,预测信息指示当前块的分区大小。在这样的实施例中,处理(900)确定分区大小是否小于或等于阈值。处理(900)还基于分区大小是否被确定为小于或等于阈值来构建运动矢量预测值列表。当确定分区大小小于或等于阈值时,运动矢量预测值列表中包括的运动矢量预测值的数目为第一数目;否则,运动矢量预测值列表中包括的运动矢量预测值的数目为第二数目。
在实施例中,基于第一组空间或时间运动矢量预测值来构建包括第一数目的运动矢量预测值的运动矢量预测值列表。第一组空间或时间运动矢量预测值小于第二组空间或时间运动矢量预测值,该第二组空间或时间运动矢量预测值用于构建包括第二数目的运动矢量预测值的运动矢量预测值列表。
在实施例中,包括第一数目的运动矢量预测值的运动矢量预测值列表不包括任何空间或时间运动矢量预测值。
在实施例中,减少了用于构建包括第一数目的运动矢量预测值的运动矢量预测值列表的冗余校验的数目。例如,执行第一数目的冗余校验以构建包括第一数目的运动矢量预测值的运动矢量预测值列表,并且执行第二数目的冗余校验以构建包括第二数目的运动矢量预测值的运动矢量预测值列表。冗余校验的第一数目小于冗余校验的第二数目。
在实施例中,第一数目的冗余校验不包括以下中的至少一个:(i)可能的空间运动矢量预测值与运动矢量预测值列表中的第一现有空间运动矢量预测值之间的比较,(ii)可能的时间运动矢量预测值与运动矢量预测值列表中的第一现有时间运动矢量预测值之间的比较,(iii)可能的基于历史的运动矢量预测值与运动矢量预测值列表中的第一现有空间运动矢量预测值或另一现有空间运动矢量预测值之间的比较,以及(iv)可能的基于历史的运动矢量预测值与运动矢量预测值列表中的第一现有时间运动矢量预测值或另一现有时间运动矢量预测值之间的比较。
在实施例中,构建包括第一数目的运动矢量预测值的运动矢量预测值列表而不执行任何冗余校验。
在实施例中,运动矢量预测值中的至少一个将当前图片用作参考图片,使得运动矢量预测值中的至少一个的参考块在当前图片内。
在步骤(S904)处,处理(900)基于运动矢量预测值列表来重建当前块。
在重建当前块之后,处理(900)终止。
尽管以上实施例是基于除了减少运动矢量预测值的数目之外减少冗余校验的数目,但是要注意的是,在其他实施例中,可以减少冗余校验的数目而不减少运动矢量预测值的数目。
运动矢量预测方法可以使用与当前图片不同的图片作为参考图片。然而,可以从当前图片内的先前重建的区域来进行运动矢量预测或块补偿。这样的运动矢量预测或块补偿可以被称为帧内图片块补偿、当前图片参考(current picture referencing,CPR)或帧内块拷贝(intra block copy,IBC)。在IBC预测模式中,将指示当前图片内的当前块与参考块之间的偏移的位移矢量称为块矢量(block vector,BV)。参考块已在当前块之前被重建。注意,BV可以被认为是本申请中讨论的MV。
本申请实施例还提供了一种视频解码的装置,该装置包括:
信息解码模块,用于对编码视频序列的当前图片中的当前块的预测信息进行解码;
大小判断模块,用于确定所述当前块的大小是否小于或等于阈值;
列表构建模块,用于构建包括多个运动矢量预测值的运动矢量预测值列表,所述运动矢量预测值的数目基于所述当前块的大小是否小于或等于所述阈值的确定结果来确定;
重建模块,用于基于所述运动矢量预测值列表来重建所述当前块。
可选的,所述列表构建模块具体用于:
当确定所述当前块的大小小于或等于所述阈值时,所述运动矢量预测值列表中包括的运动矢量预测值的数目是第一数目;
当确定所述当前块的大小大于所述阈值时,所述运动矢量预测值列表中包括的运动矢量预测值的数目是第二数目,所述第二数目大于所述第一数目。
可选的,所述列表构建模块具体用于:
当所述预测信息指示所述当前块的分区大小时,基于所述分区大小是否小于或等于所述阈值的确定结果,构建所述运动矢量预测值列表,其中,
当确定所述分区大小小于或等于所述阈值时,所述运动矢量预测值列表中包括的运动矢量预测值的数目是所述第一数目;
当确定所述分区大小大于所述阈值时,所述运动矢量预测值列表中包括的运动矢量预测值的数目是所述第二数目。
可选的,所述阈值是亮度样本的预设数目。
可选的,所述阈值对应于所述当前图片的图片分辨率。
可选的,在所述编码视频序列中用信号表示所述阈值。
可选的,所述列表构建模块具体用于:
基于第一组空间或时间运动矢量预测值,构建包括所述第一数目的运动矢量预测值的运动矢量预测值列表,所述第一组空间或时间运动矢量预测值小于第二组空间或时间运动矢量预测值,所述第二组空间或时间运动矢量预测值用于构建包括所述第二数目的运动矢量预测值的运动矢量预测值列表。
上述技术可实现为计算机软件,该计算机软件使用计算机可读指令,并物理存储于一个或多个计算机可读介质中。例如,图10示出了适于实现本申请公开的主题的某些实施例的计算机系统(1000)。
可以使用任何合适的机器代码或计算机语言来编码计算机软件,可对机器代码或计算机语言进行汇编、编译、链接等操作以创建包括指令的代码,该指令可以由一个或多个计算机中央处理单元(CPU)、图形处理单元(GPU)等直接执行或者通过解译、微代码执行等来执行。
指令可以在各种类型的计算机或其部件——包括例如个人计算机、平板计算机、服务器、智能电话、游戏装置、物联网装置等上执行。
图10中示出的用于计算机系统(1000)的部件本质上是示例性的,其目的不在于暗示对实现本申请公开的实施例中计算机软件的使用范围或功能进行任何限制。部件的配置也不应当被解释为依赖于或受制于计算机系统(1000)的示例性实施例中示出的任一部件或部件组合。
计算机系统1000可以包括某些人机接口输入装置。这样的人机接口输入装置可以响应于由一个或更多个人类用户的输入,该输入的方式例如触觉输入(比如击键、滑动、数据手套移动)、音频输入(比如语音、拍打)、视觉输入(比如手势)、嗅觉输入(未示出)。人机接口装置还可以用于采集某种媒体,该媒体不一定与人类有意识的输入直接相关,比如,音频(诸如:语音、音乐、环境声音)、图像(比如扫描图像、从静态图像摄像装置获取的摄影图像)、视频(比如二维视频、包括立体视频的三维视频)。
输入人机接口装置可以包括以下中的一个或多个(每项仅示出一个):键盘(1001)、鼠标(1002)、触控板(1003)、触摸屏(1010)、数据手套(未示出)、操纵杆(1005)、麦克风(1006)、扫描仪(1007)、摄像装置(1008)。
计算机系统(1000)还可以包括某些人机接口输出装置。这样的人机接口输出装置可以通过例如触觉输出、声音、光和气味/味道来刺激一个或多个人类用户的感觉。该人机接口输出装置可以包括触觉输出装置(比如使用触摸屏(1010)、数据手套(未示出)或操纵杆(1005)产生触觉反馈,但也可使用不作为输入装置的触觉反馈装置)、音频输出装置(比如扬声器(1009)、头戴式耳机(未示出))、视觉输出装置(比如:屏幕(1010),包括CRT屏幕、LCD屏幕、等离子屏幕、OLED屏幕,每种屏幕具有或不具有触摸屏输入能力,每个屏幕具有或不具有触觉反馈能力——其中的一些可能能够通过诸如立体图像输出装置输出二维视觉输出或三维以上输出;虚拟现实眼镜(未示出);全息显示器和烟罐(未示出))、和打印机(未示出)。这些视觉输出装置(例如屏幕(1010))可以通过图形适配器(1050)连接到系统总线(1048)。
计算机系统(1000)还可以包括人类可访问存储装置及其相关联的介质,例如,具有CD/DVD等介质(1021)的(包括CD/DVD ROM/RW)光学介质(1020)、拇指驱动器(1022)、可移除硬盘驱动器或固态驱动器(1023)、传统磁性介质例如磁带和软盘(未示出)、基于专用ROM/ASIC/PLD的装置例如安全加密狗(未示出),等等。
本领域技术人员还应当理解,结合本申请公开的主题所使用的术语“计算机可读介质”不包含传输介质、载波、或其他瞬时信号。
计算机系统(1000)还可以包括到一个或更多个通信网络(1055)的接口(1054)。一个或更多个通信网络(1055)可以例如是无线、有线、光学的。一个或更多个网络1055还可以是局域的、广域的、城域的、车载和工业的、实时的、延时容忍的等。一个或更多个网络1055的示例包括:诸如以太网的局域网,无线LAN,包括GSM、3G、4G、5G、LTE等的蜂窝网络,包括有线电视、卫星电视和地面广播电视的电视有线或无线广域数字网络,包括CANBus的车载和工业网络等。某些网络通常需要外部网络接口适配器,该外部网络接口适配器附接至某些通用数据端口或外围总线(1049)(例如,计算机系统(1000)的USB端口);其他网络通常通过附接至如下所述的系统总线(例如,到PC计算机系统的以太网接口或到智能电话计算机系统的蜂窝网络接口)而集成到计算机系统(1000)的核心中。计算机系统(1000)可通过使用这些网络中的任何网络与其他实体进行通信。这样的通信可以是单向仅接收的(例如,广播电视)、单向仅发送的(例如,从CANBus到某些CANBus装置)、或双向的(例如使用局域或广域数字网络到其他计算机系统)。可以在上述的每个网络和网络接口上使用某些协议和协议栈。
前述人机接口装置、人类可访问存储装置和网络接口可以附接至计算机系统(1000)的核心(1040)。
核心(1040)可以包括一个或多个中央处理单元(CPU)(1041)、图形处理单元(GPU)(1042)、现场可编程门阵列(FPGA)(1043)形式的专用可编程处理单元、用于某些任务的硬件加速器(1044)等。可以通过系统总线(1048)将这些装置连同只读存储器(ROM)(1045)、随机存取存储器(1046)、诸如内部非用户可访问硬盘驱动器、SSD等内部大容量存储装置(1047)连接在一起。在一些计算机系统中,可以以一个或多个物理插头的形式访问系统总线(1048),以通过另外的CPU、GPU等实现扩展。外围装置可以直接地或通过外围总线(1049)附接至核心的系统总线(1048)。外围总线的架构包括PCI、USB等。
CPU(1041)、GPU(1042)、FPGA(1043)和加速器(1044)可以执行某些指令,这些指令可以组合构成前述的计算机代码。该计算机代码可以被存储在ROM(1045)或RAM(1046)中。临时数据也可以存储在RAM(1046)中,而永久数据可以存储在例如内部大容量存储装置(1047)中。可以通过使用缓存存储器来实现存储装置中的任何存储装置的快速存储和检索,该缓存存储器可以与一个或多个CPU(1041)、GPU(1042)、大容量存储装置(1047)、ROM(1045)、RAM(1046)等紧密关联。
计算机可读介质上可具有计算机代码,该代码用于执行各种由计算机实现的操作。介质和计算机代码可以是出于本申请公开的目的而专门设计和构建的,或者可以是计算机软件领域技术人员公知且可用的。
作为示例而非限制,(一个或多个)处理器(包括CPU、GPU、FPGA、加速器等)执行一个或多个有形计算机可读介质中含有的软件,从而使具有架构(1000)的计算机系统——特别是核心(1040)——可以发挥功能。这样的计算机可读介质可以是与前文介绍的用户可访问的大容量存储装置相关联的介质,也可以是具有非暂态性核心(1040)的某些存储装置,比如核心内大容量存储装置(1047)或ROM(1045)。可以在这样的装置中存储实现本申请公开的各种实施例的软件,并且由核心(1040)执行所述软件。根据特定需要,计算机可读介质可以包括一个或多个存储装置或芯片。软件可以使核心(1040)——特别是其中的处理器(包括CPU、GPU、FPGA等)——执行本文描述的特定处理或其中特定部分,包括定义存储在RAM(1046)中的数据结构以及根据由软件定义的处理修改该数据结构。另外地或替选地,计算机系统可以逻辑硬连线的方式、或以其他表现为电路(例如,加速器(1044))的方式来发挥功能,该逻辑硬连线或者电路可以代替软件或与软件一起操作,以执行本文描述的特定处理或其中特定部分。在合适的情况下,所涉及的软件可以涵盖逻辑,反之,所涉及的逻辑也可以涵盖软件。在合适的情况下,所涉及的计算机可读介质可以涵盖存储所执行软件的电路(比如集成电路(IC))、含有所执行逻辑的电路、或以上两者。本申请公开涵盖任何合适的硬件与软件的组合。
虽然本申请已描述了若干示例性实施例,但存在落入本申请公开的范围内的改变、置换和各种等效替代。因此能够理解,本领域技术人员能够设想出多种系统和方法,这些系统和方法虽然在本文中没有明确示出或描述,但体现本申请公开的原理并且因此落入其精神和范围内。
附录A:首字母缩略词
AMVP:高级运动矢量预测
ASIC:专用集成电路
BMS:基准设置
BS:边界强度
BV:块矢量
CANBus:控制器局域网总线
CD:光盘
CPR:当前图片参考
CPU:中央处理单元
CRT:阴极射线管
CTB:编码树块
CTU:编码树单元
CU:编码单元
DPB:解码器图片缓冲器
DVD:数字视频光盘
FPGA:现场可编程门区
GOP:图片群组
GPU:图形处理单元
GSM:全球移动通信系统
HDR:高动态范围
HEVC:高效视频编码
HRD:假设参考解码器
IBC:块内复制
IC:集成电路
JEM:联合开发模型
LAN:局域网
LCD:液晶显示器
LIC:局部照明补偿
LTE:长期演进
MR-SAD:去除均值的绝对差之和
MR-SATD:去除均值的绝对阿达玛变换差之和
MV:运动矢量
OLED:有机发光二极管
PB:预测块
PCI:外围组件互连
PLD:可编程逻辑装置
PPS:图片参数集
PU:预测单元
RAM:随机存取存储器
ROM:只读存储器
SCC:屏幕内容编码
SDR:标准动态范围
SEI:补充增强信息
SMVP:空间运动矢量预测值
SNR:信噪比
SPS:序列参数集
SSD:固态驱动器
TMVP:时间运动矢量预测值
TU:变换单元
USB:通用串行总线
VUI:视频可用性信息
VVC:多功能视频编码
附图文字
图1A
Related Art 相关技术
图1B
Related Art 相关技术
PLANAR MODE 平面模式
DC MODE DC模式
图1C
Related Art 相关技术
111 当前块
图1D
Related Art 相关技术
121 同位块
图1E
Related Art 相关技术
131 当前块
图1F
Related Art 相关技术
152 同位块
151 同位图片
149 运动移位
142 当前块
141 当前图片
图1G
Related Art 相关技术
Load a table with HMVP candidates 加载具有HMVP候选的表
Decode a block with HMVP candidates 使用HMVP候选对块进行解码
Update the table with decoded motion information 使用解码的运动信息更新表
图1H
Related Art 相关技术
Table before update 更新前的表
Redundant candidates after redundancy check 冗余校验后的冗余候选
Table after update 更新后的表
HMVP candidates index in the table 表中的HMVP候选索引
Redundant HMVP 冗余HMVP
HMVP candidate to be added 要添加的HMVP候选
图2
250 网络
图4
401 信道
431 接收器
415 缓冲存储器
420 解析器
421 符号
451 缩放器/逆变换单元
452 帧内预测
453 运动补偿预测
456 环路滤波器
457 参考图片存储器
458 当前图片缓冲器
图5
SOURCE VIDEO SEQUENCE 源视频序列
550 控制器
530 源编码器
532 编码引擎
535 预测器
534 参考图片存储器
533 解码器
545 熵编码器
540 传输器
560 信道
图6
BLOCK DATA 块数据
REFERENCE PICTURES 参考图片
GENERAL CONTROL DATA 通用控制数据
INTRA PREDICTION RESULT 帧内预测结果
INTRA PREDICTION INFORMATION 帧内预测信息
INTER PREDICTION RESULT 帧间预测结果
INTER PREDICTION INFORMATION 帧间预测信息
CODED VIDEO SEQUENCE 编码视频序列
621 通用控制器
622 帧内编码器
624 残差编码器
625 熵编码器
628 残差解码器
630 帧间编码器
图7
CODED VIDEO SEQUENCE 编码视频序列
REFERENCE PICTURES 参考图片
INTRA PREDICTION INFORMATION 帧内预测信息
INTRA PREDICTION RESULT 帧内预测结果
INTER PREDICTION INFORMATION 帧间预测信息
INTER PREDICTION RESULT 帧间预测结果
RECONSTRUCTED PICTURE 重建图片
771 熵解码器
772 帧内解码器
773 残差解码器
780 帧间解码器
774 重建
图8
Start 开始
S801 当前块要被进一步划分?
S802 当前块小于或等于阈值?
S803 将当前块划分为多个较小的块。
S804 一个较小块小于或等于阈值?
S805 构建包括第一数目的运动矢量预测值的运动矢量预测值列表。
S806 构建包括第二数目的运动矢量预测值的运动矢量预测值列表。第二数目大于第一数目。
S807 基于运动矢量预测值列表来重建当前块。
Stop 停止
Yes 是
No 否
图9
Start 开始
S901 对作为编码视频序列的一部分的当前图片中的当前块的预测信息进行解码。
S902 确定当前块的大小是否小于或等于阈值。
S903 构建包括多个运动矢量预测值的运动矢量预测值列表。运动矢量预测值的数目基于当前块的大小是否被确定为小于或等于阈值。
S904 基于运动矢量预测值列表来重建当前块。
Stop 停止
图10
1044 加速器
1048 系统总线
1050 图形适配器
1054 网络接口
1055 通信网络

Claims (17)

1.一种视频解码的方法,其特征在于,包括:
对编码视频序列的当前图片中的当前块的预测信息进行解码;
当确定所述当前块的大小小于或等于一阈值时,构建包括第一数目的运动矢量预测值的第一运动矢量预测值列表;当所述当前块的大小大于所述阈值时,构建包括第二数目的运动矢量预测值的第二运动矢量预测值列表;所述第二数目大于所述第一数目;
基于所述第一运动矢量预测值列表或所述第二运动矢量预测值列表重建所述当前块;其中,所述第二运动矢量预测值列表至少包括第一类型和第二类型的运动矢量预测值,所述第一类型的运动矢量预测值是空间或时间运动矢量预测值,所述第二类型的运动矢量预测值是基于历史的运动矢量预测值。
2.根据权利要求1所述的方法,其特征在于,当所述预测信息指示所述当前块的分区大小时,所述当确定所述当前块的大小小于或等于一阈值时,构建包括第一数目的运动矢量预测值的第一运动矢量预测值列表;当所述当前块的大小大于所述阈值时,构建包括第二数目的运动矢量预测值的第二运动矢量预测值列表,包括:
当确定所述分区大小小于或等于所述阈值时,构建包括所述第一数目的运动矢量预测值的所述第一运动矢量预测值列表;当确定所述分区大小大于所述阈值时,构建包括所述第二数目的运动矢量预测值的所述第二运动矢量预测值列表。
3.根据权利要求1所述的方法,其特征在于,所述阈值是亮度样本的预设数目。
4.根据权利要求1所述的方法,其特征在于,所述阈值对应于所述当前图片的图片分辨率。
5.根据权利要求1所述的方法,其特征在于,所述第一运动矢量预测值列表包括所述第二类型的运动矢量预测值。
6.根据权利要求1所述的方法,其特征在于,基于第一组空间或时间运动矢量预测值,构建包括所述第一数目的运动矢量预测值的运动矢量预测值列表;所述第一组空间或时间运动矢量预测值小于第二组空间或时间运动矢量预测值,所述第二组空间或时间运动矢量预测值用于构建包括所述第二数目的运动矢量预测值的所述第二运动矢量预测值列表。
7.根据权利要求1所述的方法,其特征在于,包括所述第一数目的运动矢量预测值的所述第一运动矢量预测值列表不包括任何空间或时间运动矢量预测值。
8.根据权利要求1所述的方法,其特征在于,执行第一数目的冗余校验,构建包括所述第一数目的运动矢量预测值的所述第一运动矢量预测值列表;执行第二数目的冗余校验,构建包括所述第二数目的运动矢量预测值的所述运动矢量预测值列表,冗余校验的所述第一数目小于冗余校验的所述第二数目。
9.根据权利要求8所述的方法,其特征在于,所述第一数目的冗余校验不包括以下中的至少一个:(i)可能的空间运动矢量预测值与所述运动矢量预测值列表中的第一现有空间运动矢量预测值之间的比较,(ii)可能的时间运动矢量预测值与所述运动矢量预测值列表中的第一现有时间运动矢量预测值之间的比较,(iii)可能的基于历史的运动矢量预测值与所述运动矢量预测值列表中的第一现有空间运动矢量预测值或另一现有空间运动矢量预测值之间的比较,以及(iv)所述可能的基于历史的运动矢量预测值与所述运动矢量预测值列表中的第一现有时间运动矢量预测值或另一现有时间运动矢量预测值之间的比较。
10.根据权利要求1所述的方法,其特征在于,构建包括所述第一数目的运动矢量预测值的所述第一运动矢量预测值列表而不执行任何冗余校验。
11.根据权利要求1所述的方法,其特征在于,所述运动矢量预测值中的至少一个使用所述当前图片作为参考图片。
12.一种视频编码的方法,用于产生比特流,其特征在于,包括:
当确定当前块的大小小于或等于一阈值时,构建包括第一数目的运动矢量预测值的第一运动矢量预测值列表;当所述当前块的大小大于所述阈值时,构建包括第二数目的运动矢量预测值的第二运动矢量预测值列表;所述第二数目大于所述第一数目;
基于所述第一运动矢量预测值列表或所述第二运动矢量预测值列表重建所述当前块;其中,所述第二运动矢量预测值列表至少包括第一类型和第二类型的运动矢量预测值,所述第一类型的运动矢量预测值是空间或时间运动矢量预测值,所述第二类型的运动矢量预测值是基于历史的运动矢量预测值。
13.一种视频解码的装置,其特征在于,包括:
信息解码模块,用于对编码视频序列的当前图片中的当前块的预测信息进行解码;
列表构建模块,用于当确定所述当前块的大小小于或等于一阈值时,构建包括第一数目的运动矢量预测值的第一运动矢量预测值列表;当所述当前块的大小大于所述阈值时,构建包括第二数目的运动矢量预测值的第二运动矢量预测值列表;所述第二数目大于所述第一数目;
重建模块,用于基于所述第一运动矢量预测值列表或所述第二运动矢量预测值列表重建所述当前块;其中,所述第二运动矢量预测值列表至少包括第一类型和第二类型的运动矢量预测值,所述第一类型的运动矢量预测值是空间或时间运动矢量预测值,所述第二类型的运动矢量预测值是基于历史的运动矢量预测值。
14.一种视频编码的装置,其特征在于,包括:
列表构建模块,用于当确定当前块的大小小于或等于一阈值时,构建包括第一数目的运动矢量预测值的第一运动矢量预测值列表;当所述当前块的大小大于所述阈值时,构建包括第二数目的运动矢量预测值的第二运动矢量预测值列表;所述第二数目大于所述第一数目;
重建模块,用于基于所述第一运动矢量预测值列表或所述第二运动矢量预测值列表重建所述当前块;其中,所述第二运动矢量预测值列表至少包括第一类型和第二类型的运动矢量预测值,所述第一类型的运动矢量预测值是空间或时间运动矢量预测值,所述第二类型的运动矢量预测值是基于历史的运动矢量预测值。
15.一种编码装置,其特征在于,所述编码装置包括本地解码器,所述本地解码器用于执行权利要求1至11任一项所述的视频解码的方法。
16.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储程序,所述程序能够由至少一个处理器执行以执行如权利要求1-11任一项所述的视频解码的方法、或权利要求12所述的视频编码的方法。
17.一种计算机设备,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序执行权利要求1-11任一项所述的视频解码的方法、或权利要求12所述的视频编码的方法。
CN202410175461.6A 2018-12-10 2019-12-04 视频编码、解码方法及装置 Pending CN118042127A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201862777735P 2018-12-10 2018-12-10
US62/777,735 2018-12-10
US16/555,549 2019-08-29
US16/555,549 US11470340B2 (en) 2018-12-10 2019-08-29 Simplified merge list construction for small coding blocks
PCT/US2019/064422 WO2020123223A1 (en) 2018-12-10 2019-12-04 Simplified merge list construction for small coding blocks
CN201980062823.8A CN112771869B (zh) 2018-12-10 2019-12-04 视频编码、解码方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201980062823.8A Division CN112771869B (zh) 2018-12-10 2019-12-04 视频编码、解码方法及装置

Publications (1)

Publication Number Publication Date
CN118042127A true CN118042127A (zh) 2024-05-14

Family

ID=70971347

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202410175461.6A Pending CN118042127A (zh) 2018-12-10 2019-12-04 视频编码、解码方法及装置
CN201980062823.8A Active CN112771869B (zh) 2018-12-10 2019-12-04 视频编码、解码方法及装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201980062823.8A Active CN112771869B (zh) 2018-12-10 2019-12-04 视频编码、解码方法及装置

Country Status (6)

Country Link
US (3) US11470340B2 (zh)
EP (1) EP3895427A4 (zh)
JP (2) JP7346566B2 (zh)
KR (1) KR20210069720A (zh)
CN (2) CN118042127A (zh)
WO (1) WO2020123223A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230163002A (ko) * 2018-12-28 2023-11-29 가부시키가이샤 제이브이씨 켄우드 동화상 복호 장치, 동화상 복호 방법, 동화상 복호 프로그램, 동화상 부호화 장치, 동화상 부호화 방법, 동화상 부호화 프로그램, 격납 방법 및 전송 방법
RU2768971C1 (ru) * 2018-12-28 2022-03-28 ДжейВиСиКЕНВУД Корпорейшн Устройство кодирования движущихся изображений, способ кодирования движущихся изображений, программа кодирования движущихся изображений, устройство декодирования движущихся изображений, способ декодирования движущихся изображений и программа декодирования движущихся изображений
WO2020133518A1 (zh) 2018-12-29 2020-07-02 深圳市大疆创新科技有限公司 视频处理方法和设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105915903B (zh) * 2011-03-08 2017-09-22 Jvc 建伍株式会社 动图像编码装置以及动图像编码方法
CN107071470B (zh) 2011-06-27 2020-02-07 三星电子株式会社 对图像进行解码的方法
JP5972888B2 (ja) * 2011-09-29 2016-08-17 シャープ株式会社 画像復号装置、画像復号方法および画像符号化装置
US9571833B2 (en) * 2011-11-04 2017-02-14 Nokia Technologies Oy Method for coding and an apparatus
US9426463B2 (en) 2012-02-08 2016-08-23 Qualcomm Incorporated Restriction of prediction units in B slices to uni-directional inter prediction
US20140092978A1 (en) * 2012-10-01 2014-04-03 Nokia Corporation Method and apparatus for video coding
WO2015006884A1 (en) 2013-07-19 2015-01-22 Qualcomm Incorporated 3d video coding with partition-based depth inter coding
EP3876541A1 (en) * 2015-09-02 2021-09-08 Mediatek Inc. Fast sum of absolute differences calculation for motion vector derivation in video coding
US10623774B2 (en) * 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
US10506228B2 (en) 2016-10-04 2019-12-10 Qualcomm Incorporated Variable number of intra modes for video coding
JP2020031252A (ja) 2016-12-22 2020-02-27 シャープ株式会社 画像復号装置及び画像符号化装置
US10506230B2 (en) * 2017-01-04 2019-12-10 Qualcomm Incorporated Modified adaptive loop filter temporal prediction for temporal scalability support
US10986360B2 (en) * 2017-10-16 2021-04-20 Qualcomm Incorproated Various improvements to FRUC template matching
US10362330B1 (en) 2018-07-30 2019-07-23 Tencent America LLC Combining history-based motion vector prediction and non-adjacent merge prediction
CN118678108A (zh) * 2018-10-09 2024-09-20 三星电子株式会社 视频编码和编码方法以及用于发送比特流的设备
EP3868102A4 (en) * 2018-12-21 2021-12-15 Huawei Technologies Co., Ltd. CODERS, DECODERS AND RELATED METHODS USING HISTORY-BASED MOTION VECTOR PREDICTION

Also Published As

Publication number Publication date
US20230232035A1 (en) 2023-07-20
CN112771869B (zh) 2024-01-30
CN112771869A (zh) 2021-05-07
JP2023158110A (ja) 2023-10-26
JP2022507423A (ja) 2022-01-18
US20200186819A1 (en) 2020-06-11
WO2020123223A1 (en) 2020-06-18
US11470340B2 (en) 2022-10-11
KR20210069720A (ko) 2021-06-11
US20220417548A1 (en) 2022-12-29
US11665364B2 (en) 2023-05-30
JP7346566B2 (ja) 2023-09-19
EP3895427A1 (en) 2021-10-20
EP3895427A4 (en) 2022-08-17

Similar Documents

Publication Publication Date Title
CN114745540B (zh) 一种视频编解码方法、装置、设备和介质
CN113196782B (zh) 视频解码方法、装置及可读存储介质
CN110944202B (zh) 视频编解码方法、装置、计算机设备和存储介质
CN113875234B (zh) 视频解码方法、装置和介质
CN112055968B (zh) 视频解码方法、装置、存储介质以及电子设备
CN111010579B (zh) 基于成对平均运动矢量预测的视频解码方法和装置
CN113545084B (zh) 视频编解码的方法、装置以及存储介质
CN113396590B (zh) 视频解码的方法和装置、计算机设备及存储介质
CN113170095B (zh) 用于视频编解码的方法和装置
CN113287308A (zh) 视频编解码方法及装置
CN113647100B (zh) 视频解码方法、视频编码方法、视频解码器、视频编码器及计算机可读介质
CN114979657B (zh) 视频解码的方法、装置、计算机设备及存储介质
CN118660158A (zh) 视频编解码的方法和装置
CN113632465A (zh) 发信号通知用于帧内图像块补偿的预测器候选列表尺寸的方法和装置
CN111726622B (zh) 视频编解码的方法、装置及介质
CN111919440B (zh) 用于视频解码的方法、装置和计算机可读介质
JP7419506B2 (ja) 映像コーディングのための方法及び装置
CN112771869B (zh) 视频编码、解码方法及装置
CN113170208B (zh) 视频解码方法、装置和存储介质
CN113545039B (zh) 视频编解码的方法和装置
CN113841412B (zh) 视频编解码的方法、装置、计算机设备及存储介质
CN113170151B (zh) 具有并行处理能力的基于历史的运动信息缓冲器更新的方法和装置
JP2023513718A (ja) ビデオ符号化のための方法および装置
CN113545062B (zh) 视频解码方法、装置、计算机设备及存储介质
CN114641993B (zh) 用于视频解码的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination