CN114071158A - 视频编解码中的运动信息列表构建方法、装置及设备 - Google Patents

视频编解码中的运动信息列表构建方法、装置及设备 Download PDF

Info

Publication number
CN114071158A
CN114071158A CN202010747207.0A CN202010747207A CN114071158A CN 114071158 A CN114071158 A CN 114071158A CN 202010747207 A CN202010747207 A CN 202010747207A CN 114071158 A CN114071158 A CN 114071158A
Authority
CN
China
Prior art keywords
motion information
information list
list
prediction mode
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010747207.0A
Other languages
English (en)
Inventor
王英彬
许晓中
刘杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010747207.0A priority Critical patent/CN114071158A/zh
Priority to PCT/CN2021/106610 priority patent/WO2022022299A1/zh
Priority to EP21849304.7A priority patent/EP4192013A4/en
Publication of CN114071158A publication Critical patent/CN114071158A/zh
Priority to US17/896,937 priority patent/US20220417550A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请提供了一种视频编解码中的运动信息列表构建方法、装置及设备,涉及视频编解码技术领域。所述方法包括:获取初始的运动信息列表;在该运动信息列表的长度满足条件的情况下,确定至少一个运动信息;将上述至少一个运动信息添加至运动信息列表中,得到初始化更新后的运动信息列表。本申请实施例通过在初始的运动信息列表中包含的运动信息不足时,采用额外的运动信息进行填充,实现对该初始的运动信息列表进行初始化更新,从而在该运动信息列表中提供更多更有效的位移矢量,以取得更好的位移矢量预测效果,提升视频的压缩性能。

Description

视频编解码中的运动信息列表构建方法、装置及设备
技术领域
本申请实施例涉及视频编解码技术领域,特别涉及一种视频编解码中的运动信息列表构建方法、装置及设备。
背景技术
在目前的视频压缩技术中,如VVC(Versatile Video Coding,通用视频编码)和AVS3(Audio Video coding Standard 3,音视频编码标准3)中,视频编解码器通常需要构建运动信息列表以导出预测位移矢量。
但是,当运动信息列表中包含的位移矢量不足时,会导致该运动信息列表无法提供有效的预测位移矢量,这会影响到视频的压缩性能。
发明内容
本申请实施例提供了一种视频编解码中的运动信息列表构建方法、装置及设备,能够在运动信息列表中包含的运动信息不足时,采用额外的运动信息进行填充,以取得更好的位移矢量预测效果,提升视频的压缩性能。所述技术方案如下:
根据本申请实施例的一个方面,提供了一种视频编解码中的运动信息列表构建方法,所述方法包括:
获取初始的运动信息列表;
在所述运动信息列表的长度满足条件的情况下,确定至少一个运动信息;其中,所述长度是指所述运动信息列表中包括的运动信息的数量;
将所述至少一个运动信息添加至所述运动信息列表中,得到初始化更新后的运动信息列表。
根据本申请实施例的一个方面,提供了一种视频编解码中的运动信息列表构建装置,所述装置包括:
列表获取模块,用于获取初始的运动信息列表;
信息确定模块,用于在所述运动信息列表的长度满足条件的情况下,确定至少一个运动信息;其中,所述长度是指所述运动信息列表中包括的运动信息的数量;
列表更新模块,用于将所述至少一个运动信息添加至所述运动信息列表中,得到初始化更新后的运动信息列表。
根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述视频编解码中的运动信息列表构建方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述视频编解码中的运动信息列表构建方法。
还一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述视频编解码中的运动信息列表构建方法。
本申请实施例提供的技术方案可以包括如下有益效果:
通过在初始的运动信息列表中包含的运动信息不足时,采用额外的运动信息进行填充,实现对该初始的运动信息列表进行初始化更新,从而在该运动信息列表中提供更多更有效的位移矢量,以取得更好的位移矢量预测效果,提升视频的压缩性能。
附图说明
图1是本申请示例性示出的一种视频编码过程的基本流程图;
图2是本申请一个实施例提供的帧间预测模式的示意图;
图3是本申请一个实施例提供的候选运动矢量的示意图;
图4是本申请一个实施例提供的帧内块复制模式的示意图;
图5是本申请一个实施例提供的帧内串复制模式的示意图;
图6是本申请一个实施例提供的通信系统的简化框图;
图7是本申请示例性示出的视频编码器和视频解码器在流式传输环境中的放置方式的示意图;
图8是本申请一个实施例提供的视频编解码中的运动信息列表构建方法的流程图;
图9是本申请一个实施例提供的视频编解码中的运动信息列表构建装置的框图;
图10是本申请一个实施例提供的计算机设备的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例进行介绍说明之前,首先结合图1对视频编码技术进行简单介绍。图1示例性示出了一种视频编码过程的基本流程图。
视频信号是指包括多个帧的图像序列。帧(frame)是视频信号空间信息的表示。以YUV模式为例,一个帧包括一个亮度样本矩阵(Y)和两个色度样本矩阵(Cb和Cr)。从视频信号的获取方式来看,可以分为摄像机拍摄到的以及计算机生成的两种方式。由于统计特性的不同,其对应的压缩编码方式也可能有所区别。
在一些主流的视频编码技术中,如H.265/HEVC(High Efficient Video Coding,高效率视频压缩编码)、H.266/VVC(Versatile Video Coding,通用视频编码)标准、AVS(Audio Video coding Standard,音视频编码标准)(如AVS3)中,采用了混合编码框架,对输入的原始视频信号进行如下一系列的操作和处理:
1、块划分结构(Block Partition Structure):输入图像划分成若干个不重叠的处理单元,每个处理单元将进行类似的压缩操作。这个处理单元被称作CTU(Coding TreeUnit,编码树单元),或者LCU(Large Coding Unit,最大编码单元)。CTU再往下,可以继续进行更加精细的划分,得到一个或多个基本编码的单元,称之为CU(Coding Unit,编码单元)。每个CU是一个编码环节中最基本的元素。以下描述的是对每一个CU可能采用的各种编码方式。
2、预测编码(Predictive Coding):包括了帧内预测和帧间预测等方式,原始视频信号经过选定的已重建视频信号的预测后,得到残差视频信号。编码端需要为当前CU决定在众多可能的预测编码模式中,选择最适合的一种,并告知解码端。其中,帧内预测是指预测的信号来自于同一图像内已经编码重建过的区域。帧间预测是指预测的信号来自已经编码过的,不同于当前图像的其他图像(称之为参考图像)。
3、变换编码及量化(Transform&Quantization):残差视频信号经过DFT(DiscreteFourier Transform,离散傅里叶变换)、DCT(Discrete Cosine Transform,离散余弦变换)等变换操作,将信号转换到变换域中,称之为变换系数。在变换域中的信号,进一步进行有损的量化操作,丢失掉一定的信息,使得量化后的信号有利于压缩表达。在一些视频编码标准中,可能有多于一种变换方式可以选择,因此,编码端也需要为当前CU选择其中的一种变换,并告知解码端。量化的精细程度通常由量化参数来决定。QP(Quantization Parameter,量化参数)取值较大,表示更大取值范围的系数将被量化为同一个输出,因此通常会带来更大的失真,及较低的码率;相反,QP取值较小,表示较小取值范围的系数将被量化为同一个输出,因此通常会带来较小的失真,同时对应较高的码率。
4、熵编码(Entropy Coding)或统计编码:量化后的变换域信号,将根据各个值出现的频率,进行统计压缩编码,最后输出二值化(0或者1)的压缩码流。同时,编码产生其他信息,例如选择的模式、运动矢量等,也需要进行熵编码以降低码率。统计编码是一种无损编码方式,可以有效的降低表达同样的信号所需要的码率。常见的统计编码方式有变长编码(Variable Length Coding,简称VLC)或者基于上下文的二值化算术编码(ContentAdaptive Binary Arithmetic Coding,简称CABAC)。
5、环路滤波(Loop Filtering):已经编码过的图像,经过反量化、反变换及预测补偿的操作(上述2~4的反向操作),可获得重建的解码图像。重建图像与原始图像相比,由于存在量化的影响,部分信息与原始图像有所不同,产生失真(distortion)。对重建图像进行滤波操作,例如去块效应滤波(deblocking),SAO(Sample Adaptive Offset,样本自适应偏移量)或者ALF(Adaptive Lattice Filter,自适应格型滤波器)等滤波器,可以有效的降低量化所产生的失真程度。由于这些经过滤波后的重建图像,将作为后续编码图像的参考,用于对将来的信号进行预测,所以上述的滤波操作也被称为环路滤波,及在编码环路内的滤波操作。
根据上述编码过程可以看出,在解码端,对于每一个CU,解码器获得压缩码流后,先进行熵解码,获得各种模式信息及量化后的变换系数。各个系数经过反量化及反变换,得到残差信号。另一方面,根据已知的编码模式信息,可获得该CU对应的预测信号,两者相加之后,即可得到重建信号。最后,解码图像的重建值,需要经过环路滤波的操作,产生最终的输出信号。
一些主流的视频编码标准中,如HEVC、VVC、AVS3等标准中,均采用基于块的混合编码框架。它们将原始的视频数据分成一系列的编码块,结合预测、变换和熵编码等视频编码方法,实现视频数据的压缩。其中,运动补偿是视频编码常用的一类预测方法,运动补偿基于视频内容在时域或空域的冗余特性,从已编码的区域导出当前编码块的预测值。这类预测方法包括:帧间预测、帧内块复制预测、帧内串复制预测等,在具体的编码实现中,可能单独或组合使用这些预测方法。对于使用了这些预测方法的编码块,通常需要在码流显式或隐式地编码一个或多个二维的位移矢量,指示当前块(或当前块的同位块)相对它的一个或多个参考块的位移。
需要注意的是,在不同的预测模式下及不同的实现,位移矢量可能有不同的名称,本文统一按照以下方式进行描述:1)帧间预测模式中的位移矢量称为运动矢量(MotionVector,简称MV);2)IBC(Intra Block Copy,帧内块复制)预测模式中的位移矢量称为块矢量(Block Vector,简称BV);3)ISC(Intra String Copy,帧内串复制)预测模式中的位移矢量称为串矢量(String Vector,简称SV)。帧内串复制也称作“串预测”或“串匹配”等。
MV是指用于帧间预测模式的位移矢量,由当前图像指向参考图像,其值为当前块和参考块之间的坐标偏移量,其中,当前块与参考块在两个不同图像中。在帧间预测模式中,可以引入运动矢量预测,通过对当前块的运动矢量进行预测,得到当前块对应的预测运动矢量,对当前块对应的预测运动矢量与实际运动矢量之间的差值进行编码传输,相较于直接对当前块对应的实际运动矢量进行编码传输,有利于节省比特开销。在本申请实施例中,预测运动矢量是指通过运动矢量预测技术,得到的当前块的运动矢量的预测值。
BV是指用于IBC预测模式的位移矢量,其值为当前块和参考块之间的坐标偏移量,其中,当前块与参考块均在当前图像中。在IBC预测模式中,可以引入块矢量预测,通过对当前块的块矢量进行预测,得到当前块对应的预测块矢量,对当前块对应的预测块矢量与实际块矢量之间的差值进行编码传输,相较于直接对当前块对应的实际块矢量进行编码传输,有利于节省比特开销。在本申请实施例中,预测块矢量是指通过块矢量预测技术,得到的当前块的块矢量的预测值。
SV是指用于ISC预测模式的位移矢量,其值为当前串和参考串之间的坐标偏移量,其中,当前串与参考串均在当前图像中。在ISC预测模式中,可以引入串矢量预测,通过对当前串的串矢量进行预测,得到当前串对应的预测串矢量,对当前串对应的预测串矢量与实际串矢量之间的差值进行编码传输,相较于直接对当前串对应的实际串矢量进行编码传输,有利于节省比特开销。在本申请实施例中,预测串矢量是指通过串矢量预测技术,得到的当前串的串矢量的预测值。
下面对几种不同的预测模式进行介绍:
一、帧间预测模式
如图2所示,帧间预测利用视频时间域的相关性,使用邻近已编码图像的像素预测当前图像的像素,以达到有效去除视频时域冗余的目的,能够有效节省编码残差数据的比特。其中,P为当前帧,Pr为参考帧,B为当前待编码块,Br是B的参考块。B’与B在图像中的坐标位置相同,Br坐标为(xr,yr),B’坐标为(x,y)。当前待编码块与其参考块之间的位移,称为运动矢量(MV),即:
MV=(xr-x,yr-y)。
考虑到时域或空域邻近块具有较强的相关性,可以采用MV预测技术进一步减少编码MV所需要的比特。在H.265/HEVC中,帧间预测包含Merge和AMVP(Advanced MotionVector Prediction,高级运动向量预测)两种MV预测技术。
Merge模式会为当前PU(Prediction Unit,预测单元)建立一个MV候选列表,其中存在5个候选MV(及其对应的参考图像)。遍历这5个候选MV,选取率失真代价最小的作为最优MV。若编解码器依照相同的方式建立候选列表,则编码器只需要传输最优MV在候选列表中的索引即可。需要注意的是,HEVC的MV预测技术还有一种skip模式,是Merge模式的一种特例。在Merge模式找到最优MV后,如果当前块和参考块基本一样,那么不需要传输残差数据,只需要传送MV的索引和一个skip flag。
Merge模式建立的MV候选列表中包含了空域和时域的两种情形,对于BSlice(B帧图像),还包含组合列表的方式。其中,空域最多提供4个候选MV,它的建立如图3中的(a)部分所示。空域列表按照A1→B1→B0→A0→B2的顺序建立,其中B2为替补,即当A1,B1,B0,A0中有一个或多个不存在时,则需要使用B2的运动信息;时域最多只提供1个候选MV,它的建立如图3中的(b)部分所示,由同位PU的MV按下式伸缩得到:
curMV=td*colMV/tb;
其中,curMV表示当前PU的MV,colMV表示同位PU的MV,td表示当前图像与参考图像之间的距离,tb表示同位图像与参考图像之间的距离。若同位块上D0位置PU不可用,则用D1位置的同位PU进行替换。对于B Slice中的PU,由于存在两个MV,其MV候选列表也需要提供两个MVP(Motion Vector Predictor,预测运动矢量)。HEVC通过将MV候选列表中的前4个候选MV进行两两组合,产生了用于B Slice的组合列表。
类似的,AMVP模式利用空域和时域邻近块的MV相关性,为当前PU建立MV候选列表。与Merge模式不同,AMVP模式的MV候选列表中选择最优的预测MV,与当前待编码块通过运动搜索得到的最优MV进行差分编码,即编码MVD=MV-MVP,其中MVD为运动矢量残差(MotionVector Difference);解码端通过建立相同的列表,仅需要MVD与MVP在该列表中的序号即可计算当前解码块的MV。AMVP模式的MV候选列表也包含空域和时域两种情形,不同的是AMVP模式的MV候选列表长度仅为2。
HMVP(History based Motion Vector Prediction,基于历史的运动矢量预测)是H.266/VVC中新采纳的一种MV预测技术。HMVP是基于历史信息的运动矢量预测方法。历史编码块的运动信息被存储在HMVP列表中,并且用作当前CU(Coding Unit,编码单元)的MVP。H.266/VVC将HMVP添加至Merge模式的候选列表中,其顺序在空域和时域MVP之后。HMVP技术以先进先出的队列(First Input First Output,简称FIFO)存储先前编码块的运动信息。如果已存储的候选运动信息与刚刚编码完成的运动信息相同,这个重复的候选运动信息首先会被移除,然后将所有HMVP候选向前移动,并在FIFO的尾部会加入当前编码单元的运动信息。如果当前编码单元的运动信息与FIFO中任意候选的运动信息均不相同,则将最新的运动信息加到FIFO末尾。在向HMVP列表添加新的运动信息时,如果列表已达到最大长度,就去掉FIFO中第一个候选,再将最新的运动信息加到FIFO末尾。在遇到新的CTU(Coding TreeUnit,编码树单元)行时HMVP列表将重置(清空)。在H.266/VVC中,HMVP表大小S设置为6,为了减少冗余检查操作的数量,引入了以下简化:
1.将用于Merge列表生成的HMVP候选的数量设置为(N<=4)?M:(8-N),其中,N表示Merge列表中现有候选的数量,M表示Merge列表中可用的HMVP候选的数量。
2.一旦可用Merge列表的长度达到最大允许的长度减1,则HMVP的合并候选者列表构建过程终止。
二、IBC预测模式
IBC是HEVC屏幕内容编码(Screen Content Coding,简称SCC)扩展中采纳的一种帧内编码工具,它显著的提升了屏幕内容的编码效率。在AVS3和VVC中,也采纳了IBC技术以提升屏幕内容编码的性能。IBC利用屏幕内容视频在空间的相关性,使用当前图像上已编码图像像素预测当前待编码块的像素,能够有效节省编码像素所需的比特。如图4所示,在IBC中当前块与其参考块之间的位移,称为BV(块矢量)。H.266/VVC采用了类似于帧间预测的BV预测技术进一步节省编码BV所需的比特。
三、ISC预测模式
ISC技术按照某种扫描顺序(如光栅扫描、往返扫描和Zig-Zag扫描等)将一个编码块分成一系列像素串或未匹配像素。类似于IBC,每个串在当前图像已编码区域中寻找相同形状的参考串,导出当前串的预测值,通过编码当前串像素值与预测值之间残差,代替直接编码像素值,能够有效节省比特。图5给出了帧内串复制的示意图,深灰色的区域为已编码区域,白色的28个像素为串1,浅灰色的35个像素为串2,黑色的1个像素表示未匹配像素。串1与其参考串之间的位移,即为图5中的串矢量1;串2与其参考串之间的位移,即为图5中的串矢量2。
帧内串复制技术需要编码当前编码块中各个串对应的SV、串长度以及是否有匹配串的标志等。其中,SV表示待编码串到其参考串的位移。串长度表示该串所包含的像素数量。在不同的实现方式中,串长度的编码有多种方式,以下给出几种示例(部分示例可能组合使用):1)直接在码流中编码串的长度;2)在码流中编码处理该串后续的待处理像素数量,解码端则根据当前块的大小N,已处理的像素数量N1,解码得到的待处理像素数量N2,计算得到当前串的长度,L=N-N1-N2;3)在码流中编码一个标志指示该串是否为最后一个串,如果是最后一个串,则根据当前块的大小N,已处理的像素数量N1,计算得到当前串的长度L=N-N1。如果一个像素在可参考的区域中没有找到对应的参考,将直接对未匹配像素的像素值进行编码。
四、AVS3中的帧内预测运动矢量预测
IBC和ISC是AVS3中两种屏幕内容编码工具,他们均以当前图像为参考,通过运动补偿导出编码单元的预测值。考虑到IBC与ISC具有相似的参考区域,BV和SV具有较高的相关性,可通过允许两者之间的预测进一步提高编码效率。AVS3使用一个类似于HMVP的帧内预测历史运动信息表(IntraHMVP)记录这两类编码块的位移矢量信息、位置信息、尺寸信息和重复次数,并由IntraHMVP导出BVP(Block Vector Predictor,预测块矢量)和SVP(String Vector Predictor,预测串矢量)。其中,BVP即为块矢量的预测值,SVP即为串矢量的预测值。为了支持并行编码,如果当前最大编码单元是片中当前行的第一个最大编码单元,帧内预测历史运动信息表中CntIntraHmvp的值初始化为0。
1.预测块矢量的导出
AVS3中采纳了基于类别的块矢量预测(Class based Block Vector Prediction,简称CBVP),类似于HMVP,该方法首先使用一个HBVP(History based Block VectorPrediction,基于历史的块矢量预测)列表存储历史的IBC编码块的信息,除了记录历史编码块的BV信息以外,还记录了历史编码块的位置、大小等信息。对于当前编码块,按以下条件对HBVP中的候选BV进行分类:
类别0:历史编码块的面积大于或等于64像素;
类别1:BV的频率大于或等于2;
类别2:历史编码块左上角的坐标位于当前块左上角坐标的左方;
类别3:历史编码块左上角的坐标位于当前块左上角坐标的上方;
类别4:历史编码块左上角的坐标位于当前块左上角坐标的左上方;
类别5:历史编码块左上角的坐标位于当前块左上角坐标的右上方;
类别6:历史编码块左上角的坐标位于当前块左上角坐标的左下方;
其中,每个类别中的实例按编码顺序的逆序排列(编码顺序距离当前块越近,排序越靠前),第一个历史编码块对应的BV为该类对应的候选BV。然后按类别0到类别6的顺序添加每个类别对应的候选BV至CBVP列表。在向CBVP列表中添加新的BV时,需要检查CBVP列表中是否已存在重复的BV。仅当不存在重复的BV时,才将该BV添加至CBVP列表中。编码端在CBVP列表中选择最佳的候选BV作为BVP,并在码流中编码一个索引,表示最佳的候选BV所对应类别在CBVP列表中的索引。解码端根据该索引从CBVP列表中解码得到BVP。
完成当前预测单元的解码后,如果当前预测单元的预测类型为块复制帧内预测(即IBC),当NumOfIntraHmvpCand大于0时,根据当前预测块的块复制帧内预测运动信息,按下文介绍的方式更新IntraHMVP。当前预测块的帧内预测运动信息包括位移矢量信息、位置信息、尺寸信息和重复次数,其中块复制帧内预测块的位移矢量信息为块矢量;位置信息包括当前预测块左上角横坐标,左上角纵坐标;尺寸信息为宽度与高度的乘积;当前预测块的重复次数初始化为0。
2.预测串矢量的导出
AVS3为ISC编码块中的每个串编码一个索引,指示该串的SVP在IntraHMVP中的位置。类似于帧间预测中的skip模式,当前串的SV等于SVP,无需编码SV与SVP之间的残差。
完成当前预测单元的解码后,如果当前预测单元的预测类型为串复制帧内预测(即ISC),当NumOfIntraHmvpCand大于0时,根据当前预测块的串复制帧内预测运动信息,按下文介绍的方式更新IntraHMVP。当前预测块的串复制帧内预测运动信息包括位移矢量信息、位置信息、尺寸信息和重复次数,其中当前串的位移矢量信息为串矢量;位置信息包括该串第一个像素样本的横坐标和纵坐标,即(xi,yi);尺寸信息为该部分的串长度,即StrLen[i];重复次数初始化为0。
3.帧内预测历史运动信息表更新
帧内预测运动信息包括位移矢量信息、位置信息、尺寸信息和重复次数。完成当前预测单元的解码后,如果当前预测单元的预测类型为块复制帧内预测或串复制帧内预测,且NumOfIntraHmvpCand大于0时,根据当前预测块的帧内预测运动信息,更新帧内预测历史运动信息表IntraHmvpCandidateList,IntraHmvpCandidateList[X]的位移矢量信息、位置信息、尺寸信息和重复次数分别记为intraMvCandX、posCandX、sizeCandX和cntCandX;否则,不执行本条定义的操作。
a)将X初始化为0,将cntCur初始化为0。
b)如果CntIntraHmvp等于0,则IntraHmvpCandidateList[CntIntraHmvp]为当前预测单元的帧内预测运动信息,CntIntraHmvp加1。
c)否则,根据intraMvCur和intraMvCandX是否相等判断当前预测块的帧内预测运动信息和IntraHmvpCandidateList[X]是否相同:
1)如果intraMvCur和intraMvCandX相同,执行步骤d),否则,X加1。
2)如果X小于CntIntraHmvp,执行步骤c);否则,执行步骤e)。
d)cntCur等于cntCandX的值加1。如果sizeCur小于sizeCandX,则当前sizeCur分别等于sizeCandX。
e)如果X小于CntIntraHmvp,则:
1)i从X到CntIntraHmvp-1,令IntraHmvpCandidateList[i]等于IntraHmvpCandidateList[i+1];
2)IntraHmvpCandidateList[CntIntraHmvp-1]等于当前预测单元的帧内预测运动信息。
f)否则,如果X等于CntIntraHmvp且CntIntraHmvp等于NumOfIntraHmvpCand,则:
1)i从0到CntIntraHmvp-1,令IntraHmvpCandidateList[i]等于IntraHmvpCandidateList[i+1];
2)IntraHmvpCandidateList[CntIntraHmvp-1]等于当前预测单元的帧内预测运动信息。
g)否则,如果X等于CntIntraHmvp且CntIntraHmvp小于NumOfIntraHmvpCand,则IntraHmvpCandidateList[CntIntraHmvp]等于当前预测单元的帧内预测运动信息,CntIntraHmvp加1。
在目前的AVS3标准中,IntraHMVP的长度最大为12,在当前行的第一个最大编码单元中IntraHMVP被重置为空,使用已编码/已解码的IBC或ISC编码单元包含的运动信息更新IntraHMVP。当IntraHMVP未填满时,无法提供足够多的预测位移矢量。另外,当IntraHMVP长度为0时,仍需要额外编码位移矢量的索引,却无法提供有效的预测位移矢量,这给编码效率带来不利的影响。
本申请提出了一种运动信息列表的构建方法,当运动信息不足时,该方法为运动信息列表提供额外的运动信息,以取得更好的位移矢量预测效果,提升视频的压缩性能。
如图6所示,其示出了本申请一个实施例提供的通信系统的简化框图。通信系统200包括多个设备,所述设备可通过例如网络250彼此通信。举例来说,通信系统200包括通过网络250互连的第一设备210和第二设备220。在图6的实施例中,第一设备210和第二设备220执行单向数据传输。举例来说,第一设备210可对视频数据例如由第一设备210采集的视频图片流进行编码以通过网络250传输到第二设备220。已编码的视频数据以一个或多个已编码视频码流形式传输。第二设备220可从网络250接收已编码视频数据,对已编码视频数据进行解码以恢复视频数据,并根据恢复的视频数据显示视频图片。单向数据传输在媒体服务等应用中是较常见的。
在另一实施例中,通信系统200包括执行已编码视频数据的双向传输的第三设备230和第四设备240,所述双向传输可例如在视频会议期间发生。对于双向数据传输,第三设备230和第四设备240中的每个设备可对视频数据(例如由设备采集的视频图片流)进行编码,以通过网络250传输到第三设备230和第四设备240中的另一设备。第三设备230和第四设备240中的每个设备还可接收由第三设备230和第四设备240中的另一设备传输的已编码视频数据,且可对所述已编码视频数据进行解码以恢复视频数据,且可根据恢复的视频数据在可访问的显示装置上显示视频图片。
在图6的实施例中,第一设备210、第二设备220、第三设备230和第四设备240可为服务器、个人计算机和智能电话等计算机设备,但本申请公开的原理可不限于此。本申请实施例适用于PC(Personal Computer,个人计算机)、手机、平板电脑、媒体播放器和/或专用视频会议设备。网络250表示在第一设备210、第二设备220、第三设备230和第四设备240之间传送已编码视频数据的任何数目的网络,包括例如有线连线的和/或无线通信网络。通信网络250可在电路交换和/或分组交换信道中交换数据。该网络可包括电信网络、局域网、广域网和/或互联网。出于本申请的目的,除非在下文中有所解释,否则网络250的架构和拓扑对于本申请公开的操作来说可能是无关紧要的。
作为实施例,图7示出视频编码器和视频解码器在流式传输环境中的放置方式。本申请所公开主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字TV(电视)、在包括CD(Compact Disc,光盘)、DVD(Digital Versatile Disc,数字通用光盘)、存储棒等的数字介质上存储压缩视频等等。
流式传输系统可包括采集子系统313,所述采集子系统可包括数码相机等视频源301,所述视频源创建未压缩的视频图片流302。在实施例中,视频图片流302包括由数码相机拍摄的样本。相较于已编码的视频数据304(或已编码的视频码流),视频图片流302被描绘为粗线以强调高数据量的视频图片流,视频图片流302可由电子装置320处理,所述电子装置320包括耦接到视频源301的视频编码器303。视频编码器303可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于视频图片流302,已编码的视频数据304(或已编码的视频码流304)被描绘为细线以强调较低数据量的已编码的视频数据304(或已编码的视频码流304),其可存储在流式传输服务器305上以供将来使用。一个或多个流式传输客户端子系统,例如图7中的客户端子系统306和客户端子系统308,可访问流式传输服务器305以检索已编码的视频数据304的副本307和副本309。客户端子系统306可包括例如电子装置330中的视频解码器310。视频解码器310对已编码的视频数据的传入副本307进行解码,且产生可在显示器312(例如显示屏)或另一呈现装置(未描绘)上呈现的输出视频图片流311。在一些流式传输系统中,可根据某些视频编码/压缩标准对已编码的视频数据304、视频数据307和视频数据309(例如视频码流)进行编码。
应注意,电子装置320和电子装置330可包括其它组件(未示出)。举例来说,电子装置320可包括视频解码器(未示出),且电子装置330还可包括视频编码器(未示出)。其中,视频解码器用于对接收到的已编码视频数据进行解码;视频编码器用于对视频数据进行编码。
需要说明的一点是,本申请实施例提供的技术方案可以应用于H.266/VVC标准、H.265/HEVC标准、AVS(如AVS3)或者下一代视频编解码标准中,本申请实施例对此不作限定。
还需要说明的一点是,本申请实施例提供的方法,各步骤的执行主体可以是解码端设备,也可以是编码端设备。在视频解码和视频编码的过程中,都可以采用本申请实施例提供的技术方案,来构建运动信息列表。解码端设备和编码端设备均可以是计算机设备,该计算机设备是指具备数据计算、处理和存储能力的电子设备,如PC、手机、平板电脑、媒体播放器、专用视频会议设备、服务器等等。
另外,本申请所提供的方法可以单独使用或以任意顺序与其他方法合并使用。基于本申请所提供方法的编码器和解码器,可以由1个或多个处理器或是1个或多个集成电路来实现。下面,通过几个实施例对本申请技术方案进行介绍说明。
请参考图8,其示出了本申请一个实施例提供的视频编解码中的运动信息列表构建方法的流程图。为了便于说明,仅以各步骤执行主体为计算机设备进行介绍说明。该方法可以包括如下几个步骤(801~803):
步骤801,获取初始的运动信息列表。
在本申请实施例中,运动信息列表是用于记录和索引运动信息的列表。运动信息包括位移矢量,如上文介绍的帧间预测模式的运动矢量(MV)、IBC预测模式的块矢量(BV)、ISC预测模式的串矢量(SV)等。
初始的运动信息列表是指初始化构建的运动信息列表。在一个示例中,该初始的运动信息列表为空,即不包含运动信息或者说包含的运动信息的数量为0。在另一个示例中,该初始的运动信息列表不为空,即包含一个或多个运动信息。
在示例性实施例中,该初始的运动信息列表是指在对图像中每个CTU行开始编码(或解码)时初始化构建的运动信息列表;或者,该初始的运动信息列表是指在对图像中每个片开始编码(或解码)时初始化构建的运动信息列表。
在本申请实施例中,图像(picture)是指视频中的一帧或一场。一个图像可以被划分为多个CTU行,每个CTU行可以包括一个或多个CTU。另外,一个图像也可以被划分为多个片(patch),片是指按光栅扫描顺序排列的相邻若干最大编码单元,一个片可以包括一个或多个CTU。在可能的实施例中,在对图像中每个CTU行开始编码(或解码)时,或者在对图像中每个片开始编码(或解码)时,会重置运动信息列表,即初始化构建的运动信息列表为空。
步骤802,在该运动信息列表的长度满足条件的情况下,确定至少一个运动信息。
运动信息列表的长度是指运动信息列表中包括的运动信息的数量。计算机设备在获取初始的运动信息列表之后,进一步确定该初始的运动信息列表的长度。随着在运动信息列表中增减运动信息,运动信息列表的长度也会相应的发生变化。例如,在运动信息列表中添加一个运动信息,则该运动信息列表的长度加1;在运动信息列表中去除一个运动信息,则该运动信息列表的长度减1。
在一个示例中,上述条件为运动信息列表的长度为0,也即运动信息列表为空。在初始的运动信息列表的长度为0的情况下,确定该初始的运动信息列表的长度满足条件,之后通过执行下述步骤对该初始的运动信息列表进行初始化更新。
在另一个示例中,上述条件为运动信息列表的长度小于最大长度。其中,最大长度是指该运动信息列表中最多允许包括的运动信息的数量。例如,假设该运动信息列表的最大长度为N,则表示该运动信息列表中最多允许包括的运动信息的数量为N,N为正整数。在初始的运动信息列表的长度小于最大长度的情况下,确定该初始的运动信息列表的长度满足条件,之后通过执行下述步骤对该初始的运动信息列表进行初始化更新。
在另一个示例中,上述条件为运动信息列表的长度小于预设阈值。可选地,该预设阈值小于运动信息列表的最大长度。例如,假设该运动信息列表的最大长度为6,则该预设阈值可以是2。该预设阈值可以在标准或协议中规定,或者编码端在码流中指示给解码端,本申请实施例对此不做限定。在初始的运动信息列表的长度小于预设阈值的情况下,确定该初始的运动信息列表的长度满足条件,之后通过执行下述步骤对该初始的运动信息列表进行初始化更新。
另外,上述确定的至少一个运动信息,是指待添加至初始的运动信息列表中的运动信息,以实现对该初始的运动信息列表进行初始化更新。该至少一个运动信息可以预先设定(如在标准或协议中预先规定),也可以通过其他方式确定,具体可参见下文实施例中的介绍说明。
步骤803,将上述至少一个运动信息添加至运动信息列表中,得到初始化更新后的运动信息列表。
在一个示例中,不进行查重比对,直接将上述至少一个运动信息添加至运动信息列表中。例如,在运动信息列表为空的情况下,可以直接将上述至少一个运动信息添加至运动信息列表中,不进行查重比对;或者,即便在运动信息列表不为空的情况下,也可以直接将上述至少一个运动信息添加至运动信息列表中,不进行查重比对。
在另一个示例中,将待添加的运动信息与运动信息列表中已有的运动信息进行查重比对;根据查重比对结果对运动信息列表进行初始化更新,得到初始化更新后的运动信息列表。例如,如果待添加的运动信息与运动信息列表中某个已有的运动信息(记为目标运动信息)相同,那么说明存在重复,计算机设备可以将目标运动信息从上述列表中删除之后,再将该待添加的运动信息添加至上述列表中,也可以不将该待添加的运动信息添加至上述列表中。可选地,往运动信息列表中逐个添加运动信息,每添加一个运动信息与列表中已有的运动信息进行一次查重比对。或者,假设运动信息列表的当前长度为L,每添加一个运动信息,和当前运动信息列表的前L项进行查重比对,这样做的原因是,一般初始化更新时添加的运动信息之间不存在重复。或者,与候选块矢量列表的查重方式相类似,只对类别0和类别1的位移矢量进行查重比对。当然,上文介绍的查重比对的方式仅是示例性和解释性的,本申请实施例并不限定还可采用其他方式。
可选地,在将待添加的运动信息添加至运动信息列表中时,可以按照先入先出(First Input First Output,简称FIFO)的原则,从运动信息列表的尾部将待添加的运动信息逐个添加至列表中。
综上所述,本申请实施例提供的技术方案,通过在初始的运动信息列表中包含的运动信息不足时,采用额外的运动信息进行填充,实现对该初始的运动信息列表进行初始化更新,从而在该运动信息列表中提供更多更有效的位移矢量,以取得更好的位移矢量预测效果,提升视频的压缩性能。
在示例性实施例中,以解码端为例,预测位移矢量的导出可以包括以下3个步骤:
1、使用一个历史运动信息列表以先入先出的方式记录解码过程中历史预测单元(如已解码块或已解码串)的运动信息;
2、在对当前预测单元(如当前块或当前串)的位移矢量进行解码时,由历史运动信息列表结合其他运动信息,导出候选运动信息列表;
3、从码流中获取当前预测单元的预测位移矢量在候选运动信息列表中的位置(或称为索引),导出当前预测单元的预测位移矢量。
在本申请实施例中,历史预测单元是指已编码(或已解码)的图像单元,该图像单元可以包括一个或者多个像素,该图像单元可以是块状也可以是串状。对于帧间预测模式和IBC预测模式来说,历史预测单元也称为历史块,是指已编码(或已解码)的图像块。对于ISC预测模式来说,历史预测单元也称为历史串,是指已编码(或已解码)的图像串。
当前预测单元是指当前编码(或解码)的图像单元,该图像单元同样可以包括一个或者多个像素,该图像单元可以是块状也可以是串状。
本申请提出了一种运动信息列表的构建方法,当运动信息不足时,该方法能够为运动信息列表提供额外的运动信息,有以下两种方法:方法1是对上述步骤1中的历史运动信息列表进行填充,方法2是对上述步骤2中的候选运动信息列表进行填充,这两种方法可单独使用,也可以组合使用。
在本实施例中,对方法1进行介绍说明。运动信息列表为历史运动信息列表,该历史运动信息列表用于记录历史的运动信息。
在一个示例中,在对图像中每个CTU行开始编码或解码的情况下,获取初始的历史运动信息列表,然后采用至少一个运动信息对该初始的历史运动信息列表进行初始化更新。
在另一个示例中,在对图像中每个片开始编码或解码的情况下,获取初始的历史运动信息列表,然后采用至少一个运动信息对该初始的历史运动信息列表进行初始化更新。
可选地,上述初始的历史运动信息列表为空。在对该初始的历史运动信息列表进行初始化更新时,添加至该列表中的运动信息的数量,可以等于该历史运动信息列表的最大长度,也可以小于该历史运动信息列表的最大长度。
可选地,在进行历史运动信息列表的填充时,确定待添加的运动信息包括以下至少一项:
1、目标CTU编码或解码完成后的历史运动信息列表中包含的运动信息;
示例性地,目标CTU可以是当前单元所在的CTU行的上一个CTU行中的CTU,如上一个CTU行中的第一个CTU;或者,目标CTU也可以是当前单元所在的片的上一个片中的CTU,如上一个片中的第一个CTU。
例如,对于编码端来说,编码端可以记录目标CTU编码完成后的历史运动信息列表,然后使用该记录的历史运动信息列表中的运动信息,对初始的历史运动信息列表进行初始化更新。
又例如,对于解码端来说,解码端可以记录目标CTU解码完成后的历史运动信息列表,然后使用该记录的历史运动信息列表中的运动信息,对初始的历史运动信息列表进行初始化更新。
2、序列头或图像头中包含的运动信息;
在本示例中,编码端可以在序列头或者图像头中添加一些用于初始化更新的运动信息,然后解码端从该序列头或图像头中解码得到上述用于初始化更新的运动信息。
在一些标准中,图像序列又称视频序列(sequence),是编码位流的最高层语法结构,包括一个或多个连续的图像。图像序列的序列头中包含一些用于解码该图像序列相关的信息。图像的图像头中包含一些用于解码该图像相关的信息。
3、至少一个预设的运动信息。
可选地,预设的运动信息可以在标准或协议中预先规定。
可选地,预设的运动信息包括位移矢量。该位移矢量包括以下至少其中之一:(0,0)、(-w,0)、(-2*w,0)、(0,-h)、(0,-2*h)、(-w,-h)、(-w,-2*h)、(-2*w,-h)、(-2*w,-2*h);其中,w为最小编解码单元的宽度,h为最小编解码单元的高度。可选地,本文中最小编解码单元是指编码器或解码器允许的最小尺寸CU,即上述最小编解码单元的宽度是指编码器或解码器允许的CU的最小宽度,最小编解码单元的高度是指编码器或解码器允许的CU的最小高度。
可选地,对于上述预设的运动信息,还包括位移矢量对应的位置信息、尺寸信息和重复次数中的至少一种。可选地,在历史运动信息列表是基于类别的历史运动信息列表时,如类似上文介绍的HBVP,位移矢量对应的位置信息、尺寸信息和重复次数,会影响到该位移矢量所属的类别。
可选地,预设的运动信息还包括位置信息。假设当前CTU的左上角坐标为(x,y),图像的宽度为pic_w,图像的高度为pic_h,当前CTU的宽度为ctu_w,当前CTU的高度为ctu_h。该位置信息包括以下至少其中之一:
(1)图像的左边界像素的坐标,横坐标为0且纵坐标的取值范围为[0,pic_h-1]);
(2)图像的上边界像素的坐标,横坐标的取值范围为[0,pic_w-1]且纵坐标为0;
(3)当前CTU行的左边界像素的坐标,横坐标为0且纵坐标的取值范围为[y,y+ctu_h-1]);
(4)当前CTU行的上边界像素的坐标,横坐标的取值范围为[0,pic_w-1],纵坐标为y;
(5)当前CTU的左边界像素的坐标,横坐标为x且纵坐标的取值范围为[y,y+ctu_h-1]);
(6)当前CTU的上边界像素的坐标,横坐标的取值范围为[x,x+ctu_w-1],纵坐标为y。
可选地,预设的运动信息包括尺寸信息。可选地,该尺寸信息的值小于或等于第一阈值。例如,该第一阈值可以是HBVP中候选BV分类中类别0对应的阈值,即第一阈值为64像素。在一个示例中,尺寸信息的值设置为最小编码单元(即CU)的尺寸。
可选地,预设的运动信息包括重复次数。可选地,该重复次数的值小于或等于第二阈值。例如,该第二阈值可以是HBVP中候选BV分类中类别1对应的阈值,即第二阈值为2。在一个示例中,重复次数的值初始化设置为0。
在本申请实施例中,预设的运动信息中通过设置位移矢量对应的位置信息、尺寸信息和重复次数等信息,能够实现对预设的运动信息所属的分类进行控制,使得预设的运动信息被划分至合适的分类中,进而为后续添加至该列表中的运动信息保留合适的位置,有助于提升编解码性能。例如,通过限制尺寸信息的值小于或等于第一阈值,或者限制重复次数的值小于或等于第二阈值,使得预设的运动信息不会占用类别0和类别1,而是占用一些优先级更低的类别,为后续添加至该列表中的运动信息保留合适的位置。
可选地,历史运动信息列表的最大长度为N,N为正整数。对该历史运动信息列表进行初始化更新,包括在历史运动信息列表的尾部添加M个运动信息,M为小于或等于N的正整数。例如,历史运动信息列表的最大长度为7,对该历史运动信息列表进行初始化更新,包括在历史运动信息列表的尾部添加2个运动信息,其中一个运动信息包括位移矢量(-w,0)、位置信息(0,0)、尺寸信息8*8和重复次数0,另一个运动信息包括位移矢量(0,-h)、位置信息(0,0)、尺寸信息4*4和重复次数0。
另外,在采用预设的运动信息填充历史运动信息列表时,可以直接填充(0,0)。在一个例子中,假设历史运动信息列表的最大长度为N,该列表的当前长度为M(M小于N),采用预设的位移矢量将该历史运动信息列表填满,那么可以向该历史运动信息列表中填充M-N个位移矢量,这M-N个位移矢量均为(0,0)。
另外,在对初始的历史运动信息列表进行初始化更新时,可以进行查重比对。
综上所述,在本实施例中,在历史运动信息列表中包含的运动信息不足时,采用额外的运动信息进行填充,实现对该历史运动信息列表进行额外填充,使其能够提供更多更有效的候选位移矢量。
在本实施例中,对方法2进行介绍说明。运动信息列表为候选运动信息列表,该候选运动信息列表用于提供候选的预测位移矢量。
在一个示例中,在候选运动信息列表的长度小于门限值的情况下,采用至少一个运动信息对候选运动信息列表进行初始化更新。
可选地,上述门限值是候选运动信息列表的最大长度,例如假设该候选运动信息列表的最大长度为4,那么在候选运动信息列表的长度小于4的情况下,采用额外的运动信息对该候选运动信息列表进行填充。
可选地,上述门限值小于候选运动信息列表的最大长度,例如假设该候选运动信息列表的最大长度为4,门限值可以设置为2,那么在候选运动信息列表的长度小于2的情况下,采用额外的运动信息对该候选运动信息列表进行填充。
可选地,在进行候选运动信息列表的填充时,确定待添加的运动信息包括以下至少一项:
1、序列头或图像头中包含的运动信息;
在本示例中,编码端可以在序列头或者图像头中添加一些用于初始化更新的运动信息,然后解码端从该序列头或图像头中解码得到上述用于初始化更新的运动信息。
2、至少一个预设的运动信息;
可选地,预设的运动信息可以在标准或协议中预先规定。
可选地,预设的运动信息包括位移矢量。该位移矢量包括以下至少其中之一:(0,0)、(-w,0)、(-2*w,0)、(0,-h)、(0,-2*h)、(-w,-h)、(-w,-2*h)、(-2*w,-h)、(-2*w,-2*h)。
在一个示例中,w为当前编解码单元的宽度,且h为当前编解码单元的高度。在本文中,当前编解码单元是指当前正在编码或者解码的CU。即,上述当前编解码单元的宽度是指当前正在编码或者解码的CU的宽度,上述当前编解码单元的高度是指当前正在编码或者解码的CU的高度。
在另一个示例中,w为最小编解码单元的宽度,且h为最小编解码单元的高度。在本文中,最小编解码单元是指编码器或解码器允许的最小尺寸CU,即上述最小编解码单元的宽度是指编码器或解码器允许的CU的最小宽度,最小编解码单元的高度是指编码器或解码器允许的CU的最小高度。
上文介绍了预设的运动信息中包括的位移矢量的两种设置方式。基于当前编解码单元的宽度和高度设置预设的位移矢量,该位移矢量的准确度较高。基于最小编解码单元的宽度和高度设置预设的位移矢量,复杂度较低,使得编解码器不需要针对每个编解码单元动态调整预设的位移矢量。
另外,在采用预设的位移矢量填充候选运动信息列表时,可以直接填充(0,0)。在一个例子中,假设候选运动信息列表的最大长度为7,该列表的当前长度为4,采用预设的位移矢量将该候选运动信息列表填满,那么可以向该候选运动信息列表中填充3个位移矢量,这3个位移矢量均为(0,0)。
3、从其他历史运动信息列表中导出的运动信息,该其他历史运动信息列表包括与当前编解码单元采用不同预测模式的编解码单元的历史运动信息列表;
如果存在多个历史运动信息列表,可以使用其他不为空的历史运动信息列表中导出运动信息来填充当前运动信息不足的候选运动信息列表。例如,在候选运动信息列表用于提供IBC预测模式或ISC预测模式的预测位移矢量的情况下,其他历史运动信息列表包括帧间预测模式对应的历史运动信息列表。又例如,在候选运动信息列表用于提供帧间预测模式的预测位移矢量的情况下,其他历史运动信息列表包括IBC预测模式或ISC预测模式对应的历史运动信息列表。
在一个示例中,存在两个历史运动信息列表,其中一个历史运动信息列表用于记录帧间预测模式的历史单元的运动信息,称为HMVP;另一个历史运动信息列表用于记录IBC预测模式和ISC预测模式的历史单元的运动信息,称为IntraHMVP。在导出IBC预测模式和ISC预测模式的候选位移矢量时,如果IBC预测模式和ISC预测模式对应的候选运动信息列表中的位移矢量不足,可以使用HMVP中的位移矢量进行填充。
4、当前编解码单元的空间相邻单元的运动信息;
当前编解码单元的空间相邻单元是指空间位置上与当前编解码单元相邻的图像单元,如与当前编解码单元存在重合的边或者顶点。
可选地,若当前编解码单元的预测模式为IBC预测模式或ISC预测模式,则空间相邻单元包括采用IBC预测模式或ISC预测模式的空间相邻单元。例如,若当前编解码单元的预测模式为IBC预测模式,则空间相邻单元包括采用IBC预测模式的空间相邻单元,或者包括采用ISC预测模式的空间相邻单元,或者包括采用IBC预测模式以及包括采用ISC预测模式的空间相邻单元。又例如,若当前编解码单元的预测模式为ISC预测模式,则空间相邻单元包括采用ISC预测模式的空间相邻单元,或者包括采用IBC预测模式的空间相邻单元,或者包括采用ISC预测模式的空间相邻单元以及包括采用IBC预测模式的空间相邻单元。
可选地,若当前编解码单元的预测模式为帧间预测模式,则空间相邻单元包括采用帧间预测模式的空间相邻单元。
通过上述方式,采用相同或相近预测模式的运动信息进行列表填充,有助于提升填充至候选运动信息列表中的位移矢量的有效性,从而提升编码性能。
另外,当前编解码单元的空间相邻单元可以包括一个或多个CU,该CU中可以包括一个或多个预测单元(如编解码块或编解码串),那么添加至候选运动信息列表中的位移矢量,可以是该空间相邻单元中全部或者部分的预测单元的位移矢量,如距离当前编解码单元最近的预测单元的位移矢量。
5、基于历史单元列表中记录的信息所确定的运动信息,该历史单元列表中记录有至少一个历史编解码单元的信息。
在示例性实施例中,可以构建历史单元列表,通过该历史单元列表记录历史编解码单元的信息。可选地,该历史编解码单元的信息包括但不限于以下至少一项:历史编解码单元的位置坐标、历史编解码单元的尺寸信息、历史编解码单元的位移矢量等。在本文中,历史编解码单元是指已完成编码或者解码的CU。
例如,假设历史单元列表中包括一个坐标为(xi,yi)的历史编解码单元。如果当前编解码单元的预测模式为IBC预测模式,且当前编解码单元的左上角坐标为(x,y),则基于历史单元列表中记录的信息所确定的运动信息包括位移矢量(xi-x,yi-y),将该位移矢量(xi-x,yi-y)填充至候选运动信息列表中。如果当前编解码单元的预测模式为ISC预测模式,且当前编解码单元中当前串的第一个像素的坐标为(x,y),则基于历史单元列表中记录的信息所确定的运动信息包括位移矢量(xi-x,yi-y),将该位移矢量(xi-x,yi-y)填充至候选运动信息列表中。
可选地,历史单元列表中记录的信息包括以下至少一项:
(1)记录预测模式为IBC预测模式或ISC预测模式的历史编解码单元的信息;
(2)如果历史编解码单元的预测模式为IBC预测模式或帧间预测模式,记录历史编解码单元包含的至少一个编解码块的左上角坐标;
(3)如果历史单元的预测模式为ISC预测模式,记录历史编解码单元包含的至少一个编解码串(可简称为“串”)的坐标。可选地,记录历史单元包含的所有串的坐标,或者记录历史单元包含的长度大于阈值的串的坐标。
另外,在对初始的候选运动信息列表进行初始化更新时,可以进行查重比对。
综上所述,在本实施例中,在候选运动信息列表中包含的运动信息不足时,采用额外的运动信息进行填充,实现对该候选运动信息列表进行额外填充,使其能够提供更多更有效的预测位移矢量。
需要说明的是,本申请实施例提供的技术方案,可以适用于帧内预测模式下的运动信息列表的额外填充,也可以适用于帧间预测模式下的运动信息列表的额外填充。
在一个示例中,本申请实施例提供的技术方案,用于IBC预测模式下的运动信息列表的额外填充。例如,对于IBC预测模式下的历史运动信息列表和/或候选运动信息列表,采用上文介绍的方法进行额外填充。
在另一个示例中,本申请实施例提供的技术方案,用于ISC预测模式下的运动信息列表的额外填充。例如,对于ISC预测模式下的历史运动信息列表和/或候选运动信息列表,采用上文介绍的方法进行额外填充。
在另一个示例中,本申请实施例提供的技术方案,用于IBC预测模式和ISC预测模式共用的运动信息列表的额外填充。例如,IBC预测模式和ISC预测模式可以共用一个历史运动信息列表,如上文介绍的IntraHMVP。或者,IBC预测模式和ISC预测模式也可以共用一个候选运动信息列表,本申请实施例对此不做限定。
以下为AVS3标准文本中关于预测块矢量导出的描述,其中IntraHmvpCandidateList为历史运动信息列表,NumOfIntraHmvpCand为该列表允许的最大长度,CntIntraHmvp为该列表的实际长度,预测块矢量的坐标记为(MvPredXBv,MvPredYBv):
当前预测单元的宽度和高度分别记为widthCur和heightCur,当前预测单元的左上角的横坐标和纵坐标分别记为xCur和yCur。对于X=0~NumOfIntraHmvpCand-1,IntraHmvpCandidateList[X]的宽度和高度分别记为widthCandX和heightCandX,IntraHmvpCandidateList[X]的左上角的横坐标和纵坐标分别记为xCandX和yCandX,IntraHmvpCandidateList[X]的尺寸记为sizeCandX,IntraHmvpCandidateList[X]的重复次数记为cntCandX,IntraHmvpCandidateList[X]的位移矢量记为intraMvCandX。
首先,按以下步骤构建类别blockMotionClassY(Y=0~6):
a)将可选的块复制帧内预测历史运动信息候选项数量NumAllowedHbvpCand初始化为Min(CntIntraHmvp,NumOfIntraHmvpCand)。
b)如果NumAllowedHbvpCand等于0,MvPredXBv和MvPredYBv均等于0,结束导出过程,否则继续执行以下步骤。
c)否则(即如果NumAllowedHbvpCand不等于0),Y从0到6,初始化各类别blockMotionClassY中的块复制帧内预测的运动信息候选项数量cntClassY为0。对于X=0~NumAllowedHbvpCand-1,按以下方法对IntraHmvpCandidateList[X]进行分类如下:
1)如果sizeCandX大于或等于64,将IntraHmvpCandidateList[X]加入blockMotionClass0,将cntClassY的值加1;
2)如果cntCandX大于等于3,将IntraHmvpCandidateList[X]加入blockMotionClass1,将cntClassY的值加1;
3)如果xCandX小于xCur,且yCandX小于yCur,将IntraHmvpCandidateList[X]加入blockMotionClass4,将cntClassY的值加1;
4)否则,如果xCandX大于或等于xCur+widthCur,将IntraHmvpCandidateList[X]加入blockMotionClass5,将cntClassY的值加1;
5)否则,如果yCandX大于或等于yCur+heightCur,将IntraHmvpCandidateList[X]加入blockMotionClass6,将cntClassY的值加1;
6)否则,如果yCandX小于yCur,将IntraHmvpCandidateList[X]加入blockMotionClass3,将cntClassY的值加1;
7)否则,将IntraHmvpCandidateList[X]加入blockMotionClass2,将cntClassY的值加1。
然后,将blockMotionClassY中的帧内块复制运动信息的块矢量记为bvClassY,按以下方法导出候选类列表CbvpCandidateList:
a)将cntCbvp、cntCheck和Y初始化为0;
b)如果cntClassY的值大于0,执行以下步骤:
1)将candIdx初始化为0;
2)如果cntCbvp等于0,CbvpCandidateList[cntCbvp]的块矢量等于bvClassY,cntCbvp加1,执行步骤c);
3)否则,如果CbvpCandidateList[candIdx]的块矢量和bvClassY相同,执行步骤c);
4)否则,candIdx加1,如果candIdx小于cntCheck,执行步骤3);
5)否则,CbvpCandidateList[cntCbvp]的块矢量等于bvClassY,cntCbvp加1。
c)将Y的值加1,执行以下步骤:
1)如果Y的值小于或等于2,将cntCheck的值设置为cntCbvp,然后继续执行步骤b);
2)否则,如果Y小于7,继续执行步骤b);
3)否则,CbvpCandidateList的导出过程结束。
如果cntCbvp等于0,MvPredXBv和MvPredYBv均等于0。否则MvPredXBv和MvPredYBv分别等于CbvpCandidateList[CbvpIndex]的横坐标和纵坐标。
以下给出两个示例,需要将标准本文中“如果cntCbvp等于0,MvPredXBv和MvPredYBv均等于0。否则MvPredXBv和MvPredYBv分别等于CbvpCandidateList[CbvpIndex]的横坐标和纵坐标”该句如下修改:
示例1:采用上文实施例中方法2提供的方式,使用(0,0)填充候选类列表CbvpCandidateList。文本修改如下:
如果cntCbvp小于7,Y从cntCbvp到6,CbvpCandidateList[cntCbvp]的块矢量等于(0,0)。MvPredXBv和MvPredYBv分别等于CbvpCandidateList[CbvpIndex]的横坐标和纵坐标。
示例2:采用上文实施例中方法2提供的方式,使用(0,0),(-w,0),(0,-h),(-w,-h),(-2*w,0),(0,-2*h),(-2*w,-2*h)填充候选类列表CbvpCandidateList。文本修改如下:
如果cntCbvp小于7,执行以下步骤:
a)Y初始化为0;
b)执行以下步骤:
1)将candIdx初始化为0;
2)如果cntCbvp等于0,CbvpCandidateList[cntCbvp]的块矢量等于InitialIntraMvList[Y],cntCbvp加1,执行步骤c);
3)否则,如果CbvpCandidateList[candIdx]的块矢量和InitialIntraMvList[Y]相同,执行步骤c);
4)否则,candIdx加1,如果candIdx小于cntCbvp,执行步骤3);
5)否则,CbvpCandidateList[cntCbvp]的块矢量等于InitialIntraMvList[Y],cntCbvp加1。
c)将Y的值加1,执行以下步骤:
1)如果Y小于7,继续执行步骤b);
2)否则,CbvpCandidateList的导出过程结束。
其中,InitialIntraMvList的长度为7,第0到第6项依次为(0,0),(-w,0),(0,-h),(-w,-h),(-2*w,0),(0,-2*h),(-2*w,-2*h)。MvPredXBv和MvPredYBv分别等于CbvpCandidateList[CbvpIndex]的横坐标和纵坐标。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图9,其示出了本申请一个实施例提供的视频编解码中的运动信息列表构建装置的框图。该装置具有实现上述方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的计算机设备,也可以设置在计算机设备上。该装置900可以包括:列表获取模块910、信息确定模块920和列表更新模块930。
列表获取模块910,用于获取初始的运动信息列表。
信息确定模块920,用于在所述运动信息列表的长度满足条件的情况下,确定至少一个运动信息;其中,所述长度是指所述运动信息列表中包括的运动信息的数量。
列表更新模块930,用于将所述至少一个运动信息添加至所述运动信息列表中,得到初始化更新后的运动信息列表。
在示例性实施例中,所述运动信息列表为历史运动信息列表,所述历史运动信息列表用于记录历史的运动信息。
在示例性实施例中,所述列表更新模块930,用于:
在对图像中每个CTU行开始编码或解码的情况下,采用所述至少一个运动信息对所述历史运动信息列表进行初始化更新;
或者,
在对图像中每个片开始编码或解码的情况下,采用所述至少一个运动信息对所述历史运动信息列表进行初始化更新。
在示例性实施例中,所述至少一个运动信息包括以下至少一项:
目标CTU编码或解码完成后的历史运动信息列表中包含的运动信息;
序列头或图像头中包含的运动信息;
至少一个预设的运动信息。
在示例性实施例中,所述预设的运动信息包括位移矢量;所述位移矢量包括以下至少其中之一:
(0,0)、(-w,0)、(-2*w,0)、(0,-h)、(0,-2*h)、(-w,-h)、(-w,-2*h)、(-2*w,-h)、(-2*w,-2*h);
其中,w为最小编解码单元的宽度,h为最小编解码单元的高度。
在示例性实施例中,所述预设的运动信息包括位置信息;所述位置信息包括以下至少其中之一:
图像的左边界像素的坐标,横坐标为0且纵坐标的取值范围为[0,pic_h-1]);
图像的上边界像素的坐标,横坐标的取值范围为[0,pic_w-1]且纵坐标为0;
当前CTU行的左边界像素的坐标,横坐标为0且纵坐标的取值范围为[y,y+ctu_h-1]);
当前CTU行的上边界像素的坐标,横坐标的取值范围为[0,pic_w-1],纵坐标为y;
当前CTU的左边界像素的坐标,横坐标为x且纵坐标的取值范围为[y,y+ctu_h-1]);
当前CTU的上边界像素的坐标,横坐标的取值范围为[x,x+ctu_w-1],纵坐标为y;
其中,所述当前CTU的左上角坐标为(x,y),所述图像的宽度为pic_w,所述图像的高度为pic_h,所述当前CTU的宽度为ctu_w,所述当前CTU的高度为ctu_h。
在示例性实施例中,所述预设的运动信息包括尺寸信息,所述尺寸信息的值小于或等于第一阈值。
在示例性实施例中,所述预设的运动信息包括重复次数,所述重复次数的值小于或等于第二阈值。
在示例性实施例中,所述历史运动信息列表的最大长度为N,所述N为正整数;
对所述历史运动信息列表进行初始化更新,包括在所述历史运动信息列表的尾部添加M个运动信息,所述M为小于或等于所述N的正整数。
在示例性实施例中,所述运动信息列表为候选运动信息列表,所述候选运动信息列表用于提供候选的预测位移矢量。
在示例性实施例中,所述列表更新模块930,用于在所述候选运动信息列表的长度小于门限值的情况下,采用所述至少一个运动信息对所述候选运动信息列表进行初始化更新。
在示例性实施例中,所述至少一个运动信息包括以下至少一项:
序列头或图像头中包含的运动信息;
至少一个预设的运动信息;
从其他历史运动信息列表中导出的运动信息,所述其他历史运动信息列表包括与当前编解码单元采用不同预测模式的编解码单元的历史运动信息列表;
当前编解码单元的空间相邻单元的运动信息;
基于历史单元列表中记录的信息所确定的运动信息,所述历史单元列表中记录有至少一个历史编解码单元的信息。
在示例性实施例中,所述预设的运动信息包括位移矢量;所述位移矢量包括以下至少其中之一:
(0,0)、(-w,0)、(-2*w,0)、(0,-h)、(0,-2*h)、(-w,-h)、(-w,-2*h)、(-2*w,-h)、(-2*w,-2*h);
其中,w为当前编解码单元的宽度且h为当前编解码单元的高度;或者,w为最小编解码单元的宽度且h为最小编解码单元的高度。
在示例性实施例中,在所述候选运动信息列表用于提供帧内块复制IBC预测模式或帧内串复制ISC预测模式的预测位移矢量的情况下,所述其他历史运动信息列表包括帧间预测模式对应的历史运动信息列表;
或者,在所述候选运动信息列表用于提供帧间预测模式的预测位移矢量的情况下,所述其他历史运动信息列表包括IBC预测模式或ISC预测模式对应的历史运动信息列表。
在示例性实施例中,若所述当前编解码单元的预测模式为IBC预测模式或ISC预测模式,则所述空间相邻单元包括采用所述IBC预测模式或ISC预测模式的空间相邻单元;
或者,若所述当前编解码单元的预测模式为帧间预测模式,则所述空间相邻单元包括采用所述帧间预测模式的空间相邻单元。
在示例性实施例中,所述历史单元列表中包括坐标为(xi,yi)的历史编解码单元;
如果所述当前编解码单元的预测模式为IBC预测模式,且所述当前编解码单元的左上角坐标为(x,y),则基于所述历史单元列表中记录的信息所确定的运动信息包括位移矢量(xi-x,yi-y);
如果所述当前编解码单元的预测模式为ISC预测模式,且所述当前编解码单元中当前串的第一个像素的坐标为(x,y),则基于所述历史单元列表中记录的信息所确定的运动信息包括位移矢量(xi-x,yi-y)。
在示例性实施例中,所述历史单元列表中记录的信息包括以下至少一项:
记录预测模式为IBC预测模式或ISC预测模式的历史编解码单元的信息;
如果所述历史编解码单元的预测模式为IBC预测模式或帧间预测模式,记录所述历史编解码单元包含的至少一个编解码块的左上角坐标;
如果所述历史编解码单元的预测模式为ISC预测模式,记录所述历史编解码单元包含的至少一个编解码串的坐标。
在示例性实施例中,所述列表更新模块930,用于:
将待添加的所述运动信息与所述运动信息列表中已有的运动信息进行查重比对;
根据查重比对结果对所述运动信息列表进行初始化更新,得到所述初始化更新后的运动信息列表。
综上所述,本申请实施例提供的技术方案,通过在初始的运动信息列表中包含的运动信息不足时,采用额外的运动信息进行填充,实现对该初始的运动信息列表进行初始化更新,从而在该运动信息列表中提供更多更有效的位移矢量,以取得更好的位移矢量预测效果,提升视频的压缩性能。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图10,其示出了本申请一个实施例提供的计算机设备的结构框图。该计算机设备可以是上文介绍的编码端设备,也可以是上文介绍的解码端设备。该计算机设备150可以包括:处理器151、存储器152、通信接口153、编码器/解码器154和总线155。
处理器151包括一个或者一个以上处理核心,处理器151通过运行软件程序以及模块,从而执行各种功能应用以及信息处理。
存储器152可用于存储计算机程序,处理器151用于执行该计算机程序,以实现上述视频编解码中的运动信息列表构建方法。
通信接口153可用于与其它设备进行通信,如收发音视频数据。
编码器/解码器154可用于实现编码和解码功能,如对音视频数据进行编码和解码。
存储器152通过总线155与处理器151相连。
此外,存储器152可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,易失性或非易失性存储设备包括但不限于:磁盘或光盘,EEPROM(ElectricallyErasable Programmable Read-Only Memory,电可擦除可编程只读存储器),EPROM(Erasable Programmable Read-Only Memory,可擦除可编程只读存储器),SRAM(StaticRandom-Access Memory,静态随时存取存储器),ROM(Read-Only Memory,只读存储器),磁存储器,快闪存储器,PROM(Programmable read-only memory,可编程只读存储器)。
本领域技术人员可以理解,图10中示出的结构并不构成对计算机设备150的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被处理器执行时实现上述视频编解码中的运动信息列表构建方法。
在示例性实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述视频编解码中的运动信息列表构建方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (21)

1.一种视频编解码中的运动信息列表构建方法,其特征在于,所述方法包括:
获取初始的运动信息列表;
在所述运动信息列表的长度满足条件的情况下,确定至少一个运动信息;其中,所述长度是指所述运动信息列表中包括的运动信息的数量;
将所述至少一个运动信息添加至所述运动信息列表中,得到初始化更新后的运动信息列表。
2.根据权利要求1所述的方法,其特征在于,所述运动信息列表为历史运动信息列表,所述历史运动信息列表用于记录历史的运动信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在对图像中每个编码树单元CTU行开始编码或解码的情况下,采用所述至少一个运动信息对所述历史运动信息列表进行初始化更新;
或者,
在对图像中每个片开始编码或解码的情况下,采用所述至少一个运动信息对所述历史运动信息列表进行初始化更新。
4.根据权利要求2所述的方法,其特征在于,所述至少一个运动信息包括以下至少一项:
目标CTU编码或解码完成后的历史运动信息列表中包含的运动信息;
序列头或图像头中包含的运动信息;
至少一个预设的运动信息。
5.根据权利要求4所述的方法,其特征在于,所述预设的运动信息包括位移矢量;所述位移矢量包括以下至少其中之一:
(0,0)、(-w,0)、(-2*w,0)、(0,-h)、(0,-2*h)、(-w,-h)、(-w,-2*h)、(-2*w,-h)、(-2*w,-2*h);
其中,w为最小编解码单元的宽度且h为最小编解码单元的高度。
6.根据权利要求4所述的方法,其特征在于,所述预设的运动信息包括位置信息;所述位置信息包括以下至少其中之一:
图像的左边界像素的坐标,横坐标为0且纵坐标的取值范围为[0,pic_h-1]);
图像的上边界像素的坐标,横坐标的取值范围为[0,pic_w-1]且纵坐标为0;
当前CTU行的左边界像素的坐标,横坐标为0且纵坐标的取值范围为[y,y+ctu_h-1]);
当前CTU行的上边界像素的坐标,横坐标的取值范围为[0,pic_w-1],纵坐标为y;
当前CTU的左边界像素的坐标,横坐标为x且纵坐标的取值范围为[y,y+ctu_h-1]);
当前CTU的上边界像素的坐标,横坐标的取值范围为[x,x+ctu_w-1],纵坐标为y;
其中,所述当前CTU的左上角坐标为(x,y),所述图像的宽度为pic_w,所述图像的高度为pic_h,所述当前CTU的宽度为ctu_w,所述当前CTU的高度为ctu_h。
7.根据权利要求4所述的方法,其特征在于,所述预设的运动信息包括尺寸信息,所述尺寸信息的值小于或等于第一阈值。
8.根据权利要求4所述的方法,其特征在于,所述预设的运动信息包括重复次数,所述重复次数的值小于或等于第二阈值。
9.根据权利要求2所述的方法,其特征在于,所述历史运动信息列表的最大长度为N,所述N为正整数;
对所述历史运动信息列表进行初始化更新,包括在所述历史运动信息列表的尾部添加M个运动信息,所述M为小于或等于所述N的正整数。
10.根据权利要求1所述的方法,其特征在于,所述运动信息列表为候选运动信息列表,所述候选运动信息列表用于提供候选的预测位移矢量。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
在所述候选运动信息列表的长度小于门限值的情况下,采用所述至少一个运动信息对所述候选运动信息列表进行初始化更新。
12.根据权利要求10所述的方法,其特征在于,所述至少一个运动信息包括以下至少一项:
序列头或图像头中包含的运动信息;
至少一个预设的运动信息;
从其他历史运动信息列表中导出的运动信息,所述其他历史运动信息列表包括与当前编解码单元采用不同预测模式的编解码单元的历史运动信息列表;
当前编解码单元的空间相邻单元的运动信息;
基于历史单元列表中记录的信息所确定的运动信息,所述历史单元列表中记录有至少一个历史编解码单元的信息。
13.根据权利要求12所述的方法,其特征在于,所述预设的运动信息包括位移矢量;所述位移矢量包括以下至少其中之一:
(0,0)、(-w,0)、(-2*w,0)、(0,-h)、(0,-2*h)、(-w,-h)、(-w,-2*h)、(-2*w,-h)、(-2*w,-2*h);
其中,w为当前编解码单元的宽度且h为当前编解码单元的高度;或者,w为最小编解码单元的宽度且h为最小编解码单元的高度。
14.根据权利要求12所述的方法,其特征在于,
在所述候选运动信息列表用于提供帧内块复制IBC预测模式或帧内串复制ISC预测模式的预测位移矢量的情况下,所述其他历史运动信息列表包括帧间预测模式对应的历史运动信息列表;
或者,
在所述候选运动信息列表用于提供帧间预测模式的预测位移矢量的情况下,所述其他历史运动信息列表包括IBC预测模式或ISC预测模式对应的历史运动信息列表。
15.根据权利要求12所述的方法,其特征在于,
若所述当前编解码单元的预测模式为IBC预测模式或ISC预测模式,则所述空间相邻单元包括采用所述IBC预测模式或ISC预测模式的空间相邻单元;
或者,
若所述当前编解码单元的预测模式为帧间预测模式,则所述空间相邻单元包括采用所述帧间预测模式的空间相邻单元。
16.根据权利要求12所述的方法,其特征在于,所述历史单元列表中包括坐标为(xi,yi)的历史编解码单元;
如果所述当前编解码单元的预测模式为IBC预测模式,且所述当前编解码单元的左上角坐标为(x,y),则基于所述历史单元列表中记录的信息所确定的运动信息包括位移矢量(xi-x,yi-y);
如果所述当前编解码单元的预测模式为ISC预测模式,且所述当前编解码单元中当前串的第一个像素的坐标为(x,y),则基于所述历史单元列表中记录的信息所确定的运动信息包括位移矢量(xi-x,yi-y)。
17.根据权利要求12所述的方法,其特征在于,所述历史单元列表中记录的信息包括以下至少一项:
记录预测模式为IBC预测模式或ISC预测模式的历史编解码单元的信息;
如果所述历史编解码单元的预测模式为IBC预测模式或帧间预测模式,记录所述历史编解码单元包含的至少一个编解码块的左上角坐标;
如果所述历史编解码单元的预测模式为ISC预测模式,记录所述历史编解码单元包含的至少一个编解码串的坐标。
18.根据权利要求1至17任一项所述的方法,其特征在于,所述将所述至少一个运动信息添加至所述运动信息列表中,得到初始化更新后的运动信息列表,包括:
将待添加的所述运动信息与所述运动信息列表中已有的运动信息进行查重比对;
根据查重比对结果对所述运动信息列表进行初始化更新,得到所述初始化更新后的运动信息列表。
19.一种视频编解码中的运动信息列表构建装置,其特征在于,所述装置包括:
列表获取模块,用于获取初始的运动信息列表;
信息确定模块,用于在所述运动信息列表的长度满足条件的情况下,确定至少一个运动信息;其中,所述长度是指所述运动信息列表中包括的运动信息的数量;
列表更新模块,用于将所述至少一个运动信息添加至所述运动信息列表中,得到初始化更新后的运动信息列表。
20.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至18任一项所述的方法。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至18任一项所述的方法。
CN202010747207.0A 2020-07-29 2020-07-29 视频编解码中的运动信息列表构建方法、装置及设备 Pending CN114071158A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010747207.0A CN114071158A (zh) 2020-07-29 2020-07-29 视频编解码中的运动信息列表构建方法、装置及设备
PCT/CN2021/106610 WO2022022299A1 (zh) 2020-07-29 2021-07-15 视频编解码中的运动信息列表构建方法、装置及设备
EP21849304.7A EP4192013A4 (en) 2020-07-29 2021-07-15 METHOD, APPARATUS AND DEVICE FOR PREPARING A LIST OF MOTION INFORMATION IN VIDEO ENCODING AND DECODING
US17/896,937 US20220417550A1 (en) 2020-07-29 2022-08-26 Method and apparatus for constructing motion information list in video encoding and decoding and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010747207.0A CN114071158A (zh) 2020-07-29 2020-07-29 视频编解码中的运动信息列表构建方法、装置及设备

Publications (1)

Publication Number Publication Date
CN114071158A true CN114071158A (zh) 2022-02-18

Family

ID=80037544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010747207.0A Pending CN114071158A (zh) 2020-07-29 2020-07-29 视频编解码中的运动信息列表构建方法、装置及设备

Country Status (4)

Country Link
US (1) US20220417550A1 (zh)
EP (1) EP4192013A4 (zh)
CN (1) CN114071158A (zh)
WO (1) WO2022022299A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023198063A1 (en) * 2022-04-11 2023-10-19 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140059058A1 (en) * 2012-08-24 2014-02-27 Microsoft Corporation Candidate generation for predictive input using input history
CN110460859A (zh) * 2019-08-21 2019-11-15 浙江大华技术股份有限公司 历史运动矢量列表的使用方法、编解码器及存储装置
US20200077085A1 (en) * 2018-08-31 2020-03-05 Hulu, LLC Historical Motion Vector Prediction With Reset List
CN110868589A (zh) * 2018-08-28 2020-03-06 华为技术有限公司 帧间预测方法、装置及其应用的编/解方法及装置
CN110944190A (zh) * 2018-09-22 2020-03-31 上海天荷电子信息有限公司 专用历史最近运动矢量预测候选集的图像压缩方法和装置
WO2020065508A1 (en) * 2018-09-24 2020-04-02 Beijing Bytedance Network Technology Co., Ltd. Chroma mode intra coding
JP2020088451A (ja) * 2018-11-16 2020-06-04 シャープ株式会社 動画像復号装置および動画像符号化装置
US20200236384A1 (en) * 2019-01-22 2020-07-23 Tencent America LLC Method and apparatus for video coding

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150264348A1 (en) * 2014-03-17 2015-09-17 Qualcomm Incorporated Dictionary coding of video content
US10362330B1 (en) * 2018-07-30 2019-07-23 Tencent America LLC Combining history-based motion vector prediction and non-adjacent merge prediction
WO2020044195A1 (en) * 2018-08-26 2020-03-05 Beijing Bytedance Network Technology Co., Ltd. Multi-motion model based video coding and decoding
CN110876058B (zh) * 2018-08-30 2021-09-21 华为技术有限公司 一种历史候选列表更新方法与装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140059058A1 (en) * 2012-08-24 2014-02-27 Microsoft Corporation Candidate generation for predictive input using input history
CN110868589A (zh) * 2018-08-28 2020-03-06 华为技术有限公司 帧间预测方法、装置及其应用的编/解方法及装置
US20200077085A1 (en) * 2018-08-31 2020-03-05 Hulu, LLC Historical Motion Vector Prediction With Reset List
CN110944190A (zh) * 2018-09-22 2020-03-31 上海天荷电子信息有限公司 专用历史最近运动矢量预测候选集的图像压缩方法和装置
WO2020065508A1 (en) * 2018-09-24 2020-04-02 Beijing Bytedance Network Technology Co., Ltd. Chroma mode intra coding
JP2020088451A (ja) * 2018-11-16 2020-06-04 シャープ株式会社 動画像復号装置および動画像符号化装置
US20200236384A1 (en) * 2019-01-22 2020-07-23 Tencent America LLC Method and apparatus for video coding
CN110460859A (zh) * 2019-08-21 2019-11-15 浙江大华技术股份有限公司 历史运动矢量列表的使用方法、编解码器及存储装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
X. XU: "CE8-related: unified IBC block vector prediction", JOINT VIDEO EXPERTS TEAM (JVET) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11-JVET-N0382-V2, 21 March 2019 (2019-03-21), pages 1 - 10 *

Also Published As

Publication number Publication date
EP4192013A1 (en) 2023-06-07
WO2022022299A1 (zh) 2022-02-03
US20220417550A1 (en) 2022-12-29
EP4192013A4 (en) 2023-11-15

Similar Documents

Publication Publication Date Title
CN111866512B (zh) 视频解码方法、视频编码方法、装置、设备及存储介质
CN114827597B (zh) 视频解码方法、装置、计算机设备及存储介质
JP7343669B2 (ja) Vvcにおける色変換のための方法及び機器
JP7436482B2 (ja) 最大変換サイズの制御
KR20200134219A (ko) 병합 모드에서 비디오 코딩을 위한 방법 및 장치
CN116193131B (zh) 一种用于视频编码的方法、电子装置及存储介质
JP7271675B2 (ja) ビデオ復号の方法および装置、並びにプログラム
US20230068657A1 (en) Selecting a coding method for suffix values for displacement vector differences based on value intervals
KR20220127308A (ko) 비디오 코딩을 위한 방법 및 장치
US20220417550A1 (en) Method and apparatus for constructing motion information list in video encoding and decoding and device
WO2023224655A1 (en) Flexible scaling factors for joint mvd coding
JP2023546962A (ja) 成分間のブロック終了フラグの符号化
EP4088474A1 (en) Method and apparatus for video coding
CN114390289A (zh) 参考像素候选列表构建方法、装置、设备及存储介质
WO2022037458A1 (zh) 视频编解码中的运动信息列表构建方法、装置及设备
US20240146902A1 (en) Context Design for Coding and Decoding Syntax Elements in Inter Prediction Modes
WO2022037464A1 (zh) 视频解码方法、视频编码方法、装置、设备及存储介质
JP2024512662A (ja) 算術符号化のためのブロック・レベルのウィンドウ・サイズ更新のための方法および装置
KR20240051174A (ko) 인접한 공간 모션 벡터 예측기 후보 개선
CN114374849A (zh) 一种候选运动信息列表确定方法、装置、电子设备及存储介质
KR20240093604A (ko) 인터 예측 모드들에서 신택스 요소들을 코딩 및 디코딩하기 위한 컨텍스트 설계
CN118266213A (zh) 用于在帧间预测模式中对语法元素进行编码和解码的上下文设计
WO2023224651A1 (en) Adjacent spatial motion vector predictor candidates improvement
WO2023204849A1 (en) Bilateral matching based scaling factor derivation for jmvd
CN118101958A (zh) 视频编解码方法、装置、计算机可读介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40064931

Country of ref document: HK