CN113455003B - 视频编解码方法及电子设备 - Google Patents

视频编解码方法及电子设备 Download PDF

Info

Publication number
CN113455003B
CN113455003B CN202080015185.7A CN202080015185A CN113455003B CN 113455003 B CN113455003 B CN 113455003B CN 202080015185 A CN202080015185 A CN 202080015185A CN 113455003 B CN113455003 B CN 113455003B
Authority
CN
China
Prior art keywords
current block
merge candidate
candidate list
candidates
merge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080015185.7A
Other languages
English (en)
Other versions
CN113455003A (zh
Inventor
林郁晟
陈俊嘉
徐志玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of CN113455003A publication Critical patent/CN113455003A/zh
Application granted granted Critical
Publication of CN113455003B publication Critical patent/CN113455003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种生成用于帧内块复制(IBC)预测的合并候选列表的方法。视频编解码器接收要作为视频的当前图片的当前块被编码或解码的数据。当前块的多个空域相邻邻近块在当前块之前被编解码。视频编解码器生成合并候选列表,该合并候选列表包括与参考了当前图片中的像素的运动信息相关联的帧内图片候选。帧内图片候选包括与当前块的两个或更多个空域相邻邻近块中的一些但不是所有空域相邻邻近块相关联的候选。视频编解码器从生成的列表中选择合并候选。视频编解码器通过使用所选合并候选的运动信息对当前块进行编码或解码,以生成当前块的预测。

Description

视频编解码方法及电子设备
交叉引用
本公开是要求于2019年2月22日提交的美国临时专利申请No.62/808,940的优先权权益的非临时申请的一部分。上述申请的内容通过引用并入本文。
技术领域
本公开总体上涉及视频处理。特别地,本公开涉及生成用于帧内块复制(IBC)预测的合并候选列表的方法。
背景技术
除非本文另外指出,否则本节中描述的方法不是下面列出的权利要求的现有技术,并且不因包括在本节中而被承认为现有技术。
高效视频编码(HEVC)是由视频编码联合协作小组(JCT-VC)开发的国际视频编码标准。HEVC依据基于混合块的运动补偿的类DCT变换编码架构。用于压缩的基本单元(称为编码单元(CU))是2N×2N方形区块,并且每个CU可以被递归地分成四个较小的CU,直到达到预定义的最小尺寸为止。每个CU包含一个或多个预测单元(PU)。
为了实现HEVC中的混合编码架构的最佳编码效率,针对每个PU存在两种预测模式(即,帧内预测和帧间预测)。对于帧内预测模式,可以利用空域邻近重构像素来生成方向(directional)预测。在HEVC中有多达35个方向。对于帧间预测模式,可以利用时域重构参考帧来生成运动补偿预测。有三种不同的模式,包括跳过(Skip)、合并(Merge)和帧间高级运动向量预测(AMVP)模式。
发明内容
以下发明内容仅是说明性的,而无意于以任何方式进行限制。即,提供以下发明内容以介绍本文描述的新颖和非显而易见的技术的概念、重点、益处和优点。下面在具体实施方式中进一步描述了选择和并非所有实现。因此,以下发明内容既不旨在标识所要求保护的主题的必要特征,也不旨在用于确定所要求保护的主题的范围。
本公开的一些实施方式提供一种生成用于帧内块复制(IBC)预测的合并候选列表的方法。视频编解码器接收要作为视频的当前图片的当前块被编码或解码的数据。当前块的两个或更多个空域相邻邻近块在当前块之前被编码。视频编解码器生成合并候选列表,该合并候选列表包括与参考了当前图片中的像素的运动信息相关联的帧内图片候选。帧内图片候选包括与当前块的两个或更多个空域相邻邻近块中的一些但不是所有空域相邻邻近块相关联的候选。视频编解码器从生成的列表中选择合并候选。视频编解码器通过使用所选合并候选的运动信息对当前块进行编码或解码,以生成当前块的预测。
当前块的空域相邻邻近块可以在当前块的左侧和顶部,并且从所生成的合并候选列表中排除空域相邻邻近块中的一些空域相邻邻近块。帧内图片候选可以包括与当前块的上方的一个空域相邻邻近块以及当前块的左侧的一个空域相邻邻近块相关联、而不与当前块的其他空域相邻邻近块相关联的候选。
在一些实施方式中,视频编解码器通过执行简化的修剪处理来生成合并候选列表。在一些实施方式中,视频编解码器针对包括当前块的当前片维护若干基于历史的运动向量预测(HMVP)候选,每个HMVP候选与先前编码的块的运动信息相关联。将来自多个HMVP中的至少一个HMVP候选与合并候选列表进行比较,用于(检测)冗余。在一些实施方式中,简化的修剪处理可能不对HMVP候选执行。在一些实施方式中,视频编解码器生成合并候选列表包括:基于当前块的属性确定在列表中包括哪个合并候选。
附图说明
包括附图以提供对本公开的进一步理解,并且附图被并入本公开并构成本公开的一部分。附图例示了本公开的实现(implementation),并且与描述一起用于解释本公开的原理。可以理解的是,附图不一定按比例绘制,因为为了清楚地例示本公开的概念,某些组件可能被示为与实际实现中的尺寸不成比例。
图1例示了合并模式的运动候选。该图标出了正在由视频编解码器编码或解码的视频图片或帧的当前块。
图2例示了包括组合的双预测合并候选的合并候选列表。
图3例示了包括缩放的合并候选的合并候选列表。
图4例示了将零向量候选添加到合并候选列表或AMVP候选列表的示例。
图5例示了当对当前块进行编码时用于IBC模式的示例简化合并候选列表。
图6例示了可以在IBC模式下使用简化合并列表构造来对区块进行编码的示例视频编解码器。
图7概念性地例示了通过使用用于IBC模式的简化合并候选列表来对当前块进行编码的处理。
图8例示了可以在IBC模式下使用简化合并列表构造来对区块进行解码的示例视频解码器。
图9概念性地例示了通过使用用于IBC模式的简化合并候选列表来对当前块进行解码的处理。
图10概念性地例示了利用其实现本公开的一些实施方式的电子系统。
具体实施方式
在下面的具体实施方式中,通过示例的方式阐述了许多具体细节,以提供对相关教导的透彻理解。基于本文描述的教导的任何变化、派生和/或扩展均在本公开的保护范围内。在一些情况下,可以在相对较高的层面上而非详细地描述与本文公开的一个或更多个示例实现有关的众所周知的方法、过程、组件和/或电路,以避免不必要地使本公开的教导的各方面模糊不清。
I.候选列表
a.合并模式和AMVP
对于帧内预测模式,空域邻近的重构像素可以用于生成方向预测。对于帧间预测模式,时域重构的参考帧可以用于生成运动补偿预测。常规的帧间预测模式包括跳过、合并和帧间高级运动向量预测(AMVP)模式。跳过模式和合并模式从空域邻近块(空域候选)或时域并置(co-locate)块(时域候选)获得运动信息。当通过跳过或合并模式对PU进行编码时,不对运动信息进行编码,而是仅对所选候选的索引进行编码。对于跳过模式,残差信号被强制为零且未编码。如果特定的块被编码为跳过或合并,则用信号发送候选索引以指示候选集中的哪个候选被用于合并。每个合并的PU重用所选候选的MV、预测方向和参考图片索引。
图1例示了合并模式的运动候选。该图标出了正在由视频编解码器编码或解码的视频图片或帧的当前块100。如所例示的,从空域邻近者A0、A1、B0和B1推导出多达四个空域MV候选,从TBR或TCTR推导出一个时域MV候选(首先使用TBR,如果TBR不可用,则使用TCTR代替)。如果四个空域MV候选中的任何一个都不可用,则使用位置B2来推导MV候选作为替换。在四个空域MV候选和一个时域MV候选的推导处理之后,在一些实施方式中应用去除冗余(修剪)以去除冗余MV候选。如果在去除冗余(修剪)后,可用MV候选的数量少于五个,则推导出三种类型的附加候选并将其添加到候选集(候选列表)。视频编码器基于率失真优化(RDO)决策在候选集内选择一个最终候选用于跳过或合并模式,并将索引传输到视频解码器。(跳过模式和合并模式在本文文件中统称为“合并模式”。)
当在帧间AMVP模式下对PU进行编码时,利用传输的运动向量差(MVD)来执行运动补偿预测,该运动向量差可以与运动向量预测子(Motion Vector Predictor,MVP)一起使用来推导运动向量(MV)。在帧间AMVP模式下为了决定MVP,使用高级运动向量预测(AMVP)方案来在包括两个空域MVP和一个时域MVP的AMVP候选集中选择运动向量预测子。因此,在AMVP模式下,需要对MVP的MVP索引和对应的MVD进行编码和传输。另外,还应当对用于指定双向预测与单向预测(其为列表0(L0)和列表1(L1))中的预测方向的、伴随有针对每个列表的参考帧索引的帧间预测方向进行编码和传输。
当在跳过模式或合并模式下对PU进行编码时,除了所选候选的合并索引之外,不传输运动信息。这是因为跳过模式和合并模式利用运动推断方法(MV=MVP+MVD,其中MVD为零)从空域邻近块(空域候选)或位于并置图片中的时域块(时域候选)获得运动信息,其中并置图片是列表0或列表1中的第一参考图片,其在片头(slice header)中被用信号发送。在跳过PU的情况下,也省略残差(residual)信号。为了确定跳过模式和合并模式的合并索引,使用合并方案以在包含四个空域MVP和一个时域MVP的合并候选集中选择运动向量预测子。
图1还示出了用于帧间预测模式的MVP候选集,即,被参考用于推导针对AMVP和合并方案两者的空域MVP和时域MVP的邻近PU。当前块100(其可以是PU或CU)参考邻近块以将空域MVP和时域MVP推导为用于AMVP模式、合并模式或跳过模式的MVP列表或候选列表。
对于AMVP模式,左侧MVP是来自A0、A1的第一个可用的MVP,顶部MVP是来自B0、B1、B2的第一个可用的MVP,时域MVP是来自TBR或TCTR的第一个可用的MVP(首先使用TBR,如果TBR不可用,则使用TCTR代替)。如果左侧MVP不可用且顶部MVP不是缩放的MVP,则如果在B0、B1和B2中存在缩放的MVP,就可以推导出第二顶部MVP。因此,在两个空域MVP和一个时域MVP的推导处理之后,只有前两个MVP可以包括在候选列表中。如果在去除冗余之后,可用MVP的数量小于2,则将零向量候选添加到候选列表。
对于跳过模式和合并模式,从A0、A1、B0和B1推导出多达四个空域合并索引,并且从TBR或TCTR推导出一个时域合并索引(首先使用TBR,如果TBR不可用,则使用TCTR代替)。如果四个空域合并索引中的任何一个不可用,则使用位置B2来推导合并索引作为替换。在推导四个空域合并索引和一个时域合并索引之后,去除冗余合并索引。如果非冗余合并索引的数量小于5,则可以从原始候选推导出附加候选并将其添加到候选列表。存在三种类型的推导候选:
1.组合的双向预测合并候选(推导候选类型1)
2.缩放的双向预测合并候选(推导候选类型2)
3.零向量合并/AMVP候选(推导候选类型3)
对于推导候选类型1,通过对原始合并候选进行组合来创建组合的双向预测合并候选。具体地,如果当前片是B片,则可以通过组合来自列表0和列表1的候选来生成进一步的合并候选。图2例示了包括组合的双向预测合并候选的合并候选列表。如所例示的,使用具有mvL0(列表0中的运动向量)和refIdxL0(列表0中的参考图片索引)或者mvL1(列表1中的运动向量)和refIdxL1(列表1中的参考图片索引)的两个原始候选来创建双向预测合并候选。
对于推导候选类型2,通过对原始合并候选进行缩放来创建缩放的合并候选。图3例示了包括缩放的合并候选的合并候选列表。如所例示的,原始合并候选具有mvLX(列表X中的运动向量,X可以是0或1)和refIdxLX(列表X中的参考图片索引,X可以是0或1)。例如,原始候选A是具有mvL0_A和参考图片索引ref0的列表0单向预测MV。首先将候选A复制到具有参考图片索引ref0'的列表L1。通过基于ref0和ref0'对mvL0_A进行缩放来计算缩放的MVmvL0'_A。创建在列表L0中具有mvL0_A和ref0并且在列表L1中具有mvL0'_A和ref0'的缩放的双向预测合并候选,并将该缩放的双向预测合并候选添加到合并候选列表。同样,创建在列表0中具有mvL1'_A和ref1'并且在列表1中具有mvL1_A和ref1的缩放的双向预测合并候选,并将该缩放的双向预测合并候选添加到合并候选列表。
对于推导候选类型3,通过对零向量和参考索引进行组合来创建零向量候选。如果创建的零向量候选不是重复的,则将其添加到合并/AMVP候选列表。图4例示了将零向量候选添加到合并候选列表或AMVP候选列表的示例。
b.帧内块复制预测
帧内块复制(IBC)也称为当前图片参考(CPR)。IBC预测与帧间预测(帧间模式)类似,不同之处在于提供预测的参考图片是包括正在被编码的当前块的当前解码帧或当前图片。IBC(或CPR)运动向量是涉及当前图片中已经重构的参考样本的运动向量。在一些实施方式中,用信号发送IBC编解码的CU作为帧间编解码块。换句话说,当前(部分)解码的图片被视为参考图片。通过参考这样的参考图片,可以以与运动补偿相同的方式根据同一图片的参考块来预测当前块。对于一些实施方式,IBC编码块与常规运动补偿(MC)编码块之间的差异包括以下内容:(1)块向量(IBC中的位移向量)仅具有整数分辨率,亮度或色度不需要插值;(2)块向量不参与时域运动向量预测;(3)块向量和运动向量不用于相互预测;以及(4)有效块向量具有一些约束,使得它只能指向当前图片的子集。在一些实施方式中,为了降低实现成本,用于IBC模式的参考样本来自当前片或图块的已经重构的部分,并且满足WPP并行处理条件。在一些实施方式中,为了减少内存消耗和解码器复杂度,视频编解码器仅允许将当前CTU的重构部分用于IBC模式。此限制允许使用用于硬件实现的本地片上内存来实现IBC模式。
IBC预测的更多详细信息可以在下列文献中找到:ITU-T SG 16WP 3和ISO/IECJTC 1/SC 29/WG 11的联合视频专家组(JVET)第11次会议:Ljubljana,SI,2018年7月10至18日;文档:JVET-K0076;CE8-2.2:Current picture referencing using referenceindex signaling。还可以在下列文献中找到IBC模式的更多详细信息:X.Xu,S.Liu,T.Chuang,Y.Huang,S.Lei,K.Rapaka,C.Pang,V.Seregin,Y.Wang,and M.Karczewicz,“Intra Block Copy in HEVC Screen Content Coding Extensions,”IEEEJ.Emerg.Sel.Topics Circuits Syst.,第6卷,第4期,第409页至第419页,2016年。
c.基于历史的运动向量预测
在一些实施方式中,可以通过在基于历史的方案中参考先前的编码运动信息来获取用于生成帧间预测的假设的运动信息,也称为基于历史的运动向量预测(HMVP)。HMVP候选被定义为先前编解码的块的运动信息。视频编解码器在编码/解码处理期间维护具有多个HMVP候选的表。当遇到新片时将清空该表。
II.用于IBC的简化合并列表
对于IBC合并模式,生成合并候选列表,以包括与当前块的多个编码空域相邻邻近块中的仅两个相关联的合并索引。将从合并候选列表中选择一个合并候选,以用于解码当前块。
实际上,当生成合并候选列表时,如果候选存在,则将几种类型的合并候选插入到合并列表中。可以插入到合并列表中的合并候选的类型可以包括空域合并候选(即,与多个编码空域相邻邻近块中的仅两个相关联的合并索引)、时域合并候选、基于历史的(例如,HMVP)合并候选、成对平均合并(pairwise average merge)候选、子CU合并候选或默认合并候选。还对合并列表执行修剪处理。
在一些实施方式中,对于IBC合并模式,视频编解码器通过排除一些合并候选或通过减少修剪处理来简化合并列表构造。还可以根据一些约束来应用简化合并列表构造。
在一些实施方式中,对于IBC模式,在合并候选列表构造中排除或省略了一个或一些或所有合并候选。换句话说,针对IBC模式构造的合并候选列表没有一个或一些合并候选,或者仅具有合并候选的子集(与常规帧间预测合并模式下的可用合并候选相比)。例如,在一些实施方式中,在IBC预测的合并候选列表构造中排除或省略了一个或一些或所有空域合并候选,或者针对IBC预测模式构造的合并候选列表排除或省略了一个或一些空域合并候选,该一个或一些空域合并候选在常规帧间预测合并模式下将被包含,或者与常规(或非IBC)合并模式相比,仅具有空域合并候选的子集。
图5例示了当对当前块100进行编码时用于IBC模式的示例简化合并候选列表。如所例示的,仅两个空域合并候选A1和B1用作IBC模式的合并候选,而其他空域合并候选A0、B0和B2被省略、排除或不包括在合并候选列表中。换句话说,在当前块100之前编码的所有空域邻近者(即,上方邻近者B0、B1、B2以及左侧邻近者A1和A0)中,只有正上方(B1)和正左侧(A1)的空域邻近者被包括在内。即使当前块100的其他空域邻近者(B0、B2、A0)已经在当前块100之前被编码,也不会将那些空域邻近者用作IBC的合并模式候选。
在一些实施方式中,在合并候选列表构造中排除或省略了一些或所有基于历史的(例如,HMVP)候选。如所提到的,为了实现HMVP,视频编解码器可以维护运动历史表,该运动历史表存储了用于当前片的先前编码的块的运动信息。为了生成用于在IBC预测模式下对当前块进行编码的合并候选列表,视频编解码器可以仅将存储在运动历史表中的运动信息的子集包括在用于IBC模式的合并候选列表中。
在一些实施方式中,对于IBC模式,在合并候选列表构造中排除或省略了一个或一些或所有时域合并候选。在一些实施方式中,在合并候选列表构造中排除或省略了一个或一些或所有成对平均合并候选。在一些实施方式中,在合并候选列表构造中排除或省略了一个或一些或所有子CU合并候选。在一些实施方式中,在合并候选列表构造中排除或省略了默认合并候选。
在一些实施方式中,对于IBC合并模式,针对合并候选构造简化或不执行修剪处理(冗余去除处理)。在一些实施方式中,在合并候选列表构造中简化或不执行空域合并候选的修剪处理。在一些实施方式中,在合并候选列表构造中简化或不执行时域合并候选的修剪处理。在一些实施方式中,在合并候选列表构造中简化或不执行成对平均合并候选的修剪处理。在一些实施方式中,在合并候选列表构造中简化或不执行子CU合并候选的修剪处理。在一些实施方式中,在合并候选列表构造中简化或不执行默认合并候选的修剪处理。在一些实施方式中,在合并候选列表构造中简化或不执行基于历史的(例如,HMVP)候选的修剪处理。当修剪处理被简化后,仅将HMVP候选列表中的前N个HMVP候选与合并候选列表进行比较(用于检测冗余或检查冗余候选)。在一些实施方式中,当比较结果指示所比较的HMVP候选与合并候选列表中的候选不同时,将所比较的HMVP候选添加到合并候选列表中。当不执行修剪处理时,在将HMVP候选包括在合并候选列表中之前,不会执行先前的比较。简而言之,本文所述的各种类型的合并候选的修剪处理可以被简化或不执行。当不执行各种类型合并候选中的任一类型合并候选的修剪处理时,可以在不比较冗余的情况下将该类型的合并候选包括在合并候选列表中。对于某些实施方式,该简化的修剪处理不与合并候选的生成的简化相矛盾,并且可以在同一处理中执行。
在一些实施方式中,对于IBC合并模式,根据某个CU宽度或高度,在合并候选列表构造中排除一个或一些合并候选。换句话说,当生成合并候选列表时,视频编解码器基于当前CU的属性来确定要包括或省略哪个合并候选。
在一些实施方式中,根据某个CU宽度或高度,在合并候选列表构造中排除一个或一些或所有空域合并候选。在一些实施方式中,根据某个CU宽度或高度,在合并候选列表构造中排除或省略了一个或一些或所有时域合并候选。在一些实施方式中,根据某个CU宽度或高度,在合并候选列表构造中排除或省略了一个或一些或所有基于历史的(例如,HMVP)合并候选。在一些实施方式中,根据某个CU宽度或高度,在合并候选列表构造中排除或省略了一个或一些或所有成对平均合并候选。在一些实施方式中,根据某个CU宽度或高度,在合并候选列表构造中排除或省略了一个或一些或所有子CU合并候选。在一些实施方式中,根据某个CU宽度或高度,在合并候选列表构造中排除或省略了一个或一些或所有默认合并候选。在一些实施方式中,根据某个CU宽度或高度,在合并候选列表构造中简化或不执行修剪处理。
在一些实施方式中,在IBC合并模式下,根据某个CU面积在合并候选列表构造中排除一个或一些候选。在一些实施方式中,根据某个CU面积,在合并候选列表构造中排除一个或一些或所有空域合并候选。在一些实施方式中,根据某个CU面积,在合并候选列表构造中排除一个或一些或所有时域合并候选。在一些实施方式中,根据某个CU面积,在合并候选列表构造中排除一个或一些或所有基于历史的(例如,HMVP)合并候选。在一些实施方式中,根据某个CU面积,在合并候选列表构造中排除一个或一些或所有成对平均合并候选。在一些实施方式中,根据某个CU面积,在合并候选列表构造中排除一个或一些或所有子CU合并候选。在一些实施方式中,根据某个CU面积,在合并候选列表构造中排除默认合并候选。在另一个实施方式中,根据某个CU面积,在合并候选列表构造中简化或不执行修剪处理。
可以在编码器和/或解码器中实现任何前述提出的方法。例如,可以在编码器的预测因子推导模块和/或解码器的预测子推导模块中实现任何所提出的方法。另选地,任何所提出的方法可以被实现为联接到编码器的预测子推导模块和/或解码器的预测因子推导模块的电路,从而提供预测子推导模块所需的信息。
III.示例视频编解码器
图6例示了示例视频编码器600,其可以在IBC模式下使用简化合并列表构造来对区块进行编码。如所例示的,视频编码器600从视频源605接收输入视频信号,并将该信号编码到比特流695中。视频编码器600具有用于对来自视频源605的信号进行编码的若干组件或模块,至少包括从变换模块610、量化模块611、逆量化模块614、逆变换模块615、帧内图片估计模块620、帧内预测模块625、运动补偿模块630、运动估计模块635、环路滤波器645、重构图片缓冲器650、MV缓冲器665和MV预测模块675以及熵编码器690中选择的一些组件。运动补偿模块630和运动估计模块635是帧间预测模块640的一部分。
在一些实施方式中,模块610至模块690是由计算装置或电子设备的一个或更多个处理单元(例如,处理器)执行的软件指令的模块。在一些实施方式中,模块610至模块690是由电子设备的一个或更多个集成电路(IC)实现的硬件电路的模块。尽管模块610至模块690被例示为单独的模块,但是该模块中的一些可以组合成单个模块。
视频源605提供原始视频信号,该原始视频信号无需压缩即可呈现每个视频帧的像素数据。减法器608计算视频源605的原始视频像素资料与来自运动补偿模块630或帧内预测模块625的预测像素数据613之间的差。变换模块610将该差(或残差像素数据或残差信号)转换成变换系数616(例如,通过执行离散余弦变换或DCT)。量化模块611将变换系数量化为量化资料(或量化系数)612,其由熵编码器690编码到比特流695中。
逆量化模块614对量化数据(或量化系数)612进行反量化以获得变换系数,并且逆变换模块615对变换系数执行逆变换以产生重构残差619。将重构残差619与预测像素数据613相加,以产生重构像素数据617。在一些实施方式中,重构像素数据617被临时存储在用于帧内图片预测和空域MV预测的行(line)缓冲器(未示出)中。重构像素由环路滤波器645滤波,并存储在重构图片缓冲器650中。在一些实施方式中,重构图片缓冲器650是视频编码器600外部的存储部。在一些实施方式中,重构图片缓冲器650是视频编码器600内部的存储部。
帧内图片估计模块620基于重构像素数据617执行帧内预测以产生帧内预测数据。帧内预测数据被提供给熵编码器690以被编码到比特流695中。帧内预测数据还被帧内预测模块625用来产生预测像素数据613。
运动估计模块635通过产生MV来执行帧间预测,这些MV参考存储在重构图片缓冲器650中的先前解码的帧的像素数据。这些MV被提供给运动补偿模块630以产生预测像素数据。
代替对比特流中的完整的实际MV进行编码,视频编码器600使用MV预测来生成预测MV,并且将用于运动补偿的MV与预测MV之间的差编码为残差运动数据并存储在比特流695中。
MV预测模块675基于参考MV来生成预测MV,这些参考MV是为了对先前的视频帧进行编码而生成的,即,用于执行运动补偿的运动补偿MV。MV预测模块675从来自MV缓冲器665的先前的视频帧中检索参考MV。视频编码器600将针对当前视频帧生成的MV存储在MV缓冲器665中,作为用于生成预测MV的参考MV。
MV预测模块675使用参考MV来创建预测MV。可以通过空域MV预测或时域MV预测来计算预测MV。熵编码器690将当前帧的预测MV与运动补偿MV(MC MV)之间的差(残差运动数据)编码到比特流695中。
熵编码器690通过使用诸如上下文自适应二进制算术编码(CABAC)或Huffman编码的熵编码技术将各种参数和数据编码到比特流695中。熵编码器690将各种报头元素、标志以及量化的变换系数612和残差运动数据作为语法元素编码到比特流695中。比特流695进而被存储在存储装置中或通过诸如网络的通信介质被传输到解码器。
环路滤波器645对重构像素数据617执行滤波或平滑操作以减少编码的伪像,特别是在区块的边界处。在一些实施方式中,执行的滤波操作包括样本自适应偏移(SAO)。在一些实施方式中,滤波操作包括自我调整环路滤波器(ALF)。
为了实现IBC模式,运动估计模块635可以搜索存储在重构图片缓冲器650中的当前图片的已编码部分,以确定运动向量和参考了当前图片的像素的对应运动信息。运动补偿模块630可以基于存储在MV缓冲器665中的运动信息来实现合并候选列表,该运动信息包括(用于编码)当前块的空域邻近者的运动信息。当使用IBC模式对当前块进行编码时,合并候选列表可以包括当前块的一些但不是所有空域邻近者作为空域合并候选。视频编码器600还可将简化修剪应用于合并候选列表。
图7概念性地例示了通过使用用于IBC模式的简化合并候选列表来对当前块进行编码的处理700。在一些实施方式中,实现编码器600的计算装置的一个或更多个处理单元(例如,处理器)通过执行存储在计算机可读介质中的指令来执行处理700。在一些实施方式中,实现编码器600的电子设备执行处理700。在一些实施方式中,处理700在帧间预测模块640处执行。
编码器(在710处)接收要作为视频的当前图片的当前块被编码的区块的原始像素数据。当前块的两个或更多个空域相邻邻近块在当前块之前被编解码。在图1的示例中,空域邻近者A0、A1、B0、B1和B2在当前块100之前被编码,它们是当前块上方和/或左侧的PU或CU。
编码器(在720处)生成合并候选列表。合并候选列表可以包括空域合并候选、时域合并候选、基于历史的(例如,HMVP)合并候选、成对平均合并候选、子CU合并候选和/或默认合并候选。编码器可以基于当前块的属性(例如,尺寸、宽度、高度、纵横比)来确定在列表中包括哪个合并候选。
还对合并列表执行修剪处理。可以简化修剪处理,使得对于某些类型的合并候选不执行修剪。例如,在一些实施方式中,在合并候选列表构造中简化或不执行基于历史的(例如,HMVP)候选的修剪处理。当修剪处理被简化后,仅将HMVP候选列表中的前N个HMVP候选与合并候选列表进行比较。在一些实施方式中,N等于1。换句话说,在该实施方式中,将不多于一个HMVP候选与合并候选列表进行比较。然后,例如,当比较结果指示所比较的HMVP候选与合并候选列表中的候选不同时,将所比较的HMVP候选添加到合并候选列表中。当不执行修剪处理时,在将HMVP候选包括在合并候选列表中之前,不会执行先前的比较。简而言之,可以简化或不执行本文所述的各种类型的合并候选的修剪处理。当不执行各种类型合并候选中的任一类型合并候选的修剪处理时,该类型的合并候选可以被包括在合并候选列表中而无需比较冗余(比较候选以识别冗余)。
由于合并候选列表是针对IBC模式生成的,因此该列表包括与参考了当前图片中的像素的运动信息相关联的帧内图片候选。在一些实施方式中,帧内图片候选包括与当前块的两个或更多个空域相邻邻近块中的一些但不是所有相关联的候选。例如,合并候选列表的帧内图片候选可以仅包括空域邻近者A1和B1,而不包括空域邻近者A0、B0和B2。换句话说,当前块的一些但不是所有空域合并候选被包括在用于IBC的合并候选列表中。
编码器(在730处)例如通过生成要作为语法元素包括在比特流695中的索引,从生成的列表中选择合并候选。然后,编码器(在740处)通过使用所选择的合并候选的运动信息来对当前块进行编码,以生成当前块的预测。
IV.示例视频解码器
图8例示了示例视频解码器800,其可以在IBC模式下使用简化合并列表构造来对区块进行解码。如所例示的,视频解码器800是图像解码或视频解码电路,其接收比特流895并将比特流的内容解码为视频帧的像素数据以供显示。视频解码器800具有用于对比特流895进行解码的若干组件或模块,包括选自逆量化模块805、逆变换模块810、帧内预测模块825、运动补偿模块830、环路滤波器845、解码图片缓冲器850、MV缓冲器865、MV预测模块875和解析器890中的一些组件。运动补偿模块830是帧间预测模块840的一部分。
在一些实施方式中,模块810至模块890是由计算装置的一个或更多个处理单元(例如,处理器)执行的软件指令的模块。在一些实施方式中,模块810至模块890是由电子设备的一个或更多个IC实现的硬件电路的模块。尽管模块810至模块890被例示为单独的模块,但是该模块中的一些可以组合成单个模块。
解析器890(或熵解码器)接收比特流895,并根据由视频编码或图像编码标准定义的语法执行初始解析。解析的语法元素包括各种报头元素、标志以及量化数据(或量化系数)812。解析器890通过使用诸如上下文自适应二进制算术编码(CABAC)或Huffman编码的熵编码技术来解析出各种语法元素。
逆量化模块805对量化数据(或量化系数)812进行反量化以获得变换系数,并且逆变换模块810对变换系数816执行逆变换以产生重构残差信号819。将重构残差信号819与来自帧内预测模块825或运动补偿模块830的预测像素数据813相加,以产生解码像素数据817。解码像素数据由环路滤波器845滤波,并存储在解码图片缓冲器850中。在一些实施方式中,解码图片缓冲器850是视频解码器800外部的存储部。在一些实施方式中,解码图片缓冲器850是视频解码器800内部的存储部。
帧内预测模块825从比特流895接收帧内预测数据,并据此从存储在解码图片缓冲器850中的解码像素数据817产生预测像素数据813。在一些实施方式中,解码像素数据817也被存储在用于帧内图片预测和空域MV预测的行缓冲器(未示出)中。
在一些实施方式中,解码图片缓冲器850的内容用于显示。显示设备855或者检索解码图片缓冲器850的内容以直接显示,或者将解码图片缓冲器的内容检索到显示缓冲器。在一些实施方式中,显示设备通过像素传输从解码图片缓冲器850接收像素值。
运动补偿模块830根据运动补偿MV(MC MV)从存储在解码图片缓冲器850中的解码像素数据817产生预测像素数据813。通过将从比特流895接收到的残差运动数据与从MV预测模块875接收到的预测MV相加,对这些运动补偿MV进行解码。
MV预测模块875基于参考MV来生成预测MV,这些参考MV(例如,用于执行运动补偿的运动补偿MV)是为了对先前的视频帧进行解码而生成的。MV预测模块875从MV缓冲器865中检索先前视频帧的参考MV。视频解码器800将为解码当前视频帧而生成的运动补偿MV存储在MV缓冲器865中,作为用于产生预测MV的参考MV。
环路滤波器845对解码的像素数据817执行滤波或平滑操作,以减少编码的伪像,特别是在区块的边界处。在一些实施方式中,执行的滤波操作包括样本自适应偏移(SAO)。在一些实施方式中,滤波操作包括自我调整环路滤波器(ALF)。
为了实现IBC模式,运动补偿模块830可以实现合并候选列表,该合并候选列表包括与参考了当前图片中的像素的运动信息相关联的帧内图片候选。合并候选列表基于存储在MV缓冲器865中的运动信息,包括(用于编码)当前块的空域邻近者的运动信息。当使用IBC模式对当前块进行解码时,合并候选列表可以包括当前块的一些但不是所有空域邻近者作为空域合并候选。视频解码器800还可将简化修剪应用于合并候选列表。
图9概念性地例示了通过使用用于IBC模式的简化合并候选列表来对当前块进行解码的处理900。在一些实施方式中,实现解码器800的计算装置的一个或更多个处理单元(例如,处理器)通过执行存储在计算机可读介质中的指令来执行处理900。在一些实施方式中,实现解码器800的电子设备执行处理900。在一些实施方式中,处理900在帧间预测模块840处执行。
解码器(在910处)从比特流接收要作为视频的当前图片的当前块被解码的区块的数据。当前块的两个或更多个空域相邻邻近块在当前块之前被编解码。在图1的示例中,空域邻近者A0、A1、B0、B1和B2在当前块100之前被编码。
解码器(在920处)生成合并候选列表。合并候选列表可以包括空域合并候选、时域合并候选、基于历史的(例如,HMVP)合并候选、成对平均合并候选、子CU合并候选和/或默认合并候选。解码器可以基于当前块的属性(例如,尺寸、宽度、高度、纵横比)来确定在列表中包括哪个合并候选。
还对合并列表执行修剪处理。可以简化修剪处理,使得不去除合并候选列表中的至少一个冗余候选。还可以简化修剪处理,使得对于某些类型的合并候选不执行修剪。例如,在一些实施方式中,简化的修剪处理可以不去除与HMVP候选有关的冗余。
由于合并候选列表是针对IBC模式生成的,因此该列表包括与参考了当前图片中的像素的运动信息相关联的帧内图片候选。在一些实施方式中,帧内图片候选包括与当前块的两个或更多个空域相邻邻近块中的一些但不是所有相关联的候选。例如,合并候选列表的帧内图片候选可以仅包括空域邻近者A1和B1,而不包括空域邻近者A0、B0和B2。换句话说,当前块的一些但不是所有空域合并候选被包括在用于IBC的合并候选列表中。
在一些实施方式中,可用于合并模式的一些合并候选不包括在用于IBC模式的合并候选列表中。例如,在一些实施方式中,针对当前片存储的至少一个HMVP候选不包括在用于IBC模式的当前块的合并候选列表中。
解码器(在930处)例如基于由从比特流895解析的语法元素提供的索引,从生成的列表中选择合并候选。然后,解码器(在940处)通过使用所选择的合并候选的运动信息来对当前块进行解码,以生成当前块的预测。
V.示例电子系统
许多上述特征和应用被实现为被指定为记录在计算机可读存储介质(也称为计算机可读介质)上的一组指令的软件处理。当这些指令由一个或更多个计算或处理单元(例如,一个或更多个处理器、处理器的核或其他处理单元)执行时,它们使处理单元执行指令中指示的动作。计算机可读介质的示例包括但不限于CD-ROM、闪存驱动器、随机存取内存(RAM)芯片、硬盘驱动器、可擦可程序设计只读存储器(EPROM)、电可擦可程序设计只读存储器(EEPROM)等。计算机可读介质不包含无线地或通过有线连接传递的载波和电子信号。
在本说明书中,术语“软件”旨在包括驻留在只读存储器中的固件或存储在磁存储部中的应用,这些应用可以被读入内存以供处理器处理。而且,在一些实施方式中,可以将多个软件发明实现为较大程序的子部分,同时保留不同的软件发明。在一些实施方式中,多个软件发明也可以被实现为单独的程序。最后,一起实现这里描述的软件发明的单独程序的任何组合都在本公开的范围内。在一些实施方式中,当软件程序被安装以在一个或更多个电子系统上运行时,该软件程序定义了执行软件程序的操作的一种或更多种特定机器实现。
图10概念性地例示了利用其实现本公开的一些实施方式的电子系统1000。电子系统1000可以是计算机(例如,台式计算机、个人计算机、平板计算机等)、电话、PDA或任何其他种类的电子装置。这样的电子系统包括各种类型的计算机可读介质以及用于各种其他类型的计算机可读介质的接口。电子系统1000包括总线1005、处理单元1010、图形处理单元(GPU)1015、系统内存1020、网络1025、只读存储器1030、永久存储装置1035、输入设备1040、以及输出装置1045。
总线1005总体代表与电子系统1000的许多内部装置通信地连接的所有系统总线、外围总线和芯片组总线。例如,总线1005将处理单元1010与GPU 1015、只读存储器1030、系统内存1020和永久存储装置1035通信地连接。
处理单元1010从这些各种内存单元中检索要执行的指令和要处理的数据,以执行本公开的处理。在不同的实施方式中,处理单元可以是单个处理器或多核处理器。一些指令被传递到GPU 1015并由其执行。GPU1015可以卸除各种计算或者补充由处理单元1010提供的图像处理。
只读存储器(ROM)1030存储由处理单元1010和电子系统的其他模块使用的静态数据和指令。另一方面,永久存储装置1035是读写内存装置。该装置是即使在电子系统1000关闭时也存储指令和数据的非易失性内存单元。本公开的一些实施方式使用大容量存储装置(例如磁盘或光盘及其对应的盘驱动器)作为永久存储装置1035。
其他实施方式使用可移动存储装置(例如软盘、闪存装置等,及其对应的盘驱动器)作为永久存储装置。像永久存储装置1035一样,系统内存1020是读写内存装置。然而,与存储装置1035不同,系统内存1020是易失性读写内存,例如随机存取内存。系统内存1020存储处理器在运行时使用的一些指令和数据。在一些实施方式中,根据本公开的处理被存储在系统内存1020、永久存储装置1035和/或只读存储器1030中。例如,根据一些实施方式,各种内存单元包括用于处理多媒体剪辑的指令。处理单元1010从这些各种内存单元中检索要执行的指令和要处理的数据,以执行一些实施方式的处理。
总线1005还连接到输入设备1040和输出装置1045。输入设备1040使用户能够向电子系统传送信息并选择命令。输入设备1040包括字母数字键盘和指向装置(也称为“光标控制装置”)、摄像头(例如,网络摄像头)、麦克风或用于接收语音命令的类似装置等。输出装置1045显示由电子系统生成的图像或以其他方式输出数据。输出装置1045包括打印机和诸如阴极射线管(CRT)或液晶显示器(LCD)的显示设备,以及扬声器或类似的音频输出装置。一些实施方式包括既充当输入设备又充当输出装置的装置,例如触摸屏。
最后,如图10所示,总线1005还通过网络适配器(未示出)将电子系统1000联接到网络1025。以这种方式,计算机可以是计算机网络(例如局域网(“LAN”)、广域网(“WAN”)或内部网络)的一部分,或者诸如因特网的网络中的一个网络的一部分。电子系统1000的任何或所有组件可以与本公开结合使用。
一些实施方式包括将计算机程序指令存储在机器可读或计算机可读介质(或者称为计算机可读存储介质、机器可读介质或机器可读存储介质)中的电子组件,例如微处理器、存储部和内存。这种计算机可读介质的一些示例包括RAM、ROM、只读光盘(CD-ROM)、可记录光盘(CD-R)、可重写光盘(CD-RW)、只读数字多功能光盘(例如,DVD-ROM、双层DVD-ROM)、各种可记录/可重写DVD(例如DVD-RAM、DVD-RW、DVD+RW等)、闪存(例如SD卡、迷你SD卡、微型SD卡等)、磁和/或固态硬盘驱动器、只读和可记录的光盘、超密度光盘、任何其他光学或磁介质以及软盘。计算机可读介质可以存储计算机程序,该计算机程序可由至少一个处理单元执行并且包括用于执行各种操作的指令集。计算机程序或计算机代码的示例包括诸如由编译程序产生的机器代码,以及包括由计算机、电子组件或微处理器使用解释器执行的高级代码的档。
尽管以上讨论主要涉及执行软件的微处理器或多核处理器,但是许多上述特征和应用是由一个或更多个集成电路执行的,例如专用集成电路(ASIC)或现场可程序设计门阵列(FPGA)。在一些实施方式中,这样的集成电路执行存储在电路本身上的指令。另外,一些实施方式执行存储在可程序设计逻辑器件(PLD)、ROM或RAM器件中的软件。
如在本说明书和本申请的任何权利要求中使用的,术语“计算机”、“服务器”、“处理器”和“内存”均指电子或其他技术装置。这些术语不包括一个人或一群人。为了说明的目的,术语“显示”是指在电子装置上显示。如本说明书和本申请的任何权利要求中所使用的,术语“计算机可读介质”和“机器可读介质”完全限于以可被计算机读取的形式存储信息的有形的物理对象。这些术语不包括任何无线信号、有线下载信号和任何其他临时信号。
尽管已经参照许多具体细节描述了本公开,但是本领域的普通技术人员将认识到,在不脱离本公开的精神的情况下,本公开可以以其他特定形式来体现。另外,多个附图(包括图7和图9)从概念上例示了处理。这些处理的特定操作可以不按照所示和所描述的确切顺序执行。可以不按照一个连续的操作系列来执行特定操作,并且可以在不同的实施方式中执行不同的特定操作。此外,处理可以使用若干子处理来实现,或者作为更大的宏处理的一部分来实现。因此,本领域的普通技术人员将理解,本公开不受限于前述例示性细节,而是由所附权利要求书限定。
补充说明
本文描述的主题有时例示了包含在不同的其他组件内或与不同的其他组件连接的不同组件。应当理解,这样描绘的架构仅是示例,并且实际上可以实现实现相同功能的许多其他架构。在概念上,实现相同功能的组件的任何布置被有效地“关联”,从而实现所需的功能。因此,本文中被组合以实现特定功能的任何两个组件可以被视为彼此“关联”,从而实现所需的功能,而与架构或中间组件无关。同样,如此关联的任何两个组件也可以被视为彼此“在操作上连接”或“在操作上联接”以实现所需的功能,并且能够如此关联的任何两个组件也可以被视为彼此“在操作上可联接”,以实现所需的功能。在操作上可联接的具体示例包括但不限于物理上可配合和/或物理上相互作用的组件和/或可无线交互和/或无线交互的组件和/或逻辑上相互作用的和/或逻辑上可相互作用的组件。
此外,关于本文中基本上任何复数和/或单数术语的使用,本领域技术人员可以根据上下文和/或应用适当地从复数转换为单数和/或从单数转换为复数。为了清楚起见,可以在本文中明确地叙述各种单数/复数置换。
此外,本领域技术人员将理解,一般而言,本文中,尤其是在所附权利要求(例如,所附权利要求的主体)中使用的术语,通常旨在作为“开放”术语,例如,术语“包括”应解释为“包括但不限于”,术语“具有”应解释为“至少具有”,术语“包含”应解释为“包含但不限于”,等等。本领域技术人员将进一步理解,如果意图表示特定数量的引入的权利要求叙述(recitation),则在权利要求中将明确地陈述该意图,在没有此类陈述的情况下,则不存在这样的意图。例如,为了帮助理解,所附权利要求中可以包含使用介绍性短语“至少一个”和“一个或更多个”以引入权利要求叙述。然而,这些短语的使用不应理解为暗示由不定冠词“一”或“一个”引入的权利要求叙述将包含此类引入权利要求叙述的任意特定权利要求限制为仅包含一个此类叙述的实现,即使是在同一权利要求包括介绍性短语“一个或更多个”或“至少一个”以及诸如“一”或“一个”的不定冠词的情况下(例如,“一”和/或“一个”应当理解为表示“至少一个”或者“一个或更多个”);对于使用定冠词引入权利要求叙述的用法也是如此。另外,即使明确陈述特定数量的引入权利要求叙述,本领域技术人员将意识到,此类叙述应理解为表示至少所述数量(例如,在没有其它修饰词的情况下,仅叙述“两个叙述”意指至少两个叙述,或者两个或更多个叙述)。此外,在使用类似于“A、B和C等中的至少一个”等约定说法的情况下,一般来说,这种结构旨在表示本领域技术人员将理解的该约定说法的意义(例如,“具有A、B和C中的至少一个的系统”将包括但不限于包括以下的系统:单独A、单独B、单独C、A和B、A和C、B和C和/或A、B和C等)。在使用类似于“A、B或C等中的至少一个”等约定说法的情况下,一般来说,这种结构旨在表示本领域技术人员将理解的该约定说法的意义(例如,“具有A、B或C中的至少一个的系统”将包括但不限于包括单独A、单独B、单独C、A和B、A和C、B和C和/或A、B和C等的系统)。本领域技术人员应当进一步理解,实际上,呈现两个或更多个替代术语的任何转折性词和/或短语,无论是在说明书、权利要求书还是附图中,均应理解为考虑包括这些术语中的一个、这些术语中的任意一个或两个术语的可能性。例如,短语“A或B”应理解为包括“A”或“B”或“A和B”的可能性。
根据前述内容,将理解的是,出于说明的目的已经在本文中描述了本公开的各种实现,并且在不脱离本公开的范围和精神的情况下可以进行各种修改。因此,本文所公开的各种实现并非旨在进行限制,其真实范围和精神由所附权利要求书指示。

Claims (13)

1.一种视频解码方法,该方法包括以下步骤:
从比特流接收要作为视频的当前图片的当前块被解码的区块的数据,其中,所述当前块的多个空域相邻邻近块在所述当前块之前被编解码;
生成合并候选列表,所述合并候选列表包括与参考了所述当前图片中的像素的运动信息相关联的帧内图片候选,其中,所述帧内图片候选包括与所述当前块的所述多个空域相邻邻近块中的一些但不是所有空域相邻邻近块相关联的候选;
从所生成的合并候选列表中选择合并候选;以及
通过使用所选择的合并候选的运动信息对所述当前块进行解码;
其中生成合并候选列表的步骤包括:基于所述当前块的宽度、高度或面积,确定在所述列表中包括哪个合并候选。
2.根据权利要求1所述的方法,其中,所述当前块的所述多个空域相邻邻近块在所述当前块的左侧和顶部,其中,生成合并候选列表的步骤包括:从所生成的合并候选列表中排除所述空域相邻邻近块中的一些。
3.根据权利要求1所述的方法,其中,生成合并候选列表的步骤包括:包括与所述当前块的上方的一个空域相邻邻近块以及所述当前块的左侧的一个空域相邻邻近块相关联并且不与所述当前块的其他空域相邻邻近块相关联的帧内图片候选。
4.根据权利要求1所述的方法,所述方法还包括以下步骤:
针对包括所述当前块的当前片维护多个基于历史的运动向量预测(HMVP)候选,每个HMVP候选与先前编解码的块的运动信息相关联;以及
将不超过N个HMVP候选与所述帧内图片候选进行比较以检测冗余。
5.根据权利要求4所述的方法,其中,N等于1。
6.根据权利要求4所述的方法,其中,生成合并候选列表的步骤包括简化的修剪处理,所述简化的修剪处理将所述HMVP候选添加到所述合并候选列表中而不进行比较以检测冗余。
7.一种视频编码方法,该方法包括以下步骤:
接收要作为视频的当前图片的当前块被编码到比特流中的区块的原始像素资料,其中,所述当前块的多个空域相邻邻近块在所述当前块之前被编码;
生成合并候选列表,所述合并候选列表包括与参考了所述当前图片中的像素的运动信息相关联的帧内图片候选,其中,所述帧内图片候选包括与所述当前块的所述多个空域相邻邻近块中的一些但不是所有空域相邻邻近块相关联的候选;
从所生成的合并候选列表中选择合并候选;以及
通过使用所选择的合并候选的运动信息将所述当前块编码到所述比特流中;
其中生成合并候选列表的步骤包括:基于所述当前块的宽度、高度或面积,确定在所述列表中包括哪个合并候选。
8.一种电子设备,所述电子设备包括:
视频解码器电路,所述视频解码器电路被配置为执行包括以下操作:
从比特流接收要作为视频的当前图片的当前块被解码的区块的数据,其中,所述当前块的多个空域相邻邻近块在所述当前块之前被编码;
生成合并候选列表,所述合并候选列表包括与参考了所述当前图片中的像素的运动信息相关联的帧内图片候选,其中,所述帧内图片候选包括与所述当前块的所述多个空域相邻邻近块中的一些但不是所有空域相邻邻近块相关联的候选;
从所生成的列表中选择合并候选;以及
通过使用所选择的合并候选的运动信息对所述当前块进行解码;
其中生成合并候选列表的步骤包括:基于所述当前块的宽度、高度或面积,确定在所述列表中包括哪个合并候选。
9.一种视频解码方法,该方法包括以下步骤:
从比特流接收要作为视频的当前图片的当前块被解码的区块的数据,其中,所述当前块的多个空域相邻邻近块在所述当前块之前被编码;
在针对所述当前块的帧内块复制(IBC)预测中执行合并模式,包括:
生成合并候选列表,以包括仅与所述当前块的多个编码的空域相邻邻近块中的两个编码空域相邻邻近块相关联的合并索引;
从所生成的合并候选列表中选择合并候选;以及
通过使用所选择的合并候选的运动信息对所述当前块进行解码;
其中生成合并候选列表的步骤包括:基于所述当前块的宽度、高度或面积,确定在所述列表中包括哪个合并候选。
10.根据权利要求9所述的方法,其中,生成合并候选列表的所述步骤包括:生成所述合并候选列表以包括仅与所述当前块的左侧和顶部的邻近块中的两个邻近块相关联的合并索引。
11.根据权利要求9所述的方法,所述方法还包括以下步骤:
针对包括所述当前块的当前片维护基于历史的运动向量预测(HMVP)候选列表,每个HMVP候选与先前编解码的块的运动信息相关联;
仅将来自所述HMVP候选列表中的前N个HMVP候选与所述合并候选列表进行比较;以及
当比较结果表明所比较的HMVP候选与所述合并候选列表中的候选不同时,将所比较的HMVP候选添加到所述合并候选列表中。
12.根据权利要求11所述的方法,其中,N等于1。
13.根据权利要求9所述的方法,所述方法还包括以下步骤:
针对包括所述当前块的当前片维护基于历史的运动向量预测(HMVP)候选列表,每个HMVP候选与先前编码的块的运动信息相关联;以及
将所述HMVP候选列表添加到所述合并候选列表中而不进行比较以检测冗余。
CN202080015185.7A 2019-02-22 2020-02-21 视频编解码方法及电子设备 Active CN113455003B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962808940P 2019-02-22 2019-02-22
US62/808,940 2019-02-22
US16/795,491 2020-02-19
US16/795,491 US11115653B2 (en) 2019-02-22 2020-02-19 Intra block copy merge list simplification
PCT/CN2020/076174 WO2020169082A1 (en) 2019-02-22 2020-02-21 Intra block copy merge list simplification

Publications (2)

Publication Number Publication Date
CN113455003A CN113455003A (zh) 2021-09-28
CN113455003B true CN113455003B (zh) 2023-09-29

Family

ID=72141893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080015185.7A Active CN113455003B (zh) 2019-02-22 2020-02-21 视频编解码方法及电子设备

Country Status (6)

Country Link
US (2) US11115653B2 (zh)
EP (1) EP3918803A4 (zh)
CN (1) CN113455003B (zh)
CA (1) CA3126882C (zh)
TW (2) TWI737184B (zh)
WO (1) WO2020169082A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7104186B2 (ja) 2018-06-05 2022-07-20 北京字節跳動網絡技術有限公司 Ibcとatmvpとの間でのインタラクション
CN110636298B (zh) 2018-06-21 2022-09-13 北京字节跳动网络技术有限公司 对于Merge仿射模式和非Merge仿射模式的统一约束
EP4307671A3 (en) 2018-06-21 2024-02-07 Beijing Bytedance Network Technology Co., Ltd. Sub-block mv inheritance between color components
CN118055249A (zh) 2018-09-22 2024-05-17 Lg 电子株式会社 使用间预测处理视频信号的方法和装置
WO2020065518A1 (en) 2018-09-24 2020-04-02 Beijing Bytedance Network Technology Co., Ltd. Bi-prediction with weights in video coding and decoding
CN112997495B (zh) 2018-11-10 2024-02-20 北京字节跳动网络技术有限公司 当前图片参考中的取整
WO2020103936A1 (en) 2018-11-22 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Pruning method for inter prediction with geometry partition
WO2020135465A1 (en) * 2018-12-28 2020-07-02 Beijing Bytedance Network Technology Co., Ltd. Modified history based motion prediction
US11632542B2 (en) * 2019-02-26 2023-04-18 Apple Inc. Method for encoding/decoding video signal, and apparatus therefor
US11166015B2 (en) * 2019-03-06 2021-11-02 Tencent America LLC Method and apparatus for video coding
CN113812165B (zh) * 2019-05-09 2023-05-23 北京字节跳动网络技术有限公司 对hmvp表的改进
US11218727B2 (en) 2019-07-11 2022-01-04 Tencent America LLC Method and apparatus for predictor candidate list size signaling for intra picture block compensation
US11451809B2 (en) * 2019-08-28 2022-09-20 Tencent America LLC Method and apparatus for video coding
JP2022548351A (ja) * 2019-09-19 2022-11-18 アリババ グループ ホウルディング リミテッド マージ候補リストを構築するための方法
WO2023198105A1 (en) * 2022-04-14 2023-10-19 Mediatek Inc. Region-based implicit intra mode derivation and prediction
WO2023236916A1 (en) * 2022-06-06 2023-12-14 Mediatek Inc. Updating motion attributes of merge candidates
WO2023246412A1 (en) * 2022-06-23 2023-12-28 Mediatek Inc. Methods and apparatus for video coding using multiple history-based motion vector prediction tables
WO2024012460A1 (en) * 2022-07-12 2024-01-18 Beijing Bytedance Network Technology Co., Ltd. Method, apparatus, and medium for video processing

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101197176B1 (ko) * 2011-09-23 2012-11-05 주식회사 케이티 머지 후보 블록 유도 방법 및 이러한 방법을 사용하는 장치
WO2015137783A1 (ko) * 2014-03-14 2015-09-17 삼성전자 주식회사 인터 레이어 비디오의 복호화 및 부호화를 위한 머지 후보 리스트 구성 방법 및 장치
CN106464905A (zh) * 2014-05-06 2017-02-22 寰发股份有限公司 用于块内复制模式编码的块向量预测方法
WO2017084512A1 (en) * 2015-11-20 2017-05-26 Mediatek Inc. Method and apparatus of motion vector prediction or merge candidate derivation for video coding
CN108141605A (zh) * 2015-10-02 2018-06-08 高通股份有限公司 帧内块复制合并模式及不可用帧内块复制参考区域的填充
WO2019029560A1 (en) * 2017-08-08 2019-02-14 Mediatek Inc. INTRA FUSION PREDICTION

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101571947B1 (ko) * 2011-03-08 2015-11-25 가부시키가이샤 제이브이씨 켄우드 동화상 부호화 장치, 동화상 부호화방법 및 동화상 부호화 프로그램, 및 동화상 복호 장치, 동화상 복호 방법 및 동화상 복호 프로그램
US9554150B2 (en) * 2013-09-20 2017-01-24 Qualcomm Incorporated Combined bi-predictive merging candidates for 3D video coding
US10264290B2 (en) 2013-10-25 2019-04-16 Microsoft Technology Licensing, Llc Hash-based block matching in video and image coding
US10027981B2 (en) 2014-09-01 2018-07-17 Hfi Innovation Inc. Method of intra picture block copy for screen content and video coding
US9832467B2 (en) 2014-10-07 2017-11-28 Qualcomm Incorporated Deblock filtering for intra block copying
US9854237B2 (en) 2014-10-14 2017-12-26 Qualcomm Incorporated AMVP and merge candidate list derivation for intra BC and inter prediction unification
US10560718B2 (en) * 2016-05-13 2020-02-11 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
US10523934B2 (en) * 2017-05-31 2019-12-31 Mediatek Inc. Split based motion vector operation reduction
US20200021836A1 (en) * 2018-07-10 2020-01-16 Tencent America LLC Method and apparatus for ordering and selection of affine merge candidates in motion compensation
US10362330B1 (en) * 2018-07-30 2019-07-23 Tencent America LLC Combining history-based motion vector prediction and non-adjacent merge prediction
US11051034B2 (en) * 2018-10-08 2021-06-29 Qualcomm Incorporated History-based motion vector predictor
US10904557B2 (en) * 2019-01-22 2021-01-26 Tencent America LLC Method and apparatus for video coding
US11025936B2 (en) * 2019-01-25 2021-06-01 Tencent America LLC Method and apparatus for video coding
JP7460661B2 (ja) * 2019-06-06 2024-04-02 北京字節跳動網絡技術有限公司 映像符号化のための動き候補リストの構成

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101197176B1 (ko) * 2011-09-23 2012-11-05 주식회사 케이티 머지 후보 블록 유도 방법 및 이러한 방법을 사용하는 장치
WO2015137783A1 (ko) * 2014-03-14 2015-09-17 삼성전자 주식회사 인터 레이어 비디오의 복호화 및 부호화를 위한 머지 후보 리스트 구성 방법 및 장치
CN106464905A (zh) * 2014-05-06 2017-02-22 寰发股份有限公司 用于块内复制模式编码的块向量预测方法
CN108141605A (zh) * 2015-10-02 2018-06-08 高通股份有限公司 帧内块复制合并模式及不可用帧内块复制参考区域的填充
WO2017084512A1 (en) * 2015-11-20 2017-05-26 Mediatek Inc. Method and apparatus of motion vector prediction or merge candidate derivation for video coding
WO2019029560A1 (en) * 2017-08-08 2019-02-14 Mediatek Inc. INTRA FUSION PREDICTION

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"View synthesis prediction using skip and merge candidates for HEVC-based 3D video coding";F. Zou et al;2013 IEEE International Symposium on Circuits and Systems (ISCAS);第57-60页 *
CE4-related: History-based Motion Vector Prediction;Li Zhang er al.;Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11;第2-3页 *
CE4-related: Simplified merge candidate list for small blocks;Xiaozhong Xu et al.;Joint Video Exploration Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11;第1页 *

Also Published As

Publication number Publication date
TW202038620A (zh) 2020-10-16
US20200275093A1 (en) 2020-08-27
WO2020169082A1 (en) 2020-08-27
CA3126882C (en) 2023-10-10
TWI737184B (zh) 2021-08-21
US20200275120A1 (en) 2020-08-27
US11115653B2 (en) 2021-09-07
TW202038621A (zh) 2020-10-16
CN113455003A (zh) 2021-09-28
TWI749467B (zh) 2021-12-11
US11122260B2 (en) 2021-09-14
EP3918803A4 (en) 2022-11-02
CA3126882A1 (en) 2020-08-27
EP3918803A1 (en) 2021-12-08

Similar Documents

Publication Publication Date Title
CN113455003B (zh) 视频编解码方法及电子设备
CN110169061B (zh) 编解码电子装置与方法
CN111034194B (zh) 编解码视频图像的方法以及电子设备
KR102448218B1 (ko) 하드웨어 친화적으로 제약된 모션 벡터 개선
CN112400319B (zh) 一种视频编码/解码方法及装置
US11297348B2 (en) Implicit transform settings for coding a block of pixels
US11924413B2 (en) Intra prediction for multi-hypothesis
US11245922B2 (en) Shared candidate list
TW201946470A (zh) 用於照度補償的信令
CN113491123B (zh) 用于多重-参考行预测与多重-假设预测的发信
CN113853795A (zh) 发信运动向量差值推导
US20190268611A1 (en) Intelligent Mode Assignment In Video Coding
WO2023186040A1 (en) Bilateral template with multipass decoder side motion vector refinement
WO2023193769A1 (en) Implicit multi-pass decoder-side motion vector refinement
WO2024017224A1 (en) Affine candidate refinement
WO2023202569A1 (en) Extended template matching for video coding
TW202415066A (zh) 多假設預測編解碼

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220505

Address after: Hsinchu County, Taiwan, China

Applicant after: MEDIATEK Inc.

Address before: Hsinchu Science Park Road, Taiwan city of Hsinchu China Dusing 1

Applicant before: MEDIATEK Inc.

GR01 Patent grant
GR01 Patent grant