CN112840653A - 视频编解码中共享合并候选列表区域的方法和装置 - Google Patents
视频编解码中共享合并候选列表区域的方法和装置 Download PDFInfo
- Publication number
- CN112840653A CN112840653A CN201980065816.3A CN201980065816A CN112840653A CN 112840653 A CN112840653 A CN 112840653A CN 201980065816 A CN201980065816 A CN 201980065816A CN 112840653 A CN112840653 A CN 112840653A
- Authority
- CN
- China
- Prior art keywords
- history
- block
- current block
- candidate list
- root
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000012545 processing Methods 0.000 claims abstract description 39
- 238000009795 derivation Methods 0.000 claims abstract description 36
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 145
- 239000013598 vector Substances 0.000 description 62
- 238000000638 solvent extraction Methods 0.000 description 55
- 238000005192 partition Methods 0.000 description 49
- 230000002123 temporal effect Effects 0.000 description 26
- 238000013138 pruning Methods 0.000 description 23
- 238000013459 approach Methods 0.000 description 22
- 230000001419 dependent effect Effects 0.000 description 18
- 230000011218 segmentation Effects 0.000 description 16
- 238000010276 construction Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 239000000872 buffer Substances 0.000 description 9
- 230000011664 signaling Effects 0.000 description 9
- 241000023320 Luma <angiosperm> Species 0.000 description 7
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 7
- 230000006835 compression Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 101150114515 CTBS gene Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 241000723655 Cowpea mosaic virus Species 0.000 description 1
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
- H04N19/423—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
揭示一种使用基于历史(history‑based)候选推导的视频编解码方法与装置。根据一种方法,在共享合并候选列表区域(Shared Merge candidatelist Region,SMR)或是在基于历史平行处理区域之中的当前块被接收。而该当前块是使用合并候选列表来加以编码或解码。只有在该当前块是首先被编码N(N≥0)块中之一、或是最后被编码N块中之一、或是被选择N块中之一的时候,该基于历史候选列表才在该当前块被编码或被解码之后加以更新。在一实施例中,对于该共享合并候选列表区域的该当前块,该合并候选列表是事先产生的,而对于该基于历史平行处理区域的该当前块,该合并候选列表是分别产生的。在另一方法中,如果该当前块是在该共享合并候选列表区域之中或是在该基于历史平行处理区域之中的时候,该当前块是使用相关于该根编解码单元的该基于历史候选列表来进行编码或解码。
Description
交叉申请
本申请要求在2018年10月6日提出的申请号为62/742,280,在2018年12月10日提出的申请号为62/777,284,以及在2019年3月18日提出的申请号为62/819,702的美国临时专利申请的优先权。上述美国临时专利申请整体以引用方式并入本文中。
技术领域
本发明关于视频编解码中使用合并模式与基于历史(history-based)合并候选的建构。尤其,本发明揭示的技术可用来克服依存度(dependency)的问题,其是相关联用于共享合并候选列表区域(SMR)或是如合并估计区域(Merge Estimation Region,MER)的平行处理区域之中基于历史候选列表的处理(handling)。
背景技术
高效率视频编码(High Efficiency Video Coding,HEVC)的标准,是由一些标准化组织国际电信联盟电信标准化部门的视频编码专家组(ITU-T Video Coding ExpertsGroup,VCEG)与国际标准化组织/国际电工委员会下属的动态影像专家组(ISO/IEC MovingPicture Experts Group,MPEG)于联合视频计划下所开发的,而且特别是与视频编码联合协作小组(Joint Collaborative Team on Video Coding,JCT-VC)合作开发。在HEVC中,一个切片(slice)被分割成多个编解码树单元(Coding Tree Unit,CTU)。在主配置文件(mainprofile)中,CTU的最小尺寸和最大尺寸由序列参数集(Sequence Parameter Set,SPS)中的语法元素指定。允许的CTU尺寸可以是8x8,16x16,32x32或64x64。对于每个切片,切片内的CTU根据光栅扫描(raster scan)顺序进行处理。
CTU进一步被分割成多个编解码单元(Coding Unit,CU)以适应各种局部特性。表示为编解码树的四叉树用于将CTU分割成多个CU。将CTU尺寸设为M×M,其中M是值64,32或16中的一个。CTU可以是单个CU(即无分割)或可以被分割成四个相同尺寸的较小单元(亦即每一个是M/2xM/2),其相对应为编解码树的节点。如果这些单元是编解码树的叶节点,则这些单元变成CU。否则,四叉树分割流程可以被迭代,直到节点的尺寸达到序列参数集(SPS)中指定的最小允许CU尺寸。这种表示形成了如图1中的编解码树(也称为分割树结构)120所指定的递归结构。CTU分割110在图1中示出,其中实线表示CU边界。使用帧间(时间)或是帧内(空间)预测来编解码画面区域的决定,是在CU层级(CU level)作出的。由于最小CU尺寸可以是8x8,所以用于在不同基本预测类型之间切换的最小间隔尺寸是8x8。
此外根据HEVC,每个CU可以被分割成一或多个预测单元(Prediction Unit,PU)。结合CU,PU作为分享共享预测信息的基本表示块。在每个PU内部,可应用相同的预测流程,并将相关信息以PU为基础发送给解码器。根据PU分割类型,CU可以被分割成一个,两个或四个PU。如图2所示,HEVC定义了八个形状用以于CU分割成PU,包括M x M、M x M/2、M/2x M、M/2x M/2、M x M/4(U)、M x M/4(D)、M/4x M(L)与M/4x M(R)的分割类型。与CU不同,PU根据HEVC仅可以被分割一次。第二行(row)所示的分割对应于不对称分割,其中两个分割部分具有不同的尺寸。
基于PU分割类型,在通过预测过程来获得残差块之后,可以根据另一四叉树结构(其与图1中所示CU的编解码树类似)将CU分割成转换单元(Transform Unit,TU)。实线表示CU边界,而虚线表示TU边界。TU是具有残差或转换系数的基本代表块,以用来应用整数转换和量化。对于每个TU,与TU有相同尺寸的一个整数转换会被用来获得残差系数。在以TU为基础进行量化之后,这些系数被传输到解码器。
这些术语编解码树块(Coding Tree Block,CTB),编解码块(Coding Block,CB),预测块(Prediction Block,PB)和转换块(Transform Block,TB)被定义出以分别指定与CTU,CU,PU,和TU相关的一个颜色分量的2-D样本数组。因此,CTU由一个亮度CTB,两个色度CTB和相关的语法元素所组成。类似的关系对CU,PU和TU一样适用有效。通常同时将树分割应用于亮度和色度,尽管当达到色度的最小尺寸时会有例外产生。
也可以选择性地使用于JCTVC-P1005所提出的二叉树块分割结构(由D.Flynn等所提出的“HEVC Range Extensions Draft 6”,国际电信通讯联盟-电信标准化部门,研究小组16,工作集会3(ITU-T SG16 WP3)以及国际标准化组织/国际电工协会之第一技术委员会第29子委员会第11号工作组(ISO/IEC JTC1/SC29 WG11)下辖的视频编码联合协作小组(Joint Collaborative Team on Video Coding,JCT-VC),2014年1月9-17日于美国圣荷西第16次会议中文件的JCTVC-P1005)。在所提出的二叉树分割结构中,可以用图3所示的多种二元分割类型(即M/2x M、M xM/2、M/4x M(L)、M/4x M(R)、M x M/4(U)与M x M/4(D)),将块递归地分割成两个较小块。最有效和最简单的分割类型是图3中的前两种分割类型所示的对称水平和垂直分割。对于尺寸为MxN的给定块,可以发信旗标以表示给定块是否被分割成两个较小块。如果该旗标表示“是”,则发信另一语法元素以表示使用了哪种分割类型。如果使用水平分割,则给定块被分割成两个尺寸为M x N/2的块;如果使用垂直分割,则给定块被分割成两个尺寸为M/2x N的块。二叉树分割过程可以被迭代,直到分割块的尺寸(宽度或高度)达到最小允许块尺寸(宽度或高度),最小允许块尺寸可以在诸如SPS的高层语法中加以定义。由于二叉树具有两种分割类型(即水平和垂直),所以最小允许块的宽度与高度二者都应该被指示出来。当分割会造成一个块的高度小于被指示出的最小值时,也就隐含了非-水平分割(Non-horizontal splitting);当分割会造成一个块的宽度小于被指示出的最小值时,也就隐含了非-垂直分割(Non-vertical splitting)。图4示出了块分割410及其相应的二叉树结构420的例子。在二叉树的每个分割节点(即非叶节点)上,一个旗标被用来表示使用了哪种分割类型(水平或垂直),其中0可表示水平分割,1可表示垂直分割。
所述二叉树结构可以用于将影像区域分割成多个较小块,诸如将切片(slice)分割成多个CTU,将CTU分割成多个CU,将CU分割成多个PU或将CU分割成多个TU,等等。二叉树可用于将CTU分割成多个CU,其中二叉树的根节点是CTU,而二叉树的叶节点是CU。叶节点可通过预测和转换编解码进一步来处理。为简化起见,不存在从CU到PU或从CU到TU的进一步分割,这则意味着CU等同于PU并且PU也等同于TU。因此,在这种情况下,二叉树的叶节点也就是用于预测和转换编解码的基本单元。
QTBT结构
二叉树结构比四叉树结构更具弹性,是因为可以支持更多的分割形状,这也是编解码效率提高的来源。但是,为了选择最佳的分割形状,编解码复杂度也会增加。为了平衡复杂度和编解码效率,也已经有方法揭示出了组合四叉树和二叉树结构的方法,该结构也称为四叉树加二叉树(quadtree plus binary tree,QTBT)结构。根据所述QTBT结构中,一CTU(或对I-切片而言是CTB)是四叉树的根节点,而首先透过四叉树对CTU进行分割,其中对于一节点进行四叉树分割可以被迭代直到节点达到最小可被允许四叉树叶节点尺寸(即MinQTSize)。如果四叉树叶节点的尺寸不大于最大可被允许二叉树根节点的尺寸(即MaxBTSize),则可以透过二叉树进一步分割。一个节点的二叉树分割可以被迭代直到节点达到最小可被允许二叉树叶节点尺寸(即MinBTSize)或是最大可被允许二叉树深度(即MaxBTDepth)。二叉树叶节点(即CU,或对I-切片而言是CB)会被用来作预测(即帧内或帧间预测)与转换而不进一步分割。在二叉树分割中有二种分割类型:对称水平分割与对称垂直分割。在QTBT结构中,可以在高级语法如SPS中指示最小可被允许四叉树叶节点的尺寸,最大可被允许二叉树根节点的尺寸,最小可被允许二叉树叶节点的宽度和高度以及最大可被允许二叉树的深度。图5示出了块分割510及其对应的QTBT结构520的例子。实线表示四叉树分割,虚线表示二叉树分割。在二叉树的每个分割节点(即非叶节点)中,一个旗标会指示使用了哪种分割类型(水平或垂直),0可表示水平分割,1可表示垂直分割。
上述的QTBT结构可以用于将影像区域(即切片,CTU,或CU)分割成多个更小的块,诸如将切片分割成多个CTU,将CTU分割成多个CU,将CU分割成多个PU,或将CU分割成多个TU等等。例如,QTBT可用于将CTU分割为多个CU,其中QTBT的根节点是CTU,其由QTBT结构分割成多个CU,而CU由预测和转换编解码进行进一步处理。为简化起见,不存在从CU到PU或从CU到TU的进一步分割,这则意味着CU等同于PU并且PU也等同于TU。因此,在这种情况下,QTBT的叶节点也就是用于预测和转换的基本单元。
在下文显示QTBT结构的例子。对于尺寸大小为128x128的编码树单元(CTU),最小可被允许四叉树叶节点尺寸设为16×16,最大可被允许二叉树根节点尺寸设为64x64,最小可被允许二叉树叶节点宽度或高度皆设为4,最大可被允许的二叉树深度设为4。首先,CTU经由四叉树结构分割,而叶四叉树单元的尺寸可以从16×16(即最小可被允许四叉树叶节点尺寸)至128×128(等于CTU的尺寸,无分割)。如果叶四叉树单元为128×128,则不能被二叉树进一步分割,因为其尺寸大小超过最大可被允许二叉树根节点尺寸64x64;否则,叶四叉树单元可以经由二叉树进一步分割。叶四叉树单元(也是作为根二叉树单元)的二叉树深度等于0。当二叉树深度达到4时(即上述最大可被允许的二叉树深度),即隐含了不分割;当相对应二叉树节点的块的宽度等于4时,即隐含了非-水平分割;并且当相对应二叉树节点的块的高度等于4时,即隐含了非-垂直分割。QTBT的叶节点可通过预测(帧内或帧间)和转换编解码进一步来处理。
对于I-切片(I slice),通常会以亮度/色度分别编解码的方式来适用QTBT树结构。例如,QTBT树结构会分别适用在I-切片的亮度与色度成份上,而对于P-和B-切片的亮度与色度则一起适用(当达到色度的某些最小尺寸时会有例外产生)。换言之,在I-切片中的亮度CTB有其QTBT树结构块分割,而二个色度CTB有另外一QTBT树结构块分割。在另一例子中,二个色度CTB也可以有他们自己不同的QTBT树结构块分割。
为了进一步支持更多分割形状以达成更有弹性的分割,三叉树分割方法则设计为捕捉位于块中央的物体,而四叉树与二叉树分割方法总是沿着块中央来进行分割。图6A示出了垂直三叉树分割610与水平三叉树分割方620。通过允许垂直地或水平地进行四分之一分割,三叉树分割方法可以提供更快发现沿着块边界小物体位置的能力。
多类型树(Multi-Type-Tree,MTT)的块分割,是通过在MTT的第二层中允许同时有二叉树与三叉树分割方法,来延伸QTBT中二层的树结构的概念。所述MTT中二层的树分别被称为区域树(region tree,RT)与预测树(prediction tree,PT)。第一层RT总是以四叉树(QT)分割,而第二层PT则可能为二叉树(BT)分割或是三叉树(TT)分割。例如,CTU首先通过RT进行分割,其为QT分割,而每一RT叶节点可以通过PT进一步分割,其为BT或是TT分割。通过PT分割的块可进一步用PT分割,直至达到了最大PT深度。例如,一个块可以首先通过垂直BT进行分割来产生左方子块与右方子块,而且左方子块通过水平TT进一步分割,而右方子块通过水平BT进一步分割。PT叶节点是预测与转换的基本编解码单元(CU)而不会进一步被分割。
图6B根据MTT块分割示出了一个用于块分割的树-类型发信的例子。RT发信可以和QTBT块分割中四叉树发信相似。对于发信PT节点而言,额外的位子(bin)会被发信来指示出其是否为二叉树分割或是三叉树分割。对于通过RT进行的块分割,第一位子会被发信来指示出是否有另一RT分割。如果该块不由RT进一步分割(即第一位子是0),则第二位子会被发信来指示出是否有PT分割。如果该块也不由PT进一步分割(即第二位子是0),则此块为叶节点。如果该块由PT进一步分割(即第二位子是1),则会送出第三位子来指示出是水平或垂直分割,而后跟着第四位子来区分是二叉树(BT)或是三叉树(TT)分割。
在建构MTT块分割之后,MTT叶节点则为CU,则被用来进行预测与转换而不作进一步分割。在MTT中,所提出的树结构在I-切片(I slice)的亮度与色度会分别编码,而在P-和B-切片的亮度与色度则一起适用(当达到色度的某些最小尺寸时会有例外产生)。也就是说,在I-切片中的亮度CTB有其QTBT-结构的块分割,而二个色度CTB有另外一QTBT-结构的块分割。
虽然所提出的MTT通过自适应式分割块来进行预测与转换可以改善表现性能,但是如果可能还是有需要进一步改善表现性能来达成整体的效率目标。
合并模式与AMVP模式
为增进HEVC中运动向量(MV)编解码的编解码效率,HEVC有跳过、合并模式与帧间高级运动向量预测(AMVP)模式。跳过与合并模式是从如图7所示的空间相邻块(空间候选)或是时间同位块(时间候选)来取得运动信息。当PU是跳过或合并模式时,不需要对运动信息加以编码;而是只有对选择到的候选的索引加以编码。对于跳过模式,则残差信号被迫为0且不加以编码。在HEVC,如果特定块是以跳过或合并模式编码时,会发信候选索引以指示是使用候选组之中哪一个候选来进行合并。每一被合并的PU重复使用所选择的候选的MV、预测方向、与参考画面索引。
如图7所示,对于HM-4.0(HEVC测试模型4.0)而言,最多有四个空间MV候选可以从A0、A1、B0与B1推导出以及一个时间MV候选可以从TBR或TCTR推导出(先使用TBR;如果TBR是不可用的,则再使用TCTR)。要注意的是,如果四个空间MV候选中任何一个是不可用的,则位置B2被用来推导MV候选以作为替代。在四空间MV候选与时间MV候选的推导过程后,则使用移除冗余(修剪)来移除冗余的MV候选。在移除冗余(修剪)之后,如果可用的MV候选数目小于5,则三种额外的候选会被推导出并加入候选组(候选列表)之中。基于率-失真优化(rate-distortion optimization,RDO)决策,编码器会在跳过或合并模式的候选组之中来选择出最后的候选,并将索引传送至解码器。
在本揭示中,跳过与合并模式称为“合并模式”。
图7也示出了AMVP与合并架构二者中使用来推导空间与时间MVP的相邻PU。在AMVP中,左方MVP是在A0、A1中第一个可用的MVP,上方MVP是在B0、B1、B2中第一个可用的MVP,而时间MVP是在TBR或TCTR中第一个可用的MVP(先使用TBR;如果TBR是不可用的,则再使用TCTR)。如果左方MVP是不可用的而且上方MVP不是缩放的(scaled)MVP,则如果在B0、B1与B2中有缩放的MVP,就可以推导出第二个上方MVP。在HEVC中AMVP的MVP的列表大小是2。因此,在两个空间MVP与一个时间MVP的推导过程后,仅有前二个MVP可以被纳入于MVP列表中。在移除冗余之后,如果可用的MVP数目少于2,则在候选列表中加入零向量候选。
当PU是以帧间AMVP模式编码时,运动补偿的预测是由所传送来的运动向量差异(motion vector differences,MVDs)来进行,MVDs可以与运动向量预测子(Motion VectorPredictors,MVPs)一起使用来推导出运动向量(motion vector,MVs)。为了决定帧间AMVP模式下的MVP,可以使用高级运动向量预测(AMVP)的架构来选出运动向量预测子,方式是从包括二个空间MVP以及一个时间MVP的AMVP候选组中选出。因此在AMVP模式下,需要对MVP的MVP索引以及相对应的MVDs进行编码与传送。此外,帧间预测方向(用来表明在双向预测以及单向预测之间的预测方向,也就是列表List0(即L0)以及列表List1(即L1))以及对于每一列表所伴随的参考帧索引也应予以编码与传送。
图7示出了AMVP与合并架构二者中用来推导空间与时间MVP所参考的相邻PU。在AMVP中,左方MVP是在A0、A1中第一个可用的MVP,上方MVP是在B0、B1、B2中第一个可用的MVP,而时间MVP是在TBR或TCTR中第一个可用的MVP(先使用TBR;如果TBR是不可用的,则再使用TCTR)。如果左方MVP是不可用的而且上方MVP不是缩放的(scaled)MVP,则如果在B0、B1与B2中有缩放的MVP,就可以推导出第二个上方MVP。在HEVC中AMVP的MVP的列表大小是2。因此,在二个空间MVP与一个时间MVP的推导过程后,仅有前二个MVP可以被纳入于MVP列表中。在移除冗余之后,如果可用的MVP数目少于2,则在候选列表中加入零向量候选。
如图7所示对于跳过与合并模式而言,最多有四个空间合并索引可以从A0、A1、B0与B1推导出以及一个时间合并索引可以从TBR或TCTR推导出(先使用TBR;如果TBR是不可用的,则再使用TCTR)。要注意的是,如果四个空间合并索引中任何一个是不可用的,则位置B2被用来推导合并索引以作为替代。在四个空间合并索引与一个时间合并索引的推导过程后,则使用移除冗余来移除冗余的合并索引。在移除冗余之后,如果可用的合并索引数目小于5,则三种额外的候选会被推导出并加入于候选列表中。基于率-失真优化(rate-distortion optimization,RDO)决策,编码器会在跳过或合并模式的候选组之中来选择出最后的候选,并将索引传送至解码器。
通过使用原始的合并候选来创建出额外双向预测的合并候选。所述额外的候选可以分为三种候选类型:
1.结合型(combined)双向预测合并候选(候选类型1)
2.缩放型(scaled)双向预测合并候选(候选类型2)
3.零向量合并/AMVP候选(候选类型3)
在候选类型1中,结合型双向预测合并候选是通过结合原始的合并候选来创建出。尤其,双向预测合并候选是使用在原始候选中的二个候选来创建的:其中有mvL0(列表0中的运动向量)与refIdxL0(列表0中的参考画面索引);或是mvL1(列表1中的运动向量)与refIdxL1(列表1中的参考画面索引)。图8示出了结合型双向预测合并候选推导过程的例子。候选组810相对应于原始候选列表,其包括L0中的mvL0_A,ref0(831)与L1中的mvL1_B,ref0(832)。如图8中流程830所示,通过结合L0与L1中的候选,可以形成双向预测MVP833。
在候选类型2中,缩放型双向预测合并候选是通过缩放原始的合并候选来创建出。尤其,双向预测合并候选是使用在原始候选中的一个候选来创建的:其中有mvLX(列表X中的运动向量)与refIdxLX(列表X中的参考画面索引),X可以是0或1。例如,候选A是列表0有mvL0_A与ref0的单向预测,ref0先拷贝到列表1的参考索引ref0’。之后以ref0与ref0’来缩放mvL0_A并藉以计算出mvL0’_A。然后,列表0中具有mvL0_A与ref0以及列表1中具有mvL0’_A与ref0’的双向预测合并候选则被创建出并加入于合并候选列表中。图9A示出了缩放型双向预测合并候选推导过程的一例子,其中候选列表910相对应于一原始候选列表,而候选列表920相对应于一扩大候选列表,其包括如流程930显所示所二个所产生出来的双向预测MVP。
在候选类型3中,零向量合并/AMVP候选是通过结合零向量与可以被参考的参考索引来创建出。图9B示出了加入零向量合并候选的例子,其中候选列表940相对应于原始候选列表,而候选列表950相对应于通过加入零向量而扩展的合并候选列表。图9C示出了加入零向量AMVP候选的例子,其中候选列表960(L0)与962(L1)相对应于原始AMVP候选列表,而候选列表970(L0)与972(L1)相对应于通过加入零向量而扩展的AMVP候选列表。如果零向量候选不重复,则将其加入合并/AMVP候选列表中。
传统子-PU时间运动向量预测(SbTMVP)
ATMVP(高级时间运动向量预测)模式(也称为子-PU时间运动向量预测(SbTMVP))是基于子-PU的模式来用于合并候选,其使用了空间相邻来得出初始向量(initialvector),并且使用此初始向量(在某些情况下会加以修正)来得出同位画面中同位块的坐标(coordinate)。然后,取得同位画面中同位块的子-CU(通常是4x4或8x8)的运动信息,并填入当前合并候选的子-CU(通常是4x4或8x8)运动缓冲器中。有多种ATMVP的变型揭示于文件JVET-C1001(由J.Chen等人所提的“Algorithm Description of Joint ExplorationTest Model 3(JEM3)”;于国际电信通讯联盟-电信标准化部门,研究小组16,工作集会3(ITU-T SG16WP3)以及国际标准化组织/国际电工协会之第一技术委员会第29子委员会第11号工作组(ISO/IEC JTC1/SC29 WG11)下的联合视频专家组(JVET),第3次会议:在瑞士日内瓦(Geneva,CH);2016年5月26日–6月1日;文件:JVET-C1001);以及文件JVET-K0346(X.Xiu等人所提的“CE4-related:One simplified design of advanced temporalmotion vector prediction(ATMVP)”,ITU-T SG 16WP 3与ISO/IEC JTC 1/SC29/WG 11下的联合视频专家组(JVET),第11次会议:在斯洛文尼亚的卢布尔雅那(Ljubljana,SI),2018年7月10–18日;文件:JVET-K0346)。
空间-时间运动向量预测(STMVP)
STMVP模式是基于子-PU的模式来用于合并候选,子-PU的运动向量于光栅扫描(raster scan)顺序中会被递归地产生。当前块的MV推导首先会识别出其二个空间相邻,然后使用某种MV缩放来推导出时间相邻。在取得与缩放MV之后,将所有可用的运动向量(最多3个)加以平均以形成STMVP,并指定为当前子-PU的运动向量。STMVP的详细描述可以在文件JVET-C1001第2.3.1.2小节中找到。
基于历史合并模式
基于历史合并模式是传统合并模式的一种变型。基于历史合并模式会将一些先前CU的合并候选储存于历史数组(history array)中。因此,除了原始的合并候选之外,当前CU可以使用历史数组中的一或多个候选来丰富合并模式的候选。基于历史合并模式的细节可以在文件JVET-K0104中找到(L.Zhang等人所提的“CE4-related:History-based MotionVector Prediction”;于ITU-T SG 16WP 3与ISO/IEC JTC 1/SC29/WG 11下的联合视频专家组(JVET),第11次会议:在斯洛文尼亚的卢布尔雅那(Ljubljana,SI),2018年7月10–18日;文件:JVET-K0104)。
上述基于历史的方法也可以应用于AMVP候选列表。
非-相邻合并候选
非-相邻合并候选择使用远离当前CU的一些空间候选。非-相邻合并候的变型可以于下列文件中找到:JVET-K0228(R.Yu等人所提的“CE4-2.1:Adding non-adjacentspatial merge candidates”,ITU-T SG 16WP3与ISO/IEC JTC 1/SC 29/WG 11,第11次会议:在斯洛文尼亚的卢布尔雅那(Ljubljana,SI),2018年7月10–18日;文件:JVET-K0104);以及文件:JVET-K0286(J.Ye等人所提的“CE4:Additional merge candidates(Test4.2.13)”,ITU-T SG 16WP 3与ISO/IEC JTC 1/SC 29/WG 11,第11次会议:在斯洛文尼亚的卢布尔雅那(Ljubljana,SI),2018年7月10–18日;文件:JVET-K0104)。
上述非-相邻-依据的方法也可以应用于AMVP候选列表。
仿射模式
在递交至国际电信通讯联盟–视频编解码专家组(I TU-VCEG)的提案投稿I TU-T13-SG16-C1016(由Li n等人所提的“Affi ne transform pred ict ion for nextgenerat ion video cod i ng”,I TU-U,研究组16,问题Q6/16,提案投稿C1016,2015年9月,瑞士日内瓦)中,揭示了四参数仿射预测,其中包括了仿射合并模式。当仿射运动块正在移动时,该块的运动向量场域可以通过两个控制点运动向量或者四个参数加以描述如下,其中(vx,vy)表示运动向量:
四参数仿射模型的例子如图10所示,其中块1010相对应于当前块,而块1020相对应于参考块。变换块是矩形块。在此移动的块中的每个点的运动向量场域可以通过如下等式加以描述:
在上述等式中,(v0x,v0y)是位于块的左上方角落处的一个控制点运动向量(即v0),(v1x,v1y)是位于块的右上方角落的另一个控制点运动向量(即v1)。当两个控制点的MV被解码时,该块的每个4x4块的MV可以根据上述等式来决定。换句话说,该块的仿射运动模型可以由位于两个控制点处的两个运动向量来指定。另外,虽然块的左上方角落和右上方角落用作两个控制点,其他两个控制点也可以被使用。
有两种仿射候选:继承仿射候选与角落推导候选(即结构候选)。对于继承仿射候选而言,当前块会继承相邻块的仿射模型,所有控制点MV都是来自相同的相邻块。如图11A所示,如果当前块1110继承了块A1的仿射运动,则块A1的控制点MV会被使用作为当前块的控制点MV,其中根据二个控制点MV(v0和v1),相关联于块A1的块1112则会旋转到块1114。因此,当前块1110则会旋转到块1116。继承候选会在角落推导候选之前插入。继承控制点MV的候选的选择顺序根据如下:(A0->A1)(B0->B1->B2)。
在投稿ITU-T13-SG16-C1016中,对于帧间模式编解码的CU而言,当CU尺寸等于或大于16x16之时,会发信一仿射旗标以指示仿射帧间模式是否被使用。如果当前块(例如当前CU)以仿射帧间模式进行编解码,则使用相邻有效重构块来建立候选MVP对的列表。图11B示出了相邻块组以用来堆导出角落-推导仿射候选。如图11B所示,对应于位于当前块1120的左上方角落处的块V0的运动向量,其是从相邻块a0(称为左上方块,above-leftblock)、相邻块a1(称为左上方内侧块,inner above-left block)和相邻块a2(称为左上方下侧块,lower above-left block)的运动向量中所选择出的。对应于位于当前块1120的右上方角落处的块V1的运动向量,其是从相邻块b0(称为上方块)和相邻块b1(称为右上方块)的运动向量中所选择出的。
在上述等式中,MVa是与块a0、a1或者a2相关的运动向量,MVb是从块b0和b1的运动向量中所选择出来的,MVc是从块c0和c1的运动向量中所选择出来的。具有最小DV的MVa和MVb则被选择以形成MVP对。因此,虽然仅两个MV集(即MVa和MVb)将被搜索以找到最小DV,但是第三DV集(即MVc)也涉及在此选择过程中。第三DV集对应于位于当前块1110的左下方角落块的运动向量,其是从相邻块c0(称为左方块)和c1(称为左下方块)的运动向量中所选择出来的。在图11B的例子中,使用来建构仿射运动模型的控制点MV的相邻块(a0、a1、a2、b0、b1、b2、c0与c1),在本揭示中则称为相邻块组。
在投稿ITU-T13-SG16-C-1016中,也提出了仿射合并模式。如果当前块是合并PU,则检查五个相邻块(即图11B中的c0、b0、b1、c1与a0块)来决定它们其中之一是否为仿射帧间模式或者仿射合并模式。如果是,则affine_flag旗标被发信以指示当前PU是否为仿射模式。当当前PU是以仿射合并模式编码时,其从有效相邻重构块中得到用仿射模式编码的第一块。如图11B中所示,候选块的选择顺序是从左方、上方、右上方、左下方到左上方(即c0→b0→b1→c1→a0)。第一仿射编码块的仿射参数会用于推导出当前PU的v0和v1。
发明内容
揭示一种使用基于历史候选推导的视频编解码帧间预测的方法与装置,其中基于历史候选列表在编码或解码时被更新。根据本发明的一种方法,在视频编码器侧接收关于当前画面的当前块的输入数据,或在视频解码器侧接收相对应于经过压缩后数据的视频比特流,而该压缩后数据包括该当前画面中的该当前块,其中该当前块是在共享合并候选列表
区域(SMR)之中或是在平行处理区域之中。使用合并候选列表来对该
当前块进行编码或解码。只有在该当前块是首先被编码N块中之一、或
是最后被编码N块中之一、或是在该SMR或是在该基于历史平行处理区
域之中所选择N块中之一的时候,该基于历史候选列表才在该当前块被
编码或被解码之后被更新。而N是大于或等于0的整数。
在一实施例中,N等于0。在此案例中,在该当前块被编码或被解码之后,该基于历史候选列表总是被限制更新。备选地,该基于历史候选列表也可以在该当前块被编码或被解码之后被限制更新,除非该当前块是该SMR或是在该基于历史平行处理区域之中的最后一块。
在一实施例中,N是基于下列来决定:包含该当前块的共享边界CU(编解码单元)中块的形状、块的宽度、或是块的高度。
在一实施例中,N是事先定义的数值。该事先定义的数值会在该视频编码器侧的序列、画面、或切片层级中发信,或该事先定义的数值在该视频解码器侧的该序列、画面、或切片层级中被剖析。
在一实施例中,对于该SMR的当前块,该合并候选列表是事先产生的,而对于该基于历史平行处理区域的当前块,该合并候选列表是分别产生。
根据另一种方法,根CU(编解码单元)被决定以用于共享合并候选列表区域(SMR)或是在基于历史平行处理区域。在视频编码器侧接收关于当前画面的当前块的输入数据,或在视频解码器侧接收相对应于经过压缩后数据的视频比特流,而该压缩后数据包括该当前画面中的该当前块。如果该当前块是在该SMR之中或是在该基于历史平行处理区域之中的时候,该当前块使用相关于该根CU的该基于历史候选列表来进行编码或解码。
如果该当前块是在该SMR之中或是在该平行处理区域之中,该基于历史候选列表在该当前块被编码或被解码之后被限制更新。如果该当前块不是在该SMR之中或不是在该基于历史平行处理区域之中,该根基于历史候选列表在该当前块被编码或被解码之后被更新。
附图说明
图1示出了块分割的一个例子,使用四叉树结构来将编解码树单元(CTU)分割成数个编解码单元(CUs)。
图2标出了根据高效率视频编码(HEVC)的非对称运动分割(AMP),其中AMP定义了八个形状来将CU分割成PU。
图3标出了二叉树分割结构所使用的多种二元分割类型的例子,其中使用分割类型可将块递归地分割成两个较小块。
图4示出了块分割及其相应的二叉树的例子,其中在二叉树的每个分割节点(即非叶节点)上,一个语法被用来表示使用了哪种分割类型(水平或垂直),其中0可表示水平分割,而1可表示垂直分割。
图5示出了块分割及其对应的QTBT的例子,其中实线表示四叉树分割,而虚线表示二叉树分割。
图6A示出了垂直三叉树分割与水平三叉树分割。
图6B根据MTT块分割示出了一个用于块分割的树-类型发信的例子,其中RT发信可以和QTBT块分割中四叉树发信相似。
图7示出了AMVP与合并架构二者中使用来推导空间与时间MVP的相邻PU。
图8示出了结合型双向预测合并候选推导过程的一例子。
图9A示出了缩放型双向预测合并候选推导过程的一例子,其中在左方的候选列表相对应于原始候选列表,而在右方的候选列表相对应于扩大候选列表,其包括二个所产生出来的双向预测MVP。
图9B示出了加入零向量合并候选的例子,其中在左方的候选列表相对应于原始合并候选列表,而在右方的候选列表相对应于通过加入零候选而扩展的合并候选列表。
图9C示出了加入零向量AMVP候选的例子,其中在上方的候选列表相对应于原始AMVP候选列表(L0在左方,而L1在右方),而在下方的候选列表相对应于通过加入零向量而扩展的AMVP候选列表(L0在左方,而L1在右方)。
图10标出了四参数仿射模型的例子,其中也示出了当前块与参考块。
图11A示出了继承仿射候选推导的一例子,其中当前块继承相邻块的仿射模型,并且是通过来继承相邻块的控制点MV来当成当前块的控制点MV来达成。
图11B示出了用来推导角落-推导仿射候选的相邻块组,其中MV是从每一相邻群组推导得出。
图12A-图12C示出了在根CU中的子-CU的共享合并列表的例子。
图13示出了子-树的例子,其中的子-树根是QTBT分割树的树节点。
图14根据本发明的实施例示出了使用基于历史候选推导的示例性视频编解码帧间预测的流程图。
图15根据本发明的实施例示出了使用基于历史候选推导的示例性视频编解码帧间预测的另一流程图。
具体实施方式
在接下来的说明是实施本发明所最佳能思及的方式,在此说明的目的是为了阐释本发明的一般性原则,不应受所述说明性细节的限制,而本发明的范围最佳方式是由参照所附的权利要求的范围来决定。
在本发明中揭示了一些技艺以便于简化子-块合并模式。
提出方法–共享候选列表
为了简化编解码器操作的复杂度,提出一种共享候选列表的方法。在此,“候选列表”是指合并模式或AMVP模式候选,或其他种类的预测候选列表(例如DMVR或双向改善(bi-lateral refinement)候选列表、仿射合并模式、子-块合并模式、仿射帧间/AMVP模式)。“共享候选列表”的基本想法是,可以产生在一个较大边界(例如母CU、或QTBT或QTBTTT树中一子-树的根、或QT树的节点)的候选列表,而所产生的候选列表可以由边界之内或是子-树之内的所有叶-CU来共享。
图12A-图12C示出了共享候选列表的一些例子。图12A中,子-树的根CU(1210)通过大的虚线方框所显示。分割的叶CU(1212)则如小的虚线方框所显示。在根叶(root leaf)之下,相关联于根CU的虚线方框(1210)也相对应于叶CU的共享边界。图12B中,共享边界(1220)是通过大的虚线方框所显示。小的叶CU(1222)则如小的虚线方框所显示。图12C显示出了合并共享节点的四个例子。共享合并候选列表被产生以用于点状虚拟CU(即合并共享节点)。在分割1232中,相对应于8x8块的合并共享节点被分割为4个4x4的块。在分割1234中,相对应于8x8块的合并共享节点被分割为2个4x8的块。在分割1236中,相对应于4x16块的合并共享节点被分割为2个4x8的块。在分割1238中,相对应于4x16块的合并共享节点被分割为2个4x4的块与1个8x8的块。
有两个主要的实施例是有关于“共享候选列表”:一个是在子-树之内来共享所述之候选列表,而另一个是在“共同共享边界”之内来共享所述之候选列表。
实施例–在子-树之内的共享候选列表
“子-树”一词定义为QTBT分割树的子-树(例如图1所示的QTBT分割树120)。图13显示“子-树(1310)”的一个例子,其中子-树根是QTBT分割树中的树节点(1312)。子-树最后的分割叶CU则是在此子-树之内。块分割1320相对应于图13的子-树1310。在所提出的方法中,候选列表(例如合并模式、AMVP模式候选、或其他类型的预测候选列表)可以基于共享-块-边界来产生,其中共享-块-边界的例子是基于如图12A所示的子-树的根CU边界。
实施例–在“共同共享边界”之内的共享候选列表
在此实施例中定义了共同共享边界。“共同共享边界”是在画面内排列的最小-块(例如4x4)的矩形区域。在“共同共享边界”之内的每一CU可以使用共同共享候选列表,其中共同共享候选列表是基于“共同共享边界”所产生的。例如,共同共享边界1210中的子块可以共享合并候选列表,其中基于共同共享边界的相邻块可以推导出一或更多的合并候选。换言之,空间相邻位置与时间相邻位置都是基于“共同共享边界”。共同共享边界可以是方形块或非方形块。共同共享边界的尺寸大小/深度/宽度/高度可以发信于序列-层级/画面-层级/切片-层级。
在所提出的共享列表方法(例如在子-树与共同共享边界之内的共享候选列表),根CU(或称母CU)或共享边界的尺寸大小/深度/形状/宽度/高度是用来推导出候选列表。在候选列表推导中,对于任何基于位置的推导(根据当前块/CU/PU位置/尺寸大小/深度/形状/宽度/高度来推导出参考块的位置),会使用根CU或共享边界位置与形状/尺寸大小/深度/宽度/高度。在一个实施例中,对仿射继承候选推导而言,会先推导出参考块的位置。当应用共享列表时,会通过使用根CU或共享边界位置与形状/尺寸大小/深度/宽度/高度,来推导出参考块的位置。在一个例子中,会储存参考块的位置。当对于根CU或共享边界的子CU编码时,会使用所储存的参考块位置来找仿射候选的参考块。
在另一实施例中,在候选列表中每一仿射候选的根CU或共享边界的控制点MV被推导出。每一仿射候选的根CU或共享边界的控制点MV,会被此根CU或共享边界的数个子CU中所共享。在一个例子中,所推导出控制点MV可以储存起来而用于子CU。对于根CU或共享边界的每一个子CU,根CU或共享边界的控制点MV会被使用来推导子CU的控制点MV,或被使用来推导子CU的子-块MV。在一个例子中,子CU的子-块MV是从子CU的控制点MV推导得出的,而子CU的控制点MV是从根CU或共享边界的控制点MV推导得出的。在一个例子中,子CU的子-块MV是从根CU或共享边界的控制点MV推导得出的。在一个例子中,根CU或共享边界的子-块MV是在根CU或共享边界推导得出的。所推导出的子-块MV可以直接被使用。对于在根CU或共享边界之外的相邻CU的这种CU,从根CU或共享边界的控制点MV所推导出的控制点MV,则被使用来推导出仿射继承候选。在另一例子中,根CU或共享边界的控制点MV被使用来推导出仿射继承候选。在另一例子中,所储存CU的子-块MV被使用来推导出仿射继承候选。在另一例子中,所储存的在根CU或共享边界的子-块MV被使用来推导出仿射继承候选。在一实施例中,对于在上方CTU行(row)的相邻参考CU而言,会被用来推导仿射继承候选的,是用所储存相邻参考CU的子-块MV(例如左下方与右下方的子-块MV、或左下方与下方中间的子-块MV、或下方中间与右下方的子-块MV),而不是用包含此相邻参考CU的根CU或共享边界的控制点MV,而也不是用此相邻参考CU的控制点MV。
在另一实施例中,在编码子CU时,根CU或共享边界的位置与形状/宽度/高度/尺寸大小可以被储存起来或推导出以用于仿射候选参考块推导。可以使用等式(3)的四-参数仿射模型与等式(4)的六-参数仿射模型,来推导子CU的仿射候选或控制点MV。例如在图12A,在根CU之内的CU可以参考块A0、A1、B0、B1、B2以及同位块TBR与TCTR来推导仿射候选。在另一实施例中,对于仿射继承候选的推导而言,会使用当前子CU的位置与形状/尺寸大小/深度/宽度/高度。如果参考块是在根CU或共享边界之内,则不会用它来推导仿射候选。
对于仿射角落推导候选而言,根据本发明的实施例对于子CU不会使用角落推导候选。在另一实施例中,会使用当前子CU的位置与形状/尺寸大小/深度/宽度/高度。如果参考块/MV是在根CU或共享边界之内,则不会用它来推导仿射候选。在另一实施例中,会使用根CU或共享边界的形状/尺寸大小/深度/宽度/高度。角落参考块/MV的推导是基于根CU或共享边界的形状/尺寸大小/深度/宽度/高度。所推导出的MV可以直接使用为控制点MV。在另一实施例中,角落参考块/MV的推导是基于根CU或共享边界的形状/尺寸大小/深度/宽度/高度。通过使用仿射模型(例如四-参数仿射模型或六-参数仿射模型),参考MV与其位置可以被用来推导子CU的仿射候选。例如,所推导出的角落控制点MV可被视为根CU或共享边界的CU的控制点MV。子CU的仿射候选可以通过等式(3)或等式(4)推导出。
可以将根CU或根共享边界的结构仿射候选的控制点MV储存起来。对于根CU或共享边界中的子CU而言,所储存起来的参考块位置可以用来找到仿射候选推导的参考块。在另一实施例中,在候选列表的每一个仿射候选的根CU或共享边界的控制点MV可以被推导出来。每一个仿射候选的根CU或共享边界的控制点MV可以被此根CU或共享边界的子CU们所共享。在一个例子中,可以将所推导出的控制点MV储存起来以用于子CU中。对于根CU或共享边界中的每一个子CU而言,根CU或共享边界的控制点MV被用来推导子CU的控制点MV,或是被用来推导子CU的子-块MV。在一个例子中,子CU的子-块MV是从子CU的控制点MV推导出来的,而所述控制点MV是从根CU或共享边界的控制点MV推导出来的。在一个例子中,子CU的子-块MV是从根CU或共享边界的控制点MV推导出来的。在一个例子中,在根CU或共享边界中的子-块MV可以在根CU或共享边界推导出来的。所推导出来的子-块MV可以被直接使用。对于根CU或共享边界之外的相邻CU中的CU而言,从根CU或共享边界的控制点MV所推导出的控制点MV被用来推导仿射继承候选。在另一例子中,根CU或共享边界的控制点MV被用来推导仿射继承候选。在另一例子中,CU所储存的子-块MV被用来推导仿射继承候选。在另一例子中,根CU或共享边界的所储存的子-块MV被用来推导仿射继承候选。在一个实施例中,对于在上方CTU行(row)的相邻参考CU而言,会被用来推导仿射继承候选的,是用所储存相邻参考CU的子-块MV(例如左下方与右下方的子-块MV、或左下方与下方中间的子-块MV、或下方中间与右下方的子-块MV),而不是用包含此相邻参考CU的根CU或共享边界的控制点,而也不是用此相邻参考CU的控制点MV。
在另一实施例中,从根CU与共享边界所推导出的控制点MV可以未经仿射模型转换而直接被使用。
在一个实施例中,对于时间同位MV推导而言,根CU或共享边界的同位MV是被所有子CU所共享/使用。在另一实施例中,对于时间同位MV推导而言,是使用每一CU/块的同位MV,而不是使用共享时间同位MV。
在另一实施例中,对于所提出的共享列表方法(即在子-树与共同共享边界之内的共享候选列表)而言,当推导参考块位置时会使用当前块的位置/尺寸大小/深度/宽度/高度。然而,如果参考块是在根CU或共享边界之内,则将参考块位置推至或移至根CU或共享边界之外。例如在第3.2图中,块B1是当前块右上方样本的上方块。如果块B1是在根CU或共享边界之内,则将块B1位置向上移至根CU或共享边界之外的第一个最近块。在另一实施例中,当推导参考块位置时会使用当前块的位置/尺寸大小/深度/宽度/高度。然而,如果参考块是在根CU或共享边界之内,则不使用此参考块/MV(或视为不可用)。在一个实施例中,当推导参考块位置时会使用当前块的位置/尺寸大小/深度/宽度/高度。然而,如果参考块是在根CU或共享边界之内,或是包含参考块的CU/PU是在根CU或共享边界之内,或是包含参考块的CU/PU的一部分是在根CU或共享边界之内,则不使用此参考块/MV(或视为不可用)。
在所提出的方法中,根CU或共享边界的尺寸大小/深度/形状/面积/宽度/高度可以事先定义或被发信于序列/画面/切片/方块(tile)/CTU-行(CTU-row)的层级(level)或事先定义区域(即CTU或CTU-行)。根CU或共享边界的共享可以是方形或非方形。根CU或共享边界的尺寸大小/深度/形状/面积/宽度/高度可以事先定义而且取决于输入画面的尺寸大小/深度/宽度/高度。
在一个实施例中,如果当前CU大于或等于此定义的面积/尺寸大小/形状/面积/宽度/高度,而且子分割之一、或所有子分割、或部份的子分割小于所述的面积/尺寸大小/形状/面积/宽度/高度,则将当前CU指定为根CU。在另一实施例中,如果当前CU小于或等于此定义的面积/尺寸大小/形状/面积/宽度/高度,而且母大于此定义的面积/尺寸大小/形状/面积/宽度/高度,则将当前CU指定为根CU。相似地,如果当前CU的深度小于或等于此定义的深度,而且子分割之一、或所有子分割、或部份的子分割的深度大于此定义的深度,则将当前CU指定为根CU。例如,如果此定义的面积是1024而且CU的尺寸大小是64x32(宽度=64与高度=32),而且使用的是垂直TT分割(例如64x32CU被分割成16x32子-CU、32x32子-CU、与16x32子-CU),则将此64x32块指定为根CU。在此64x32中的子-CU则使用所述共享列表。在另一实施例中,此64x32不可以是根CU,而此16x32子-CU、此32x32子-CU、与此16x32子-CU可以是根CU。在另一实施例中,对于定义了的根CU或共享边界的面积/尺寸大小/深度/形状/面积/宽度/高度而言,在TT分割中此根CU或共享边界的面积/尺寸大小/深度/形状/面积/宽度/高度在不同TT分割可以是不同的。例如,对于第一与第三分割而言,可以将根CU或共享边界的面积/尺寸大小/深度/形状/面积/宽度/高度的阀值除以2。对于第二分割而言,根CU或共享边界的面积/尺寸大小/深度/形状/面积/宽度/高度的阀值可以保持相同。
在一实施例中,根CU或共享边界被定义以用于QT分割或QT分割CU。如果叶QT CU等于或大于此定义的面积/尺寸大小/QT-深度/形状/面积/宽度/高度,则将此根CU或共享边界定义为叶QT CU的面积/尺寸大小/QT-深度/形状/面积/宽度/高度。在此QT叶CU之中的所有子-CU(例如通过BT或TT所分割)使用此QT叶CU当成根CU或共享边界。如果QT非-叶CU等于此定义的面积/尺寸大小/QT-深度/形状/面积/宽度/高度,则使用此QT CU当成为根CU或共享边界。在此QT CU之中通过QT、BT、或TT所分割的所有子-CU,都使用此QT CU当作根CU或共享边界。在一个例子中,会使用此根CU或共享边界的面积/尺寸大小/QT-深度/形状/面积/宽度/高度来推导参考块位置。在另一例子中,会使用当前CU的面积/尺寸大小/QT-深度/形状/面积/宽度/高度来推导参考块位置。如果参考块位置是在根CU或共享边界之内,则将参考块位置移至根CU或共享边界之外。在另一例子中,会使用当前CU的面积/尺寸大小/QT-深度/形状/面积/宽度/高度来推导参考块位置。如果参考块位置是在根CU或共享边界之内,则不使用此参考块。
在上面所述的深度,深度可以等于(((A*QT-深度)>>C)+((B*MT-深度)>>D)+E)>>F+G或(((A*QT-深度)>>C)+((B*BT-深度)>>D)+E)>>F+G,其中A、B、C、D、E、F、G是整数。MT-深度是指TT-深度或BT-深度。例如,深度可以等于2*QT-深度+MT-深度或2*QT-深度+BT-深度或QT-深度+MT-深度或QT-深度+BT-深度。
除了共享列表方法,基于共享列表方法吾人也提出了“共享合并索引”与“合并模式的共享参考索引”。在此吾人先定义“用于共享的子CU”一词。“用于共享的子CU”是指为了候选列表共享,在子-树或“共同共享边界”中的任何CU。例如,如果候选列表共享是基于子-树的方法,“用于共享的子CU”则是在子-树之中的所有CU。例如,如果候选列表共享是基于“共同共享边界”的方法,“用于共享的子CU”则是在“共同共享边界”之中的所有CU。
以下介绍基于共享列表方法的“共享合并索引”与“合并模式的共享参考索引”。
对于“共享合并索引”方法,不仅所有用于共享的子CU的合并候选列表是相同的,而且所有用于共享的子CU的最后选择合并索引(final selected Merge index)也是相同的。
对于“合并模式的共享参考索引”方法,不仅所有用于共享的子CU的合并候选列表是相同的,而且所有用于共享的子CU的合并索引,其代表具有该参考索引的选择候选(aselected candidate having the reference index),也是相同的。
共享合并列表MV以用于合并/帧间/仿射-合并/仿射-帧间/ATMVP/子-块候选列表的建构
即使共享列表未被致能(not enabled),在根CU或共享边界所产生的候选列表可以作为子CU合并/帧间/仿射-合并/仿射-帧间/ATMVP/子-块候选列表的建构。根CU或共享边界的候选可以被加入于子CU的候选列表中。根CU或共享边界的形状/尺寸大小/深度/宽度/高度可以被事先定义、被发信(例如于序列/画面/切片/方块(tile)/CTU-行(CTU-row)/CTU-层级(CTU-level))、或被推导出。例如,根CU可以是母N-层级CU而N可以是整数。
在一个实施例中,可以定义出二个阀值,一个比较大而一个比较小。一个较大的根CU或较大的共享边界可以通过此较大的阀值来加以定义/决定。在此较大的根CU或较大的共享边界则产生出候选列表。对于在此较大的根CU或较大的共享边界中的所有子CU而言,此较大的根CU或较大的共享边界的候选则可被加入于子CU的候选列表中。一个较小的根CU或较小的共享边界可以通过此较小的阀值来加以定义/决定。在此较小的根CU或较小的共享边界则产生出候选列表。当此较小的根CU或较小的共享边界的候选列表产生出时,则可以加入此较大的根CU或较大的共享边界的候选。对于在此较小的根CU或较小的共享边界中的子CU而言,则使用产生于此较小的根CU或较小的共享边界的候选列表。
在共享候选列表中的子-CU合并候选处理
揭示了一些方法以达成用于子-CU候选(例如ATMVP或STMVP或合并模式中的仿射合并,与仿射AMVP候选)的共享列表。对于子-CU候选而言,也揭示了数种共享候选列表的实施例。
一种方法是关掉共享候选列表中的子-CU候选。另一方法是在根CU建立子-CU候选(或建立在共享-块-边界)。对于每一“用于共享的子CU”,它会直接从子-CU候选中来取得(相对应区域的)子-CU运动信息。以相对应于16x8与ATMVP的共享边界为例。如传统ATMVP方法,ATMVP可以产生在相对应于16x8的共享边界。当分享此候选列表给共同边界(例如16x8)之内的二个子CU时,要使得产生给16x8块的ATMVP候选适合于8x8块,它可以直接取得16x8与ATMVP中左方8x8的运动信息,来形成新的8x8ATMVP以用于左方8x8子-CU。它可以直接取得16x8与ATMVP中右方8x8的运动信息,来形成新的8x8ATMVP以用于右方8x8子-CU。
在另一实施例中,ATMVP的初始MV(其用于推导ATMVP同位MV参考块)是通过使用根CU或共享边界的尺寸大小/深度/形状/面积/宽度/高度来推导的。根CU或共享边界的ATMVP的初始MV可以为子CU所共享。共享的初始MV可被用来推导子CU的同位MV参考块,而然后推导子CU的块MV或子-块MV。
所提出“共享候选列表”、“共享合并索引”与其他共享-特性的方法也可以应用于其他种类的合并列表建构的方法,例如“基于历史的合并模式建构”与“非-相邻合并候选”。换言之,共享-特性的方法通常可以适用于所有合并模式算法与AMVP模式算法。
此外,吾人进一步提出发信旗标来对于所提的共享方法进行开启或关闭的切换。在一个实施例中,可以发信旗标来指示是否致能(enable)“共享候选列表”。用来发信的单元的最小尺寸也可以分别地编码于序列层级、画面层级、切片层级、或PU层级。
在一个实施例中,当推导用于ATMVP的初始向量时,如果参考相邻MV是在根CU或共享边界之内时,则不使用这样的MV。
小CU的缩减型候选列表
所提出的方法会依据CU尺寸大小来移除某些候选。如果CU尺寸小于预订阀值(例如面积=16),就会从候选列表的建构中移除某些候选。有些实施例则通过移除某些候选来加以说明于图7中。
a)移除A1、B1、TCTR
b)移除A0、B0
c)移除ATMVP
d)移除TCTR、TBR或取消TCTR、TBR的MV缩放
所提出方法不限于已列出的实施例,根据本发明其他的候选组合也可以被移除。
在小CU下的简化型修剪(Simplified Pruning)
传统上,合并/AMVP模式的修剪有二种类型,第一类型是全面修剪,第二类型是配对(pair-wise)修剪。
在本实施例中对于小CU是使用配对修剪(例如CU尺寸小于阀值),而对于其他CU则使用全面修剪。对于配对修剪而言,每一候选被用来与其之前的候选来比较,而不是和所有候选来比较。
在另一实施例中,在候选列表中的某些候选使用配对修剪,而在候选列表中的某些其他候选则使用全面修剪。此方法可以有CU尺寸约束。例如,如果CU尺寸小于或大于阀值,则此模式会被致能(enabled)。否则,对所有候选都使用全面修剪或配对修剪。在另一实施例中,此方法可以适用于所有CU尺寸。
在另一实施例中,在候选列表中的某些候选使用配对修剪,在候选列表中的某些候选使用全面修剪,而在候选列表中的某些其他候选则使用部份修剪。对于部份修剪而言,目标候选不是和所有候选来比较,该目标候选仅和之前的候选来比较。此方法可以有CU尺寸约束。例如,如果CU尺寸小于(或大于)阀值,则此模式会被致能(enabled)。否则,对所有候选都使用全面修剪或配对修剪。在另一实施例中,此方法可以适用于所有CU尺寸。
在一个实施例中,修剪是取决于参考CU/PU是否属于相同的CU/PU。如果两个参考块属于相同的CU/PU,则后面的那个会定义为冗余。在一个实施例中,预定的位置会使用作为修剪程序。例如,CU/PU的左上方样本位置是用来修剪。对于二个参考块而言,如果左上方样本位置是相同的,则它们是在相同的CU/PU,后面的那个候选则为冗余。
在小CU下关掉子-CU的合并模式
在此实施例中,其在小CU(即CU小于阀值)下关掉子-CU的合并模式(例如ATMVP或STMVP或仿射合并)。
在子-块合并列表中,可以插入超过一个ATMVP候选。例如,可以插入二个ATMVP候选。在一实施例中,二个ATMVP候选是插入在子-块合并列表之前。在另一实施例中,一个ATMVP候选是插入在子-块合并列表之前,而另一个是插入在一或多种其他子-块候选(例如仿射候选)类型之后。在一例子中,ATMVP是插入在子-块合并列表的第三、第四、或第五个位置。在另一实施例中,一个ATMVP候选是插入在子-块合并列表中的某些仿射候选之后,例如在某些仿射继承候选之后或仿射结构候选之前。在另一实施例中,二个ATMVP候选都插入在一或多种其他子-块候选(例如仿射候选)类型之后。
用于QTMTT结构的MER
在一个实施例中,在HEVC中的合并估计区域(Merge estimation region,MER)概念可以延伸至QTBT或QTBTT结构。所述MER可以是非方形。取决于结构分割,MER可以是不同的形状或尺寸大小。其尺寸大小/面积/宽度/高度可以被事先定义或被发信于序列/画面/切片-层级。对于MER的宽度/高度,可以发信宽度/高度的对数log2的值。对于MER的面积/尺寸大小,可以发信尺寸大小/面积的对数log2的值。当对于区域定义出MER时,在此MER的CU/PU无法被使用作为合并模式候选推导的参考CU/PU。例如,在此MER的CU/PU的MV或仿射参数,无法被相同MER中用为合并候选或仿射合并候选推导的CU/PU所参考。对于相同MER中的CU/PU而言,这些MV与/或仿射参数则被当成不可用(unavailable)。对于子-块模式(例如ATMVP模式)推导而言,可以使用当前CU的尺寸大小/深度/形状/面积/宽度/高度。如果参考CU是在相同的MER,则不能使用参考CU的MV信息。
由于MER中块的编解码处理不会互相干扰,因此MER概念所预期的应用之一是平行处理。在本揭示中,比起MER,“平行处理区域”(parallel processing region)一词是使用更普遍的词。
当MER的面积/尺寸大小/深度/形状/面积/宽度/高度被定义了(例如被事先定义或被发信),如果当前CU大于或等于此定义的面积/尺寸大小/形状/面积/宽度/高度,而且子分割之一、所有子分割、或部分的子分割小于所述的面积/尺寸大小/形状/面积/宽度/高度,则将当前CU指定为MER。在另一实施例中,如果当前CU的深度小于或等于此定义的深度,而且子分割之一、或所有子分割、或部份的子分割的深度大于此定义的深度,则将当前CU指定为MER。在另一实施例中,如果当前CU小于或等于此定义的面积/尺寸大小/形状/面积/宽度/高度,而且母CU大于此定义的面积/尺寸大小/形状/面积/宽度/高度,则将当前CU指定为MER。在另一实施例中,如果当前CU的深度大于或等于此定义的深度,而且母CU小于此定义的深度,则将当前CU指定为MER。例如,如果此定义的面积是1024而且CU的尺寸大小是64x32(即宽度=64与高度=32),而且使用的是垂直TT分割(即64x32CU被分割成16x32子-CU、32x32子-CU、与16x32子-CU),则根据本发明的实施例此64x32即为MER。在此64x32MER中的子-CU则使用所述共享列表。在另一实施例中,此64x32区域并非MER,而是将此16x32子-CU、此32x32子-CU、与此16x32子-CU指定为MER。在另一实施例中,对于定义了的MER面积/尺寸大小/深度/形状/面积/宽度/高度而言,在TT分割中此MER面积/尺寸大小/深度/形状/面积/宽度/高度在不同TT分割可以是不同的。例如,对于第一与第三分割而言,可以将MER面积/尺寸大小/深度/形状/面积/宽度/高度的阀值除以2,或是可以将深度增加1。对于第二分割而言,MER面积/尺寸大小/深度/形状/面积/宽度/高度的阀值可以保持相同。
在一个实施例中,MER被定义以用于QT分割或QT分割CU。如果QTCU等于或大于此定义的面积/尺寸大小/QT-深度/形状/面积/宽度/高度,则将此MER定义为叶QT CU面积/尺寸大小/QT-深度/形状/面积/宽度/高度。在此QT叶CU之中的所有子-CU(例如通过BT或TT所分割)使用此QT叶CU当成MER。此MER包括在此叶QT CU之中的所有子-CU。如果QT非-叶CU等于此定义的面积/尺寸大小/QT-深度/形状/面积/宽度/高度,则使用此QT CU当成为MER。在此QT CU之中的所有子-CU(例如通过QT、BT、或TT所分割)都包括于此MER之中。在一个实施例中,会使用此MER的面积/尺寸大小/QT-深度/形状/面积/宽度/高度来推导参考块位置。在另一实施例中,会使用当前CU的面积/尺寸大小/QT-深度/形状/面积/宽度/高度来推导参考块位置。如果参考块位置是在MER之内,则将参考块位置移至MER之外。在另一例子中,会使用当前CU的面积/尺寸大小/QT-深度/形状/面积/宽度/高度来推导参考块位置。如果参考块位置是在MER之内,则不使用此参考块作为合并候选或仿射合并候选推导。
在上面所述的深度,深度可以等于(((A*QT-深度)>>C)+((B*MT-深度)>>D)+E)>>F+G或(((A*QT-深度)>>C)+((B*BT-深度)>>D)+E)>>F+G,其中A、B、C、D、E、F、G是整数。例如,深度可以等于2*QT-深度+MT-深度或2*QT-深度+BT-深度或QT-深度+MT-深度或QT-深度+BT-深度。
在另一实施例中,MER区域无法跨越画面边界。换言之,MER区域必须完全在画面之内,MER区域中没有像素是存在于画面边界之外。
除了合并或仿射合并之外,也可以应用MER概念于AMVP模式。也可以应用基于QTMTT的MER于所有候选-推导工具,例如AMVP、合并、仿射合并等。
MER与共享列表两者都存在用于QTMTT结构
在此方法中,MER与共享列表两者都可以被致能于QTMTT结构中。在一个实施例中,对于一般合并与ATMVP模式,其使用共享列表。但是对于仿射合并模式而言,其使用基于QTMTT的MER。在另一实施例中,对于有些预测模式,其使用共享列表;但是对于其他合并模式或AMVP模式而言,其使用的是MER。
MER的变形与/或共享列表模式
吾人提议以基于历史MVP模式结构来应用合并估计区域(MER)与/或共享列表模式。基于历史合并模式会将一些先前CU的运动向量储存于历史数组(history array)中。在这种状况下,基于历史MER的概念被延伸至基于历史平行处理区域。对于合并候选而言,除了原始的合并模式候选之外,当前CU可以使用历史数组中的一或多个候选来丰富合并模式的候选。
基于历史MVP模式的建构是一种基于历史合并模式的一般性方法,而被应用于合并、AMVP、或其他帧间预测模式。如果其被应用于合并模式,其算法与基于历史合并模式是相同的。仿射候选(例如控制点)也可以被纳入于历史列表之中,而历史列表的每一字段可以储存传统MV或仿射控制点MV组(包括相对应于仿射控制点的k-控制点、块开始偏移量、块宽度/高度)。以下则提供关于历史列表中仿射候选的一些实施例。在一个实施例中,只有最后-编码的仿射CU的仿射控制点会被插入于历史列表中。在另一实施例中,最后-编码的仿射CU的仿射控制点、块开始偏移量(块_x,块_y)、块宽度、块高度会被插入于历史列表中。在又另一实施例中,仿射控制点的四个角落会被插入于历史缓冲器中。在又另一实施例中,少于四个角落(例如二个控制点或三个控制点)会被插入于历史列表中,其中或者会发信模式来指示是使用二或三个角落,或者所有控制点皆储存于三个-角落的版本。
在共享列表模式中,吾人于事先定义的节点或区域来产生候选列表(例如母CU、于QTBT或QTBTTT树的子-树的根、QT树的节点、或包含当前CU的其他事先定义的长方形区域),而且所产生的候选列表可以被边界之内或子-树之内的所有叶-CU们所共享。在MER中,会事先定义区域,而此MER中的CU们无法被使用作为合并模式候选推导的参考CU。因此,为了保存共享列表模式与MER的概念并且还同时要应用基于历史合并/MVP模式,因而提出几种更新约束与复杂度降低的方法。此外,以下方法中的MER是一般化(generalized)的MER或合并模式MER。合并模式MER是传统的MER,其仅用在合并模式中。在有着相同的概念下,一般化的MER可以应用于AMVP、合并、或其他帧间模式。上述之相同概念是指如果相邻CU与当前CU是在同一MER区域时,则不使用相邻CU MV作为候选。此外,在本揭示之后部分所描述的历史方法也指:(1)依据本发明的一般化历史方法,或(2)原始的传统基于历史合并模式。
变形1–基于历史合并模式的约束更新
在一个实施例中,当共享列表模式或MER被致能时,只有在编码与/或解码MER区域或共享区域中的最后一个叶-CU之后才可以将基于历史候选进行更新。在对于MER区域或共享区域中的叶-CU进行编码与/或解码之时,更新是不能进行的,这是因为更新会破坏MER或共享列表的平行处理好处。
有几个方式可以更新基于历史候选列表。在一个实施例中,可以用下列的MV来更新基于历史候选:最先-编码的N个CU、最后-编码的N个CU、或MER区域或共享区域中的任何N个CU。N可以取决于共享边界CU的CU形状、CU宽度、或CU高度。N也可以选择性地是在序列/画面/切片层级中被发信的事先定义的数值。例如,可以用64x64MER区域或共享区域中最后或最先N个经过编码的CU(例如最后或最先3个经过编码的CU)的MV来更新历史列表。
在另一实施例中使用了二个历史列表缓冲器。一个是用来代表MER区域或共享区域的第一历史列表,而且会用它于MER区域或共享区域的每一个叶-CU。另一个是用来代表第二历史列表,其中在处理MER区域或共享区域的每一个叶-CU之后会对第二历史列表加以更新。在一个实施例中,第二历史列表可以用于帧间/AMVP模式候选的产生。在编码与/或解码MER区域或共享区域中的最后一个叶-CU之后,可以用第二历史列表来对第一历史列表加以更新。
变形2–再利用合并列表以作为历史列表
基于历史合并模式会在历史数组中储存一些先前CU的MV。除了原始的合并模式候选之外,对于当前CU其可以使用历史数组中的一或多个候选来丰富合并模式的候选。
在一个实施例中,提议将预先-建构的或之前建构的合并候选列表直接使用为历史列表,也称为再利用历史列表。例如,当停在某一母节点之时,可以将合并列表预先-建构并储存于此列表中。对于接下来的子节点,在历史列表中预先-建构的合并候选可以被使用作为原始的基于历史合并列表。在另一例子,在二叉树分割中,用于左分割的之前建构的合并列表可以被使用作为用于右分割的历史列表。
在另一实施例中,所提出的方法也可以使用基于历史的机制而应用于AMVP列表。
在又一实施例中,所提出的再利用历史列表方法也可以与原始历史列表一起使用。换言之,再利用历史列表中经过或未经修剪的的任何N字段,可以被用来取代原始历史列表中在任何位置的现存的字段。
在又一实施例中,用于基于历史合并模式的MER区域或共享区域中的更新约束,可以应用于所提出的再利用历史列表。
变形3–在共享列表模式或MER为致能的情形下关掉基于历史合并模式
在此实施例中,在共享列表模式或MER为致能(enabled)的情形下其关掉基于历史合并模式。如果共享列表模式或MER为致能的状态,基于历史合并模式将会被推论是失能的(disabled)。
此外,也进一步提出发信旗标来对于MER或共享列表模式加以开启或关闭。在一个实施例中,可以发信旗标(例如:平行化_区域,"parallelized_region")来指示MER或共享列表模式是否被致能(例如数值1:致能,数值0:失能)。用来发信旗标(spatial_based_pruning_en)的单元的最小尺寸也可以分别地编码于序列层级、画面层级、切片层级、或方块(tile)层级。
变形4–对于MER内不同CU有不同历史候选的更新数目
如前所述,当编解码叶CU在MER区域之内时,所要使用的历史列表不可以改变。在此方法中,虽然当编解码叶CU在MER区域之内时历史缓冲器不可被更新,然而对于不同CU而言,要插入叶CU合并列表的来自历史列表的候选数目是可以不同的。例如,如果MER区域有4个叶CU,而历史列表有5个候选。当编解码第一CU时,其可应用历史列表中的4个候选而将其插入第一CU的合并列表中。当编解码第二CU时,其可应用历史列表中的3个候选而将其插入第二CU的合并列表中,依此类推。换言之,取决于MER区域之内的CU编解码顺序,而来决定插入当前CU的合并列表中历史字段的数目。有一些子-实施例。在子-实施例中,对于MER区域中较早编码的CU,其插入较多历史字段于合并列表中;而对于较晚编码的CU,其插入较少历史字段于合并列表中。在另一实施例中,对于MER区域中较早编码的CU,其插入较少历史字段于合并列表中;而对于较晚编码的CU,其插入较多历史字段于合并列表中。
变形5–使历史缓冲器修剪失能
在此实施例中,当当前MER区域或共享区域完成编解码,而如果在MER区域或共享区域之内的最后-编码的N个MV需要被更新于历史缓冲器以用于下一个CU的时候,可以使得最后-编码的N个MV的历史列表MV修剪失能,以便可以致能平行处理。
变形6–具有平均配对的历史
在历史FIFO中的MV可以被用来与另一个候选加以平均,而上述的候选是已经在列表中或将于候选产生过程中被检查、或是另一MV。例如,时间同位MV可以被用来与基于历史候选加以平均。如果参考索引是相同的,会使用基于历史候选MV与另一MV(例如时间MV)的加权平均来产生新的候选。在一个实施例中,如果参考索引是不同的,则应用缩放。此另一的MV会被缩放至基于历史候选的参考画面。在另一实施例中,基于历史候选会被缩放至此另一的MV候选。在另一实施例中,二者MV都会被缩放至预先定义的、推导出的、或被发信的参考索引/画面。在另一实施例中,会使用直接的加权平均。基于历史候选或其他候选的参考索引/画面会被使用。在另一实施例中,其仅挑选基于历史的或仅挑选其他的候选。在另一实施例中,如果参考索引是不同的,则不加入候选。
变形7–方形MER与共享列表,与CU分割约束
于此提议总是使用方形区域以用于MER与/或共享列表根CU或共享边界。
于此提议当应用方形MER或方形共享列表根CU或共享边界时,也应用CU分割约束。在一个例子中,当对CU进行分割时,子-CU应该要涵盖一或多个完整的MER或共享列表区域。在另一例子中,子-CU应该在MER区域或共享列表区域之内。
在另一实施例中,CU边界不能跨越MER边界或共享列表区域边界。CU可以涵盖一或多个完整的MER或共享列表区域。
在另一实施例中,如果CU不是完整地涵盖/包含/包括那些MER区域或共享列表区域,则此CU不能涵盖/包含/包括位于二个不同MER区域或共享列表区域的像素。
变形8–MER,使用根历史列表与根区域之内持续更新
当MER被致能时,根CU则被定义出。当CU是根CU时,历史运动候选列表会被储存起来,与/或会被用来产生候选列表(例如一般合并模式、子-块合并模式、仿射合并模式、与/或三角合并模式;或是一般帧间/AMVP模式与/或仿射帧间/AMVP模式)。对于根CU之内的当前CU而言,根历史列表会被使用。在一个实施例中,第二历史列表会被使用。初始的第二历史列表会拷贝自第一/原始的历史列表。当当前CU是在根CU之内,运动信息则会更新于第二历史列表中。第二历史列表的数据无法被使用来产生候选列表。在对根CU中所有CU进行编解码后,第一/原始的历史会被第二历史列表所取代,或第一/原始的历史会拷贝自第二历史列表。在另一实施例中,当CU是根CU,原始历史列表的数据会储存在缓冲器中。当当前CU是在根CU之内,会使用所储存的历史列表数据来产生候选列表。当此当前CU是在根CU之内,原始的历史列表会持续更新数据。然而,无法使用更新的数据来产生候选列表;只能使用所储存的数据。在对根CU中所有CU进行编解码后,原始的历史则可以再被使用。对于在根CU之内的空间相邻CU而言,信息(包括运动信息、仿射控制点MV/参数、与/或例如预测模式和种类的边信息)是无法被存取或是被视为不可用的。
在一个实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,当前叶CU则不定义为位于根CU之内。在另一实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,则当前叶CU也还是定义位于根CU之内。
变形9–MER,使用根历史列表与仅更新根区域内的最后CU数据
当MER被致能时,根CU则被定义出。当CU是根CU时,基于历史运动候选列表会被储存起来,与/或会被用来产生候选列表(例如一般合并模式、子-块合并模式、仿射合并模式、与/或三角合并模式;或是一般帧间/AMVP模式与/或仿射帧间/AMVP模式)。对于根CU之内的当前CU而言,根历史列表会被使用。除了根CU的最后CU之外,在根CU之内的历史列表是不会被更新的。在编解码根CU的最后CU之后,最后CU的数据则可以被更新于历史列表中。被更新的历史列表可以被根CU之外的CU所参考。对于在根CU之内的空间相邻CU而言,信息(包括运动信息与/或例如预测模式和种类的边信息)是无法被存取或是被视为不可用的。
在一个实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,当前叶CU则不定义为位于根CU之内。在另一实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,则当前叶CU也还是定义位于根CU之内。
变形10–MER,使用根历史列表与根区域之内不更新
当MER被致能时,根CU则被定义出。当CU是根CU时,基于历史运动候选列表会被储存起来,与/或会被用来产生候选列表(例如一般合并模式、子-块合并模式、仿射合并模式、与/或三角合并模式;或是一般帧间/AMVP模式与/或仿射帧间/AMVP模式),使得根CU之内的一或多个CU可以在如下的程序中使用基于历史运动候选列表。对于根CU之内的当前CU而言,事先产生的(或称产生于先前相对应于根CU的程序)历史列表(或称基于历史运动候选列表)会被使用。在一个实施例中,当编解码CU是在根CU之内,历史更新会失能(disabled,或称基于历史候选列表的更新会被限制)。只有在当编解码CU不在根CU之内或CU尺寸大小大于MER阀值之时,才会进行历史更新。对于在根CU之内的空间相邻CU而言,信息(包括运动信息、仿射控制点MV/参数、与/或例如预测模式和种类的边信息)是无法被存取或是被视为不可用的。
在一实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,当前叶CU则不定义为位于根CU之内。在另一实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,则当前叶CU也还是定义位于根CU之内。
变形11–MER,不使用MER的历史候选与在MER中不更新
当MER被致能时,根CU则被定义出。当CU是根CU时,基于历史运动候选列表无法被用来产生候选列表(例如一般合并模式、子-块合并模式、仿射合并模式、与/或三角合并模式;或是一般帧间/AMVP模式与/或仿射帧间/AMVP模式)。在一个实施例中,当编解码CU是在根CU之内,历史更新会失能(disabled)。只有在当编解码CU不在根CU之内或CU尺寸大小大于MER阀值之时,才会进行历史更新。对于在根CU之内的空间相邻CU而言,信息(包括运动信息、仿射控制点MV/参数、与/或例如预测模式和种类的边信息)是无法被存取或是被视为不可用的。
在一个实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,当前叶CU则不定义为位于根CU之内。在另一实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,则当前叶CU也还是定义位于根CU之内。
变形12–MER,不使用MER的历史候选与在MER中持续更新
当MER被致能时,根CU则被定义出。当CU是根CU时,基于历史运动候选列表无法被用来产生候选列表(例如一般合并模式、子-块合并模式、仿射合并模式、与/或三角合并模式;或是一般帧间/AMVP模式与/或仿射帧间/AMVP模式)。在一个实施例中,当编解码CU在根CU之内的时候,历史列表仍持续更新。然而,当编解码CU在根CU之内的时候,无法使用更新的数据。可以使用更新的数据来产生根CU之外CU的候选列表。对于在根CU之内的空间相邻CU而言,信息(包括运动信息、仿射控制点MV/参数、与/或例如预测模式和种类的边信息)是无法被存取或是被视为不可用的。
在一个实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,当前叶CU则不定义为位于根CU之内。在另一实施例中,如果当前叶CU的尺寸大小与位置和根CU是相同的,则当前叶CU也还是定义位于根CU之内。
在一个实施例中,如果相邻参考PU/CU/块和当前PU/CU/块是处于相同的MER之内,则无法使用相邻参考运动信息与边信息。例如,当推导ATMVP模式的初始向量(initialvector)时,会使用相邻块的MV。当推导仿射继承候选时,会使用相邻CU/PU/块的控制点MV或子-块MV。当推导仿射结构候选时,会使用相邻CU/PU/块的MV或子-块MV。如果相邻参考PU/CU/块和当前PU/CU/块是处于相同的MER之内,则这些信息都无法使用。
变形13–历史-索引-依据仿射表
在此方法中,历史-索引-依据表被建立而表中每一字段储存一组仿射参数。使用解码后的仿射-编码CU的仿射参数来写入历史-索引-依据表,并且使用这些仿射参数来推导历史-索引-依据的仿射候选。可以将这些历史-索引-依据的仿射候选加入到仿射候选列表中。可以利用基础位置与基础MV来推导每一块的MV以用在历史-索引-依据的仿射候选,或是来推导CPMV以用在AMVP历史-索引-依据的仿射候选。
在一个实施例中,使用在历史-索引-依据表中的仿射参数来推导历史-索引-依据的继承仿射候选。
在另一实施例中,使用在历史-索引-依据表中的仿射参数来推导历史-索引-依据的结构仿射候选。
在另一实施例中,使用在历史-索引-依据表中的仿射参数来推导历史-索引-依据的ATMVP候选。
在另一实施例中,使用在历史-索引-依据表中的仿射参数来推导历史-索引-依据的AMVP候选。
在另一实施例中,在合并候选列表的开始,将历史-索引-依据的仿射候选加入。
在另一实施例中,在继承仿射合并候选之后,再加入历史-索引-依据的仿射候选。
在另一实施例中,在ATMVP候选之后,再加入历史-索引-依据的仿射候选。
在另一实施例中,在结构仿射合并候选之后,再加入历史-索引-依据的仿射候选。
在另一实施例中,在仿射AMVP候选的开始,将历史-索引-依据的仿射候选加入。
在另一实施例中,历史-索引-依据的仿射候选是在仿射AMVP候选之后。
在另一实施例中,历史-索引-依据的仿射候选是在预定AMVP候选之前。
在另一实施例中,历史-索引-依据的仿射候选是在继承仿射合并候选列表的建构中插入的。
在另一实施例中,历史-索引-依据的仿射候选是在ATMVP候选列表的建构中插入的。
在另一实施例中,历史-索引-依据的仿射候选是在结构仿射合并候选列表的建构中插入的。
在另一实施例中,历史-索引-依据的仿射候选是在AMVP候选列表的建构中插入的。
在另一实施例中,在表中的仿射参数是从相邻块拷贝而得。
在另一实施例中,在表中的仿射参数是经由转换从相邻块推导而得。
在另一实施例中,在表中的仿射参数是基于历史-索引从相邻块推导而得。
在另一实施例中,基础位置(base position)是在相邻块的中央位置。
在另一实施例中,基础位置是在相邻块的角落位置。
在另一实施例中,基础位置是在相邻块之内的内插点。
在另一实施例中,基础位置是在相邻块之内的边界。
在另一实施例中,基础位置是在相邻块之内的外插点。
在另一实施例中,基础MV是从相邻块拷贝而得。
在另一实施例中,基础MV是从相邻块转换而得。
在另一实施例中,基础MV是从相邻块取平均而得。
在另一实施例中,基础MV是从相邻块缩放而得。
在一个实施例中,储存在历史-索引-依据表中的一组仿射参数可以被压缩。此压缩方法包括尾数加上指数表示法(mantissa plus exponent representation)、截断最低有效位或最高有效位法(truncating least significant bits or most significantbits)、舍入法(rounding)与/或向右位移法(right-shift)。
在一个实施例中,将仿射参数压缩而储存在历史-索引-依据表中。在将这些数值从历史-索引-依据表中读出之后,可将仿射参数解压缩。在上述实施例中,仿射参数被压缩与解压缩而后存入在历史缓冲器中。
以上提出的方法(例如具有MER或共享列表合并模式的历史依据合并候选)可以应用于仅有-合并模式(例如一般的合并模式、子块合并模式、仿射合并模式、与/或三角合并模式),也可以应用于合并模式与帧间模式两者(AMVP模式,例如一般帧间/AMVP模式与/或仿射帧间/AMVP模式)。
可以在编码器与/或解码器中实施上述提出的方法。例如可以在编码器的帧间预测模块、与/或解码器的帧间预测模块中实施所提出的方法。任何所提出的方法也可以选择性地实施为电路来耦合至编码器的帧间预测模块、与/或解码器的帧间预测模块中,以便提供帧间预测模块所需的信息。
图14根据本发明的一个实施例示出了一种使用基于历史候选推导的视频编解码中示例性帧间预测的流程图。本流程图中所示的步骤,以及本揭示中其他接下来的流程图,可以实作成程序代码而可在编码器侧与/或解码器侧中的一或多个处理器(例如一或多个中央处理器)中执行。本流程图中所示的步骤也可以基于硬件来实作,硬件可以例如安排来进行本流程图中各步骤的一或多个电子装置或处理器。根据本方法在步骤1410中,在视频编码器侧接收关于当前画面的当前块的输入数据,或在视频解码器侧接收相对应于经过压缩后数据的视频比特流,而该压缩后数据包括该当前画面中的该当前块,其中该当前块是在共享合并候选列表区域(SMR)之中或是在基于历史平行处理区域之中。在步骤1420中,使用合并候选列表来对该当前块进行编码或解码。在步骤1430中,只有在该当前块是首先被编码N块中之一、或是最后被编码N块中之一、或是在该SMR或是在该基于历史平行处理区域之中所选择N块中之一的时候,才在该当前块被编码或被解码之后对该基于历史候选列表加以更新,其中N是大于或等于0的整数。
图15根据本发明的一实施例示出了一种使用基于历史候选推导的视频编解码中示例性帧间预测的另一流程图。根据本方法在步骤1510中,根CU(编解码单元)被决定以用于共享合并候选列表区域(SMR)或是在基于历史平行处理区域。在步骤1520中,在视频编码器侧接收关于当前画面的当前块的输入数据,或在视频解码器侧接收相对应于经过压缩后数据的视频比特流,而该压缩后数据包括该当前画面中的该当前块。在步骤1530中,如果该当前块是在该SMR之中或是在该基于历史平行处理区域之中的时候,使用相关于该根CU的基于历史候选列表来对该当前块进行编码或解码。
所示的流程图用于示出根据本发明的视频编解码的示例。在不脱离本发明的精神的情况下,所属领域中具有普通技术人员可以修改每个步骤、重组这些步骤、将一个步骤进行分离或者组合这些步骤而实施本发明。在本揭示中,具体的语法和语义已被使用以示出实现本发明实施例的示例。在不脱离本发明的精神的情况下,透过用等同的语法和语义来替换该语法和语义,具有普通技术人员可以实施本发明。
运动缓冲压缩
使用6-位尾数与4-位指数来储存运动向量以便进一步降低储存的要求规定。尾数加上指数表示法有效地较粗略地量化较大的运动向量数值,然而对于较小的运动向量保持较高的精确度,而且在此,当时间运动向量位移(displacement)不可用(not available)来作为运动预测的时候,尾数与指数分别设为-32与15。例如,当使用帧内模式时,所有四个运动向量位移方向的数值都指定其尾数为-32与指数为15。类似地,当二运动向量仅有一个是有效的(valid,例如inter_pred_idc[][]是PRED_L0或PRED_L1),则对于没有有效的运动信息的运动向量,在二个位移方向上其尾数与指数会被设为-32与15。此指示可用性(availability)的作法也被应用在相对应于当前画面参考的时间运动信息中。值得注意的是此一部分也可以非-规范性地(non-normatively)来达成。
上述说明,使得所属领域中具有普通技术人员能够在特定应用程序的内容及其需求中实施本发明。对所属领域中具有普通技术人员来说,所描述的实施例的各种变形将是显而易见的,并且本文定义的一般原则可以应用于其他实施例中。因此,本发明不限于所示和描述的特定实施例,而是将被赋予与本文所公开的原理和新颖特征相一致的最大范围。在上述详细说明中,说明了各种具体细节,以便透彻理解本发明。尽管如此,将被本领域的具有普通技术人员理解的是,本发明能够被实践。
如上所述的本发明的实施例可以在各种硬件、软件代码或两者的结合中实现。例如,本发明的实施例可以是集成在视频压缩芯片内的电路,或者是集成到视频压缩软件中的程序代码,以执行本文所述的处理。本发明的一个实施例也可以是在数字信号处理器(Digital Signal Processor,DSP)上执行的程序代码,以执行本文所描述的处理。本发明还可以包括由计算机处理器、数字信号处理器、微处理器或现场可程序设计门阵列(fieldprogrammable gate array,FPGA)所执行的若干函数。根据本发明,透过执行定义了本发明所实施的特定方法的机器可读软件代码或者固件代码,这些处理器可以被配置为执行特定任务。软件代码或固件代码可以由不同的程序设计语言和不同的格式或样式开发。软件代码也可以编译为不同的目标平台。然而,执行本发明的任务的不同的代码格式、软件代码的样式和语言以及其他形式的配置代码,不会背离本发明的精神和范围。
本发明可以以不脱离其精神或本质特征的其他具体形式来实施。所描述的例子在所有方面仅是说明性的,而非限制性的。因此,本发明的范围由附加的权利要求来表示,而不是前述的描述来表示。权利要求的含义以及相同范围内的所有变化都应纳入其范围内。
Claims (13)
1.一种使用基于历史候选推导的视频编解码方法,其中基于历史候选列表在编码或解码时被更新,该方法包括:
在视频编码器侧接收关于当前画面的当前块的输入数据,或在视频解码器侧接收相对应于经过压缩后数据的视频比特流,而该压缩后数据包括该当前画面中的该当前块,其中该当前块是在共享合并候选列表区域之中或是在基于历史平行处理区域之中;
使用合并候选列表来对该当前块进行编码或解码;以及
只有在该当前块是首先被编码N块中之一、或是最后被编码N块中之一、或是在该共享合并候选列表区域或是在该基于历史平行处理区域之中所选择N块中之一的时候,才在该当前块被编码或被解码之后对该基于历史候选列表加以更新。
2.根据权利要求1所述的使用基于历史候选推导的视频编解码方法,其特征在于,N是大于或等于0的整数。
3.根据权利要求2所述的使用基于历史候选推导的视频编解码方法,其特征在于,在该当前块被编码或被解码之后,该基于历史候选列表总是被限制更新。
4.根据权利要求2所述的使用基于历史候选推导的视频编解码方法,其特征在于,在该当前块被编码或被解码之后该基于历史候选列表总是被限制更新,除非该当前块是该共享合并候选列表区域或是在该基于历史平行处理区域之中的最后一块。
5.根据权利要求1所述的使用基于历史候选推导的视频编解码方法,其特征在于,N是基于下列来决定:包含该当前块的共享边界编解码单元中块的形状、块的宽度、或是块的高度。
6.根据权利要求1所述的使用基于历史候选推导的视频编解码方法,其特征在于,N是事先定义的数值。
7.根据权利要求6所述的使用基于历史候选推导的视频编解码方法,其特征在于,该事先定义的数值会在该视频编码器侧的序列、画面、或切片层级中被发信,或该事先定义的数值会在该视频解码器侧的该序列、画面、或切片层级中被剖析。
8.根据权利要求1所述的使用基于历史候选推导的视频编解码方法,其特征在于,对于该共享合并候选列表区域的该当前块,该合并候选列表是事先产生的,而对于该基于历史平行处理区域的该当前块,该合并候选列表是分别产生的。
9.一种使用基于历史候选推导的视频编解码装置,其中基于历史候选列表在编码或解码时被更新,该装置包括有一或多个电子电路或处理器以安排用来:
在视频编码器侧接收关于当前画面的当前块的输入数据,或在视频解码器侧接收相对应于经过压缩后数据的视频比特流,而该压缩后数据包括该当前画面中的该当前块,其中该当前块是在共享合并候选列表区域之中或是在基于历史平行处理区域之中;
使用合并候选列表来对该当前块进行编码或解码;以及
只有在该当前块是首先被编码N块中之一、或是最后被编码N块中之一、或是在该共享合并候选列表区域或是在该基于历史平行处理区域之中所选择N块中之一的时候,才在该当前块被编码或被解码之后对于该基于历史候选列表加以更新,其中N是整数。
10.一种使用基于历史候选推导的视频编解码方法,其中基于历史候选列表在编码或解码时被更新,该方法包括:
决定根编解码单元以用于共享合并候选列表区域或基于历史平行处理区域;
在视频编码器侧接收关于当前画面的当前块的输入数据,或在视频解码器侧接收相对应于经过压缩后数据的视频比特流,而该压缩后数据包括该当前画面中的该当前块;以及
如果该当前块是在该共享合并候选列表区域之中或是在该基于历史平行处理区域之中的时候,使用相关于该根编解码单元的该基于历史候选列表来对该当前块进行编码或解码。
11.根据权利要求10所述的使用基于历史候选推导的视频编解码方法,其特征在于,如果该当前块是在该共享合并候选列表区域之中或是在该基于历史平行处理区域之中的时候,在该当前块被编码或被解码之后该基于历史候选列表被限制更新。
12.根据权利要求10所述的使用基于历史候选推导的视频编解码方法,其特征在于,如果该当前块不是在该共享合并候选列表区域之中或不是在该基于历史平行处理区域之中,在该当前块被编码或被解码之后该基于历史候选列表被更新。
13.一种使用基于历史候选推导的视频编解码装置,其中基于历史候选列表在编码或解码时被更新,该装置包括有一或多个电子电路或处理器以安排用来:
决定根编解码单元以用于共享合并候选列表区域或是在基于历史平行处理区域;
在视频编码器侧接收关于当前画面的当前块的输入数据,或在视频解码器侧接收相对应于经过压缩后数据的视频比特流,而该压缩后数据包括该当前画面中的该当前块;以及
如果该当前块是在该共享合并候选列表区域之中或是在该基于历史平行处理区域之中的时候,使用相关于该根编解码单元的该基于历史候选列表来对该当前块进行编码或解码。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862742280P | 2018-10-06 | 2018-10-06 | |
US62/742,280 | 2018-10-06 | ||
US201862777284P | 2018-12-10 | 2018-12-10 | |
US62/777,284 | 2018-12-10 | ||
US201962819702P | 2019-03-18 | 2019-03-18 | |
US62/819,702 | 2019-03-18 | ||
PCT/CN2019/109835 WO2020069673A1 (en) | 2018-10-06 | 2019-10-05 | Method and apparatus of shared merge candidate list region for video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112840653A true CN112840653A (zh) | 2021-05-25 |
CN112840653B CN112840653B (zh) | 2023-12-26 |
Family
ID=70054971
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980065816.3A Active CN112840653B (zh) | 2018-10-06 | 2019-10-05 | 视频编解码中共享合并候选列表区域的方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11290711B2 (zh) |
EP (1) | EP3857888A4 (zh) |
CN (1) | CN112840653B (zh) |
TW (1) | TWI734212B (zh) |
WO (1) | WO2020069673A1 (zh) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6200806B2 (ja) | 2010-05-21 | 2017-09-20 | メリマック ファーマシューティカルズ インコーポレーティッド | 二重特異的融合タンパク質 |
KR102516233B1 (ko) * | 2018-04-02 | 2023-03-30 | 엘지전자 주식회사 | 움직임 벡터에 기반한 영상 코딩 방법 및 그 장치 |
KR20210025537A (ko) | 2018-06-29 | 2021-03-09 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 하나 또는 다수의 룩업 테이블들을 사용하여 이전에 코딩된 모션 정보를 순서대로 저장하고 이를 사용하여 후속 블록들을 코딩하는 개념 |
JP7460617B2 (ja) | 2018-06-29 | 2024-04-02 | 北京字節跳動網絡技術有限公司 | Lut更新条件 |
TWI723445B (zh) | 2018-06-29 | 2021-04-01 | 大陸商北京字節跳動網絡技術有限公司 | 查找表的更新:fifo、約束的fifo |
CN114885173A (zh) | 2018-06-29 | 2022-08-09 | 抖音视界(北京)有限公司 | Lut中的运动候选的检查顺序 |
TWI728390B (zh) | 2018-06-29 | 2021-05-21 | 大陸商北京字節跳動網絡技術有限公司 | 查找表尺寸 |
CN112866720B (zh) * | 2018-07-02 | 2022-02-18 | 华为技术有限公司 | 一种运动矢量预测方法、装置与编解码器 |
TWI820211B (zh) | 2018-09-12 | 2023-11-01 | 大陸商北京字節跳動網絡技術有限公司 | 取決於總數減去k的開始檢查hmvp候選的條件 |
WO2020098812A1 (en) | 2018-11-16 | 2020-05-22 | Beijing Bytedance Network Technology Co., Ltd. | Pruning method for history-based affine parameters |
JP7343097B2 (ja) * | 2018-12-29 | 2023-09-12 | エスゼット ディージェイアイ テクノロジー カンパニー リミテッド | 動画処理方法、装置、およびコンピュータプログラム |
WO2020143824A1 (en) * | 2019-01-13 | 2020-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between lut and shared merge list |
WO2020147773A1 (en) | 2019-01-16 | 2020-07-23 | Beijing Bytedance Network Technology Co., Ltd. | Inserting order of motion candidates in lut |
US11032560B2 (en) | 2019-01-17 | 2021-06-08 | Tencent America LLC | Method and apparatus for video coding without updating the HMVP table |
CN113439444A (zh) * | 2019-02-02 | 2021-09-24 | 北京字节跳动网络技术有限公司 | 用于仿射的多hmvp |
US11223840B2 (en) * | 2019-08-19 | 2022-01-11 | Tencent America LLC | Method and apparatus for video coding |
US11979593B2 (en) | 2022-04-25 | 2024-05-07 | Mediatek Inc. | Method and apparatus for video coding with of low-precision floating-point operations |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100070818A1 (en) * | 2008-09-17 | 2010-03-18 | Ulriksson Bengt A | Node processor for use with low density parity check decoder using multiple variable node degree distribution codes |
US20130003850A1 (en) * | 2011-06-30 | 2013-01-03 | Toshiyasu Sugio | Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus |
CN104185988A (zh) * | 2011-11-08 | 2014-12-03 | 韩国电子通信研究院 | 用于共享候选者列表的方法和装置 |
CN104205838A (zh) * | 2012-03-22 | 2014-12-10 | 联发科技股份有限公司 | 可伸缩视频编码的方法以及装置 |
US20160373739A1 (en) * | 2015-06-16 | 2016-12-22 | Microsoft Technology Licensing, Llc | Intra/inter decisions using stillness criteria and information from previous pictures |
CN107079161A (zh) * | 2014-09-01 | 2017-08-18 | 寰发股份有限公司 | 用于屏幕内容以及视频编码的帧内图片块复制的方法 |
CN107257476A (zh) * | 2011-09-09 | 2017-10-17 | Lg 电子株式会社 | 帧间预测方法及其装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102860006B (zh) * | 2010-02-05 | 2016-11-23 | 瑞典爱立信有限公司 | 管理预测运动向量候选 |
KR101630688B1 (ko) * | 2010-02-17 | 2016-06-16 | 삼성전자주식회사 | 움직임 예측 장치 및 방법과 영상 처리 장치 |
US9736489B2 (en) * | 2011-09-17 | 2017-08-15 | Qualcomm Incorporated | Motion vector determination for video coding |
WO2013108689A1 (ja) | 2012-01-19 | 2013-07-25 | ソニー株式会社 | 画像処理装置および方法 |
US10863193B2 (en) * | 2018-06-29 | 2020-12-08 | Qualcomm Incorporated | Buffer restriction during motion vector prediction for video coding |
CN112369030B (zh) * | 2018-07-06 | 2023-11-10 | 寰发股份有限公司 | 解码器的视频解码方法及装置 |
US10491902B1 (en) * | 2018-07-16 | 2019-11-26 | Tencent America LLC | Method and apparatus for history-based motion vector prediction |
US11336914B2 (en) * | 2018-08-16 | 2022-05-17 | Qualcomm Incorporated | History-based candidate list with classification |
-
2019
- 2019-10-05 CN CN201980065816.3A patent/CN112840653B/zh active Active
- 2019-10-05 WO PCT/CN2019/109835 patent/WO2020069673A1/en unknown
- 2019-10-05 US US17/282,361 patent/US11290711B2/en active Active
- 2019-10-05 EP EP19869456.4A patent/EP3857888A4/en active Pending
- 2019-10-07 TW TW108136228A patent/TWI734212B/zh active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100070818A1 (en) * | 2008-09-17 | 2010-03-18 | Ulriksson Bengt A | Node processor for use with low density parity check decoder using multiple variable node degree distribution codes |
US20130003850A1 (en) * | 2011-06-30 | 2013-01-03 | Toshiyasu Sugio | Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus |
CN106851269A (zh) * | 2011-06-30 | 2017-06-13 | 太阳专利托管公司 | 图像解码方法及装置、图像编码方法及装置、编解码装置 |
CN107257476A (zh) * | 2011-09-09 | 2017-10-17 | Lg 电子株式会社 | 帧间预测方法及其装置 |
CN104185988A (zh) * | 2011-11-08 | 2014-12-03 | 韩国电子通信研究院 | 用于共享候选者列表的方法和装置 |
CN104205838A (zh) * | 2012-03-22 | 2014-12-10 | 联发科技股份有限公司 | 可伸缩视频编码的方法以及装置 |
CN107079161A (zh) * | 2014-09-01 | 2017-08-18 | 寰发股份有限公司 | 用于屏幕内容以及视频编码的帧内图片块复制的方法 |
US20160373739A1 (en) * | 2015-06-16 | 2016-12-22 | Microsoft Technology Licensing, Llc | Intra/inter decisions using stillness criteria and information from previous pictures |
Non-Patent Citations (1)
Title |
---|
杨静: "高效视频编码的Merge模式候选决策研究与改进", 《计算机工程》 * |
Also Published As
Publication number | Publication date |
---|---|
TW202021368A (zh) | 2020-06-01 |
EP3857888A1 (en) | 2021-08-04 |
CN112840653B (zh) | 2023-12-26 |
EP3857888A4 (en) | 2022-08-03 |
US20210321089A1 (en) | 2021-10-14 |
WO2020069673A1 (en) | 2020-04-09 |
TWI734212B (zh) | 2021-07-21 |
US11290711B2 (en) | 2022-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112840653B (zh) | 视频编解码中共享合并候选列表区域的方法和装置 | |
CN112154660B (zh) | 使用双向编码单元加权的视频编码方法和装置 | |
US11122260B2 (en) | Method and apparatus of Merge list generation for Intra Block Copy mode | |
JP7425808B2 (ja) | 動き候補リスト構築プロセスの条件付き実行 | |
TWI774141B (zh) | 視訊編解碼方法及裝置 | |
US12047596B2 (en) | Method and apparatus of combined inter and intra prediction for video coding | |
CN118055250A (zh) | 使用间预测处理视频信号的方法和装置 | |
WO2020035064A1 (en) | Shared candidate list | |
JP2023164843A (ja) | 適応的動きベクトル解像度を利用したビデオ信号処理方法及び装置 | |
CN112970250B (zh) | 视频编码的多重假设方法和装置 | |
TWI729458B (zh) | 用於視訊編解碼的簡化的合併候選列表的方法和裝置 | |
CN112585972B (zh) | 视频编解码的帧间预测方法及装置 | |
WO2024149251A1 (en) | Methods and apparatus of cross-component model merge mode for video coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220429 Address after: Hsinchu County, Taiwan, China Applicant after: MEDIATEK Inc. Address before: 1 Duxing 1st Road, Hsinchu Science Park, Hsinchu, Taiwan, China Applicant before: MEDIATEK Inc. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |