CN109963155A - 图像块的运动信息的预测方法、装置及编解码器 - Google Patents

图像块的运动信息的预测方法、装置及编解码器 Download PDF

Info

Publication number
CN109963155A
CN109963155A CN201711411690.XA CN201711411690A CN109963155A CN 109963155 A CN109963155 A CN 109963155A CN 201711411690 A CN201711411690 A CN 201711411690A CN 109963155 A CN109963155 A CN 109963155A
Authority
CN
China
Prior art keywords
motion information
candidate
candidate motion
image block
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711411690.XA
Other languages
English (en)
Other versions
CN109963155B (zh
Inventor
张娜
安基程
郑建铧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201711411690.XA priority Critical patent/CN109963155B/zh
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to KR1020207021531A priority patent/KR20200108856A/ko
Priority to BR112020012732-9A priority patent/BR112020012732A2/pt
Priority to EP18893007.7A priority patent/EP3731526A4/en
Priority to JP2020535069A priority patent/JP2021507639A/ja
Priority to CN201880083601.XA priority patent/CN111512630A/zh
Priority to PCT/CN2018/107094 priority patent/WO2019119909A1/zh
Priority to PCT/CN2018/122951 priority patent/WO2019120305A1/zh
Publication of CN109963155A publication Critical patent/CN109963155A/zh
Priority to US16/907,660 priority patent/US11297326B2/en
Priority to US17/696,132 priority patent/US20220345716A1/en
Application granted granted Critical
Publication of CN109963155B publication Critical patent/CN109963155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/521Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请实施例公开了图像块的运动信息的预测方法和相关产品。其中该方法包括:确定当前图像块的候选运动信息列表,所述候选运动信息列表包括至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值,所述P个候选运动信息的加权因子之和为1;从所述候选运动信息列表中确定目标运动信息;根据所述目标运动信息,预测当前图像块的运动信息,所述运动信息用于帧内预测或帧间预测。本申请实施例方案有利于提升图像块的运动信息的预测准确性。

Description

图像块的运动信息的预测方法、装置及编解码器
技术领域
本申请涉及视频图像编解码领域,尤其涉及一种图像块的运动信息的预测方法、装置以及编解码器。
背景技术
通过视频压缩技术,例如MPEG-2、MPEG-4、ITU-TH.263、ITU-TH.264/MPEG-4第10部分高级视频编解码(advanced video coding,AVC)、ITU-TH.265高效率视频编解码(highefficiency video coding,HEVC)标准和所述标准的扩展部分中所描述的那些视频压缩技术,设备之间可以实现高效地发射及接收数字视频信息。通常情况下,视频序列的图像被划分成图像块进行编码或解码。
视频压缩技术中,为了减少或去除视频序列中的冗余信息,引入了基于图像块的空间预测(帧内预测,intra predict ion)和/或时间预测(帧间预测,inter prediction)。其中,帧间预测模式可以包括但不限于:合并模式(Merge Mode)与非合并模式(例如高级运动矢量预测模式(AMVP mode))等,且均是利用多运动信息竞争的方法进行帧间预测的。
帧间预测过程中,引入了包括多组运动信息(亦称为多个候选运动信息)的候选运动信息列表(简称候选列表),例如,编码器可以利用从该候选列表中选出一组合适的候选运动信息来预测当前待编码图像块的运动信息(例如运动矢量),进而得到当前待编码图像块的最佳参考图像块(即预测块)。帧内预测过程中,有时候也引入了包括多组运动信息(亦称为block vector)的候选列表。
然而,无论合并模式还是非合并模式,都对候选列表中的候选运动信息的最大候选数量作了限定。一旦可用候选运动信息不足,则将缺省值(例如零向量)作为候选运动信息添加到候选列表,以满足最大候选数量的要求,且给每组候选运动信息分配索引标识。可见,这种做法可能会导致候选列表中的某些候选运动信息的参考意义较低,进而一定程度上导致运动矢量预测准确性较低,从而影响编解码性能。
发明内容
本申请实施例提供一种图像块的运动信息的预测方法、装置及相应的编码器和解码器,提高运动矢量预测的准确性,从而提高编解码性能。
第一方面,本申请实施例提供一种图像块的运动信息的预测方法,所述运动信息用于帧内预测或帧间预测,包括:确定当前图像块的候选运动信息列表,所述候选运动信息列表包括至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息(亦可称为P组候选预测运动信息)采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;从所述候选运动信息列表中确定目标运动信息;以及,根据所述目标运动信息预测当前图像块的运动信息。应当理解的是,所述P个候选运动信息的加权因子之和为1。较佳地,所述P个候选运动信息中的每个候选运动信息的加权因子wpi可以为大于0且小于1的数值。
可见,通过加权处理以构造一个或多个组合候选运动信息,能尽可能的挖掘更多的有参考意义的候选运动信息,丰富了候选运动信息,一定程度上减少或避免使用零向量的候选运动信息去填充候选运动信息列表,比如:针对同一个编解码应用场景,没有引入本申请的技术方案之前,可能会填充多个零向量;而引入本申请的技术方案之后,可能不用填充零向量或者减少填充零向量,一定程度上提高了运动矢量预测的准确性,从而提高了编解码性能。
此外,应当理解的是,这里的当前图像块(简称为当前块)可以理解为当前待编码图像块(coding block)或当前待解码图像块(decoding block)。
此外,应当理解的是,从候选运动信息列表中确定目标运动信息,可以理解为,从候选运动信息列表中选择用于当前图像块的最佳运动信息(最佳预测运动信息)。
此外,应当理解的是,本申请实施例中进行加权处理(或者待加权)的P个候选运动信息可以是在先得到的P个原始候选运动信息,或者在先得到的P个非原始候选运动信息,或者原始候选运动信息与非原始候选运动信息一起构成的在先得到的P个候选运动信息,或者,可以是已放入候选运动信息列表中的P个候选运动信息,或者,可以是在放入候选运动信息列表之前的P个候选运动信息,本申请实施例对此不做限定。
此外,应当理解的是,本申请实施例中确定或构建的用于预测当前图像块的运动信息的候选运动信息列表可以包括一个或多个组合候选运动信息和一个或多个原始候选运动信息,或者,候选运动信息列表可以仅包括一个或多个组合候选运动信息,或者,候选运动信息列表可以包括一个或多个组合候选运动信息和以其它方式获取的候选运动信息,本申请实施例对此不作限定。
此外,应当理解的是,本申请实施例中确定或构建的候选运动信息列表可以包括一种或多种运动信息,例如时域运动信息(时域方向的运动信息)、视间运动信息(视间方向的运动信息)和/或帧内运动信息中的一种或多种,本申请实施例对此不作限定。
此外,需要说明的是,本申请实施例的候选运动信息列表中的候选运动信息可包括运动矢量MV和参考图像指示信息。当然,候选运动信息也可以包含两者之一或者全部包含,例如在编解码端共同约定参考图像的情况下,候选运动信息可以仅包含运动矢量MV。运动矢量一般包含水平分量偏移和竖直分量偏移。例如使用(x,y)表示MV,x表示水平方向的位置偏移,y表示竖直方向的位置偏移。其中参考图像指示信息可以包括但不限于参考图像列表和与参考图像列表对应的参考图像索引。参考图像索引用于识别对应参考图像列表(RefPicList0或RefPicList1)中的运动矢量所指向的参考图像。图像可被称作帧,且参考图像可被称作参考帧。
应当理解的是,本申请实施例的方法的执行主体可以是图像块的运动信息的预测装置,例如可以是视频编码器或视频解码器或具有视频编解码功能的电子设备,具体例如可以是视频编码器中的帧内预测单元或帧间预测单元,或者视频解码器中的帧内预测单元或运动补偿单元。
结合第一方面,在第一方面的某些实现方式中,所述至少一个组合候选运动信息还包括第二组合候选运动信息,所述第二组合候选运动信息是对M个候选运动信息采用对应的加权因子进行加权得到的,M为大于或等于2的整数,所述M个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述P个候选运动信息中的至少一个候选运动信息与所述M个候选运动信息中的至少一个候选运动信息彼此不同。应当理解的是,所述M个候选运动信息的加权因子之和为1。
可见,本申请实施例提供的用于加权处理得到第二组合候选运动信息的M个候选运动信息与用于加权处理得到第一组合候选运动信息的P个候选运动信息可以是彼此完全不同的多个候选运动信息,也可以是彼此部分不同的多个候选运动信息,从而本申请实施例提供了多种加权组合的方式,进一步的提高了构建候选运动信息列表的灵活性和完整性。
结合第一方面,在第一方面的某些实现方式中,所述第一组合候选运动信息包括:所述P个候选运动信息中与第一参考列表对应的P1个候选运动矢量的加权值,和/或,所述P个候选运动信息中与第二参考列表对应的P2个候选运动矢量的加权值,1<P1<=P,1<P2<=P,P1或P2为大于或等于2的整数,其中所述P1或P2个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值。应当理解的是,所述P1个候选运动矢量的加权因子之和为1;所述P2个候选运动矢量的加权因子之和为1。
应当理解的是,在一种示例下,所述P个候选运动信息中的每个候选运动信息可以包括与第一参考列表对应的运动矢量和与第一参考列表对应的参考帧索引,或与第二参考列表对应的运动矢量和与第二参考列表对应的参考帧索引,或前述两者的结合。换言之,所述P个候选运动信息中的每个候选运动信息可以包括:用于前向预测方向的运动信息,或用于后向预测方向的运动信息,或前述两者的结合,其中所述用于前向预测方向的运动信息可以包括:与第一参考图像列表对应的第一参考图像索引以及指向所述第一参考图像索引对应的第一参考图像的运动矢量;所述用于后向预测方向的运动信息可以包括:与第二参考图像列表对应的第二参考图像索引以及指向所述第二参考图像索引对应的第二参考图像的运动矢量。
结合第一方面,在第一方面的某些实现方式中,所述第二组合候选运动信息包括:所述M个候选运动信息中与第一参考列表对应的M1个候选运动矢量的加权值,和/或,所述M个候选运动信息中与第二参考列表对应的M2个候选运动矢量的加权值,1<M1<=M,1<M2<=M,M1或M2为大于或等于2的整数,其中所述M1或M2个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值。应当理解的是,所述M1个候选运动矢量的加权因子之和为1;所述M2个候选运动矢量的加权因子之和为1。
应当理解的是,所述M个候选运动信息中的每个候选运动信息可以包括与第一参考列表对应的运动矢量和与第一参考列表对应的参考帧索引,或与第二参考列表对应的运动矢量和与第二参考列表对应的参考帧索引,或前述两者的结合。换言之,所述M个候选运动信息中的每个候选运动信息可以包括:用于前向预测方向的运动信息,或用于后向预测方向的运动信息,或前述两者的结合,其中所述用于前向预测方向的运动信息可以包括:与第一参考图像列表对应的第一参考图像索引以及指向所述第一参考图像索引对应的第一参考图像的运动矢量;所述用于后向预测方向的运动信息可以包括:与第二参考图像列表对应的第二参考图像索引以及指向所述第二参考图像索引对应的第二参考图像的运动矢量。
结合第一方面,在第一方面的某些实现方式中,所述P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识(亦称为第一索引值)小于第二索引标识(亦称为第二索引值),相应地,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。
可选的,如果候选运动信息列表的长度大于2的情况下,所述候选运动信息列表中的P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识占用的比特数小于第二索引标识占用的比特数,相应地,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。
应当理解的是,第一候选运动信息的加权因子和第二候选运动信息的加权因子的大小关系可以是基于第一索引标识与第二索引标识之间的大小确定的(或者可以是基于第一索引标识与第二索引标识在候选运动信息列表中的排列位置决定的),如果第一索引标识小于第二索引标识(或者第一索引标识排列在前,第二索引标识排列在后),则第一候选运动信息的加权因子大于或等于第二候选运动信息的加权因子。
此外,应当理解的是,如果所述P个候选运动信息中每个候选运动信息的加权因子彼此相同,且所述P个候选运动信息的加权因子之和为1,则前述对P个候选运动信息进行加权以得到第一组合候选运动信息,可以理解为对P个候选运动信息求均值以得到第一组合候选运动信息。
可见,本申请实施例中根据与一个或多个候选运动信息一一对应的一个或多个索引标识的大小关系来灵活确定加权因子,相关性越强的候选运动信息的加权因子(亦称为权值)越大,从而进一步的提高了运动矢量预测的准确性。
结合第一方面,在第一方面的某些实现方式中,所述M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识小于第四索引标识,相应地,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。
可选的,如果候选运动信息列表的长度大于2的情况下,所述候选运动信息列表中的M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识占用的比特数小于第四索引标识占用的比特数,相应地,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。
应当理解的是,第三候选运动信息的加权因子和第四候选运动信息的加权因子的大小关系可以是基于第三索引标识与第四索引标识之间的大小确定的(或者可以是基于第三索引标识与第四索引标识在候选运动信息列表中的排列位置决定的),如果第三索引标识小于第四索引标识(或者第三索引标识排列在前,第四索引标识排列在后),则第三候选运动信息的加权因子大于第四候选运动信息的加权因子。
此外,应当理解的是,如果所述M个候选运动信息中每个候选运动信息的加权因子彼此相同,且所述M个候选运动信息的加权因子之和为1,则前述对M个候选运动信息进行加权以得到第二组合候选运动信息,可以理解为对M个候选运动信息求均值以得到第二组合候选运动信息。
可见,本申请实施例中根据与一个或多个候选运动信息一一对应的一个或多个索引标识的大小关系来灵活确定加权因子,相关性越强的候选运动信息的加权因子(亦称为权值)越大,从而进一步的提高了运动矢量预测的准确性。
结合第一方面,在第一方面的某些实现方式中,所述P个候选运动信息为P个原始候选运动信息,例如,为所述候选运动信息列表中的P个原始候选运动信息;或者,所述P个候选运动信息为(P-X)个原始候选运动信息和X个非原始候选运动信息,例如为所述候选运动信息列表中的(P-X)个原始候选运动信息和X个非原始候选运动信息,X为小于或等于P的正整数。
结合第一方面,在第一方面的某些实现方式中,所述M个候选运动信息为M个原始候选运动信息,例如为所述候选运动信息列表中的M个原始候选运动信息;或者,所述M个候选运动信息为(M-Y)个原始候选运动信息和Y个非原始候选运动信息,例如为所述候选运动信息列表中的(M-Y)个原始候选运动信息和Y个非原始候选运动信息,Y为小于或等于M的正整数。
结合第一方面,在第一方面的某些实现方式中,所述原始候选运动信息包括:当前图像块的一个或多个空域参考块的运动信息、当前图像块的一个或多个时域参考块的运动信息和/或当前图像块的一个或多个视间参考块的运动信息;
所述非原始候选运动信息包括:经缩放过的候选运动信息,第一组合候选运动信息,第二组合候选运动信息,组合双向预测候选运动信息和/或零运动信息,其中每个经缩放的候选运动信息包括:在第一参考列表下的指向第一目标参考帧的运动矢量,和/或在第二参考列表下的指向第二目标参考帧的运动矢量。
需要说明的是,这里的空域参考块指的是与当前图像块空域相关的参考块,可以包括当前图像块所在图像中的、与当前图像块邻近的一个或多个空域参考块,和/或,当前图像块所在图像中的、与所述当前图像块不邻接的一个或多个空域参考块。一种示例下,所述当前图像块所在图像中的与所述当前图像块邻近的一个或多个空域参考块包括:位于所述当前图像块左下侧的第四空域邻近块A0,位于所述当前图像块左侧的第一空域邻近块A1,位于所述当前图像块右上侧的第三空域邻近块B0,位于所述当前图像块上侧的第二空域邻近块B1,或位于所述当前图像块左上侧的第五空域邻近块B2。
需要说明的是,这里的时域参考块,指的是与当前图像块时域相关的参考块,可以包括参考图像中、与并置块(co-located块)邻近的一个或多个空域参考块,和/或,所述并置块中的一个或多个子块,其中,所述并置块为参考图像中与所述当前图像块具有相同的大小、形状和坐标的图像块,或者所述并置块为参考图像中与所述当前图像块具有指定位置偏移量的具有相同的大小、形状的图像块。这里的参考图像指的是已重建的图像,具体的,这里的参考图像指的是一个或多个参考图像列表中的参考图像,例如可以是指定参考图像列表中的指定参考图像索引对应的参考图像,也可以是默认的参考图像列表中的处于首位置的参考图像,本申请对此不作限定。一种示例下,所述时域参考块包括:所述当前图像块的并置块(co-located块)的右下空域邻近块H,所述并置块的左上中间块C0,所述并置块的右下中间块C3、所述并置块的左上块TL,或所述并置块的右下块BR。
需要说明的是,这里的视间参考块,指的是与当前图像块视点间相关的参考块,可以包括参考图像中、与对应块邻近的一个或多个空域参考块,和/或,所述对应块中的一个或多个子块,其中,所述对应块为参考图像中与所述当前图像块具有相同的大小、形状和坐标的图像块,或者所述对应块为参考图像中与所述当前图像块具有指定位置偏移量的具有相同的大小、形状的图像块(亦即由一个视差矢量定位得到的)。这里的参考图像指的是已重建的图像,具体的,这里的参考图像指的是参考视点下与所述当前图像相同时刻或者不同时刻的参考图像,本申请对此不作限定。
需要说明的是,无论是哪一种参考块,都是指已确定运动矢量图像块(亦指已编码图像块或已解码图像块)。
需要说明的是,这里的组合双向预测候选运动信息,指的是对所述候选运动信息列表中包括的两个单向预测类型的原始候选运动信息进行组合而得到的双向预测类型的候选运动信息。这里的组合可以理解为,将一组单向预测类型为前向预测方向的原始候选运动信息和另一组单向预测类型为后向预测方向的原始候选运动信息进行组合,得到一组新构造的双向预测类型的候选运动信息。
结合第一方面,在第一方面的某些实现方式中,所述经缩放过的候选运动信息是通过如下方法得到的:
确定当前图像块的、与第一参考列表对应的第一目标参考帧和/或与第二参考列表对应的第二目标参考帧;
判断候选运动信息包括的与所述第一参考列表对应的参考图像是否与第一目标参考帧相同,和/或候选运动信息包括的与所述第二参考列表对应的参考图像是否与第二目标参考帧相同;
如果候选运动信息包括的与所述第一参考列表对应的参考图像不同于所述第一目标参考帧,则对候选运动信息包括的与所述第一参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第一目标参考帧的运动矢量;和/或,
如果候选运动信息包括的与所述第二参考列表对应的参考图像不同于所述第二目标参考帧,则对候选运动信息包括的与所述第二参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第二目标参考帧的运动矢量。
其中,所述第一目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第一参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第一参考列表的参考帧;或者,所述第二目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第二参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第二参考列表的参考帧。
应当理解的是,如果进行加权处理(待加权的)的候选运动信息均是帧内运动信息,则无需预先执行缩放处理;如果进行加权处理的候选运动信息包括时域方向的运动信息和/或视间方向的运动该信息,则需要预先执行缩放处理。
可见,在进行加权处理之前,对指向的参考帧不同于目标参考帧的运动矢量进行预处理,以缩放到指向目标参考帧的运动矢量,从而能进一步提高运动矢量预测的有效性。
结合第一方面,在第一方面的某些实现方式中,所述组合候选运动信息的索引标识所占用的比特数大于或等于原始候选运动信息的索引标识所占用的的比特数。
可见,将组合候选运动信息的索引标识设置为比特数较大的索引标识,有利于兼容现有的构建候选运动信息列表的过程。
结合第一方面,在第一方面的某些实现方式中,所述组合候选运动信息的索引标识所占用的的比特数小于或等于原始候选运动信息的索引标识所占用的的比特数。
可见,在某些帧内或帧间预测模式下,根据组合候选运动信息进行编解码的效率高于根据原始候选运动信息进行编解码的效率,因此,组合候选运动信息为目标运动信息的概率相对较大,因此,可以将组合候选运动信息的索引标识设置为比特数较小的索引标识,有利于减小视频传输的比特开销。
结合第一方面,在第一方面的某些实现方式中,所述根据所述目标运动信息,预测所述当前图像块的运动信息,包括:将所述目标运动信息作为所述当前图像块的运动信息。
结合第一方面,在第一方面的某些实现方式中,所述运动信息包括运动矢量,所述根据所述目标运动信息,预测所述当前图像块的运动信息,包括:从码流中解析所述当前图像块的运动矢量预测残差值;将所述目标运动信息中的运动矢量和所述运动矢量预测残差值之和,作为所述当前图像块的运动矢量。
结合第一方面,在第一方面的某些实现方式中,所述方法用于编码所述当前图像块,所述确定目标运动信息包括:从所述候选运动信息列表中确定所述目标运动信息,其中,所述目标运动信息编码所述当前图像块的码率失真代价最小;
或者,所述方法用于解码所述当前图像块,所述确定目标运动信息包括:从所述候选运动信息列表中确定第五索引标识指示的目标运动信息,所述第五索引标识指示所述候选运动信息列表中的所述目标运动信息。应理解的是,第五索引标识可以是前述出现的第一、二、三或四索引标识中的某一个,也可以是不同于前述出现的第一、二、三或四索引标识的索引标识。
需要说明的是,如果候选运动信息列表中只有一个候选运动信息,则确定唯一的候选运动信息为目标运动信息。
可见,本申请实施例的图像块的运动信息的预测方法,不仅适用于合并预测模式(Merge)和/或高级运动矢量预测模式(advanced mot ion vector predict ion,AMVP),而且也能适用于使用空域参考块,时域参考块和/或视间参考块的运动信息对当前图像块的运动信息进行预测的其它模式,从而提高编解码性能。
本申请的第二方面提供一种图像块的运动信息的预测装置,所述运动信息用于帧内预测或帧间预测,所述装置包括:候选运动信息列表确定单元,用于确定当前图像块的候选运动信息列表,所述候选运动信息列表包括至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;目标运动信息确定单元,用于从所述候选运动信息列表中确定目标运动信息;以及,预测单元,用于根据所述目标运动信息,预测当前图像块的运动信息。应当理解的是,所述P个候选运动信息的加权因子之和为1。较佳地,所述P个候选运动信息中的每个候选运动信息的加权因子wpi可以为大于0且小于1的数值。
这里的当前图像块(简称为当前块)可以理解为当前待编码图像块或当前待解码图像块。
需要说明的是,所述候选运动信息列表包括一种或多种候选运动信息,例如时域运动信息(亦称为时域方向的运动信息)、视间运动信息(亦称为视间方向的运动信息)和/或帧内运动信息中的一种或多种。
结合第二方面,在第二方面的某些实现方式中,所述至少一个组合候选运动信息还包括第二组合候选运动信息,所述第二组合候选运动信息是对M个候选运动信息采用对应的加权因子进行加权得到的,M为大于或等于2的整数,所述M个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述P个候选运动信息中的至少一个候选运动信息与所述M个候选运动信息中的至少一个候选运动信息彼此不同。应当理解的是,所述M个候选运动信息的加权因子之和为1。
结合第二方面,在第二方面的某些实现方式中,所述第一组合候选运动信息包括:所述P个候选运动信息中与第一参考列表对应的P1个候选运动矢量的加权值,和/或,所述P个候选运动信息中与第二参考列表对应的P2个候选运动矢量的加权值,1<P1<=P,1<P2<=P,P1或P2为大于或等于2的整数,其中所述P1或P2个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值。应当理解的是,所述P1个候选运动矢量的加权因子之和为1;所述P2个候选运动矢量的加权因子之和为1。
结合第二方面,在第二方面的某些实现方式中,所述第二组合候选运动信息包括:所述M个候选运动信息中与第一参考列表对应的M1个候选运动矢量的加权值,和/或,所述M个候选运动信息中与第二参考列表对应的M2个候选运动矢量的加权值,1<M1<=M,1<M2<=M,M1或M2为大于或等于2的整数,其中所述M1或M2个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值。应当理解的是,所述M1个候选运动矢量的加权因子之和为1;所述M2个候选运动矢量的加权因子之和为1。
结合第二方面,在第二方面的某些实现方式中,所述P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识小于第二索引标识,相应地,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。
结合第二方面,在第二方面的某些实现方式中,所述M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识小于第四索引标识,相应地,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。
结合第二方面,在第二方面的某些实现方式中,所述P个候选运动信息为P个原始候选运动信息;或者,所述P个候选运动信息为(P-X)个原始候选运动信息和X个非原始候选运动信息,X为小于或等于P的正整数。
结合第二方面,在第二方面的某些实现方式中,所述M个候选运动信息为M个原始候选运动信息;或者,所述M个候选运动信息为(M-Y)个原始候选运动信息和Y个非原始候选运动信息,Y为小于或等于M的正整数。
结合第二方面,在第二方面的某些实现方式中,所述原始候选运动信息包括:当前图像块的一个或多个空域参考块的运动信息、当前图像块的一个或多个时域参考块的运动信息和/或当前图像块的一个或多个视间参考块的运动信息;
所述非原始候选运动信息包括:经缩放过的候选运动信息,第一组合候选运动信息,第二组合候选运动信息,组合双向预测候选运动信息和/或零运动信息,其中每个经缩放的候选运动信息包括:在第一参考列表下的指向第一目标参考帧的运动矢量,和/或在第二参考列表下的指向第二目标参考帧的运动矢量。
结合第二方面,在第二方面的某些实现方式中,所述经缩放过的候选运动信息是所述候选运动信息列表确定单元通过如下步骤得到的:
确定当前图像块的、与第一参考列表对应的第一目标参考帧和/或与第二参考列表对应的第二目标参考帧;
判断所述候选运动信息包括的与所述第一参考列表对应的参考图像是否与第一目标参考帧相同,和/或所述候选运动信息包括的与所述第二参考列表对应的参考图像是否与第二目标参考帧相同;
如果所述候选运动信息包括的与所述第一参考列表对应的参考图像不同于所述第一目标参考帧,则对所述候选运动信息包括的与所述第一参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第一目标参考帧的运动矢量;和/或,
如果所述候选运动信息包括的与所述第二参考列表对应的参考图像不同于所述第二目标参考帧,则对所述候选运动信息包括的与所述第二参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第二目标参考帧的运动矢量。
其中,所述第一目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第一参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第一参考列表的参考帧;或者,所述第二目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第二参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第二参考列表的参考帧。
结合第二方面,在第二方面的某些实现方式中,所述组合候选运动信息的索引标识所占用的比特数大于或等于原始候选运动信息的索引标识所占用的的比特数。
结合第二方面,在第二方面的某些实现方式中,所述组合候选运动信息的索引标识所占用的的比特数小于或等于原始候选运动信息的索引标识所占用的的比特数。
结合第二方面,在第二方面的某些实现方式中,所述预测单元具体用于将所述目标运动信息作为所述当前图像块的运动信息。
结合第二方面,在第二方面的某些实现方式中,所述运动信息包括运动矢量,所述预测单元具体用于:从码流中解析所述当前图像块的运动矢量预测残差值;将所述目标运动信息中的运动矢量和所述运动矢量预测残差值之和,作为所述当前图像块的运动矢量。
结合第二方面,在第二方面的某些实现方式中,所述装置用于编码所述当前图像块,所述目标运动信息确定单元具体用于:从所述候选运动信息列表中确定所述目标运动信息,其中,所述目标运动信息编码所述当前图像块的码率失真代价最小;
或者,所述装置用于解码所述当前图像块,所述目标运动信息确定单元具体用于:从所述候选运动信息列表中确定第五索引标识指示的目标运动信息,所述第五索引标识指示所述候选运动信息列表中的所述目标运动信息。
需要说明的是,如果候选运动信息列表中只有一个候选运动信息,则确定唯一的候选运动信息为目标运动信息。
本申请的第三方面提供了一种图像块的运动信息的预测装置,所述运动信息用于帧内预测或帧间预测,所述装置包括:处理器和耦合于所述处理器的存储器;所述处理器用于:确定当前图像块的候选运动信息列表,所述候选运动信息列表包括至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;从所述候选运动信息列表中确定目标运动信息;以及,根据所述目标运动信息预测当前图像块的运动信息。应当理解的是,所述P个候选运动信息的加权因子之和为1。
这里的当前图像块(简称为当前块)可以理解为当前待编码图像块或当前待解码图像块。
需要说明的是,所述候选运动信息列表包括一种或多种候选运动信息,例如时域运动信息(亦称为时域方向的运动信息)、视间运动信息(亦称为视间方向的运动信息)和/或帧内运动信息中的一种或多种。
结合第三方面,在第三方面的某些实现方式中,所述至少一个组合候选运动信息还包括第二组合候选运动信息,所述第二组合候选运动信息是对M个候选运动信息采用对应的加权因子进行加权得到的,M为大于或等于2的整数,所述M个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述P个候选运动信息中的至少一个候选运动信息与所述M个候选运动信息中的至少一个候选运动信息彼此不同。
应当理解的是,所述M个候选运动信息的加权因子之和为1。
结合第三方面,在第三方面的某些实现方式中,所述第一组合候选运动信息包括:所述P个候选运动信息中与第一参考列表对应的P1个候选运动矢量的加权值,和/或,所述P个候选运动信息中与第二参考列表对应的P2个候选运动矢量的加权值,1<P1<=P,1<P2<=P,P1或P2为大于或等于2的整数,其中所述P1或P2个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值。应当理解的是,所述P1个候选运动矢量的加权因子之和为1;所述P2个候选运动矢量的加权因子之和为1。
结合第三方面,在第三方面的某些实现方式中,所述第二组合候选运动信息包括:所述M个候选运动信息中与第一参考列表对应的M1个候选运动矢量的加权值,和/或,所述M个候选运动信息中与第二参考列表对应的M2个候选运动矢量的加权值,1<M1<=M,1<M2<=M,M1或M2为大于或等于2的整数,其中所述M1或M2个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值。应当理解的是,所述M1个候选运动矢量的加权因子之和为1;所述M2个候选运动矢量的加权因子之和为1。
结合第三方面,在第三方面的某些实现方式中,所述P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识小于第二索引标识,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。
结合第三方面,在第三方面的某些实现方式中,所述M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识小于第四索引标识,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。
结合第三方面,在第三方面的某些实现方式中,所述P个候选运动信息为P个原始候选运动信息;或者,所述P个候选运动信息为(P-X)个原始候选运动信息和X个非原始候选运动信息,X为小于或等于P的正整数。
结合第三方面,在第三方面的某些实现方式中,所述M个候选运动信息为M个原始候选运动信息;或者,所述M个候选运动信息为(M-Y)个原始候选运动信息和Y个非原始候选运动信息,Y为小于或等于M的正整数。
结合第三方面,在第三方面的某些实现方式中,所述原始候选运动信息包括:当前图像块的一个或多个空域参考块的运动信息、当前图像块的一个或多个时域参考块的运动信息和/或当前图像块的一个或多个视间参考块的运动信息;
所述非原始候选运动信息包括:经缩放过的候选运动信息,第一组合候选运动信息,第二组合候选运动信息,组合双向预测候选运动信息和/或零运动信息,其中每个经缩放的候选运动信息包括:在第一参考列表下的指向第一目标参考帧的运动矢量,和/或在第二参考列表下的指向第二目标参考帧的运动矢量。
结合第三方面,在第三方面的某些实现方式中,所述经缩放过的候选运动信息是所述处理器执行如下步骤得到的:
确定当前图像块的、与第一参考列表对应的第一目标参考帧和/或与第二参考列表对应的第二目标参考帧;
判断候选运动信息包括的与所述第一参考列表对应的参考图像是否与第一目标参考帧相同,和/或候选运动信息包括的与所述第二参考列表对应的参考图像是否与第二目标参考帧相同;
如果候选运动信息包括的与所述第一参考列表对应的参考图像不同于所述第一目标参考帧,则对候选运动信息包括的与所述第一参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第一目标参考帧的运动矢量;和/或,
如果候选运动信息包括的与所述第二参考列表对应的参考图像不同于所述第二目标参考帧,则对候选运动信息包括的与所述第二参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第二目标参考帧的运动矢量。
其中,所述第一目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第一参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第一参考列表的参考帧;或者,所述第二目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第二参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第二参考列表的参考帧。
结合第三方面,在第三方面的某些实现方式中,所述组合候选运动信息的索引标识所占用的比特数大于或等于原始候选运动信息的索引标识所占用的的比特数。
结合第三方面,在第三方面的某些实现方式中,所述组合候选运动信息的索引标识所占用的的比特数小于或等于原始候选运动信息的索引标识所占用的的比特数。
结合第三方面,在第三方面的某些实现方式中,所述处理器具体用于将所述目标运动信息作为所述当前图像块的运动信息。
结合第三方面,在第三方面的某些实现方式中,所述运动信息包括运动矢量,所述处理器具体用于:从码流中解析所述当前图像块的运动矢量预测残差值;将所述目标运动信息中的运动矢量和所述运动矢量预测残差值之和,作为所述当前图像块的运动矢量。
结合第三方面,在第三方面的某些实现方式中,所述装置用于编码所述当前图像块,所述处理器具体用于:从所述候选运动信息列表中确定所述目标运动信息,其中,所述目标运动信息编码所述当前图像块的码率失真代价最小;
或者,所述装置用于解码所述当前图像块,所述处理器具体用于:从所述候选运动信息列表中确定第五索引标识指示的目标运动信息,所述第五索引标识指示所述候选运动信息列表中的所述目标运动信息。
需要说明的是,如果候选运动信息列表中只有一个候选运动信息,则确定唯一的候选运动信息为目标运动信息。
本申请的第四方面提供了一种图像块的运动信息的预测方法,所述运动信息用于帧内预测或帧间预测,包括:获取至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;确定目标运动信息,其中所述目标运动信息为所述至少一个组合候选运动信息中的一个候选运动信息;以及,根据所述目标运动信息预测当前图像块的运动信息。应当理解的是,所述P个候选运动信息的加权因子之和为1。较佳地,所述P个候选运动信息中的每个候选运动信息的加权因子wpi可以为大于0且小于1的数值。
这里的当前图像块(简称为当前块)可以理解为当前待编码图像块或当前待解码图像块。
此外,应当理解的是,当该方法用于编码所述待处理图像块,如果获取的组合候选运动信息的数量为一个的情况,确定唯一的组合候选运动信息为目标运动信息;如果获取的组合候选运动信息的数量为多于一个的情况,从所述多于一个的组合候选运动信息中确定目标运动信息,所述目标运动信息编码当前图像块的码率失真代价最小。
当该方法用于解码所述待处理图像块,如果获取的组合候选运动信息的数量为一个的情况,确定唯一的组合候选运动信息为目标运动信息;如果获取的组合候选运动信息的数量为多于一个的情况,从所述多于一个的组合候选运动信息中确定由码流中的标识信息所指示的目标运动信息。
结合第四方面,在第四方面的某些实现方式中,所述第一组合候选运动信息包括:所述P个候选运动信息中用于前向预测方向的P1个候选运动矢量的加权值,和/或,所述P个候选运动信息中用于后向预测方向的P2个候选运动矢量的加权值,1<P1<=P,1<P2<=P,P1或P2为大于或等于2的整数,其中所述P1或P2个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值。应当理解的是,所述P1个候选运动矢量的加权因子之和为1;所述P2个候选运动矢量的加权因子之和为1。
结合第四方面,在第四方面的某些实现方式中,所述第二组合候选运动信息包括:所述M个候选运动信息中用于前向预测方向的M1个候选运动矢量的加权值,和/或,所述M个候选运动信息中用于后向预测方向的M2个候选运动矢量的加权值,1<M1<=M,1<M2<=M,M1或M2为大于或等于2的整数,其中所述M1或M2个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值。应当理解的是,所述M1个候选运动矢量的加权因子之和为1;所述M2个候选运动矢量的加权因子之和为1。
结合第四方面,在第四方面的某些实现方式中,所述P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识小于第二索引标识,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。
结合第四方面,在第四方面的某些实现方式中,所述M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识小于第四索引标识,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。
结合第四方面,在第四方面的某些实现方式中,所述P个候选运动信息为P个原始候选运动信息;或者,所述P个候选运动信息为(P-X)个原始候选运动信息和X个非原始候选运动信息,X为小于或等于P的正整数。
结合第四方面,在第四方面的某些实现方式中,所述M个候选运动信息为M个原始候选运动信息;或者,所述M个候选运动信息为(M-Y)个原始候选运动信息和Y个非原始候选运动信息,Y为小于或等于M的正整数。
结合第四方面,在第四方面的某些实现方式中,所述原始候选运动信息包括:当前图像块的一个或多个空域参考块的运动信息、当前图像块的一个或多个时域参考块的运动信息和/或当前图像块的一个或多个视间参考块的运动信息;
所述非原始候选运动信息包括:经缩放过的候选运动信息,第一组合候选运动信息,第二组合候选运动信息,组合双向预测候选运动信息和/或零运动信息,其中每个经缩放的候选运动信息包括:在第一参考列表下的指向第一目标参考帧的运动矢量,和/或在第二参考列表下的指向第二目标参考帧的运动矢量。
结合第四方面,在第四方面的某些实现方式中,所述经缩放过的候选运动信息是通过如下方法得到的:
确定当前图像块的、与第一参考列表对应的第一目标参考帧和/或与第二参考列表对应的第二目标参考帧;
判断候选运动信息包括的与所述第一参考列表对应的参考图像是否与第一目标参考帧相同,和/或候选运动信息包括的与所述第二参考列表对应的参考图像是否与第二目标参考帧相同;
如果候选运动信息包括的与所述第一参考列表对应的参考图像不同于所述第一目标参考帧,则对候选运动信息包括的与所述第一参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第一目标参考帧的运动矢量;和/或,
如果候选运动信息包括的与所述第二参考列表对应的参考图像不同于所述第二目标参考帧,则对候选运动信息包括的与所述第二参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第二目标参考帧的运动矢量。
其中,所述第一目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第一参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第一参考列表的参考帧;或者,所述第二目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第二参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第二参考列表的参考帧。
结合第四方面,在第四方面的某些实现方式中,所述根据所述目标运动信息,预测所述当前图像块的运动信息,包括:将所述目标运动信息作为所述当前图像块的运动信息。
结合第四方面,在第四方面的某些实现方式中,所述运动信息包括运动矢量,所述根据所述目标运动信息,预测所述当前图像块的运动信息,包括:从码流中解析所述当前图像块的运动矢量预测残差值;将所述目标运动信息中的运动矢量和所述运动矢量预测残差值之和,作为所述当前图像块的运动矢量。
本申请的第五方面提供一种图像块的运动信息的预测装置,包括用于实施第四方面的任意一种方法的若干个功能单元。举例来说,图像块的运动信息的预测装置可以包括:
运动信息获取单元,用于获取至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;运动信息确定单元,用于确定目标运动信息,其中所述目标运动信息为所述至少一个组合候选运动信息中的一个候选运动信息;以及,预测单元,用于根据所述目标运动信息预测当前图像块的运动信息。
应当理解的是,所述P个候选运动信息的加权因子之和为1。以及,这里的当前图像块(简称为当前块)可以理解为当前待编码图像块或当前待解码图像块。
其中,所述图像块的运动信息的预测装置例如应用于视频编码装置(视频编码器)或视频解码装置(视频解码器)。
本申请的第六方面提供了一种图像块的运动信息的预测装置,所述运动信息用于帧内预测或帧间预测,所述装置包括:处理器和耦合于所述处理器的存储器;所述处理器用于:获取至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;确定目标运动信息,其中所述目标运动信息为所述至少一个组合候选运动信息中的一个候选运动信息;以及,根据所述目标运动信息预测当前图像块的运动信息。应当理解的是,所述P个候选运动信息的加权因子之和为1。
这里的当前图像块(简称为当前块)可以理解为当前待编码图像块或当前待解码图像块。
本申请的第七方面提供一种视频编码器,所述视频编码器用于编码图像块,包括:
帧间预测器(亦称为帧间预测单元),包括如第二方面或第三方面或第五方面或第六方面所述的图像块的运动信息的预测装置,其中所述帧间预测器用于基于目标运动信息预测当前图像块的运动信息,基于所述当前图像块的运动信息确定当前待编码图像块的预测块;熵编码器(亦称为熵编码单元),用于将所述目标运动信息的索引标识编入码流,所述索引标识指示用于所述当前待编码图像块的所述目标运动信息;重建器(亦称为重建单元),用于基于所述预测块重建所述图像块。
结合第七方面,在第七方面的某些实现方式中,所述帧间预测器进一步用于从所述候选运动信息列表包括的多个候选运动信息中选择用于当前待编码图像块的目标运动信息,其中,所述选择的目标运动信息编码所述当前待编码图像块的码率失真代价最小。
本申请的第八方面提供一种视频编码器,所述视频编码器用于编码图像块,包括:
帧内预测器(亦称为帧内预测单元),包括如第二方面或第三方面或第五方面或第六方面所述的图像块的运动信息的预测装置,其中所述帧内预测器用于基于目标运动信息预测当前图像块的帧内运动信息,基于所述当前图像块的帧内运动信息确定当前待编码图像块的帧内预测块;熵编码器(亦称为熵编码单元),用于将所述目标运动信息的索引标识编入码流,所述索引标识指示用于所述当前待编码图像块的所述目标运动信息;重建器(亦称为重建单元),用于基于所述帧内预测块重建所述图像块。
结合第八方面,在第八方面的某些实现方式中,所述帧内预测器进一步用于从所述候选运动信息列表包括的多个候选运动信息中选择用于当前待编码图像块的目标运动信息,其中,所述选择的目标运动信息编码所述当前待编码图像块的码率失真代价最小。
本申请的第九方面提供一种视频解码器,所述视频解码器用于从码流中解码出图像块,包括:熵解码器(亦称为熵解码单元),用于从码流中解码出索引标识,所述索引标识用于指示当前待解码图像块的目标运动信息;帧间预测器(亦称为帧间预测单元),包括如第二方面或第三方面或第五方面或第六方面所述的图像块的运动信息的预测装置,所述帧间预测器用于基于所述索引标识指示的目标运动信息预测当前图像块的运动信息,基于所述当前图像块的运动信息确定当前待解码图像块的预测块;重建器(亦称为重建单元),用于基于所述预测块重建所述图像块。
本申请的第十方面提供一种视频解码器,所述视频解码器用于从码流中解码出图像块,包括:熵解码器(亦称为熵解码单元),用于从码流中解码出索引标识,所述索引标识用于指示当前待解码图像块的目标运动信息;帧内预测器(亦称为帧内预测单元),包括如第二方面或第三方面或第五方面或第六方面的图像块的运动信息的预测装置,所述帧内预测器用于基于所述索引标识指示的目标运动信息预测当前图像块的运动信息,基于所述当前图像块的运动信息确定当前待解码图像块的预测块;重建器(亦称为重建单元),用于基于所述预测块重建所述图像块。
本申请的第十一方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第四方面所述的方法。
本申请的第十二方面提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面或第四方面所述的方法。
本申请的第十三方面提供了一种电子设备,包括上述第七或八方面所述的视频编码器,或上述第九或十方面所述的视频解码器,或上述第二、三、五或六方面所述的图像块的运动信息的预测装置。
本申请的第十四方面提供了一种编码设备,包括:相互耦合的非易失性存储器和处理器,所述处理器调用存储在所述存储器中的程序代码以执行第一方面或第四方面的任意一种方法的部分或全部步骤。
本申请的第十五方面提供了一种解码设备,包括:相互耦合的非易失性存储器和处理器,所述处理器调用存储在所述存储器中的程序代码以执行第一方面或第四方面的任意一种方法的部分或全部步骤。
应理解,本申请的第二至十五方面与本申请的第一方面的技术方案一致,各方面及对应的可实施的设计方式所取得的有益效果相似,不再赘述。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1为本申请实施例中一种视频编码及解码系统的示意性框图;
图2为本申请实施例中一种视频编码器的示意性框图;
图3为本申请实施例中一种视频解码器的示意性框图;
图4A为本申请实施例中合并模式下由视频编码器执行的编码方法的一种示例性流程图;
图4B为本申请实施例中高级运动矢量预测模式下由视频编码器执行的编码方法的一种示例性流程图;
图5为本申请实施例中由视频解码器执行的运动补偿的一种示例性流程图;
图6A和6B为本申请实施例中编码单元及与其关联的空域参考块、时域参考块的一种示例性示意图;
图6C为本申请实施例中编码单元及与其关联的视间对应块的一种示例性示意图;
图7为本申请实施例中一种图像块的运动信息的预测方法的流程图;
图8A为本申请实施例中将组合候选运动信息添加到合并模式候选列表的一种示例性示意图;
图8B为本申请实施例中将组合候选运动信息添加到合并模式候选列表的另一种示例性示意图;
图9为本申请实施例中缩放处理的一种示例性示意图;
图10为本申请实施例中将组合候选运动信息添加到AMVP模式候选列表的一种示例性示意图;
图11为本申请实施例中构建候选预测运动矢量列表的一种示例性流程图;
图12为本申请实施例中将组合双向预测候选运动信息添加到合并模式候选列表的一种示例性示意图;
图13为本申请实施例中将零运动矢量添加到合并模式候选列表的一种示例性示意图;
图14为本申请实施例中一种图像块的运动信息的预测装置的示意性框图;
图15为本申请实施例中一种编码设备或解码设备的示意性框图;
图16为本申请实施例的编解码性能的增益的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
图1为本申请实施例中视频编码及解码系统10的一种示意性框图。如图1中所展示,系统10包含源装置12,源装置12产生将在稍后时间由目的地装置14解码的经编码视频数据。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含桌上型计算机、笔记型计算机、平板计算机、机顶盒、例如所谓的“智能”电话的电话手机、所谓的“智能”触控板、电视、摄影机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些应用中,源装置12及目的地装置14可经装备以用于无线通信。
目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个可行的实施方式中,链路16可包括使源装置12能够实时将经编码视频数据直接传输到目的地装置14的通信媒体。可根据通信标准(例如,无线通信协议)调制经编码视频数据且将其传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频频谱或一个或多个物理传输线。通信媒体可形成基于包的网络(例如,局域网、广域网或因特网的全球网络)的部分。通信媒体可包含路由器、交换器、基站或可有用于促进从源装置12到目的地装置14的通信的任何其它装备。
替代地,可将经编码数据从输出接口22输出到存储装置24。类似地,可由输入接口从存储装置24存取经编码数据。存储装置24可包含多种分散式或本地存取的数据存储媒体中的任一者,例如,硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一可行的实施方式中,存储装置24可对应于文件服务器或可保持由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置24存取所存储视频数据。文件服务器可为能够存储经编码视频数据且将此经编码视频数据传输到目的地装置14的任何类型的服务器。可行的实施方式文件服务器包含网站服务器、文件传送协议服务器、网络附接存储装置或本地磁盘机。目的地装置14可经由包含因特网连接的任何标准数据连接存取经编码视频数据。此数据连接可包含适合于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,缆线调制解调器等)或两者的组合。经编码视频数据从存储装置24的传输可为流式传输、下载传输或两者的组合。
本申请的技术不必限于无线应用或设定。技术可应用于视频解码以支持多种多媒体应用中的任一者,例如,空中电视广播、有线电视传输、卫星电视传输、流式传输视频传输(例如,经由因特网)、编码数字视频以用于存储于数据存储媒体上、解码存储于数据存储媒体上的数字视频或其它应用。在一些可行的实施方式中,系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频播放、视频广播和/或视频电话的应用。
在图1的可行的实施方式中,源装置12包含视频源18、视频编码器20及输出接口22。在一些应用中,输出接口22可包含调制器/解调制器(调制解调器)和/或传输器。在源装置12中,视频源18可包含例如以下各者的源:视频捕获装置(例如,摄像机)、含有先前捕获的视频的视频存档、用以从视频内容提供者接收视频的视频馈入接口,和/或用于产生计算机图形数据作为源视频的计算机图形系统,或这些源的组合。作为一种可行的实施方式,如果视频源18为摄像机,那么源装置12及目的装置14可形成所谓的摄影机电话或视频电话。本申请中所描述的技术可示例性地适用于视频解码,且可适用于无线和/或有线应用。
可由视频编码器20来编码所捕获、预捕获或计算机产生的视频。经编码视频数据可经由源装置12的输出接口22直接传输到目的地装置14。经编码视频数据也可(或替代地)存储到存储装置24上以供稍后由目的地装置14或其它装置存取以用于解码和/或播放。
目的地装置14包含输入接口28、视频解码器30及显示装置32。在一些应用中,输入接口28可包含接收器和/或调制解调器。目的地装置14的输入接口28经由链路16接收经编码视频数据。经由链路16传达或提供于存储装置24上的经编码视频数据可包含由视频编码器20产生以供视频解码器30的视频解码器使用以解码视频数据的多种语法元素。这些语法元素可与在通信媒体上传输、存储于存储媒体上或存储于文件服务器上的经编码视频数据包含在一起。
显示装置32可与目的地装置14集成或在目的地装置14外部。在一些可行的实施方式中,目的地装置14可包含集成显示装置且也经配置以与外部显示装置接口连接。在其它可行的实施方式中,目的地装置14可为显示装置。一般来说,显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如液晶显示器、等离子显示器、有机发光二极管显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据例如目前在开发中的下一代视频编解码压缩标准(H.266)操作且可遵照H.266测试模型(JEM)。替代地,视频编码器20及视频解码器30可根据例如ITU-TH.265标准,也称为高效率视频解码标准,或者,ITU-TH.264标准的其它专属或工业标准或这些标准的扩展而操作,ITU-TH.264标准替代地被称为MPEG-4第10部分,也称高级视频编码(advanced video coding,AVC)。然而,本申请的技术不限于任何特定解码标准。视频压缩标准的其它可行的实施方式包含MPEG-2和ITU-TH.263。
尽管未在图1中展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件及软件以处置共同数据流或单独数据流中的音频及视频两者的编码。如果适用,那么在一些可行的实施方式中,MUX-DEMUX单元可遵照ITUH.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
视频编码器20及视频解码器30各自可实施为多种合适编码器电路中的任一者,例如,一个或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。在技术部分地以软件实施时,装置可将软件的指令存储于合适的非暂时性计算机可读媒体中且使用一个或多个处理器以硬件执行指令,以执行本申请的技术。视频编码器20及视频解码器30中的每一者可包含于一个或多个编码器或解码器中,其中的任一者可在相应装置中集成为组合式编码器/解码器(CODEC)的部分。
本申请示例性地可涉及视频编码器20将特定信息“用信号发送”到例如视频解码器30的另一装置。然而,应理解,视频编码器20可通过将特定语法元素与视频数据的各种经编码部分相关联来用信号发送信息。即,视频编码器20可通过将特定语法元素存储到视频数据的各种经编码部分的头信息来“用信号发送”数据。在一些应用中,这些语法元素可在通过视频解码器30接收及解码之前经编码及存储(例如,存储到存储系统34或文件服务器36)。因此,术语“用信号发送”示例性地可指语法或用于解码经压缩视频数据的其它数据的传达,而不管此传达是实时或近实时地发生或在时间跨度内发生,例如可在编码时将语法元素存储到媒体时发生,语法元素接着可在存储到此媒体之后的任何时间通过解码装置检索。
JCT-VC开发了H.265(HEVC)标准。HEVC标准化基于称作HEVC测试模型(HM)的视频解码装置的演进模型。H.265的最新标准文档可从http://www.itu.int/rec/T-REC-H.265获得,最新版本的标准文档为H.265(12/16),该标准文档以全文引用的方式并入本文中。HM假设视频解码装置相对于ITU-TH.264/AVC的现有算法具有若干额外能力。例如,H.264提供9种帧内预测编码模式,而HM可提供多达35种帧内预测编码模式。
JVET致力于开发H.266标准。H.266标准化的过程基于称作H.266测试模型的视频解码装置的演进模型。H.266的算法描述可从http://phenix.int-evry.fr/jvet获得,其中最新的算法描述包含于JVET-F1001-v2中,该算法描述文档以全文引用的方式并入本文中。同时,可从https://jvet.hhi.fraunhofer.de/svn/svn_HMJEMSoftware/获得JEM测试模型的参考软件,同样以全文引用的方式并入本文中。
一般来说,HM的工作模型描述可将视频帧或图像划分成包含亮度及色度样本两者的树块或最大编码单元(largest coding unit,LCU)的序列,LCU也被称为CTU。树块具有与H.264标准的宏块类似的目的。条带包含按解码次序的数个连续树块。可将视频帧或图像分割成一个或多个条带。可根据四叉树将每一树块分裂成编码单元。例如,可将作为四叉树的根节点的树块分裂成四个子节点,且每一子节点可又为母节点且被分裂成另外四个子节点。作为四叉树的叶节点的最终不可分裂的子节点包括解码节点,例如,经解码视频块。与经解码码流相关联的语法数据可定义树块可分裂的最大次数,且也可定义解码节点的最小大小。
编码单元包含解码节点及预测单元(predict ion unit,PU)以及与解码节点相关联的变换单元(transform unit,TU)。CU的大小对应于解码节点的大小且形状必须为正方形。CU的大小的范围可为8×8像素直到最大64×64像素或更大的树块的大小。每一CU可含有一个或多个PU及一个或多个TU。例如,与CU相关联的语法数据可描述将CU分割成一个或多个PU的情形。分割模式在CU是被跳过或经直接模式编码、帧内预测模式编码或帧间预测模式编码的情形之间可为不同的。PU可经分割成形状为非正方形。例如,与CU相关联的语法数据也可描述根据四叉树将CU分割成一个或多个TU的情形。TU的形状可为正方形或非正方形。
HEVC标准允许根据TU进行变换,TU对于不同CU来说可为不同的。TU通常基于针对经分割LCU定义的给定CU内的PU的大小而设定大小,但情况可能并非总是如此。TU的大小通常与PU相同或小于PU。在一些可行的实施方式中,可使用称作“残差四叉树”(res idualqualtree,RQT)的四叉树结构将对应于CU的残差样本再分成较小单元。RQT的叶节点可被称作TU。可变换与TU相关联的像素差值以产生变换系数,变换系数可被量化。
一般来说,PU包含与预测过程有关的数据。例如,在PU经帧内模式编码时,PU可包含描述PU的帧内预测模式的数据。作为另一可行的实施方式,在PU经帧间模式编码时,PU可包含界定PU的运动矢量的数据。例如,界定PU的运动矢量的数据可描述运动矢量的水平分量、运动矢量的垂直分量、运动矢量的分辨率(例如,四分之一像素精确度或八分之一像素精确度)、运动矢量所指向的参考图像,和/或运动矢量的参考图像列表(例如,列表0、列表1或列表C)。
一般来说,TU使用变换及量化过程。具有一个或多个PU的给定CU也可包含一个或多个TU。在预测之后,视频编码器20可计算对应于PU的残差值。残差值包括像素差值,像素差值可变换成变换系数、经量化且使用TU扫描以产生串行化变换系数以用于熵解码。本申请通常使用术语“视频块”来指CU的解码节点。在一些特定应用中,本申请也可使用术语“视频块”来指包含解码节点以及PU及TU的树块,例如,LCU或CU。
视频序列通常包含一系列视频帧或图像。图像群组(group of picture,GOP)示例性地包括一系列、一个或多个视频图像。GOP可在GOP的头信息中、图像中的一者或多者的头信息中或在别处包含语法数据,语法数据描述包含于GOP中的图像的数目。图像的每一条带可包含描述相应图像的编码模式的条带语法数据。视频编码器20通常对个别视频条带内的视频块进行操作以便编码视频数据。视频块可对应于CU内的解码节点。视频块可具有固定或变化的大小,且可根据指定解码标准而在大小上不同。
作为一种可行的实施方式,HM支持各种PU大小的预测。假定特定CU的大小为2N×2N,HM支持2N×2N或N×N的PU大小的帧内预测,及2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。HM也支持2N×nU、2N×nD、nL×2N及nR×2N的PU大小的帧间预测的不对称分割。在不对称分割中,CU的一方向未分割,而另一方向分割成25%及75%。对应于25%区段的CU的部分由“n”后跟着“上(Up)”、“下(Down)”、“左(Left)”或“右(Right)”的指示来指示。因此,例如,“2N×nU”指水平分割的2N×2NCU,其中2N×0.5NPU在上部且2N×1.5NPU在底部。
在本申请中,“N×N”与“N乘N”可互换使用以指依照垂直维度及水平维度的视频块的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样地,N×N块一股在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。可将块中的像素排列成行及列。此外,块未必需要在水平方向上与在垂直方向上具有相同数目个像素。例如,块可包括N×M个像素,其中M未必等于N。
在使用CU的PU的帧内预测性或帧间预测性解码之后,视频编码器20可计算CU的TU的残差数据。PU可包括空间域(也称作像素域)中的像素数据,且TU可包括在将变换(例如,离散余弦变换(discrete cos ine transform,DCT)、整数变换、小波变换或概念上类似的变换)应用于残差视频数据之后变换域中的系数。残差数据可对应于未经编码图像的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含CU的残差数据的TU,且接着变换TU以产生CU的变换系数。
在任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化示例性地指对系数进行量化以可能减少用以表示系数的数据的量从而提供进一步压缩的过程。量化过程可减少与系数中的一些或全部相关联的位深度。例如,可在量化期间将n位值降值舍位到m位值,其中n大于m。
JEM模型对视频图像的编码结构进行了进一步的改进,具体的,被称为“四叉树结合二叉树”(QTBT)的块编码结构被引入进来。QTBT结构摒弃了HEVC中的CU,PU,TU等概念,支持更灵活的CU划分形状,一个CU可以正方形,也可以是长方形。一个CTU首先进行四叉树划分,该四叉树的叶节点进一步进行二叉树划分。同时,在二叉树划分中存在两种划分模式,对称水平分割和对称竖直分割。二叉树的叶节点被称为CU,JEM的CU在预测和变换的过程中都不可以被进一步划分,也就是说JEM的CU,PU,TU具有相同的块大小。在现阶段的JEM中,CTU的最大尺寸为256×256亮度像素。
在一些可行的实施方式中,视频编码器20可利用预定义扫描次序来扫描经量化变换系数以产生可经熵编码的串行化向量。在其它可行的实施方式中,视频编码器20可执行自适应性扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可根据上下文自适应性可变长度解码(CAVLC)、上下文自适应性二进制算术解码(CABAC)、基于语法的上下文自适应性二进制算术解码(SBAC)、概率区间分割熵(PIPE)解码或其他熵解码方法来熵解码一维向量。视频编码器20也可熵编码与经编码视频数据相关联的语法元素以供视频解码器30用于解码视频数据。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待传输的符号。上下文可与符号的相邻值是否为非零有关。为了执行CAVLC,视频编码器20可选择待传输的符号的可变长度码。可变长度解码(VLC)中的码字可经构建以使得相对较短码对应于可能性较大的符号,而较长码对应于可能性较小的符号。以这个方式,VLC的使用可相对于针对待传输的每一符号使用相等长度码字达成节省码率的目的。基于指派给符号的上下文可以确定CABAC中的概率。
在本申请实施例中,视频编码器可执行帧间预测以减少图像之间的时间冗余。如前文所描述,根据不同视频压缩编解码标准的规定,CU可具有一个或多个预测单元PU。换句话说,多个PU可属于CU,或者PU和CU的尺寸相同。在本文中当CU和PU尺寸相同时,CU的分割模式为不分割,或者即为分割为一个PU,且统一使用PU进行表述。当视频编码器执行帧间预测时,视频编码器可用信号通知视频解码器用于PU的运动信息。示例性的,PU的运动信息可以包括:参考图像索引、运动矢量和预测方向标识。运动矢量可指示PU的图像块(也称视频块、像素块、像素集合等)与PU的参考块之间的位移。PU的参考块可为类似于PU的图像块的参考图像的一部分。参考块可定位于由参考图像索引和预测方向标识指示的参考图像中。
为了减少表示PU的运动信息所需要的编码比特的数目,视频编码器可根据合并预测模式或高级运动矢量预测模式过程产生用于PU中的每一者的候选运动信息列表(后文简称为候选者列表)。用于PU的候选者列表中的每一候选者可表示一组运动信息。运动信息可包括运动矢量MV和参考图像指示信息。当然,运动信息也可以只包含两者之一或者全部包含,例如在编解码端共同约定参考图像的情况下,运动信息可以仅包含运动矢量。由候选列表中的一些候选者表示的运动信息可基于其它PU的运动信息。如果候选者表示指定空间候选者位置(spatial candidate positions)或时间候选者位置(temporal candidatepositions)中的一者的运动信息,则本申请可将所述候选者称作“原始”候选运动信息。举例来说,对于合并模式,在本文中也称为合并预测模式,可存在五个原始空间候选者位置和一个原始时间候选者位置。在一些实例中,视频编码器还可以通过一些手段来产生附加或额外候选运动信息,例如插入零运动矢量作为候选运动信息来产生额外候选运动信息。这些额外候选运动信息不被视为原始候选运动信息且在本申请中可称作后期或人工产生的候选运动信息。
本申请的技术一般涉及用于在视频编码器处产生候选者列表的技术和用于在视频解码器处产生相同候选者列表的技术。视频编码器和视频解码器可通过实施用于构建候选者列表的相同技术来产生相同候选者列表。举例来说,视频编码器和视频解码器两者可构建具有相同数目的候选者(例如,五个候选者)的列表。视频编码器和解码器可首先考虑空间候选者(例如,同一图像中的相邻块),接着考虑时间候选者(例如,不同图像中的候选者),且最后可考虑人工产生的候选者直到将所要数目的候选者添加到列表为止。根据本申请的技术,可在候选列表构建期间针对某些类型的候选运动信息利用修剪操作以便从候选列表移除重复,而对于其它类型的候选者,可能不使用修剪以便减小解码器复杂性。举例来说,对于空间候选者集合和对于时间候选者,可执行修剪操作以从候选者的列表排除具有重复运动信息的候选者。
在产生用于CU的PU的候选列表之后,视频编码器可从候选列表选择候选运动信息且在码流中输出表示所选择的候选运动信息的索引标识。选择的候选运动信息可为具有产生最紧密地匹配正被解码的PU的预测块的运动信息。前述索引标识可指示在候选列表中所选择的候选运动信息的位置。视频编码器还可基于由PU的运动信息指示的参考块产生用于PU的预测块。可基于由选择的候选运动信息确定PU的运动信息。举例来说,在合并模式中,确定选择的候选运动信息即为PU的运动信息。在AMVP模式中,PU的运动信息可基于PU的运动矢量差和选择的候选运动信息确定。视频编码器可基于CU的PU的预测性图像块(简称为预测块)和用于CU的原始图像块产生用于CU的一个或多个残差图像块(简称为残差块)。视频编码器可接着编码一个或多个残差块且输出码流。
码流可包括用于识别PU的候选列表中的选定候选运动信息的数据。视频解码器可基于由PU的候选列表中的选定候选运动信息确定PU的运动信息。视频解码器可基于PU的运动信息识别用于PU的一或多个参考块。在识别PU的一或多个参考块之后,视频解码器可基于PU的一或多个参考块产生用于PU的预测块。视频解码器可基于用于CU的PU的预测块和用于CU的一个或多个残差块来重构用于CU的图像块。
为了易于解释,本申请可将位置或图像块描述为与CU或PU具有各种空间关系。此描述可解释为是指位置或图像块和与CU或PU相关联的图像块具有各种空间关系。此外,本申请可将视频解码器当前在解码的PU称作当前PU,也称为当前待处理图像块。本申请可将视频解码器当前在解码的CU称作当前CU。本申请可将视频解码器当前在解码的图像称作当前图像。应理解,本申请同时适用于PU和CU具有相同尺寸,或者PU即为CU的情况,统一使用PU来表示。
如前文简短地描述,视频编码器20可使用帧间预测以产生用于CU的PU的预测块和运动信息。在一些例子中,PU的运动信息可能与一个或多个邻近PU(即,其图像块在空间上或时间上在该PU的图像块附近的PU)的运动信息相同或类似。因为邻近PU经常具有类似运动信息,所以视频编码器20可参考邻近PU的运动信息来编码该PU的运动信息。参考邻近PU的运动信息来编码该PU的运动信息可减少码流中指示该PU的运动信息所需要的编码比特的数目。
视频编码器20可以各种方式参考邻近PU的运动信息来编码该PU的运动信息。举例来说,视频编码器20可指示该PU的运动信息与附近PU的运动信息相同。本申请可使用合并模式来指代指示该PU的运动信息与邻近PU的运动信息相同或可从邻近PU的运动信息导出。在另一可行的实施方式中,视频编码器20可计算用于该PU的运动矢量差(Mot ion VectorDifference,MVD)。MVD指示该PU的运动矢量与邻近PU的运动矢量之间的差。视频编码器20可将MVD而非该PU的运动矢量包括于该PU的运动信息中。在码流中表示MVD比表示该PU的运动矢量所需要的编码比特少。本申请可使用高级运动矢量预测模式指代通过使用MVD和识别候选者(即候选运动信息)的索引值来通知解码端该PU的运动信息。
为了使用合并模式或AMVP模式以信号通知解码端该PU的运动信息,视频编码器20可产生用于该PU的候选列表。候选列表可包括一或多个候选者(即一组或多组候选运动信息)。用于该PU的候选列表中的每一个候选者表示一组运动信息。一组运动信息可包括运动矢量、参考图像列表和与参考图像列表对应的参考图像索引。
在产生用于PU的候选列表之后,视频编码器20可从用于PU的候选列表中选择多个候选者中的一者。举例来说,视频编码器可比较每一候选者与正被解码的PU且可选择具有所要求的码率-失真代价的候选者。视频编码器20可输出用于PU的候选者索引。候选者索引可识别选定的候选者在候选列表中的位置。
此外,视频编码器20可基于由PU的运动信息指示的参考块产生用于PU的预测块。可基于由用于PU的候选列表中的选定的候选运动信息确定PU的运动信息。
当视频解码器30接收到码流时,视频解码器30可产生用于CU的PU中的每一者的候选列表。由视频解码器30针对PU产生的候选列表可与由视频编码器20针对PU产生的候选列表相同。从码流中解析得到的语法元素可指示在PU的候选列表中选择的候选运动信息的位置。在产生用于PU的候选列表之后,视频解码器30可基于由PU的运动信息指示的一或多个参考块产生用于PU的预测块。视频解码器30可基于在用于PU的候选列表中选择的候选运动信息确定PU的运动信息。视频解码器30可基于用于PU的预测块和用于CU的残差块重构用于CU的图像块。
应当理解,在一种可行的实施方式中,在解码端,候选列表的构建与从码流中解析选择的候选者在候选列表中的位置是相互独立,可以任意先后或者并行进行的。
在另一种可行的实施方式中,在解码端,首先从码流中解析选定的候选者在候选列表中的位置,根据解析出来的位置构建候选列表,在该实施方式中,不需要构建全部的候选列表,只需要构建到该解析出来的位置处的候选列表,即能够确定该位置处的候选者即可。举例来说,当解析码流得出选定的候选者为候选列表中索引标识为3的候选者时,仅需要构建从索引为0到索引为3的候选列表,即可确定索引标识为3的候选者,可以达到减小复杂度,提高解码效率的技术效果。
图2为本申请实施例中视频编码器20的一种示意性框图。视频编码器20可执行视频条带内的视频块的帧内解码和帧间解码。帧内解码依赖于空间预测来减少或去除给定视频帧或图像内的视频的空间冗余。帧间解码依赖于时间预测来减少或去除视频序列的邻近帧或图像内的视频的时间冗余。帧内模式(I模式)可指若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指若干基于时间的压缩模式中的任一者。
在图2的可行的实施方式中,视频编码器20包含分割单元35、预测单元41、参考图像存储器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。预测单元41包含帧间预测单元(未示意)和帧内预测单元46。帧间预测单元可以包括运动估计单元42和运动补偿单元44。对于视频块重构建,视频编码器20也可包含反量化单元58、反变换单元60和求和器(亦称为重建器)62。也可包含解块滤波器(图2中未展示)以对块边界进行滤波从而从经重构建视频中去除块效应伪影。在需要时,解块滤波器将通常对求和器62的输出进行滤波。除了解块滤波器之外,也可使用额外环路滤波器(环路内或环路后)。
如图2中所展示,视频编码器20接收视频数据,且分割单元35将数据分割成视频块。此分割也可包含分割成条带、图像块或其它较大单元,以及(例如)根据LCU及CU的四叉树结构进行视频块分割。视频编码器20示例性地说明编码在待编码的视频条带内的视频块的组件。一般来说,条带可划分成多个视频块(且可能划分成称作图像块的视频块的集合)。
预测单元41可基于编码质量与代价计算结果(例如,码率-失真代价,RDcost)选择当前视频块的多个可能解码模式中的一者,例如多个帧内解码模式中的一者或多个帧间解码模式中的一者。预测单元41可将所得经帧内解码或经帧间解码块提供到求和器50以产生残差块数据且将所得经帧内解码或经帧间解码块提供到求和器62以重构建经编码块从而用作参考图像。
预测单元41内的帧间预测单元(例如运动估计单元42及运动补偿单元44)执行相对于一个或多个参考图像中的一个或多个预测块的当前视频块的帧间预测性解码以提供时间压缩。运动估计单元42用于根据视频序列的预定模式确定视频条带的帧间预测模式。预定模式可将序列中的视频条带指定为P条带、B条带或GPB条带。运动估计单元42及运动补偿单元44可高度集成,这里为方便理解概念而分别说明。通过运动估计单元42所执行的运动估计以产生估计视频块(亦称为图像块)的运动矢量的过程。例如,运动矢量可指示当前视频帧或图像内的视频块的PU相对于参考图像内的预测块的位移。
预测块为依据像素差而被发现为紧密匹配待解码的视频块的PU的块,像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差度量确定。在一些可行的实施方式中,视频编码器20可计算存储于参考图像存储器64中的参考图像的子整数(sub-integer)像素位置的值。例如,视频编码器20可内插参考图像的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置及分数像素位置的运动搜索且输出具有分数像素精确度的运动矢量。
运动估计单元42通过比较PU的位置与参考图像的预测块的位置而计算经帧间解码条带中的视频块的PU的运动矢量。可从第一参考图像列表(列表0)或第二参考图像列表(列表1)选择参考图像,列表中的每一者识别存储于参考图像存储器64中的一个或多个参考图像。运动估计单元42将经计算运动矢量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计所确定的运动矢量提取或产生预测块。在接收当前视频块的PU的运动矢量后,运动补偿单元44即可在参考图像列表中的一者中定位运动矢量所指向的预测块。视频编码器20通过从正解码的当前视频块的像素值减去预测块的像素值来形成残差视频块,从而形成像素差值。像素差值形成块的残差数据,且可包含亮度及色度差分量两者。求和器50表示执行此减法运算的一个或多个组件。运动补偿单元44也可产生与视频块及视频条带相关联的语法元素以供视频解码器30用于解码视频条带的视频块。
如果PU位于B条带中,则含有PU的图像可与称作“列表0”和“列表1”的两个参考图像列表相关联。在一些可行的实施方式中,含有B条带的图像可与为列表0和列表1的组合的列表组合相关联。
此外,如果PU位于B条带中,则运动估计单元42可针对PU执行单向预测或双向预测,其中,在一些可行的实施方式中,双向预测为分别基于列表0和列表1的参考图像列表的图像进行的预测,在另一些可行的实施方式中,双向预测为分别基于当前帧在显示顺序上的已重建的未来帧和已重建的过去帧进行的预测。当运动估计单元42针对PU执行单向预测时,运动估计单元42可在列表0或列表1的参考图像中搜索用于PU的参考块。运动估计单元42可接着产生指示列表0或列表1中的含有参考块的参考图像的参考帧索引和指示PU与参考块之间的空间位移的运动矢量。运动估计单元42可输出参考帧索引、预测方向标识和运动矢量作为PU的运动信息。预测方向标识可指示参考帧索引指示列表0或列表1中的参考图像。例如预测方向标识1指示列表list0,预测方向标识2指示列表list1,预测方向标识3指示双向预测,即list0和list1。运动补偿单元44可基于由PU的运动信息指示的参考块产生PU的预测性图像块。
当运动估计单元42针对PU执行双向预测时,运动估计单元42可在列表0中的参考图像中搜索用于PU的参考块且还可在列表1中的参考图像中搜索用于PU的另一参考块。运动估计单元42可接着产生指示列表0和列表1中的含有参考块的参考图像的参考索引和指示参考块与PU之间的空间位移的运动矢量。运动估计单元42可输出PU的参考索引和运动矢量作为PU的运动信息。运动补偿单元44可基于由PU的运动信息指示的参考块产生PU的预测性图像块。
在一些可行的实施方式中,运动估计单元42不向熵编码模块56输出用于PU的运动信息的完整集合。而是,运动估计单元42可参考另一PU的运动信息来用信号通知PU的运动信息。举例来说,运动估计单元42可确定PU的运动信息充分类似于相邻PU的运动信息。在此实施方式中,运动估计单元42可在与PU相关联的语法结构中指示一个指示值,所述指示值向视频解码器30指示PU具有与相邻PU相同的运动信息或具有可从相邻PU导出的运动信息。在另一实施方式中,运动估计单元42可在与PU相关联的语法结构中识别与相邻PU相关联的候选者和运动矢量差(MVD)。MVD指示PU的运动矢量和与相邻PU相关联的所指示候选者之间的差。视频解码器30可使用所指示候选者和MVD来确定PU的运动矢量。
如前文所描述,预测单元41可产生用于CU的每一PU的候选者列表。候选者列表中的一或多者可包括一组或多组原始候选运动信息和从原始候选运动信息导出的一组或多组附加候选运动信息。
预测单元41内的帧内预测单元46可执行相对于在与待解码的当前块相同的图像或条带中的一个或多个相邻块的当前视频块的帧内预测性解码以提供空间压缩。因此,作为通过运动估计单元42及运动补偿单元44执行的帧间预测(如前文所描述)的替代,帧内预测单元46可帧内预测当前块。具体地说,帧内预测单元46可确定用以编码当前块的帧内预测模式。在一些可行的实施方式中,帧内预测单元46可(例如)在单独编码遍历期间使用各种帧内预测模式来编码当前块,且帧内预测单元46(或在一些可行的实施方式中,模式选择单元40)可从经测试模式选择使用的适当帧内预测模式。
在预测单元41经由帧间预测或帧内预测产生当前视频块的预测块之后,视频编码器20通过从当前视频块减去预测块而形成残差视频块。残差块中的残差视频数据可包含于一个或多个TU中且应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上类似的变换的变换(例如,离散正弦变换DST)将残差视频数据变换成残差变换系数。变换处理单元52可将残差视频数据从像素域转换到变换域(例如,频域)。
变换处理单元52可将所得变换系数发送到量化单元54。量化单元54对变换系数进行量化以进一步减小码率。量化过程可减少与系数中的一些或全部相关联的比特深度。可通过调整量化参数来修改量化的程度。在一些可行的实施方式中,量化单元54可接着执行包含经量化变换系数的矩阵的扫描。替代地,熵编码单元56可执行扫描。
在量化之后,熵编码单元56可熵编码经量化变换系数。例如,熵编码单元56可执行上下文自适应性可变长度解码(CAVLC)、上下文自适应性二进制算术解码(CABAC)、基于语法的上下文自适应性二进制算术解码(SBAC)、概率区间分割熵(PIPE)解码或另一熵编码方法或技术。熵编码单元56也可熵编码正经解码的当前视频条带的运动矢量及其它语法元素。在通过熵编码单元56进行熵编码之后,可将经编码码流传输到视频解码器30或存档以供稍后传输或由视频解码器30检索。
熵编码单元56可编码根据本申请的技术指示选定帧内预测模式的信息。视频编码器20可在可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也称作码字映射表)的所传输码流配置数据中包含各种块的编码上下文的定义及用于上下文中的每一者的MPM、帧内预测模式索引表和经修改帧内预测模式索引表的指示。
反量化单元58及反变换单元60分别应用反量化及反变换,以在像素域中重构建残差块以供稍后用作参考图像的参考块。运动补偿单元44可通过将残差块与参考图像列表中的一者内的参考图像中的一者的预测块相加来计算重建块。运动补偿单元44也可将一个或多个内插滤波器应用于经重构建残差块以计算子整数像素值以用于运动估计。求和器62将经重构建残差块与通过运动补偿单元44所产生的经运动补偿的预测块相加以产生重建块,所述重建块作为参考块以供存储于参考图像存储器64中。参考块可由运动估计单元42及运动补偿单元44用作参考块以帧间预测后续视频帧或图像中的块。
应当理解的是,视频编码器20的其它的结构变化可用于编码视频流。例如,对于某些图像块或者图像帧,视频编码器20可以直接地量化残差信号而不需要经变换单元52处理,相应地也不需要经反变换单元60处理;或者,对于某些图像块或者图像帧,视频编码器20没有产生残差数据,相应地不需要经变换单元52、量化单元54、反量化单元58和反变换单元60处理;或者,视频编码器20中量化单元54和反量化单元58可以合并在一起。
图3为本申请实施例中视频解码器30的一种示意性框图。在图3的可行的实施方式中,视频解码器30包含熵编码单元80、预测单元81、反量化单元86、反变换单元88、求和器90(即重建器)和参考图像存储器92。一种变型下,参考图像存储器92亦可以设置在视频解码器30之外。预测单元81包括帧间预测单元(未示意)和帧内预测单元84。帧间预测单元例如可以是运动补偿单元82。在一些可行的实施方式中,视频解码器30可执行与关于来自图4的视频编码器20描述的编码流程的示例性地互逆的解码流程。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频条带的视频块及相关联的语法元素的经编码视频码流。视频解码器30的熵编码单元80熵解码码流以产生经量化系数、运动矢量及其它语法元素。熵编码单元80将运动矢量及其它语法元素转递到预测单元81。视频解码器30可在视频条带层级和/或视频块层级处接收语法元素。
在视频条带经解码为经帧内解码(I)条带时,预测单元81的帧内预测单元84可基于用信号发送的帧内预测模式及来自当前帧或图像的先前经解码块的数据而产生当前视频条带的视频块的预测数据。
在视频图像经解码为经帧间解码(例如,B、P或GPB)条带时,预测单元81的运动补偿单元82基于从熵编码单元80所接收的运动矢量及其它语法元素而产生当前视频图像的视频块的预测块。预测块可从参考图像列表中的一者内的参考图像中的一者产生。视频解码器30可基于存储于参考图像存储器92中的参考图像使用默认构建技术来构建参考图像列表(列表0及列表1)。
运动补偿单元82通过解析运动矢量及其它语法元素来确定当前视频条带的视频块的预测信息,且使用预测信息来产生正经解码的当前视频块的预测块。例如,运动补偿单元82使用所接收的语法元素中的一些来确定用以解码视频条带的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测条带类型(例如,B条带、P条带或GPB条带)、条带的参考图像列表中的一者或多者的构建信息、条带的每一经帧间编码视频块的运动矢量、条带的每一经帧间解码视频块的帧间预测状态及用以解码当前视频条带中的视频块的其它信息。
运动补偿单元82也可基于内插滤波器执行内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的子整数像素的内插值。在此应用中,运动补偿单元82可从所接收的语法元素确定由视频编码器20使用的内插滤波器且使用内插滤波器来产生预测块。
如果PU是使用帧间预测而编码,则运动补偿单元82可产生用于PU的候选者列表。码流中可包括识别选定候选者在PU的候选者列表中的位置的数据。在产生用于PU的候选者列表之后,运动补偿单元82可基于由PU的运动信息指示的一或多个参考块产生用于PU的预测性图像块。PU的参考块可在与所述PU不同的时间图像中。运动补偿单元82可基于由PU的候选者列表中的选定的运动信息确定PU的运动信息。
反量化单元86对码流中所提供且通过熵编码单元80所解码的经量化变换系数进行反量化(例如,解量化)。反量化过程可包含使用通过视频编码器20针对视频条带中的每一视频块所计算的量化参数确定量化的程度,且同样地确定应应用的反量化的程度。反变换单元88将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数以便在像素域中产生残差块。
在运动补偿单元82基于运动矢量及其它语法元素产生当前视频块的预测块之后,视频解码器30通过将来自反变换单元88的残差块与通过运动补偿单元82产生的对应预测块求和来形成经解码视频块。求和器90(即重建器)表示执行此求和运算的一个或多个组件。在需要时,也可应用解块滤波器来对经解码块进行滤波以便去除块效应伪影。其它环路滤波器(在解码环路中或在解码环路之后)也可用以使像素转变平滑,或以其它方式改进视频质量。给定帧或图像中的经解码视频块接着存储于参考图像存储器92中,参考图像存储器92存储供后续运动补偿所使用的参考图像。参考图像存储器92也存储供稍后呈现于例如图1的显示装置32的显示装置上的经解码视频。
如前文所注明,本申请的技术示例性地涉及帧间解码。应理解,本申请的技术可通过本申请中所描述的视频解码器中的任一者进行,视频解码器包含(例如)如关于图1到3所展示及描述的视频编码器20及视频解码器30。即,在一种可行的实施方式中,关于图2所描述的预测单元41可在视频数据的块的编码期间在执行帧间预测时执行下文中所描述的特定技术。在另一可行的实施方式中,关于图3所描述的预测单元81可在视频数据的块的解码期间在执行帧间预测时执行下文中所描述的特定技术。因此,对一般性“视频编码器”或“视频解码器”的引用可包含视频编码器20、视频解码器30或另一视频编码或编码单元。
应当理解的是,视频解码器30的其它结构变化可用于解码经编码视频位流。例如,对于某些图像块或者图像帧,视频解码器30的熵解码单元80没有解码出经量化的系数,相应地不需要经反量化单元86和反变换单元88处理。
图4A为本申请实施例中合成(Merge)模式的一种示例性流程图。视频编码器(例如视频编码器20)可执行合并操作200。在其它可行的实施方式中,视频编码器可执行不同于合并操作200的合并操作。举例来说,在其它可行的实施方式中,视频编码器可执行合并操作,其中视频编码器执行比合并操作200多、少的步骤或与合并操作200不同的步骤。在其它可行的实施方式中,视频编码器可以不同次序或并行地执行合并操作200的步骤。编码器还可对以跳跃(skip)模式编码的PU执行合并操作200。
在视频编码器开始合并操作200之后,视频编码器可产生用于当前PU的候选者列表(202)。视频编码器可以各种方式产生用于当前PU的候选者列表。举例来说,视频编码器可根据下文关于图7到图13描述的实例技术中的一者产生用于当前PU的候选者列表。
如前文所述,用于当前PU的候选者列表可包括时间候选运动信息(简称时间候选者)。时间候选运动信息可指示时域对应(co-located)的PU的运动信息。co-located的PU可在空间上与当前PU处于图像帧中的同一个位置,但在参考图像而非当前图像中。本申请可将包括时域对应的PU的参考图像称作相关参考图像。本申请可将相关参考图像的参考图像索引称作相关参考图像索引。如前文所描述,当前图像可与一个或多个参考图像列表(例如,列表0、列表1等)相关联。参考图像索引可通过指示参考图像在某一个参考图像列表中的位置来指示参考图像。在一些可行的实施方式中,当前图像可与组合参考图像列表相关联。
在一些视频编码器中,相关参考图像索引为涵盖与当前PU相关联的参考索引源位置的PU的参考图像索引。在这些视频编码器中,与当前PU相关联的参考索引源位置邻接于当前PU左方或邻接于当前PU上方。在本申请中,如果与PU相关联的图像块包括特定位置,则PU可“涵盖”所述特定位置。
然而,可存在以下例子:与当前PU相关联的参考索引源位置在当前CU内。在这些例子中,如果PU在当前CU上方或左方,则涵盖与当前PU相关联的参考索引源位置的PU可被视为可用。然而,视频编码器可需要存取当前CU的另一PU的运动信息以便确定含有co-located PU的参考图像。因此,这些视频编码器可使用属于当前CU的PU的运动信息(即,参考图像索引)以产生用于当前PU的时间候选者。换句话说,这些视频编码器可使用属于当前CU的PU的运动信息产生时间候选者。因此,视频编码器不能并行地产生用于当前PU和涵盖与当前PU相关联的参考索引源位置的PU的候选者列表。
根据本申请的技术,视频编码器可在不参考任何其它PU的参考图像索引的情况下显式地设定相关参考图像索引。此可使得视频编码器能够并行地产生用于当前PU和当前CU的其它PU的候选者列表。因为视频编码器显式地设定相关参考图像索引,所以相关参考图像索引不基于当前CU的任何其它PU的运动信息。在视频编码器显式地设定相关参考图像索引的一些可行的实施方式中,视频编码器可始终将相关参考图像索引设定为固定的预定义预设参考图像索引(例如0)。以此方式,视频编码器可基于由预设参考图像索引指示的参考帧中的co-located PU的运动信息产生时间候选者,且可将时间候选者包括于当前CU的候选者列表中。
在视频编码器显式地设定相关参考图像索引的可行的实施方式中,视频编码器可显式地在语法结构(例如图像标头、条带标头、APS或另一语法结构)中用信号通知相关参考图像索引。在此可行的实施方式中,视频编码器可用信号通知解码端用于每一LCU(即CTU)、CU、PU、TU或其它类型的子块的相关参考图像索引。举例来说,视频编码器可用信号通知:用于CU的每一PU的相关参考图像索引等于“1”。
在一些可行的实施方式中,相关参考图像索引可经隐式地而非显式地设定。在这些可行的实施方式中,视频编码器可使用由涵盖当前CU外部的位置的PU的参考图像索引指示的参考图像中的PU的运动信息产生用于当前CU的PU的候选者列表中的每一时间候选者,即使这些位置并不严格地邻近当前PU。
在产生用于当前PU的候选者列表之后,视频编码器可产生与候选者列表中的候选者相关联的预测性图像块(204)。视频编码器可通过基于所指示候选者的运动信息确定当前PU的运动信息和接着基于由当前PU的运动信息指示的一个或多个参考块产生预测性图像块来产生与候选者相关联的预测性图像块。视频编码器可从候选者列表选择候选者中的一者(206)。视频编码器可以各种方式选择候选者。举例来说,视频编码器可基于对与候选者相关联的预测性图像块的每一者的码率-失真代价分析来选择候选者中的一者。
在选择候选者之后,视频编码器可输出候选者的索引(208)。该索引可指示选定候选者在候选者列表中的位置。在一些可行的实施方式中,该索引可表示为“merge_idx”。
图4B为本申请实施例中高级运动矢量预测(AMVP)模式的一种示例性流程图。视频编码器(例如视频编码器20)可执行AMVP操作210。
在视频编码器开始AMVP操作210之后,视频编码器可产生用于当前PU的一个或多个运动矢量(211)。视频编码器可执行整数运动估计和分数运动估计以产生用于当前PU的运动矢量。如前文所描述,当前图像可与两个参考图像列表(列表0和列表1)相关联。如果当前PU经单向预测,则视频编码器可产生用于当前PU的列表0运动矢量或列表1运动矢量。列表0运动矢量可指示当前PU的图像块与列表0中的参考图像中的参考块之间的空间位移。列表1运动矢量可指示当前PU的图像块与列表1中的参考图像中的参考块之间的空间位移。如果当前PU经双向预测,则视频编码器可产生用于当前PU的列表0运动矢量和列表1运动矢量。
在产生用于当前PU的一个或多个运动矢量之后,视频编码器可产生用于当前PU的预测性图像块(简称为预测块)(212)。视频编码器可基于由用于当前PU的一个或多个运动矢量指示的一个或多个参考块产生用于当前PU的预测性图像块。
另外,视频编码器可产生用于当前PU的候选列表(213)。视频解码器可以各种方式产生用于当前PU的候选预测运动矢量列表。举例来说,视频编码器可根据下文关于图6到图13描述的可行的实施方式中的一个或多个产生用于当前PU的候选列表。在一些可行的实施方式中,当视频编码器在AMVP操作210中产生候选列表时,候选预测运动矢量列表可包括两个或三个候选预测运动矢量。相比而言,当视频编码器在合并操作中产生候选预测运动矢量列表时,候选预测运动矢量列表可包括更多候选预测运动矢量(例如,五个或七个候选预测运动矢量)。
在产生用于当前PU的候选列表之后,视频编码器可产生用于候选列表中的每一候选预测运动矢量的一个或多个运动矢量预测残差值(亦称为运动矢量差MVD)(214)。视频编码器可通过确定由候选预测运动矢量指示的运动矢量与当前PU的对应运动矢量之间的差来产生用于候选预测运动矢量的运动矢量差。
如果当前PU经单向预测,则视频编码器可产生用于每一候选预测运动矢量的单一MVD。如果当前PU经双向预测,则视频编码器可产生用于每一候选预测运动矢量的两个MVD。第一MVD可指示候选预测运动矢量的运动矢量与当前PU的列表0运动矢量之间的差。第二MVD可指示候选预测运动矢量的运动矢量与当前PU的列表1运动矢量之间的差。
视频编码器可从候选预测运动矢量列表选择候选预测运动矢量中的一个或多个(215)。视频编码器可以各种方式选择一个或多个候选预测运动矢量。举例来说,视频编码器可选择具有最小误差地匹配待编码的运动矢量的相关联运动矢量的候选预测运动矢量,此可减少表示用于候选预测运动矢量的运动矢量差所需的位数目。
在选择一个或多个候选预测运动矢量之后,视频编码器可输出用于当前PU的一个或多个参考图像索引、一个或多个候选预测运动矢量索引,和用于一个或多个选定候选预测运动矢量的一个或多个运动矢量差(216)。
在当前图像与两个参考图像列表(列表0和列表1)相关联且当前PU经单向预测的例子中,视频编码器可输出用于列表0的参考图像索引(“ref_idx_10”)或用于列表1的参考图像索引(“ref_idx_11”)。视频编码器还可输出指示用于当前PU的列表0运动矢量的选定候选预测运动矢量在候选预测运动矢量列表中的位置的候选预测运动矢量索引(“mvp_10_flag”)。或者,视频编码器可输出指示用于当前PU的列表1运动矢量的选定候选预测运动矢量在候选预测运动矢量列表中的位置的候选预测运动矢量索引(“mvp_11_flag”)。视频编码器还可输出用于当前PU的列表0运动矢量或列表1运动矢量的MVD。
在当前图像与两个参考图像列表(列表0和列表1)相关联且当前PU经双向预测的例子中,视频编码器可输出用于列表0的参考图像索引(“ref_idx_10”)和用于列表1的参考图像索引(“ref_idx_11”)。视频编码器还可输出指示用于当前PU的列表0运动矢量的选定候选预测运动矢量在候选预测运动矢量列表中的位置的候选预测运动矢量索引(“mvp_10_flag”)。另外,视频编码器可输出指示用于当前PU的列表1运动矢量的选定候选预测运动矢量在候选预测运动矢量列表中的位置的候选预测运动矢量索引(“mvp_11_flag”)。视频编码器还可输出用于当前PU的列表0运动矢量的MVD和用于当前PU的列表1运动矢量的MVD。
图5为本申请实施例中由视频解码器(例如视频解码器30)执行的运动补偿的一种示例性流程图。
当视频解码器执行运动补偿操作220时,视频解码器可接收用于当前PU的选定候选者的指示(222)。举例来说,视频解码器可接收指示选定候选者在当前PU的候选者列表内的位置的候选者索引。
如果当前PU的运动信息是使用合成merge模式进行编码且当前PU经双向预测,则视频解码器可接收第一候选者索引和第二候选者索引。第一候选者索引指示用于当前PU的列表0运动矢量的选定候选者在候选者列表中的位置。第二候选者索引指示用于当前PU的列表1运动矢量的选定候选者在候选者列表中的位置。在一些可行的实施方式中,单一语法元素可用以识别两个候选者索引。
另外,视频解码器可产生用于当前PU的候选者列表(224)。视频解码器可以各种方式产生用于当前PU的此候选者列表。举例来说,视频解码器可使用下文参看图6A、图6B到图10描述的技术来产生用于当前PU的候选者列表。当视频解码器产生用于候选者列表的时间候选者时,视频解码器可显式地或隐式地设定识别包括co-located PU的参考图像的参考图像索引,如前文关于图4所描述。
在产生用于当前PU的候选者列表之后,视频解码器可基于由用于当前PU的候选者列表中的一个或多个选定候选者指示的运动信息确定当前PU的运动信息(225)。举例来说,如果当前PU的运动信息是使用合并模式而编码,则当前PU的运动信息可与由选定候选者指示的运动信息相同。如果当前PU的运动信息是使用AMVP模式而编码,则视频解码器可使用由所述或所述选定候选者指示的一个或多个运动矢量和码流中指示的一个或多个MVD来重建当前PU的一个或多个运动矢量。当前PU的参考图像索引和预测方向标识可与所述一个或多个选定候选者的参考图像索引和预测方向标识相同。在确定当前PU的运动信息之后,视频解码器可基于由当前PU的运动信息指示的一个或多个参考块产生用于当前PU的预测性图像块(226)。
图6A为本申请实施例中编码单元(CU)、与其关联的空域邻近图像块以及时域邻近图像块的一种示例性示意图,说明CU600和与CU600相关联的示意性的候选者位置1到10的示意图。候选者位置1到5表示与CU600在同一图像中的空间候选者。候选者位置1定位于CU600左方。候选者位置2定位于CU600上方。候选者位置3定位于CU600右上方。候选者位置4定位于CU600左下方。候选者位置5定位于CU600左上方。候选者位置6到7表示与CU600的co-located块602相关联的时间候选者,其中co-located块为在参考图像(即临近已编码图像)中与CU600具有相同的大小、形状和坐标的图像块。候选者位置6位于co-located块602的右下角。候选者位置7定位于co-located块602右下中间位置,或者或者co-located块602左上中间位置。图6A为用以提供帧间预测模块(例如具体是运动估计单元42或运动补偿单元82)可产生候选者列表的候选者位置的示意性实施方式。图6A的候选者位置1至5为用以提供帧内预测模块可产生候选者列表的候选者位置的示意性实施方式。
需要说明的是,图6A中空间候选者位置和时间候选者位置仅仅是示意,候选者位置包括但不限于此。在一些可行的实施方式中,空间候选者位置示例性的还可以包括与待处理图像块相距预设距离以内,但不与待处理图像块邻接的位置。示例性的,该类位置可以如图6B中的6至27所示。应理解,图6B为本申请实施例中编码单元及与其关联的空域邻近图像块的一种示例性示意图。与所待处理图像块处于同一图像帧且处理所述待处理图像块时已完成重建的不与所述待处理图像块相邻的图像块的位置也属于空间候选者位置的范围内。这里将该类位置称为空域非邻接图像块,应理解的是,所述空间候选者可以取自图6B所示的一个或多个位置。
在一些可行的实施方式中,候选者位置示例性的还可以取自图6C所示的一个或多个位置,例如图6C中示意的视间参考块。
本申请实施例的图像块的运动信息的预测方法,不仅适用于合并预测模式(Merge)和/或高级运动矢量预测模式(advanced mot ion vector predict ion,AMVP),而且也能适用于其它使用空域参考块,时域参考块和/或视间参考块的运动信息对当前图像块的运动信息进行预测的模式,从而提高编解码性能。
图7为本申请实施例中图像块的运动信息的预测方法的一种示例性流程图。该方法用于帧内预测或帧间预测,该方法的执行主体可以是视频编码器(例如视频编码器20)或视频解码器(例如视频解码器30)或具有视频编解码功能的电子设备(例如设备1500),该方法可以包括以下步骤:
S701、确定/构建当前图像块的候选运动信息列表,所述候选运动信息列表包括至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息(亦可称为P组候选预测运动信息)采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;其中,所述P个候选运动信息的加权因子之和为1。
S702、从所述候选运动信息列表中确定目标运动信息;以及,
S703、根据所述目标运动信息预测当前图像块的运动信息。
需要说明的是,本申请实施例中进行加权处理(或者待加权)的P个候选运动信息可以是在先得到的P个原始候选运动信息,或者在先得到的P个非原始候选运动信息,或者原始候选运动信息与非原始候选运动信息一起构成的在先得到的P个候选运动信息,或者,可以是已放入候选运动信息列表中的P个候选运动信息,或者,可以是在放入候选运动信息列表之前的P个候选运动信息,本申请实施例对此不做限定,下面将结合图12来举例说明,这里不再赘述。
在一些可行的实施方式中,所述至少一个组合候选运动信息还包括第二组合候选运动信息,所述第二组合候选运动信息是对M个候选运动信息采用对应的加权因子进行加权得到的,M为大于或等于2的整数,所述M个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述P个候选运动信息中的至少一个候选运动信息与所述M个候选运动信息中的至少一个候选运动信息彼此不同,其中,所述M个候选运动信息的加权因子之和为1。
在一种示例下,如果原始merge候选者的个数为4,则本申请提出的组合候选运动信息(下文称为组合加权merge候选者)有6种组合,这6种组合描述如下:
Merge_idx0[6]={0,0,1,0,1,2};
Merge_idx1[6]={1,2,2,3,3,3};
其中0,1,2,3表示原始merge候选者在候选运动信息列表(candidate list)中的索引号,例如0表示candidate list中处于索引位置0的候选者,相应地,第一种组合为merge索引号0对应的候选运动矢量和merge索引号1对应的候选运动矢量的组合,即一个组合加权merge候选者是对merge索引号0对应的候选运动矢量和merge索引号1对应的候选运动矢量进行加权得到的,第二种组合为merge索引号0对应的候选运动矢量和merge索引号2对应的候选运动矢量的组合,即另一个组合加权预测merge候选者是对对merge索引号0对应的候选运动矢量和merge索引号2对应的候选运动矢量进行加权得到的,另外四个组合加权预测merge候选者这里不再穷举。
在一些可行的实施方式中,所述第一组合候选运动信息包括:所述P个候选运动信息中与第一参考列表对应的P1个候选运动矢量的加权值,和/或,所述P个候选运动信息中与第二参考列表对应的P2个候选运动矢量的加权值,1<P1<=P,1<P2<=P,P1或P2为大于或等于2的整数,其中所述P1或P2个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值,所述P1个候选运动矢量的加权因子之和为1;所述P2个候选运动矢量的加权因子之和为1。
所述第二组合候选运动信息包括:所述M个候选运动信息中与第一参考列表对应的M1个候选运动矢量的加权值,和/或,所述M个候选运动信息中与第二参考列表对应的M2个候选运动矢量的加权值,1<M1<=M,1<M2<=M,M1或M2为大于或等于2的整数,其中所述M1或M2个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述M1个候选运动矢量的加权因子之和为1;所述M2个候选运动矢量的加权因子之和为1。
在一些可行的实施方式中,所述P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识(亦称为第一索引值)小于第二索引标识(亦称为第二索引值),相应地,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。比如,对于上文提到的第一种组合,即merge索引号0和1的组合,对应的merge候选的运动矢量的加权因子(权值)为{2/3,1/3}。如果所述P个候选运动信息中每个候选运动信息的加权因子彼此相同,且所述P个候选运动信息的加权因子之和为1,则前述对P个候选运动信息进行加权以得到第一组合候选运动信息,可以理解为对P个候选运动信息求均值以得到第一组合候选运动信息。
在一些可行的实施方式中,所述M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识小于第四索引标识,相应地,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。如果所述M个候选运动信息中每个候选运动信息的加权因子彼此相同,且所述M个候选运动信息的加权因子之和为1,则前述对M个候选运动信息进行加权以得到第二组合候选运动信息,可以理解为对M个候选运动信息求均值以得到第二组合候选运动信息。
本申请各种实施例中,用于加权处理的P个候选运动信息存在多种形式,例如,所述P个候选运动信息为P个原始候选运动信息;或者,所述P个候选运动信息为(P-X)个原始候选运动信息和X个非原始候选运动信息,X为小于或等于P的正整数。
本申请各种实施例中,用于加权处理的M个候选运动信息存在多种形式,例如,所述M个候选运动信息为M个原始候选运动信息;或者,所述M个候选运动信息为(M-Y)个原始候选运动信息和Y个非原始候选运动信息,Y为小于或等于M的正整数。
本申请各种实施例中,所述原始候选运动信息包括:当前图像块的一个或多个空域参考块的运动信息、当前图像块的一个或多个时域参考块的运动信息和/或当前图像块的一个或多个视间参考块的运动信息;所述非原始候选运动信息包括:经缩放过的候选运动信息,第一组合候选运动信息,第二组合候选运动信息,组合双向预测候选运动信息和/或零运动信息,其中每个经缩放的候选运动信息包括:在第一参考列表下的指向第一目标参考帧的运动矢量,和/或在第二参考列表下的指向第二目标参考帧的运动矢量。
图8A为本申请实施例中将组合候选信息添加到merge模式候选列表的一种示例性示意图。Merge_idx为0、1、2的三个候选者为原始merge候选运动信息,Merge_idx为3、4、5的三个候选者为添加的本申请提出的组合merge候选运动信息(下文称为Combined AverageMerge candidates)。
对于每个参考列表(L0或L1),两个原始merge候选者在某个参考列表下的运动矢量的均值即为Combined Average Merge candidate在该参考列表的运动矢量。如果两个原始Merge候选者在该参考列表下只有一个运动矢量,则该运动矢量即为combined AverageMerge candidate在该参考列表的运动矢量;否则,需要对两个运动矢量求均值。
图8B为本申请实施例中将组合候选信息添加到merge模式候选列表的另一种示例性示意图。Merge_idx为0、1、2的三个候选者为原始merge候选运动信息,Merge_idx为3、4、5的三个候选者为添加的本申请提出的组合merge候选运动信息(下文称为CombinedAverage Merge candidates)。与图8A不同的是,在进行求均值之前,先对某些原有的merge候选者(例如mvL0_A,ref0')在某个参考列表(例如L0)的运动矢量mvL0_A进行缩放处理,以得到指向目标参考帧(例如ref0)的运动矢量(mvL0_A')。
一并参阅图9,经缩放过的候选运动信息是通过如下方法得到的:
确定当前图像块的、与第一参考列表(例如L0)对应的第一目标参考帧(例如ref0)和/或与第二参考列表(例如L1)对应的第二目标参考帧(例如ref1),其中,所述第一目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第一参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第一参考列表的参考帧;或者,所述第二目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第二参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第二参考列表的参考帧;
判断某个候选运动信息(例如图8B中的索引位置为0的候选运动信息)包括的与所述第一参考列表对应的参考图像是否与第一目标参考帧相同,和/或某个候选运动信息包括的与所述第二参考列表对应的参考图像是否与第二目标参考帧相同;
如果该候选运动信息包括的与所述第一参考列表对应的参考图像不同于所述第一目标参考帧,则对该候选运动信息包括的与所述第一参考图像列表对应的运动矢量(例如图8B中的mvL0_A)进行基于时域距离或视点间距离的缩放处理,以得到指向所述第一目标参考帧的运动矢量(例如图8B中的mvL0_A');和/或,
如果该候选运动信息包括的与所述第二参考列表对应的参考图像不同于所述第二目标参考帧,则对该候选运动信息包括的与所述第二参考图像列表对应的运动矢量(例如图8B中mvL1_A)进行基于时域距离或视点间距离的缩放处理,以得到指向所述第二目标参考帧的运动矢量(例如图8BmvL1_A');从而得到的经缩放过的候选运动信息(例如图8B中的mvL0_A',ref0;mvL1_A',ref1)。
这里提到的候选运动信息可以是上文提到的P个候选运动信息或M个候选运动信息中的某一个,本申请对此不做限定。
其中,如图9所示,如果待缩放的候选运动信息为时域方向的运动信息,基于时域距离的缩放处理可以描述如下:
MVdst=tdst*MVCan/tCan
tdst=currPicPOC-dstRefPicPOC
tCan=currPicPOC-CanRefPicPOC
其中,MVdst表示经缩放过的运动矢量,MVCan表示待缩放的候选运动信息包括的运动矢量,tdst表示当前帧与目标参考帧之间的图像序列计数(picture order count,POC)距离;tCan表示当前帧与该候选运动信息包括的参考帧索引所对应的参考帧之间的POC距离。
一并参阅图9,如果待缩放的候选运动信息为视间方向的运动信息,基于视间距离的缩放处理可以描述如下:
MVdst=tdst*MVCan/tCan
tdst=currPicVOI-dstRefPicVOI
tCan=currPicVOI-CanRefPicVOI
其中,MVdst表示经缩放过的运动矢量,MVCan表示待缩放的候选运动信息包括的运动矢量,tdst表示当前帧与目标参考帧之间的视点顺序(view order index,VOI)距离;tCan表示当前帧与该候选运动信息包括的参考帧索引所对应的参考帧之间的VOI距离。
图10为本申请实施例中将组合候选运动信息添加到AMVP模式候选列表的一种示例性示意图,具体的以参考列表L0的参考帧索引Ref0为例进行说明。假设AMVP候选列表的最大候选数为4,若原始候选运动信息没有填满AMVP候选列表,可以将本申请提出的组合候选运动信息添加到原始候选运动信息之后。若AMVP候选列表仍没有填满,再添加零运动矢量。其中,Merge_idx为0、1的二个候选者为原始AMVP候选运动信息,Merge_idx为2的候选者为添加的本申请提出的组合AMVP候选运动信息(亦称为Combined Average AMVPcandidate),Merge_idx为3的候选者为添加的零运动矢量。
可见,本申请实施例的图像块的运动信息的预测方法中,通过加权处理多个候选运动信息以构造一个或多个组合候选运动信息,能尽可能的挖掘更多的有参考意义的候选运动信息,丰富了候选运动信息,一定程度上减少或避免使用零向量的候选运动信息去填充候选运动信息列表,一定程度上提高了运动矢量预测的准确性,从而提高了编解码性能。
图11为本申请实施例中Merge候选列表构建方法的一种示例流程图。如图11所示,本申请提出的组合候选运动信息(亦称为combined weight merge candidate orcombined average merge candidate)可以放在所有原始候选运动信息或者部分原始候选运动信息之后,替换或兼容组合双向预测合并候选运动矢量(combined bi-predict iveMerge candidate)或者零运动矢量,或者作为原始候选预测运动矢量之外的其它附加候选预测运动矢量。过程1100可由视频编码器20或视频解码器30执行,示意性地,可以由视频编码器20的帧间预测单元或视频解码器30的帧间预测单元来执行。在视频编码器20中,帧间预测单元示例性的,可以包括运动估计单元42和运动补偿单元44。在视频解码器30中,帧间预测单元示例性的,可以包括运动补偿单元82。帧间预测单元可产生用于PU的候选运动信息列表。候选运动信息列表可包括一个或多个原始候选运动信息和从原始候选运动信息导出的一个或多个额外候选运动信息。换言之,即过程1100可以包括原始候选运动信息的获取过程1110和附加候选运动信息的获取过程1130,过程1100描述为一系列的步骤或操作,应当理解的是,过程1100可以以各种顺序执行和/或同时发生,不限于图11所示的执行顺序。假设具有多个视频帧的视频数据流正在使用视频编码器或者视频解码器,执行包括如下步骤的过程1100来构建当前视频帧的当前图像块的候选运动信息列表;
步骤1111,按照第一预设顺序,对当前图像块的一个或多个空域参考块进行检测,得到所述待处理图像块的候选列表中的Q个原始候选运动信息(或者,得到用于构建所述待处理图像块的候选列表的Q个原始候选运动信息),Q为大于或等于0的整数;
应理解,这里的检测可以包括如本文其它地方提到的“可用”的检查过程,或者这里的检测可以包括如本文其它地方提到的“可用”的检查以及修剪(例如去冗余)的过程,不再赘述。
请参阅图6A和6B,当前图像块的一个或多个空域参考块包括:当前图像块所在图像中的、与所述当前图像块邻近的一个或多个空域参考块,和/或,当前图像块所在图像中的、与所述待处理图像块不邻接的一个或多个空域参考块。其中,如图6A所示,当前图像块所在图像中的与所述当前图像块邻近的一个或多个空域参考块可以包括:位于所述当前图像块左下侧的第四空域邻近块A0,位于所述当前图像块左侧的第一空域邻近块A1,位于所述当前图像块右上侧的第三空域邻近块B0,位于所述当前图像块上侧的第二空域邻近块B1,或位于所述当前图像块左上侧的第五空域邻近块B2。其中,如图6B所示,当前图像块所在图像中的与所述待处理图像块不邻接的一个或多个空域参考块可以包括:第一空域非邻接图像块、第二空域非邻接图像块和第三空域非邻接图像块等。
在一种实现方式下,在步骤1111中,依序检测所述第一空域邻近块A1、第二空域邻近块B1、第三空域邻近块B0、第四空域邻近块A0、第五空域邻近块B2是否可用,以得到所述第一空域邻近块A1、第二空域邻近块B1、第三空域邻近块B0、第四空域邻近块A0、第五空域邻近块B2中Q1个已确定运动矢量图像块的运动信息,Q1为大于或等于0的整数,
将检测得到的Q1个已确定运动矢量图像块的运动信息中的Q组运动信息作为候选运动信息加入到所述候选列表中,Q1等于或大于Q;
其中:第五空域邻近块B2的检测条件包括:当所述第一空域邻近块A1、第二空域邻近块B1、第三空域邻近块B0和第四空域邻近块A0中的任一个不可用时,检测第五空域邻近块B2。
步骤1113,按照第二预设顺序(例如图示6—>7),对所述当前图像块的一个或多个时域参考块进行检测,得到所述待处理图像块的候选列表中的S个原始候选运动信息(或者,得到用于构建所述待处理图像块的候选列表的S个原始候选运动信息),S为大于或等于0的整数;
请参阅图6A,当前图像块的一个或多个时域参考块可以理解为当前图像块的co-located块中的图像块或者当前图像块的co-located块的空域邻近块,例如可以包括:所述当前图像块的并置块(co-located块)的右下空域邻近块H,所述并置块的左上中间块或所述并置块的右下中间块Ctr,其中,所述并置块为参考图像中与所述当前图像块具有相同的大小、形状和坐标的图像块,也可以是参考图像中与所述当前图像块具有位置偏移的、相同大小和形状的图像块。
步骤1131,当所述待处理图像块的候选列表中的候选运动信息的数量小于目标数量时,获取T个组合候选运动信息,所述T个组合候选运动信息中的第一组合候选运动信息是对在先得到的P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值,所述P个候选运动信息的加权因子之和为1,从而得到当前图像块的候选列表中的T个新构造的组合候选运动信息,T为大于或等于1的整数。较佳地,所述P个候选运动信息中的每个候选运动信息的加权因子wpi可以为大于0且小于1的数值,
所述目标数量为所述当前图像块的候选列表中候选运动信息的预设最大数量;或者,所述目标数量为利用从码流中解析得到的索引标识确定的候选运动信息的数量。
应当理解的是,所述P个候选运动信息可以为例如过程1110中获取的P个原始候选运动信息;或者,所述P个候选运动信息可以为(P-X)个原始候选运动信息和X个非原始候选运动信息(例如在先得到的组合候选运动信息),X为小于或等于P的正整数。
可选的,本发明实施例中,还可以进一步包括:
步骤1133,当所述待处理图像块的候选列表中的候选运动信息的数量小于目标数量时,对所述候选列表中包括的两组单向预测类型的原始候选运动信息进行组合处理,得到所述待处理图像块的候选列表中的组合双向预测候选运动信息。
需要说明的是,步骤1133可以发生在步骤1131之前,也可以发生在步骤1131之后,本申请对此不做限定。
请一并参阅图12,为本申请实施例中将组合双向预测候选运动信息(combinedbi-predict ive merge candidate)添加到merge模式候选者列表的一种示例性示意图。具体来说,原始候选者中的两个候选者(其具有mvL0和refIdxL0或mvL1和refIdxL1)可用以产生组合双向预测合并候选者。在图12中,两个候选者包括于原始合并候选者列表中。一候选者的预测类型为列表0单向预测,且另一候选者的预测类型为列表1单向预测。在此可行的实施方式中,mvL0_A和ref0是从列表0拾取,且mvL1_B和ref0是从列表1拾取,且接着可产生双向预测性合并候选者(其具有列表0中的mvL0_A和ref0以及列表1中的mvL1_B和ref0)并检查其是否不同于已包括于候选者列表中的候选者。如果其不同,则视频解码器可将双向预测性合并候选者包括于候选者列表中。
可选的,在一些可能的实现方式下,本发明实施例中,还可以进一步包括:
步骤1135,当所述待处理图像块的候选列表中的候选运动信息的数量仍然小于目标数量时,例如如果通过前述方式所产生的附加候选者仍然不足,视频编码器或视频解码器还可以插入零运动矢量作为候选运动信息来产生附加或额外候选者。
请一并参阅图13,为本申请实施例中将零运动矢量添加到合并模式候选预测运动矢量列表的一种示例性示意图。零向量合并候选预测运动矢量可通过组合零向量与可经参考的参考索引而产生。如果零向量候选预测运动矢量并非重复的,则可将其添加到合并候选预测运动矢量列表。
应理解,上述候选者列表可以用于上文所述的Merge模式,或者其它获取待处理图像块的预测运动矢量的预测模式中,可以用于编码端,也可以和对应的编码端保持一致地用于解码端,例如,候选者列表中候选者的数量也是预设的最大数量,并且在编解码端保持一致,具体的数量不做限定,这种情况下的解码端的操作参考解码端,这里不再赘述。
可见,本实施例中不仅可以扩展更多的原始候选运动信息(例如采用空域非邻接图像块的运动矢量作为待处理块的候选者列表中的候选运动信息),而且还可以扩展更多的额外候选运动信息,以获取更多的用于构建候选者列表的可用候选运动信息,从而在最大程度的避免或减少人工添加的零向量的基础上,候选者列表中的候选者的数量能满足目标数量(例如候选列表中候选运动信息的预设最大数量,或者利用从码流中解析得到的索引标识确定的候选运动信息的数量),从而提高了编码性能。
图14为本申请实施例中的图像块的运动信息的预测装置1400的一种示意性框图。需要说明的是,预测装置1400既适用于解码视频图像的帧内或帧间预测,也适用于编码视频图像的帧内或帧间预测,应当理解的是,这里的预测装置1400可以对应于图2中的帧内预测单元46或运动估计单元42,或者可以对应于图3中的帧内预测单元84或运动补偿单元82,该预测装置1400可以包括:
候选运动信息列表确定单元1401,用于确定当前图像块的候选运动信息列表,所述候选运动信息列表包括至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值,所述P个候选运动信息的加权因子之和为1;较佳地,所述P个候选运动信息中的每个候选运动信息的加权因子wpi可以为大于0且小于1的数值。
目标运动信息确定单元1402,用于从所述候选运动信息列表中确定目标运动信息;以及,
预测单元1403,用于根据所述目标运动信息,预测当前图像块的运动信息。
在一种可行的实施方式中,所述至少一个组合候选运动信息还包括第二组合候选运动信息,所述第二组合候选运动信息是对M个候选运动信息采用对应的加权因子进行加权得到的,M为大于或等于2的整数,所述M个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述P个候选运动信息中的至少一个候选运动信息与所述M个候选运动信息中的至少一个候选运动信息彼此不同,所述M个候选运动信息的加权因子之和为1。
在一种可行的实施方式中,所述第一组合候选运动信息包括:所述P个候选运动信息中与第一参考列表对应的P1个候选运动矢量的加权值,和/或,所述P个候选运动信息中与第二参考列表对应的P2个候选运动矢量的加权值,1<P1<=P,1<P2<=P,P1或P2为大于或等于2的整数,其中所述P1或P2个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值。应当理解的是,所述P1个候选运动矢量的加权因子之和为1。所述P2个候选运动矢量的加权因子之和为1。
所述第二组合候选运动信息包括:所述M个候选运动信息中与第一参考列表对应的M1个候选运动矢量的加权值,和/或,所述M个候选运动信息中与第二参考列表对应的M2个候选运动矢量的加权值,1<M1<=M,1<M2<=M,M1或M2为大于或等于2的整数,其中所述M1或M2个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值。应当理解的是,所述M1个候选运动矢量的加权因子之和为1。所述M2个候选运动矢量的加权因子之和为1。
在一种可行的实施方式中,所述P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识小于第二索引标识,相应地,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。
所述M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识小于第四索引标识,相应地,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。
在一种可行的实施方式中,所述P个候选运动信息为P个原始候选运动信息;或者,所述P个候选运动信息为(P-X)个原始候选运动信息和X个非原始候选运动信息,X为小于或等于P的正整数。
所述M个候选运动信息为M个原始候选运动信息;或者,所述M个候选运动信息为(M-Y)个原始候选运动信息和Y个非原始候选运动信息,Y为小于或等于M的正整数。
其中,所述原始候选运动信息包括:当前图像块的一个或多个空域参考块的运动信息、当前图像块的一个或多个时域参考块的运动信息和/或当前图像块的一个或多个视间参考块的运动信息;所述非原始候选运动信息包括:经缩放的候选运动信息,第一组合候选运动信息,第二组合候选运动信息,组合双向预测候选运动信息和/或零运动信息,其中每个经缩放的候选运动信息包括:在第一参考列表下的指向第一目标参考帧的运动矢量,和/或在第二参考列表下的指向第二目标参考帧的运动矢量。
在一种可行的实施方式中,所述经缩放过的候选运动信息是所述候选运动信息列表确定单元1401通过如下步骤得到的:
确定当前图像块的、与第一参考列表对应的第一目标参考帧和/或与第二参考列表对应的第二目标参考帧;
判断某个候选运动信息包括的与所述第一参考列表对应的参考图像是否与第一目标参考帧相同,和/或某个候选运动信息包括的与所述第二参考列表对应的参考图像是否与第二目标参考帧相同;
如果该候选运动信息包括的与所述第一参考列表对应的参考图像不同于所述第一目标参考帧,则对候选运动信息包括的与所述第一参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第一目标参考帧的运动矢量;和/或,
如果该候选运动信息包括的与所述第二参考列表对应的参考图像不同于所述第二目标参考帧,则对候选运动信息包括的与所述第二参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第二目标参考帧的运动矢量。
其中,所述第一目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第一参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第一参考列表的参考帧;或者,所述第二目标参考帧为所述候选运动信息列表中、使用频率最高的对应于第二参考列表的参考帧,或者为所述候选运动信息列表中、索引标识最小的对应于第二参考列表的参考帧。
在一种可行的实施方式中,例如针对Merge模式,所述预测单元具体用于将所述目标运动信息作为所述当前图像块的运动信息。
在另一种可行的实施方式中,例如针对AMVP模式,所述运动信息包括运动矢量,所述预测单元具体用于:从码流中解析所述当前图像块的运动矢量预测残差值;将所述目标运动信息中的运动矢量和所述运动矢量预测残差值之和,作为所述当前图像块的运动矢量。
当所述装置用于编码所述当前图像块,所述目标运动信息确定单元具体用于:从所述候选运动信息列表中确定所述目标运动信息,其中,所述目标运动信息编码所述当前图像块的码率失真代价最小;
当所述装置用于解码所述当前图像块,所述目标运动信息确定单元具体用于:从所述候选运动信息列表中确定第五索引标识指示的目标运动信息,所述第五索引标识指示所述候选运动信息列表中的所述目标运动信息。
需要说明的是,所述候选运动信息列表包括一种或多种候选运动信息,例如时域运动信息(亦称为时域方向的运动信息)、视间运动信息(亦称为视间方向的运动信息)和/或帧内运动信息中的一种或多种。
对于HEVC来说,这里的候选运动信息是指时域方向的运动信息,即运动矢量指向不同时刻相同视点的参考帧。
对于3D-HEVC(HEVC的3D扩展)来说,候选运动信息除了指时域方向的运动信息,还可以指视间方向的运动信息,即运动矢量指向相同/不同时刻不同视点的参考帧。
对于HEVC SCC(HEVC的屏幕视频编码扩展,HEVC Screen Content Coding Extensions)来说,候选运动信息除了指时域方向的运动信息,还可以指帧内运动信息,即运动矢量指向当前重构帧。
因此,Merge/Skip/AMVP模式的候选运动信息列表包含的可能是时域方向的运动信息,视间方向的运动信息,或者帧内运动信息。具体的,Merge/Skip列表可能会同时包含多种运动信息(时域/视间/帧内),然而,AMVP列表一般只包含其中一种运动信息。
可见,本申请实施例的预测装置中,通过加权处理多个候选运动信息以构造至少一个组合候选运动信息,能尽可能的挖掘更多的有参考意义的候选运动信息,丰富了候选运动信息,一定程度上减少或避免使用零向量的候选运动信息去填充候选运动信息列表,一定程度上提高了运动矢量预测的准确性,从而提高了编解码性能。
图15为本申请实施例的编码设备或解码设备(简称为译码设备1500)的一种实现方式的示意性框图。其中,译码设备1500可以包括处理器1510、存储器1530和总线系统1550。其中,处理器和存储器通过总线系统相连,该存储器用于存储指令,该处理器用于执行该存储器存储的指令。编码设备的存储器存储程序代码,且处理器可以调用存储器中存储的程序代码执行本申请描述的各种视频编码或解码方法,尤其是在各种帧间预测模式或帧内预测模式下的视频编码或解码方法,以及在各种帧间或帧内预测模式下预测运动信息的方法。为避免重复,这里不再详细描述。
在本申请实施例中,该处理器1510可以是中央处理单元(Central Process ingUnit,简称为“CPU”),该处理器1510还可以是其他通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
该存储器1530可以包括只读存储器(ROM)设备或者随机存取存储器(RAM)设备。任何其他适宜类型的存储设备也可以用作存储器1530。存储器1530可以包括由处理器1510使用总线1550访问的代码和数据1531。存储器1530可以进一步包括操作系统1533和应用程序1535,该应用程序1535包括允许处理器1510执行本申请描述的视频编码或解码方法(尤其是本申请描述的图像块的运动信息的预测方法)的至少一个程序。例如,应用程序1535可以包括应用1至N,其进一步包括执行在本申请描述的视频编码或解码方法的视频编码或解码应用(简称视频译码应用)。
该总线系统1550除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都标为总线系统1550。
可选的,译码设备1500还可以包括一个或多个输出设备,诸如显示器1570。在一个示例中,显示器1570可以是触感显示器或触摸显示屏,其将显示器与可操作地感测触摸输入的触感单元合并。显示器1570可以经由总线1550连接到处理器1510。
图16示意出本申请实施例的方案在随机访问RA配置条件和低延迟LP配置条件下带来的编解码性能的增益,本申请实施例方案有利于提升图像块的运动信息(例如运动矢量)的预测准确性,在视频质量相同的情况下节省了码率,从而提高编解码性能。
本领域技术人员能够领会,结合本文公开描述的各种说明性逻辑框、模块和算法步骤所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么各种说明性逻辑框、模块、和步骤描述的功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本申请中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
作为实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储指令或数据结构的形式的所要程序代码并且可由计算机存取的任何其它媒体。并且,任何连接被恰当地称作计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。但是,应理解,所述计算机可读存储媒体和数据存储媒体并不包括连接、载波、信号或其它暂时媒体,而是实际上针对于非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。
可通过例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行相应的功能。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的各种说明性逻辑框、模块、和步骤所描述的功能可以提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或者并入在组合编解码器中。而且,所述技术可完全实施于一或多个电路或逻辑元件中。在一种示例下,视频编码器20及视频解码器30中的各种说明性逻辑框、单元、模块可以理解为对应的电路器件或逻辑元件。
本申请的技术可在各种各样的装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本申请中描述各种组件、模块或单元是为了强调用于执行所揭示的技术的装置的功能方面,但未必需要由不同硬件单元实现。实际上,如上文所描述,各种单元可结合合适的软件和/或固件组合在编码解码器硬件单元中,或者通过互操作硬件单元(包含如上文所描述的一或多个处理器)来提供。
以上所述,仅为本申请示例性的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (30)

1.一种图像块的运动信息的预测方法,其特征在于,所述运动信息用于帧内预测或帧间预测,包括:
确定当前图像块的候选运动信息列表,所述候选运动信息列表包括至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;
从所述候选运动信息列表中确定目标运动信息;
根据所述目标运动信息,预测当前图像块的运动信息。
2.根据权利要求1所述的方法,其特征在于,所述至少一个组合候选运动信息还包括第二组合候选运动信息,所述第二组合候选运动信息是对M个候选运动信息采用对应的加权因子进行加权得到的,M为大于或等于2的整数,所述M个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述P个候选运动信息中的至少一个候选运动信息与所述M个候选运动信息中的至少一个候选运动信息彼此不同。
3.根据权利要求1或2所述的方法,其特征在于,
所述第一组合候选运动信息包括:所述P个候选运动信息中与第一参考列表对应的P1个候选运动矢量的加权值,和/或,所述P个候选运动信息中与第二参考列表对应的P2个候选运动矢量的加权值,1<P1<=P,1<P2<=P,P1或P2为大于或等于2的整数,其中所述P1个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值,所述P2个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值。
4.根据权利要求2所述的方法,其特征在于,
所述第二组合候选运动信息包括:所述M个候选运动信息中与第一参考列表对应的M1个候选运动矢量的加权值,和/或,所述M个候选运动信息中与第二参考列表对应的M2个候选运动矢量的加权值,1<M1<=M,1<M2<=M,M1或M2为大于或等于2的整数,其中所述M1个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述M2个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值。
5.根据权利要求1至3任一项所述的方法,其特征在于,
所述P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识小于第二索引标识,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。
6.根据权利要求2或4所述的方法,其特征在于,
所述M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识小于第四索引标识,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。
7.根据权利要求1,2,3或5所述的方法,其特征在于,所述P个候选运动信息为P个原始候选运动信息;或者,
所述P个候选运动信息为(P-X)个原始候选运动信息和X个非原始候选运动信息,X为小于或等于P的正整数。
8.根据权利要求2,4或6所述的方法,其特征在于,所述M个候选运动信息为M个原始候选运动信息;或者,
所述M个候选运动信息为(M-Y)个原始候选运动信息和Y个非原始候选运动信息,Y为小于或等于M的正整数。
9.根据权利要求7或8所述的方法,其特征在于,所述原始候选运动信息包括:当前图像块的一个或多个空域参考块的运动信息、当前图像块的一个或多个时域参考块的运动信息和/或当前图像块的一个或多个视间参考块的运动信息;
所述非原始候选运动信息包括:经缩放过的候选运动信息,第一组合候选运动信息,第二组合候选运动信息,组合双向预测候选运动信息和/或零运动信息,其中每个经缩放过的候选运动信息包括:在第一参考列表下的指向第一目标参考帧的运动矢量,和/或在第二参考列表下的指向第二目标参考帧的运动矢量。
10.根据权利要求9所述的方法,其特征在于,所述经缩放过的候选运动信息是通过如下方法得到的:
确定当前图像块的、与第一参考列表对应的第一目标参考帧和/或与第二参考列表对应的第二目标参考帧;
判断候选运动信息包括的与所述第一参考列表对应的参考图像是否与第一目标参考帧相同,和/或所述候选运动信息包括的与所述第二参考列表对应的参考图像是否与第二目标参考帧相同;
如果所述候选运动信息包括的与所述第一参考列表对应的参考图像不同于所述第一目标参考帧,则对所述候选运动信息包括的与所述第一参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第一目标参考帧的运动矢量;和/或,
如果所述候选运动信息包括的与所述第二参考列表对应的参考图像不同于所述第二目标参考帧,则对所述候选运动信息包括的与所述第二参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第二目标参考帧的运动矢量。
11.根据权利要求1至10任一项所述的方法,其特征在于,所述根据所述目标运动信息,预测所述当前图像块的运动信息,包括:
将所述目标运动信息作为所述当前图像块的运动信息。
12.根据权利要求1至10任一项所述的方法,其特征在于,所述运动信息包括运动矢量,所述根据所述目标运动信息,预测所述当前图像块的运动信息,包括:
从码流中解析所述当前图像块的运动矢量预测残差值;
将所述目标运动信息中的运动矢量和所述运动矢量预测残差值之和,作为所述当前图像块的运动矢量。
13.根据权利要求1至12任一项所述的方法,其特征在于,所述方法用于编码所述当前图像块,所述确定目标运动信息包括:从所述候选运动信息列表中确定所述目标运动信息,所述目标运动信息编码所述当前图像块的码率失真代价最小;
或者,所述方法用于解码所述当前图像块,所述确定目标运动信息包括:从所述候选运动信息列表中确定第五索引标识指示的目标运动信息,所述第五索引标识用于指示所述候选运动信息列表中的所述目标运动信息。
14.一种图像块的运动信息的预测装置,其特征在于,所述运动信息用于帧内预测或帧间预测,包括:
候选运动信息列表确定单元,用于确定当前图像块的候选运动信息列表,所述候选运动信息列表包括至少一个组合候选运动信息,所述至少一个组合候选运动信息中的第一组合候选运动信息是对P个候选运动信息采用对应的加权因子进行加权得到的,P为大于或等于2的整数,所述P个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值;
目标运动信息确定单元,用于从所述候选运动信息列表中确定目标运动信息;
预测单元,用于根据所述目标运动信息,预测当前图像块的运动信息。
15.根据权利要求14所述的装置,其特征在于,所述至少一个组合候选运动信息还包括第二组合候选运动信息,所述第二组合候选运动信息是对M个候选运动信息采用对应的加权因子进行加权得到的,M为大于或等于2的整数,所述M个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述P个候选运动信息中的至少一个候选运动信息与所述M个候选运动信息中的至少一个候选运动信息彼此不同。
16.根据权利要求14或15所述的装置,其特征在于,
所述第一组合候选运动信息包括:所述P个候选运动信息中与第一参考列表对应的P1个候选运动矢量的加权值,和/或,所述P个候选运动信息中与第二参考列表对应的P2个候选运动矢量的加权值,1<P1<=P,1<P2<=P,P1或P2为大于或等于2的整数,其中所述P1个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值,所述P2个候选运动信息中的至少两个候选运动信息的加权因子wpi分别为大于0且小于1的数值。
17.根据权利要求15所述的装置,其特征在于,
所述第二组合候选运动信息包括:所述M个候选运动信息中与第一参考列表对应的M1个候选运动矢量的加权值,和/或,所述M个候选运动信息中与第二参考列表对应的M2个候选运动矢量的加权值,1<M1<=M,1<M2<=M,M1或M2为大于或等于2的整数,其中所述M1个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值,所述M2个候选运动信息中的至少两个候选运动信息的加权因子wmi分别为大于0且小于1的数值。
18.根据权利要求14至16任一项所述的装置,其特征在于,
所述P个候选运动信息包括与第一索引标识对应的第一候选运动信息和与第二索引标识对应的第二候选运动信息,第一索引标识小于第二索引标识,所述第一候选运动信息的加权因子大于或等于所述第二候选运动信息的加权因子。
19.根据权利要求15或17所述的装置,其特征在于,
所述M个候选运动信息包括与第三索引标识对应的第三候选运动信息和与第四索引标识对应的第四候选运动信息,第三索引标识小于第四索引标识,所述第三候选运动信息的加权因子大于或等于所述第四候选运动信息的加权因子。
20.根据权利要求14,15,16或18所述的装置,其特征在于,所述P个候选运动信息为P个原始候选运动信息;或者,
所述P个候选运动信息为(P-X)个原始候选运动信息和X个非原始候选运动信息,X为小于或等于P的正整数。
21.根据权利要求15,17或19所述的装置,其特征在于,所述M个候选运动信息为M个原始候选运动信息;或者,
所述M个候选运动信息为(M-Y)个原始候选运动信息和Y个非原始候选运动信息,Y为小于或等于M的正整数。
22.根据权利要求20或21所述的装置,其特征在于,所述原始候选运动信息包括:当前图像块的一个或多个空域参考块的运动信息、当前图像块的一个或多个时域参考块的运动信息和/或当前图像块的一个或多个视间参考块的运动信息;
所述非原始候选运动信息包括:经缩放过的候选运动信息,第一组合候选运动信息,第二组合候选运动信息,组合双向预测候选运动信息和/或零运动信息,其中每个经缩放过的候选运动信息包括:在第一参考列表下的指向第一目标参考帧的运动矢量,和/或在第二参考列表下的指向第二目标参考帧的运动矢量。
23.根据权利要求22所述的装置,其特征在于,所述经缩放过的候选运动信息是所述候选运动信息列表确定单元通过如下步骤得到的:
确定当前图像块的、与第一参考列表对应的第一目标参考帧和/或与第二参考列表对应的第二目标参考帧;
判断候选运动信息包括的与所述第一参考列表对应的参考图像是否与第一目标参考帧相同,和/或所述候选运动信息包括的与所述第二参考列表对应的参考图像是否与第二目标参考帧相同;
如果所述候选运动信息包括的与所述第一参考列表对应的参考图像不同于所述第一目标参考帧,则对所述候选运动信息包括的与所述第一参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第一目标参考帧的运动矢量;和/或,
如果所述候选运动信息包括的与所述第二参考列表对应的参考图像不同于所述第二目标参考帧,则对所述候选运动信息包括的与所述第二参考图像列表对应的运动矢量进行基于时域距离或视点间距离的缩放处理,以得到指向所述第二目标参考帧的运动矢量。
24.根据权利要求14至23任一项所述的装置,其特征在于,所述预测单元具体用于将所述目标运动信息作为所述当前图像块的运动信息。
25.根据权利要求14至23任一项所述的装置,其特征在于,所述运动信息包括运动矢量,所述预测单元具体用于:从码流中解析所述当前图像块的运动矢量预测残差值;将所述目标运动信息中的运动矢量和所述运动矢量预测残差值之和,作为所述当前图像块的运动矢量。
26.根据权利要求14至25任一项所述的装置,其特征在于,所述装置用于编码所述当前图像块,所述目标运动信息确定单元具体用于:从所述候选运动信息列表中确定所述目标运动信息,所述目标运动信息编码所述当前图像块的码率失真代价最小;
或者,所述装置用于解码所述当前图像块,所述目标运动信息确定单元具体用于:从所述候选运动信息列表中确定第五索引标识指示的目标运动信息,所述第五索引标识用于指示所述候选运动信息列表中的所述目标运动信息。
27.一种视频编码器,其特征在于,所述视频编码器用于编码图像块,包括:
帧间预测器,包括如权利要求14至25任一项所述的图像块的运动信息的预测装置,其中所述帧间预测器用于基于目标运动信息预测当前待编码图像块的运动信息,基于所述当前待编码图像块的运动信息确定所述当前待编码图像块的预测块;
熵编码器,用于将所述目标运动信息的索引标识编入码流,所述索引标识指示用于所述当前待编码图像块的所述目标运动信息;
重建器,用于基于所述预测块重建所述图像块。
28.一种视频编码器,其特征在于,所述视频编码器用于编码图像块,包括:
帧内预测器,包括如权利要求14至25任一项所述的图像块的运动信息的预测装置,其中所述帧内预测器用于基于目标运动信息预测当前待编码图像块的帧内运动信息,基于所述当前待编码图像块的帧内运动信息确定所述当前待编码图像块的帧内预测块;
熵编码器,用于将所述目标运动信息的索引标识编入码流,所述索引标识指示用于所述当前待编码图像块的所述目标运动信息;
重建器,用于基于所述帧内预测块重建所述图像块。
29.一种视频解码器,其特征在于,所述视频解码器用于从码流中解码出图像块,包括:
熵解码器,用于从码流中解码出索引标识,所述索引标识用于指示当前待解码图像块的目标运动信息;
帧间预测器,包括如权利要求14至25中任一项所述的图像块的运动信息的预测装置,所述帧间预测器用于基于所述索引标识指示的目标运动信息预测当前待解码图像块的运动信息,基于所述当前待解码图像块的运动信息确定所述当前待解码图像块的预测块;
重建器,用于基于所述预测块重建所述图像块。
30.一种视频解码器,其特征在于,所述视频解码器用于从码流中解码出图像块,包括:
熵解码器,用于从码流中解码出索引标识,所述索引标识用于指示当前待解码图像块的目标运动信息;
帧内预测器,包括如权利要求14至25中任一项所述的图像块的运动信息的预测装置,所述帧内预测器用于基于所述索引标识指示的目标运动信息预测当前待解码图像块的帧内运动信息,基于所述当前待解码图像块的帧内运动信息确定所述当前待解码图像块的帧内预测块;
重建器,用于基于所述帧内预测块重建所述图像块。
CN201711411690.XA 2017-12-23 2017-12-23 图像块的运动信息的预测方法、装置及编解码器 Active CN109963155B (zh)

Priority Applications (10)

Application Number Priority Date Filing Date Title
CN201711411690.XA CN109963155B (zh) 2017-12-23 2017-12-23 图像块的运动信息的预测方法、装置及编解码器
BR112020012732-9A BR112020012732A2 (pt) 2017-12-23 2018-09-21 método e aparelho para predição de informações de movimento de bloco de imagens, codificador, e decodificador
EP18893007.7A EP3731526A4 (en) 2017-12-23 2018-09-21 METHOD AND DEVICE FOR PREDICTING MOVEMENT INFORMATION OF AN IMAGE BLOCK, AND CODEC
JP2020535069A JP2021507639A (ja) 2017-12-23 2018-09-21 ピクチャブロックの動き情報を予測するための方法および装置、エンコーダ、ならびにデコーダ
CN201880083601.XA CN111512630A (zh) 2017-12-23 2018-09-21 图像块的运动信息的预测方法、装置及编解码器
PCT/CN2018/107094 WO2019119909A1 (zh) 2017-12-23 2018-09-21 图像块的运动信息的预测方法、装置及编解码器
KR1020207021531A KR20200108856A (ko) 2017-12-23 2018-09-21 이미지 블록의 모션 정보를 예측하기 위한 방법 빛 디바이스, 및 코덱
PCT/CN2018/122951 WO2019120305A1 (zh) 2017-12-23 2018-12-22 图像块的运动信息的预测方法、装置及编解码器
US16/907,660 US11297326B2 (en) 2017-12-23 2020-06-22 Method and apparatus for predicting motion information of picture block, encoder, and decoder
US17/696,132 US20220345716A1 (en) 2017-12-23 2022-03-16 Method and apparatus for predicting motion information of picture block, encoder, and decoder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711411690.XA CN109963155B (zh) 2017-12-23 2017-12-23 图像块的运动信息的预测方法、装置及编解码器

Publications (2)

Publication Number Publication Date
CN109963155A true CN109963155A (zh) 2019-07-02
CN109963155B CN109963155B (zh) 2023-06-06

Family

ID=66993054

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201711411690.XA Active CN109963155B (zh) 2017-12-23 2017-12-23 图像块的运动信息的预测方法、装置及编解码器
CN201880083601.XA Pending CN111512630A (zh) 2017-12-23 2018-09-21 图像块的运动信息的预测方法、装置及编解码器

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201880083601.XA Pending CN111512630A (zh) 2017-12-23 2018-09-21 图像块的运动信息的预测方法、装置及编解码器

Country Status (7)

Country Link
US (2) US11297326B2 (zh)
EP (1) EP3731526A4 (zh)
JP (1) JP2021507639A (zh)
KR (1) KR20200108856A (zh)
CN (2) CN109963155B (zh)
BR (1) BR112020012732A2 (zh)
WO (2) WO2019119909A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110460859A (zh) * 2019-08-21 2019-11-15 浙江大华技术股份有限公司 历史运动矢量列表的使用方法、编解码器及存储装置
CN110611820A (zh) * 2019-09-11 2019-12-24 北京达佳互联信息技术有限公司 视频编码方法、装置、电子设备及存储介质
CN110636311A (zh) * 2019-09-18 2019-12-31 浙江大华技术股份有限公司 运动矢量的获取方法及相关预测方法、装置
CN112449180A (zh) * 2019-08-27 2021-03-05 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN112905817A (zh) * 2021-05-08 2021-06-04 深圳市安软科技股份有限公司 基于排序算法的图像检索方法、装置及相关设备
CN113261285A (zh) * 2019-09-24 2021-08-13 Oppo广东移动通信有限公司 编码方法、解码方法、编码器、解码器以及存储介质
CN113453005A (zh) * 2020-03-26 2021-09-28 杭州海康威视数字技术股份有限公司 解码方法、编码方法、装置及设备
CN113709498A (zh) * 2020-05-20 2021-11-26 Oppo广东移动通信有限公司 帧间预测方法、编码器、解码器以及计算机存储介质
CN113709499A (zh) * 2020-08-20 2021-11-26 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
WO2021244125A1 (zh) * 2020-06-05 2021-12-09 Oppo广东移动通信有限公司 帧间预测方法、解码器、编码器及计算机存储介质
CN114071159A (zh) * 2020-07-29 2022-02-18 Oppo广东移动通信有限公司 帧间预测方法、编码器、解码器及计算机可读存储介质
CN115209161A (zh) * 2019-10-10 2022-10-18 华为技术有限公司 简化指示图像头的编码器、解码器及对应方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190110044A (ko) * 2018-03-19 2019-09-27 주식회사 케이티 비디오 신호 처리 방법 및 장치
JP7104186B2 (ja) 2018-06-05 2022-07-20 北京字節跳動網絡技術有限公司 Ibcとatmvpとの間でのインタラクション
CN110636298B (zh) 2018-06-21 2022-09-13 北京字节跳动网络技术有限公司 对于Merge仿射模式和非Merge仿射模式的统一约束
EP4307671A3 (en) 2018-06-21 2024-02-07 Beijing Bytedance Network Technology Co., Ltd. Sub-block mv inheritance between color components
EP3794825A1 (en) 2018-06-29 2021-03-24 Beijing Bytedance Network Technology Co. Ltd. Update of look up table: fifo, constrained fifo
BR112020024142A2 (pt) 2018-06-29 2021-03-02 Beijing Bytedance Network Technology Co., Ltd. método para processamento de vídeo, aparelho para codificação de dados de vídeo, meio de armazenamento e meio de gravação legíveis por computador não transitório
WO2020003282A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Managing motion vector predictors for video coding
CN114900694A (zh) 2018-06-29 2022-08-12 抖音视界(北京)有限公司 哪个查找表需要更新或不更新
TWI719525B (zh) 2018-06-29 2021-02-21 大陸商北京字節跳動網絡技術有限公司 Lut與amvp之間的交互
EP4322533A3 (en) 2018-06-29 2024-03-06 Beijing Bytedance Network Technology Co., Ltd. Checking order of motion candidates in lut
JP7460617B2 (ja) 2018-06-29 2024-04-02 北京字節跳動網絡技術有限公司 Lut更新条件
TWI748202B (zh) 2018-07-02 2021-12-01 大陸商北京字節跳動網絡技術有限公司 Lamvr中取整和修剪的順序
WO2020065518A1 (en) * 2018-09-24 2020-04-02 Beijing Bytedance Network Technology Co., Ltd. Bi-prediction with weights in video coding and decoding
CN112997495B (zh) 2018-11-10 2024-02-20 北京字节跳动网络技术有限公司 当前图片参考中的取整
WO2020143741A1 (en) 2019-01-10 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Invoke of lut updating
CN113383554B (zh) 2019-01-13 2022-12-16 北京字节跳动网络技术有限公司 LUT和共享Merge列表之间的交互
CN113302937A (zh) 2019-01-16 2021-08-24 北京字节跳动网络技术有限公司 运动候选推导
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017076221A1 (en) * 2015-11-05 2017-05-11 Mediatek Inc. Method and apparatus of inter prediction using average motion vector for video coding
WO2017105097A1 (ko) * 2015-12-17 2017-06-22 삼성전자 주식회사 머지 후보 리스트를 이용한 비디오 복호화 방법 및 비디오 복호화 장치
CN107079164A (zh) * 2014-09-30 2017-08-18 寰发股份有限公司 用于视频编码的自适应运动向量分辨率的方法
CN107079161A (zh) * 2014-09-01 2017-08-18 寰发股份有限公司 用于屏幕内容以及视频编码的帧内图片块复制的方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9161057B2 (en) * 2009-07-09 2015-10-13 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
CN101610413B (zh) * 2009-07-29 2011-04-27 清华大学 一种视频的编码/解码方法及装置
KR101803886B1 (ko) * 2011-01-07 2017-12-04 가부시키가이샤 엔.티.티.도코모 움직임 벡터의 예측 부호화 방법, 예측 부호화 장치, 및 예측 부호화 프로그램, 그리고 움직임 벡터의 예측 복호 방법, 예측 복호 장치, 및 예측 복호 프로그램
LT3282707T (lt) * 2011-06-27 2018-11-26 Samsung Electronics Co., Ltd. Judesio informacijos dekodavimo būdas
KR102004113B1 (ko) * 2011-06-30 2019-07-25 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법, 화상 부호화 프로그램, 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
JP2013018369A (ja) 2011-07-11 2013-01-31 Kinki Sharyo Co Ltd 鉄道車両の構体構造
MX341415B (es) * 2011-08-03 2016-08-19 Panasonic Ip Corp America Metodo de codificacion de video, aparato de codificacion de video, metodo de decodificacion de video, aparato de decodificacion de video y aparato de codificacion/decodificacion de video.
JP5768662B2 (ja) * 2011-10-31 2015-08-26 富士通株式会社 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム
KR20130050405A (ko) * 2011-11-07 2013-05-16 오수미 인터 모드에서의 시간 후보자 결정방법
WO2013107939A1 (en) * 2012-01-20 2013-07-25 Nokia Corporation Method for video coding and an apparatus, a computer-program product, a system, and a module for the same
US9674527B2 (en) * 2012-01-31 2017-06-06 Qualcomm Incorporated Implicit derivation of parallel motion estimation range size
CN103916673B (zh) * 2013-01-06 2017-12-22 华为技术有限公司 基于双向预测的编码方法、解码方法和装置
GB2514334B (en) * 2013-05-13 2020-04-22 Snell Advanced Media Ltd Video processing
US20170310994A1 (en) * 2014-10-08 2017-10-26 Lg Electronics Inc. 3d video coding method and device
US20180131943A1 (en) * 2015-04-27 2018-05-10 Lg Electronics Inc. Method for processing video signal and device for same
JP2019519148A (ja) * 2016-05-13 2019-07-04 ヴィド スケール インコーポレイテッド ビデオ符号化のための一般化された多重仮説予測(Generalized Multi−Hypothesis Prediction)のためのシステムおよび方法
CN109196864B (zh) * 2016-05-24 2023-07-11 韩国电子通信研究院 图像编码/解码方法和用于所述方法的记录介质
CN116567223A (zh) * 2016-08-11 2023-08-08 Lx 半导体科技有限公司 图像编码/解码设备和图像数据的发送设备
US10715827B2 (en) * 2017-01-06 2020-07-14 Mediatek Inc. Multi-hypotheses merge mode
US20180310017A1 (en) * 2017-04-21 2018-10-25 Mediatek Inc. Sub-prediction unit temporal motion vector prediction (sub-pu tmvp) for video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107079161A (zh) * 2014-09-01 2017-08-18 寰发股份有限公司 用于屏幕内容以及视频编码的帧内图片块复制的方法
CN107079164A (zh) * 2014-09-30 2017-08-18 寰发股份有限公司 用于视频编码的自适应运动向量分辨率的方法
WO2017076221A1 (en) * 2015-11-05 2017-05-11 Mediatek Inc. Method and apparatus of inter prediction using average motion vector for video coding
WO2017105097A1 (ko) * 2015-12-17 2017-06-22 삼성전자 주식회사 머지 후보 리스트를 이용한 비디오 복호화 방법 및 비디오 복호화 장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LI,BIN 等: "Non-SCCE1: Unification of intra BC and inter modes", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 18TH MEETING: SAPPORO, JP, 30 JUNE – 9 JULY 2014 DOCUMENT: JCTVC-R0100_R1》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110460859A (zh) * 2019-08-21 2019-11-15 浙江大华技术股份有限公司 历史运动矢量列表的使用方法、编解码器及存储装置
CN112449180A (zh) * 2019-08-27 2021-03-05 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN112449180B (zh) * 2019-08-27 2023-02-28 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN110611820A (zh) * 2019-09-11 2019-12-24 北京达佳互联信息技术有限公司 视频编码方法、装置、电子设备及存储介质
CN110636311B (zh) * 2019-09-18 2021-10-15 浙江大华技术股份有限公司 运动矢量的获取方法及相关预测方法、装置
CN110636311A (zh) * 2019-09-18 2019-12-31 浙江大华技术股份有限公司 运动矢量的获取方法及相关预测方法、装置
CN113261285A (zh) * 2019-09-24 2021-08-13 Oppo广东移动通信有限公司 编码方法、解码方法、编码器、解码器以及存储介质
CN113261285B (zh) * 2019-09-24 2023-06-02 Oppo广东移动通信有限公司 编码方法、解码方法、编码器、解码器以及存储介质
CN115209161A (zh) * 2019-10-10 2022-10-18 华为技术有限公司 简化指示图像头的编码器、解码器及对应方法
CN115209161B (zh) * 2019-10-10 2023-05-12 华为技术有限公司 视频译码方法、解码器、解码设备、存储介质
CN113453005A (zh) * 2020-03-26 2021-09-28 杭州海康威视数字技术股份有限公司 解码方法、编码方法、装置及设备
CN113709498A (zh) * 2020-05-20 2021-11-26 Oppo广东移动通信有限公司 帧间预测方法、编码器、解码器以及计算机存储介质
WO2021244125A1 (zh) * 2020-06-05 2021-12-09 Oppo广东移动通信有限公司 帧间预测方法、解码器、编码器及计算机存储介质
CN114071159A (zh) * 2020-07-29 2022-02-18 Oppo广东移动通信有限公司 帧间预测方法、编码器、解码器及计算机可读存储介质
CN114079783B (zh) * 2020-08-20 2022-12-23 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN114079783A (zh) * 2020-08-20 2022-02-22 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN113709499B (zh) * 2020-08-20 2022-12-23 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN113709499A (zh) * 2020-08-20 2021-11-26 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
CN112905817B (zh) * 2021-05-08 2021-07-06 深圳市安软科技股份有限公司 基于排序算法的图像检索方法、装置及相关设备
CN112905817A (zh) * 2021-05-08 2021-06-04 深圳市安软科技股份有限公司 基于排序算法的图像检索方法、装置及相关设备

Also Published As

Publication number Publication date
EP3731526A1 (en) 2020-10-28
BR112020012732A2 (pt) 2020-12-01
WO2019119909A1 (zh) 2019-06-27
US20220345716A1 (en) 2022-10-27
CN111512630A (zh) 2020-08-07
WO2019120305A1 (zh) 2019-06-27
CN109963155B (zh) 2023-06-06
JP2021507639A (ja) 2021-02-22
US20200396462A1 (en) 2020-12-17
US11297326B2 (en) 2022-04-05
EP3731526A4 (en) 2020-12-30
KR20200108856A (ko) 2020-09-21

Similar Documents

Publication Publication Date Title
CN109963155A (zh) 图像块的运动信息的预测方法、装置及编解码器
CN106797476B (zh) 用于编码/解码视频数据的方法和视频解码装置
CN106576171B (zh) 一种对视频数据进行编码、解码的方法以及装置
CN106797477B (zh) 用于解码及编码视频数据的方法和设备
CN105637870B (zh) 使用不对称运动分割的视频译码技术
CN104704833B (zh) 多视图或3维视频译码中的高级视图间残差预测
CN106105202B (zh) 通用颜色空间逆变换译码方法及装置
CN104322070B (zh) 用于高效率视频译码的高级别语法扩展
CN105874797B (zh) 视频数据的编解码方法、装置、设备和存储媒体
CN105580372B (zh) 用于3d视频译码的组合式双向预测合并候选者
CN103202016B (zh) 用于视频译码的自适应运动向量分辨率信令
CN104170381B (zh) 在高效率视频译码及其扩展中的运动矢量译码及双向预测
CN104303502B (zh) 对多视图视频数据进行编码、解码和译码的方法、装置及计算机可读存储介质
CN106471806B (zh) 3d-hevc中的简化移位合并候选者及合并列表导出
CN104170380B (zh) 视频译码中的视差矢量预测
CN109996081A (zh) 图像预测方法、装置以及编解码器
CN103650505B (zh) 视频译码中的运动向量预测
CN104838657B (zh) 可缩放及多视角视频译码中的高级残差预测的方法及设备
CN105144715B (zh) 后向视图合成预测
CN104272742B (zh) 加权预测参数译码
CN110301135A (zh) 在视频解码器处导出运动向量信息
CN110100436A (zh) 使用导出色度模式译码视频数据
CN109076235A (zh) 用于在视频译码中的并置参考索引的一致性约束
CN109792531A (zh) 用于视频译码的运动向量译码
CN107431820A (zh) 视频译码中运动向量推导

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant