CN109155855A - 用于视频译码的仿射运动预测 - Google Patents

用于视频译码的仿射运动预测 Download PDF

Info

Publication number
CN109155855A
CN109155855A CN201780029286.8A CN201780029286A CN109155855A CN 109155855 A CN109155855 A CN 109155855A CN 201780029286 A CN201780029286 A CN 201780029286A CN 109155855 A CN109155855 A CN 109155855A
Authority
CN
China
Prior art keywords
video data
data block
block
affine
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780029286.8A
Other languages
English (en)
Other versions
CN109155855B (zh
Inventor
邹锋
陈建乐
马尔塔·卡切维奇
李翔
庄孝强
钱威俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Priority to CN202211114612.4A priority Critical patent/CN115379237A/zh
Publication of CN109155855A publication Critical patent/CN109155855A/zh
Application granted granted Critical
Publication of CN109155855B publication Critical patent/CN109155855B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/537Motion estimation other than block-based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

本发明提供一种实例方法,所述方法包含:针对当前视频数据块获得相邻视频数据块的仿射运动模型的运动向量MV的值;从所述相邻块的所述仿射运动模型的所述MV的所述值导出所述当前块的仿射运动模型的MV的预测子的值;从视频位流解码所述当前块的所述仿射运动模型的所述MV的所述值与所述预测子的所述值之间的差值的表示;从所述预测子的所述值及所述解码的差值确定所述当前块的所述仿射运动模型的所述MV的所述值;基于所述当前块的所述仿射运动模型的所述MV的所述经确定值确定视频数据的预测子块;及基于所述预测子块重建所述当前块。

Description

用于视频译码的仿射运动预测
本申请案请求2016年5月16日提交的美国临时申请案第62/337,301号的权益,所述申请案的全部内容在此以引用的方式并入。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数目相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式发射装置及其类似者。数字视频装置实施视频译码技术,例如视频译码标准中描述的那些视频译码技术。视频装置可通过实施这类视频译码技术来更有效地发射、接收、编码、解码及/或存储数字视频信息。
一些视频译码标准由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4部分10高级视频译码(AVC)(包含其可调式视频译码(SVC)及多视图视频译码(MVC)扩展)、ITU-TH.265(也被称作高效视频译码(HEVC)及这些标准的扩展定义。最近,ITU-T视频译码专家组(VCEG)及ISO/IEC动画专家组(MPEG)的视频译码联合合作小组(JCT-VC)已完成新的视频译码标准(即,高效视频译码(HEVC))的设计。最近HEVC规范草案(且下文中被称作HEVC WD)可在itu.int/rec/T-REC-H.265-201504-S/en处获得。对HEVC的范围扩展(即HEVC-Rext)也正由JCT-VC开发。范围扩展的最近工作草案(WD)(在下文中被称作RExt WD6)可从phenix.int-evry.fr/jct/doc_end_user/documents/16_San%20Jose/wg11/JCTVC-P1005-v1.zip获得。
视频译码技术包含空间(图片内)预测及/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(例如,视频帧或视频帧的一部分)分割为视频块,对于一些技术,视频块也可被称作树型块、译码单元(CU)及/或译码节点。图片的经帧内译码(I)切片中的视频块使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生待译码块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量及指示经译码块与预测性块之间的差异的残余数据来编码经帧间译码块。帧内译码块根据帧内译码模式及残余数据编码。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,可接着量化所述残余变换系数。最初布置于二维阵列中的经量化变换系数可经扫描以便产生变换系数的一维向量,且熵译码可经应用以达成甚至更多压缩。
发明内容
在一个实例中,一种用于解码视频数据的方法包含:通过视频解码器的一或多个处理器及针对当前视频数据块获得相邻视频数据块的仿射运动模型的运动向量(MV)的值;通过所述一或多个处理器并从相邻视频数据块的仿射运动模型的MV的值导出当前视频数据块的仿射运动模型的MV的预测子的值;通过所述一或多个处理器并从经编码视频位流解码当前视频数据块的仿射运动模型的运动向量的值与预测子的值之间的差值的表示;通过所述一或多个处理器从预测子的值及解码的差值确定当前视频数据块的仿射运动模型的运动向量的值;基于当前视频数据块的仿射运动模型的运动向量的经确定值确定视频数据的预测子块;及基于视频数据的预测子块重建当前视频数据块。
在另一实例中,一种用于编码视频数据的方法包含:通过视频编码器的一或多个处理器确定当前视频数据块的仿射运动模型的运动向量的值,仿射运动模型的运动向量识别当前视频数据块的视频数据的预测子块;通过所述一或多个处理器获得相邻视频数据块的仿射运动模型的运动向量的值;通过所述一或多个处理器及从相邻视频数据块的仿射运动模型的运动向量的值导出当前视频数据块的仿射运动模型的运动向量的预测子的值;及通过所述一或多个处理器及在经编码视频位流中编码当前视频数据块的仿射运动模型的运动向量的值与预测子的值之间的差值的表示。
在另一实例中,用于解码视频数据块的装置包含:存储器,其经配置以存储视频数据;及一或多个处理单元,其实施于电路中。在这个实例中,一或多个处理单元经配置以:针对当前视频数据块获得相邻视频数据块的仿射运动模型的运动向量的值;从相邻视频数据块的仿射运动模型的运动向量的值导出当前视频数据块的仿射运动模型的运动向量的预测子的值;从经编码视频位流解码当前视频数据块的仿射运动模型的运动向量的值与预测子的值之间的差值的表示;从预测子的值及经解码差值确定当前视频数据块的仿射运动模型的运动向量的值;基于当前视频数据块的仿射运动模型的运动向量的经确定值确定视频数据的预测子块;及基于视频数据的预测子块重建当前视频数据块。
在另一实例中,用于编码视频数据块的装置包含:存储器,其经配置以存储视频数据;及一或多个处理单元,其实施于电路中。在这个实例中,一或多个处理单元经配置以:确定当前视频数据块的仿射运动模型的运动向量的值,仿射运动模型的运动向量识别当前视频数据块的视频数据的预测子块;获得相邻视频数据块的仿射运动模型的运动向量的值;从相邻视频数据块的仿射运动模型的运动向量的值导出当前视频数据块的仿射运动模型的运动向量的预测子的值;及在经编码视频位流中编码当前视频数据块的仿射运动模型的运动向量的值与预测子的值之间的差值的表示。
在另一实例中,一种用于编码或解码视频数据的装置包含:用于针对当前视频数据块获得相邻视频数据块的仿射运动模型的运动向量的值的装置;用于从相邻视频数据块的仿射运动模型的运动向量的值导出当前视频数据块的仿射运动模型的运动向量的预测子的值的装置;用于获得当前视频数据块的仿射运动模型的运动向量的值与预测子的值之间的差值的装置;用于从预测子的值及经解码差值确定当前视频数据块的仿射运动模型的运动向量的值中的每一者的装置;及用于基于当前视频数据块的仿射运动模型的运动向量的经确定值识别视频数据的预测子块的装置。
在另一实例中,一种存储指令的计算机可读存储媒体,所述指令当经执行时引起视频编码器或视频解码器的一个或多个处理器执行以下操作:针对当前视频数据块获得相邻视频数据块的仿射运动模型的运动向量的值;从相邻视频数据块的仿射运动模型的运动向量的值导出当前视频数据块的仿射运动模型的运动向量的预测子的值;获得当前视频数据块的仿射运动模型的运动向量的值与预测子的值之间的差值;从预测子的值及经解码差值确定当前视频数据块的仿射运动模型的运动向量的值中的每一者;及基于当前视频数据块的仿射运动模型的运动向量的经确定值识别视频数据的预测子块。
在以下附图及实施方式中阐述一或多个实例的细节。其它特征、目标及优点将从所述描述及图式以及权利要求书显而易见。
附图说明
图1为说明可经配置以执行本发明的技术的实例视频编码及解码系统的框图。
图2为说明可经配置以执行本发明的技术的视频编码器的实例的框图。
图3为说明可经配置以执行本发明的技术的视频解码器的实例的框图。
图4A及4B为说明高效视频译码(HEVC)中的空间相邻候选的概念图。
图5为说明具有四个仿射参数的两点运动向量仿射的概念图。
图6为说明仿射帧间模式的概念图。
图7A及7B为说明仿射合并模式的候选的概念图。
图8为说明根据本发明的一或多种技术的六参数仿射运动模型的概念图。
图9为说明根据本发明的一或多种技术的仿射运动向量评估的概念图。
图10为说明H.263中的重叠块运动补偿(OBMC)的概念图。
图11A及11B为说明在HEVC的顶部上的OBMC的概念图。
图12A及12B为说明其中OBMC可应用的子块的概念图。
图13为说明根据本发明的一或多种技术的用于通过视频编码器(例如,在视频编码过程期间)执行仿射运动补偿的实例方法的流程图。
图14为说明根据本发明的一或多种技术的用于通过视频解码器(例如,在视频解码过程期间)执行仿射运动补偿的实例方法的流程图。
具体实施方式
一般来说,本发明描述与视频数据块的仿射运动信息的译码(例如,编码或解码)相关的技术。在当前视频译码标准中,仅平移运动模型应用于运动补偿预测(MCP)。当将平移运动模型用于MCP时,视频译码器(例如,视频编码器或视频解码器)可将单个二维运动向量(MV)用于当前块,所述二维运动向量指示当前视频数据块与视频数据的对应预测子块之间的位移。MV可为二维的,因为每一MV可具有指示当前视频数据块与视频数据的预测子块之间的水平位移的x分量,及指示当前视频数据块与视频数据的预测子块之间的垂直位移的y分量。如下文进一步详细论述,在例如HEVC的当前视频译码标准中,存在两个帧间预测模式,称为合并(跳过被视为合并的特殊状况)及高级运动向量预测(AMVP)模式。在合并模式中,当前块的MV的值从MV候选的值直接继承,所述MV候选的值可为当前块的相邻块的MV的值。相比之下,在AMVP模式中,MV候选的值可经进一步改进。详细来说,视频译码器可用信号表示MV候选的值与当前块的MV的值之间的差值。差值可被称为运动向量差(MVD)。
然而,存在除平移运动以外的许多种类的运动,例如放大运动、缩小运动、旋转运动、透视运动,及其它不规则运动。在具有不规则运动的这些测试序列中仅仅将平移运动模型应用于MCP可影响预测准确度并可产生低译码效率。举例来说,仅仅使用平移运动模型可产生也不与正经译码的原始块匹配的预测块。因此,残余数据的大小(即,表示待译码的原始块与预测块之间的像素差的值)可增大,这可减小译码效率。
ITU-T VCEG(Q6/16)及ISO/IEC MPEG(JTC 1/SC 29/WG 11)正研究压缩能力显著超过当前HEVC标准的压缩能力的未来视频译码技术的标准化的潜在需要(包含用于屏幕内容译码及高动态范围译码的其当前扩展及近期扩展)。所述群体一起工作,为此探索活动而联合努力(被称为联合视频探索小组(JVET)),以评估由其在此技术领域的专家所提议的压缩技术设计。JVET已发布联合探索模型(JEM),所述联合探索模型将在协调测试模型研究中的译码特征描述为除HEVC的能力以外的潜在增强型视频译码技术。在JEM中,仿射运动模型经提议供应用于MCP。2016年2月20日到26日,美国,圣地亚哥,ITU-T SG 16WP 3及ISO/IECJTC 1/SC 29/WG 11的联合视频探索小组(JVET)第2次会议,文件:JVET-B1001_v3(下文中“JEM测试模型”),JEM的最新算法描述“联合探索测试模型2的算法描述(AlgorithmDescription of Joint Exploration Test Model 2)”可从phenix.it-sudparis.eu/jvet/doc_end_user/documents/2_San%20Diego/wg11/JVET-B1001-v3.zip获得。
当将仿射运动模型用于MCP时,视频译码器可将多个运动向量用于当前块,多个运动向量共同地指示当前视频数据块与视频数据的对应预测子块之间的仿射变换(例如,平移、按比例调整、反射、旋转等)。举例来说,仿射运动模型可包含指示当前块的左上角与对应预测子块的左上角之间的位移的第一二维运动向量,及指示当前块的右上角与对应预测子块的右上角之间的位移的第二二维运动向量。仿射运动模型中的运动向量可被称为控制点运动向量(CPMV)且可参考当前块上的位置(即,控制点)。举例来说,指示当前块的左上角与对应预测子块的左上角之间的位移的二维运动向量可被称为当前块的左上CPMV。如下文进一步详细论述,在JEM测试模型中,存在两个帧间预测模式,仿射帧间(例如,AF_INTER)及仿射合并(例如,AF_MERGE)。
在仿射合并模式中,当前块的每一CPMV的值从正使用仿射运动模型译码的当前块的单个相邻块的CPMV直接导出。换句话说,在仿射合并模式中,仅将相邻块的CPMV变到当前块的CPMV,且不存在改变或调整仿射模型参数的灵活性。详细来说,使用MVD修改CPMV的值是不可能的。
在仿射帧间模式中,用于当前块的每一CPMV的值是基于与对应控制点相邻的块的MV的值及MVD而个别地导出的。确定CPMV所基于的MV的值可被称为控制点运动向量预测子(CPMVP)。作为一个实例,当前块的左上CPMV的值可基于左块、左上块或邻近于当前块的左上点的上方相邻块中的一者的MV及MVD而导出。作为另一实例,当前块的右上CPMV的值可基于右上块或邻近于当前块的右上点的上方相邻块中的一者的MV及MVD而导出。
在HEVC及JEM测试模型两者中,视频编码器可在位流中用信号表示MVD语法(即,表示MVD的所述值的语法元素),以使得MV可在解码器侧被重建。用以用信号表示MVD语法的数据量可与MVD值的大小相关。举例来说,与具有相对较小值的MVD相比,可需要更多数据来用信号表示用于具有相对较大值的MVD的MVD语法。
然而,基于对应控制点的相邻块的MV的值导出每一CPMV的值的当前技术可呈现一或多个缺点。作为一个实例,当前技术不利用当前块的仿射运动模型与相邻块的仿射运动模型的相关性。
根据本发明的一或多种技术,视频译码器可基于视频数据的特定相邻块的仿射运动模型的运动向量的值及当前视频数据块的仿射运动模型的运动向量的值与基于相邻视频数据块的仿射运动模型导出的运动向量的值之间的差值来确定当前视频数据块的仿射运动模型的运动向量的值。举例来说,视频译码器可利用相邻块的CPMV作为当前块的CPMV的CPMVP。因为相邻块的CPMV可与当前块的CMPV相关,因此预测子(例如,CPMVP)与当前块的运动向量(例如,CMPV)之间的差(MVD)可减小。以这种方式,由于用以编码差值的数据量可与差的大小成比例,因此本发明的技术可改进视频压缩的效率。
已在华为技术有限公司“用于下一代视频译码的仿射变换预测(Affinetransform prediction for next generation video coding)”文件ITU-T SG 16(2013研究周期)提案1016(下文中“提案1016”)中开发了四参数仿射运动模型,所述提案1016可从itu.int/md/T13-SG16-C-1016/en获得。提案1016引入下文在方程式(1)中展示的四参数仿射模型。
其中(v0x、v0y)为当前块的左上角的CPMV且(v1x、v1y)为当前块的右上角的CPMV,仿射运动模型(也称作运动向量场(MVF))可根据以下方程式(2)来表示。
上文在方程式(1)中展示的四参数仿射模型可呈现一或多个缺点。详细来说,四参数仿射运动约束x及y分量的仿射参数,从而强迫x及y分量具有对称按比例调整性质。然而,这个约束条件可能在多样化视频内容中并不正确。
根据本发明的一或多种技术,视频译码器可选择性地利用四参数仿射运动模型或六参数仿射运动模型。举例来说,视频解码器可确定是使用上文在方程式(1)中展示的四参数仿射运动模型还是使用下文在方程式(3)中展示的六参数仿射运动模型来译码当前块。
在一些实例中,视频解码器可基于显式信令确定使用哪一仿射运动模型。举例来说,视频译码器可从位流解码指示用于当前视频数据块的仿射运动模型是包括四参数模型还是包括六参数模型的语法元素。在一些实例中,可在由当前视频数据块参考的视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)及切片标头中的一或多者中译码语法元素。在一些实例中,可在包含当前视频数据块的CU的译码单元(CU)层级处译码语法元素。
四参数模型的处理及/或信号表示要求可低于六参数模型的处理及/或信号表示要求。然而,在一些实例中,六参数模型可产生较好匹配正被译码的块的预测块,这可减小残余值的大小。因而,在一些实例中,视频编码器可平衡使用六参数模型编码块的处理及信号表示成本与块的所减少的残余值的益处,并可选择更有利的那一模型。以这种方式,本发明的技术可使用仿射运动模型进一步改进视频压缩的效率。
图1为说明可利用用于执行本发明的仿射运动补偿的技术的实例视频编码及解码系统10的框图。如图1中所示,系统10包含源装置12,源装置12提供待在稍后时间由目的地装置14解码的经编码视频数据。详细来说,源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的“智能”电话的手机、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式发射装置或类似者。在一些状况下,源装置12及目的地装置14可经装备以用于无线通信。
目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中,计算机可读媒体16可包括通信媒体以使源装置12能够实时地将经编码视频数据直接发射到目的地装置14。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将其发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理发射线。通信媒体可形成基于包的网络(例如局域网、广域网或全球网络,例如因特网)的一部分。通信媒体可包含路由器、交换器、基站或任何其它可适用于有助于从源装置12到目的地装置14的通信的装备。
在一些实例中,经编码数据可从输出接口22输出到存储装置。类似地,可由输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一者,例如,硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。目的地装置14可经由流式发射或下载从存储装置存取存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)而存取经编码视频数据。所述数据连接可包含适于存取存储于文件服务器上的经编码视频数据的无线通道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等),或两者的组合。来自存储装置的经编码视频数据的发射可为流式发射、下载发射,或其组合。
本发明的技术不必限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一者,例如,空中电视广播、有线电视发射、卫星电视发射、因特网流式视频发射(例如,经由HTTP的动态自适应流式发射(DASH))、经编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持应用(例如,视频流式发射、视频播放、视频广播及/或视频电话的应用)。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。目的地装置14包含输入接口28、视频解码器30及显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于执行本发明的仿射运动补偿的技术。在其它实例中,源装置及目的地装置可包含其它组件或布置。举例来说,源装置12可从外部视频源18(例如外部相机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而非包含集成式显示装置。
图1的所说明系统10仅为一个实例。用于执行本发明的仿射运动补偿的技术可通过任何数字视频编码及/或解码装置来执行。尽管本发明的技术通常由视频编码装置执行,但所述技术也可由视频编码器/解码器(通常被称为“CODEC”)执行。此外,本发明的技术也可由视频预处理器执行。源装置12及目的地装置14仅为源装置12产生经译码视频数据以用于发射到目的地装置14的这些译码装置的实例。在一些实例中,装置12、14可以大体上对称的方式操作,使得装置12、14中的每一者包含视频编码及解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射以用于(例如)视频流式发射、视频播放、视频广播或视频电话。
源装置12的视频源18可包含视频俘获装置,例如摄像机、含有先前俘获的视频的视频存档及/或用于从视频内容提供者接收视频的视频馈入接口。作为另一替代,视频源18可产生基于计算机图形的数据作为源视频,或实况视频、经存档视频及计算机产生的视频的组合。在一些状况下,如果视频源18为摄像机,那么源装置12及目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术一般可适用于视频译码,且可适用于无线及/或有线应用。在每一状况下,俘获、预先俘获或计算机产生的视频可由视频编码器20编码。经编码视频信息可接着由输出接口22输出到计算机可读媒体16上。
计算机可读媒体16可包含暂时性媒体,例如无线广播或有线网络发射,或存储媒体(即,非暂时性存储媒体),例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(未展示)可从源装置12接收经编码视频数据,且(例如)经由网络发射将经编码视频数据提供到目的地装置14。类似地,媒体生产设施(例如光盘冲压设施)的计算装置可从源装置12接收经编码视频数据且生产含有经编码视频数据的光盘。因此,在各种实例中,可理解计算机可读媒体16包含各种形式的一或多个计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息,其也由视频解码器30使用,其包含描述块及其它经译码单元的特性及/或处理的语法元素。显示装置32将经解码视频数据显示给用户,且可包括多种显示装置中的任一者,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据视频译码标准操作,例如,高效视频译码(HEVC)标准,也被称作ITU-T H.265。替代地,视频编码器20及视频解码器30可根据其它专有或行业标准(例如ITU-T H.264标准,替代地被称作MPEG-4,第10部分,高级视频译码(AVC))或这些标准的扩展来操作。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包含MPEG-2及ITU-T H.263。尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当MUX-DEMUX单元或其它硬件及软件以处置共同数据流或单独数据流中的音频及视频两者的编码。如果适用,那么MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
视频编码器20及视频解码器30各自可实施为多种合适编码器电路中的任一者,例如一或多个微处理器、处理电路(包含固定功能电路及/或可编程处理电路)、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且在硬件中使用一或多个处理器执行指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一或多个编码器或解码器中,编码器或解码器中的任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
大体而言,根据ITU-T H.265,可将视频图片划分成可包含明度样本及色度样本两者的一连串译码树单元(CTU)(或最大译码单元(LCU))。替代地,CTU可包含单色数据(即,仅明度样本)。位流内的语法数据可定义CTU的大小,CTU就像素的数目而言为最大译码单元。切片包含按译码次序的数个连续CTU。视频图片可分割成一或多个切片。每一CTU可根据四分树而分裂成译码单元(CU)。大体而言,四分树数据结构每CU包含一个节点,其中根节点对应于CTU。如果CU分裂成四个子CU,那么对应于所述CU的节点包含四个叶节点,所述四个叶节点中的每一者对应于所述子CU中的一者。
四分树数据结构中的每一节点可提供对应CU的语法数据。举例来说,四分树中的节点可包含分裂标志,从而指示对应于所述节点的CU是否分裂成子CU。针对CU的语法元素可经递回地定义,且可取决于所述CU是否分裂成子CU。如果CU未经进一步分裂,那么其被称作叶CU。在本发明中,即使不存在原始叶CU的明显分裂,叶CU的四个子CU也将被称作叶CU。举例来说,如果16×16大小的CU未进一步分裂,那么四个8×8子CU也将被称作叶CU,尽管所述16×16CU从未分裂。
除CU不具有大小区别外,CU具有与H.264标准的宏块类似的用途。举例来说,CTU可分裂成四个子节点(也被称作子CU),且每一子节点转而可为父节点且可分裂成另外四个子节点。被称作四分树的叶节点的最终的未分裂子节点包括译码节点,所述译码节点也被称作叶CU。与经译码位流相关联的语法数据可定义可分裂CTU的最大次数(其被称作最大CU深度),且也可定义译码节点的最小大小。因此,位流也可定义最小译码单元(SCU)。本发明使用术语“块”指代在HEVC的上下文中的CU、预测单元(PU)或变换单元(TU),或在其它标准的上下文中的类似数据结构(例如,在H.264/AVC中的宏块及其子块)中的任一者。
CU包含译码节点以及与所述译码节点相关联的预测单元(PU)及变换单元(TU)。CU的大小对应于译码节点的大小,且大体上为正方形形状。CU的大小范围可从8×8像素直到具有最大大小(例如,64×64像素或更大)的CTU的大小。每一CU可含有一或多个PU及一或多个TU。与CU相关联的语法数据可描述(例如)将CU分割成一或多个PU。分割模式可在CU经跳过或直接模式编码、帧内预测模式编码或是帧间预测模式编码之间不同。PU可分割成非正方形形状。与CU相关联的语法数据也可描述(例如)根据四分树将CU分割成一或多个TU。TU可为正方形或非正方形(例如,矩形)形状。
HEVC标准允许根据TU进行变换,所述变换对于不同CU可不同。TU通常基于经定义用于分割CTU的给定CU内的PU(CU的分割区)的大小而设定大小,但未必总是如此。TU通常与PU(或例如,在帧内预测的状况下,CU的分割区)有相同的大小或小于PU。在一些实例中,可使用被称为“残余四分树”(RQT)的四分树结构而将对应于CU的残余样本再分为较小单元。可将RQT的叶节点称作变换单元(TU)。与TU相关联的像素差值可经变换以产生可加以量化的变换系数。
叶CU可在使用帧间预测进行预测时包含一或多个预测单元(PU)。大体而言,PU表示对应于对应CU的全部或一部分的空间区域,且可包含用于针对PU检索及/或产生参考样本的数据。此外,PU包含与预测有关的数据。当CU经帧间模式编码时,CU的一或多个PU可包含定义运动信息的数据,例如一或多个运动向量,或PU可经跳过模式译码。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片,及/或运动向量的参考图片列表(例如,列表0或列表1)。
叶CU也可经帧内模式预测。一般来说,帧内预测涉及使用帧内模式预测叶CU(或其分割区)。视频译码器可选择一组与叶CU相邻的先前经译码像素以用以预测所述叶CU(或其分割区)。
叶CU也可包含一或多个变换单元(TU)。如上文所论述,可使用RQT(也称作TU四分树结构)来指定所述变换单元。举例来说,分裂标志可指示叶CU是否分裂成四个变换单元。接着,每一TU可进一步分裂成其它子TU。当TU未进一步分裂时,可将所述TU称作叶TU。大体而言,对于帧内译码而言,属于叶CU的所有叶TU共享相同的帧内预测模式。即,一般应用同一帧内预测模式来计算叶CU的所有TU的预测值。对于帧内译码,视频编码器可使用帧内预测模式将每一叶TU的残余值计算为CU的对应于所述TU的部分与原始块之间的差。TU不必限于PU的大小。因此,TU可大于或小于PU。对于帧内译码,CU的分割区或CU自身可与CU的对应叶TU共置。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU也可与相应四分树数据结构(被称作残余四分树(RQT))相关联。即,叶CU可包含指示所述叶CU如何被分割成TU的四分树。TU四分树的根节点大体对应于叶CU,而CU四分树的根节点大体对应于CTU(或LCU)。将RQT的未被分裂的TU称作叶TU。一般来说,除非另有指示,否则本发明分别使用术语CU及TU来指叶CU及叶TU。
视频序列通常包含一系列视频帧或图片,开始于随机存取点(RAP)图片。视频序列可包含序列参数集(SPS)中的语法数据,其视频序列的特性。图片的每一切片可包含描述所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定译码标准而大小不同。
作为一实例,可针对各种大小的PU执行预测。假定特定CU的大小为2N×2N,那么可对2N×2N或N×N的PU大小执行帧内预测,且对2N×2N、2N×N、N×2N或N×N的对称PU大小执行帧间预测。也可针对2N×nU、2N×nD、nL×2N及nR×2N的PU大小执行帧间预测的不对称分割。在不对称分割中,CU的一方向未分割,而另一方向分割成25%及75%。CU的对应于25%分割的部分由“n”加上“上(Up)”、“下(Down)”、“左(Left)”或“右(Right)”的指示来指示。因此,例如,“2N×nU”指水平地以顶部的2N×0.5N PU及底部的2N×1.5N PU分割的2N×2NCU。
在本发明中,“N×N”与“N乘N”可互换地使用以指视频块在垂直尺寸与水平尺寸方面的像素尺寸,例如,16×16像素或16乘16像素。一般来说,16×16块在垂直方向上将具有16个像素(y=16)且在水平方向上将具有16个像素(x=16)。同样地,N×N块通常在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。可按行及列来排列块中的像素。此外,块未必需要在水平方向上与垂直方向上具有同一数目个像素。举例来说,块可包括N×M个像素,其中M未必等于N。
视频译码标准中广泛使用图片次序计数(POC)以识别图片的显示次序。尽管存在一个经译码视频序列内的两个图片可具有相同POC值的状况,但经译码视频序列内通常不发生这类状况。当位流中存在多个经译码视频序列时,就解码次序而言,具有同一POC值的图片可更接近于彼此。图片的POC值通常用于参考图片列表构建、如HEVC中的参考图片集的导出及运动向量按比例调整。
HEVC中的运动补偿用以产生当前帧间块的预测子。使用四分之一像素准确度运动向量且在分数位置处的像素值使用用于明度分量及色度分量两者的相邻整数像素值来内插。
在HEVC中,对于每一块,运动信息的集合可为可用的。运动信息的集合含有用于前向及后向预测方向的运动信息。在此,前向及后向预测方向为双向预测模式的两个预测方向,且术语“前向”及“后向”未必具有几何含义;实情为其对应于当前图片的参考图片列表0(RefPicList0)及参考图片列表1(RefPicList1)。当仅仅一个参考图片列表可供用于图片或切片时,仅仅RefPicList0为可用的,且切片的每一块的运动信息始终为前向的。
对于每一预测方向,运动信息必须含有参考索引及运动向量。在一些状况下,为简单起见,可以假设运动向量自身具有相关联参考索引的方式参考所述运动向量。参考索引用于识别当前参考图片列表(RefPicList0或RefPicList1)中的参考图片。运动向量具有水平分量及垂直分量。
在HEVC标准中,对于预测单元(PU)存在两个帧间预测模式,分别命名为合并(跳过被视为合并的特殊状况)及高级运动向量预测(AMVP)模式。在AMVP或合并模式中,针对多个运动向量预测子维持运动向量(MV)候选列表。当前PU的运动向量(以及合并模式中的参考索引)通过从MV候选列表获取一个候选而产生。
MV候选列表针对合并模式含有达五个候选且针对AMVP模式含有仅两个候选。合并候选可含有一组运动信息,例如,对应于两个参考图片列表(列表0及列表1)的运动向量及参考索引。如果由合并索引来识别合并候选,那么参考图片用于当前块的预测,以及确定相关联的运动向量。然而,在AMVP模式下,对于从列表0或列表1的每一潜在预测方向,需要明确地将参考索引连同针对MV候选列表的MVP索引一起用信号表示,这是因为AMVP候选仅含有运动向量。在AMVP模式中,可进一步改进经预测运动向量。
如上文可见,合并候选可对应于运动信息的整个集合,而AMVP候选可仅含有用于特定预测方向的一个运动向量及参考索引。以类似方式从相同空间及时间相邻块导出用于两个模式的候选。用于合并及AMVP模式的空间相邻候选的其它细节在下文中参考图4而论述。
视频编码器20及视频解码器30可经配置以使用仿射运动模型执行运动补偿。举例来说,相较于仅仅使用具有单个二维运动向量的平移运动模型(即,如在HEVC中),视频编码器20及视频解码器30可利用包含多个运动向量的仿射运动模型。下文论述使用仿射运动模型的其它细节。
在使用CU的PU的帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包括描述在空间域(也称为像素域)中产生预测性像素数据的方法或模式的语法数据,且TU可包括在对残余视频数据应用变换(例如离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)之后变换域中的系数。残余数据可对应于未经编码的图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含表示CU的残余数据的经量化变换系数的TU。即,视频编码器20可计算残余数据(以残余块的形式)、变换残余块以产生变换系数的块,且接着量化变换系数以形成经量化变换系数。视频编码器20可形成包含经量化变换系数的TU,以及其它语法信息(例如,TU的分裂信息)。
如上文所提及,在任何变换以产生变换系数后,视频编码器20可执行变换系数的量化。量化通常指变换系数经量化以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。所述量化过程可减小与所述系数中的一些或所有相关联的位深度。举例来说,可在量化期间将n位值降值舍位到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而从包含经量化变换系数的二维矩阵产生一维向量。扫描可经设计以将较高能量(且因此较低频率)系数置于阵列前部,及将较低能量(且因此较高频率)系数置于阵列后部。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数以产生可经熵编码的系列化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法而熵编码一维向量。视频编码器20还可熵编码与经编码的视频数据相关联的供由视频解码器30用于解码视频数据的语法元素。
为执行CABAC,视频编码器20可将上下文模型内的上下文指配到待发射的符号。所述上下文可能涉及(例如)符号的邻近值是否为非零。为执行CAVLC,视频编码器20可选择用于待发射的符号的可变长度码。可将VLC中的码字构建成使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以这种方式,相对于(例如)针对待发射的每一符号使用相等长度码字,使用VLC可达成位节省。概率确定可基于经指配到符号的上下文而进行。
大体而言,视频解码器30执行尽管与由视频编码器20执行的过程互逆但与其大体上类似的过程,以解码经编码数据。举例来说,视频解码器30反量化且反变换所接收TU的系数以再生残余块。视频解码器30使用经信号表示预测模式(帧内预测或帧间预测)以形成经预测块。接着视频解码器30(在逐像素基础上)使经预测块与残余块组合以再生原始块。可执行额外处理,例如执行解块过程以减少沿块边界的视觉伪影。另外,视频解码器30可以尽管与视频编码器20的CABAC编码过程互逆但与其大体上类似的方式使用CABAC解码语法元素。
视频编码器20可进一步(例如)在图片标头、块标头、切片标头中将语法数据(例如基于块的语法数据、基于图片的语法数据及基于序列的语法数据)发送到视频解码器30,或发送其它语法数据,例如序列参数集(SPS)、图片参数集(PPS)或视频参数集(VPS)。
视频编码器20及视频解码器30各自可经实施为可适用的多种合适的编码器或解码器电路中的任一者,例如一或多个微处理器、处理电路(包含固定功能电路及/或可编程处理电路)、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20及视频解码器30中的每一者可包含在一或多个编码器或解码器中,编码器或解码器中的任一者可经集成为组合式编码器/解码器(CODEC)的部分。包含视频编码器20及/或视频解码器30的装置可包括集成电路、微处理器及/或无线通信装置(例如蜂窝式电话)。
图2为说明可实施用于执行本发明的仿射运动补偿的技术的视频编码器20的实例的框图。视频编码器20可执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减少或去除视频序列的相邻帧或图片内的视频的时间冗余。帧内模式(I模式)可指代若干基于空间的译码模式中的任一者。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指若干基于时间的译码模式中的任一者。
如图2中所展示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包含模式选择单元40、参考图片存储器64(其也可被称作经解码图片缓冲器(DPB))、求和器50、变换处理单元52、量化单元54及熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46及分割单元48。为了视频块重新构建,视频编码器20还包含反量化单元58、反变换单元60及求和器62。还可包含解块滤波器(图2中未展示)以对块边界滤波以从经重建的视频去除块效应伪影。如果需要,解块滤波器将通常滤波求和器62的输出。除了解块滤波器外,还可使用额外滤波器(回路中或回路后)。为简洁起见未展示这类滤波器,但如果需要,这类滤波器可对求和器50的输出进行滤波(作为回路内滤波器)。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。可将帧或切片划分成多个视频块。运动估计单元42及运动补偿单元44执行所接收视频块相对于一或多个参考帧中的一或多个块的帧间预测性编码以提供时间预测。帧内预测单元46可替代地执行所接收视频块相对于与待译码块相同的帧或切片中的一或多个相邻块的帧内预测性编码以提供空间预测。视频编码器20可执行多个译码遍次,(例如)以选择用于每一视频数据块的适当译码模式。
此外,分割单元48可基于对先前译码遍次中的先前分割方案的评估而将视频数据的块分割成子块。举例来说,分割单元48可首先将帧或切片分割成CTU,且基于位率-失真分析(例如,位率-失真优化)来将所述CTU中的每一者分割成子CU。模式选择单元40可进一步产生指示将CTU分割为子CU的四分树数据结构。四分树的叶节点CU可包含一或多个PU及一或多个TU。
模式选择单元40可选择预测模式、帧内或帧间中的一者(例如,基于错误结果),且将所得预测块提供到求和器50以产生残余数据且提供到求和器62以重建经编码块以作为参考帧使用。模式选择单元40也将语法元素(例如,运动向量、帧内模式指示符、分割区信息及其它这类语法信息)提供到熵编码单元56。
运动估计单元42及运动补偿单元44可高度集成,但出于概念目的而单独说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。举例来说,运动向量可指示在当前视频帧或图片内的视频块的PU相对于在参考图片(或其它经译码单元)内的预测性块相对于在所述当前图片(或其它经译码单元)内正经译码的当前块的位移。预测性块为依据像素差被发现紧密地匹配于待译码块的块,所述像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差度量予以确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置及分数像素位置的运动搜索且输出具有分数像素精度的运动向量。
运动估计单元42通过将PU的位置与参考图片的预测性块的位置比较而计算经帧间译码切片中的视频块的PU的运动向量。参考图片可从第一参考图片列表(列表0)或第二参考图片列表(列表1)选择,所述列表中的每一者识别存储于参考图片存储器64中的一或多个参考图片。运动估计单元42将经计算运动向量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量提取或产生预测性块。再次,在一些实例中,运动估计单元42与运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可在参考图片列表中的一者中定位运动向量所指向的预测性块。求和器50通过从正经译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值,如下文所论述。一般来说,运动估计单元42相对于明度分量而执行运动估计,且运动补偿单元44将基于明度分量所计算的运动向量用于色度分量与明度分量两者。模式选择单元40还可产生与视频块及视频切片相关联的语法元素以供视频解码器30在解码视频切片的视频块过程中使用。
视频编码器20可经配置以执行上文关于图1所论述的本发明的各种技术中的任一者,并将如下文更详细地描述。举例来说,运动补偿单元44可经配置以根据HEVC使用AMVP或合并模式译码视频数据块的运动信息,及/或可经配置以根据本发明的技术使用仿射帧间模式或仿射合并模式译码仿射运动信息或视频数据块。
如上文所描述,作为由运动估计单元42及运动补偿单元44执行的帧间预测的替代方案,帧内预测单元46可对当前块进行帧内预测。详细来说,帧内预测单元46可确定待用以编码当前块的帧内预测模式。在一些实例中,帧内预测单元46可(例如)在分开的编码遍次期间使用各种帧内预测模式编码当前块,且帧内预测单元46(或在一些实例中为模式选择单元40)可从测试模式中选择适当帧内预测模式来使用。
举例来说,帧内预测单元46可使用对于各种所测试的帧内预测模式的位率-失真分析来计算位率-失真值,且在所测试的模式之中选择具有最佳位率-失真特性的帧内预测模式。位率-失真分析大体上确定经编码块与原始、未编码块(其经编码以产生经编码块)之间的失真(或错误)量,以及用以产生经编码块的位率(即,位的数目)。帧内预测单元46可根据不同经编码块的失真及位率来计算比率以确定哪一帧内预测模式展现所述块的最佳位率-失真值。
在为块选择帧内预测模式之后,帧内预测单元46可将指示用于所述块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可编码指示所选择的帧内预测模式的信息。视频编码器20可在经发射位流中包含以下各者:配置数据,其可包含多个帧内预测模式索引表及多个经修改帧内预测模式索引表(也被称作码字映射表);各种块的编码上下文的定义;及待用于所述上下文中的每一者的最可能帧内预测模式、帧内预测模式索引表及经修改帧内预测模式索引表的指示。
视频编码器20通过从正被译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行所述减法运算的一或多个组件。变换处理单元52将变换(例如离散余弦变换(DCT)或概念上类似的变换)应用于残余块,从而产生包括残余变换系数值的视频块。可使用小波变换、整数变换、子频带变换、离散正弦变换(DST)或其它类型的变换,而不是DCT。在任何状况下,变换处理单元52将变换应用于残余块,从而产生变换系数块。所述变换可将残余信息从像素域转换到变换域,例如,频域。变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减少位速率。所述量化过程可减小与所述系数中的一些或所有相关联的位深度。可通过调整量化参数来修改量化程度。
在量化之后,熵编码单元56熵译码经量化变换系数。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的状况下,上下文可基于相邻块。在由熵编码单元56进行熵译码之后,可将经编码位流发射到另一装置(例如,视频解码器30)或加以存档以供稍后发射或检索。
反量化单元58及反变换单元60相应地应用反量化及反变换以重建像素域中的残余块。详细来说,求和器62将经重建残余块添加到由运动补偿单元44或帧内预测单元46产生的运动补偿预测块,以产生用于存储于参考图片存储器64中的经重建的视频块。所述经重建的视频块可由运动估计单元42及运动补偿单元44使用,作为参考块以对后续视频帧中的块进行帧间译码。
图3为说明可实施用于执行本发明的仿射运动补偿的技术的视频解码器30的实例的框图。在图3的实例中,视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、反量化单元76、反变换单元78、参考图片存储器82及求和器80。在一些实例中,视频解码器30可执行大体上与关于视频编码器20(图2)所描述的编码遍次互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据,而帧内预测单元74可基于从熵解码单元70接收的帧内预测模式指示符产生预测数据。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块及相关联的语法元素的经编码视频位流。视频解码器30的熵解码单元70熵解码位流以产生经量化系数、运动向量或帧内预测模式指示符及其它语法元素。熵解码单元70将运动向量及其它语法元素转递到运动补偿单元72。视频解码器30可在视频切片层级及/或视频块层级接收语法元素。
当视频切片经译码为经帧内译码(I)切片时,帧内预测单元74可基于信号表示帧内预测模式及来自当前帧或图片的先前经解码块的数据来产生用于当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(即,B或P)切片时,运动补偿单元72基于从熵解码单元70接收的运动向量及其它语法元素而产生当前视频切片的视频块的预测性块。可从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可基于存储于参考图片存储器82中的参考图片使用默认构建技术来构建参考帧列表:列表0及列表1。
运动补偿单元72通过剖析运动向量及其它语法元素来确定当前视频切片的视频块的预测信息,且使用所述预测信息产生正经解码的当前视频块的预测性块。举例来说,运动补偿单元72使用所接收的语法元素中的一些以确定用以译码视频切片的视频块的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片或P切片)、用于所述切片的参考图片列表中的一或多者的构建信息、用于所述切片的每一经帧间编码视频块的运动向量、用于所述切片的每一经帧间译码视频块的帧间预测状态及用以解码当前视频切片中的视频块的其它信息。
视频解码器30可经配置以执行上文关于图1所论述的本发明的各种技术中的任一者,并如将在下文更详细地论述。举例来说,运动补偿单元72可经配置以根据HEVC使用AMVP或合并模式执行运动向量预测,及/或可经配置以根据本发明的技术使用仿射帧间模式或仿射合并模式执行仿射运动信息或视频数据块。熵解码单元70可解码表示运动信息如何经译码用于当前块的一或多个语法元素。
运动补偿单元72还可执行基于内插滤波器的内插。运动补偿单元72可使用如由视频编码器20在编码视频块期间使用的内插滤波器来计算参考块的子整数像素的内插值。在这种状况下,运动补偿单元72可根据接收的语法元素确定由视频编码器20使用的内插滤波器且使用内插滤波器来产生预测性块。
反量化单元76反量化(即,解量化)位流中所提供,并由熵解码单元70解码的经量化的变换系数。反量化过程可包含使用视频解码器30针对视频切片中的每一视频块计算的量化参数QPY以确定应应用的量化程度及同样地应应用的反量化程度。
反变换单元78将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数,以便在像素域中产生残余块。
在运动补偿单元72基于运动向量及其它语法元素产生当前视频块的预测性块后,视频解码器30通过对来自反变换单元78的残余块与由运动补偿单元72产生的对应预测性块求和而形成经解码的视频块。求和器80表示执行所述求和运算的所述或所述组件。必要时,还可应用解块滤波器来对经解码块进行滤波以便去除块效应伪影。其它回路滤波器(在译码回路中或在译码回路之后)还可用于使像素转变平滑,或另外改进视频质量。接着将给定帧或图片中的经解码的视频块存储于参考图片存储器82中,所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器82还存储经解码视频以用于稍后在显示装置(例如,图1的显示装置32)上呈现。
图4A及4B为说明高效视频译码(HEVC)中的空间相邻候选的概念图。如上文所论述,空间MV候选可从特定PU(PU0)的相邻块导出,但从块产生候选的方法对于合并及AMVP模式而不同。
图4A说明视频译码器可如何在合并模式中导出空间MV候选的实例。在合并模式中,可使用图4A上以数字展示的次序导出至多四个空间MV候选,且次序如下:左(0)、上(1)、右上(2)、左下(3)及左上(4),如图4A所示。
图4B说明视频译码器可如何在AVMP模式中导出空间MV候选的实例。在AVMP模式中,相邻块经划分成两个群:由块0及块1组成的左侧群,及由块2、块3及块4组成的上方群,如图4B上所展示。对于每一群,参考与由用信号表示的参考索引所指示相同的参考图片的相邻块中的潜在候选具有待选择的最高优先权以形成所述群的最终候选。有可能所有相邻块均不含有指向相同参考图片的运动向量。因此,如果无法发现这类候选,那么将按比例调整第一可用候选以形成最终候选,因此可补偿时间距离差。
图5为说明具有四个仿射参数的两点运动向量仿射的概念图。如图5中所示,当前块500的左上角502的CPMV表示为v0的(v0x、v0y)且当前块500的右上角504的CPMV表示为v1的(v1x、v1y)。如上文所论述,当前块500的CMPV可形成根据上述方程式(2)表示的运动向量场(MVF)。
在JEM测试模型中,仿射运动预测仅仅应用于正方形块。作为自然延伸,仿射运动预测可应用于非正方形块。
图6为说明仿射帧间模式的概念图。对于具有等于或大于16×16的大小的块(例如,CU/PU),视频译码器(例如,视频编码器20及/或视频解码器30)可应用如下的仿射帧间(AF_INTER)模式。在一些实例中,如果当前块(例如,当前CU/PU)在仿射帧间模式中,那么视频译码器可在位流中用信号表示在CU/PU层级中的仿射标志。视频译码器可使用当前块的相邻有效经重建块的运动向量构建当前块的候选运动向量列表。举例来说,如实例图6中所示,左上CPMV v0的候选运动向量预测子可选自块602A、602B及602C(即,与当前块600的左上角接触的相邻块)的运动向量。视频译码器可根据参考列表及用于相邻块的参考的POC、用于当前CU/PU的参考的POC及当前CU/PU的POC之间的关系按比例调整来自相邻块的运动向量。视频译码器可执行类似方法以从相邻块602D及602E(即,与当前块600的右上角接触的相邻块)选择右上CPMV v1的候选运动向量预测子。因而,在一些实例中,候选列表可表示为{(v0,v1)|v0={v602A,v602B,v602C},v1={v602D,v602E}}。
如果候选列表的数目小于阈值(例如,二、三或四),那么视频译码器可指配AMVP的候选到v0及v1。视频译码器可利用当前块的位率-失真优化(RDO)成本以确定哪一(v0,v1)选择作为当前块的控制点运动向量预测(CPMVP)。视频译码器可在位流中用信号表示索引以指示CPMVP在候选列表中的位置。
基于当前仿射块的CPMVP,视频译码器可应用仿射运动估计以确定CPMV。视频译码器可译码位流中的CPMV与CPMVP之间的差的表示。
视频译码器可执行如上文所描述的仿射运动补偿预测以产生当前块的残余。视频译码器可变换及量化当前块的所产生残余,且将经量化残余译码到位流中(例如,以类似于HEVC的方式)。
图7A及7B为说明仿射合并模式的候选的概念图。当将仿射合并(AF_MERGE)模式应用于当前块时,视频译码器(例如,视频编码器20及/或视频解码器30)可从当前块的有效相邻经重建块获得以仿射模式译码的第一块。在一些实例中,视频译码器可按特定选择次序剖析相邻经重建块以获得以仿射模式译码的第一块。图7A说明实例选择次序。如图7A中所示,选择次序可如下:左块702A、上块702B、右上块702C、左下块702D到左上块702E。
图7B说明其中左块按选择次序为以仿射模式译码的第一块的实例。如图7B中所示,视频译码器可导出含有所选择块1002A的CU/PU 704的左上角(v2)、右上角(v3)及左下角(v4)的运动向量。视频译码器可基于所选择块的所导出运动向量(即,v2、v3及v4)确定/计算当前块700的左上角的运动向量(即,v0)及当前块700的右上角的运动向量(即,v1)。
视频译码器可根据上文在方程式(2)中所描述的简化仿射运动模型基于当前块700的CPMV v0及v1确定当前块700的MVF。视频译码器可使用如上文所描述的MVF应用仿射MCP。
为了识别当前块是否以仿射合并模式译码,视频译码器可在存在以仿射模式译码的至少一个相邻块时在位流中用信号表示仿射标志。如果不存在当前块的仿射块相邻者,那么视频译码器可省略在位流中译码仿射标志或可译码仿射标志以指示不存在当前块的仿射块相邻者。
如上文所论述,现有仿射运动模型方法(例如,在JEM测试模型及提案1016中)呈现若干问题及/或具有若干缺点。作为一个实例,在提案1016中,四参数仿射运动已对MVx及MVy中的仿射参数提出约束条件,从而强迫MVx及MVy具有对称按比例调整性质。所述约束条件可能在多样化视频内容中并不正确。
作为另一实例,仿射合并模式依赖于主要依赖于左下角及右上角的预定义检查次序。所述预定义次序已使左上角处于最低优先权,同时在以下仿射模型推导中大量地使用所述角信息。
作为另一实例,仿射合并可仅仅通过将相邻块角MV变成当前块角而继承相邻模型。当继承相邻仿射模型时不存在改变或调整仿射模型参数的灵活性。
根据本发明的一或多种技术,视频译码器可译码指示如何识别视频数据的预测子块的语法元素。举例来说,视频译码器可译码指示是使用四参数仿射模型还是六参数仿射模型来识别当前视频数据块的视频数据的预测子块的语法元素。通过使得能够在四参数仿射模型与六参数仿射模型之间选择,本发明的技术可使得运动向量能够具有非对称按比例调整性质,这可改进译码效率。
在一些实例中,视频译码器可译码在译码单元(CU)层级的语法元素。举例来说,标志可在CU层级中引入以指示是将四参数仿射运动模型还是六参数仿射运动模型用于CU中的当前块。
在一些实例中,视频译码器可在通过当前视频数据块参考的跳过模式语法或合并模式语法中译码语法元素。举例来说,标志可在跳过或合并模式中引入以指示是将四参数仿射运动模型还是六参数仿射运动模型用于当前块。
在一些实例中,视频译码器可在通过当前视频数据块参考的帧间模式语法中译码语法元素。举例来说,标志可在帧间模式(在当前块既不是跳过模式也不是合并模式的情况下)中引入以指示是将四参数仿射运动模型还是六参数仿射运动模型用于当前块。
在一些实例中,相较于仅仅指示是使用四参数仿射模型还是六参数仿射模型识别当前视频数据块的视频数据的预测子块,视频译码器可译码语法元素以指示是使用单个运动向量、四参数仿射模型、六参数仿射模型还是可切换四/六参数仿射模型识别当前视频数据块的视频数据的预测子块。举例来说,可呈现序列参数集(SPS)、图片参数集(PPS)及/或切片标头中的一个语法元素以用信号表示以下状况中的哪一者用于当前序列/图片/切片:1)停用仿射,2)4参数仿射,3)6参数仿射,4)4/6可切换仿射。可使用一元、截短一元或固定长度码字译码语法元素。
在一些实例中,视频译码器可译码指示用以识别视频数据的预测子块的仿射模型中使用的参数的数目是否为可切换的启用语法元素。举例来说,视频译码器可译码序列参数集(SPS)、图片参数集(PPS)及/或切片标头中的标志以指示可切换仿射模型是否经启用用于参考SPS或PPS或切片标头的图片。
在启用语法元素指示在用以识别视频数据的预测子块的仿射模型中使用的参数的数目为可切换的情况下(例如,在启用语法元素为具有值1的标志的情况下),视频译码器可译码指示是四参数还是六参数仿射模型用以识别如上文所论述的当前视频数据块的视频数据的预测子块的语法元素。举例来说,在启用语法元素指示在用以识别视频数据的预测子块的仿射模型中使用的参数的数目为可切换的情况下(例如,在启用语法元素为具有值1的标志的情况下),四参数仿射模型及六参数仿射模型两者均被启用且用于每一块的额外标志可用信号表示以指示四参数模型或六参数模型的使用情况。
在启用语法元素指示在用以识别视频数据的预测子块的仿射模型中使用的参数的数目并不可切换的情况下(例如,在启用语法元素为具有值0的标志的情况下),视频译码器可确定四参数仿射模型被使用(即,在使用仿射的情况下)。在这些实例中,视频译码器可省略指示是四参数还是六参数仿射模型用以识别当前视频数据块的视频数据的预测子块的语法元素的译码。
在一些实例中,上文所描述的语法元素(即,仿射参数(四参数或六参数)标志及/或启用语法元素)中的一或多者可取决于相邻块仿射参数使用情况使用CABAC上下文模型来译码。在一个实例中,当前仿射参数上下文索引CtxVal取决于左及上相邻块。如果左相邻块不可用,或并非仿射模式,或六参数仿射,那么leftCtx设定为等于0;否则(左相邻块可用,且为六参数仿射模式),leftCtx设定为等于1。类似计算可针对上相邻块而计算以得到aboveCtx。接着,当前块的CtxVal设定为等于leftCtx+aboveCtx。在这种状况下,CtxVal在[0,2]范围内(0、2包含在内)。设定leftCtx(aboveCtx)的其它变体也是可能的。举例来说,如果左(上)相邻块不可用或并不经仿射译码,那么leftCtx(aboveCtx)设定为等于0;如果左(上)相邻块正使用四参数仿射,那么设定为等于1;如果左(上)相邻块正使用六参数仿射,那么设定为等于2。在这种状况下,CtxVal在[0,4]范围内(0、4包含在内)。
在一些实例中,上文所描述的语法元素(即,仿射参数(四参数或六参数)标志及/或启用语法元素)中的一或多者可取决于当前块大小使用CABAC上下文模型来译码且块大小阈值可用于区分不同上下文。举例来说,上下文0用于等于或小于16×16的块大小;而上下文1用于大于16×16的块大小。阈值可经预定义或在位流中用信号表示。块的大小可单独地或联合地由当前块的宽度及高度指定。举例来说,大小可由宽度×高度的值表示。
在一些实例中,上文所描述的语法元素(即,仿射参数(四参数或六参数)标志及/或启用语法元素)中的一或多者也可在无任何上下文的情况下使用CABAC旁路模式来译码。
图8为说明根据本发明的一或多种技术的六参数仿射运动模型的概念图。四参数仿射模型可包含两个运动向量且六参数仿射模型可包含三个运动向量。在一些实例中,例如当使用六参数仿射运动模型时,视频译码器可针对帧间模式在位流中译码三个运动向量差(MVD)。三个运动向量预测子可由相邻运动向量产生,或从相邻运动向量导出。相邻运动向量可为或可不为仿射运动向量。举例来说,当前块中的在当前块800的三个角中的三个运动向量v0(MV0)、v1(MV1)及v2(MV2)可如图8中所示而待译码。为了预测v0,802A(左上)、802B(上)及802C(左)的运动向量为可能的候选。类似地,802D(上)及802E(右上)的运动向量为用于预测v1的可能候选,且802F(左)及802G(左下)的运动向量为用于预测v2的可能候选。在一些实例中,在预定义检查次序中的每一位置的第一可用候选直接用作其预测子。
三个运动向量预测子可选自使用验证、分选及去复制方案的组合的一列表,且仅仅前几个K组合用作可能预测子,其中K>=1。在一些实例中,视频译码器可使用相邻可用运动向量产生所有预测子的完整组合。如图8中所示,可存在总共3×2×2=12个组合。
在第一步骤中,对于每一组合,视频译码器可执行验证检查。如果MV0等于MV1且MV0等于MV2,那么所述组合无效;否则,所述组合有效。在第二步骤中,视频译码器可基于参数类似性执行分选。举例来说,如果当前块使用如下六参数仿射模式(其中a、b、c、d、e及f为模型参数),那么可根据下文再现的方程式(3)表示仿射运动模型。
使用六参数仿射模型,三个角运动向量可表示如下:
图9为说明根据本发明的一或多种技术的仿射运动向量评估的概念图。为了评估模型正确性,本发明引入称为估计差(ED)的参数。同时,在如图9中所示定位于宽度的一半及高度的一半的相邻块902H及902I中突出显示的两个相邻块MV可用于评估过程中。因此,存在:
在所有组合当中,前几个K最小ED组合可经选择为最终预测子。以下为实例ED计算:
视频译码器可将ED设定为等于上述四个元素的和。
ED=Δa+Δb+Δd+Δe (7)
在一些实例中,视频译码器可基于仿射运动向量类似性执行分选。在一个实例中,给定三个运动向量,视频译码器可使用六参数仿射模型预测第四个运动向量。预测差可添加在ED中且具有最小ED之前几个组合可经选择为MV预测候选。
可使用四参数仿射模型跨越其它预测子产生运动向量预测子。举例来说,给定前两个经重建MV,视频译码器可使用四参数仿射模型产生第三个MV预测子。举例来说,可通过使用上述方程式(2)基于当前块的MV0及MV1导出MV2的MV预测子。
在一些实例中,仿射运动向量预测子可由当前帧内的先前经译码仿射运动向量产生。在一个实例中,一组N(N>=0)仿射运动向量可在每一帧的开头处经初始化,且在译码每一仿射块之后,以最近译码的仿射运动向量更新列表且索引用信号表示以指示列表当中的所选择仿射运动预测子。视频译码器可使用截短一元,或标志加截短一元码来译码索引。
在一些实例中,一组K(K>=0)仿射模型参数是在每一帧的开头处初始化。在每一仿射块被译码之后,所述组参数以经译码仿射模型参数来更新。举例来说,在六参数模型中,视频译码器可维持N个向量的列表,其中每一向量由具有六个元素的{ai、bi、ci、di、ei、fi}表示。类似地,在四参数模式中,视频译码器可维持M个向量{aj、bj、cj、dj}的列表。应注意M及N可或可不相同。
在上文所提及的技术中,对于仿射帧间模式,视频译码器可通过使用其相邻位置的MV个别地导出仿射模型的每一MV的运动向量预测子。根据本发明的一或多种技术,当仿射运动由相邻块使用时,视频译码器可使用可预测当前块的仿射运动模型的所有MV的相邻块的仿射运动模型,即当前仿射模型的MV0及MV1(及用于六参数模型的MV2)的预测子从相邻块的仿射运动外推,且接着译码MVD。
可联合地使用上文所提及的不同预测方法。举例来说,标志或索引可用信号表示以指示使用哪一MV预测方法。在一些实例中,通过使用上文所提及的不同预测方法导出的预测子用以产生MV预测子候选列表,且标志或索引用以指示哪一候选用以预测当前仿射运动模型。
当使用四参数仿射运动模型时,“MV0及MV1”或“MV0及MV2”(如图8中所示的v0及v1或v0及v2)可用以表示当前CU/PU的仿射运动。当当前CU/PU的宽度及高度不同时,某一种类的规则可用以确定使用哪一对运动向量。
在一个实例中,当宽度大于或等于(或仅大于)高度或宽度与高度的比率大于阈值时,可使用所述对MV0及MV1,否则可使用所述对MV0及MV2。阈值可为块大小相依或宽度/高度相依。
技术可应用于仿射合并模式及仿射帧间模式两者,或仅仅应用于其中的一者,例如,仿射合并模式。
视频译码器可使用特定检查/评估次序以选择相邻块(例如,在合并模式中)。在一些实例中,视频译码器可使用以下次序来检查用于仿射合并模式的相邻块:上->左->左上->右上->左下。所述次序对应于如D->F->A->E->G的图9中的块。当相邻块不可用或不为仿射译码块时,视频译码器可应用按预定义次序的检查直到所有五个候选被检查为止。
在一些实例中,如果不存在可用的相邻仿射运动块,那么视频译码器可插入某些默认或预定义或经预计算仿射运动模型作为合并模式的候选。插入的模型可经初始化为图片层级,且可在运行中经更新。
在一些实例中,如果不存在有效相邻仿射模型,那么视频译码器可在根据“上->左->左上->右上->左下”次序检查相邻块之后执行默认或预定义或经预计算仿射运动模型的插入。
在一些实例中,视频译码器可译码仿射合并索引以指示哪些相邻仿射模型经复本用于当前块且截短一元、或一元、或指数哥伦布、或哥伦布族码字、或这些的串连可用以译码索引。
从其它信息导出/推断的可切换四参数及六参数仿射模型。在一些实例中,视频译码器可从帧间预测方向信息导出仿射参数。对于每一块,如果其使用帧间模式来译码,那么预测参考帧索引可来自refList0,或来自refList1,或refList0及refList1两者。根据本发明的一或多种技术,当使用单向预测(从refList0预测,或从refList1预测)时,视频译码器可使用其中三个运动向量差值是在位流中译码的六参数仿射模型。当使用双向预测(从refList0及refList1两者预测)时,视频译码器可使用其中两个运动向量差值是在位流中译码的四参数仿射模型。在这些实例中的一些中,视频译码器可省略明确地指示是使用四参数还是六参数仿射模型以识别当前视频数据块的视频数据的一或多个预测子块的语法元素的译码。
根据本发明的一或多种技术,对于双向预测块,当L1ZeroMVDFlag为开启时,视频译码器可实现用于refList1的六参数仿射模型,尽管不存在所发射的MVD。在这种状况下,视频译码器可经由通过三个运动向量预测子建立的六参数仿射模型产生运动补偿的预测子。
在一些实例中,仿射参数可从相邻块导出。如果大部分相邻块使用四参数仿射模式,那么当前块还使用四参数仿射模型。类似地,当大部分相邻块使用六参数仿射模型(六参数仿射的数目大于四参数仿射的数目)时,当前块还使用六参数仿射模型。计数器可用以在确定大部分相邻仿射使用情况中计算某一单元大小(对于4×4块)的相邻块的数目。当不存在相邻仿射模型时,六参数仿射模型用作默认模式(替代地,四参数仿射模型用作默认)。当四参数仿射模型的数目等于六参数模型的数目时,六参数仿射模型用作默认(替代地,四参数仿射模型用作默认)。
仿射模型标志及运动向量的交叉帧确定。根据本发明的一或多种技术,视频译码器可使用交叉帧仿射运动模型参数而非明确地用信号表示仿射参数标志(四或六参数模式)或仿射运动向量信息。在一个实例中,当前块从共置块继承仿射参数模型标志。共置块来自相同位置但在相同时间电平处的先前经译码图片中。共置块与当前块可或可不具有相同分区大小。根据本发明的一或多种技术,视频译码器可检查共置区域中的所有子块(在4×4的单元中),且大部分仿射模型用于当前块。如果共置区域中不存在仿射模型,那么视频译码器可明确地译码四或六参数切换标志。在一些实例中,6(或4)参数仿射用作默认。在一些实例中,为减小复杂度,共置区域中的按光栅扫描次序的第一仿射子块被检查且通过当前块继承。
在另一实例中,当前块直接从共置块继承仿射运动模型参数{a、b、c、d、e、f}或{a、b、c、d}。共置块来自相同位置但在具有相同时间电平的先前经译码图片中。共置块与当前块可或可不具有相同分区大小。根据本发明的一或多种技术,视频译码器可检查共置区域中的所有子块(在4×4的单元中),且当前块继承大部分仿射区域的运动模型参数。如果共置区域中不存在仿射模式,那么视频译码器可明确地译码四或六参数切换标志。在一些实例中,六(或四)参数仿射用作默认。在一些实例中,为减小复杂度,共置区域中的按光栅扫描次序的第一仿射子块被检查且通过当前块继承。在一些实例中,以上实例的组合可一起使用。视频译码器可译码标志以指示所述继承是被使用还是在不同层级(例如PU、CU层级、PPS或SPS)中。
给定仿射参数信息情况下的仿射运动补偿。在重建过程中,给定三个运动向量(例如,当前块中的角运动向量)情况下,可通过求解方程式(4)建立六参数仿射模型。给定六参数模型情况下,每像素运动向量可通过将像素位置(x、y)代入到方程式(3)中而计算。为减小运动补偿复杂度,一个运动向量可用于每一子块K×K,其中K为等于或大于1的整数。代表性运动向量可使用K×K子块内的左上像素位置来计算,或使用K×K子块的中心位置来计算。大小K可明确地用信号表示,或设定为默认值,或基于像素群是否共享相同运动向量而在运行中计算。
仿射运动向量译码。来自相邻有效(根据仿射模型验证)及去复制运动向量的预测子可用于识别/预测当前仿射运动向量。来自最近先前去复制译码仿射运动向量的预测子可经维持以识别/预测当前仿射运动向量。预测子的数目可为K,其中K为等于或大于1的整数。这些预测子形成仿射预测子列表。K可经预定义或在位流中用信号表示。
在一些实例中,上述技术中的两者的组合可用于维持预测子列表。举例来说,视频译码器可使用来自相邻有效(根据仿射模型验证)及去复制运动向量的预测子以及来自最近先前去复制译码仿射运动向量的预测子以识别/预测当前仿射运动向量。
视频译码器可在位流中明确地用信号表示预测子索引以指示预测子使用情况。三个MVD可在六参数模型的状况下被译码,而两个MVD可在四参数模型的状况下被译码。
MVD可使用来自传统MVD译码的不同二值化方法。在一个实例中,使用分开的上下文模型化译码仿射MVD。在另一实例中,仿射MVD译码与传统帧间MVD译码(即,如在HEVC中)共享相同MVD译码上下文模型化。
MVD可基于块中的相对位置运用四参数或六参数仿射模型针对每一MVD使用不同二值化方法。在一个实例中,仿射MVD可运用四参数或六参数仿射模型基于块中的相对位置使用不同上下文模型化而译码。
标志可用信号表示以指示在两个方向(X方向及Y方向)中的MVD对于仿射运动向量的一者或全部是否为零以进一步改进运动向量译码。如果所述标志(AllZeroFlag)为1,那么新颖的MVD译码经引入以联合地译码MVD_x及MVD_y。特定而言,如果AllZeroFlag为1,那么MVD_x及MVD_y两者经推断为零;否则,如果MVD_x为零,那么MVD_y必须为非零。在这种状况下,abs(MVD_y)-1被译码。换句话说,对于每一运动向量,如果AllZeroFlag为零,那么标志AllZeroFlag在两个MVD译码之前经信号表示。对于四参数仿射,对于每一列表,译码两个AllZeroFlags;而对于六参数仿射,对于每一列表,译码三个AllZeroFlags。
在一些实例中,AllZeroFlag可经扩展并表示在双预测中在两个参考列表中的所有零MVD。举例来说,在四参数仿射中,总计两个AllZeroFlags经译码用于两个参考列表;在六参数仿射中,总计三个AllZeroFlags经译码用于两个参考列表。
图10说明重叠块运动补偿(OBMC)的实例。在H.263的开发中提议,在8×8块上执行OBMC,且两个已连接相邻8×8块的运动向量用于当前块。举例来说,对于当前宏块中的第一8×8块,除了第一8×8块的运动向量以外,第一8×8块的上及左相邻运动向量也经应用以产生两个额外预测块。类似地,对于当前宏块中的第二8×8块,除了第二8×8块的运动向量以外,第二8×8块的上及右相邻运动向量也经应用以产生两个额外预测块。举例来说,在图10的实例中,块1004A及块1004B的运动向量可用于产生用于16×16宏块1000的8×8块1002A的额外预测块,且块1006A及块1006B的运动向量可用于产生用于宏块1000的8×8块1002B的额外预测块。以这种方式,当前8×8块中的每一像素可具有三个预测块,且这些三个预测值的加权平均可用作最终预测块。
当相邻块未经译码或译码为帧内(即,相邻块不具有可用运动向量)时,当前8×8块的运动向量用作相邻运动向量。同时,对于当前宏块的第三及第四8×8块(如图10中所示),下相邻块始终未被使用。举例来说,如图10的实例中所示,块1008B的运动向量不用以产生用于8×8块1002C的额外预测块,这是因为块1008B被认为未被译码,且块1010B的运动向量不用以产生用于8×8块1002D的额外预测块,这是因为块1010B被认为未被译码。换句话说,对于每一宏块,没有来自在其下方的宏块的运动信息将在OBMC期间用以重建当前宏块的像素。
图11A及11B为说明HEVC中的OBMC的概念图。在HEVC中,在美国专利申请公开案第2013/0128974A1号及美国专利申请公开案第2012/0177120A1号中,OBMC也经提议用以使PU边界平滑。图11A及11B说明所提议方法的实例。在图11A及11B中,白色区域均为第一PU1102(PU0)且加阴影区域均为第二PU 1104(PU1)。当CU含有两个(或更多)PU时,通过OBMC使靠近PU边界的线/行平滑。对于PU0 1102或PU11104中的以“A”或“B”标记的像素,例如,通过分别应用PU0及PU1的运动向量而产生两个预测值,且其加权平均用作最终预测。
图12A及12B为说明其中OBMC可应用的子块的概念图。在联合探索模型(JEM)参考软件(可在https://jvet.hhi.fraunhofer.de/处获得)中,应用子PU层级OBMC。OBMC经执行用于除了CU的右边界及底部边界之外的所有运动补偿(MC)块边界。此外,其应用于明度分量及色度分量两者。在HEVC中,MC块对应于PU。在JEM中,当PU通过子PU模式译码时,PU的每一子块为MC块。为以均匀方式处理CU/PU边界,在子块层级处对于所有MC块边界执行OBMC,其中子块大小设定为等于4×4,如图12A及12B中所说明。
当OBMC适用于当前子块时,除了当前运动向量以外,四个连接相邻子块的运动向量在其为可用且与当前运动向量不相同的情况下还用以导出当前子块的预测块。这些基于多个运动向量的多个预测块经加权以产生当前子块的最终预测信号。
基于相邻子块的运动向量的预测块可表示为PN,其中N指示相邻上、下、左及右子块的索引。基于当前块的运动向量的预测块可表示为PC。当PN属于与PC相同的PU(因此含有相同运动信息)时,并不从PN执行OBMC。否则,PN的每一像素被添加到PC中的相同像素,即PN的四个行/列被添加到PC。加权因子{1/4、1/8、1/16、1/32}用于PN且加权因子{3/4、7/8、15/16、31/32}用于PC。例外为小MC块,(即,当PU大小等于8×4、4×8或PU使用ATMVP模式译码时),为此PN的仅仅两列/行被添加到PC。在这种状况下,加权因子{1/4、1/8}可用于PN且加权因子{3/4、7/8}用于PC。对于基于垂直地(水平地)相邻子块的运动向量产生的PN,PN的相同列(行)中的像素与相同加权因子一起被添加到PC。应注意对于PU边界,OBMC可应用于边界的每一侧上。例如在图12A及12B中,可沿PU1与PU2之间的边界两次应用OBMC。首先,OBMC与PU2的MV一起沿着PU1内部的边界应用于加阴影块。第二,OBMC与PU1的MV一起沿着PU2内部的边界应用于加阴影块。对比而言,OBMC可仅仅应用于CU边界的一侧,这是因为当译码当前CU时,我们不能改变已译码的CU。
图13为说明根据本发明的一或多种技术的用于通过视频编码器(例如,在视频编码过程期间)执行仿射运动补偿的实例方法的流程图。出于实例及解释的目的,关于图1及2的视频编码器20描述图13的方法。
视频编码器20可接收待编码的当前视频数据块(1302)。举例来说,视频编码器20可从视频源18接收包含当前视频数据块的视频数据的当前图片的原始像素值(例如,RGB、CMYK、YUV等)。视频编码器20的模式选择单元40的分割单元48可将当前图片向上划分成多个块,所述多个块中的一者可为当前块。
视频编码器20可确定使用仿射运动预测编码当前视频数据块(1304)。举例来说,模式选择单元40可确定使用帧间预测模式编码当前视频数据块,并选择仿射运动模型作为运动信息预测模式。模式选择单元40可基于多种因素确定使用帧间预测模式,所述多种因素例如当前图片的帧类型(例如,P帧、I帧、B帧等)及哪一预测模式产生最低位率-失真优化(RDO)成本。
视频编码器20可编码当前块是使用仿射运动预测来编码的指示(1306)。举例来说,模式选择单元40可引起视频编码器20的熵编码单元56在视频位流中编码指示当前块是使用帧间预测模式来编码的一或多个语法元素,指示仿射运动模型为当前块的运动信息预测模式的一或多个语法元素,及/或指示当前块是使用帧间预测模式来编码且仿射运动模型为当前块的运动信息预测模式的一或多个语法元素。
视频编码器20可确定当前视频数据块的仿射运动模型的运动向量的值(1308)。举例来说,视频编码器20的运动估计单元42及/或运动补偿单元44可识别具有紧密匹配当前视频数据块的像素值的像素值的视频数据的预测子块。运动估计单元42及/或运动补偿单元44可确定表示当前视频数据块与视频数据的预测子块之间的仿射变换的两个或大于两个运动向量。
如上文所论述,在一些实例中,运动估计单元42及/或运动补偿单元44可始终使用包含两个运动向量的四参数仿射运动模型以识别预测子块。类似地,在一些实例中,运动估计单元42及/或运动补偿单元44可始终使用包含三个运动向量的六参数仿射运动模型以识别预测子块。在另外其它实例中,运动估计单元42及/或运动补偿单元44可选择性地使用包含两个运动向量(例如,图8的v0及v1,也称作MV0及MV1)的四参数仿射运动模型或包含三个运动向量(例如,图8的v0、v1及v2,也称作MV0、MV1及MV2)的六参数仿射运动模型以识别预测子块。
在一些实例中,视频编码器20可编码当前块是使用四参数模型还是六参数模型译码的指示。举例来说,运动估计单元42及/或运动补偿单元44可引起熵编码单元56在经编码视频位流中编码指示当前视频数据块的仿射运动模型是包括四参数模型还是六参数模型的语法元素。在一些实例中,熵编码单元56可在通过当前视频数据块参考的视频参数集(VPS)、序列参数集(SPS)、图片参数集(PPS)或切片标头中的一或多者中编码语法元素。在一些实例中,熵编码单元56可在包含当前视频数据块的CU的译码单元(CU)层级处编码语法元素。
视频编码器20可针对当前视频数据块选择具有仿射运动模型的相邻视频数据块(1310)。举例来说,当编码图8的当前块800时,运动估计单元42及/或运动补偿单元44可按特定次序评估图8的块802A到802G并按所述特定次序选择使用仿射运动补偿译码的第一块(例如,具有可用仿射运动模型的第一块)作为所选择相邻视频数据块。在一些实例中,当前视频数据块可使用仿射帧间模式来译码。在一些实例中,所选择相邻视频数据块可使用仿射帧间模式(例如,AF_INTER)或仿射合并模式(例如,AF_MERGE)来译码。
视频编码器20可获得所选择相邻视频数据块的仿射运动模型的运动向量的预测子的值(1312)。举例来说,运动估计单元42及/或运动补偿单元44可从视频编码器20的存储器或存储装置(例如参考图片存储器64)获得所选择相邻视频数据块的仿射运动模型的值。运动估计单元42及/或运动补偿单元44可将所选择相邻视频数据块的仿射运动模型的值变到当前块的位置以导出预测子的值。换句话说,运动估计单元42及/或运动补偿单元44可从所选择相邻视频数据块的仿射运动模型的值外推预测子的值。作为一个实例,在所选择相邻块为图8的块802F的情况下,视频编码器20可获得块802F的多个运动向量的值(例如,块802F的CPMV的值),并将块802F的所述多个运动向量的值变到当前块800的位置。作为另一实例,在所选择相邻块为图8的块802F的情况下,视频编码器20可使用块802F的所述多个运动向量的值(例如,块802F的CPMV的值)作为预测子。
视频编码器20可在经编码视频位流中编码当前视频数据块的仿射运动模型的运动向量的值与预测子的值之间的差值的表示(1314)。举例来说,运动估计单元42及/或运动补偿单元44可针对当前块的仿射运动模型的每一相应运动向量确定表示当前块的仿射运动模型的相应运动向量的值与从所选择相邻块的仿射运动模型的运动向量导出的对应预测子的值之间的差的相应运动向量差(MVD)值。作为一个实例,在当前块的仿射运动模型的运动向量的值为MV0及MV1且从所选择相邻块的仿射运动模型的运动向量导出的预测子的值为MVP0及MVP1的情况下,运动估计单元42及/或运动补偿单元44可将第一MVD值确定为MV0与MVP0之间的差,并将第二MVD值确定为MV1与MVP1之间的差。运动估计单元42及/或运动补偿单元44可引起熵编码单元56在经编码视频位流中编码表示经确定MVD的值的一或多个语法元素。
在一些实例中,视频编码器20可进一步在经编码视频位流中编码表示当前块与通过当前块的仿射运动模型识别的预测子块之间的像素差的残余数据。视频编码器20可实施解码器回路以重建当前块的像素值(例如,以供在预测将来块时使用)。举例来说,视频编码器20可基于当前块的仿射运动模型识别预测子块,从参考图片存储器64获得预测子块的像素值,并添加残余值到预测子块的像素值以重建当前块的像素值。
图14为说明根据本发明的一或多种技术的用于通过视频解码器(例如,在视频解码过程期间)执行仿射运动补偿的实例方法的流程图。出于实例及解释的目的,关于图1及3的视频解码器30描述图14的方法。
视频解码器30可解码当前块是使用仿射运动预测来编码的一指示(1402)。举例来说,熵解码单元70可从视频位流解码指示当前块是使用帧间预测模式来编码的一或多个语法元素,指示仿射运动模型为当前块的运动信息预测模式的一或多个语法元素,及/或指示当前块是使用帧间预测模式来编码且仿射运动模型为当前块的运动信息预测模式的一或多个语法元素。熵解码单元70可提供经解码语法元素的值到运动补偿单元72。
视频解码器30可针对当前视频数据块选择具有仿射运动模型的相邻视频数据块(1404)。举例来说,当解码图8的当前块800时,运动补偿单元72可按特定次序评估图8的块802A到802G并按所述特定次序选择使用仿射运动补偿译码的第一块(例如,具有可用仿射运动模型的第一块)作为所选择相邻视频数据块。在一些实例中,当前视频数据块可使用仿射帧间模式来译码。在一些实例中,所选择相邻视频数据块可使用仿射帧间模式(例如,AF_INTER)或仿射合并模式(例如,AF_MERGE)来译码。
视频解码器30可获得从所选择相邻视频数据块的仿射运动模型的运动向量导出的预测子的值(1406)。举例来说,运动补偿单元72可从视频解码器30的存储器或存储装置(例如参考图片存储器82)获得所选择相邻视频数据块的仿射运动模型的值。运动补偿单元72可将所选择相邻视频数据块的仿射运动模型的值变到当前块的位置以导出预测子的值。换句话说,运动补偿单元72可从所选择相邻视频数据块的仿射运动模型的值外推预测子的值。作为一个实例,在所选择相邻块为图8的块802F的情况下,视频解码器30可获得块802F的多个运动向量的值(例如,块802F的CPMV的值),并将块802F的所述多个运动向量的值变到当前块800的位置。作为另一实例,在所选择相邻块为图8的块802F的情况下,视频解码器30可使用块802F的所述多个运动向量的值(例如,块802F的CPMV的值)作为预测子。
视频解码器30可从经编码视频位流解码当前视频数据块的仿射运动模型的运动向量的值与预测子的值之间的差值的表示(1408)。举例来说,熵解码单元70可从经编码视频位流解码表示当前块的仿射运动模型的相应运动向量的值与从所选择相邻块的仿射运动模型的运动向量导出的对应预测子的值之间的差值的值的语法元素。作为一个实例,在当前块的仿射运动模型的运动向量的值为MV0及MV1且从所选择相邻块的仿射运动模型的运动向量导出的预测子的值为MVP0及MVP1的情况下,熵解码单元70可解码表示第一MVD值及第二MVD值的值的语法元素,第一MVD值为MV0与MVP0之间的差且第二MVD值为MV1与MVP1之间的差。熵解码单元70可提供经解码语法元素的值到运动补偿单元72。
视频解码器30可基于预测子的值及经解码差值来确定当前视频数据块的仿射运动模型的运动向量的值(1410)。举例来说,运动补偿单元72可添加MVP0的值到第一MVD值的值以确定MV0的值并添加MVP1的值到第二MVD值的值以确定MV1的值。
视频解码器30可基于当前视频数据块的仿射运动模型的运动向量的确定值来确定视频数据的预测子块(1412)。举例来说,运动补偿单元72可从参考图片存储器82获得通过当前视频数据块的仿射运动模型识别的预测子块的像素值。
视频解码器30可基于视频数据的预测子块重建当前视频数据块(1414)。举例来说,熵解码单元70可从经编码视频位流解码表示当前块与通过当前块的仿射运动模型识别的预测子块之间的像素差的残余数据。运动补偿单元72可添加残余值到预测子块的像素值以重建当前块的像素值。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同序列执行、可添加、合并或完全省略(例如,并非所有所描述的动作或事件对于技术的实践是必要的)。此外,在某些实例中,可例如经由多线程处理、中断处理或多个处理器同时而非依序执移动作或事件。
在一或多个实例中,所描述的功能可以硬件、软件、固件或其任何组合实施。如果以软件实施,那么所述功能可作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行发射,且通过基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体)或通信媒体,所述通信媒体包含(例如)根据通信协议促进计算机程序从一处传送到另一处的任何媒体。以这种方式,计算机可读媒体大体可对应于(1)为非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如,信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中所描述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
通过实例而非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、快闪存储器或可用于存储呈指令或数据结构形式的所要程序码且可由计算机存取的任何其它媒体。并且,任何连接被恰当地称为计算机可读媒体。举例来说,如果使用同轴缆线、光缆、双绞线、数字订户线(DSL)或无线技术(例如红外线、无线电及微波)从网站、服务器或其它远程源发射指令,那么同轴缆线、光缆、双绞线、DSL或无线技术(例如红外线、无线电及微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而实情为是有关于非暂时性有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字影音光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘使用激光以光学方式再现数据。以上各者的组合也应包含于计算机可读媒体的范围内。
指令可由一或多个处理器执行,所述一或多个处理器例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码及解码的专用硬件及/或软件模块内,或并入组合式编解码器中。此外,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可以多种装置或设备实施,所述装置或设备包含无线手机、集成电路(IC)或IC集合(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必要求由不同硬件单元来实现。确切而言,如上文所描述,可将各种单元组合于编解码器硬件单元中,或通过互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适的软件及/或固件来提供所述单元。
各种实例已予以描述。这些及其它实例在以下权利要求书的范围内。

Claims (42)

1.一种用于解码视频数据的方法,所述方法包括:
通过视频解码器的一或多个处理器且针对当前视频数据块,获得相邻视频数据块的仿射运动模型的运动向量的值;
通过所述一或多个处理器且从所述相邻视频数据块的所述仿射运动模型的所述运动向量的所述值导出所述当前视频数据块的仿射运动模型的运动向量的预测子的值;
通过所述一或多个处理器且从经编码视频位流解码所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值与所述预测子的所述值之间的差的表示;
通过所述一或多个处理器从所述预测子的所述值及所述经解码差值确定所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值;
基于所述当前视频数据块的所述仿射运动模型的所述运动向量的所述经确定值确定视频数据的预测子块;及
基于视频数据的所述预测子块重建所述当前视频数据块。
2.根据权利要求1所述的方法,其中所述当前视频数据块使用仿射帧间模式来解码。
3.根据权利要求2所述的方法,其中所述相邻视频数据块使用仿射帧间模式或仿射合并模式解码。
4.根据权利要求1所述的方法,其中所述相邻视频块包括所选择相邻视频数据块,且其中获得所述所选择相邻视频数据块的所述仿射运动模型的所述运动向量的所述值包括:
按预定义次序评估所述当前视频数据块的相邻视频数据块;及
选择使用仿射运动补偿解码的所述多个相邻视频数据块中的第一相邻视频数据块作为所述所选择相邻视频数据块。
5.根据权利要求1所述的方法,其进一步包括:
通过所述一或多个处理器确定所述当前视频数据块的所述仿射运动模型是包括可转换成两个运动向量的四参数模型还是可转换成三个运动向量的六参数模型。
6.根据权利要求5所述的方法,其中确定用于所述当前视频数据块的所述仿射运动模型是包括四参数模型还是六参数模型包括:
通过所述一或多个处理器且从所述经编码视频位流解码指示所述当前视频数据块的所述仿射运动模型是包括四参数模型还是六参数模型的语法元素。
7.根据权利要求6所述的方法,其中解码所述语法元素包括从通过所述当前视频数据块参考的视频参数集VPS、序列参数集SPS、图片参数集PPS及切片标头中的一或多者解码所述语法元素。
8.根据权利要求6所述的方法,其中解码所述语法元素包括从包含所述当前视频数据块的译码单元CU解码所述语法元素。
9.根据权利要求1所述的方法,所述方法可在无线通信装置上执行,其中所述装置包括:
存储器,其经配置以存储所述视频数据;
处理器,其经配置以执行指令以处理存储于所述存储器中的所述视频数据;及
接收器,其经配置以接收所述视频数据且将所述视频数据存储到所述存储器。
10.根据权利要求9所述的方法,其中所述无线通信装置为蜂窝式电话,且所述视频数据通过所述接收器接收且根据蜂窝式通信标准调制。
11.一种用于编码视频数据的方法,所述方法包括:
通过视频编码器的一或多个处理器确定当前视频数据块的仿射运动模型的运动向量的值,所述仿射运动模型的所述运动向量识别所述当前视频数据块的视频数据的预测子块;
通过所述一或多个处理器获得相邻视频数据块的仿射运动模型的运动向量的值;
通过所述一或多个处理器且从所述相邻视频数据块的所述仿射运动模型的所述运动向量的所述值导出所述当前视频数据块的仿射运动模型的运动向量的预测子的值;及
通过所述一或多个处理器且在经编码视频位流中编码所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值与所述预测子的所述值之间的差的表示。
12.根据权利要求11所述的方法,其中所述当前视频数据块使用仿射帧间模式来编码。
13.根据权利要求12所述的方法,其中所述相邻视频数据块使用仿射帧间模式或仿射合并模式编码。
14.根据权利要求11所述的方法,其中所述相邻视频块包括所选择相邻视频数据块,且其中获得所述所选择相邻视频数据块的所述仿射运动模型的所述运动向量的所述值包括:
按预定义次序评估所述当前视频数据块的相邻视频数据块;及
选择使用仿射运动补偿解码的所述多个相邻视频数据块中的第一相邻视频数据块作为所述所选择相邻视频数据块。
15.根据权利要求11所述的方法,其进一步包括:
通过所述一或多个处理器确定所述当前视频数据块的所述仿射运动模型是包括可转换成两个运动向量的四参数模型还是可转换成三个运动向量的六参数模型。
16.根据权利要求15所述的方法,其进一步包括:
通过所述一或多个处理器且在所述经编码视频位流中编码指示用于所述当前视频数据块的所述仿射运动模型是包括四参数模型还是六参数模型的语法元素。
17.根据权利要求16所述的方法,其中编码所述语法元素包括将所述语法元素编码在通过所述当前视频数据块参考的视频参数集VPS、序列参数集SPS、图片参数集PPS或切片标头中。
18.根据权利要求16所述的方法,其中编码所述语法元素包括将所述语法元素编码在包含所述当前视频数据块的译码单元CU中。
19.根据权利要求11所述的方法,所述方法可在无线通信装置上执行,其中所述装置包括:
存储器,其经配置以存储所述视频数据;
处理器,其经配置以执行指令以处理存储于所述存储器中的所述视频数据;及
发射器,其经配置以发射所述经编码视频位流。
20.根据权利要求19所述的方法,其中所述无线通信装置为蜂窝式电话,且所述经编码视频位流通过所述所发射发射且根据蜂窝式通信标准调制。
21.一种用于解码视频数据块的装置,所述装置包括:
存储器,其经配置以存储所述视频数据;及
一或多个处理单元,其以电路实施并经配置以:
针对当前视频数据块获得相邻视频数据块的仿射运动模型的运动向量的值;
从所述相邻视频数据块的所述仿射运动模型的所述运动向量的所述值导出所述当前视频数据块的仿射运动模型的运动向量的预测子的值;
从经编码视频位流解码所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值与所述预测子的所述值之间的差值的表示;
从所述预测子的所述值及所述经解码差值确定所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值;
基于所述当前视频数据块的所述仿射运动模型的所述运动向量的所述经确定值确定视频数据的预测子块;及
基于视频数据的所述预测子块重建所述当前视频数据块。
22.根据权利要求21所述的装置,其中所述当前视频数据块使用仿射帧间模式来解码。
23.根据权利要求22所述的装置,其中所述相邻视频数据块使用仿射帧间模式或仿射合并模式解码。
24.根据权利要求21所述的装置,其中所述相邻视频块包括所选择相邻视频数据块,且其中为获得所述所选择相邻视频数据块的所述仿射运动模型的所述运动向量的所述值,所述一或多个处理单元经配置以:
按预定义次序评估所述当前视频数据块的相邻视频数据块;及
选择使用仿射运动补偿解码的所述多个相邻视频数据块中的第一相邻视频数据块作为所述所选择相邻视频数据块。
25.根据权利要求21所述的装置,其中所述一或多个处理单元经进一步配置以执行以下操作:
确定所述当前视频数据块的所述仿射运动模型是包括可转换成两个运动向量的四参数模型还是可转换成三个运动向量的六参数模型。
26.根据权利要求25所述的装置,其中为确定所述当前视频数据块的所述仿射运动模型是包括四参数模型还是六参数模型,所述一或多个处理单元经配置以:
从所述经编码视频位流解码指示所述当前视频数据块的所述仿射运动模型是包括四参数模型还是六参数模型的语法元素。
27.根据权利要求26所述的装置,其中为解码所述语法元素,所述一或多个处理单元经配置以从通过所述当前视频数据块参考的视频参数集VPS、序列参数集SPS、图片参数集PPS及切片标头中的一或多者解码所述语法元素。
28.根据权利要求26所述的装置,其中为解码所述语法元素,所述一或多个处理单元经配置以从包含所述当前视频数据块的译码单元CU解码所述语法元素。
29.根据权利要求21所述的装置,其进一步包括以下各者中的至少一者:
显示器,其经配置以显示所述经重建视频数据;或
相机,其经配置以俘获所述视频数据。
30.根据权利要求21所述的装置,其中所述装置包括相机、计算机、移动装置、广播接收器装置或机顶盒中的一或多者。
31.一种用于编码视频数据块的装置,所述装置包括:
存储器,其经配置以存储所述视频数据;及
一或多个处理单元,其以电路实施并经配置以:
确定当前视频数据块的仿射运动模型的运动向量的值,所述仿射运动模型的所述运动向量识别所述当前视频数据块的视频数据的预测子块;
获得相邻视频数据块的仿射运动模型的运动向量的值;
从所述相邻视频数据块的所述仿射运动模型的所述运动向量的所述值导出所述当前视频数据块的仿射运动模型的运动向量的预测子的值;及
在经编码视频位流中编码所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值与所述预测子的所述值之间的差值的表示。
32.根据权利要求31所述的装置,其中所述当前视频数据块使用仿射帧间模式来编码。
33.根据权利要求32所述的装置,其中所述相邻视频数据块使用仿射帧间模式或仿射合并模式来编码。
34.根据权利要求31所述的装置,其中所述相邻视频块包括所选择相邻视频数据块,且其中为获得所述所选择相邻视频数据块的所述仿射运动模型的所述运动向量的所述值,所述一或多个处理单元经配置以:
按预定义次序评估所述当前视频数据块的相邻视频数据块;及
选择使用仿射运动补偿解码的所述多个相邻视频数据块中的第一相邻视频数据块作为所述所选择相邻视频数据块。
35.根据权利要求31所述的装置,其中所述一或多个处理单元经进一步配置以执行以下操作:
确定所述当前视频数据块的所述仿射运动模型是包括可转换成两个运动向量的四参数模型还是可转换成三个运动向量的六参数模型。
36.根据权利要求35所述的装置,其中所述一或多个处理单元经进一步配置以执行以下操作:
在所述经编码视频位流中编码指示所述当前视频数据块的所述仿射运动模型是包括四参数模型还是六参数模型的语法元素。
37.根据权利要求36所述的装置,其中为编码所述语法元素,所述一或多个处理单元经配置以将所述语法元素编码在通过所述当前视频数据块参考的视频参数集VPS、序列参数集SPS、图片参数集PPS或切片标头中。
38.根据权利要求36所述的装置,其中为编码所述语法元素,所述一或多个处理单元经配置以将所述语法元素编码在包含所述当前视频数据块的译码单元CU中。
39.根据权利要求31所述的装置,其进一步包括以下各者中的至少一者:
显示器,其经配置以显示所述经重建视频数据;或
相机,其经配置以俘获所述视频数据。
40.根据权利要求31所述的装置,其中所述装置包括相机、计算机、移动装置、广播接收器装置或机顶盒中的一或多者。
41.一种用于编码或解码视频数据的装置,所述装置包括:
用于针对当前视频数据块获得相邻视频数据块的仿射运动模型的运动向量的值的装置;
用于从所述相邻视频数据块的所述仿射运动模型的所述运动向量的所述值导出所述当前视频数据块的仿射运动模型的运动向量的预测子的值的装置;
用于获得所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值与所述预测子的所述值之间的差值的装置;
用于从所述预测子的所述值及所述经解码差值确定所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值的装置;及
用于基于所述当前视频数据块的所述仿射运动模型的所述运动向量的所述经确定值识别视频数据的预测子块的装置。
42.一种存储指令的计算机可读存储媒体,所述指令当经执行时使得视频编码器或视频解码器的一或多个处理器执行以下操作:
针对当前视频数据块获得相邻视频数据块的仿射运动模型的运动向量的值;
从所述相邻视频数据块的所述仿射运动模型的所述运动向量的所述值导出所述当前视频数据块的仿射运动模型的运动向量的预测子的值;
获得所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值与所述预测子的所述值之间的差值;
从所述预测子的所述值及所述经解码差值确定所述当前视频数据块的所述仿射运动模型的所述运动向量的所述值中的每一者;及
基于所述当前视频数据块的所述仿射运动模型的所述运动向量的所述经确定值识别视频数据的预测子块。
CN201780029286.8A 2016-05-16 2017-05-05 用于视频译码的仿射运动预测方法、装置及存储媒体 Active CN109155855B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211114612.4A CN115379237A (zh) 2016-05-16 2017-05-05 用于视频译码的仿射运动预测

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662337301P 2016-05-16 2016-05-16
US62/337,301 2016-05-16
US15/587,044 2017-05-04
US15/587,044 US10560712B2 (en) 2016-05-16 2017-05-04 Affine motion prediction for video coding
PCT/US2017/031258 WO2017200771A1 (en) 2016-05-16 2017-05-05 Affine motion prediction for video coding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211114612.4A Division CN115379237A (zh) 2016-05-16 2017-05-05 用于视频译码的仿射运动预测

Publications (2)

Publication Number Publication Date
CN109155855A true CN109155855A (zh) 2019-01-04
CN109155855B CN109155855B (zh) 2022-09-20

Family

ID=60297144

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201780029286.8A Active CN109155855B (zh) 2016-05-16 2017-05-05 用于视频译码的仿射运动预测方法、装置及存储媒体
CN202211114612.4A Pending CN115379237A (zh) 2016-05-16 2017-05-05 用于视频译码的仿射运动预测

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202211114612.4A Pending CN115379237A (zh) 2016-05-16 2017-05-05 用于视频译码的仿射运动预测

Country Status (9)

Country Link
US (2) US10560712B2 (zh)
EP (1) EP3459249A1 (zh)
JP (1) JP6767508B2 (zh)
KR (1) KR102177089B1 (zh)
CN (2) CN109155855B (zh)
BR (1) BR112018073397A2 (zh)
CA (1) CA3020244C (zh)
TW (1) TWI703860B (zh)
WO (1) WO2017200771A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111050168A (zh) * 2019-12-27 2020-04-21 浙江大华技术股份有限公司 仿射预测方法及其相关装置
CN111435993A (zh) * 2019-01-14 2020-07-21 华为技术有限公司 视频编码器、视频解码器及相应方法
WO2020169109A1 (en) * 2019-02-22 2020-08-27 Beijing Bytedance Network Technology Co., Ltd. Sub-table for history-based affine mode
CN112204973A (zh) * 2019-09-24 2021-01-08 北京大学 视频编解码的方法与装置
US20210266584A1 (en) 2018-11-16 2021-08-26 Beijing Bytedance Network Technology Co., Ltd. Usage for history-based affine parameters
CN113316933A (zh) * 2019-01-17 2021-08-27 北京字节跳动网络技术有限公司 使用运动预测进行去方块滤波
CN113574869A (zh) * 2019-03-17 2021-10-29 北京字节跳动网络技术有限公司 基于光流的预测细化
CN113711608A (zh) * 2019-04-19 2021-11-26 北京字节跳动网络技术有限公司 利用光流的预测细化过程的适用性
CN113728630A (zh) * 2019-04-19 2021-11-30 北京字节跳动网络技术有限公司 不同运动矢量细化中的基于区域的梯度计算
CN113853793A (zh) * 2019-05-21 2021-12-28 北京字节跳动网络技术有限公司 基于光流的帧间编码的语法信令
CN114503558A (zh) * 2019-09-30 2022-05-13 华为技术有限公司 插值滤波器在仿射运动补偿中的适应性使用
CN115349257A (zh) * 2019-09-30 2022-11-15 华为技术有限公司 基于dct的内插滤波器的使用

Families Citing this family (191)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3029055B1 (fr) * 2014-11-24 2017-01-13 Ateme Procede d'encodage d'image et equipement pour la mise en oeuvre du procede
CN105872539B (zh) 2015-02-08 2020-01-14 同济大学 图像编码方法和装置及图像解码方法和装置
WO2017157259A1 (en) * 2016-03-15 2017-09-21 Mediatek Inc. Method and apparatus of video coding with affine motion compensation
US10560712B2 (en) 2016-05-16 2020-02-11 Qualcomm Incorporated Affine motion prediction for video coding
US10715818B2 (en) * 2016-08-04 2020-07-14 Intel Corporation Techniques for hardware video encoding
US10778999B2 (en) 2016-09-30 2020-09-15 Qualcomm Incorporated Frame rate up-conversion coding mode with affine motion model
US10448010B2 (en) 2016-10-05 2019-10-15 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding
US20190273943A1 (en) * 2016-10-10 2019-09-05 Sharp Kabushiki Kaisha Systems and methods for performing motion compensation for coding of video data
US10750203B2 (en) * 2016-12-22 2020-08-18 Mediatek Inc. Method and apparatus of adaptive bi-prediction for video coding
BR112019013978A2 (pt) * 2017-01-12 2020-03-03 Sony Corporation Dispositivo e método de processamento de imagem.
US10701390B2 (en) 2017-03-14 2020-06-30 Qualcomm Incorporated Affine motion information derivation
US10873760B2 (en) * 2017-04-07 2020-12-22 Futurewei Technologies, Inc. Motion vector (MV) constraints and transformation constraints in video coding
US11245921B2 (en) 2017-06-26 2022-02-08 Interdigital Vc Holdings, Inc. Multiple predictor candidates for motion compensation
WO2019004283A1 (ja) * 2017-06-28 2019-01-03 シャープ株式会社 動画像符号化装置及び動画像復号装置
EP3661209A4 (en) * 2017-08-03 2020-06-03 LG Electronics Inc. -1- METHOD AND DEVICE FOR PROCESSING VIDEO IMAGE SIGNALS USING AFFINED PREDICTION
CN116708780A (zh) * 2017-08-11 2023-09-05 华为技术有限公司 视频图像编码和解码的方法、装置及设备
CN117221524A (zh) * 2017-08-29 2023-12-12 株式会社Kt 视频解码方法、视频编码方法及装置
US11082721B2 (en) * 2017-09-07 2021-08-03 Lg Electronics Inc. Method and apparatus for entropy-encoding and entropy-decoding video signal
US10841794B2 (en) * 2017-09-18 2020-11-17 Futurewei Technologies, Inc. Adaptive motion vector resolution
US10609384B2 (en) * 2017-09-21 2020-03-31 Futurewei Technologies, Inc. Restriction on sub-block size derivation for affine inter prediction
MX2020002586A (es) * 2017-09-28 2020-07-20 Samsung Electronics Co Ltd Metodo y dispositivo de codificacion, y metodo y dispositivo de decodificacion.
US10856003B2 (en) 2017-10-03 2020-12-01 Qualcomm Incorporated Coding affine prediction motion information for video coding
US10582212B2 (en) * 2017-10-07 2020-03-03 Google Llc Warped reference motion vectors for video compression
US11877001B2 (en) * 2017-10-10 2024-01-16 Qualcomm Incorporated Affine prediction in video coding
CN117354538A (zh) * 2017-10-27 2024-01-05 松下电器(美国)知识产权公司 编码装置、解码装置、生成装置、发送装置和存储介质
EP3711299A1 (en) 2017-11-14 2020-09-23 Qualcomm Incorporated Unified merge candidate list usage
US10735758B2 (en) * 2017-12-07 2020-08-04 Tencent America LLC Method and apparatus for video coding
CN112055205B (zh) * 2017-12-12 2021-08-03 华为技术有限公司 视频数据的帧间预测方法和装置、视频编解码器、存储介质
WO2019117659A1 (ko) * 2017-12-14 2019-06-20 엘지전자 주식회사 움직임 벡터 도출을 기반으로 하는 영상 코딩 방법 및 그 장치
US11070842B2 (en) * 2018-01-02 2021-07-20 Samsung Electronics Co., Ltd. Video decoding method and apparatus and video encoding method and apparatus
US20190208211A1 (en) * 2018-01-04 2019-07-04 Qualcomm Incorporated Generated affine motion vectors
US11172229B2 (en) 2018-01-12 2021-11-09 Qualcomm Incorporated Affine motion compensation with low bandwidth
US20190222834A1 (en) * 2018-01-18 2019-07-18 Mediatek Inc. Variable affine merge candidates for video coding
WO2019147079A1 (ko) * 2018-01-25 2019-08-01 주식회사 윌러스표준기술연구소 서브블록 기반의 모션 보상을 이용한 비디오 신호 처리 방법 및 장치
EP3744094A4 (en) * 2018-01-26 2021-11-03 MediaTek Inc. METHOD AND DEVICE FOR AFFINE INTER-PREDICTION FOR A VIDEO ENCODING SYSTEM
US11202079B2 (en) 2018-02-05 2021-12-14 Tencent America LLC Method and apparatus for video decoding of an affine model in an intra block copy mode
WO2019160860A1 (en) * 2018-02-14 2019-08-22 Futurewei Technologies, Inc. Adaptive interpolation filter
EP3759919A1 (en) * 2018-02-26 2021-01-06 InterDigital VC Holdings, Inc. Method and apparatus for generalized obmc
US11516496B2 (en) * 2018-03-21 2022-11-29 Electronics And Telecommunications Research Institute Image encoding/decoding method and apparatus, and recording medium storing bitstream
KR102568879B1 (ko) * 2018-04-01 2023-08-21 엘지전자 주식회사 어파인 움직임 예측에 기반한 영상 코딩 방법 및 그 장치
TWI700922B (zh) * 2018-04-02 2020-08-01 聯發科技股份有限公司 用於視訊編解碼系統中的子塊運動補償的視訊處理方法和裝置
CN116708841A (zh) * 2018-04-03 2023-09-05 英迪股份有限公司 对图像解码和编码的方法、非暂态计算机可读存储介质
US11146796B2 (en) * 2018-04-06 2021-10-12 Arris Enterprises Llc Reducing motion vector information transmission in bi-directional temporal prediction
KR20200133327A (ko) * 2018-04-12 2020-11-27 삼성전자주식회사 부호화 방법 및 그 장치, 복호화 방법 및 그 장치
EP3780616B1 (en) 2018-04-13 2024-03-06 LG Electronics Inc. Method and apparatus for inter prediction in video processing system
WO2019199152A1 (ko) * 2018-04-14 2019-10-17 엘지전자 주식회사 어파인 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
US10986343B2 (en) * 2018-04-15 2021-04-20 Arris Enterprises Llc Reducing overhead for multiple-hypothesis temporal prediction
HUE063886T2 (hu) * 2018-04-24 2024-02-28 Lg Electronics Inc Eljárás és berendezés képek közötti predikcióhoz videó kódoló rendszerben
US11451816B2 (en) * 2018-04-24 2022-09-20 Mediatek Inc. Storage of motion vectors for affine prediction
US10506251B2 (en) * 2018-05-08 2019-12-10 Tencent America LLC Method and apparatus for video coding
WO2019235819A1 (ko) * 2018-06-04 2019-12-12 엘지전자 주식회사 비디오 신호를 처리하기 위한 방법 및 장치
WO2019235822A1 (ko) * 2018-06-04 2019-12-12 엘지전자 주식회사 어파인 움직임 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
GB2588004B (en) 2018-06-05 2023-03-01 Beijing Bytedance Network Tech Co Ltd Interaction between IBC and affine
WO2019244719A1 (en) * 2018-06-18 2019-12-26 Sharp Kabushiki Kaisha Systems and methods for performing affine motion compensation prediction for coding of video data
CN112567749B (zh) 2018-06-18 2024-03-26 Lg电子株式会社 使用仿射运动预测来处理视频信号的方法和装置
TWI723430B (zh) 2018-06-19 2021-04-01 大陸商北京字節跳動網絡技術有限公司 不同精度的多個候選
US20210297691A1 (en) * 2018-06-20 2021-09-23 Mediatek Inc. Method and Apparatus of Motion Vector Buffer Management for Video Coding System
CN110636298B (zh) 2018-06-21 2022-09-13 北京字节跳动网络技术有限公司 对于Merge仿射模式和非Merge仿射模式的统一约束
CN113115046A (zh) 2018-06-21 2021-07-13 北京字节跳动网络技术有限公司 分量相关的子块分割
WO2019244809A1 (ja) * 2018-06-21 2019-12-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
EP3791588A1 (en) 2018-06-29 2021-03-17 Beijing Bytedance Network Technology Co. Ltd. Checking order of motion candidates in lut
JP7256265B2 (ja) 2018-06-29 2023-04-11 北京字節跳動網絡技術有限公司 ルックアップテーブルの更新:fifo、制限されたfifo
TWI744662B (zh) * 2018-06-29 2021-11-01 大陸商北京字節跳動網絡技術有限公司 更新查閱資料表(lut)的條件
WO2020003279A1 (en) 2018-06-29 2020-01-02 Beijing Bytedance Network Technology Co., Ltd. Concept of using one or multiple look up tables to store motion information of previously coded in order and use them to code following blocks
TWI719523B (zh) 2018-06-29 2021-02-21 大陸商北京字節跳動網絡技術有限公司 哪個查找表需要更新或不更新
WO2020005572A1 (en) * 2018-06-29 2020-01-02 Interdigital Vc Holdings, Inc. Virtual temporal affine candidates
TWI719525B (zh) 2018-06-29 2021-02-21 大陸商北京字節跳動網絡技術有限公司 Lut與amvp之間的交互
EP3791587A1 (en) 2018-06-29 2021-03-17 Beijing Bytedance Network Technology Co. Ltd. Resetting of look up table per slice/tile/lcu row
TWI728390B (zh) 2018-06-29 2021-05-21 大陸商北京字節跳動網絡技術有限公司 查找表尺寸
TWI752331B (zh) 2018-06-29 2022-01-11 大陸商北京字節跳動網絡技術有限公司 當向Merge/AMVP添加HMVP候選時的部分/完全修剪
WO2020009445A1 (ko) * 2018-07-02 2020-01-09 엘지전자 주식회사 어파인 예측을 이용하여 비디오 신호를 처리하기 위한 방법 및 장치
KR20240008952A (ko) 2018-07-02 2024-01-19 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 인트라 예측 모드들을 갖는 lut들 및 비인접 블록들로부터의 인트라 모드 예측
EP3809704A4 (en) 2018-07-02 2021-04-28 Huawei Technologies Co., Ltd. METHOD AND RELATED DEVICE FOR MOTION VECTOR PREDICTION
US20200021836A1 (en) * 2018-07-10 2020-01-16 Tencent America LLC Method and apparatus for ordering and selection of affine merge candidates in motion compensation
KR102639425B1 (ko) 2018-07-11 2024-02-21 후아웨이 테크놀러지 컴퍼니 리미티드 비디오 인코더, 비디오 디코더, 및 대응하는 방법
KR102386836B1 (ko) 2018-07-13 2022-04-14 엘지전자 주식회사 영상 코딩 시스템에서 어파인 움직임 예측에 기반한 영상 디코딩 방법 및 장치
US10462488B1 (en) * 2018-07-13 2019-10-29 Tencent America LLC Method and apparatus for video coding
US10805624B2 (en) * 2018-07-16 2020-10-13 Tencent America LLC Determination of parameters of an affine model
KR102617280B1 (ko) * 2018-07-17 2023-12-27 후아웨이 테크놀러지 컴퍼니 리미티드 움직임 모델 시그널링
US11032563B2 (en) * 2018-07-17 2021-06-08 Tencent America LLC Method and apparatus for affine model prediction
US10958934B2 (en) * 2018-07-27 2021-03-23 Tencent America LLC History-based affine merge and motion vector prediction
BR122021006509A2 (pt) * 2018-08-09 2021-05-18 Lg Electronics Inc. método de decodificação de imagem com base na predição de movimento afim e dispositivo usando lista de candidatos à fusão afins no sistema de codificação de imagem
CN117499671A (zh) 2018-08-27 2024-02-02 华为技术有限公司 一种视频图像预测方法及装置
CN110868601B (zh) * 2018-08-28 2024-03-15 华为技术有限公司 帧间预测方法、装置以及视频编码器和视频解码器
WO2020043004A1 (zh) * 2018-08-28 2020-03-05 华为技术有限公司 候选运动信息列表的构建方法、帧间预测方法及装置
US10944984B2 (en) * 2018-08-28 2021-03-09 Qualcomm Incorporated Affine motion prediction
US11184635B2 (en) * 2018-08-31 2021-11-23 Tencent America LLC Method and apparatus for video coding with motion vector constraints
TWI729483B (zh) * 2018-09-04 2021-06-01 聯發科技股份有限公司 視訊編解碼系統的運動向量湊整統一的方法以及裝置
CN116647696A (zh) 2018-09-06 2023-08-25 Lg电子株式会社 图像解码方法、图像编码方法、存储介质和发送方法
WO2020050281A1 (ja) * 2018-09-06 2020-03-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
CN110891174B (zh) * 2018-09-08 2023-03-10 北京字节跳动网络技术有限公司 不同视频块尺寸的仿射模式计算
CN110891176B (zh) 2018-09-10 2023-01-13 华为技术有限公司 基于仿射运动模型的运动矢量预测方法及设备
DK3700216T3 (da) * 2018-09-10 2022-09-12 Lg Electronics Inc Billeddekodning, baseret på affin bevægelses-forudsigelse under anvendelse af affin MVP-kandidatliste
CN111064961B (zh) 2018-09-12 2023-06-09 北京字节跳动网络技术有限公司 视频处理方法和装置
KR102362840B1 (ko) * 2018-09-12 2022-02-14 엘지전자 주식회사 영상 코딩 시스템에서 서브 블록 단위의 움직임 예측에 기반한 영상 디코딩 방법 및 장치
US11750836B2 (en) * 2018-09-13 2023-09-05 Interdigital Vc Holdings, Inc. Virtual temporal affine candidates
EP3827586A1 (en) 2018-09-19 2021-06-02 Beijing Bytedance Network Technology Co. Ltd. Syntax reuse for affine mode with adaptive motion vector resolution
GB2577318B (en) * 2018-09-21 2021-03-10 Canon Kk Video coding and decoding
GB2589735B (en) * 2018-09-21 2021-12-01 Canon Kk Video coding and decoding
GB2579763B (en) * 2018-09-21 2021-06-09 Canon Kk Video coding and decoding
US10834417B2 (en) * 2018-09-21 2020-11-10 Tencent America LLC Method and apparatus for video coding
US11212550B2 (en) * 2018-09-21 2021-12-28 Qualcomm Incorporated History-based motion vector prediction for affine mode
WO2020060374A1 (ko) * 2018-09-21 2020-03-26 엘지전자 주식회사 어파인 예측을 이용하여 비디오 신호를 처리하기 위한 방법 및 장치
GB2597616B (en) * 2018-09-21 2023-01-18 Canon Kk Video coding and decoding
TWI821408B (zh) * 2018-09-23 2023-11-11 大陸商北京字節跳動網絡技術有限公司 塊級別的運動向量平面模式
WO2020058956A1 (en) * 2018-09-23 2020-03-26 Beijing Bytedance Network Technology Co., Ltd. Non-affine blocks predicted from affine motion
WO2020058955A1 (en) * 2018-09-23 2020-03-26 Beijing Bytedance Network Technology Co., Ltd. Multiple-hypothesis affine mode
WO2020065518A1 (en) 2018-09-24 2020-04-02 Beijing Bytedance Network Technology Co., Ltd. Bi-prediction with weights in video coding and decoding
WO2020065569A1 (en) * 2018-09-26 2020-04-02 Beijing Bytedance Network Technology Co., Ltd. Mode dependent affine inheritance
WO2020067835A1 (ko) * 2018-09-28 2020-04-02 엘지전자 주식회사 어파인 예측을 이용하여 비디오 신호를 처리하기 위한 방법 및 장치
WO2020072397A1 (en) * 2018-10-04 2020-04-09 Interdigital Vc Holdings, Inc. Block size based motion vector coding in affine mode
MX2021004008A (es) 2018-10-08 2021-06-23 Lg Electronics Inc Método de diseño de sintaxis y aparato para realizar codificación usando sintaxis.
JP2022504753A (ja) * 2018-10-10 2022-01-13 インターデイジタル ヴィーシー ホールディングス インコーポレイテッド ビデオエンコーディングおよびデコーディングにおけるアフィンモードシグナリング
GB2578150C (en) * 2018-10-18 2022-05-18 Canon Kk Video coding and decoding
GB2578151B (en) * 2018-10-18 2021-06-09 Canon Kk Video coding and decoding
CN112913239A (zh) * 2018-10-22 2021-06-04 北京字节跳动网络技术有限公司 基于参考图片的解码器侧运动矢量推导
CN111083489A (zh) 2018-10-22 2020-04-28 北京字节跳动网络技术有限公司 多次迭代运动矢量细化
WO2020084470A1 (en) * 2018-10-22 2020-04-30 Beijing Bytedance Network Technology Co., Ltd. Storage of motion parameters with clipping for affine mode
CN116471403A (zh) * 2018-10-23 2023-07-21 北京字节跳动网络技术有限公司 基于子块的运动信息列表的简化熵编解码
WO2020085953A1 (en) * 2018-10-25 2020-04-30 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods for inter prediction
WO2020089822A1 (en) 2018-10-31 2020-05-07 Beijing Bytedance Network Technology Co., Ltd. Overlapped block motion compensation with derived motion information from neighbors
CN115514958A (zh) * 2018-11-02 2022-12-23 抖音视界有限公司 用于基于历史的运动矢量预测的表维护
KR20230158645A (ko) 2018-11-05 2023-11-20 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 리파인먼트를 이용한 인터 예측을 위한 보간
EP3847814A1 (en) * 2018-11-06 2021-07-14 Beijing Bytedance Network Technology Co. Ltd. Position dependent storage of motion information
US11212521B2 (en) * 2018-11-07 2021-12-28 Avago Technologies International Sales Pte. Limited Control of memory bandwidth consumption of affine mode in versatile video coding
EP3861723A4 (en) 2018-11-10 2022-04-20 Beijing Bytedance Network Technology Co., Ltd. ROUNDS IN PAIRS OF MEDIUM CANDIDATE BILLS
KR102628361B1 (ko) * 2018-11-12 2024-01-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 인터-예측을 위한 대역폭 제어 방법
US11736713B2 (en) * 2018-11-14 2023-08-22 Tencent America LLC Constraint on affine model motion vector
CN112997496A (zh) * 2018-11-14 2021-06-18 北京字节跳动网络技术有限公司 仿射预测模式的改进
WO2020098803A1 (en) * 2018-11-15 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Harmonization between affine mode and other inter coding tools
WO2020098810A1 (en) 2018-11-17 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Merge with motion vector difference in video processing
WO2020103852A1 (en) 2018-11-20 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Difference calculation based on patial position
WO2020103935A1 (en) * 2018-11-22 2020-05-28 Beijing Bytedance Network Technology Co., Ltd. Blending method for inter prediction with geometry partition
CN113170198B (zh) * 2018-11-22 2022-12-09 北京字节跳动网络技术有限公司 子块时域运动矢量预测
US20200169757A1 (en) * 2018-11-23 2020-05-28 Mediatek Inc. Signaling For Multi-Reference Line Prediction And Multi-Hypothesis Prediction
WO2020108652A1 (en) * 2018-11-29 2020-06-04 Beijing Bytedance Network Technology Co., Ltd. Interaction between intra block copy mode and sub-block based motion vector prediction mode
US11115652B2 (en) * 2018-12-07 2021-09-07 Tencent America LLC Method and apparatus for further improved context design for prediction mode and coded block flag (CBF)
CN113170148A (zh) * 2018-12-08 2021-07-23 北京字节跳动网络技术有限公司 减少仿射继承所需的ctu内存储
WO2020122232A1 (ja) * 2018-12-14 2020-06-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法、および復号方法
WO2020130617A1 (ko) * 2018-12-18 2020-06-25 엘지전자 주식회사 비디오 데이터를 처리하기 위한 방법 및 장치
GB2580084B (en) * 2018-12-20 2022-12-28 Canon Kk Video coding and decoding
WO2020131583A1 (en) * 2018-12-21 2020-06-25 Beijing Dajia Internet Information Technology Co., Ltd. Methods and apparatus of video coding for deriving affine motion vectors for chroma components
EP3868107A4 (en) 2018-12-21 2021-12-15 Beijing Bytedance Network Technology Co. Ltd. MOTION VECTOR ACCURACY IN INTERACTING WITH MOTION VECTOR DIFFERENCE MODE
CN113196771B (zh) 2018-12-21 2023-12-22 北京字节跳动网络技术有限公司 基于运动矢量精度的运动矢量范围
EP3886438A4 (en) * 2018-12-24 2022-01-19 Huawei Technologies Co., Ltd. FLAG BIT CONTEXT MODELING METHOD AND APPARATUS
CN111355961B (zh) * 2018-12-24 2023-11-03 华为技术有限公司 一种帧间预测的方法和装置
BR112021012479A2 (pt) * 2018-12-28 2021-09-08 Jvckenwood Corporation Dispositivo de codificação de imagem em movimento, método de codificação de imagem em movimento, programa de codificação de imagem em movimento, dispositivo de decodificação de imagem em movimento, método de decodificação de imagem em movimento e programa de decodificação de imagem em movimento
US11102476B2 (en) * 2018-12-28 2021-08-24 Qualcomm Incorporated Subblock based affine motion model
WO2020143772A1 (en) * 2019-01-10 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Affine based merge with mvd
CN113273186A (zh) 2019-01-10 2021-08-17 北京字节跳动网络技术有限公司 Lut更新的调用
US11025951B2 (en) * 2019-01-13 2021-06-01 Tencent America LLC Method and apparatus for video coding
WO2020143824A1 (en) 2019-01-13 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and shared merge list
WO2020147773A1 (en) * 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Inserting order of motion candidates in lut
US10904553B2 (en) * 2019-01-22 2021-01-26 Tencent America LLC Method and apparatus for video coding
KR20210121021A (ko) 2019-01-31 2021-10-07 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 어파인 모드 적응적 움직임 벡터 해상도 코딩 문맥
CN111526362B (zh) * 2019-02-01 2023-12-29 华为技术有限公司 帧间预测方法和装置
WO2020164544A1 (en) 2019-02-13 2020-08-20 Beijing Bytedance Network Technology Co., Ltd. Updating of history based motion vector prediction tables
CN113508593A (zh) * 2019-02-27 2021-10-15 北京字节跳动网络技术有限公司 基于回退的运动矢量场的基于子块运动矢量推导
WO2020177755A1 (en) 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Usage of converted uni-prediction candidate
US11323731B2 (en) * 2019-03-08 2022-05-03 Tencent America LLC Method and apparatus for video coding
US11343525B2 (en) * 2019-03-19 2022-05-24 Tencent America LLC Method and apparatus for video coding by constraining sub-block motion vectors and determining adjustment values based on constrained sub-block motion vectors
WO2020192611A1 (en) 2019-03-22 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. Interaction between merge list construction and other tools
CN113661708B (zh) 2019-04-02 2023-12-15 北京字节跳动网络技术有限公司 基于双向光流的视频编解码和解码
CN113785586B (zh) * 2019-04-12 2023-12-22 寰发股份有限公司 用于视频编解码系统的简化仿射子块处理的方法及装置
CN113711609B (zh) 2019-04-19 2023-12-01 北京字节跳动网络技术有限公司 利用光流的预测细化过程中的增量运动矢量
WO2020219970A1 (en) 2019-04-24 2020-10-29 Op Solutions, Llc Signaling of global motion vector in picture header
CN114080811A (zh) * 2019-04-25 2022-02-22 Op方案有限责任公司 具有全局运动的帧中的选择性运动矢量预测候选
MX2021013071A (es) 2019-04-25 2021-11-17 Op Solutions Llc Candidatos a la prediccion adaptativa de vectores de movimiento en tramas con movimiento global.
WO2020219969A1 (en) * 2019-04-25 2020-10-29 Op Solutions, Llc Signaling of global motion vector in picture header
JP7448975B2 (ja) * 2019-04-25 2024-03-13 オーピー ソリューションズ, エルエルシー インタ予測における大域的運動制約運動ベクトル
KR20220002987A (ko) * 2019-04-25 2022-01-07 오피 솔루션즈, 엘엘씨 모션 벡터 인터 예측을 위한 글로벌 모션 모델들
US11109041B2 (en) * 2019-05-16 2021-08-31 Tencent America LLC Method and apparatus for video coding
CN114175658A (zh) * 2019-05-26 2022-03-11 北京达佳互联信息技术有限公司 用于改进视频编解码中的运动估计的方法和装置
US11153598B2 (en) * 2019-06-04 2021-10-19 Tencent America LLC Method and apparatus for video coding using a subblock-based affine motion model
US11190761B2 (en) 2019-06-14 2021-11-30 Hyundai Motor Company Method and apparatus for encoding and decoding video using inter-prediction
WO2020251325A1 (ko) * 2019-06-14 2020-12-17 현대자동차주식회사 인터 예측을 이용하여 비디오를 부호화 및 복호화하는 방법 및 장치
WO2021023255A1 (en) * 2019-08-08 2021-02-11 FG Innovation Company Limited Device and method for coding video data
JP2022544260A (ja) 2019-08-13 2022-10-17 北京字節跳動網絡技術有限公司 サブブロックに基づくインター予測における動き精度
CN114762330A (zh) 2019-09-22 2022-07-15 北京字节跳动网络技术有限公司 视频的子图片编码和解码
BR112022005406A2 (pt) * 2019-09-30 2022-11-29 Huawei Tech Co Ltd Restrições de modelo de movimento afim para redução de largura de banda de memória de filtro de interpolação aprimorado
WO2021086153A1 (ko) * 2019-10-31 2021-05-06 삼성전자 주식회사 어파인 모델에 따른 인터 예측을 수행하는 비디오 복호화 방법 및 그 장치, 비디오 부호화 방법 및 그 장치
US20220377318A1 (en) * 2019-12-24 2022-11-24 Interdigital Vc Holdings France Spatial predictor scan order
KR20220123707A (ko) * 2020-01-07 2022-09-08 후아웨이 테크놀러지 컴퍼니 리미티드 강화된 보간 필터에 대한 움직임 벡터 범위 도출
KR102587601B1 (ko) 2021-01-20 2023-10-10 조창용 커피 및 귀리와 메밀껍질액상발효액을 포함하는 커피막걸리 제조방법 및 그에 의해 제조되는 커피막걸리
US11936877B2 (en) * 2021-04-12 2024-03-19 Qualcomm Incorporated Template matching based affine prediction for video coding
CN117337409A (zh) * 2021-06-17 2024-01-02 Sage电致变色显示有限公司 电致变色玻璃的基于叠层电压的闭环反馈控制
US20230164351A1 (en) * 2021-11-19 2023-05-25 Tencent America LLC Methods and devices for refining motion vector candidates
US11943448B2 (en) 2021-11-22 2024-03-26 Tencent America LLC Joint coding of motion vector difference
WO2023177799A1 (en) * 2022-03-16 2023-09-21 Beijing Dajia Internet Information Technology Co., Ltd. Adaptive picture modifications for video coding
WO2023219616A1 (en) * 2022-05-11 2023-11-16 Google Llc Local motion extension in video coding
US20240015303A1 (en) * 2022-07-06 2024-01-11 Tencent America LLC Local warp motion prediction modes

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150092851A1 (en) * 2013-09-30 2015-04-02 Panasonic Intellectual Property Corporation Of America Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
WO2015055111A1 (en) * 2013-10-14 2015-04-23 Mediatek Inc. Method of lossless mode signaling for video system with lossless and lossy coding
CN104935938A (zh) * 2015-07-15 2015-09-23 哈尔滨工业大学 一种混合视频编码标准中帧间预测方法

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5654771A (en) 1995-05-23 1997-08-05 The University Of Rochester Video compression system using a dense motion vector field and a triangular patch mesh overlay model
AU1941797A (en) * 1997-03-17 1998-10-12 Mitsubishi Denki Kabushiki Kaisha Image encoder, image decoder, image encoding method, image decoding method and image encoding/decoding system
US6735249B1 (en) 1999-08-11 2004-05-11 Nokia Corporation Apparatus, and associated method, for forming a compressed motion vector field utilizing predictive motion coding
US6738423B1 (en) * 2000-01-21 2004-05-18 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
US6711211B1 (en) * 2000-05-08 2004-03-23 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
KR100359115B1 (ko) * 2000-05-24 2002-11-04 삼성전자 주식회사 영상 코딩 방법
US20030123738A1 (en) * 2001-11-30 2003-07-03 Per Frojdh Global motion compensation for video pictures
KR100746314B1 (ko) 2002-01-18 2007-08-03 가부시끼가이샤 도시바 동화상 복호화방법 및 장치
EP1800238A4 (en) * 2004-09-21 2012-01-25 Euclid Discoveries Llc APPARATUS AND METHOD FOR PROCESSING VIDEO DATA
JP2012080151A (ja) * 2009-02-09 2012-04-19 Toshiba Corp 幾何変換動き補償予測を用いる動画像符号化及び動画像復号化の方法と装置
WO2011013253A1 (ja) 2009-07-31 2011-02-03 株式会社 東芝 幾何変換動き補償予測を用いる予測信号生成装置、動画像符号化装置及び動画像復号化装置
US8411750B2 (en) * 2009-10-30 2013-04-02 Qualcomm Incorporated Global motion parameter estimation using block-based motion vectors
HUE025960T2 (en) * 2010-04-13 2016-04-28 Ge Video Compression Llc Video coding using multi-tree subdivisions of images
CN103026707B (zh) * 2010-07-21 2016-11-09 杜比实验室特许公司 使用用于视频编码的高级运动模型的参考处理
CN107071438B (zh) 2010-10-08 2020-09-01 Ge视频压缩有限责任公司 编码器和编码方法与解码器和解码方法
US9807424B2 (en) 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
RU2480941C2 (ru) 2011-01-20 2013-04-27 Корпорация "Самсунг Электроникс Ко., Лтд" Способ адаптивного предсказания кадра для кодирования многоракурсной видеопоследовательности
US9282338B2 (en) 2011-06-20 2016-03-08 Qualcomm Incorporated Unified merge mode and adaptive motion vector prediction mode candidates selection
US20130070855A1 (en) 2011-09-17 2013-03-21 Qualcomm Incorporated Hybrid motion vector coding modes for video coding
US9883203B2 (en) 2011-11-18 2018-01-30 Qualcomm Incorporated Adaptive overlapped block motion compensation
CN104704819B (zh) 2012-10-03 2016-12-21 联发科技股份有限公司 3d视频编码的视差矢量推导和视图间运动矢量预测的方法及装置
WO2014078068A1 (en) 2012-11-13 2014-05-22 Intel Corporation Content adaptive transform coding for next generation video
JP6472441B2 (ja) 2013-10-11 2019-02-20 シャープ株式会社 ビデオを復号するための方法
CN106464905B (zh) 2014-05-06 2019-06-07 寰发股份有限公司 用于块内复制模式编码的块向量预测方法
WO2016008157A1 (en) * 2014-07-18 2016-01-21 Mediatek Singapore Pte. Ltd. Methods for motion compensation using high order motion model
CN107734335B (zh) 2014-09-30 2020-11-06 华为技术有限公司 图像预测方法及相关装置
CN104363451B (zh) 2014-10-27 2019-01-25 华为技术有限公司 图像预测方法及相关装置
CN112188207B (zh) 2014-10-31 2023-10-20 三星电子株式会社 使用高精度跳过编码的视频编码设备和视频解码设备及其方法
MX2017011558A (es) 2015-03-10 2018-03-21 Huawei Tech Co Ltd Método de predicción de imagen y aparato relacionado.
KR102267922B1 (ko) 2015-09-23 2021-06-22 노키아 테크놀로지스 오와이 360도 파노라마 비디오를 코딩하는 방법, 장치 및 컴퓨터 프로그램 제품
CN108141588A (zh) 2015-09-24 2018-06-08 Lg电子株式会社 图像编码系统中的帧间预测方法和装置
KR102469145B1 (ko) * 2015-10-13 2022-11-21 삼성전자주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
US11082713B2 (en) 2015-11-20 2021-08-03 Mediatek Inc. Method and apparatus for global motion compensation in video coding system
CN108886619A (zh) * 2016-01-07 2018-11-23 联发科技股份有限公司 用于视频编解码系统的仿射合并模式预测的方法及装置
WO2017130696A1 (ja) 2016-01-29 2017-08-03 シャープ株式会社 予測画像生成装置、動画像復号装置、および動画像符号化装置
US10560712B2 (en) 2016-05-16 2020-02-11 Qualcomm Incorporated Affine motion prediction for video coding
CN109076234A (zh) 2016-05-24 2018-12-21 华为技术有限公司 图像预测方法和相关设备
US10448010B2 (en) 2016-10-05 2019-10-15 Qualcomm Incorporated Motion vector prediction for affine motion models in video coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150092851A1 (en) * 2013-09-30 2015-04-02 Panasonic Intellectual Property Corporation Of America Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
WO2015055111A1 (en) * 2013-10-14 2015-04-23 Mediatek Inc. Method of lossless mode signaling for video system with lossless and lossy coding
CN104935938A (zh) * 2015-07-15 2015-09-23 哈尔滨工业大学 一种混合视频编码标准中帧间预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HUAWEI TECHNOLOGIES: "Affine transform prediction for next generation video coding", 《INTERNATIONAL TELECOMMUNICATION UNION》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11856211B2 (en) 2018-11-16 2023-12-26 Beijing Bytedance Network Technology Co., Ltd Usage for history-based affine parameters
US11902550B2 (en) 2018-11-16 2024-02-13 Beijing Bytedance Network Technology Co., Ltd Pruning method for history-based affine parameters
US20210266584A1 (en) 2018-11-16 2021-08-26 Beijing Bytedance Network Technology Co., Ltd. Usage for history-based affine parameters
CN111435993A (zh) * 2019-01-14 2020-07-21 华为技术有限公司 视频编码器、视频解码器及相应方法
WO2020147514A1 (zh) * 2019-01-14 2020-07-23 华为技术有限公司 视频编码器、视频解码器及相应方法
CN113366850B (zh) * 2019-01-14 2022-09-23 华为技术有限公司 视频编码器、视频解码器及相应方法
CN111435993B (zh) * 2019-01-14 2022-08-26 华为技术有限公司 视频编码器、视频解码器及相应方法
US11902506B2 (en) 2019-01-14 2024-02-13 Huawei Technologies Co., Ltd. Video encoder, video decoder, and corresponding methods
CN113366850A (zh) * 2019-01-14 2021-09-07 华为技术有限公司 视频编码器、视频解码器及相应方法
CN113316933A (zh) * 2019-01-17 2021-08-27 北京字节跳动网络技术有限公司 使用运动预测进行去方块滤波
US11863784B2 (en) 2019-02-22 2024-01-02 Beijing Bytedance Network Technology Co., Ltd Sub-table for history-based affine mode
WO2020169109A1 (en) * 2019-02-22 2020-08-27 Beijing Bytedance Network Technology Co., Ltd. Sub-table for history-based affine mode
CN113597766A (zh) * 2019-03-17 2021-11-02 北京字节跳动网络技术有限公司 基于光流的预测细化的计算
CN113574869B (zh) * 2019-03-17 2024-01-05 北京字节跳动网络技术有限公司 基于光流的预测细化
CN113597766B (zh) * 2019-03-17 2023-11-10 北京字节跳动网络技术有限公司 基于光流的预测细化的计算
CN113574869A (zh) * 2019-03-17 2021-10-29 北京字节跳动网络技术有限公司 基于光流的预测细化
CN113711608A (zh) * 2019-04-19 2021-11-26 北京字节跳动网络技术有限公司 利用光流的预测细化过程的适用性
CN113728630A (zh) * 2019-04-19 2021-11-30 北京字节跳动网络技术有限公司 不同运动矢量细化中的基于区域的梯度计算
US11924463B2 (en) 2019-04-19 2024-03-05 Beijing Bytedance Network Technology Co., Ltd Gradient calculation in different motion vector refinements
CN113728630B (zh) * 2019-04-19 2023-11-17 北京字节跳动网络技术有限公司 不同运动矢量细化中的基于区域的梯度计算
CN113711608B (zh) * 2019-04-19 2023-09-01 北京字节跳动网络技术有限公司 利用光流的预测细化过程的适用性
CN113853793B (zh) * 2019-05-21 2023-12-19 北京字节跳动网络技术有限公司 基于光流的帧间编码的语法信令
CN113924771A (zh) * 2019-05-21 2022-01-11 北京字节跳动网络技术有限公司 子块Merge模式中的语法信令
CN113853793A (zh) * 2019-05-21 2021-12-28 北京字节跳动网络技术有限公司 基于光流的帧间编码的语法信令
CN113924771B (zh) * 2019-05-21 2024-01-12 北京字节跳动网络技术有限公司 子块Merge模式中的语法信令
WO2021056220A1 (zh) * 2019-09-24 2021-04-01 北京大学 视频编解码的方法与装置
CN112204973A (zh) * 2019-09-24 2021-01-08 北京大学 视频编解码的方法与装置
CN114503558B (zh) * 2019-09-30 2023-10-20 华为技术有限公司 插值滤波器在仿射运动补偿中的适应性使用
CN115349257A (zh) * 2019-09-30 2022-11-15 华为技术有限公司 基于dct的内插滤波器的使用
CN114503558A (zh) * 2019-09-30 2022-05-13 华为技术有限公司 插值滤波器在仿射运动补偿中的适应性使用
CN115349257B (zh) * 2019-09-30 2024-04-09 华为技术有限公司 基于dct的内插滤波器的使用
CN111050168A (zh) * 2019-12-27 2020-04-21 浙江大华技术股份有限公司 仿射预测方法及其相关装置
CN111050168B (zh) * 2019-12-27 2021-07-13 浙江大华技术股份有限公司 仿射预测方法及其相关装置

Also Published As

Publication number Publication date
TWI703860B (zh) 2020-09-01
CA3020244A1 (en) 2017-11-23
JP6767508B2 (ja) 2020-10-14
US11503324B2 (en) 2022-11-15
CA3020244C (en) 2023-01-03
KR20190006967A (ko) 2019-01-21
WO2017200771A1 (en) 2017-11-23
CN115379237A (zh) 2022-11-22
US10560712B2 (en) 2020-02-11
CN109155855B (zh) 2022-09-20
EP3459249A1 (en) 2019-03-27
US20170332095A1 (en) 2017-11-16
KR102177089B1 (ko) 2020-11-10
BR112018073397A2 (pt) 2019-03-19
TW201742465A (zh) 2017-12-01
JP2019519980A (ja) 2019-07-11
US20200145688A1 (en) 2020-05-07

Similar Documents

Publication Publication Date Title
CN109155855A (zh) 用于视频译码的仿射运动预测
CN107211156B (zh) 一种译码视频数据的方法、装置及计算机可读存储媒体
CN107211124B (zh) 用于译码视频数据的方法、装置和计算机可读存储媒体
CN105122812B (zh) 用于三维(3d)视频译码的高级合并模式
CN105379282B (zh) 用于纹理译码的先进残余预测(arp)的方法和设备
CN104303502B (zh) 对多视图视频数据进行编码、解码和译码的方法、装置及计算机可读存储介质
CN106797477B (zh) 用于解码及编码视频数据的方法和设备
CN105637870B (zh) 使用不对称运动分割的视频译码技术
CN105556969B (zh) 视频译码中使用视差向量的块识别
CN106105203B (zh) 块自适应颜色空间转换译码
CN109792531A (zh) 用于视频译码的运动向量译码
CN104769949B (zh) 用于视差向量导出的图片的选择的方法和装置
CN110301135A (zh) 在视频解码器处导出运动向量信息
CN105723707B (zh) 用于视频译码的色彩残差预测
CN110100436A (zh) 使用导出色度模式译码视频数据
CN104170380B (zh) 视频译码中的视差矢量预测
CN109792532A (zh) 用于视频译码的适应性运动向量精准度
CN105393536B (zh) 使用位移向量从预测性块的帧内预测
CN104025602B (zh) 三维视频译码中用信号通知视图合成预测支持
CN105493507B (zh) 用于帧内块复制的残余预测
CN104756499B (zh) 用于视频译码的方法、设备及计算机可读存储媒体
CN104584558B (zh) 用于3d视频的视图间预测的运动向量
CN110431845A (zh) 约束通过解码器侧运动向量推导导出的运动向量信息
CN105144715B (zh) 后向视图合成预测
CN107710764A (zh) 确定用于视频译码的照明补偿状态的系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant