CN112839224B - 一种预测模式选择方法、装置、视频编码设备及存储介质 - Google Patents

一种预测模式选择方法、装置、视频编码设备及存储介质 Download PDF

Info

Publication number
CN112839224B
CN112839224B CN201911159812.XA CN201911159812A CN112839224B CN 112839224 B CN112839224 B CN 112839224B CN 201911159812 A CN201911159812 A CN 201911159812A CN 112839224 B CN112839224 B CN 112839224B
Authority
CN
China
Prior art keywords
unit
prediction mode
motion vector
downsampling
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911159812.XA
Other languages
English (en)
Other versions
CN112839224A (zh
Inventor
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911159812.XA priority Critical patent/CN112839224B/zh
Publication of CN112839224A publication Critical patent/CN112839224A/zh
Application granted granted Critical
Publication of CN112839224B publication Critical patent/CN112839224B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请公开了一种预测模式选择方法、装置、视频编码设备及存储介质,属于视频编码技术领域。该方法包括:获取待编码单元对应的下采样单元的预分析运动矢量,下采样单元是对待编码单元所在的当前编码帧进行下采样后划分得到的;根据当前编码帧中与待编码单元相邻的至少两个已编码单元分别对应的运动矢量,确定M个候选运动矢量;以当前待选择的目标预测模式,从M个候选运动矢量中确定目标运动矢量;在预分析运动矢量和目标运动矢量满足预设条件时,将目标预测模式确定为对待编码单元进行编码的预测模式。结合预分析阶段的运动信息和从相邻已编码单元处继承的运动特征能够对预测模式进行快速判决,减少预测模式的决策时间,提高预测模式决策效率。

Description

一种预测模式选择方法、装置、视频编码设备及存储介质
技术领域
本申请涉及视频编码技术领域,尤其涉及一种预测模式选择方法、装置、视频编码设备及存储介质。
背景技术
视频编码技术主要是通过消除视频信号中的冗余实现对视频的压缩,其中较为常用的是预测编码技术。在进行预测编码的过程中,需要将每帧视频图像划分为多个编码单元,然后分别对每一编码单元进行预测编码。
在对编码单元进行预测编码之前,需要先对预测模式进行决策,即需要从视频编码标准定义的多种预测模式中选择一种最优预测模式来进行预测编码。相关技术中决策最优预测模式的方式是:遍历每种预测模式,以计算每种预测模式相应的编码代价,进而选择出编码代价最小的预测模式作为最优预测模式。
可见,相关技术中通过遍历决策预测模式的方式需要对每种预测模式都进行编码代价的计算,然而由于编码代价的计算本身就较为复杂,所以对全部预测模式都计算编码代价的计算复杂度较高,预测模式的整个决策过程的处理量较大,视频编码的效率较低。所以,如何减少预测模式决策过程中的计算复杂度以提高视频编码效率是需要考虑的问题。
发明内容
本申请实施例提供一种预测模式选择方法、装置、视频编码设备及存储介质,用于降低预测模式决策过程的计算复杂度,进而提高编码效率。
一方面,提供一种预测模式选择方法,所述方法包括:
获取待编码单元对应的下采样单元的预分析运动矢量,其中,所述下采样单元是对所述待编码单元所在的当前编码帧进行下采样后划分得到的;
根据所述当前编码帧中与所述待编码单元相邻的至少两个已编码单元分别对应的运动矢量,确定M个候选运动矢量,M为大于1的整数;
以当前待选择的目标预测模式,从所述M个候选运动矢量中确定目标运动矢量;
在所述预分析运动矢量和所述目标运动矢量满足预设条件时,将所述目标预测模式确定为用于对所述待编码单元进行编码的预测模式。
一方面,提供一种预测模式选择装置,所述装置包括:
获取模块,用于获取待编码单元对应的下采样单元的预分析运动矢量,其中,所述下采样单元是对所述待编码单元所在的当前编码帧进行下采样后划分得到的;
第一确定模块,用于根据所述当前编码帧中与所述待编码单元相邻的至少两个已编码单元分别对应的运动矢量,确定M个候选运动矢量,M为大于1的整数;
第二确定模块,用于以当前待选择的目标预测模式,从所述M个候选运动矢量中确定目标运动矢量;
编码模块,用于在所述预分析运动矢量和所述目标运动矢量满足预设条件时,将所述目标预测模式确定为用于对所述待编码单元进行编码的预测模式。
在一种可能的实现方式中,所述第二确定模块用于:
以每个候选运动矢量分别作为所述待编码单元的预测运动矢量,确定在所述目标预测模式下的率失真代价,得到M个率失真代价;
将所述M个率失真代价中的最小率失真代价对应的候选运动矢量确定为所述目标运动矢量。
在一种可能的实现方式中,所述决策模块用于:
在所述预分析运动矢量和所述目标运动矢量相等时,确定所述预分析运动矢量和所述目标运动矢量满足所述预设条件;或者,
在所述预分析运动矢量和所述目标运动矢量之间的差值在预设差值范围内时,确定所述预分析运动矢量和所述目标运动矢量满足所述预设条件。
在一种可能的实现方式中,所述决策模块用于:
在所述待编码单元对应的下采样单元为一个时,确定该一个下采样单元对应的一个预分析运动矢量满足所述预设条件;
在所述待编码单元对应的下采样单元为多个时,确定该多个下采样单元对应的多个预分析运动矢量满足第一级条件,以及所述多个预分析运动矢量与所述目标运动矢量满足第二级条件。
在一种可能的实现方式中,所述决策模块用于:
按照skip模式、merge模式优先判决的判决顺序对多种预测模式进行判决。
在一种可能的实现方式中,所述多种预测模式中的每种预测模式均为帧间预测模式。
在一种可能的实现式中,所述装置还包括第三确定模块,用于:
根据所述待编码单元的尺寸和下采样参数确定所述待编码单元对应的下采样单元的数量,所述下采样参数包括下采样比例和下采样单元的尺寸。
在一种可能的实现方式中,所述装置还包括第四确定模块,用于:
确定所述待编码单元的尺寸大于所述下采样单元的尺寸。
在一种可能的实现方式中,所述决策模块还用于:
在所述待编码单元的尺寸不大于所述下采样单元的尺寸时,依次确定所述待编码单元在每种待选择的预测模式下的率失真代价;
从待选择的所有预测模式对应的所有率失真代价中确定率失真代价最小对应的预测模式,并将率失真代价最小对应的预测模式确定为用于对所述待编码单元进行编码的预测模式。
在一种可能的实现方式中,所述装置还包括编码模块,用于:
在所述决策模块将所述目标预测模式确定为用于对所述待编码单元进行编码的预测模式之后,根据所述目标预测模式对所述待编码单元进行编码处理。
一方面,提供一种视频编码设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述各种可能的实现方式中所描述的预测模式选择方法包括的步骤。
一方面,提供一种存储介质,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述各种可能的实现方式中所描述的预测模式选择方法包括的步骤。
一方面,提供一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行上述各种可能的实现方式中所描述的预测模式选择方法包括的步骤。
本申请实施例中,根据待编码单元相邻的多个已编码单元分别对应的运动矢量确定候选运动矢量列表(例如包括M个候选运动矢量),然后以当前待选择的目标预测模式,从该候选运动矢量列表中选择出目标运动矢量,进而再将从相邻的已编码单元处继承的目标运动矢量与预分析阶段得到的对应下采样单元的预分析运动矢量进行预设条件的验证,并在两者满足预设条件时则直接将当前正在判决的目标预测模式(例如skip模式或者merge模式)决策为将用于对待编码单元实际进行编码的预测模式,从而跳过后续预测模式的遍历,减少预测模式的决策时间,提高预测模式的决策速度,从而提高编码效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例适用的一种应用场景的示意图;
图2为本申请实施例适用的另一种应用场景的示意图;
图3为相关技术中的视频编码过程的流程示意图;
图4为本申请实施例中的预测模式选择方法的流程图;
图5为本申请实施例中的对视频帧进行下采样的示意图;
图6为本申请实施例中的与待编码单元相邻的已编码单元的示意图;
图7为本申请实施例中的多种预测模式的判决顺序示意图;
图8为本申请实施例中的预测模式选择方法的另一流程图;
图9为本申请实施例中的16×16的编码单元与下采样单元对应的示意图;
图10为本申请实施例中的32×32的编码单元与下采样单元对应的示意图;
图11为本申请实施例中的64×64的编码单元与下采样单元对应的示意图;
图12为本申请实施例中的预测模式选择装置的结构框图;
图13为本申请实施例中的视频编码设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于申请保护的范围。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
以下对本文中涉及的部分技术用语进行说明,以便于本领域技术人员理解。
1、视频帧:构成视频的基本单元,视频即为多个视频帧构成的帧序列。视频帧例如又称作图像帧,当对视频帧进行视频编码时,可以将进行编码的视频帧称作编码帧。
视频帧包括I帧、B帧和P帧三类。其中的I帧为帧内编码帧,是一种自带全部信息的独立帧,无需参考其它图像帧便可独立进行解码;P帧为帧间编码帧,P帧又称为帧间预测帧或前向预测帧,可采用帧内预测编码和帧间预测编码,可前向参考预测编码;B帧也为帧间编码帧,B采用帧内预测编码和帧间预测编码,可前向、后向、双向参考预测编码。
2、HEVC(High-Efficiency Video Coding)是由国际电信联盟电信标准分(ITU-T,简称国际电联)和国际标准化组织(International Standards Organization,ISO)共同制定的新一代高效视频编码标准。
3、编码单元:HEVC中以编码树单元(Coding Tree Unit,CTU)为单位进行编码,因此,在进行编码过程中需将视频序列中的视频帧划分成均匀等大小的CTU,进一步地,还可以将CTU按照四叉树结构划分成更小的编码单元(Coding Unit,CU)。
CTU包括64×64、32×32、16×16、8×8四种尺寸,以32×32为例,表示对应的CTU的尺寸为宽为32像素、高为32像素,即32×32像素,为了简便,本文中将32×32像素简写为32×32,而对于其它尺寸的描述也是类似的。
进一步地,可以将CTU以四叉树结构划分为多个CU,这么做是为了很好地对不同的空间特性编码方式(帧间或帧内)能够做出调整,在CU级决定是采用帧内预测编码(利用空间相关性)还是帧间预测编码(利用时间相关性)。
CU也可以包括64×64、32×32、16×16、8×8这四种尺寸。例如,当CTU为64×64时,划分的CU大小可以为8×8、16×16、32×32、64×64,对应的划分深度分别为3、2、1、0。
4、帧内预测编码:由于视频帧序列图像在空间上存在很强的相关性,例如在一帧图像帧中,其背景是一面同样花纹和质地的墙壁,因此,在该视频帧被分成的若干编码单元中,有关墙壁的编码单元可能显示的信息相同或者类似,对这些空间相关性程度高的编码单元可以采用帧内预测编码技术进行编码。
也就是说,帧内预测是利用空间相关性,探索视频帧内部的相关性,一般来说,编码过程对视频帧逐块进行,编码端也会对各个编码块(即编码单元)逐块进行重建。帧内预测直接利用视频帧中当前编码单元相邻的已编码重建块进行预测。
5、帧间预测编码:是利用当前编码单元周边已编码重建的其它编码块确定参考帧,通过运动估计(motion estimation,ME),利用参考帧对当前编码块进行预测编码,以消除视频的时间冗余信息的一种手段。
也就是说,帧间预测是利用时间相关性,探索相邻视频帧之间的相关性,通过在时间上已经重建的视频帧对当前的视频帧进行预测,即利用当前视频帧之前的已经重建完成的其它视频帧对当前视频帧进行预测。
6、预测模式:又称作编码模式,预测模式用于指导将一个CU具体以何种分割方式划分为多个预测单元(Prediction Unit,PU),换言之,预测模式可以理解为是CU划分为PU的具体方式,同一个CU下的所有PU可以采用同一种预测模式进行编码。
预测模式包括帧间预测模式(Inter模式)和帧内预测模式(Intra模式)。
帧间预测模式包括:skip 2N×2N、merge 2N×2N、Inter 2N×2N、Inter 2N×2N、Inter 2N×N、Inter N×2N、Inter N×N、Inter 2N×nU、Inter 2N×nD、Inter nL×2N、Inter nR×2N。其中的skip 2N×2N可以直接简写成skip或skip模式,以及merge 2N×2N可以直接简写成merge或merge模式。
帧内预测模式包括:Intra 2N×2N、Intra N×N。
从另外一个描述维度来说,预测模式可以包括对称预测模式和非对称预测模式,其中,对称预测模式包括N×2N和2N×N这两种预测模式,非对称预测模式包括2N×nU、2N×nD、nL×2N和nR×2N这四种预测模式,而2N×2N相当于就是原始CU的大小,可以理解为是没有进一步地划分。
7、运动矢量(Motion Vector,MV):在帧间预测编码中,待编码单元相对于该待编码单元的参考编码单元的位移和该位移的方向,运动矢量可以通过ME确定。
8、率失真优化:为了在有限信道内传输、存储数据量巨大的视频,需要采用有损压缩方式对视频进行压缩,但在降低码率的同时也引入了失真,因此需要在码率和失真间进行权衡。
视频编码的主要目的就是保证一定视频质量的条件下尽可能的减少编码比特率,或保证一定编码比特率的条件下尽可能的减小失真。针对不同视频内容,编码器有多种候选编码模式,以某种策略来选择最优编码参数,实现最优编码。基于率失真理论的编码参数优化方法就是率失真优化,其目的是权衡编码码率与失真,为编码器选择最优编码参数。
9、率失真代价:又可以称作编码代价,是编码性能的评估标准,选择最小的率失真代价对应的编码模式(预测模式),来获取最优的编码性能。
以下介绍本申请的方案。
如前所述的,相关技术中通过遍历计算每个预测模式的编码代价来决策预测模式的方式,计算复杂度高,预测模式决策的速度较慢,视频编码效率较低。
鉴于此,本申请的发明人考虑到,想要提高视频编码效率,可以从减少预测模式的决策复杂度以提高预测模式的决策效率这方面着手。基于此,本申请的发明人提出一种预测模式的决策方式,在对当前CU进行预测模式决策的过程中,针对当前正遍历的待选择的预测模式(例如称作目标预测模式)进行决策时,先从该当前CU空间相邻的多个已编码单元的运动矢量中直接继承一个运动矢量,例如将直接继承的这个运动矢量称作目标运动矢量,同时获得该当前CU对应的下采样单元的预分析运动矢量,其中的预分析运动矢量为在预分析过程中对当前CU对应的下采样单元进行预分析得到的运动矢量,再判断目标运动矢量与预分析运动矢量是否满足预设条件,例如判断两者是否相等,在两者满足预设条件时,就直接将该目标预测模式判决为将用于对待编码单元进行实际编码的预测模式,而无需再遍历其它的预测模式,这样,就可以快速地做出预测模式的决策,而无需再对所有预测模式进行遍历计算编码代价,降低了预测模式决策过程中的计算复杂度,能够快速地决策出待编码单元的实际预测模式,从而提高编码决策速度。
在本申请实施例提供的预测模式决策方式中,当前CU对应的下采样单元是当前CU的缩略图表示,当前CU对应的下采样单元能够在一定程度上反映当前CU自身的信息,所以当前CU对应的下采样单元在预分析阶段得到的预分析运动矢量能够较为准确地反映出当前CU的实际运动信息(运动特性)。所以,在对当前CU进行预测模式的决策时,不仅利用了当前CU空间相邻的已编码CU的运动信息(即目标运动矢量),同时还考虑了当前CU自身在时域上的运动变化信息(即预分析运动矢量),这样可以确保针对当前CU的预测模式决策的准确性,同时不用再遍历所有预测模式后才能进行预测模式的决策,以达到快速决策预测模式的目的。
预分析阶段得到的预分析运动矢量是对应的下采样单元对应的运动矢量,而下采样单元只是当前CU的缩略而非全部像素表示,所以预分析阶段得到的预分析运动矢量能够粗略地反映当前CU的运动状态,而目标运动矢量是从空间相邻的其它已编码CU中直接继承得到的,如果预分析运动矢量与继承得到的目标运动矢量相同,则可以认为当前CU与周围的已编码单元运动特性相同(比如视频帧中背景区域),此时则可以直接选择当前正在判决的预测模式(例如skip模式或者merge模式)作为对待编码单元进行编码的理想预测模式,从而跳过后续预测模式的遍历,以提高预测模式的决策速度。
同时,在对视频帧进行编码前一般都会对其进行预分析,所以本方案中利用预分析阶段的预分析结果(预分析运动矢量)来进行预测模式的快速决策,是直接复用预分析阶段得到的预分析结果,无需引入额外的计算,方案易实现,方便移植,而且可以提高计算资源的利用率。
进一步地,利用本申请实施例提供的预测模式选择方法,本申请实施例进一步地提出一种视频编码方法,该视频编码方法中直接采用本申请实施例提供的预测模式选择方式进行预测模式的快速决策,通过减小预测模式决策过程的计算复杂度,可以有效降低编码时间,提高视频编码效率。
本申请实施例提供的视频编码方法可以应用于需要采用视频压缩技术的应用场景中,例如,终端之间进行视频聊天的应用场景(具体例如使用即时通信应用进行视频聊天),终端或服务器需要存储大量视频的应用场景(例如监控视频)等,使用本申请实施例提供的视频编码方法可以较大程度上加快视频的压缩速度。
本申请实施例提供的视频编码方法应用于视频压缩的应用场景中,在对视频进行压缩后,可以对视频进行传输,以节省视频在传输过程中所占用的带宽,并减少传输耗时,减少时延。还可以对视频进行存储,以节省视频所占用的存储空间;还可以对视频进行其它操作,此处不做限定。其中,视频传输包括实时传输和非实时传输,实时传输可以是利用即时通讯客户端进行实时视频通话,利用直播客户端进行实时直播等;非实时传输可以是视频上传、下载等。
为更好地理解本申请实施例提供的技术方案,下面对本申请实施例提供的技术方案适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施时,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
请参见图1,其示出了本申请实施例中的技术方案适用的一种应用场景,该应用场景以通过即时通信客户端进行实时视频通话为例。该场景中至少包括终端110、终端120和服务器130。终端110、终端120均与服务器130通过有线网络或无线网络建立通信连接,终端110与用户1对应,终端120与用户2对应。
终端110和终端120是具有视频数据流收发功能的设备,且可以具备视频编码能力,比如智能手机,终端110中安装有即时通信客户端。终端120与终端110中至少安装有一种相同的即时通信客户端,通过该相同的即时通信客户端使得终端110和终端120能够进行通信。服务器130是即时通信客户端的后台服务器,用于为各个终端的即时通信提供后台服务。
本申请实施例中,可以由终端110通过服务器130向终端120发起实时视频通话,也可以由终端120通过服务器130向终端110发起实时视频通话。
下面对使用终端110的用户1和使用终端120的用户2进行实时视频通话的过程进行介绍。终端110通过摄像头对用户1的通话过程进行拍摄得到第一视频,终端110采用本申请实施例提供的视频编码方法对第一视频进行编码,将编码后得到的第一视频流发送给服务器130,服务器130将该第一视频流转发给终端120,终端120根据该编码方式对应的解码方式对该第一视频流进行解码,并对解码得到的第一视频进行播放。同时,终端120通过摄像头对用户2的通话过程进行拍摄得到第二视频,终端120采用本申请实施例提供的视频编码方法对第二视频进行编码,将编码后得到的第二视频流发送给服务器130,服务器130将该第二视频流转发给终端110,终端110根据该编码方式对应的解码方式对该第二视频流进行解码,并对解码得到的第二视频进行播放。
可选的,终端110除了播放第二视频,还可以播放自身拍摄的第一视频,即,在终端110的显示界面中同时播放第一视频和第二视频。同理,终端120也可以同时播放第二视频和第一视频。其中,终端110和终端120的显示界面详见图1所示。
再参见图2所示的另一应用场景,该应用场景以直播场景为例。其中包括直播终端201,直播终端201可以对直播用户进行拍摄以得到直播视频,并通过本申请实施例提供的视频编码方法对该直播视频进行编码以得到直播视频流,再将该直播视频流发送给直播服务器221,直播服务器221可以将该直播视频流转发给观看终端211、观看终端212和观看终端213,观看终端211、观看终端212和观看终端213在接收到直播服务器221转发的直播视频流之后,可以采用对应的解码方式对该直播视频流进行解码以获得直播视频,进而观看直播。
在上述图1和图2的应用场景中,可以由各个终端采用本申请实施例提供预测模式选择方式为每个待编码单元决策出需要使用的预测模式,进而采用决策出的预测模式进行编码,或者在其它的实施方式中,例如终端110和直播终端201也可以将拍摄得到的视频直接发送给对应的服务器,再由对应的服务器采用本申请实施例提供的预测模式选择方式为每个待编码单元决策出需要使用的预测模式并进行编码,也就是说,可以由服务器实现本申请实施例中的技术方案。
上述图1和图2的应用场景的各个服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群,可以是提供云服务器、云数据库、云存储和内容分发网络(Content Delivery Network,CDN)等基础云计算服务的云服务器。上述图1和图2中的各个终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、专业相机等,但并不局限于此。
为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述方法在实际的处理过程中或者装置执行时,可按照实施例或者附图所示的方法顺序执行或者并行执行。
本申请实施例提供一种预测模式选择方法,该方法可以由具备视频编码能力的视频编码设备执行,例如可以由前述图1和图2中的任一终端执行,或者也可以由图1和图2中的任一服务器执行。
在介绍本申请实施例提供的技术方案之前,以下先结合图3对视频编码的整体流程进行大致介绍。
请参见图3所示,视频帧的视频编码大致可以包括预分析、编码决策和编码这三个过程。其中,预分析过程是一种近似编码过程的处理过程,其目的是为了在实际编码之前,对待编码的视频帧进行下采样,然后对下采样得到的下采样帧进行模拟分析,从而得到下采样帧的复杂度等信息,预分析的过程包括帧类型判决、自适应量化(AdaptiveQuantization,AQ)、精简的8×8(或其它尺寸)帧内预测、精简的ME等功能;编码决策过程即是对编码模式(例如本申请实施例中的预测模式决策)进行决策,以从多种预测模式中选择一种理想的预测模式作为后续编码使用的预测模式,本申请实施例提出的针对预测模式进行快速决策的方案即应用在该过程中;编码过程利用决策出的预测模式对视频帧进行正式编码,以得到编码压缩后的视频。
请参见图4,其示出了本申请实施例提供的预测模式选择方法的方法流程图,该预测模式选择方法的流程描述如下。
步骤401:对当前编码帧进行下采样,得到当前编码帧对应的下采样帧。
步骤402:对下采样帧进行预分析,得到预分析结果,该预分析结果中包括各个下采样单元对应的预分析运动矢量。
如前所述的,在预分析阶段,需要对当前编码帧进行下采样处理。下采样即降采样或缩小图像,通过对原分辨率的视频图像进行下采样处理,例如能够使得图像符合显示区域的大小,并生成对应图像的缩略图,下采样后得到的下采样帧的数据量相对于原始帧有所减小,这样有利于在预分析阶段提高预分析效率。也就是说,通过下采样可以减少图像的分比率以及缩小尺寸,由于下采样帧相当于是原始视频图像的缩略图,对当前编码帧进行下采样后得到的下采样帧仍然能够较为准确地反映出当前编码帧的真实信息。
在进行下采样时,可以采用预设的下采样比例,下采样比例可以简单地理解为是原始视频图像与进行下采样后得到的下采样帧的宽高比。
对于一个样值序列间隔几个样值取样一次,这样得到的新序列就是原序列的下采样,因此,下采样帧相比原始帧体积要小得多,但是下采样帧能够尽可能保留原始帧中的元素点的分布特征,下采样帧与原始帧的画面内容基本相同。例如在下采样比例为Ds:1时,表示每Ds个像素采样1个像素,Ds为大于1的整数,例如Ds取值为2,即下采样比例为2:1,如果原始图像长、宽分别为a、b,则按照2:1的下采样比例进行下采样后得到的下采样帧的长、宽分别为a/2、b/2。如果下采样后得到的下采样帧的长宽不是N的整数倍,则可以对下采样帧进行扩边处理,使其为N的整倍数,其中,N×N是下采样单元的尺寸,例如可以是4×4、8×8、16×16。
其中,下采样单元可以理解为是对下采样帧进行预分析的基本单位,即预分析的分析处理粒度是一个下采样单元,所以也可以将一个下采样单元称作是一个预分析块,是预分析处理过程中的基本单元。
例如图5所示的,以规定的下采样单元尺寸为8×8为例,当前编码帧的尺寸为64×64像素,按照2:1的下采样比例进行下采样后,得到的下采样帧为32×32像素,当前编码帧中包含16个16×16的编码单元(编号为1至16),下采样帧中包含16个8×8的下采样单元(编号为1'至16'),其中,当前编码帧和下采样帧中编号数值相同的编码单元与下采样单元对应。以当前编码帧中的编号为“15”的编码单元为例,那么下采样帧中编号为“15'”的下采样单元即为与当前编码帧中的编号为“15”的编码单元对应的下采样单元,且如前所述的,预分析过程中是以下采样单元作为预分析块进行预分析处理,所以,当前编码帧中的编号为“15”的编码单元对应的预分析块也即为下采样帧中编号为“15'”的下采样单元,具体参见图5所示。
通过预先对于原始帧近似的下采样帧进行分析,即对下采样帧进行预分析,能够预先得到一些基于原始帧的特征信息,如复杂度、各个下采样单元(预分析块)的运动矢量(MV)等,方便后续使用。
本申请实施例中将在预分析阶段通过预分析得到的下采样单元(亦即预分析块)的运动矢量称作下采样单元的预分析运动矢量,如图5中编号为1'至16'的16个预分析单元均具有对应的预分析运动矢量。由于下采样帧保留了原始帧中的元素点的分布特征,下采样帧与原始帧的画面内容基本相同,所以每个下采样单元的预分析运动矢量也能够在一定程度上真实、准确地反映出该下采样单元对应的编码单元的运动特征。
步骤403:获取当前编码帧中的待编码单元对应的下采样单元的预分析运动矢量。
通过预分析,可以获得每个预分析单元对应的预分析运动矢量,进而可以以该预分析运动矢量来表征对应的编码单元的运动特征,所以对于当前编码帧中的需要进行编码的待编码单元,可以先确定与该待编码单元对应的下采样单元,进而获得该对应的下采样单元对应的预分析运动矢量,以通过该预分析运动矢量来粗略但是合理、真实地表征该待编码单元的运动特征。
步骤404:根据当前编码帧中待编码单元相邻的至少两个已编码单元分别对应的运动矢量,确定M个候选运动矢量。
待编码单元可以理解为是当前需要进行预测编码的CU,已编码单元可以认为是利用本申请实施例提供的预测模式选择方法选择预测模式并根据选择出的预测模式已进行了预测编码的CU,在已编码单元的编码过程中,利用本申请实施例提供的预测模式判决方式决策出预测模式,进而通过决策出的预测模式进行预测编码,因此已编码单元所选择的参考帧,和基于已选择的参考帧所确定的运动矢量是已知的。
其中,与待编码单元相邻的已编码单元可以认为是:与待编码单元空间相邻、且与待编码单元的边点相接的已编码单元。如图6所示的,其中的当前CU为当前需要编码的待编码单元,与该当前CU相邻的已编码单元可以包括:与当前CU右上边点相接的已编码块(B0),与当前CU右上边点相接且位于当前CU上边的已编码块(B0),与当前CU左上边点相接的已编码块(B2),与当前CU左下边点相接的已编码块(A0),与当前CU左下边点相接且位于当前预测单元左边的已编码块(A1)。需要说明的是,图6所示的示例仅是一种举例示意说明,具体的与当前CU相邻的已编码块的选取可不限于图6所示,例如可以仅选取其中的B0、B2、A0。
如前所述的,与待编码单元相邻的已编码单元的运动矢量是已知的,例如选择待编码单元相邻的三个已编码单元,这三个已编码单元例如是图6中的B0、B2、A0,与这三个已编码单元对应的已知的运动矢量例如是MV1、MV2、MV3。进一步地,可以将这三个已编码单元对应的运动矢量集合作为本申请实施例中的M个候选运动矢量,即此时的M个候选运动矢量为MV1、MV2、MV3;在另外一种实施方式中,例如还可以先计算MV1、MV2、MV3这三个运动矢量的平均矢量MVavg,然后将MV1、MV2、MV3和MVavg一起作为M个候选运动矢量,即此时的M个候选运动矢量为MV1、MV2、MV3、MVavg
步骤405:以当前待选择的目标预测模式,从M个候选运动矢量中确定目标运动矢量。
在根据相邻的已编码单元得到候选运动矢量列表(即M个候选运动矢量)之后,可以从该候选运动矢量列表中选择一个作为待编码单元的运动矢量,例如将选择出的这个候选运动矢量称作目标运动矢量,也就是说,可以通过从相邻的已编码单元的运动矢量中直接继承的方式确定待编码单元自身的预测运动矢量,换言之,待编码单元的预测运动矢量是从相邻的多个已编码单元那里直接继承的,通过空间上相邻的已编码单元的运动矢量来直接表征待编码单元的运动特征。
在对待编码单元进行预测模式选择时,可以按照设定好的预测模式排序按序依次进行预测模式的判决,也就是说,可以先将所有可能使用的预测模式按照一定顺序进行排序,在进行预测模式选择时,可以按照拍好的顺序对每个预测模式进行选择。例如,可以按照skip模式、merge模式优先判决的判决顺序对多种预测模式进行依次判断,例如图7所示的决策顺序。也就是说,可以将skip模式、merge模式先进行判决,因为在实际中,skip模式和merge模式作为最优预测模式的概率远大于其它预测模式,以及,skip模式和merge模式这两种预测模式计算率失真代价的复杂度较低,所以可以优先对这两种预测模式进行判决,以便于能够尽快地决策出skip模式或merge模式,从而尽可能地减少对其它预测模式的决策计算,在较大概率上提高决策速度。
例如将当前进行判决的预测模式称作目标预测模式,那么,可以根据在该目标预测模式下的率失真代价来从M个候选运动矢量中选择出目标运动矢量。例如,针对M个候选运动矢量中的每个候选运动矢量,以每个候选运动矢量分别作为待编码单元的预测运动矢量,确定在目标预测模式下的率失真代价(又称作编码代价),以得到M个率失真代价,然后将M个率失真代价中的最小率失真代价对应的候选运动矢量确定为待编码单元对应的目标运动矢量。
率失真代价最小的候选运动矢量,表明以该候选运动矢量在该目标预测模式下进行编码的话可以在视频的主观质量(通过失真体现)和编码码率之间做出较好的平衡,以尽量提高编码的有效性,同时确保压缩率最高。
计算每个候选运动矢量在目标预测模式下的率失真代价,可以利用率失真代价计算公式:cost=D+λR。其中,cost表示率失真代价;D表示采用不同预测模式下的运动预测误差,可以理解为利用已编码视频帧和当前带待编码的视频帧获得待编码单元的预测值,再确定该预测值和与待编码单元的实际值之间的误差,可以用均方误差表示;R表示运动矢量的相关信息(运动矢量、参考图像索引、参考队列索引等)的编码比特数,λ为拉格朗日因子。
通过上述公式可知,D是与每种预测模式相关的,针对同一预测模式(例如目标预测模式)来说,将不同的运动矢量代入上述率失真代价计算公式中进行计算,可以得到对应不同的cost,即可以得到不同的率失真代价,例如在meger模式下,将前述的MV1、MV2、MV3分别代入上述率失真代价计算公式中进行计算,得到对应的率失真代价是cost1、cost2、cost3,假设其中的cost3最小,则将最小的cost3对应的候选运动矢量MV3确定为最终的目标运动矢量,从而完成从相邻的已编码单元的运动矢量中继承运动矢量的过程。
步骤406:判断待编码单元对应的下采样单元的预分析运动矢量与目标运动矢量是否满足预设条件。
例如,将待编码单元对应的下采样单元的预分析运动矢量以pMV表示,将从M个候选运动矢量中选择出的目标运动矢量以cMV表示,可以根据pMV与cMV是否满足预设条件来作为是否将当前正在判决的预测模式确定为最优或者较为优选的预测模式的依据。
在一种可能的实施方式中,预设条件例如是预分析运动矢量与目标运动矢量相等,即在pMV=cMV时表明满足该预设条件,在pMV≠cMV时表明不满足该预设条件。
在另一种可能的实施方式中,预设条件例如是预分析运动矢量与目标运动矢量的差值在预设差值范围内,即,在pMV与cMV的差值的绝对值(|pMV-cMV|)在预设差值范围内时表明满足该预设条件,而在pMV与cMV的差值的绝对值不在预设差值范围内时表明不满足该预设条件。
步骤407:在待编码单元对应的下采样单元的预分析运动矢量与目标运动矢量满足预设条件时,将目标预测模式确定为用于对待编码单元进行编码的预测模式。
待编码单元对应的下采样单元的预分析运动矢量pMV是对待编码单元的运动特征的粗略反映,但是这种粗略的反映是结合待编码单元自身的像素点信息的实际真实运动状态反映,即预分析运动矢量pMV能够粗略但准确地反映待编码单元的运动特性,而从空间相邻的其它的已编码单元处直接继承得到的目标运动矢量cMV是基于预测模式得到的反映待编码单元的预测运动特征,所以,在pMV与cMV完全相等或者非常接近的时候,表明预测出的运动特性与待编码单元的实际运动特性是相符的,可以认为待编码单元与周围的已编码单元的运动特性相同(比如视频帧中背景区域),因此可以直接选择当前正在判决的目标预测模式决策为用于待编码单元进行编码的预测模式,从而跳过后续预测模式的遍历,完成预测模式的决策过程,提高预测模式的决策速度。
进一步地,可以通过快速决策出的目标预测模式对待编码单元进行视频编码,从而完成对一个编码单元的视频编码过程。由于预测模式决策过程中减少了决策时间,所以对于整个编码过程来说也就减少了一定处理时间,从而减少了整个编码过程所花费的时间,从而提高编码效率。
步骤408:在待编码单元对应的下采样单元的预分析运动矢量与目标运动矢量不满足预设条件时,跳过当前判决的目标预测模式,并对下一个待选择的预测模式进行判决。
相应地,在确定待编码单元对应的下采样单元的预分析运动矢量pMV与目标运动矢量cMV不满足前述的预设条件时,即表明当前正在进行判决的目标预测模式并非是理想的预测模式,所以可以直接跳过该目标预测模式,并采用本申请实施例提供的预测模式决策方式对下一个预测模式进行判决。
本申请实施例中,是通过预分析阶段得到的预分析运动矢量来进行预测模式的快速判决,由于需要利用到运动矢量这一用于表征帧间(即当前编码帧与参考帧)预测的信息,所以本申请中的预测模式可以是指帧间预测模式,例如前述的skip模式、merge模式、Inter 2N×2N、Inter 2N×2N、Inter 2N×N等。
在具体实施过程中,在预分析阶段的下采样过程中可能采用不同的下采样参数,不同的下采样参数对应的下采样结果也不一样,下采样参数可以包括下采样比例和下采样单元的尺寸以及其它参数。例如一种下采样参数设置是:下采样比例2:1、下采样单元的尺寸是8×8;再例如,另一种下采样参数设置是:下采样比例3:1、下采样单元的尺寸是4×4,等等。对于同一编码单元(例如前述的待编码单元)来说,由于该待编码单元的尺寸是固定的,在不同的下采样参数设置下,该待编码单元所对应的下采样单元的数量也可能是不同的,以下结合图8具体说明。
步骤801:判断待编码单元的尺寸是否大于下采样单元的尺寸。
如前所述的,下采样单元是预分析过程中的基本处理单元,而下采样单元可以看作是对应的编码单元的缩略图,例如长宽均缩小一半,所以编码单元的尺寸应该是大于对应的下采样单元的尺寸的,例如下采样比例是2:1且设定的下采样单元的尺寸是8×8,那一个下采样单元对应的编码单元的最小尺寸应该是16×16,因为16×16经过2:1的下采样后正好是8×8,比16×16更小的编码单元经过2:1的下采样后是得不到8×8的下采样单元尺寸的。
由于涉及到下采样,所以,只有在待编码单元的尺寸大于下采样单元的尺寸时,才表明该待编码单元在下采样帧有对应的预分析块(下采样单元),进而才能针对对应的下采样单元进行预分析而得到对应的预分析运动矢量。
所以,根据待编码单元的尺寸与下采样单元的尺寸的大小比较结果的不同,可以分别采用对应的判决方法来进行预测模式的决策。具体来说,在待编码单元的尺寸大于下采样单元的尺寸时,按照前述介绍的本申请实施例中的预测模式的快速决策方式来进行预测模式的判决,以执行下述的步骤802至步骤806;在待编码单元的尺寸小于或等于下采样单元的尺寸时,可以按照步骤807的方式进行预测模式的决策。
步骤802:在待编码单元的尺寸大于下采样单元的尺寸时,根据待编码单元的尺寸和下采样参数确定待编码单元对应的下采样单元的数量。
以下采样比例为2:1以及下采样单元的尺寸为8×8为例。如前所述的,在HEVC中,编码单元的尺寸可能是8×8、16×16、32×32、64×64,满足待编码单元的尺寸大于下采样单元尺寸的是16×16、32×32、64×64这三种CU尺寸。
在2:1的下采样比例及设定的8×8的下采样单元尺寸下,如图9所示,16×16的CU对应1个下采样单元;如图10所示,32×32的CU可以划分为4个16×16的子CU,即CU0、CU1、CU2、CU3,而每个16×16的子CU对应1个下采样单元,所以32×32的CU对应4个下采样单元;如图11所示,64×64的CU可以划分为16个16×16的子CU,即CU0、CU1、CU2、CU3、……CU15,而每个16×16的子CU对应1个下采样单元,所以64×64的CU对应14个下采样单元。
在预分析阶段,可以获得每个下采样单元对应的一个预分析运动矢量pMV,所以,16×16的CU对应包括1个pMV;32×32的CU对应包括4个pMV,例如以pMV0、pMV1、pMV2、pMV3表示;64×64的CU对应包括16个pMV,例如以pMV0、pMV1、pMV2、pMV3、pMV4、pMV5、……、pMV15表示。
进而,可以根据待编码单元的实际尺寸确定对应的下采样单元的数量,以及对应包括的预分析运动矢量。
步骤803:在待编码单元对应的下采样单元的数量为1时,判断该一个下采样单元对应的一个预分析运动矢量和目标运动矢量是否满足预设条件。
在待编码单元对应的下采样单元的数量为1个时,则可以获得对应的1个预分析运动矢量pMV,再将该pMV与从相邻的已编码单元处继承得到的目标运动矢量cMV进行比较,以判断两者是否满足预设条件,而对于预设条件的判断可以参照图4中的步骤406的说明,此处就不再重复说明了。
步骤804:在待编码单元对应的下采样单元的数量为多个时,先判断多个下采样单元对应的多个预分析运动矢量之间是否满足第一级条件。
在待编码单元对应的下采样单元的数量为多个时,可以获得多个下采样单元对应的多个预分析运动矢量pMV,例如图10所示的,确定出的待编码单元对应的下采样单元为4个,对应的4个预分析运动矢量分别是pMV0、pMV1、pMV2、pMV3。则可以先判断多个预分析运动矢量是否满足第一级条件,具体来说,可以针对所有的预分析运动矢量一起进行第一级条件的判断,或者,也可以针对其中的部分预分析运动矢量一起进行第一级条件的判断,而第一级条件例如和前述图4中的步骤406中介绍的“预设条件”是类似的,以同时对pMV0、pMV1、pMV2、pMV3这四个预分析运动矢量进行第一级预设条件的判断为例,可以判断pMV0、pMV1、pMV2、pMV3是否完全相等,或者可以判断这四者两两之间的差值是否在预定差值范围之内,若四者完全相等或者两两之间的差值均在预定差值范围之内,则可以认为满足第一级条件,进而再进行步骤805。
通过第一级条件的判断,可以确保待编码单元对应的多个下采样单元的运动特性是完全一致或者近似完全一致的,这样通过多个运动特性完全一致或近似完全一致的多个下采样单元可以整体上反映待编码单元的运动特性,在多个下采样单元的运动特性完全一致或者近似完全一致时,表明这些预分析运动矢量的区域和当前编码单元同属一个区域,所以能够更为准确地反映待编码单元的运动特性。在下采样单元的数量不多时,例如只有4个时可以将全部的预分析运动矢量进行第一级条件的判断,而在例如有16个或者更多个时可以将全部的预分析运动矢量进行第一级条件的判断,或者可以选择大部分预分析运动矢量进行第一级条件的判断,因为每个预分析运动矢量相当于是待编码单元中的其中一部分缩略像素块的运动特性表示,通过尽量多的预分析运动矢量进行第一级条件的筛选,可以尽量提高准确性。
步骤805:在步骤804中的多个预分析运动矢量之间满足第一级条件时,再判断多个预分析运动矢量与目标运动矢量是否满足第二级条件。
继续以步骤804中的pMV0、pMV1、pMV2、pMV3为例,若步骤804中的pMV0、pMV1、pMV2、pMV3满足第一级条件,那么第二级条件例如可以是:pMV0、pMV1、pMV2、pMV3中的每个与目标运动矢量cMV均相等,第二级条件或者可以是pMV0、pMV1、pMV2、pMV3中的每个与目标运动矢量cMV的差值均在预设差值范围之内,或者还可以是其它条件,本申请实施例不做限制。
当多个预分析运动矢量与目标运动矢量满足第二级条件时,表明通过预分析运动矢量粗略、真实地反映出的待编码单元的运动特性与基于相邻已编码单元继承的运动特性是相符的,可以认为待编码单元与周围的已编码单元的运动特性相同(比如视频帧中背景区域),因此可以直接选择当前正在判决的目标预测模式作为较为理想的预测模式,从而跳过后续预测模式的遍历,完成预测模式的决策过程,提高预测模式的决策速度。
步骤806:将目标预测模式决策为用于对待编码单元进行编码的预测模式,并根据该目标预测模式对待编码单元进行编码。
在一个预分析运动矢量pMV与目标运动矢量cMV满足预设条件,或者在多个预分析运动矢量(例如pMV0、pMV1、pMV2、pMV3)满足第一级条件以及这些预分析运动矢量与目标运动矢量cMV满足第二级条件时,则将当前正在判决的目标预测模式决策为优选的预测模式,即利用目标预测模式对待编码单元进行编码的话可以获得较好的编码效果,进而根据该目标预测模式对待编码单元进行编码,以提高视频编码效率。
在一个预分析运动矢量pMV与目标运动矢量cMV不满足前述的预设条件,或者在多个预分析运动矢量(例如pMV0、pMV1、pMV2、pMV3)不满足第一级条件和/或这些预分析运动矢量与目标运动矢量cMV不满足第二级条件时,则跳过当前判决的目标预测模式,再按照本申请实施例中的预测模式决策方式来对下一个预测模式进行判决。
步骤807:在待编码单元的尺寸不大于下采样单元的尺寸时,依次确定待编码单元在每种待选择的预测模式下的率失真代价,并从待选择的所有预测模式对应的所有率失真代价中,确定率失真代价最小对应的预测模式,并将最小率失真代价对应的预测模式决策为用于对待编码单元进行编码的预测模式,并根据该目标预测模式对待编码单元进行编码。
如前面步骤801中所述的,在待编码单元的尺寸不大于(小于或者等于)下采样单元的尺寸时,该待编码单元在下采样单元中并没有对应的下采样单元,所以无法利用预分析运动矢量进行预测模式的快速决策,对于这种情况,可以参照相关技术中的遍历预测模式计算各个预测模式下的率失真代价,以选择出率失真代价最小对应的预测模式作为优选的预测模式进行实际编码。这样,可以确保待编码单元的尺寸不适合通过前述的预分析运动矢量进行预测模式判决时,能够提供一种候选替补的方式进行预测模式的决策,以确保各种尺寸的编码单元都可以进行预测模式的决策,以确保编码的顺利进行,确保持续编码,提高视频编码过程的可靠性。
本申请实施例中,根据待编码单元相邻的多个已编码单元分别对应的运动矢量确定候选运动矢量列表(例如包括M个候选运动矢量),然后以当前待判决的目标预测模式,从该候选运动矢量列表中选择出目标运动矢量,进而再将从相邻的已编码单元处继承的目标运动矢量与预分析阶段得到的对应下采样单元的预分析运动矢量进行预设条件的验证,并在两者满足预设条件时则直接选择当前正在判决的目标预测模式(例如skip模式或者merge模式)作为用于编码待编码单元的理想预测模式,从而跳过后续预测模式的遍历,减少预测模式的决策时间,提高预测模式的决策速度,从而提高编码效率。
基于同一发明构思,本申请实施例提供一种预测模式选择装置,该视预测模式选择装置可以是硬件结构、软件模块、或硬件结构加软件模块。该预测模式选择装置例如是前述图1和图2中的任一终端或任一服务器。请参见图12所示,本申请实施例中的预测模式选择装置包括获取模块1201、第一确定模块1202、第二确定模块1203和决策模块1204,其中:
获取模块1201,用于获取待编码单元对应的下采样单元的预分析运动矢量,其中,下采样单元是对待编码单元所在的当前编码帧进行下采样后划分得到的;
第一确定模块1202,用于根据当前编码帧中与待编码单元相邻的至少两个已编码单元分别对应的运动矢量,确定M个候选运动矢量,M为大于1的整数;
第二确定模块1203,用于以当前待选择的目标预测模式,从M个候选运动矢量中确定目标运动矢量;
决策模块1204,用于在预分析运动矢量和目标运动矢量满足预设条件时,将所述目标预测模式确定为用于对所述待编码单元进行编码的预测模式。
在一种可能的实施方式中,第二确定模块1203用于:
以每个候选运动矢量分别作为待编码单元的预测运动矢量,确定在目标预测模式下的率失真代价,得到M个率失真代价;
将M个率失真代价中的最小率失真代价对应的候选运动矢量确定为目标运动矢量。
在一种可能的实施方式中,决策模块1204用于:
在预分析运动矢量和目标运动矢量相等时,确定预分析运动矢量和目标运动矢量满足预设条件;或者,
在预分析运动矢量和目标运动矢量之间的差值在预设差值范围内时,确定预分析运动矢量和目标运动矢量满足预设条件。
在一种可能的实施方式中,决策模块1204用于:
在待编码单元对应的下采样单元为一个时,确定该一个下采样单元对应的一个预分析运动矢量满足预设条件;
在待编码单元对应的下采样单元为多个时,确定该多个下采样单元对应的多个预分析运动矢量满足第一级条件,以及多个预分析运动矢量与目标运动矢量满足第二级条件。
在一种可能的实施方式中,决策模块1204用于:
按照skip模式、merge模式优先判决的判决顺序对多种预测模式进行判决。
在一种可能的实施方式中,多种预测模式中的每种预测模式均为帧间预测模式。
在一种可能的实施方式中,继续参见图12所示的,本申请实施例中的预测模式选择装置还包括第三确定模块1205,用于:
根据待编码单元的尺寸和下采样参数确定待编码单元对应的下采样单元的数量,下采样参数包括下采样比例和下采样单元的尺寸。
在一种可能的实施方式中,继续参见图12所示的,本申请实施例中的预测模式选择装置还包括第四确定模块1206,用于确定待编码单元的尺寸大于下采样单元的尺寸。
在一种可能的实施方式中,决策模块1204还用于:
在待编码单元的尺寸不大于下采样单元的尺寸时,依次确定待编码单元在每种待选择的预测模式下的率失真代价;
从待选择的所有预测模式对应的所有率失真代价中确定率失真代价最小对应的预测模式,并将率失真代价最小对应的预测模式确定为用于对待编码单元进行编码的预测模式。
在一种可能的实施方式中,继续参见图12所示的,本申请实施例中的预测模式选择装置还包括编码模块1207,用于决策模块1204将目标预测模式确定为用于对待编码单元进行编码的预测模式之后,根据目标预测模式对待编码单元进行编码处理。
前述的预测模式选择方法的实施例中涉及的各步骤的所有相关内容均可援引到本申请施例中的预测模式选择装置所对应的功能模块的功能描述,在此不再赘述。
需要说明的是,图12中的第三确定模块1205、第四确定模块1206和编码模块1207可以并不是必须的,所以在图12中是以虚线框表示的。
本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本申请各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
基于同一发明构思,本申请实施例还提供一种视频编码设备,该视频编码设备例如是前述图1和图2中的任一终端或任一服务器。请参见图13,本申请实施例中的视频编码设备包括至少一个处理器1301,以及与至少一个处理器连接的存储器1302,本申请实施例中不限定处理器1301与存储器1302之间的具体连接介质,例如处理器1301和存储器1302之间可以通过总线连接,该总线可以分为地址总线、数据总线、控制总线等。
在本申请实施例中,存储器1302存储有可被至少一个处理器1301执行的指令,至少一个处理器1301通过执行存储器1302存储的指令,可以执行前述的视频处理方法中所包括的步骤。
处理器1301可以是通用处理器,例如中央处理器(CPU)、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器1302作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器1302还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
其中,处理器1301是视频编码设备的控制中心,可以利用各种接口和线路连接整个视频编码设备的各个部分,通过运行或执行存储在存储器1302内的指令以及调用存储在存储器1302内的数据,视频编码设备的各种功能和处理数据,从而对视频编码设备进行整体监控。可选的,处理器1301可包括一个或多个处理单元,处理器1301可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1301中。在一些实施例中,处理器1301和存储器1302可以在同一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
进一步地,本申请实施例中的视频编码设备还可以包括输入单元1303、显示单元1304、射频单元1305、音频电路1306、扬声器1307、麦克风1308、无线保真(WirelessFidelity,WiFi)模块1309、蓝牙模块1310、电源1311、外部接口1312、耳机插孔1313等部件。本领域技术人员可以理解的是,图13仅仅是视频编码设备的举例,并不构成对视频编码设备的限定,视频编码设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
输入单元1303可用于接收输入的数字或字符信息,以及产生与视频播放设备的用户设置以及功能控制有关的键信号输入。例如,输入单元1303可包括触摸屏1314以及其它输入设备1315。触摸屏1314可收集用户在其上或附近的触摸操作(比如用户使用手指、关节、触笔等任何适合的物体在触摸屏1314上或在触摸屏1314附近的操作),即触摸屏1314可用于检测触摸压力以及触摸输入位置和触摸输入面积,并根据预先设定的程序驱动相应的连接装置。触摸屏1314可以检测用户对触摸屏1314的触控操作,将触控操作转换为触控信号发送给处理器1301,或者理解为可将触控操作的触控信息发送给处理器1301,并能接收处理器1301发来的命令并加以执行。触控信息至少可以包括压力大小信息和压力持续时长信息中的至少一种。触摸屏1314可以提供视频播放设备和用户之间的输入界面和输出界面。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触摸屏1314。除了触摸屏1314,输入单元1303还可以包括其它输入设备1315。比如,其它输入设备1315可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1304可用于显示由用户输入的信息或提供给用户的信息以及视频播放设备的各种菜单。进一步的,触摸屏1314可覆盖显示单元1304,当触摸屏1314检测到在其上或附近的触控操作后,传送给处理器1301以确定的触控操作的压力信息。在本申请实施例中,触摸屏1314与显示单元1304可以集成为一个部件而实现视频播放设备的输入、输出、显示功能。为便于描述,本申请实施例以触摸屏1314代表触摸屏1314和显示单元1304的功能集合为例进行示意性说明,当然在某些实施例中,触摸屏1314与显示单元1304也可以作为两个独立的部件。
当显示单元1304和触摸板以层的形式彼此叠加以形成触摸屏1314时,显示单元1304可以用作输入装置和输出装置,在作为输出装置时,可以用于显示图像,例如实现对各种视频的播放。显示单元1304可以包括液晶显示器(Liquid Crystal Display,LCD)、薄膜晶体管液晶显示器(Thin Film Transistor Liquid Crystal Display,TFT-LCD)、有机发光二极管(Organic Light Emitting Diode,OLED)显示器、有源矩阵有机发光二极体(Active Matrix Organic Light Emitting Diode,AMOLED)显示器、平面转换(In-PlaneSwitching,IPS)显示器、柔性显示器、3D显示器等等中的至少一种。这些显示器中的一些可以被构造为透明状以允许用户从外部观看,这可以称为透明显示器,根据特定想要的实施方式,视频编码设备可以包括两个或更多显示单元(或其它显示装置),例如,视频编码设备可以包括外部显示单元(图13未示出)和内部显示单元(图13未示出)。
射频单元1305可用于收发信息或通话过程中信号的接收和发送。通常,射频电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,射频单元1305还可以通过无线通信与网络设备和其它设备通信。
音频电路1306、扬声器1307、麦克风1308可提供用户与视频播放设备之间的音频接口。音频电路1306可将接收到的音频数据转换后的电信号,传输到扬声器1307,由扬声器1307转换为声音信号输出。另一方面,麦克风1308将收集的声音信号转换为电信号,由音频电路1306接收后转换为音频数据,再将音频数据输出处理器1301处理后,经射频单元1305以发送给比如另一电子设备,或者将音频数据输出至存储器1302以便进一步处理,音频电路也可以包括耳机插孔1313,用于提供音频电路和耳机之间的连接接口。
虽然图13示出了WiFi模块1309,但是可以理解的是,其并不属于视频编码设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
视频播放设备通过蓝牙模块1310使视频编码设备与因特网之间的数据传输变得更加迅速高效,为无线通信拓宽道路。蓝牙技术是能够实现语音和数据无线传输的开放性方案。虽然图13示出了蓝牙模块1310,但是可以理解的是,其并不属于视频编码设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
视频编码设备还可以包括电源1311(比如电池),其用于接收外部电力或为视频编码设备内的各个部件供电。优选的,电源1311可以通过电源管理系统与处理器901逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
视频编码设备还可以包括外部接口1312,该外部接口1312可以包括标准的MicroUSB接口,也可以包括多针连接器,可以用于连接视频编码设备与其它设备进行通信,也可以用于连接充电器为视频编码设备充电。
基于同一发明构思,本申请实施例还提供一种存储介质,该存储介质可以是计算机可读存储介质,该存储介质中存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行如前述的预测模式选择方法的步骤。
基于同一发明构思,本申请实施例还提供一种芯片系统,该芯片系统包括处理器,还可以包括存储器,用于实现如前述的预测模式选择方法的步骤。该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
在一些可能的实施方式中,本申请实施例提供的预测模式选择方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机上运行时,所述程序代码用于使所述计算机执行前文所描述的根据本申请各种示例性实施方式的预测模式选择方法中的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种预测模式选择方法,其特征在于,所述方法包括:
获取待编码单元对应的下采样单元的预分析运动矢量,其中,所述下采样单元是对所述待编码单元所在的当前编码帧进行下采样后划分得到的;
根据所述当前编码帧中与所述待编码单元相邻的至少两个已编码单元分别对应的运动矢量,确定M个候选运动矢量,M为大于1的整数;
以当前待选择的目标预测模式,从所述M个候选运动矢量中确定目标运动矢量;
在所述预分析运动矢量和所述目标运动矢量满足预设条件时,将所述目标预测模式确定为用于对所述待编码单元进行编码的预测模式。
2.如权利要求1所述的方法,其特征在于,以当前待选择的目标预测模式,从所述M个候选运动矢量中确定目标运动矢量,包括:
以每个候选运动矢量分别作为所述待编码单元的预测运动矢量,确定在所述目标预测模式下的率失真代价,得到M个率失真代价;
将所述M个率失真代价中的最小率失真代价对应的候选运动矢量确定为所述目标运动矢量。
3.如权利要求1所述的方法,其特征在于,确定所述预分析运动矢量和所述目标运动矢量满足所述预设条件,包括:
在所述预分析运动矢量和所述目标运动矢量相等时,确定所述预分析运动矢量和所述目标运动矢量满足所述预设条件;或者,
在所述预分析运动矢量和所述目标运动矢量之间的差值在预设差值范围内时,确定所述预分析运动矢量和所述目标运动矢量满足所述预设条件。
4.如权利要求1所述的方法,其特征在于,确定所述预分析运动矢量和所述目标运动矢量满足所述预设条件,包括:
在所述待编码单元对应的下采样单元为一个时,确定该一个下采样单元对应的一个预分析运动矢量与所述目标运动矢量满足所述预设条件;
在所述待编码单元对应的下采样单元为多个时,确定该多个下采样单元对应的多个预分析运动矢量满足第一级条件,以及所述多个预分析运动矢量与所述目标运动矢量满足第二级条件。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
按照skip模式、merge模式优先判决的判决顺序对多种预测模式进行判决。
6.如权利要求5所述的方法,其特征在于,所述多种预测模式中的每种预测模式均为帧间预测模式。
7.如权利要求1-6任一所述的方法,其特征在于,所述方法还包括:
根据所述待编码单元的尺寸和下采样参数确定所述待编码单元对应的下采样单元的数量,所述下采样参数包括下采样比例和下采样单元的尺寸。
8.如权利要求1-6任一所述的方法,其特征在于,所述方法还包括:
确定所述待编码单元的尺寸大于所述下采样单元的尺寸。
9.如权利要求1-6任一所述的方法,其特征在于,所述方法还包括:
在所述待编码单元的尺寸不大于所述下采样单元的尺寸时,依次确定所述待编码单元在每种待选择的预测模式下的率失真代价;
从待选择的所有预测模式对应的所有率失真代价中确定率失真代价最小对应的预测模式,并将率失真代价最小对应的预测模式确定为用于对所述待编码单元进行编码的预测模式。
10.如权利要求1-6任一所述的方法,其特征在于,在将所述目标预测模式确定为用于对所述待编码单元进行编码的预测模式之后,所述方法还包括:
根据所述目标预测模式对所述待编码单元进行编码处理。
11.一种预测模式选择装置,其特征在于,所述装置包括:
获取模块,用于获取待编码单元对应的下采样单元的预分析运动矢量,其中,所述下采样单元是对所述待编码单元所在的当前编码帧进行下采样后划分得到的;
第一确定模块,用于根据所述当前编码帧中与所述待编码单元相邻的至少两个已编码单元分别对应的运动矢量,确定M个候选运动矢量,M为大于1的整数;
第二确定模块,用于以当前待选择的目标预测模式,从所述M个候选运动矢量中确定目标运动矢量;
决策模块,用于在所述预分析运动矢量和所述目标运动矢量满足预设条件时,将所述目标预测模式确定为用于对所述待编码单元进行编码的预测模式。
12.如权利要求11所述的装置,其特征在于,所述第二确定模块用于:
以每个候选运动矢量分别作为所述待编码单元的预测运动矢量,确定在所述目标预测模式下的率失真代价,得到M个率失真代价;
将所述M个率失真代价中的最小率失真代价对应的候选运动矢量确定为所述目标运动矢量。
13.如权利要求11或12所述的装置,其特征在于,所述装置还包括编码模块,用于:
在所述决策模块将所述目标预测模式确定为用于对所述待编码单元进行编码的预测模式之后,根据所述目标预测模式对所述待编码单元进行编码处理。
14.一种视频编码设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-10任一所述的方法包括的步骤。
15.一种存储介质,其特征在于,所述存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1-10任一所述的方法包括的步骤。
CN201911159812.XA 2019-11-22 2019-11-22 一种预测模式选择方法、装置、视频编码设备及存储介质 Active CN112839224B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911159812.XA CN112839224B (zh) 2019-11-22 2019-11-22 一种预测模式选择方法、装置、视频编码设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911159812.XA CN112839224B (zh) 2019-11-22 2019-11-22 一种预测模式选择方法、装置、视频编码设备及存储介质

Publications (2)

Publication Number Publication Date
CN112839224A CN112839224A (zh) 2021-05-25
CN112839224B true CN112839224B (zh) 2023-10-10

Family

ID=75922599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911159812.XA Active CN112839224B (zh) 2019-11-22 2019-11-22 一种预测模式选择方法、装置、视频编码设备及存储介质

Country Status (1)

Country Link
CN (1) CN112839224B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115661273B (zh) * 2022-09-15 2024-03-22 北京百度网讯科技有限公司 运动矢量的预测方法、装置、电子设备及存储介质
CN117478881A (zh) * 2023-11-06 2024-01-30 淘宝(中国)软件有限公司 视频信息处理方法、系统、设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022555A (zh) * 2007-02-12 2007-08-22 清华大学 帧间预测编码的模式快速选择方法
CN101677406A (zh) * 2008-09-19 2010-03-24 华为技术有限公司 一种视频编解码的方法及装置
CN103384325A (zh) * 2013-02-22 2013-11-06 张新安 一种avs-m视频编码快速帧间预测模式选择方法
JP2014204208A (ja) * 2013-04-02 2014-10-27 日本電信電話株式会社 予測モード決定方法、動画像符号化装置、及び予測モード決定プログラム
CN107396102A (zh) * 2017-08-30 2017-11-24 中南大学 一种基于Merge技术运动矢量的帧间模式快速选择方法及装置
WO2018010492A1 (zh) * 2016-07-12 2018-01-18 北京大学深圳研究生院 视频编码中帧内预测模式的快速决策方法
CN109788287A (zh) * 2017-11-10 2019-05-21 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100944333B1 (ko) * 2007-07-30 2010-03-02 한국과학기술원 스케일러블 비디오 부호화에서 계층간 예측모드 고속결정방법
CN104333756B (zh) * 2014-11-19 2017-10-24 西安电子科技大学 基于时域相关性的hevc预测模式快速选择方法
JP2016187171A (ja) * 2015-03-27 2016-10-27 富士通株式会社 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
CN109120926B (zh) * 2017-06-23 2019-08-13 腾讯科技(深圳)有限公司 预测模式选择方法、装置及介质
US20190320181A1 (en) * 2018-04-17 2019-10-17 Qualcomm Incorporated Generation of motion vector predictors from multiple neighboring blocks in video coding
CN109510992A (zh) * 2018-11-15 2019-03-22 建湖云飞数据科技有限公司 用于视频编解码的预测模式选择方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101022555A (zh) * 2007-02-12 2007-08-22 清华大学 帧间预测编码的模式快速选择方法
CN101677406A (zh) * 2008-09-19 2010-03-24 华为技术有限公司 一种视频编解码的方法及装置
CN103384325A (zh) * 2013-02-22 2013-11-06 张新安 一种avs-m视频编码快速帧间预测模式选择方法
JP2014204208A (ja) * 2013-04-02 2014-10-27 日本電信電話株式会社 予測モード決定方法、動画像符号化装置、及び予測モード決定プログラム
WO2018010492A1 (zh) * 2016-07-12 2018-01-18 北京大学深圳研究生院 视频编码中帧内预测模式的快速决策方法
CN107396102A (zh) * 2017-08-30 2017-11-24 中南大学 一种基于Merge技术运动矢量的帧间模式快速选择方法及装置
CN109788287A (zh) * 2017-11-10 2019-05-21 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN112839224A (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
RU2683495C1 (ru) Нововведения в предсказание блочных векторов и оценку восстановленных значений отсчетов в области перекрытия
TWI556648B (zh) 解碼影像的方法
KR101644208B1 (ko) 이전에 계산된 모션 정보를 이용하는 비디오 인코딩
TWI552579B (zh) 視訊編碼方法與裝置以及非暫時性電腦可讀記錄媒體
CN107005698B (zh) 支持尽力服务解码的元数据提示
JP2019505144A (ja) ビデオコーディングのためのフィルタのための幾何学的変換
US10218983B2 (en) Adapting mode decisions in video encoder
KR20170078673A (ko) 움직임 벡터 부복호화 방법 및 장치
JP7279154B2 (ja) アフィン動きモデルに基づく動きベクトル予測方法および装置
JP2022515031A (ja) ビデオコーディングのための方法、機器及びコンピュータ・プログラム
TW201412127A (zh) 畫面間預測的運動向量預測方法與裝置
KR20230007313A (ko) 딥 러닝을 사용한 병렬화된 레이트-왜곡 최적화된 양자화
GB2505726A (en) Dividing Enhancement Layer Processing Block Upon Overlap with Spatially Corresponding Region of Base Layer
CN104539948A (zh) 视频处理系统和视频处理方法
CN112839224B (zh) 一种预测模式选择方法、装置、视频编码设备及存储介质
CN109996080A (zh) 图像的预测方法、装置及编解码器
JP2023107799A (ja) ビデオピクチャの復号および符号化の方法ならびに装置
JP2022502966A (ja) 候補動きベクトルリストを取得するための方法、装置、エンコーダ及びデコーダ
JP7448558B2 (ja) 画像エンコーディングおよびデコーディングのための方法およびデバイス
KR102609215B1 (ko) 비디오 인코더, 비디오 디코더, 및 대응하는 방법
CN116868571A (zh) 对于帧间预测的改进的局部光照补偿
CN113573066A (zh) 一种视频编码的方法及装置
JP7437426B2 (ja) インター予測方法および装置、機器、記憶媒体
JP2023179684A (ja) ピクチャ予測方法および装置、およびコンピュータ可読記憶媒体
JP2022513814A (ja) インター予測方法および装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40044539

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant