CN114157868B - 视频帧的编码模式筛选方法、装置及电子设备 - Google Patents

视频帧的编码模式筛选方法、装置及电子设备 Download PDF

Info

Publication number
CN114157868B
CN114157868B CN202210116116.6A CN202210116116A CN114157868B CN 114157868 B CN114157868 B CN 114157868B CN 202210116116 A CN202210116116 A CN 202210116116A CN 114157868 B CN114157868 B CN 114157868B
Authority
CN
China
Prior art keywords
mode
affine
current
rate
exists
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210116116.6A
Other languages
English (en)
Other versions
CN114157868A (zh
Inventor
张鹏
陈长鑫
向国庆
黄晓峰
严伟
范益波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Institute of Information Technology AIIT of Peking University
Hangzhou Weiming Information Technology Co Ltd
Original Assignee
Advanced Institute of Information Technology AIIT of Peking University
Hangzhou Weiming Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Institute of Information Technology AIIT of Peking University, Hangzhou Weiming Information Technology Co Ltd filed Critical Advanced Institute of Information Technology AIIT of Peking University
Priority to CN202210116116.6A priority Critical patent/CN114157868B/zh
Publication of CN114157868A publication Critical patent/CN114157868A/zh
Application granted granted Critical
Publication of CN114157868B publication Critical patent/CN114157868B/zh
Priority to PCT/CN2023/074598 priority patent/WO2023147780A1/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria

Abstract

本申请公开了一种视频帧的编码模式筛选方法、装置及电子设备。其中,该方法包括:根据当前编码单元CU的编码数据,判断当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集;确定当前CU在仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;在相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,在当前CU存在父CU且父CU的最优模式为跳跃SKIP模式的情况下,获取第二率失真率代价集合;将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为当前CU的目标编码预测模式。本申请解决了相关技术中的确定CU的帧间预测模式效率较低的技术问题。

Description

视频帧的编码模式筛选方法、装置及电子设备
技术领域
本申请涉及视频编解码领域,具体而言,涉及一种视频帧的编码模式筛选方法、装置及电子设备。
背景技术
视频编解码技术的主要作用是在可用的计算资源内,追求尽可能高的视频重建质量和尽可能高的压缩比。例如先进视频编码(Advanced Video Coding,AVS)。
基于仿射Affine的运动补偿技术是一种用于淡入、淡出、旋转、放缩等不规则运动的位移变换模型,解决了平移变换模型运动补偿不准确的问题。基于Affine的运动补偿技术包含了Affine Merge模式(仿射合并模式)和仿射运动估计模式(Affine MotionEstimation),二者包含在帧间模式选择的过程中,通常情况下,仿射运动估计和普通的运动估计一起计算率失真代价RDCost。仿射运动估计作为帧间预测的一项新的功能,增加了视频帧的编码器的时间复杂度以及需要较多的硬件资源。
目前在AVS3(第三代先进视频编码)标准中,对于尺寸大于等于16*16的编码单元(Coding Unit,CU)在帧间模式决策过程中都需要进行仿射运动估计过程,而由于仿射运动估计过程相比较其余帧间模式而言,具有更高的计算复杂度,大大增加了编码时间,从而导致确定CU的帧间预测模式的效率较低。
发明内容
本申请实施例提供了一种视频帧的编码模式筛选方法、装置及电子设备,以至少解决相关技术中的确定CU的帧间预测模式效率较低的技术问题。
根据本申请实施例的一个方面,提供了一种视频帧的编码模式筛选方法,包括:根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,上述仿射CU子集中的每个CU均为已编码单元;在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,上述第二率失真率代价集合为上述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合;在上述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件;在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取上述第二率失真率代价集合;其中,上述非仿射模式包括上述跳跃SKIP模式;在上述当前CU不满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价;将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。
根据本申请实施例的另一方面,还提供了一种视频帧的编码模式筛选装置,包括:第一判断单元,用于根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,上述仿射CU子集中的每个CU均为已编码单元;第一确定单元,用于在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,上述第二率失真率代价集合为上述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合;第二判断单元,用于在上述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件;第一获取单元,用于在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取上述第二率失真率代价集合;其中,上述非仿射模式包括上述跳跃SKIP模式;第二确定单元,用于在上述当前CU不满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价;第三确定单元,用于将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。
根据本申请实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述的视频帧的编码模式筛选方法。
根据本申请实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过上述计算机程序执行上述的视频帧的编码模式筛选方法。
在本申请实施例中,通过根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,以及判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件;进一步来获取当前CU在仿射模式下的第一率失真代价和非仿射模式下的第二率失真率代价集合中,并将最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。由于简化了仿射运动估计的过程,因此,本方案不仅减少仿射运动估计在整个帧间模式决策过程所占用的编码时间,而且提高了确定CU的预测模式的效率,解决了相关技术中的确定CU的帧间预测模式效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本发明实施例的一种可选的视频帧的编码模式筛选方法的应用环境的示意图;
图2是根据本发明实施例的另一种可选的视频帧的编码模式筛选方法的应用环境的示意图;
图3是根据本发明实施例的一种可选的视频帧的编码模式筛选方法的流程示意图;
图4是根据本发明实施例的一种当前CU的相邻的空域CU示意图;
图5是根据本发明实施例的另一种当前CU的时域CU示意图;
图6是根据本发明实施例的另一种可选的视频帧的编码模式筛选方法的流程示意图;
图7是根据本发明实施例的一种可选的视频帧的编码模式筛选装置的结构示意图;
图8是根据本申请实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种视频帧的编码模式筛选方法,作为一种可选的实施方式,上述视频帧的编码模式筛选上述方法可以但不限于应用于如图1所示的硬件环境中。该硬件环境中包括:与用户进行人机交互的终端设备102、网络104、服务器106。用户108与终端设备102之间可以进行人机交互,终端设备102中运行有视频帧的编码模式筛选应用客户端。上述终端设备102中包括人机交互屏幕1022,处理器1024及存储器1026。人机交互屏幕1022用于呈现视频帧处理的界面;处理器1024用于获取判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,和/或,判断上述当前CU是否存在父CU且上述父CU的最优模式为跳跃SKIP模式。存储器1026用于存储基于当前编码单元CU的编码数据。
此外,服务器106中包括数据库1062及处理引擎1064,数据库1062中用于存储当前编码单元CU的编码数据,及用于存储AVS3的编码模式。处理引擎1064根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,上述仿射CU子集中的每个CU均为已编码单元;在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,上述第二率失真率代价集合为上述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合;在上述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件;在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取上述第二率失真率代价集合;其中,上述非仿射模式包括上述跳跃SKIP模式;在上述当前CU不满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价;将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。
作为另一种可选的实施方式,本申请上述视频帧的编码模式筛选上述方法可以应用于图2中。如图2所示,用户202与用户设备204之间可以进行人机交互。用户设备204中包含有存储器206和处理器208。本实施例中用户设备204可以但不限于参考执行上述终端设备102所执行的操作,以获取当前CU的目标编码预测模式。
可选地,上述终端设备102和用户设备204可以但不限于为手机、平板电脑、笔记本电脑、PC机等终端,上述网络104可以包括但不限于无线网络或有线网络。其中,该无线网络包括:WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器106可以包括但不限于任何可以进行计算的硬件设备。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
可选地,在一个或多个实施例中,如图3所示,上述视频帧的编码模式筛选方法包括:
S302,根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,上述仿射CU子集中的每个CU均为已编码单元。
在本发明实施例中,如图4与图5所示,按照AVS3中的编码标准,当前帧图像Cur_pic的参考帧图像Col_pic;当前CU(Cur)的1个同位时域T位于当前Cu相邻的右下方,当前CU相邻的 6个空域CU{A,B,D,G,C,F}共7个相邻CU,构成相邻CU集合{A,B,D,G,C,F,T}。
CodingStructure为AVS3的编码器内的一种数据结构,根据CodingStructure通过坐标操作可以获取一帧所有位置的CU信息。CU信息包括CU的编码信息。
判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,例如,当{A,B,D,G,C,F,T}中存在CU A和CU B编码模式为仿射模式,{A,B}为仿射CU子集。
在本发明实施例中,跳跃SKIP模式为AVS3中的非仿射模式的帧间预设模式。
S304,在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,上述第二率失真率代价集合为上述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合。
在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,此时,可以初步通过仿射模式来预测当前CU的运动矢量信息,并根据运动矢量信息得到上述的第一率失真代价。
在本发明实施例中,这里需要说明的是,上述父CU的最优模式为各个帧间预测模式下的将率失真代价最小的预测模式,在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,可以初步判断出当前CU的最优模式不是仿射模式,然后依次获取当前CU在AVS3标准的每个非仿射模式下的率失真代价,得到第二率失真率代价集合。
S306,在上述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件。
S308,在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取上述第二率失真率代价集合;其中,上述非仿射模式包括上述跳跃SKIP模式;
S310,在上述当前CU不满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价;
S312,将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。
在本发明实施例中,通过将当前CU在仿射模式下对应的率失真代价,以及在非仿射模式下对应的率失真代价进行比较,将最小率失真代价对应的预测模式作为目标编码预测模式,这里的目标编码预测模式为最优的编码模式。
在本申请实施例中,通过根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,以及判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件;进一步来获取当前CU在仿射模式下的第一率失真代价和非仿射模式下的第二率失真率代价集合中,并将最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。由于简化仿射运动估计的过程,因此,本方案不仅减少仿射运动估计在整个帧间模式决策过程所占用的编码时间,而且提高了确定CU的预测模式的效率,解决了相关技术中的确定CU的帧间预测模式效率较低的技术问题。
在一个或多个实施例中,上述步骤S302,上述仿射模式包括仿射合并AffineMerge模式,上述判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,包括:判断上述当前CU的相邻CU集合中是否存在编码模式为Affine Merge模式的仿射CU子集。
在本发明实施例中,如图4与图5所示,例如,当相邻CU集合{A,B,D,G,C,F,T}中存在CU A和CU B编码模式为Affine Merge仿射模式,{A,B}为Affine Merge仿射模式的仿射CU子集。
在一个或多个实施例中,上述步骤S302,上述仿射模式包括仿射跳跃Affine Skip模式,上述判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,包括:判断上述当前CU的相邻CU集合中是否存在编码模式为上述Affine Skip模式的仿射CU子集。
这里需要说明的是,按照AVS3中的编码标准,在本发明实施例中,如图4与图5所示,例如,当{A,B,D,G,C,F,T}中存在CU A和CU B编码模式为Affine Skip仿射模式,{A,B}为Affine Skip仿射模式的仿射CU子集。
在一个或多个实施例中,上述步骤S304,上述在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价,包括:
在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,判断上述相邻CU集合中每个CU与上述当前CU的运动矢量的角度差异;当存在与当前CU的角度差异大于预设阈值时,确定出上述当前CU在上述仿射模式下的第一率失真代价。
如图4与图5所示,例如,当相邻CU集合{A,B,D,G,C,F,T}中存在CU A与当前CU的角度差异大于预设阈值时,估算当前CU的运动矢量信息,并确定出上述当前CU在上述仿射模式下的第一率失真代价。这里,预设阈值包括但不限于30度。
在一个或多个实施例中,上述非仿射模式还包括整像素预测模式,分像素预测模式,跳跃SKIP模式;上述步骤S304中,上述获取第二率失真率代价集合,包括:分别获取上述当前CU在整像素预测模式,分像素预测模式,跳跃SKIP模式和直接Direct模式下的率失真代价,得到第二率失真率代价集合。
在本发明实施例中,得到第一率失真代价和第二率失真率代价集合后,将最小率失真代价对应的预测模式作为最优预测模式。
在一个或多个实施例中,在确定上述当前CU在上述仿射模式下的第一率失真代价之前,还包括:通过以下公式预测上述当前CU的运动矢量信息:
Figure 715078DEST_PATH_IMAGE001
其中,
Figure 513270DEST_PATH_IMAGE002
为当前CU的控制点在水平方向上的运动矢量,
Figure 977749DEST_PATH_IMAGE003
为当前CU的控制点在竖直方向上的运动矢量,a,b,c,d,e,f为调整参数。
在本发明实施例中,通过已知控制点的运动矢量信息以及上述公式,可以到当前CU中所有子模块的运动矢量信息。
基于上述实施例,在一个或多个实施例中,如图6所示,上述视频帧的编码模式筛选方法包括如下步骤:
步骤1:开始当前CU的运动估计;
步骤2:在当前CU所在划分深度下,判断当前CU相邻已编码CU块中是否存在最优模式为仿射模式Affine或仿射合并模式Affine Merge,或者仿射跳跃Affine Skip模式的CU。若存在,则步骤4;若不存在,则进行步骤3;
步骤3:判断当前CU是否存在父CU且父CU最优模式为Skip模式。若是,则跳过步骤5,进入步骤6;若否,则接着进行步骤5;
步骤4:判断当前CU与相邻CU块的运动矢量MV角度差异是否超过阈值α。若是,则进行步骤5;若否,则接着进行步骤6;
步骤5:通过CU的运动预测公式,
Figure 177787DEST_PATH_IMAGE004
,迭代进行3次以内的仿射运动估计过程;
步骤6:进行AVS3标准中非仿射帧间模式的预测;
步骤7:根据率失真代价,选出最优模式;
步骤8:结束当前CU运动估计。
在本发明实施例中,通过简化仿射运动估计的过程,减少了仿射运动估计过程的高计算复杂度的编码时间。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
根据本申请实施例的另一个方面,还提供了一种用于实施上述视频帧的编码模式筛选方法的视频帧的编码模式筛选装置。如图7所示,该装置包括:
第一判断单元702,用于根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,上述仿射CU子集中的每个CU均为已编码单元。
在本发明实施例中,如图4与图5所示,按照AVS3标准,当前帧图像Cur_pic的参考帧图像Col_pic;当前CU(Cur)的1个同位时域T位于当前Cu相邻的右下方,当前CU相邻的 6个空域CU{A,B,D,G,C,F}共7个相邻CU,构成相邻CU集合{A,B,D,G,C,F,T}。
CodingStructure为AVS3的编码器内的一种数据结构,根据CodingStructure通过坐标操作可以获取一帧所有位置的CU信息。CU信息包括CU的编码信息。
判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,例如,当{A,B,D,G,C,F,T}中存在CU A和CU B编码模式为仿射模式,{A,B }为仿射CU子集。
在本发明实施例中,跳跃SKIP模式为AVS3中的非仿射模式的帧间预设模式。
第一确定单元704,用于在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,上述第二率失真率代价集合为上述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合。
在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,此时,可以初步通过仿射模式来预测当前CU的运动矢量信息,并根据运动矢量信息得到上述的第一率失真代价。
在本发明实施例中,这里需要说明的是,上述父CU的最优模式为各个帧间预测模式下的将率失真代价最小的预测模式,在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,可以初步判断出当前CU的最优模式不是仿射模式,然后依次获取当前CU在AVS3标准的每个非仿射模式下的率失真代价,得到第二率失真率代价集合。
第二判断单元706,用于在上述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件。
第一获取单元708,用于在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取上述第二率失真率代价集合;其中,上述非仿射模式包括上述跳跃SKIP模式。
第二确定单元710,用于在上述当前CU不满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价。
第三确定单元712,用于将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。
在本发明实施例中,通过将当前CU在仿射模式下对应的率失真代价,以及在非仿射模式下对应的率失真代价进行比较,将最小率失真代价对应的预测模式作为目标编码预测模式,这里的目标编码预测模式为最优的编码模式。
在本申请实施例中,通过根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,以及判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件;进一步来获取当前CU在仿射模式下的第一率失真代价和非仿射模式下的第二率失真率代价集合中,并将最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。由于简化仿射运动估计的过程,因此,本方案不仅减少仿射运动估计在整个帧间模式决策过程所占用的编码时间,而且提高了确定CU的预测模式的效率,解决了相关技术中的确定CU的帧间预测模式效率较低的技术问题。
在一个或多个实施例中,上述仿射模式包括仿射合并Affine Merge模式,上述第一判断单元702,具体包括:
第一判断模块,用于判断上述当前CU的相邻CU集合中是否存在编码模式为AffineMerge模式的仿射CU子集。
在一个或多个实施例中,上述仿射模式包括仿射合并Affine Skip模式,上述第一判断单元702,还包括:
第二判断模块,用于判断上述当前CU的相邻CU集合中是否存在编码模式为AffineSkip模式的仿射CU子集。
在一个或多个实施例中,上述第一确定单元704,具体包括:
第三判断模块,用于在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,判断上述相邻CU集合中每个CU与上述当前CU的运动矢量的角度差异;
第一确定模块,用于当存在与当前CU的角度差异大于预设阈值时,确定出上述当前CU在上述仿射模式下的第一率失真代价。
在一个或多个实施例中,上述非仿射模式还包括整像素预测模式,分像素预测模式,直接Direct模式;上述第一获取单元708,具体包括:
获取模块,用于分别获取上述当前CU在整像素预测模式,分像素预测模式,跳跃SKIP模式和直接Direct模式下的率失真代价,得到第二率失真率代价集合。
在一个或多个实施例中,上述视频帧的编码模式筛选装置,还包括:
预测单元,用于通过以下公式预测上述当前CU的运动矢量信息:
Figure 702309DEST_PATH_IMAGE005
其中,
Figure 987797DEST_PATH_IMAGE006
为当前CU的控制点在水平方向上的运动矢量,
Figure 255967DEST_PATH_IMAGE007
为当前CU的控制点在竖直方向上的运动矢量,a,b,c,d,e,f为调整参数。
根据本申请实施例的又一个方面,还提供了一种用于实施上述视频帧的编码模式筛选方法的电子设备,该电子设备可以是图1所示的终端设备或服务器。本实施例以该电子设备为服务器为例来说明。如图8所示,该电子设备包括存储器802和处理器804,该存储器802中存储有计算机程序,该处理器804被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,上述仿射CU子集中的每个CU均为已编码单元;
S2,在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,上述第二率失真率代价集合为上述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合;
S3,在上述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件;
S4,在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取上述第二率失真率代价集合;其中,上述非仿射模式包括上述跳跃SKIP模式;
S5,在上述当前CU不满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价;
S6,将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。
可选地,本领域普通技术人员可以理解,图8所示的结构仅为示意,电子装置电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图8其并不对上述电子装置电子设备的结构造成限定。例如,电子装置电子设备还可包括比图8中所示更多或者更少的组件(如网络接口等),或者具有与图8所示不同的配置。
其中,存储器802可用于存储软件程序以及模块,如本申请实施例中的视频帧的编码模式筛选方法和装置对应的程序指令/模块,处理器804通过运行存储在存储器802内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的视频帧的编码模式筛选方法。存储器802可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器802可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器802具体可以但不限于用于存储当前编码单元CU的参考空域CU等信息。作为一种示例,如图8所示,上述存储器802中可以但不限于包括上述视频帧的编码模式筛选装置中的第一判断单元702、第一确定单元704、第二判断单元706、第一获取单元708、第二确定单元710及第三确定单元712。此外,还可以包括但不限于上述视频帧的编码模式筛选装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置810用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置810包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置810为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器808,用于显示上述当前编码单元CU的参考空域CU信息;和连接总线810,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
在一个或多个实施例中,本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述视频帧的编码模式筛选方法。其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,根据当前编码单元CU的编码数据,判断上述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,上述仿射CU子集中的每个CU均为已编码单元;
S2,在上述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,上述第二率失真率代价集合为上述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合;
S3,在上述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断上述当前CU是否满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件;
S4,在上述当前CU满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取上述第二率失真率代价集合;其中,上述非仿射模式包括上述跳跃SKIP模式;
S5,在上述当前CU不满足存在父CU且上述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定上述当前CU在上述仿射模式下的第一率失真代价;
S6,将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为上述当前CU的目标编码预测模式。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种视频帧的编码模式筛选方法,其特征在于,包括:
根据当前编码单元CU的编码数据,判断所述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,所述仿射CU子集中的每个CU均为已编码单元;
在所述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定所述当前CU在所述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,所述第二率失真率代价集合为所述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合;
在所述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断所述当前CU是否满足存在父CU且所述父CU的最优模式为跳跃SKIP模式的条件;
在所述当前CU满足存在父CU且所述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取所述第二率失真率代价集合;其中,所述非仿射模式包括所述跳跃SKIP模式;
在所述当前CU不满足存在父CU且所述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定所述当前CU在所述仿射模式下的第一率失真代价;
将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为所述当前CU的目标编码预测模式。
2.根据权利要求1所述的方法,其特征在于,所述仿射模式包括仿射合并Affine Merge模式,所述判断所述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,包括:
判断所述当前CU的相邻CU集合中是否存在编码模式为Affine Merge模式的仿射CU子集。
3.根据权利要求1所述的方法,其特征在于,所述仿射模式包括仿射跳跃Affine Skip模式,所述判断所述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,包括:
判断所述当前CU的相邻CU集合中是否存在编码模式为所述Affine Skip模式的仿射CU子集。
4.根据权利要求1所述的方法,其特征在于,所述在所述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定所述当前CU在所述仿射模式下的第一率失真代价,包括:
在所述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,判断所述相邻CU集合中每个CU与所述当前CU的运动矢量的角度差异;
当存在与当前CU的角度差异大于预设阈值时,确定出所述当前CU在所述仿射模式下的第一率失真代价。
5.根据权利要求1至4中任一项中所述的方法,其特征在于,所述非仿射模式还包括整像素预测模式,分像素预测模式,直接Direct模式;所述获取第二率失真率代价集合,包括:
分别获取所述当前CU在整像素预测模式,分像素预测模式,跳跃SKIP模式和直接Direct模式下的率失真代价,得到所述第二率失真率代价集合。
6.根据权利要求1所述的方法,其特征在于,在确定所述当前CU在所述仿射模式下的第一率失真代价之前,还包括:
通过以下公式预测所述当前CU的运动矢量信息:
Figure 618215DEST_PATH_IMAGE001
其中,
Figure 544583DEST_PATH_IMAGE002
为当前CU的控制点在水平方向上的运动矢量,
Figure 890113DEST_PATH_IMAGE003
为当前CU的控制点在竖直方向上的运动矢量,a,b,c,d,e,f为调整参数。
7.一种视频帧的编码模式筛选装置,其特征在于,包括:
第一判断单元,用于根据当前编码单元CU的编码数据,判断所述当前CU的相邻CU集合中是否存在编码模式为仿射模式的仿射CU子集,所述仿射CU子集中的每个CU均为已编码单元;
第一确定单元,用于在所述相邻CU集合中存在编码模式为仿射模式的仿射CU子集的情况下,确定所述当前CU在所述仿射模式下的第一率失真代价,以及获取第二率失真率代价集合;其中,所述第二率失真率代价集合为所述当前CU在AVS3标准的每个非仿射模式下的率失真代价的集合;
第二判断单元,用于在所述相邻CU集合中不存在编码模式为仿射模式的仿射CU子集的情况下,判断所述当前CU是否满足存在父CU且所述父CU的最优模式为跳跃SKIP模式的条件;
第一获取单元,用于在所述当前CU满足存在父CU且所述父CU的最优模式为跳跃SKIP模式的条件的情况下,获取所述第二率失真率代价集合;其中,所述非仿射模式包括所述跳跃SKIP模式;
第二确定单元,用于在所述当前CU不满足存在父CU且所述父CU的最优模式为跳跃SKIP模式的条件的情况下,确定所述当前CU在所述仿射模式下的第一率失真代价;
第三确定单元,用于将第一率失真代价和第二率失真率代价集合中最小率失真代价对应的预测模式作为所述当前CU的目标编码预测模式。
8.根据权利要求7所述的装置,其特征在于,所述仿射模式包括仿射合并Affine Merge模式,所述第一判断单元,包括:
第一判断模块,用于判断所述当前CU的相邻CU集合中是否存在编码模式为AffineMerge模式的仿射CU子集。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至6任一项中所述的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至6中任一项所述的方法。
CN202210116116.6A 2022-02-07 2022-02-07 视频帧的编码模式筛选方法、装置及电子设备 Active CN114157868B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210116116.6A CN114157868B (zh) 2022-02-07 2022-02-07 视频帧的编码模式筛选方法、装置及电子设备
PCT/CN2023/074598 WO2023147780A1 (zh) 2022-02-07 2023-02-06 视频帧的编码模式筛选方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210116116.6A CN114157868B (zh) 2022-02-07 2022-02-07 视频帧的编码模式筛选方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114157868A CN114157868A (zh) 2022-03-08
CN114157868B true CN114157868B (zh) 2022-07-19

Family

ID=80450372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210116116.6A Active CN114157868B (zh) 2022-02-07 2022-02-07 视频帧的编码模式筛选方法、装置及电子设备

Country Status (2)

Country Link
CN (1) CN114157868B (zh)
WO (1) WO2023147780A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114157868B (zh) * 2022-02-07 2022-07-19 杭州未名信科科技有限公司 视频帧的编码模式筛选方法、装置及电子设备

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101967028B1 (ko) * 2016-12-21 2019-04-09 전자부품연구원 고효율 비디오 부호화 모드 결정방법 및 결정장치
US10701390B2 (en) * 2017-03-14 2020-06-30 Qualcomm Incorporated Affine motion information derivation
CN109788287B (zh) * 2017-11-10 2022-10-25 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质
US10958934B2 (en) * 2018-07-27 2021-03-23 Tencent America LLC History-based affine merge and motion vector prediction
EP4325859A3 (en) * 2018-09-19 2024-05-15 Beijing Bytedance Network Technology Co., Ltd. Syntax reuse for affine mode with adaptive motion vector resolution
CN111698515B (zh) * 2019-03-14 2023-02-14 华为技术有限公司 帧间预测的方法及相关装置
WO2021188598A1 (en) * 2020-03-20 2021-09-23 Beijing Dajia Internet Information Technology Co., Ltd. Methods and devices for affine motion-compensated prediction refinement
CN111698502A (zh) * 2020-06-19 2020-09-22 中南大学 基于vvc编码的仿射运动估计加速方法、设备及存储介质
CN111988607B (zh) * 2020-08-07 2023-03-24 北京奇艺世纪科技有限公司 编码单元处理方法、装置、电子设备及存储介质
CN112911308B (zh) * 2021-02-01 2022-07-01 重庆邮电大学 一种h.266/vvc的快速运动估计方法及存储介质
CN114157868B (zh) * 2022-02-07 2022-07-19 杭州未名信科科技有限公司 视频帧的编码模式筛选方法、装置及电子设备

Also Published As

Publication number Publication date
CN114157868A (zh) 2022-03-08
WO2023147780A1 (zh) 2023-08-10

Similar Documents

Publication Publication Date Title
CN111681167B (zh) 画质调整方法和装置、存储介质及电子设备
US20190268616A1 (en) Picture prediction method and related apparatus
CN107396112A (zh) 一种编码方法及装置、计算机装置、可读存储介质
CN114157868B (zh) 视频帧的编码模式筛选方法、装置及电子设备
CN110545433B (zh) 视频编解码方法和装置及存储介质
CN110519607B (zh) 视频解码方法及装置,视频编码方法及装置
CN112312131B (zh) 一种帧间预测方法、装置、设备及计算机可读存储介质
CN110662071B (zh) 视频解码方法和装置、存储介质及电子装置
CN115495677B (zh) 视频的时空定位方法和存储介质
CN115550645A (zh) 帧内预测模式的确定方法、装置、存储介质及电子设备
CN110677653A (zh) 视频编解码方法和装置及存储介质
CN116170582A (zh) 一种视频数据处理方法、装置、计算机设备以及存储介质
CN110572672A (zh) 视频编解码方法和装置、存储介质及电子装置
CN113808157B (zh) 图像处理方法、装置、及计算机设备
CN110636293B (zh) 视频编码、解码方法和装置、存储介质及电子装置
CN113996056A (zh) 云游戏的数据发送和接收方法以及相关设备
CN114374841A (zh) 视频编码码率控制的优化方法、装置及电子设备
CN110677721B (zh) 视频编解码方法和装置及存储介质
CN110677690B (zh) 视频处理方法和装置、存储介质
KR20220003087A (ko) Vr 영상 품질 평가 방법 및 장치
CN114554209A (zh) 基于avs3的仿射模式筛选方法、装置及电子设备
CN116760986B (zh) 候选运动矢量生成方法、装置、计算机设备和存储介质
CN114222134A (zh) 视频数据的帧间预测方法、装置及电子设备
CN110582022A (zh) 视频编解码方法和装置及存储介质
CN110572654B (zh) 视频编码、解码方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20220308

Assignee: Zhejiang smart video security Innovation Center Co.,Ltd.

Assignor: Institute of Information Technology, Zhejiang Peking University

Contract record no.: X2022330000930

Denomination of invention: Method, device and electronic equipment for screening encoding mode of video frames

Granted publication date: 20220719

License type: Common License

Record date: 20221229