CN114630114A - 视频编码的帧内预测方法和装置、存储介质及电子设备 - Google Patents

视频编码的帧内预测方法和装置、存储介质及电子设备 Download PDF

Info

Publication number
CN114630114A
CN114630114A CN202210103355.8A CN202210103355A CN114630114A CN 114630114 A CN114630114 A CN 114630114A CN 202210103355 A CN202210103355 A CN 202210103355A CN 114630114 A CN114630114 A CN 114630114A
Authority
CN
China
Prior art keywords
prediction
intra
frame
prediction mode
distortion cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210103355.8A
Other languages
English (en)
Inventor
张鹏
文映博
向国庆
黄晓峰
严伟
范益波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced Institute of Information Technology AIIT of Peking University
Hangzhou Weiming Information Technology Co Ltd
Original Assignee
Advanced Institute of Information Technology AIIT of Peking University
Hangzhou Weiming Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Advanced Institute of Information Technology AIIT of Peking University, Hangzhou Weiming Information Technology Co Ltd filed Critical Advanced Institute of Information Technology AIIT of Peking University
Priority to CN202210103355.8A priority Critical patent/CN114630114A/zh
Publication of CN114630114A publication Critical patent/CN114630114A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频编码的帧内预测方法和装置、存储介质及电子设备。其中,所述方法包括:获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp;基于所述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;根据所述预测重构像素确定所述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;将率失真代价小于预设阈值的至少一个帧内预测模式,作为所述每个PU的目标帧内预测模式集合。本发明解决了视频编码的帧内预测的准确性较低的技术问题。

Description

视频编码的帧内预测方法和装置、存储介质及电子设备
技术领域
本发明图像处理技术领域,具体而言,涉及一种视频编码的帧内预测方法和装置、存储介质及电子设备。
背景技术
视频编码技术中,帧内预测可以有效地消除空间冗余,是视频编码技术中非常重要的组成部分。为了使得帧内预测值更加准确,预测残差更小,目前主流的视频编码标准中采用了多种预测模式进行帧内预测过程,而模式决策的过程分为两个步骤进行,即粗模式选择(Rough Mode Decision,RMD)和模式选择。RMD过程为从33种帧内预测模式中选出N种模式进入下一步的率失真优化模式决策。为了便于硬件的实现,当前RMD是以64x64大小的LCU为单位,选取附近的以及LCU自身内部的原始像素作为每一个编码单元(Coding Unit,CU)的参考像素来进行预测,该方式相比于编码标准中使用CU周围的重构像素作为参考像素来计算,无法准确对视频帧进行帧内预测。
发明内容
本发明实施例提供了一种视频编码的帧内预测方法和装置、存储介质及电子设备,以至少解决视频编码的帧内预测的准确性较低的技术问题。
根据本发明实施例的一个方面,提供了一种视频编码的帧内预测方法,包括:获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp;基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合。
根据本发明实施例的另一方面,还提供了一种视频编码的帧内预测装置,包括:获取单元,获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp;第一确定单元,用于基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;第二确定单元,用于根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;第三确定单元,用于将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过上述计算机程序执行上述的视频编码的帧内预测方法。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述视频编码的帧内预测方法。
在本发明实施例中,采用了基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合的方法,在上述方法中,由于采用基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素,不仅解决了在视频编码流水线过程中,无需在模式决策(MD)结束后就能获得重构像素的问题,而且提高了视频编码的帧内预测的准确性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的视频编码的帧内预测方法的应用环境的示意图;
图2是根据本发明实施例的另一种可选的视频编码的帧内预测方法的应用环境的示意图;
图3是根据本发明实施例的一种可选的相关技术中的视频编码的流程示意图;
图4是根据本发明实施例的一种可选的视频编码的帧内预测方法的流程示意图;
图5是根据本发明实施例的一种可选的视频编码的帧内预测方法的重构像素示意图;
图6是根据本发明实施例的另一种可选的视频编码的帧内预测方法的模式选择示意图;
图7是根据本发明实施例的又一种可选的视频编码的帧内预测方法的流程示意图;
图8是根据本发明实施例的一种可选的视频编码的帧内预测装置的结构示意图;
图9是根据本发明实施例的一种可选的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种视频编码的帧内预测方法,可选地,作为一种可选地实施方式,上述视频编码的帧内预测方法可以但不限于应用于如图1所示的应用环境中。该应用环境中包括:与用户进行人机交互的终端设备102、网络104、服务器106。用户108与终端设备102之间可以进行人机交互,终端设备102中运行有视频编码的帧内预测应用程序。上述终端设备102中包括人机交互屏幕1022,处理器1024及存储器1026。人机交互屏幕1022用于目标帧内预测模式集合;处理器1024用于获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp。存储器1026用于存储上述目标帧内预测模式集合。
此外,服务器106中包括数据库1062及处理引擎1064,数据库1062中用于存储上述目标帧内预测模式集合。处理引擎1064用于基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合;将上述每个PU的目标帧内预测模式集合发送至上述终端设备102的客户端。
在一个或多个实施例中,本申请上述视频编码的帧内预测方法可以应用于图2所示的应用环境中。如图2所示,用户202与用户设备204之间可以进行人机交互。用户设备204中包含有存储器206和处理器208。本实施例中用户设备204可以但不限于参考执行上述终端设备102所执行的操作,以获取每个PU的目标帧内预测模式集合。
可选地,上述终端设备102和用户设备204包括但不限于为手机、平板电脑、笔记本电脑、PC机,车载电子设备,可穿戴设备等终端,上述网络104可以包括但不限于无线网络或有线网络。其中,该无线网络包括:WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器106可以包括但不限于任何可以进行计算的硬件设备。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
如图3所示,在相关技术中的编码标准中,RMD模式被提取出来作为单独流水级,每一个CU会使用预测周边已编码完成的CU的重构像素作为参考像素来进行帧内预测,而在这一流水排布下,重构像素是在模式决策MD结束后才可获得,因此RMD模式无法提前获得重构像素来进行帧内预测。
为了解决上述技术问题,作为一种可选地实施方式,如图4所示,本发明实施例提供了一种视频编码的帧内预测方法,包括如下步骤:
S402,获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp。
具体地,基于视频帧的粗模式选择RMD所需的原始像素和量化参数qp,来获取每一个CU周边已编码完成的CU的重构像素。
S404,基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素。
这里,预设的线性预估模型包括但不限于训练好的通过原始像素来预测重构像素的线性模型。
S406,根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价。
在本发明实施例中,通过上述预设的线性预估模型得到每一个CU周边已编码完成的CU的重构像素,然后每个预测单元PU的帧内预测模式的率失真代价,可以得到当前视频帧的RMD模式下的多个帧内预测模式的率失真代价。
S408,将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合。
具体地,获取多个帧内预测模式的率失真代价后,根据当前应用场景的需求设置预设阈值来获取到率失真代价小于预设阈值的一个或多个帧内预测模式作为上述每个PU的目标帧内预测模式集合。
在本发明实施例中,采用了基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合的方法,在上述方法中,由于采用基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素,不仅解决了在视频编码流水线过程中,无需在模式决策(MD)结束后就能获得重构像素的问题,而且提高了视频编码的帧内预测的准确性。
在一个或多个实施例中,上述基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素,包括:
通过下式确定当前帧中每个编码树单元CTU中的每个CU的预测重构像素:
Figure BDA0003492987150000071
其中,RecCTU(x,y)为当前CTU周围的重构像素,OrgCTU(x,y)为当前CTU的原始像素,OrgCU(x,y)为当前CTU中当前编码CU的原始像素,α,β为拟合参数,margin为量化参数qp预设阈值,F(O)为拟合的预测重构像素。
在本发明实施例中,如图5所示,拟合样本选取当前编码的4X4大小的CU上方与左侧的CTU的重构像素和原始像素,而此时CTU周边重构像素已经得到。当qp较大,即量化步长较大时,拟合得到的像素准确性较低,故设定低于margin的情况下采用拟合的方式获取重构像素,大于等于预设阈值margin的情况下直接使用原始像素进行预测。
在一个或多个实施例中,上述根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价,包括:
将上述预测重构像素作为参考像素,通过公式(1)确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;
J=λ·R+D (1)
其中,λ为拉格朗日乘数,R为编码所需码率,D为失真误差,J为计算出的率失真代价;
在第三代音视频编码标准AVS3标准中,帧内预测的R值是根据MPM来决定的,如公式(2)所示,在当前模式等于MPM0或MPM1时,R大小为2,否则为6。而MPM值获取是根据左侧与上侧的已编码块来决定,在现有技术的编码流程中,该部分尚未完成,无法提前获得MPM值,因此也就无法获得R值的大小。
Figure BDA0003492987150000081
而在本发明实施例中,在公式(1)中,上述R通过公式(3)获取,以此可以作为R的值可以准确计算率失真代价。
R=log2(mode+1)+1 (3)
其中,mode为当前帧内预测模式的值。
在一个或多个实施例中,上述根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价,还包括:
遍历上述当前视频帧中的每个PU,执行如下操作,直至得到上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价:
将确定出的任意两个PU的帧内预测模式的率失真代价,作为上述任意两个PU的父PU的帧内预测模式的率失真代价。
在本发明实施例中,包括但限于使用小尺寸的PU向上拼接的方法进行估算大尺寸的PU的率失真代价,例如8x4的PU的每种模式的率失真代价值,可以使用其包含的两个4x4PU的对应模式的率失真代价值相加后得到;通过上述技术手段可以减少视频编码的电路数量,节省硬件资源。
在一个或多个实施例中,上述将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合,包括:
针对经过四叉树划分的PU子集,在上述PU子集中存在一个未确定出目标帧内预测模式集合的待定PU时,将上述PU子集中其余三个PU的目标帧内预测模式集合的交集作为上述待定PU的目标帧内预测模式集合。
在本发明实施例中,对每种尺寸的PU的33种帧内预测模式的率失真代价值进行排序,以获得率失真代价值小于预设阈值的N种模式,将其保存后输出。其中,对于16x16尺寸的经过四叉树划分模式的PU,为减少排序时间,其右下角PU,即第四个处理的PU,用来排序的模式根据左上,上方,左侧的PU来选择,参考这三个PU最终所选择的模式,以它们作为候选进行最终排序,选择出N种模式,如图6所示,PU3的候选模式将从PU0~PU2中获取。
在一个或多个实施例中,上述margin的值为30。
在一个或多个实施例中,上述将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合之后,还包括:输出上述每个PU的目标帧内预测模式集合。
基于上述实施例,如图7所示,在一应用实施例中,上述的视频编码的帧内预测方法还包括如下步骤:
S702,获取参考像素和参考信息(即当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp)。
S704,对参数信息进行分析并拟合线性模型。
S706,将参考像素输入上述拟合线性模型进行计算,并获取拟合重构像素。
S708,计算4*4大小的PU的率失真代价。
S710,计算较4*4大小的PU更大的PU的率失真代价。
S712,对各尺寸PU帧内预测模式按照率失真代价值排序。
S714,将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合。
本发明实施例还具有以下有益效果:
1.本发明实施例不仅便于硬件实现,能够满足RMD模块并行计算的目的。
2.本发明实施例可以提升帧内预测的效率,相比于直接使用原始像素作为参考像素,本发明实施例能够使用更接近重构像素的复合像素作为参考像素,最终在做RMD时能够获得更精准的结果。
3.减少排序操作所需时间,可以减少获取通过四叉树划分的其中一个CU的帧内预测排序模式的过程。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述视频编码的帧内预测方法的视频编码的帧内预测装置。如图8所示,该装置包括:
获取单元802,获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp;
第一确定单元804,用于基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;
第二确定单元806,用于根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;
第三确定单元808,用于将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合。
在本发明实施例中,采用了基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合的方法,在上述方法中,由于采用基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素,不仅解决了在视频编码流水线过程中,无需在模式决策(MD)结束后就能获得重构像素的问题,而且提高了视频编码的帧内预测的准确性。
在一个或多个实施例中,上述第一确定单元804,具体包括:
第一确定模块,用于通过下式确定当前帧中每个编码树单元CTU中的每个CU的预测重构像素:
Figure BDA0003492987150000111
其中,RecCTU(x,y)为当前CTU周围的重构像素,OrgCTU(x,y)为当前CTU的原始像素,OrgCU(x,y)为当前CTU中当前编码CU的原始像素,α,β为拟合参数,margin为量化参数qp预设阈值,F(O)为拟合的预测重构像素。
在一个或多个实施例中,上述第二确定单元806,具体包括:
第二确定模块,用于将上述预测重构像素作为参考像素,通过公式(1)确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;J=λ·R+D (1)
其中,λ为拉格朗日乘数,R为编码所需码率,D为失真误差,J为计算出的率失真代价;
在公式(1)中,上述R通过公式(2)获取;
R=log2(mode+1)+1 (2)
其中,mode为当前帧内预测模式的值。
在一个或多个实施例中,上述第二确定单元806,还包括:
遍历模块,用于遍历上述当前视频帧中的每个PU,执行如下操作,直至得到上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价:
第三确定模块,用于将确定出的任意两个PU的帧内预测模式的率失真代价,作为上述任意两个PU的父PU的帧内预测模式的率失真代价。
在一个或多个实施例中,上述第三确定单元808,具体包括:
第四确定模块,用于针对经过四叉树划分的PU子集,在上述PU子集中存在一个未确定出目标帧内预测模式集合的待定PU时,将上述PU子集中其余三个PU的目标帧内预测模式集合的交集作为上述待定PU的目标帧内预测模式集合。
在一个或多个实施例中,上述视频编码的帧内预测装置中,上述margin的值为30。
在一个或多个实施例中,上述视频编码的帧内预测装置中,还包括:
输出单元,用于输出上述每个PU的目标帧内预测模式集合。
根据本发明实施例的又一个方面,还提供了一种用于实施上述视频编码的帧内预测方法的电子设备,该电子设备可以是图9所示的终端设备或服务器。本实施例以该电子设备为终端为例来说明。如图9所示,该电子设备包括存储器902和处理器904,该存储器902中存储有计算机程序,该处理器904被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp;
S2,基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;
S3,根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;
S4,将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合。
可选地,本领域普通技术人员可以理解,图9所示的结构仅为示意,电子装置电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图9其并不对上述电子装置电子设备的结构造成限定。例如,电子装置电子设备还可包括比图9中所示更多或者更少的组件(如网络接口等),或者具有与图9所示不同的配置。
其中,存储器902可用于存储软件程序以及模块,如本发明实施例中的视频编码的帧内预测方法和装置对应的程序指令/模块,处理器904通过运行存储在存储器902内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的视频编码的帧内预测方法。存储器902可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器902可进一步包括相对于处理器904远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器902具体可以但不限于用于存储目标帧内预测模式集合等信息。作为一种示例,如图9所示,上述存储器902中可以但不限于包括上述视频编码的帧内预测装置中的获取单元802、第一确定单元804、第二确定单元806与第三确定单元808。此外,还可以包括但不限于上述视频编码的帧内预测装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置906用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置906包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置906为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器908,用于显示上述目标帧内预测模式集合;和连接总线910,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述视频编码的帧内预测方法,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp;
S2,基于上述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;
S3,根据上述预测重构像素确定上述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;
S4,将率失真代价小于预设阈值的至少一个帧内预测模式,作为上述每个PU的目标帧内预测模式集合。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种视频编码的帧内预测方法,其特征在于,包括:
获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp;
基于所述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;
根据所述预测重构像素确定所述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;
将率失真代价小于预设阈值的至少一个帧内预测模式,作为所述每个PU的目标帧内预测模式集合。
2.根据权利要求1所述的方法,其特征在于,所述基于所述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素,包括:
通过下式确定当前帧中每个编码树单元CTU中的每个CU的预测重构像素:
Figure FDA0003492987140000011
其中,RecCTU(x,y)为当前CTU周围的重构像素,OrgCTU(x,y)为当前CTU的原始像素,OrgCU(x,y)为当前CTU中当前编码CU的原始像素,α,β为拟合参数,margin为量化参数qp预设阈值,F(0)为拟合的预测重构像素。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述预测重构像素确定所述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价,包括:
将所述预测重构像素作为参考像素,通过公式(1)确定所述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;
J=λ·R+D (1)
其中,λ为拉格朗日乘数,R为编码所需码率,D为失真误差,J为计算出的率失真代价;
在公式(1)中,所述R通过公式(2)获取;
R=log2(mode+1)+1 (2)
其中,mode为当前帧内预测模式的值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述预测重构像素确定所述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价,还包括:
遍历所述当前视频帧中的每个PU,执行如下操作,直至得到所述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价:
将确定出的任意两个PU的帧内预测模式的率失真代价,作为所述任意两个PU的父PU的帧内预测模式的率失真代价。
5.根据权利要求1所述的方法,其特征在于,所述将率失真代价小于预设阈值的至少一个帧内预测模式,作为所述每个PU的目标帧内预测模式集合,包括:
针对经过四叉树划分的PU子集,在所述PU子集中存在一个未确定出目标帧内预测模式集合的待定PU时,将所述PU子集中其余三个PU的目标帧内预测模式集合的交集作为所述待定PU的目标帧内预测模式集合。
6.根据权利要求2所述的方法,其特征在于,所述margin的值为30。
7.根据权利要求1所述的方法,其特征在于,所述将率失真代价小于预设阈值的至少一个帧内预测模式,作为所述每个PU的目标帧内预测模式集合之后,还包括:
输出所述每个PU的目标帧内预测模式集合。
8.一种图像处理装置,其特征在于,包括:
获取单元,获取当前视频帧的粗模式选择RMD所需的原始像素和量化参数qp;
第一确定单元,用于基于所述原始像素和qp通过预设的线性预估模型确定当前帧中每个编码树单元CTU的预测重构像素;
第二确定单元,用于根据所述预测重构像素确定所述当前视频帧中每个预测单元PU的帧内预测模式的率失真代价;
第三确定单元,用于将率失真代价小于预设阈值的至少一个帧内预测模式,作为所述每个PU的目标帧内预测模式集合。
9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
10.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行所述权利要求1至7任一项中所述的方法。
CN202210103355.8A 2022-01-27 2022-01-27 视频编码的帧内预测方法和装置、存储介质及电子设备 Pending CN114630114A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210103355.8A CN114630114A (zh) 2022-01-27 2022-01-27 视频编码的帧内预测方法和装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210103355.8A CN114630114A (zh) 2022-01-27 2022-01-27 视频编码的帧内预测方法和装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN114630114A true CN114630114A (zh) 2022-06-14

Family

ID=81897997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210103355.8A Pending CN114630114A (zh) 2022-01-27 2022-01-27 视频编码的帧内预测方法和装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN114630114A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115278237A (zh) * 2022-07-29 2022-11-01 天翼云科技有限公司 一种视频帧内编码方法、编码器及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115278237A (zh) * 2022-07-29 2022-11-01 天翼云科技有限公司 一种视频帧内编码方法、编码器及介质

Similar Documents

Publication Publication Date Title
CN109151468B (zh) 一种图像数据的编码、解码方法及装置
US11070803B2 (en) Method and apparatus for determining coding cost of coding unit and computer-readable storage medium
CN112312131B (zh) 一种帧间预测方法、装置、设备及计算机可读存储介质
CN109587491A (zh) 一种帧内预测方法、装置及存储介质
CN110832869B (zh) 用于视频编码或解码的运动信息获取方法与装置
CN107396112A (zh) 一种编码方法及装置、计算机装置、可读存储介质
US11704840B2 (en) Attribute information prediction method, encoder, decoder and storage medium
US20230023369A1 (en) Video processing method, video processing apparatus, smart device, and storage medium
CN111862305B (zh) 处理图像的方法、装置、电子设备、存储介质和程序产品
CN114630114A (zh) 视频编码的帧内预测方法和装置、存储介质及电子设备
CN110198443B (zh) 视频帧的编码单元划分方法、装置、存储介质及电子装置
CN112399177A (zh) 一种视频编码方法、装置、计算机设备及存储介质
CN114157868B (zh) 视频帧的编码模式筛选方法、装置及电子设备
CN109493304A (zh) 一种图像数据处理方法以及装置
CN112839224B (zh) 一种预测模式选择方法、装置、视频编码设备及存储介质
CN115495677B (zh) 视频的时空定位方法和存储介质
CN115550645A (zh) 帧内预测模式的确定方法、装置、存储介质及电子设备
CN114697650B (zh) 基于下采样的帧内划分方法、相关装置设备及介质
CN112337093B (zh) 一种虚拟对象的分簇方法、装置、存储介质和电子装置
CN117750019B (zh) 视频编码方法及装置、电子设备及计算机可读存储介质
CN114786008A (zh) 帧内预测模式的选择方法、装置、存储介质及电子设备
WO2023024842A1 (zh) 点云编解码方法、装置、设备及存储介质
CN114222134A (zh) 视频数据的帧间预测方法、装置及电子设备
CN114567777A (zh) 基于avs3的分像素运动估计方法、装置及电子设备
CN115665424A (zh) 图像处理方法、装置、设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination