CN112422967B - 视频的编码方法及装置、存储介质、电子设备 - Google Patents

视频的编码方法及装置、存储介质、电子设备 Download PDF

Info

Publication number
CN112422967B
CN112422967B CN202011019860.1A CN202011019860A CN112422967B CN 112422967 B CN112422967 B CN 112422967B CN 202011019860 A CN202011019860 A CN 202011019860A CN 112422967 B CN112422967 B CN 112422967B
Authority
CN
China
Prior art keywords
value
crf
source
video
frame rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011019860.1A
Other languages
English (en)
Other versions
CN112422967A (zh
Inventor
张文杰
樊鸿飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN202011019860.1A priority Critical patent/CN112422967B/zh
Publication of CN112422967A publication Critical patent/CN112422967A/zh
Application granted granted Critical
Publication of CN112422967B publication Critical patent/CN112422967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频的编码方法及装置、存储介质、电子设备,属于视频编码技术领域。其中,该方法包括:获取源视频的帧率值;根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值;基于所述目标CRF值对所述源视频进行恒定视觉质量编码。通过本发明,解决了相关技术在CRF模式下的视频画面容易失真的技术问题,可以提升CRF模式的编码效果,在视频帧率较低时更好的保障视觉质量,避免失真,此外,在视频帧率较高时进一步降低码率,在保证视频质量的情况下,压缩视频编码量,进一步降低视频的存储空间,提高视频的传输量,降低解码量。

Description

视频的编码方法及装置、存储介质、电子设备
技术领域
本发明涉及视频编码领域,具体而言,涉及一种视频的编码方法及装置、存储介质、电子设备。
背景技术
相关技术在进行视频编码时,是指通过压缩技术,将原始视频格式的文件转换成另一种视频格式文件的方式。视频流传输中常见的编解码标准有H.264、H.265、AVS、AV1等。
相关技术在视频编码时有多种码率控制方法,有恒定码率的CBR(Constant BitRate,固定码率)模式,有恒定视觉质量的CRF(Constant Rate Factor,固定码率系数)模式,每种码率控制方式最终都是通过改变每帧的QP值来达到码率控制的效果。其中,CRF模式以输入的CRF值作为基准QP(Quant parameter,量化参数),同时依据图像的复杂度信息和运动信息,来调整每帧的实际QP值,以此来稳定输出的视觉质量。对于运动剧烈或复杂场景,其失真相对难以被肉眼察觉,因此可以加大QP以节省码率;而对于人眼敏感的平坦区域,较小的失真都更容易被人察觉,故需减小QP以减小失真。
相关技术中的CRF方法,通常只考虑了空域复杂度,而并未考虑时域的帧率信息。然而,申请人发现,在不同的帧率时,即使同样质量的视频,人眼的主观质量感受可能也并不相同。比如当视频帧率较低时,每一帧画面被人眼所观测的时间较长,因此更容易感知其中的失真,而当视频帧率较高时,同样的失真更不易被人眼察觉、导致相关技术中采用CRF模式编码的视频的视觉质量并不恒定,失真率高。
针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
发明内容
本发明实施例提供了一种视频的编码方法及装置、存储介质、电子设备。
根据本申请实施例的一个方面,提供了一种视频的编码方法,包括:获取源视频的帧率值;根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值;基于所述目标CRF值对所述源视频进行恒定视觉质量编码。
进一步,根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值,包括:确定所述帧率值所在的帧率区间;若所述帧率值小于第一阈值,降低所述源视频的源CRF值,得到目标CRF值;若所述帧率值小于或等于第二阈值且大于所述第一阈值,维持所述源视频的源CRF值,得到目标CRF值;若所述帧率值大于所述第二阈值,增加所述源视频的源CRF值,得到目标CRF值,其中,所述第二阈值大于所述第一阈值。
进一步,降低所述源视频的源CRF值,得到目标CRF值,包括:根据以下算法计算所述目标CRF值:目标CRF值=源CRF值-a,其中,a为所述目标CRF值的向下调整步长。
进一步,增加所述源视频的源CRF值,得到目标CRF值,包括:根据以下算法计算所述目标CRF值:目标CRF值=源CRF值+min(FPS/N,M);其中,所述FPS为所述帧率值,N为正数、M为正数,N、M分别为第一预设值和第二预设值。
进一步,基于所述目标CRF值对所述源视频进行恒定视觉质量编码包括:基于所述目标CRF值计算量化参数QP值;采用所述QP值逐帧对所述源视频进行恒定视觉质量编码。
进一步,基于所述目标CRF值计算量化参数QP值包括:计算所述源视频的基础复杂度Cplx_base和实际复杂度Cplx_frame;通过以下公式计算基础中间结果:Qscalebase=0.85×2(CRF值-12)/6;通过以下公式计算实际中间结果:
通过以下公式计算QP值:QPframe=12+6×log2(Qscaleframe/0.85);其中,Qscalebase为所述基础中间结果,Qscaleframe为所述实际中间结果,QPframe为所述QP值,b为第三预设值。
进一步,在根据所述帧率值调整所述源视频的源CRF值之前,所述方法还包括:判断所述源CRF值是否大于第三阈值,以及判断所述源CRF值是否小于第四阈值;若所述源CRF值大于第三阈值,且所述源CRF值小于第四阈值,确定根据所述帧率值调整所述源视频的源固定码率系数CRF值。
进一步,在获取源视频的帧率值之后,所述方法还包括:获取所述源视频的视频类型信息,其中,所述视频类型信息用于指示所述源视频为电脑图画CG视频或自然视频;若所述源视频为CG视频,通过第一幅度根据所述帧率值调整所述源视频的源CRF值;若所述源视频为自然视频,通过第二幅度根据所述帧率值调整所述源视频的源CRF值,其中,所述第一幅度小于所述第二幅度。
根据本申请实施例的另一个方面,还提供了一种视频的编码装置,包括:第一获取模块,用于获取源视频的帧率值;第一调整模块,用于根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值;编码模块,用于基于所述目标CRF值对所述源视频进行恒定视觉质量编码。
进一步,所述第一调整模块包括:确定单元,用于确定所述帧率值所在的帧率区间;调整单元,用于若所述帧率值小于第一阈值,降低所述源视频的源CRF值,得到目标CRF值;若所述帧率值小于或等于第二阈值且大于所述第一阈值,维持所述源视频的源CRF值,得到目标CRF值;若所述帧率值大于所述第二阈值,增加所述源视频的源CRF值,得到目标CRF值,其中,所述第二阈值大于所述第一阈值。
进一步,所述调整单元包括:第一计算子单元,用于根据以下算法计算所述目标CRF值:目标CRF值=源CRF值-a,其中,a为所述目标CRF值的向下调整步长。
进一步,所述调整单元包括:第二计算子单元,用于根据以下算法计算所述目标CRF值:目标CRF值=源CRF值+min(FPS/N,M);其中,所述FPS为所述帧率值,N为正数、M为正数,N、M分别为第一预设值和第二预设值。
进一步,所述编码模块包括:计算单元,用于基于所述目标CRF值计算量化参数QP值;编码单元,用于采用所述QP值逐帧对所述源视频进行恒定视觉质量编码。
进一步,所述计算单元包括:第一计算子单元,用于计算所述源视频的基础复杂度Cplx_base和实际复杂度Cplx_frame;第二计算子单元,用于通过以下公式计算基础中间结果:Qscalebase=0.85×2(CRF值-12)/6;第三计算子单元,用于通过以下公式计算实际中间结果:第四计算子单元,用于通过以下公式计算QP值:QPframe=12+6×log2(Qscaleframe/0.85);其中,Qscalebase为所述基础中间结果,Qscaleframe为所述实际中间结果,QPframe为所述QP值,b为第三预设值。
进一步,所述装置还包括:判断模块,用于在所述第一调整模块根据所述帧率值调整所述源视频的源CRF值之前,判断所述源CRF值是否大于第三阈值,以及判断所述源CRF值是否小于第四阈值;确定模块,用于若所述源CRF值大于第三阈值,且所述源CRF值小于第四阈值,确定根据所述帧率值调整所述源视频的源固定码率系数CRF值。
进一步,所述装置还包括:第二获取模块,用于在所述第一获取模块获取源视频的帧率值之后,获取所述源视频的视频类型信息,其中,所述视频类型信息用于指示所述源视频为电脑图画CG视频或自然视频;第二调整模块,用于若所述源视频为CG视频,通过第一幅度根据所述帧率值调整所述源视频的源CRF值;若所述源视频为自然视频,通过第二幅度根据所述帧率值调整所述源视频的源CRF值,其中,所述第一幅度小于所述第二幅度。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的步骤。
根据本申请实施例的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
通过本发明,获取源视频的帧率值,然后根据帧率值调整源视频的源CRF值,得到目标CRF值,最后基于目标CRF值对源视频进行恒定视觉质量编码,通过视频的帧率来调整CRF值,以避免在恒定视觉质量模式下因帧率变化而产生的画面失真,解决了相关技术在CRF模式下的视频画面容易失真的技术问题,可以提升CRF模式的编码效果,在视频帧率较低时更好的保障视觉质量,避免失真,此外,在视频帧率较高时进一步降低码率,在保证视频质量的情况下,压缩视频编码量,进一步降低视频的存储空间,提高视频的传输量,降低解码量。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种服务器的硬件结构框图;
图2是根据本发明实施例的一种视频的编码方法的流程图;
图3是本发明实施例的编码流程图;
图4是根据本发明实施例的一种视频的编码装置的结构框图;
图5是实施本发明实施例的一种电子设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
本申请实施例一所提供的方法实施例可以在服务器、计算机、影像设备、手机、平板或者类似的运算装置中执行。以运行在服务器上为例,图1是本发明实施例的一种服务器的硬件结构框图。如图1所示,服务器10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述服务器还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述服务器的结构造成限定。例如,服务器10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储服务器程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种视频的编码方法对应的服务器程序,处理器102通过运行存储在存储器104内的服务器程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至服务器10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种视频的编码方法,图2是根据本发明实施例的一种视频的编码方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取源视频的帧率值;
本实施例的帧率值(Frame rate)是用于测量显示帧数的量度,视频每秒的图像帧数,测量单位为每秒显示帧数(Frames per Second,FPS)或“赫兹”(Hz)。帧率值影响视频的画面流畅度,与画面流畅度成正比,帧率的值越大,画面越流畅;帧率的值越小,画面越有跳动感。
步骤S204,根据帧率值调整源视频的源固定码率系数CRF值,得到目标CRF值;
在恒定视觉质量(CRF)的编码模式下,CRF值与码率相关,并影响编码参数中的QP(Quant parameter,量化参数)值。码率就是数据传输时单位时间传送的数据位数,编码后的视频的每秒的比特率,码率也叫取样率,单位时间内取样率越大,精度就越高,处理出来的文件就越接近原始文件,码率影响视频的失真度,码率越高越清晰,反之则画面粗糙而多马赛克。
步骤S206,基于目标CRF值对源视频进行恒定视觉质量编码。
在本实施例的CRF模式(即恒定视觉质量编码模式)以调整后的目标CRF替换输入的CRF值作为编码参数来编码,以此来稳定输出的视觉质量。对于帧率值较大的视频,其失真相对难以被肉眼察觉,因此可以加大目标CRF值进行编码,以节省视频的码率;而对于或帧率值较小的视频,较小的失真都更容易被人察觉,通过减小目标CRF值进行编码,以减小视频的失真。
通过上述步骤,获取源视频的帧率值,然后根据帧率值调整源视频的源CRF值,得到目标CRF值,最后基于目标CRF值对源视频进行恒定视觉质量编码,通过视频的帧率来调整CRF值,以避免在恒定视觉质量模式下因帧率变化而产生的画面失真,解决了相关技术在CRF模式下的视频画面容易失真的技术问题,可以提升CRF模式的编码效果,在视频帧率较低时更好的保障视觉质量,避免失真,此外,在视频帧率较高时进一步降低码率,在保证视频质量的情况下,压缩视频编码量,进一步降低视频的存储空间,提高视频的传输量,降低解码量。
在本实施例中,根据帧率值调整源视频的源固定码率系数CRF值,得到目标CRF值,包括:
S11,确定帧率值所在的帧率区间;
本实施例包括三个帧率区间,分别是向下调整区间,维持区间,向上调整区间,分别在源CRF的基础上降低、维持、增加一定值,以得到目标CRF值。
由于当视频帧率小于一定值(第一阈值)时,人眼对失真更为敏感,因此减小源CRF,可以令失真更小,以保障在低帧率时的主观视觉质量。在另一方面,当视频帧率大于一定值(第二阈值)时,人眼对局部失真的敏感性降低,因此增加源CRF值,以降低码率,同时节省由多余码率给编码过程带来的资源消耗。而在一定范围的帧率内,人眼对失真在一个正常范围内,采用源CRF值进行编码即可保证恒定的视觉质量。
S12,若帧率值小于第一阈值,降低源视频的源CRF值,得到目标CRF值;若帧率值小于或等于第二阈值且大于第一阈值,维持源视频的源CRF值,得到目标CRF值;若帧率值大于第二阈值,增加源视频的源CRF值,得到目标CRF值,其中,第二阈值大于第一阈值。
可选的,第一阈值为20,第二阈值为30。
在本实施例的一个实施方式中,降低源视频的源CRF值,得到目标CRF值,包括:根据以下算法计算目标CRF值:目标CRF值=源CRF值-a,其中,a为所述目标CRF值的向下调整步长。可选的,a可以取值1,或者其他正的整数值或者小数值。
在本实施例的一个实施方式中,增加源视频的源CRF值,得到目标CRF值,包括:根据以下算法计算目标CRF值:目标CRF值=源CRF值+min(FPS/N,M);其中,FPS为帧率值,N为正数、M为正数,可以是大于0的正整数或者是小数,N、M分别为第一预设值和第二预设值。
在本实施例的一些实施方式中,基于目标CRF值对源视频进行恒定视觉质量编码包括:基于目标CRF值计算量化参数QP值;采用QP值逐帧对源视频进行恒定视觉质量编码。
在本实施例的CRF模式以调整后的目标CRF替换输入的CRF值作为基准QP,以此来稳定输出的视觉质量。对于运动剧烈或复杂场景,或帧率值较大的视频,其失真相对难以被肉眼察觉,因此可以加大QP进行编码,以节省视频的码率;而对于人眼敏感的平坦区域,或帧率值较小的视频,较小的失真都更容易被人察觉,故需减小QP进行编码,以减小视频的失真。
可选的,基于上述实施方式,基于目标CRF值计算量化参数QP值包括:计算源视频的基础复杂度Cplx_base和实际复杂度Cplx_frame;
通过以下公式计算基础中间结果:Qscalebase=0.85×2(CRF值-12)/6
通过以下公式计算实际中间结果:
通过以下公式计算QP值:QPframe=12+6×log2(Qscaleframe/0.85);
其中,Qscalebase为基础中间结果,Qscaleframe为实际中间结果,QPframe为QP值,b为第三预设值,可以取值0.6、0.5等。
在本实施方式中,Cplx_base可以通过源视频的分辨率计算得到,Cplx_frame通过源视频的编码代码量,运动信息,纹理信息等参数计算得到。
通过本实施例的编码方式,调整后的CRF值(目标CRF值)越大,基础的Qscale越大,每帧的Qscale也越大,或某帧的复杂度越高,该帧的Qscale也会越大,最终该帧的QP也会越大,即编码失真越大,编码码率越低。
在本实施例的一些实例中,在根据帧率值调整源视频的源CRF值之前,还包括:判断源CRF值是否大于第三阈值,以及判断源CRF值是否小于第四阈值;若源CRF值大于第三阈值,且源CRF值小于第四阈值,确定根据帧率值调整源视频的源固定码率系数CRF值。
可选的,第三阈值为17,第四阈值为34。当视频的CRF值小于一定值时,通常人眼无法察觉编码后的视频与原始视频的差别;当视频的CRF值大于一定值时,人眼会明显察觉出编码后的视频质量较差。因此只有当CRF介于这两个阈值区间内,才考虑依据帧率对输入CRF做调整,通过调整输入的源CRF可以修正人眼的视觉误差,保证视频画面的平稳。
在本实施例的另一方面,还可以根据视频类型来协同调整源视频的源CRF值,以进一步根据视频类型来保证视频编码过程中的恒定视觉质量。在获取源视频的帧率值之后,还包括:获取源视频的视频类型信息,其中,视频类型信息用于指示源视频为电脑图画CG视频或自然视频;若源视频为CG视频,通过第一幅度根据帧率值调整源视频的源CRF值;若源视频为自然视频,通过第二幅度根据帧率值调整源视频的源CRF值,其中,第一幅度小于第二幅度。
根据视频类型的不同,CRF的调整方式也不同。比如按照CG视频和自然视频分为两类,对CRF依据fps做不同方式的调整。由于CG视频由计算机生成,每帧图像本身很少有运动模糊,故在相同帧率下也比自然视频更容易察觉出失真,因此在同样fps下,对CG视频CRF的调整幅度需要更小。
在本实施例的一个具体实施场景中,提出了一种结合时域信息的CRF编码方法,依据视频的帧率来调整输入的CRF值(源CRF值),随后基于调整的CRF值,结合图像的复杂度来决定每帧QP的分配。当帧率较低时,将基础CRF值(源CRF值)降低,使最终QP更低,使编码后的视频失真更低视觉质量更好;而当帧率较高时,适当增大基础CRF值,使最终QP更高,使编码后的码率更低。图3是本发明实施例的编码流程图,如图3所示,包括如下步骤:
步骤1:判定是否需要调整CRF值;
判断编码参数中输入的CRF值,若CRF≤T1(对应上述实施例中的第四阈值)或CRF≥T2(对应上述实施例中的第三阈值),则不对CRF做调整,其中两个阈值按经验分别设为:T1=17,T2=34。当CRF≤17时,通常人眼无法察觉编码后的视频与原始视频的差别;当CRF≥34时,人眼会明显察觉出编码后的视频质量较差。因此只有当CRF介于这两个阈值区间内,才考虑依据帧率对输入CRF做调整,否则不对输入CRF做调整。
步骤2:依据fps的值调整CRF值;
当CRF的输入值介于阈值区间内,依据帧率fps的值对输入CRF做调整,包括:
(2.1)当fps≤T’1(对应上述实施例中的第一阈值)时,调整CRF为CRF=CRF-1,其中阈值按经验设为T’1=20。通常当视频帧率小于20时,人眼对失真更为敏感,因此将CRF减小1,令失真更小,以保障在低帧率时的主观视觉质量。
(2.2)当T’1<fps≤T’2(对应上述实施例中的第二阈值)时,不对输入CRF做调整,其中阈值T’1=20,T’2=30。即当输入fps在20至30区间内时,CRF无需调整。
(2.3)当T’2<fps时,调整CRF为CRF=CRF+min(fps/N,M)。其中按经验将阈值设为T’2=30,参数N=25,M=3。当视频帧率大于30时,人眼对局部失真的敏感性降低,因此可适当增加CRF,以降低码率。Crf增加的值为fps/25,并且上限为3。其中,CRF的值可以是整数或小数。
步骤3:利用调整后的CRF值计算每帧QP并进行编码。
通过步骤2,确定调整后的CRF值为实际编码时的CRF值。然后通过计算每一帧图像的复杂度,结合CRF值,计算出每帧图像编码时所使用的QP值,最后开始实际编码。由CRF计算QP的具体公式如下:
Qscalebase=0.85×2(crf-12)/6
QPframe=12+6×log2(Qscaleframe/0.85)
其中,CRF即为步骤2调整后的CRF值(当前编码的所有帧CRF值相同),Cplx_base为基础复杂度(一个和分辨率相关的经验值),Cplx_frame为每帧的实际复杂度,Qscale为中间结果,QP_frame为最终每一帧的编码QP。由公式可知,CRF值越大,基础的Qscale越大,每帧的Qscale也越大;或某帧的复杂度越高,该帧的Qscale也会越大;最终该帧的QP也会越大,即编码失真越大,编码码率越低。
可选的,可将对CRF的调整放在步骤3,即先通过图像复杂度计算出QP值,然后依据fps的值对QP进行相应调整。
采用本实施例的CRF模式下依据视频的时域信息(即帧率)调整QP值的方法,可以提升CRF模式(即恒定视觉质量编码模式)的编码效果,在视频帧率较低时更好的保障视觉质量,或在视频帧率较高时进一步降低码率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
在本实施例中还提供了一种视频的编码装置,用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的一种视频的编码装置的结构框图,如图4所示,该装置包括:第一获取模块40,第一调整模块42,编码模块44,其中,
第一获取模块40,用于获取源视频的帧率值;
第一调整模块42,用于根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值;
编码模块44,用于基于所述目标CRF值对所述源视频进行恒定视觉质量编码。
可选的,所述第一调整模块包括:确定单元,用于确定所述帧率值所在的帧率区间;调整单元,用于若所述帧率值小于第一阈值,降低所述源视频的源CRF值,得到目标CRF值;若所述帧率值小于或等于第二阈值且大于所述第一阈值,维持所述源视频的源CRF值,得到目标CRF值;若所述帧率值大于所述第二阈值,增加所述源视频的源CRF值,得到目标CRF值,其中,所述第二阈值大于所述第一阈值。
可选的,所述调整单元包括:第一计算子单元,用于根据以下算法计算所述目标CRF值:目标CRF值=源CRF值-a,其中,a为所述目标CRF值的向下调整步长。
可选的,所述调整单元包括:第二计算子单元,用于根据以下算法计算所述目标CRF值:目标CRF值=源CRF值+min(FPS/N,M);其中,所述FPS为所述帧率值,N为正数、M为正数,N、M分别为第一预设值和第二预设值。
可选的,所述编码模块包括:计算单元,用于基于所述目标CRF值计算量化参数QP值;编码单元,用于采用所述QP值逐帧对所述源视频进行恒定视觉质量编码。
可选的,所述计算单元包括:第一计算子单元,用于计算所述源视频的基础复杂度Cplx_base和实际复杂度Cplx_frame;第二计算子单元,用于通过以下公式计算基础中间结果:Qscalebase=0.85×2(CRF值-12)/6;第三计算子单元,用于通过以下公式计算实际中间结果:第四计算子单元,用于通过以下公式计算QP值:QPframe=12+6×log2(Qscaleframe/0.85);其中,Qscalebase为所述基础中间结果,Qscaleframe为所述实际中间结果,QPframe为所述QP值,b为第三预设值。
可选的,所述装置还包括:判断模块,用于在所述第一调整模块根据所述帧率值调整所述源视频的源CRF值之前,判断所述源CRF值是否大于第三阈值,以及判断所述源CRF值是否小于第四阈值;确定模块,用于若所述源CRF值大于第三阈值,且所述源CRF值小于第四阈值,确定根据所述帧率值调整所述源视频的源固定码率系数CRF值。
可选的,所述装置还包括:第二获取模块,用于在所述第一获取模块获取源视频的帧率值之后,获取所述源视频的视频类型信息,其中,所述视频类型信息用于指示所述源视频为电脑图画CG视频或自然视频;第二调整模块,用于若所述源视频为CG视频,通过第一幅度根据所述帧率值调整所述源视频的源CRF值;若所述源视频为自然视频,通过第二幅度根据所述帧率值调整所述源视频的源CRF值,其中,所述第一幅度小于所述第二幅度。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例3
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取源视频的帧率值;
S2,根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值;
S3,基于所述目标CRF值对所述源视频进行恒定视觉质量编码。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取源视频的帧率值;
S2,根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值;
S3,基于所述目标CRF值对所述源视频进行恒定视觉质量编码。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
图5是实施本发明实施例的一种电子设备的结构框图。如图5所示,包括处理器41和用于存储数据的存储器42,通过通信总线44连接,还包括与通信总线44连接的通信接口43,与其他部件或外部设备进行适配连接。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种视频的编码方法,其特征在于,包括:
获取源视频的帧率值;
根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值;
基于所述目标CRF值对所述源视频进行恒定视觉质量编码;
其中,根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值,包括:确定所述帧率值所在的帧率区间;若所述帧率值小于第一阈值,降低所述源视频的源CRF值,得到目标CRF值;若所述帧率值小于或等于第二阈值且大于所述第一阈值,维持所述源视频的源CRF值,得到目标CRF值;若所述帧率值大于所述第二阈值,增加所述源视频的源CRF值,得到目标CRF值,其中,所述第二阈值大于所述第一阈值。
2.根据权利要求1所述的方法,其特征在于,降低所述源视频的源CRF值,得到目标CRF值,包括:
根据以下算法计算所述目标CRF值:目标CRF值=源CRF值-a,其中,a为所述目标CRF值的向下调整步长。
3.根据权利要求1所述的方法,其特征在于,增加所述源视频的源CRF值,得到目标CRF值,包括:
根据以下算法计算所述目标CRF值:目标CRF值=源CRF值+min(FPS/N,M);
其中,所述FPS为所述帧率值,N为正数、M为正数,N、M分别为第一预设值和第二预设值。
4.根据权利要求1所述的方法,其特征在于,基于所述目标CRF值对所述源视频进行恒定视觉质量编码包括:
基于所述目标CRF值计算量化参数QP值;
采用所述QP值逐帧对所述源视频进行恒定视觉质量编码。
5.根据权利要求4所述的方法,其特征在于,基于所述目标CRF值计算量化参数QP值包括:
计算所述源视频的基础复杂度Cplx_base和实际复杂度Cplx_frame;
通过以下公式计算基础中间结果:Qscalebase=0.85×2(CRF值-12)/6
通过以下公式计算实际中间结果:
通过以下公式计算QP值:QPframe=12+6×log2(Qscaleframe/0.85);
其中,Qscalebase为所述基础中间结果,Qscaleframe为所述实际中间结果,QPframe为所述QP值,b为第三预设值。
6.根据权利要求1所述的方法,其特征在于,在根据所述帧率值调整所述源视频的源CRF值之前,所述方法还包括:
判断所述源CRF值是否大于第三阈值,以及判断所述源CRF值是否小于第四阈值;
若所述源CRF值大于第三阈值,且所述源CRF值小于第四阈值,确定根据所述帧率值调整所述源视频的源固定码率系数CRF值。
7.根据权利要求1所述的方法,其特征在于,在获取源视频的帧率值之后,所述方法还包括:
获取所述源视频的视频类型信息,其中,所述视频类型信息用于指示所述源视频为电脑图画CG视频或自然视频;
若所述源视频为CG视频,通过第一幅度根据所述帧率值调整所述源视频的源CRF值;若所述源视频为自然视频,通过第二幅度根据所述帧率值调整所述源视频的源CRF值,其中,所述第一幅度小于所述第二幅度。
8.一种视频的编码装置,其特征在于,包括:
第一获取模块,用于获取源视频的帧率值;
第一调整模块,用于根据所述帧率值调整所述源视频的源固定码率系数CRF值,得到目标CRF值;
编码模块,用于基于所述目标CRF值对所述源视频进行恒定视觉质量编码;
其中,所述第一调整模块包括:确定单元,用于确定所述帧率值所在的帧率区间;调整单元,用于若所述帧率值小于第一阈值,降低所述源视频的源CRF值,得到目标CRF值;若所述帧率值小于或等于第二阈值且大于所述第一阈值,维持所述源视频的源CRF值,得到目标CRF值;若所述帧率值大于所述第二阈值,增加所述源视频的源CRF值,得到目标CRF值,其中,所述第二阈值大于所述第一阈值。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7中任一项所述的方法步骤。
10.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
存储器,用于存放计算机程序;
处理器,用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述的方法步骤。
CN202011019860.1A 2020-09-24 2020-09-24 视频的编码方法及装置、存储介质、电子设备 Active CN112422967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011019860.1A CN112422967B (zh) 2020-09-24 2020-09-24 视频的编码方法及装置、存储介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011019860.1A CN112422967B (zh) 2020-09-24 2020-09-24 视频的编码方法及装置、存储介质、电子设备

Publications (2)

Publication Number Publication Date
CN112422967A CN112422967A (zh) 2021-02-26
CN112422967B true CN112422967B (zh) 2024-01-19

Family

ID=74854968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011019860.1A Active CN112422967B (zh) 2020-09-24 2020-09-24 视频的编码方法及装置、存储介质、电子设备

Country Status (1)

Country Link
CN (1) CN112422967B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102625106A (zh) * 2012-03-28 2012-08-01 上海交通大学 场景自适应的屏幕编码码率控制方法及其系统
CN103975601A (zh) * 2011-10-17 2014-08-06 谷歌公司 视频编码的速率-失真-复杂性优化
CN103999471A (zh) * 2011-10-17 2014-08-20 谷歌公司 由视频描述长度引导的视频编码的速率-失真-复杂性优化
US10313675B1 (en) * 2015-01-30 2019-06-04 Google Llc Adaptive multi-pass video encoder control
CN110401834A (zh) * 2019-08-06 2019-11-01 杭州微帧信息科技有限公司 一种基于深度学习的自适应视频编码方法
CN111083473A (zh) * 2019-12-28 2020-04-28 杭州当虹科技股份有限公司 一种基于机器学习的内容自适应视频编码方法
CN111465962A (zh) * 2018-10-04 2020-07-28 谷歌有限责任公司 用于手持式用户设备的增强现实的运动深度

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100086063A1 (en) * 2008-10-02 2010-04-08 Apple Inc. Quality metrics for coded video using just noticeable difference models

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103975601A (zh) * 2011-10-17 2014-08-06 谷歌公司 视频编码的速率-失真-复杂性优化
CN103999471A (zh) * 2011-10-17 2014-08-20 谷歌公司 由视频描述长度引导的视频编码的速率-失真-复杂性优化
CN102625106A (zh) * 2012-03-28 2012-08-01 上海交通大学 场景自适应的屏幕编码码率控制方法及其系统
US10313675B1 (en) * 2015-01-30 2019-06-04 Google Llc Adaptive multi-pass video encoder control
CN111465962A (zh) * 2018-10-04 2020-07-28 谷歌有限责任公司 用于手持式用户设备的增强现实的运动深度
CN110401834A (zh) * 2019-08-06 2019-11-01 杭州微帧信息科技有限公司 一种基于深度学习的自适应视频编码方法
CN111083473A (zh) * 2019-12-28 2020-04-28 杭州当虹科技股份有限公司 一种基于机器学习的内容自适应视频编码方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Boya Cheng, et al.A neural network approach to GOP-level rate control of x265 using Lookahead.《 2019 Picture Coding Symposium (PCS)》.2020,全文. *
面向视频会议和视频聊天的X264码率控制算法研究;冀贞贤;《中国优秀硕士学位论文全文数据库 信息科技辑》;全文 *

Also Published As

Publication number Publication date
CN112422967A (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
US11394980B2 (en) Preprocessing image data
Wang et al. VideoSet: A large-scale compressed video quality dataset based on JND measurement
EP3001885B1 (en) Region-of-interest aware video coding
US11089305B2 (en) Video frame coding method during scene change, terminal and storage medium
TWI727968B (zh) 用於視訊編碼及解碼中量化之方法及設備
CN110166781B (zh) 一种视频编码方法、装置、可读介质和电子设备
US9787987B2 (en) Adaptive pre-filtering based on video complexity and output bit rate
US20200068200A1 (en) Methods and apparatuses for encoding and decoding video based on perceptual metric classification
CN110708570B (zh) 视频的编码码率确定方法、装置、设备及存储介质
CN104270649A (zh) 影像编码装置及影像编码方法
CN111182300B (zh) 编码参数的确定方法、装置、设备及存储介质
CN108810530A (zh) 一种基于人眼视觉系统的avc码率控制方法
CN113938682A (zh) 视频编码方法、装置和电子设备
WO2013115972A1 (en) Video coding using eye tracking maps
CN112165620A (zh) 视频的编码方法及装置、存储介质、电子设备
US20150256822A1 (en) Method and Apparatus for Assessing Video Freeze Distortion Degree
CN110740316A (zh) 数据编码方法及装置
CN112422967B (zh) 视频的编码方法及装置、存储介质、电子设备
CN106454386B (zh) 一种基于jnd的视频编码的方法和装置
CN106921840B (zh) 一种即时视频中的人脸美化方法、设备及系统
CN108737826B (zh) 一种视频编码的方法和装置
CN116962613A (zh) 数据传输方法及装置、计算机设备、存储介质
CN115967806B (zh) 一种数据帧编码控制方法、系统及电子设备
CN116248895B (zh) 虚拟现实全景漫游的视频云转码方法及系统
KR101251879B1 (ko) 멀티미디어 클라우드 시스템에서 화면변화에 따른 광고영상 출력 장치 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant