CN114051144A - 视频的压缩方法、装置、计算机设备及存储介质 - Google Patents
视频的压缩方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114051144A CN114051144A CN202111322119.7A CN202111322119A CN114051144A CN 114051144 A CN114051144 A CN 114051144A CN 202111322119 A CN202111322119 A CN 202111322119A CN 114051144 A CN114051144 A CN 114051144A
- Authority
- CN
- China
- Prior art keywords
- quantization parameter
- difference
- value
- image
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本公开提出一种视频的压缩方法、装置、计算机设备及存储介质,涉及计算机技术领域。该方法包括:获取待压缩的第N帧图像对应的初始量化参数;获取与所述第N帧图像相邻的前M帧已压缩图像对应的质量评价参数;根据所述初始量化参数、及所述质量评价参数,确定所述第N帧图像对应的目标量化参数;根据所述目标量化参数,确定所述第N帧图像对应的压缩码率;基于所述压缩码率,对所述第N帧图像进行压缩。由此,通过已压缩图像帧的质量评价参数,对待压缩图像帧的初始量化参数进行调整,以确定更合理的目标量化参数,从而可以为待压缩的图像帧分配更合适的压缩码率,以使其被压缩后具有更好的保真度。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种视频的压缩方法、装置、计算机设备及存储介质。
背景技术
随着科技的不断发展,视频已成为流行的信息传递方式,但由于视频体积过大,不便于传输和存储,因此,需要对视频进行压缩,以节省传输和存储开销。通常,视频压缩量、视频压缩后的保真度等,主要受量化参数(QuantizationParameter,QP)的影响,因此,如何确定量化参数,从而为每帧图像分配合适的码率成为重点的研究方向。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
本公开第一方面实施例提出了一种视频的压缩方法,包括:
获取待压缩的第N帧图像对应的初始量化参数;
获取与所述第N帧图像相邻的前M帧已压缩图像对应的质量评价参数;
根据所述初始量化参数、及所述质量评价参数,确定所述第N帧图像对应的目标量化参数;
根据所述目标量化参数,确定所述第N帧图像对应的压缩码率;
基于所述压缩码率,对所述第N帧图像进行压缩。
本公开第二方面实施例提出了一种视频的压缩装置,包括:
第一获取模块,用于获取待压缩的第N帧图像对应的初始量化参数;
第二获取模块,用于获取与所述第N帧图像相邻的前M帧已压缩图像对应的质量评价参数;
第一确定模块,用于根据所述初始量化参数、及所述质量评价参数,确定所述第N帧图像对应的目标量化参数;
第二确定模块,用于根据所述目标量化参数,确定所述第N帧图像对应的压缩码率;
压缩模块,用于基于所述压缩码率,对所述第N帧图像进行压缩。
本公开第三方面实施例提出了一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本公开第一方面实施例提出的视频的压缩方法。
本公开第四方面实施例提出了一种非临时性计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如本公开第一方面实施例提出的视频的压缩方法。
本公开第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行本公开第一方面实施例提出的视频的压缩方法。
本公开提供的视频的压缩方法、装置、计算机设备及存储介质,存在如下有益效果:
本公开实施例中,首先获取待压缩的第N帧图像对应的初始量化参数,及与第N帧图像相邻的前M帧已压缩图像对应的质量评价参数,之后根据初始量化参数、及质量评价参数,确定第N帧图像对应的目标量化参数,再根据目标量化参数,确定第N帧图像对应的压缩码率,最后基于压缩码率,对第N帧图像进行压缩。由此,通过已压缩图像帧的质量评价参数,对待压缩图像帧的初始量化参数进行调整,以确定更合理的目标量化参数,从而可以为待压缩的图像帧分配更合适的压缩码率,以使其被压缩后具有更好的保真度。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本公开一实施例所提供的视频的压缩方法的流程示意图;
图2为本公开另一实施例所提供的视频的压缩方法的流程示意图;
图3为本公开又一实施例所提供的视频的压缩方法的流程示意图;
图4为本公开一实施例所提供的视频的压缩装置的结构示意图;
图5示出了适于用来实现本公开实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
下面参考附图描述本公开实施例的视频的压缩方法、装置、计算机设备和存储介质。
图1为本公开实施例所提供的视频的压缩方法的流程示意图。
本公开实施例以该视频的压缩方法被配置于视频的压缩装置中来举例说明,该视频的压缩装置可以应用于任一计算机设备中,以使该计算机设备可以执行视频的压缩功能。
其中,计算机设备可以为个人电脑(Personal Computer,简称PC)、云端设备、移动设备等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
如图1所示,该视频的压缩方法可以包括以下步骤:
步骤101,获取待压缩的第N帧图像对应的初始量化参数。
可以理解的是,量化参数可以反映图像空间细节压缩情况。量化参数的值越小,图像的质量越高,即图像中的大部分细节都会被保留;量化参数的值越大,图像失真加强、质量下降,即图像中的细节保留的越少。
其中,初始量化参数可以是视频编码器根据预先设置的预测算法,为待压缩的第N帧图像确定的一个初始的量化参数。初始的量化参数可以是亮度的量化参数值、色度的量化参数值等等,本公开对此不做限定。
步骤102,获取与第N帧图像相邻的前M帧已压缩图像对应的质量评价参数。
可选的,可以根据N的取值确定M的取值,其中,M的取值可以为小于N的任意数值。比如,M的取值可以为N-1,即获取的质量评价参数为从视频的第1帧图像到第N-1帧图像对应的质量评价参数;或者,M的数值也可以为100、1000等,即获取的质量评价参数为与第N帧图像相邻的前100、1000帧图像。本公开对此不做限定。
其中,质量评价参数,可以为峰值信噪比(peak signal noise ratio,PSNR)、结构相似性(Structure Similarity,SSIM)、量化参数QP等等,本公开对此不做限定。
其中,峰值信噪比可以用于评价已压缩图像质量的好坏。峰值信噪比越大表示已压缩图像的质量越好,峰值信噪比越小表示已压缩图像的质量越差。
其中,结构相似性可以表征压缩前的图像与压缩后的图像之间的相似度。结构相似度越大,已压缩图像的质量越好;反之,结构相似性越小,已压缩图像质量越差。
步骤103,根据初始量化参数、及质量评价参数,确定第N帧图像对应的目标量化参数。
其中,目标量化参数,可以为根据质量评价参数,对初始量化参数进行调整得到的量化参数。
可以理解的是,本公开中,可以利用已压缩图像对应的质量评价参数,对待压缩的第N帧图像对应的初始量化参数进行调整,使确定的第N帧图像对应的目标量化参数更合理,进而为第N帧图像分配合理的压缩码率。
步骤104,根据目标量化参数,确定第N帧图像对应的压缩码率。
其中,码率一般指比特率,即单位时间内传送的比特(bit)数,单位为bps(bit persecond)。
可以理解的是,量化参数的值越小,图像中的大部分细节都会被保留,码率越大;量化参数的值越大,图像中丢失的细节越多,码率越低。因此,量化参数与码率呈负相关关系。从而,第N帧图像对应的目标量化参数在一定程度上反映了第N帧图像对应的压缩码率。因此,可根据目标量化参数,确定第N帧图像对应的压缩码率。
可选的,可以基于码率控制算法,确定第N帧图像对应的压缩码率。即可将目标量化参数输入离散余弦变换公式中,以确定第N帧图像对应的压缩码率。
步骤105,基于压缩码率,对第N帧图像进行压缩。
可以理解的是,在确定了第N帧图像对应的压缩码率之后,视频编码器即可基于压缩码率,对第N帧图像进行压缩。
本公开实施例中,首先获取待压缩的第N帧图像对应的初始量化参数,及与第N帧图像相邻的前M帧已压缩图像对应的质量评价参数,之后根据初始量化参数、及质量评价参数,确定第N帧图像对应的目标量化参数,再根据目标量化参数,确定第N帧图像对应的压缩码率,最后基于压缩码率,对第N帧图像进行压缩。由此,通过已压缩图像帧的质量评价参数,对待压缩图像帧的初始量化参数进行调整,以确定更合理的目标量化参数,从而可以为待压缩的图像帧分配更合适的压缩码率,以使其被压缩后具有更好的保真度。
图2为本公开另一实施例所提供的视频的压缩方法的流程示意图,如图2所示,该视频的压缩方法可以包括以下步骤:
步骤201,获取待压缩的第N帧图像对应的初始量化参数。
其中,步骤201的具体实现形式,可参照本公开中其他各实施例中的详细描述,此处不再详细描述。
步骤202,确定第N帧图像非场景切换帧图像。
可选的,可以采用场景切换检测算法,对第N帧图像进行检测,以确定第N帧图像是否为切换帧图像。
可以理解的是,在第N帧图像为非场景切换帧的情况下,则可以根据已压缩图像对应的质量评价参数,对第N帧图像对应的初始量化参数进行修正。
步骤203,获取与第N帧图像相邻的前M帧已压缩图像对应的质量评价参数,其中,质量评价参数可以包括峰值信噪比参考值、结构相似性参考值及量化参数参考值。
可选的,峰值信噪比参考值,可以为前M帧已压缩图像对应的峰值信噪比的平均值、方差、标准差等等,本公开对此不做限定。
步骤204,获取第N-1帧已压缩图像对应的峰值信噪比及结构相似性。
可以理解的是,由于第N帧图像还未压缩,根据连续视频帧之间的相关性,可以认为第N-1帧图像与第N帧图像的质量基本一致,因此,本公开中,可以将第N-1帧图像对应的峰值信噪比及结构相似性作为第N帧图像对应的峰值信噪比及结构相似性。
步骤205,确定峰值信噪比与峰值信噪比参考值之间的第一差值、结构相似性与结构相似性参考值之间的第二差值、及初始量化参数与量化参数参考值之间的第三差值。
其中,第一差值、第二差值、第三差值的计算公式可以为:
diff_psnr=PSNR1-PSNR2
diff_ssim=SSIM1-SSIM2
diff_qp=QP1-QP2
其中,diff_psnr为第一差值,PSNR1为第N-1帧图像对应的峰值信噪比,PSNR2为峰值信噪比参考值;diff_ssim为第二差值,SSIM1第N-1帧图像对应的结构相似性,SSIM2为结构相似性参考值;diff_qp为第三差值,QP1为第N帧图像对应的初始量化参数,QP2为量化参数参考值。
可以理解的是,本公开中,可以将第N-1帧图像对应的峰值信噪比及结构相似性作为第N帧图像对应的峰值信噪比及结构相似性,因此,第一差值即第二差值可以反映第N帧图像与已压缩的M帧图像之间的质量差距,第三插值不仅可以反映第N帧图像与已压缩的M帧图像之间的质量差距,还可以反映第N帧图像与已压缩的M帧图像之间的大小差异。
步骤206,根据第一差值、第二差值及第三差值分别所属的范围,确定量化参数修正值。
可选的,响应于第三差值大于等于第一阈值,确定量化参数修正值为第一预设值。
可以理解的是,第三差值大于等于第一阈值的情况,可以为设置的容错情况,所以,在第三差值大于等于第一阈值的情况。可以将第一预设值设置为0,即不对初始量化参数进行修正。其中,第一阈值,可以为4、5等等,本公开对此不做限定。
或者,响应于第一差值大于第二阈值、第二差值大于第三阈值、且第三差值小于第一阈值,确定量化参数修正值为第二预设值,其中,第二预设值大于第一预设值。
或者,响应于第一差值大于第四阈值、第二差值大于第五阈值、且第三差值小于第一阈值,确定量化参数修正值为第三预设值,其中,第三预设值大于第二预设值。
或者,响应于第一差值大于第六阈值、第二差值大于第五阈值、且第三差值小于第一阈值,确定量化参数修正值为第四预设值,其中,第四预设值大于第三预设值。
其中,第二阈值小于第四阈值,第四阈值小于第六阈值,第三阈值小于第五阈值。
举例来说,若第一阈值为4、第二阈值为0.5、第三阈值为0.000005、第四阈值为1.0、第五阈值为0.00001、第六阈值为2.0,第一预设值为0、第一预设值为0.25、第三预设值为0.5、第四预设值为0.75,则在diff_psnr>0.5&&diff_ssim>0.000005&&diff_qp<4的情况下,量化参数修正值为第二预设值0.25;则在diff_psnr>1.0&&diff_ssim>0.00001&&diff_qp<4的情况下,量化参数修正值为第二预设值0.5;则在diff_psnr>2.0&&diff_ssim>0.00001&&diff_qp<4的情况下,量化参数修正值为第二预设值0.75。
需要说明的是,上述示例只是简单的举例说明,不能作为本公开中第一阈值、第二阈值、第三阈值、第四阈值、第五阈值、第六阈值、第一预设值、第二预设值、第三预设值、第四预设值等的具体限定。
步骤207,基于量化参数修正值,对初始量化参数进行修正,以确定目标量化参数。
可选的,目标量化参数可以为初始量化参数与量化修正参数的差值。
可以理解的是,根据量化参数修正值对初始量化参数进行修正,得到目标量化参数,从而更好地为第N帧图像分配合适的码率。
步骤208,根据目标量化参数,确定第N帧图像对应的压缩码率。
步骤209,基于压缩码率,对第N帧图像进行压缩。
其中,步骤208、步骤209的具体实现形式,可参照本公开中其他各实施例中的详细描述,此处不再详细赘述。
本公开实施例中,首先获取待压缩的第N帧图像对应的初始量化参数,之后在第N帧图像非场景切换帧图像的情况下,获取与第N帧图像相邻的前M帧已压缩图像对应的峰值信噪比参考值、结构相似性参考值及量化参数参考值,再根据第N-1帧图像的峰值信噪比与峰值信噪比参考值之间的第一差值、第N-1帧图像的结构相似性与结构相似性参考值之间的第二差值、及初始量化参数与量化参数参考值之间的第三差值,对初始量化参数进行修正,以确定第N帧图像对应的目标量化参数,最后根据目标量化参数,确定第N帧图像对应的压缩码率,基于压缩码率,对第N帧图像进行压缩。由此,通过已压缩图像帧的质量评价参数与第N帧图像质量之间的差异,对待压缩图像的初始量化参数进行修正,以确定更合理的目标量化参数,从而可以为待压缩的图像帧分配更合适的压缩码率,以使其被压缩后具有更好的保真度。
图3为本公开又一实施例所提供的视频的压缩方法的流程示意图,如图3所示,该视频的压缩方法可以包括以下步骤:
步骤301,获取待压缩的第N帧图像对应的初始量化参数。
其中,步骤301的具体实现形式,可参照本公开中其他各实施例中的详细描述,此处不再详细描述。
步骤302,在第N帧图像为场景切换帧图像的情况下,根据初始量化参数,确定第N帧图像对应的压缩码率。
可以理解的是,若第N帧图像为场景切换帧图像,则视频编码器在对第N帧图像进行帧类型决策时,会将第N帧图像决策为I类型帧或P类型帧,I类型帧或P类型帧中包含的信息量较大,对后续帧图像的质量影响较大,因此,一般不对场景切换帧图像的初始量化参数进行调控。即若第N帧图像为场景切换帧图像,可根据第N帧图像的初始量化参数,确定第N帧图像对应的压缩码率。
步骤303,基于压缩码率,对第N帧图像进行压缩。
其中,步骤303的具体实现形式,可参照本公开中其他各实施例中的详细描述,此处不再详细描述。
本公开实施例,首先获取待压缩的第N帧图像对应的初始量化参数,之后在第N帧图像为场景切换帧图像的情况下,根据初始量化参数,确定第N帧图像对应的压缩码率,最后基于压缩码率,对第N帧图像进行压缩。由此,通过不改变场景切换帧图像的初始量化参数,避免了场景切换帧中包含的大量细节信息丢失,从而保证了视频压缩的质量。
为了实现上述实施例,本公开还提出一种视频的压缩装置。
图4为本公开实施例所提供的视频的压缩装置的结构示意图。
如图4所示,该视频的压缩装置400可以包括:第一获取模块410、第二获取模块420、第一确定模块430、第二确定模块440、压缩模块450。
其中,第一获取模块410,用于获取待压缩的第N帧图像对应的初始量化参数;
第二获取模块420,用于获取与第N帧图像相邻的前M帧已压缩图像对应的质量评价参数;
第一确定模块430,用于根据初始量化参数、及质量评价参数,确定第N帧图像对应的目标量化参数;
第二确定模块440,用于根据目标量化参数,确定第N帧图像对应的压缩码率;
压缩模块450,用于基于压缩码率,对第N帧图像进行压缩。
可选的,质量评价参数包括峰值信噪比参考值、结构相似性参考值及量化参数参考值,第一确定模块430,包括:
第一获取单元,用于获取第N-1帧已压缩图像对应的峰值信噪比及结构相似性;
第一确定单元,用于确定峰值信噪比与峰值信噪比参考值之间的第一差值、结构相似性与结构相似性参考值之间的第二差值、及初始量化参数与量化参数参考值之间的第三差值;
第二确定单元,用于根据第一差值、第二差值及第三差值分别所属的范围,确定量化参数修正值;
修正单元,用于基于量化参数修正值,对初始量化参数进行修正,以确定目标量化参数。
可选的,第二确定单元,具体用于:
响应于第三差值大于等于第一阈值,确定量化参数修正值为第一预设值;
或者,响应于第一差值大于第二阈值、第二差值大于第三阈值、且第三差值小于第一阈值,确定量化参数修正值为第二预设值,其中,第二预设值大于第一预设值;
或者,响应于第一差值大于第四阈值、第二差值大于第五阈值、且第三差值小于第一阈值,确定量化参数修正值为第三预设值,其中,第三预设值大于第二预设值;
或者,响应于第一差值大于第六阈值、第二差值大于第五阈值、且第三差值小于第一阈值,确定量化参数修正值为第四预设值,其中,第四预设值大于第三预设值。
可选的,装置400,还包括:
第三确定模块,用于确定第N帧图像非场景切换帧图像。
可选的,装置400,还包括:
第四确定模块,用于在第N帧图像为场景切换帧图像的情况下,根据初始量化参数,确定第N帧图像对应的压缩码率。
可选的,装置400,还包括:
第五确定模块,用于根据N的取值确定M的取值。
本公开实施例中的上述各模块的功能及具体实现原理,可参照上述各方法实施例,此处不再赘述。
本公开实施例中的视频的压缩装置400,首先获取待压缩的第N帧图像对应的初始量化参数,及与第N帧图像相邻的前M帧已压缩图像对应的质量评价参数,之后根据初始量化参数、及质量评价参数,确定第N帧图像对应的目标量化参数,再根据目标量化参数,确定第N帧图像对应的压缩码率,最后基于压缩码率,对第N帧图像进行压缩。由此,通过已压缩图像帧的质量评价参数,对待压缩图像帧的初始量化参数进行调整,以确定更合理的目标量化参数,从而可以为待压缩的图像帧分配更合适的压缩码率,以使其被压缩后具有更好的保真度。
为了实现上述实施例,本公开还提出一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现如本公开前述实施例提出的视频的压缩方法。
为了实现上述实施例,本公开还提出一种非临时性计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现如本公开前述实施例提出的视频的压缩方法。
为了实现上述实施例,本公开还提出一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行如本公开前述实施例提出的视频的压缩方法。
图5示出了适于用来实现本公开实施方式的示例性计算机设备的框图。图5显示的计算机设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
本公开的技术方案,首先获取待压缩的第N帧图像对应的初始量化参数,及与第N帧图像相邻的前M帧已压缩图像对应的质量评价参数,之后根据初始量化参数、及质量评价参数,确定第N帧图像对应的目标量化参数,再根据目标量化参数,确定第N帧图像对应的压缩码率,最后基于压缩码率,对第N帧图像进行压缩。由此,通过已压缩图像帧的质量评价参数,对待压缩图像帧的初始量化参数进行调整,以确定更合理的目标量化参数,从而可以为待压缩的图像帧分配更合适的压缩码率,以使其被压缩后具有更好的保真度。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (15)
1.一种视频的压缩方法,其特征在于,包括:
获取待压缩的第N帧图像对应的初始量化参数;
获取与所述第N帧图像相邻的前M帧已压缩图像对应的质量评价参数;
根据所述初始量化参数、及所述质量评价参数,确定所述第N帧图像对应的目标量化参数;
根据所述目标量化参数,确定所述第N帧图像对应的压缩码率;
基于所述压缩码率,对所述第N帧图像进行压缩。
2.根据权利要求1所述的方法,其特征在于,所述质量评价参数包括峰值信噪比参考值、结构相似性参考值及量化参数参考值,所述根据所述初始量化参数、及所述质量评价参数,确定所述第N帧图像对应的目标量化参数,包括:
获取第N-1帧已压缩图像对应的峰值信噪比及结构相似性;
确定所述峰值信噪比与所述峰值信噪比参考值之间的第一差值、所述结构相似性与所述结构相似性参考值之间的第二差值、及所述初始量化参数与所述量化参数参考值之间的第三差值;
根据所述第一差值、所述第二差值及所述第三差值分别所属的范围,确定量化参数修正值;
基于所述量化参数修正值,对所述初始量化参数进行修正,以确定所述目标量化参数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一差值、所述第二差值及所述第三差值分别所属的范围,确定量化参数修正值,包括:
响应于所述第三差值大于等于第一阈值,确定所述量化参数修正值为第一预设值;
或者,响应于所述第一差值大于第二阈值、所述第二差值大于第三阈值、且所述第三差值小于所述第一阈值,确定所述量化参数修正值为第二预设值,其中,所述第二预设值大于所述第一预设值;
或者,响应于所述第一差值大于第四阈值、所述第二差值大于第五阈值、且所述第三差值小于所述第一阈值,确定所述量化参数修正值为第三预设值,其中,所述第三预设值大于所述第二预设值;
或者,响应于所述第一差值大于第六阈值、所述第二差值大于第五阈值、且所述第三差值小于所述第一阈值,确定所述量化参数修正值为第四预设值,其中,所述第四预设值大于所述第三预设值。
4.根据权利要求1所述的方法,其特征在于,在所述获取与所述第N帧图像相邻的前M帧已压缩图像对应的质量评价参数之前,还包括:
确定所述第N帧图像非场景切换帧图像。
5.如权利要求1所述的方法,其特征在于,在所述获取待压缩的第N帧图像对应的初始量化参数之后,还包括:
在所述第N帧图像为场景切换帧图像的情况下,根据所述初始量化参数,确定所述第N帧图像对应的压缩码率。
6.如权利要求1-5任一所述的方法,其特征在于,在所述获取与所述第N帧图像相邻的前M帧已压缩图像对应的质量评价参数之前,还包括:
根据所述N的取值确定所述M的取值。
7.一种视频的压缩装置,其特征在于,包括:
第一获取模块,用于获取待压缩的第N帧图像对应的初始量化参数;
第二获取模块,用于获取与所述第N帧图像相邻的前M帧已压缩图像对应的质量评价参数;
第一确定模块,用于根据所述初始量化参数、及所述质量评价参数,确定所述第N帧图像对应的目标量化参数;
第二确定模块,用于根据所述目标量化参数,确定所述第N帧图像对应的压缩码率;
压缩模块,用于基于所述压缩码率,对所述第N帧图像进行压缩。
8.根据权利要求7所述的装置,其特征在于,所述质量评价参数包括峰值信噪比参考值、结构相似性参考值及量化参数参考值,所述第一确定模块,包括:
第一获取单元,用于获取第N-1帧已压缩图像对应的峰值信噪比及结构相似性;
第一确定单元,用于确定所述峰值信噪比与所述峰值信噪比参考值之间的第一差值、所述结构相似性与所述结构相似性参考值之间的第二差值、及所述初始量化参数与所述量化参数参考值之间的第三差值;
第二确定单元,用于根据所述第一差值、所述第二差值及所述第三差值分别所属的范围,确定量化参数修正值;
修正单元,用于基于所述量化参数修正值,对所述初始量化参数进行修正,以确定所述目标量化参数。
9.根据权利要求8所述的装置,其特征在于,所述第二确定单元,具体用于:
响应于所述第三差值大于等于第一阈值,确定所述量化参数修正值为第一预设值;
或者,响应于所述第一差值大于第二阈值、所述第二差值大于第三阈值、且所述第三差值小于所述第一阈值,确定所述量化参数修正值为第二预设值,其中,所述第二预设值大于所述第一预设值;
或者,响应于所述第一差值大于第四阈值、所述第二差值大于第五阈值、且所述第三差值小于所述第一阈值,确定所述量化参数修正值为第三预设值,其中,所述第三预设值大于所述第二预设值;
或者,响应于所述第一差值大于第六阈值、所述第二差值大于第五阈值、且所述第三差值小于所述第一阈值,确定所述量化参数修正值为第四预设值,其中,所述第四预设值大于所述第三预设值。
10.根据权利要求7所述的装置,其特征在于,所述装置,还包括:
第三确定模块,用于确定所述第N帧图像非场景切换帧图像。
11.如权利要求7所述的装置,其特征在于,所述装置,还包括:
第四确定模块,用于在所述第N帧图像为场景切换帧图像的情况下,根据所述初始量化参数,确定所述第N帧图像对应的压缩码率。
12.如权利要求7-11任一所述的装置,其特征在于,所述装置,还包括:
第五确定模块,用于根据所述N的取值确定所述M的取值。
13.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-6中任一所述的视频的压缩方法。
14.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-6中任一所述的视频的压缩方法。
15.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现如权利要求1-6中任一项所述的视频的压缩方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322119.7A CN114051144A (zh) | 2021-11-09 | 2021-11-09 | 视频的压缩方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322119.7A CN114051144A (zh) | 2021-11-09 | 2021-11-09 | 视频的压缩方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114051144A true CN114051144A (zh) | 2022-02-15 |
Family
ID=80207976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111322119.7A Pending CN114051144A (zh) | 2021-11-09 | 2021-11-09 | 视频的压缩方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114051144A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116438794A (zh) * | 2022-05-31 | 2023-07-14 | 上海玄戒技术有限公司 | 图像压缩方法、装置、电子设备、芯片及储存介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140092204A1 (en) * | 2012-10-01 | 2014-04-03 | The University Of Ottawa | Dynamic rate control algorithm for high definition video conferencing |
US20180184092A1 (en) * | 2016-12-22 | 2018-06-28 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding video and adjusting a quantization parameter |
CN110139168A (zh) * | 2018-02-02 | 2019-08-16 | 中南大学 | 视频编码方法、装置、计算机设备及存储介质 |
US20200053356A1 (en) * | 2017-11-22 | 2020-02-13 | Tencent Technology (Shenzhen) Company Limited | Video coding method, computer device, and storage medium |
CN112203094A (zh) * | 2020-11-16 | 2021-01-08 | 北京世纪好未来教育科技有限公司 | 编码方法、装置、电子设备及存储介质 |
CN112752106A (zh) * | 2019-10-29 | 2021-05-04 | 北京新唐思创教育科技有限公司 | 视频图像帧的编码控制方法、装置及计算机存储介质 |
-
2021
- 2021-11-09 CN CN202111322119.7A patent/CN114051144A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140092204A1 (en) * | 2012-10-01 | 2014-04-03 | The University Of Ottawa | Dynamic rate control algorithm for high definition video conferencing |
US20180184092A1 (en) * | 2016-12-22 | 2018-06-28 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding video and adjusting a quantization parameter |
US20200053356A1 (en) * | 2017-11-22 | 2020-02-13 | Tencent Technology (Shenzhen) Company Limited | Video coding method, computer device, and storage medium |
CN110139168A (zh) * | 2018-02-02 | 2019-08-16 | 中南大学 | 视频编码方法、装置、计算机设备及存储介质 |
CN112752106A (zh) * | 2019-10-29 | 2021-05-04 | 北京新唐思创教育科技有限公司 | 视频图像帧的编码控制方法、装置及计算机存储介质 |
CN112203094A (zh) * | 2020-11-16 | 2021-01-08 | 北京世纪好未来教育科技有限公司 | 编码方法、装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116438794A (zh) * | 2022-05-31 | 2023-07-14 | 上海玄戒技术有限公司 | 图像压缩方法、装置、电子设备、芯片及储存介质 |
CN116438794B (zh) * | 2022-05-31 | 2023-12-12 | 上海玄戒技术有限公司 | 图像压缩方法、装置、电子设备、芯片及储存介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10957358B2 (en) | Reference and non-reference video quality evaluation | |
US10735727B2 (en) | Method of adaptive filtering for multiple reference line of intra prediction in video coding, video encoding apparatus and video decoding apparatus therewith | |
JP5164866B2 (ja) | ビデオ画像シーケンスの時間的頻度を適合させる方法および装置 | |
US20040001638A1 (en) | Rate allocation for mixed content video | |
US8605792B2 (en) | Slice coding allocation method, apparatus and circuit | |
US9307244B2 (en) | Data storage controlling device, data reading controlling device, and data storing method | |
US11044477B2 (en) | Motion adaptive encoding of video | |
US12022096B2 (en) | Human visual system adaptive video coding | |
EP3648460B1 (en) | Method and apparatus for controlling encoding resolution ratio | |
CN111131828B (zh) | 一种图像压缩方法、装置、电子设备和存储介质 | |
US20140169473A1 (en) | Texture sensitive temporal filter based on motion estimation | |
WO2018216929A1 (en) | Methods and systems for saving data while streaming video | |
CN114051144A (zh) | 视频的压缩方法、装置、计算机设备及存储介质 | |
US10841591B2 (en) | Systems and methods for deferred post-processes in video encoding | |
CN108200429B (zh) | 一种Bayer图像压缩方法及装置 | |
EP4443380A1 (en) | Video coding method and apparatus, real-time communication method and apparatus, device, and storage medium | |
US11825088B2 (en) | Adaptively encoding video frames based on complexity | |
CN110677728B (zh) | 播放视频的方法、装置、设备及存储介质 | |
CN108933945B (zh) | 一种gif图片的压缩方法、装置及存储介质 | |
CN111770330B (zh) | 图像压缩方法、装置以及电子设备 | |
JP7020068B2 (ja) | 映像符号化装置、映像符号化方法、及びプログラム | |
US9955163B2 (en) | Two pass quantization of video data | |
US20240357138A1 (en) | Human visual system adaptive video coding | |
CN108319493A (zh) | 数据处理方法、装置及机器可读存储介质 | |
CN114222126A (zh) | 视频传输方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |