CN114727107B - 一种视频处理方法、装置、设备及介质 - Google Patents
一种视频处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114727107B CN114727107B CN202110002671.1A CN202110002671A CN114727107B CN 114727107 B CN114727107 B CN 114727107B CN 202110002671 A CN202110002671 A CN 202110002671A CN 114727107 B CN114727107 B CN 114727107B
- Authority
- CN
- China
- Prior art keywords
- image frame
- sequence
- adjustment
- frame sub
- complexity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000013139 quantization Methods 0.000 claims description 72
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 abstract description 7
- 230000011218 segmentation Effects 0.000 abstract description 5
- 239000010410 layer Substances 0.000 description 30
- 230000008569 process Effects 0.000 description 13
- 230000003068 static effect Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011229 interlayer Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本公开实施例涉及一种视频处理方法、装置、设备及介质,其中该方法包括:获取待处理视频的图像帧序列;对图像帧序列进行划分,确定至少两个图像帧子序列;基于各图像帧子序列分别对应的调整策略进行调整处理,其中,一个图像帧子序列对应一个调整策略。采用上述技术方案,通过对视频的图像帧序列进行划分,可以对视频实现分段调整策略,不同区段采用不同的调整策略,改变了单一的调整方式,实现了码率和视频质量这两个指标的平衡,提高了调整的性能,并且不需要复杂的公式计算,调整策略较为简单,降低了调整复杂度,进而提高了调整效率。
Description
技术领域
本公开涉及视频处理技术领域,尤其涉及一种视频处理方法、装置、设备及介质。
背景技术
随着互联网技术的发展,人们对视频的要求越来越高,如何实现更好的视频各种性能指标的控制尤为重要。
在视频编码过程中可以通过调整量化参数(Quantization Parameter,QP)来实现视频的码率调整。目前,通常可以根据视频中图像的空域复杂度或时域复杂度调整量化参数以降低码率,但是上述方式可能会导致视频质量下降,存在视频调整性能不高以及复杂度较高的问题。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种视频处理方法、装置、设备及介质。
本公开实施例提供了一种视频处理方法,所述方法包括:
获取待处理视频的图像帧序列;
对所述图像帧序列进行划分,确定至少两个图像帧子序列;
基于各所述图像帧子序列分别对应的调整策略进行调整处理,其中,一个所述图像帧子序列对应一个调整策略。
本公开实施例还提供了一种视频处理装置,所述装置包括:
视频获取模块,用于获取待处理视频的图像帧序列;
划分模块,用于对所述图像帧序列进行划分,确定至少两个图像帧子序列;
调整模块,用于基于各所述图像帧子序列分别对应的调整策略进行调整处理,其中,一个所述图像帧子序列对应一个调整策略。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的视频处理方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的视频处理方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:本公开实施例提供的视频处理方案,获取待处理视频的图像帧序列;对图像帧序列进行划分,确定至少两个图像帧子序列;基于各图像帧子序列分别对应的调整策略进行调整处理,其中,一个图像帧子序列对应一个调整策略。采用上述技术方案,通过对视频的图像帧序列进行划分,可以对视频实现分段调整策略,不同区段采用不同的调整策略,改变了单一的调整方式,实现了码率和视频质量这两个指标的平衡,提高了视频调整的性能,并且不需要复杂的公式计算,调整策略较为简单,降低了调整复杂度,进而提高了调整效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种视频处理方法的流程示意图;
图2为本公开实施例提供的另一种视频处理方法的流程示意图;
图3为本公开实施例提供的一种视频处理的示意图;
图4为本公开实施例提供的一种视频处理装置的结构示意图;
图5为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
目前,在视频编码过程中可以通过调整量化参数(Quantization Parameter,QP)来实现视频的性能调整。通常量化参数的调整是依据图像的空域复杂度或时域复杂度,如果量化参数调整后时域复杂度和空域复杂度不同,会导致不同的码率压缩和视频质量的变化,视频质量可能会下降;量化参数的调整基于编码单元的层级实现,对于不同层级的图像帧通常会逐级参考,量化参数调整导致的缺陷会逐级传播,造成准确性较低;并且量化参数的计算过程的复杂度较高。为了解决上述问题,本公开实施例提供了一种视频处理方法,下面结合具体的实施例对该方法进行介绍。
图1为本公开实施例提供的一种视频处理方法的流程示意图,该方法可以由视频处理装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法包括:
步骤101、获取待处理视频的图像帧序列。
其中,待处理视频是指需要进行调整处理的视频,具体视频的来源和格式等不作限定。图像帧为组成视频的最小单位,图像帧序列是通过对待处理视频进行截取得到的多个图像帧的集合。
本公开实施例中,视频处理装置可以获取预先对待处理视频处理得到的图像帧序列,也可以先获取待处理视频,对待处理视频进行处理,得到其图像帧序列。
步骤102、对图像帧序列进行划分,确定至少两个图像帧子序列。
其中,图像帧子序列是指通过对待处理视频的图像帧序列进行划分得到的子序列,图像帧子序列的数量为至少两个,每个图像帧子序列中包括多个图像帧,具体数量不限。
本公开实施例中,对图像帧序列进行划分,确定至少两个图像帧子序列,可以包括:确定图像帧序列中每个图像帧的复杂度比值,其中,复杂度比值为时域复杂度和空域复杂度的比值;基于各图像帧的复杂度比值与复杂度比值阈值,对图像帧序列进行划分,确定至少两个图像帧子序列。
其中,时域复杂度是指图像帧在时间上的复杂程度,空域复杂度是指图像帧在空间上的复杂程度,复杂度比值为时域复杂度和空域复杂度的比值。复杂度比值阈值可以为基于多种类型的图像帧序列进行统计计算得到的阈值,复杂度比值阈值的确定需要最大程度的区分出不同的序列,例如区分出偏动态和偏静态的序列,其中对于偏静态的序列各个图像帧之间变化比较大,而对于偏静态的序列各个图像帧之间变化比较小。为了更加精确的区分不同类型的图像帧序列,复杂度比值阈值可能有多个,本公开实施例中采用了两个阈值为例进行说明。复杂度比值阈值可以包括第一比值阈值和第二比值阈值,其中,第一比值阈值小于第二比值阈值,通过上述第一比值阈值和第二比值阈值可以将视频帧序列划分为偏动态序列和偏静态序列。
可选的,基于各图像帧的复杂度比值与复杂度比值阈值,对图像帧序列进行划分,确定至少两个图像帧子序列,包括:将各图像帧的复杂度比值与第一比值阈值、第二比值阈值进行比对;将复杂度比值大于第二比值阈值的图像帧组成的序列,确定为第一图像帧子序列;将复杂度比值大于第一比值阈值并且小于第二比值阈值的图像帧组成的序列,确定为第二图像帧子序列。
将图像帧序列中每个图像帧的复杂度比值与上述第一比值阈值、第二比值阈值进行对比,如果图像帧的复杂度比值大于第二比值阈值,则该图像帧属于第一图像帧子序列;如果图像帧的复杂度比值小于第二比值阈值并且大于第一比值阈值,则该图像帧属于第二图像帧子序列,上述第一图像帧子序列属于偏动态序列,第二图像帧子序列属于偏静态序列。
可以理解的是,也可以将图像帧的复杂度小于第一比值阈值的图像帧组成的序列确定为第三图像帧子序列。由于上述第三图像帧子序列属于偏静态序列,近似于各个图像帧之间没有变化,本公开实施例中对该第三图像帧子序列中的图像帧不进行调整处理。
步骤103、基于各图像帧子序列分别对应的调整策略进行调整处理,其中,一个图像帧子序列对应一个调整策略。
其中,调整策略可以为编码过程中对视频性能的具体调整方式,本公开实施例中调整策略可以包括扩大层级间的量化参数总差值和缩小层级间的量化参数总差值两种,一个图像帧子序列对应一个调整策略。其中,层级间的量化参数总差值为各图像帧所在最低编码层级和最高编码层级之间量化参数的差值。由于视频的编码模式可以为层级模式,具体可以划分多个编码层级分层编码,每个编码层级包括多个图像帧,例如一个编码层级可以包括4个图像帧。层级间的量化参数差值是指两个编码层级之间量化参数的差值,层级间的量化参数总差值是指图像帧子序列中最低编码层级和最高编码层级之间量化参数的差值。
量化参数是指能够反映图像空间细节压缩情况的参数,量化参数较小时,大部分的细节都会被保留,量化参数较大时,一些细节丢失。量化参数与量化步长对应,量化参数越大,量化步长越大,量化误差越大。
本公开实施例中,基于各图像帧子序列分别对应的调整策略进行调整处理,可以包括:通过缩小层级间的量化参数总差值的调整策略对第一图像帧子序列进行调整处理。可选的,基于各图像帧子序列分别对应的调整策略进行调整处理,可以包括:通过扩大层级间的量化参数总差值的调整策略对第二图像帧子序列进行调整处理。
本公开实施例中通过调整量化参数,目的是要平衡码率和视频质量,避免现有方案中降低码率时视频质量下降。本公开实施例中可以采用峰值信噪比(Peak Signal toNoise Ratio,PSNR)来衡量视频质量。对于空域复杂度比较高的序列,人眼对于其变换不太敏感,因此扩大层级间的量化参数总差值时,在码率降低的同时峰值信噪比降低的量在可接受的范围内容,而缩小层级间的量化参数总差值时,峰值信噪比的增益低于码率的损失,不能达到目的。而对于时域复杂度比较高的序列,人眼对其变化比较敏感,扩大层级间的量化参数总差值时,会导致峰值信噪比降低的量超过码率降低的量,不能达到目的,而缩小层级间的量化参数总差值,峰值信噪比的增益高于码率的损失,更能达到目的。由此,对于不同类型的图像帧子序列不能采用同一种调整量化参数的策略。
而由于第一图像帧子序列属于偏动态序列,也即时域复杂度远大于空域复杂度,此时可以根据时域复杂度调整层级间的量化参数总差值,因此对应的调整策略可以为缩小层级间的量化参数总差值。而第二图像帧子序列属于偏静态序列,也即空域复杂度远大于时域复杂度,此时可以根据空域复杂度调整层级间的量化参数总差值,因此对应的调整策略可以为扩大层级间的量化参数总差值。本公开实施例中针对偏静态序列和偏动态序列采用了相反的调整策略。
分别采用对应的调整策略对各图像帧子序列进行调整处理,具体的调整过程可以为:对于第二图像帧子序列,在各编码层级包括的图像帧的原始量化参数的基础上,第一编码层级的图像帧的量化参数可以减去对应的变化值,第二编码层级至第n编码层级的图像帧的量化参数分别与不同的变化值相加;对于第一图像帧子序列,在各编码层级包括的图像帧的原始量化参数的基础上,第一编码层级的图像帧的量化参数可以加上对应的变化值,第二编码层级至第n编码层级的图像帧的量化参数分别减去不同的变化值。上述第一编码层级可以采用layer_0表示,第n编码层级可以采用layer_n表示,n表示编码层级的总数量。对于不同图像帧子序列中的图像帧,均根据图像帧所在的编码层级对量化参数进行调整。
本公开实施例中,视频处理方法还可以包括:确定调整处理后的各图像帧子序列中图像帧的编码性能参数;如果编码性能参数不满足预设条件,则返回继续执行调整处理,直到编码性能参数满足预设条件,其中,预设条件为编码性能参数为负。
编码性能参数可以为评价视频编码算法性能的一种参数,本公开实施例中该编码性能参数可以为BD-rate,表示新算法编码的视频相对于原来的算法在码率和峰值信噪比的变化情况。也即编码性能参数是同时平衡码率和峰值信噪比的指标,其值为负表示编码性能提升,其值为正表示编码性能降低。本公开实施例中对视频调整处理的目的在于平衡码率和视频质量,也即编码性能更优,因此上述预设条件为编码性能参数为负。
基于各图像帧子序列分别对应的调整策略进行调整处理之后,确定各图像帧子序列中各图像帧的编码性能参数,编码性能参数为负且绝对值越大,则说明当前的视频编码性能更优,结束调整;如果编码性能参数为正,则返回继续基于对应的调整策略进行调整处理,具体可以通过修改上述不同编码层级的量化参数对应的变化值,以缩小或扩大层级间的量化参数总差值,直到编码性能参数为负。可以理解的是,由于编码性能参数为负并且绝对值越大时,性能更优,可以通过多次调整处理,将编码性能参数调整至最优。
上述方案中,基于同时平衡码率和视频质量的编码性能参数可以对调整处理后的序列进行判断,当不满足条件时可以返回继续进行调整处理,在调整码率的同时保证了视频质量;并且不同编码层级的量化参数对应的加或减的变化值可以根据多次调整后的编码性能参数进行调整,直到达到最优,进一步提高了调整的性能。
本公开实施例提供的视频处理方案,获取待处理视频的图像帧序列;对图像帧序列进行划分,确定至少两个图像帧子序列;基于各图像帧子序列分别对应的调整策略进行调整处理,其中,一个图像帧子序列对应一个调整策略。采用上述技术方案,通过对视频的图像帧序列进行划分,可以对视频实现分段调整策略,不同区段采用不同的调整策略,改变了单一的调整方式,实现了码率和视频质量这两个指标的平衡,提高了调整的性能,并且不需要复杂的公式计算,调整策略较为简单,降低了调整复杂度,进而提高了调整效率。
图2为本公开实施例提供的另一种视频处理方法的流程示意图,本实施例在上述实施例的基础上,进一步优化了上述视频处理方法。
如图2所示,该方法包括:
步骤201、获取待处理视频的图像帧序列。
步骤202、确定图像帧序列中每个图像帧的复杂度比值。
其中,复杂度比值为时域复杂度和空域复杂度的比值
步骤203、将各图像帧的复杂度比值与第一比值阈值、第二比值阈值进行比对。
步骤203之后,可以执行步骤204-步骤205,和/或,步骤206-步骤207。
步骤204、将复杂度比值大于第二比值阈值的图像帧组成的序列,确定为第一图像帧子序列。
步骤205、通过缩小层级间的量化参数总差值的调整策略对第一图像帧子序列进行调整处理。
其中,层级间的量化参数总差值为各图像帧所在最低编码层级和最高编码层级之间量化参数的差值。
步骤205之后,可以执行步骤208。
步骤206、将复杂度比值大于第一比值阈值并且小于第二比值阈值的图像帧组成的序列,确定为第二图像帧子序列。
步骤207、通过扩大层级间的量化参数总差值的调整策略对第二图像帧子序列进行调整处理。
步骤207之后,可以执行步骤208。
步骤208、确定调整处理后的各图像帧子序列中图像帧的编码性能参数。
步骤209、判断编码性能参数是否满足预设条件,若是,则执行步骤210;否则,返回执行步骤205和/或步骤207。
其中,所述预设条件为所述编码性能参数为负。如果编码性能参数不满足预设条件,则返回步骤205和/或步骤207,继续执行调整处理,直到编码性能参数满足预设条件。
步骤210、结束。
如果各图像帧子序列中图像帧的编码性能参数均满足预设条件,则调整结束。
图3为本公开实施例提供的一种视频处理的示意图,具体过程可以包括:步骤21、通过实验确定不同类型视频的阈值complexity_max和complexity_min。其中,complexity_min为上述复杂度比值阈值中的第一比值阈值,complexity_max为上述复杂度比值阈值中的第二比值阈值。步骤22、计算被测试序列的时域与空域复杂度比值η。其中,η表示时域复杂度与空域复杂度的比值,也即上述复杂度比值。被测试序列是指待处理视频的图像帧序列。步骤23、η>complexity_min&&η<complexity_max?判断η是否大于complexity_min并且小于complexity_max,若是,则执行步骤25;否则执行步骤24。步骤24、η>complexity_max?判断η是否大于complexity_max,若是,则执行步骤26;否则,执行执行步骤27。步骤25、策略一。采用策略一的调整策略,具体可以为扩大层级间的量化参数总差值。步骤26、策略二。采用策略二的调整策略,具体可以为缩小层级间的量化参数总差值。步骤27、策略三。当η<complexity_min时,由于属于静态序列,近似于各个图像帧之间没有变化,本公开实施例中策略三为不进行调整处理。
本公开实施例中,根据视频的各图像帧的视时域复杂度与空域复杂度的比值,给定了不同的量化参数的调整策略;并且可以基于编码层级对量化参数进行调整,对于不同编码层级的量化参数可以向不同的方式进行调整;量化参数的调整策略较为简单,避免了复杂的计算过程,提高了调整效率。
本公开实施例提供的视频处理方案,获取待处理视频的图像帧序列,确定图像帧序列中每个图像帧的复杂度比值,将各图像帧的复杂度比值与第一比值阈值、第二比值阈值进行比对;将复杂度比值大于第二比值阈值的图像帧组成的序列,确定为第一图像帧子序列,通过缩小层级间的量化参数总差值的调整策略对第一图像帧子序列进行调整处理;和/或,将复杂度比值大于第一比值阈值并且小于第二比值阈值的图像帧组成的序列,确定为第二图像帧子序列,通过扩大层级间的量化参数总差值的调整策略对第二图像帧子序列进行调整处理;确定调整处理后的各图像帧子序列中图像帧的编码性能参数,如果编码性能参数不满足预设条件,则返回继续执行调整处理,直到编码性能参数满足预设条件。采用上述技术方案,通过对视频的图像帧序列进行划分,可以对视频实现分段调整策略,不同区段采用不同的调整策略,改变了单一的调整方式,实现了码率和视频质量这两个指标的平衡,提高了调整的性能,并且不需要复杂的公式计算,调整策略较为简单,降低了调整复杂度,进而提高了调整效率。
图4为本公开实施例提供的一种视频处理装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图4所示,该装置包括:
视频获取模块301,用于获取待处理视频的图像帧序列;
划分模块302,用于对所述图像帧序列进行划分,确定至少两个图像帧子序列;
调整模块303,用于基于各所述图像帧子序列分别对应的调整策略进行调整处理,其中,一个所述图像帧子序列对应一个调整策略。
本公开实施例提供的视频处理方案,获取待处理视频的图像帧序列;对图像帧序列进行划分,确定至少两个图像帧子序列;基于各图像帧子序列分别对应的调整策略进行调整处理,其中,一个图像帧子序列对应一个调整策略。采用上述技术方案,通过对视频的图像帧序列进行划分,可以对视频实现分段调整策略,不同区段采用不同的调整策略,改变了单一的调整方式,实现了码率和视频质量这两个指标的平衡,提高了调整的性能,并且不需要复杂的公式计算,调整策略较为简单,降低了调整复杂度,进而提高了调整效率。
可选的,所述划分模块302具体用于:
确定所述图像帧序列中每个图像帧的复杂度比值,其中,所述复杂度比值为时域复杂度和空域复杂度的比值;
基于各所述图像帧的复杂度比值与复杂度比值阈值,对所述图像帧序列进行划分,确定至少两个图像帧子序列。
可选的,所述复杂度比值阈值包括第一比值阈值和第二比值阈值,其中,所述第一比值阈值小于所述第二比值阈值。
可选的,所述划分模块302具体用于:
将各所述图像帧的复杂度比值与所述第一比值阈值、所述第二比值阈值进行比对;
将复杂度比值大于所述第二比值阈值的图像帧组成的序列,确定为第一图像帧子序列;
将复杂度比值大于所述第一比值阈值并且小于所述第二比值阈值的图像帧组成的序列,确定为第二图像帧子序列。
可选的,所述调整模块303具体用于:
通过缩小层级间的量化参数总差值的调整策略对所述第一图像帧子序列进行调整处理。
可选的,所述调整模块303具体用于:
通过扩大层级间的量化参数总差值的调整策略对所述第二图像帧子序列进行调整处理。
可选的,所述层级间的量化参数总差值为各图像帧所在最低编码层级和最高编码层级之间量化参数的差值。
可选的,所述装置还包括编码性能模块,具体用于:
确定调整处理后的各所述图像帧子序列中图像帧的编码性能参数;
如果所述编码性能参数不满足预设条件,则返回继续执行调整处理,直到所述编码性能参数满足所述预设条件,其中,所述预设条件为所述编码性能参数为负。
本公开实施例所提供的视频处理装置可执行本公开任意实施例所提供的视频处理方法,具备执行方法相应的功能模块和有益效果。
图5为本公开实施例提供的一种电子设备的结构示意图。如图5所示,电子设备400包括一个或多个处理器401和存储器402。
处理器401可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备400中的其他组件以执行期望的功能。
存储器402可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器401可以运行所述程序指令,以实现上文所述的本公开的实施例的视频处理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备400还可以包括:输入装置403和输出装置404,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
此外,该输入装置403还可以包括例如键盘、鼠标等等。
该输出装置404可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置404可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备400中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备400还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本公开实施例所提供的视频处理方法。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本公开实施例所提供的视频处理方法。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种视频处理方法,其特征在于,包括:
获取待处理视频的图像帧序列;
对所述图像帧序列进行划分,确定至少两个图像帧子序列;
基于各所述图像帧子序列分别对应的调整策略进行调整处理,其中,一个所述图像帧子序列对应一个调整策略;
所述至少两个图像帧子序列包括第一图像帧子序列和第二图像帧子序列;
基于各所述图像帧子序列分别对应的调整策略进行调整处理,包括:
通过缩小层级间的量化参数总差值的调整策略对所述第一图像帧子序列进行调整处理;
通过扩大层级间的量化参数总差值的调整策略对所述第二图像帧子序列进行调整处理;
所述层级间的量化参数总差值为各图像帧所在最低编码层级和最高编码层级之间量化参数的差值。
2.根据权利要求1所述的方法,其特征在于,对所述图像帧序列进行划分,确定至少两个图像帧子序列,包括:
确定所述图像帧序列中每个图像帧的复杂度比值,其中,所述复杂度比值为时域复杂度和空域复杂度的比值;
基于各所述图像帧的复杂度比值与复杂度比值阈值,对所述图像帧序列进行划分,确定至少两个图像帧子序列。
3.根据权利要求2所述的方法,其特征在于,所述复杂度比值阈值包括第一比值阈值和第二比值阈值,其中,所述第一比值阈值小于所述第二比值阈值。
4.根据权利要求3所述的方法,其特征在于,基于各所述图像帧的复杂度比值与复杂度比值阈值,对所述图像帧序列进行划分,确定至少两个图像帧子序列,包括:
将各所述图像帧的复杂度比值与所述第一比值阈值、所述第二比值阈值进行比对;
将复杂度比值大于所述第二比值阈值的图像帧组成的序列,确定为第一图像帧子序列;
将复杂度比值大于所述第一比值阈值并且小于所述第二比值阈值的图像帧组成的序列,确定为第二图像帧子序列。
5.根据权利要求1所述的方法,其特征在于,还包括:
确定调整处理后的各所述图像帧子序列的编码性能参数;
如果所述编码性能参数不满足预设条件,则返回继续执行调整处理,直到所述编码性能参数满足所述预设条件,其中,所述预设条件为所述编码性能参数为负。
6.一种视频处理装置,其特征在于,包括:
视频获取模块,用于获取待处理视频的图像帧序列;
划分模块,用于对所述图像帧序列进行划分,确定至少两个图像帧子序列;
调整模块,用于基于各所述图像帧子序列分别对应的调整策略进行调整处理,其中,一个所述图像帧子序列对应一个调整策略;
所述至少两个图像帧子序列包括第一图像帧子序列和第二图像帧子序列;
调整模块具体用于:
通过缩小层级间的量化参数总差值的调整策略对所述第一图像帧子序列进行调整处理;
通过扩大层级间的量化参数总差值的调整策略对所述第二图像帧子序列进行调整处理;
所述层级间的量化参数总差值为各图像帧所在最低编码层级和最高编码层级之间量化参数的差值。
7.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-5中任一所述的视频处理方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-5中任一所述的视频处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110002671.1A CN114727107B (zh) | 2021-01-04 | 2021-01-04 | 一种视频处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110002671.1A CN114727107B (zh) | 2021-01-04 | 2021-01-04 | 一种视频处理方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114727107A CN114727107A (zh) | 2022-07-08 |
CN114727107B true CN114727107B (zh) | 2024-01-23 |
Family
ID=82234472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110002671.1A Active CN114727107B (zh) | 2021-01-04 | 2021-01-04 | 一种视频处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114727107B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103974060A (zh) * | 2013-01-31 | 2014-08-06 | 华为技术有限公司 | 视频质量调整方法和装置 |
CN104205836A (zh) * | 2012-04-03 | 2014-12-10 | 高通股份有限公司 | 色度切片层级量化参数偏移及解块 |
CN105578185A (zh) * | 2015-12-14 | 2016-05-11 | 华中科技大学 | 一种网络视频流的无参考图像质量在线估计方法 |
CN107635115A (zh) * | 2017-10-09 | 2018-01-26 | 深圳市天视通电子科技有限公司 | 一种实现超低码率的方法、存储介质及电子设备 |
CN108989801A (zh) * | 2018-07-27 | 2018-12-11 | 福州大学至诚学院 | 一种基于时空特性的自适应模式选择快速方法 |
CN109905711A (zh) * | 2019-02-28 | 2019-06-18 | 深圳英飞拓智能技术有限公司 | 一种图像的处理方法、系统及终端设备 |
CN110740318A (zh) * | 2018-07-20 | 2020-01-31 | 英特尔公司 | 用于视频处理和视频译码的自动自适应长期参考帧选择 |
CN112165620A (zh) * | 2020-09-24 | 2021-01-01 | 北京金山云网络技术有限公司 | 视频的编码方法及装置、存储介质、电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8331438B2 (en) * | 2007-06-05 | 2012-12-11 | Microsoft Corporation | Adaptive selection of picture-level quantization parameters for predicted video pictures |
GB2559783A (en) * | 2017-02-17 | 2018-08-22 | British Broadcasting Corp | Image or video encoding and decoding |
-
2021
- 2021-01-04 CN CN202110002671.1A patent/CN114727107B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104205836A (zh) * | 2012-04-03 | 2014-12-10 | 高通股份有限公司 | 色度切片层级量化参数偏移及解块 |
CN103974060A (zh) * | 2013-01-31 | 2014-08-06 | 华为技术有限公司 | 视频质量调整方法和装置 |
CN105578185A (zh) * | 2015-12-14 | 2016-05-11 | 华中科技大学 | 一种网络视频流的无参考图像质量在线估计方法 |
CN107635115A (zh) * | 2017-10-09 | 2018-01-26 | 深圳市天视通电子科技有限公司 | 一种实现超低码率的方法、存储介质及电子设备 |
CN110740318A (zh) * | 2018-07-20 | 2020-01-31 | 英特尔公司 | 用于视频处理和视频译码的自动自适应长期参考帧选择 |
CN108989801A (zh) * | 2018-07-27 | 2018-12-11 | 福州大学至诚学院 | 一种基于时空特性的自适应模式选择快速方法 |
CN109905711A (zh) * | 2019-02-28 | 2019-06-18 | 深圳英飞拓智能技术有限公司 | 一种图像的处理方法、系统及终端设备 |
CN112165620A (zh) * | 2020-09-24 | 2021-01-01 | 北京金山云网络技术有限公司 | 视频的编码方法及装置、存储介质、电子设备 |
Non-Patent Citations (2)
Title |
---|
Anhong Wang,et al.A Two-Description Distributed Video Coding.《2009 Fifth International Conference on Information Assurance and Security》.2009,全文. * |
高效率视频编码码率控制算法研究;许鹤;《中国优秀硕士学位论文全文数据库 信息科技辑》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114727107A (zh) | 2022-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hasan et al. | Improved BM3D image denoising using SSIM-optimized Wiener filter | |
Hou et al. | Hue preserving‐based approach for underwater colour image enhancement | |
EP3488388B1 (en) | Video processing method and apparatus | |
CN109616139B (zh) | 语音信号噪声功率谱密度估计方法和装置 | |
CN110717522A (zh) | 图像分类网络的对抗防御方法及相关装置 | |
JP4219552B2 (ja) | 画像及び信号処理のための装置及び方法 | |
JP4988715B2 (ja) | ビデオ符号化におけるノイズフィルタリング方法及び装置 | |
US8655647B2 (en) | N-gram selection for practical-sized language models | |
EP1512297A1 (en) | A method and system for estimating sharpness metrics based on local edge statistical distribution | |
CN110363297A (zh) | 神经网络训练及图像处理方法、装置、设备和介质 | |
CN111179201B (zh) | 一种视频去噪方法和电子设备 | |
US10911785B2 (en) | Intelligent compression of grainy video content | |
CN111261148A (zh) | 语音模型的训练方法、语音增强处理方法及相关设备 | |
US20090213933A1 (en) | Texture sensitive temporal filter based on motion estimation | |
CN113270107A (zh) | 音频信号中噪声响度的获取方法、装置和电子设备 | |
CN110689496B (zh) | 降噪模型的确定方法、装置、电子设备和计算机存储介质 | |
CN117956265A (zh) | 用于激光光束近场检测的相机智能控制方法 | |
RU2407056C2 (ru) | Способ и устройство обработки изображения, программа обработки изображения и запоминающий носитель, который хранит программу | |
CN114727107B (zh) | 一种视频处理方法、装置、设备及介质 | |
CN111652821B (zh) | 基于梯度信息的微光视频图像降噪处理方法、装置和设备 | |
CN117557459A (zh) | 图像的盲复原方法及装置、存储介质和电子设备 | |
CN110913221A (zh) | 一种视频码率预测方法及装置 | |
Hernández-Gutiérrez et al. | Improved preclassification non local-means (IPNLM) for filtering of grayscale images degraded with additive white Gaussian noise | |
CN117689571A (zh) | 基于视频编码的降噪方法及装置 | |
CN114841325B (zh) | 神经网络模型的数据处理方法、介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |