CN114298199A - 转码参数模型的训练方法、视频转码方法及装置 - Google Patents
转码参数模型的训练方法、视频转码方法及装置 Download PDFInfo
- Publication number
- CN114298199A CN114298199A CN202111588656.6A CN202111588656A CN114298199A CN 114298199 A CN114298199 A CN 114298199A CN 202111588656 A CN202111588656 A CN 202111588656A CN 114298199 A CN114298199 A CN 114298199A
- Authority
- CN
- China
- Prior art keywords
- video
- transcoding
- parameter
- training
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 285
- 238000000034 method Methods 0.000 title claims abstract description 115
- 238000012545 processing Methods 0.000 claims abstract description 195
- 230000000875 corresponding effect Effects 0.000 claims abstract description 113
- 230000002596 correlated effect Effects 0.000 claims abstract description 3
- 230000008569 process Effects 0.000 claims description 58
- 230000000694 effects Effects 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 description 25
- 238000005457 optimization Methods 0.000 description 14
- 238000012360 testing method Methods 0.000 description 13
- 238000013500 data storage Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本公开提供了一种转码参数模型的训练方法、视频转码方法及装置。所述训练方法包括:获取视频转码处理中所使用的至少一个可调参数中的每个可调参数;获取训练样本集,所述训练样本集包括:每个训练视频的多个视频特征的特征值;基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征;基于所述关联视频特征,训练各个转码参数模型,其中,各个转码参数模型是与视频转码处理中所使用的每个可调参数相对应的转码参数模型;其中,每个转码参数模型的输入为:与该转码参数模型对应的可调参数的关联视频特征的特征值;每个转码参数模型的输出为:针对视频进行视频转码处理时与该转码参数模型对应的可调参数的预测最优值。
Description
技术领域
本公开总体说来涉及电子技术领域,更具体地讲,涉及一种转码参数模型的训练方法、视频转码方法及装置。
背景技术
目前随着通信和互联网技术的进步,特别是智能手机的普及以及4G、5G移动通信技术的成熟与发展,视频聊天、视频游戏等多样化的视频娱乐方式层出不穷,普通用户对视频的消费需求也在不断增长,这使得大部分互联网流量将由视频创造。然而,海量的视频数据对视频的传输、存储和其他处理带来了巨大的挑战。视频编解码等视频处理技术也就变得至关重要。
对于某个视频压缩应用场景,一般会针对一个编码器给定一套前处理方案以及一套固定的编码参数,对一些视频会达到较好的压缩效果,但对其他一些视频并不一定能达到理想的压缩效果。
发明内容
本公开的示例性实施例在于提供一种转码参数模型的训练方法、视频转码方法及装置,能够根据每个视频的特征动态地调整对视频进行转码处理所使用参数的参数值。
根据本公开实施例的第一方面,提供一种转码参数模型的训练方法,包括:获取视频转码处理中所使用的至少一个可调参数中的每个可调参数;获取训练样本集,其中,所述训练样本集包括:每个训练视频的多个视频特征的特征值;基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征;基于所述关联视频特征,训练各个转码参数模型,其中,各个转码参数模型是与视频转码处理中所使用的每个可调参数相对应的转码参数模型;其中,每个转码参数模型的输入为:与该转码参数模型对应的可调参数的关联视频特征的特征值;每个转码参数模型的输出为:针对视频进行视频转码处理时与该转码参数模型对应的可调参数的预测最优值。
可选地,所述训练样本集还包括:针对每个训练视频进行视频转码处理时每个可调参数的实际最优值;其中,基于所述关联视频特征,训练各个转码参数模型的步骤包括:针对每个转码参数模型,将每个训练视频的与该转码参数模型对应的关联视频特征的特征值输入该转码参数模型,得到针对该训练视频的与该转码参数模型对应的可调参数的预测最优值;基于针对该训练视频的与该转码参数模型对应的可调参数的实际最优值和预测最优值,确定该转码参数模型的损失函数;通过根据所述损失函数调整该转码参数模型的参数,对该转码参数模型进行训练。
可选地,基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征的步骤包括:针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。
可选地,获取训练样本集的步骤包括:获取每个可调参数对应的至少一个候选值;基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合,其中,每个参数值组合包括:每个可调参数对应的一个候选值;针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果;基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。
可选地,基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合的步骤包括:确定每个训练视频的每个转码处理结果对应的码率和转码质量评分;从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合,或者,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合;针对确定的转码处理结果组合中的每个转码处理结果,将该转码处理结果所对应的参数值组合中的各个候选值,确定为该转码处理结果所对应的训练视频的各个可调参数的实际最优值;其中,每个转码处理结果组合包括:各个训练视频各自的一个转码处理结果;其中,转码处理结果组合的总转码质量评分为该转码处理结果组合中的各个转码处理结果对应的转码质量评分之和;转码处理结果组合的总码率为该转码处理结果组合中的各个转码处理结果对应的码率之和。
可选地,从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合的步骤包括:使用寻优算法,从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合;其中,从所有可能的转码处理结果组合中,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合的步骤包括:使用寻优算法,从所有可能的转码处理结果组合中,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合;其中,所述寻优算法包括以下项中的至少一项:背包算法、动态规划算法、贪心算法。
可选地,视频转码处理中所使用的至少一个可调参数包括:视频编码前处理中所使用的至少一个参数和/或编码处理中所使用的至少一个参数。
可选地,所述多个视频特征包括:至少一个用于描述视频品质的特征和/或至少一个用于描述视频复杂度的特征。
根据本公开实施例的第二方面,提供一种视频转码方法,包括:获取待转码处理的目标视频;针对视频转码处理中所使用的至少一个可调参数中的每个可调参数,确定目标视频的针对该可调参数的关联视频特征的特征值;将目标视频的针对每个可调参数的关联视频特征的特征值,输入与该可调参数对应的转码参数模型,得到针对目标视频的该可调参数的预测最优值;使用针对目标视频的各个可调参数的预测最优值,对目标视频进行转码处理。
可选地,每个转码参数模型基于训练样本集训练得到;其中,所述训练样本集包括:每个训练视频的多个视频特征的特征值和针对每个训练视频进行视频转码处理时每个可调参数的实际最优值。
可选地,每个可调参数的关联视频特征基于所述训练样本集通过下述方式确定:针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。
可选地,针对每个训练视频进行视频转码处理时每个可调参数的实际最优值通过下述方式得到:获取每个可调参数对应的至少一个候选值;基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合,其中,每个参数值组合包括:每个可调参数对应的一个候选值;针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果;基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。
可选地,视频转码处理中所使用的至少一个可调参数包括:视频编码前处理中所使用的至少一个参数和/或编码处理中所使用的至少一个参数。
可选地,所述关联视频特征包括:至少一个用于描述视频品质的特征和/或至少一个用于描述视频复杂度的特征。
根据本公开实施例的第三方面,提供一种转码参数模型的训练装置,包括:可调参数获取单元,被配置为获取视频转码处理中所使用的至少一个可调参数中的每个可调参数;训练样本集获取单元,被配置为获取训练样本集,其中,所述训练样本集包括:每个训练视频的多个视频特征的特征值;关联特征确定单元,被配置为基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征;训练单元,被配置为基于所述关联视频特征,训练各个转码参数模型,其中,各个转码参数模型是与视频转码处理中所使用的每个可调参数相对应的转码参数模型;其中,每个转码参数模型的输入为:与该转码参数模型对应的可调参数的关联视频特征的特征值;每个转码参数模型的输出为:针对视频进行视频转码处理时与该转码参数模型对应的可调参数的预测最优值。
可选地,所述训练样本集还包括:针对每个训练视频进行视频转码处理时每个可调参数的实际最优值;其中,训练单元被配置为:针对每个转码参数模型,将每个训练视频的与该转码参数模型对应的关联视频特征的特征值输入该转码参数模型,得到针对该训练视频的与该转码参数模型对应的可调参数的预测最优值;基于针对该训练视频的与该转码参数模型对应的可调参数的实际最优值和预测最优值,确定该转码参数模型的损失函数;通过根据所述损失函数调整该转码参数模型的参数,对该转码参数模型进行训练。
可选地,关联特征确定单元被配置为:针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。
可选地,训练样本集获取单元被配置为:获取每个可调参数对应的至少一个候选值;基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合,其中,每个参数值组合包括:每个可调参数对应的一个候选值;针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果;基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。
可选地,训练样本集获取单元被配置为:确定每个训练视频的每个转码处理结果对应的码率和转码质量评分;从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合,或者,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合;针对确定的转码处理结果组合中的每个转码处理结果,将该转码处理结果所对应的参数值组合中的各个候选值,确定为该转码处理结果所对应的训练视频的各个可调参数的实际最优值;其中,每个转码处理结果组合包括:各个训练视频各自的一个转码处理结果;其中,转码处理结果组合的总转码质量评分为该转码处理结果组合中的各个转码处理结果对应的转码质量评分之和;转码处理结果组合的总码率为该转码处理结果组合中的各个转码处理结果对应的码率之和。
可选地,训练样本集获取单元被配置为:使用寻优算法,从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合;其中,训练样本集获取单元被配置为:使用寻优算法,从所有可能的转码处理结果组合中,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合;其中,所述寻优算法包括以下项中的至少一项:背包算法、动态规划算法、贪心算法。
可选地,视频转码处理中所使用的至少一个可调参数包括:视频编码前处理中所使用的至少一个参数和/或编码处理中所使用的至少一个参数。
可选地,所述多个视频特征包括:至少一个用于描述视频品质的特征和/或至少一个用于描述视频复杂度的特征。
根据本公开实施例的第四方面,提供一种视频转码装置,包括:目标视频获取单元,被配置为获取待转码处理的目标视频;特征值确定单元,被配置为针对视频转码处理中所使用的至少一个可调参数中的每个可调参数,确定目标视频的针对该可调参数的关联视频特征的特征值;预测单元,被配置为将目标视频的针对每个可调参数的关联视频特征的特征值,输入与该可调参数对应的转码参数模型,得到针对目标视频的该可调参数的预测最优值;转码处理单元,被配置为使用针对目标视频的各个可调参数的预测最优值,对目标视频进行转码处理。
可选地,每个转码参数模型基于训练样本集训练得到;其中,所述训练样本集包括:每个训练视频的多个视频特征的特征值和针对每个训练视频进行视频转码处理时每个可调参数的实际最优值。
可选地,每个可调参数的关联视频特征基于所述训练样本集通过下述方式确定:针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。
可选地,针对每个训练视频进行视频转码处理时每个可调参数的实际最优值通过下述方式得到:获取每个可调参数对应的至少一个候选值;基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合,其中,每个参数值组合包括:每个可调参数对应的一个候选值;针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果;基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。
可选地,视频转码处理中所使用的至少一个可调参数包括:视频编码前处理中所使用的至少一个参数和/或编码处理中所使用的至少一个参数。
可选地,所述关联视频特征包括:至少一个用于描述视频品质的特征和/或至少一个用于描述视频复杂度的特征。
根据本公开实施例的第五方面,提供一种电子设备,包括:至少一个处理器;至少一个存储计算机可执行指令的存储器,其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如上所述的转码参数模型的训练方法和/或如上所述的视频转码方法。
根据本公开实施例的第六方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令被至少一个处理器运行时,促使所述至少一个处理器执行如上所述的转码参数模型的训练方法和/或如上所述的视频转码方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,包括计算机指令,所述计算机指令被至少一个处理器执行时实现如上所述的转码参数模型的训练方法和/或如上所述的视频转码方法。
根据本公开的示例性实施例的转码参数模型的训练方法、视频转码方法及装置,能够根据每个视频的特征动态地调整对视频进行转码处理所使用参数的参数值,从而视频的转码效果会得到优化,例如,可提高转码效率和转码质量。
此外,本公开的示例性实施例相较于相关技术,对于相同输入视频,可以在保证转出视频质量相近的情况下,可控地降低输出文件大小;或者在输出文件大小相同的情况下,显著提高转出视频质量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1示出根据本公开示例性实施例的转码参数模型的训练方法的流程图;
图2示出根据本公开示例性实施例的获取训练视频的可调参数的实际最优值的方法的流程图;
图3示出根据本公开示例性实施例的转码参数模型的训练方法的示例;
图4示出根据本公开示例性实施例的转码参数模型的训练方法的另一示例;
图5示出根据本公开示例性实施例的视频转码方法的流程图;
图6示出根据本公开示例性实施例的转码参数模型的训练装置的结构框图;
图7示出根据本公开示例性实施例的视频转码装置的结构框图;
图8示出根据本公开示例性实施例的电子设备的结构框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在此需要说明的是,在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括A和B之中的至少一个”即包括如下三种并列的情况:(1)包括A;(2)包括B;(3)包括A和B。又例如“执行步骤一和步骤二之中的至少一个”,即表示如下三种并列的情况:(1)执行步骤一;(2)执行步骤二;(3)执行步骤一和步骤二。
图1示出根据本公开示例性实施例的转码参数模型的训练方法的流程图。
参照图1,在步骤S101,获取视频转码处理中所使用的至少一个可调参数中的每个可调参数。
作为示例,可调参数为针对不同输入视频时参数值可被适应性调整的参数,可根据实际情况和需求、参数特性等方面将视频转码处理中所使用的至少一个参数指定为可调参数,以通过转码参数模型根据视频的特性,有针对性地为视频选择适合的可调参数的参数值对视频进行转码处理,使得对视频的转码处理达到较好的效果。
作为示例,视频转码处理中所使用的至少一个可调参数可包括但不限于:视频编码前处理中所使用的至少一个参数和/或编码处理中所使用的至少一个参数。
作为示例,视频编码前处理可包括但不限于:增强处理。作为示例,增强处理可包括但不限于以下处理之中的至少一项:降噪、超分辨率、去模糊、去交错。应该理解,视频编码前处理也可包括其他类型的在编码前需要对视频进行的处理,例如,缩放处理,本公开对此不作限制。应该理解,增强处理也可包括其他类型的使视频变得更清晰的处理,本公开对此不作限制。
在步骤S102,获取训练样本集。
所述训练样本集包括:每个训练视频的多个视频特征的特征值。进一步地,所述训练样本集还可包括:针对每个训练视频进行视频转码处理时每个可调参数的实际最优值。应该理解,训练样本集可对应于多个训练视频。针对每个训练视频进行视频转码处理时每个可调参数的实际最优值可理解为:当使用针对训练视频的可调参数的实际最优值对该训练视频进行视频转码处理时,转码效果较好。例如,当使用针对每个训练视频的可调参数的实际最优值对该训练视频进行视频转码处理时,训练视频集总体的转码处理结果的综合评价最优。
作为示例,所述多个视频特征可包括但不限于:至少一个用于描述视频品质的特征和/或至少一个用于描述视频复杂度的特征。
作为示例,用于描述视频品质的特征可包括但不限于以下项之中的至少一项:用于描述视频的噪声程度的特征、用于描述视频的块效应程度的特征。应该理解,用于描述视频品质的特征也可包括其他类型的用于描述视频品质的特征,本公开对此不作限制。
作为示例,用于描述视频复杂度的特征可包括但不限于以下项之中的至少一项:用于描述视频的帧内编码复杂度的特征、用于描述视频的帧间编码复杂度的特征。应该理解,用于描述视频复杂度的特征也可包括其他类型的用于描述视频复杂度的特征,本公开对此不作限制。
作为示例,步骤S102可包括提取每个训练视频的所述多个视频特征的特征值。
作为示例,步骤S102可包括获取针对每个训练视频进行视频转码处理时每个可调参数的实际最优值。下面将会结合图2来描述获取针对每个训练视频进行视频转码处理时每个可调参数的实际最优值的示例性实施例。
在步骤S103,基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征。
作为示例,每个可调参数的关联视频特征可为与该可调参数相关性最高的预设数量个视频特征。
作为示例,可针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;并将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。例如,可通过相关系数对相关性进行评价,即,相关系数越大,相关性越高,以第一可调参数和第一视频特征为例,可计算多个训练视频的第一视频特征的特征值(x1、x2、……、xNtrain)与第一可调参数的实际最优值(y1、y2、……、yNtrain)之间的相关系数,x1表示训练视频1的第一视频特征的特征值,y1表示训练视频1的第一可调参数的实际最优值,Ntrain表示训练视频的数量。
应该理解,不同可调参数的关联视频特征的数量可相同或不同。例如,针对第一可调参数,可将与其相关性最高的第一预设数量个视频特征确定为第一可调参数的关联视频特征;针对第二可调参数,可将与其相关性最高的第二预设数量个视频特征确定为第二可调参数的关联视频特征。
在步骤S104,基于所述关联视频特征,训练各个转码参数模型。
各个转码参数模型是与视频转码处理中所使用的每个可调参数相对应的转码参数模型。例如,各个转码参数模型与各个可调参数一一对应。
可基于所述训练样本集,训练每个转码参数模型。
每个转码参数模型的输入为:视频的与该转码参数模型对应的视频特征的特征值,与该转码参数模型对应的视频特征为与该转码参数模型对应的可调参数的关联视频特征;每个转码参数模型的输出为:针对视频进行视频转码处理时与该转码参数模型对应的可调参数的预测最优值。
作为示例,可针对每个转码参数模型,将每个训练视频的与该转码参数模型对应的视频特征的特征值输入该转码参数模型,得到针对该训练视频的与该转码参数模型对应的可调参数的预测最优值;然后,基于针对该训练视频的与该转码参数模型对应的可调参数的实际最优值和预测最优值,确定该转码参数模型的损失函数;最后,通过根据所述损失函数调整该转码参数模型的参数,对该转码参数模型进行训练。
应该理解,可基于训练样本集,对每个转码参数模型进行单独训练。
作为示例,每个转码参数模型可为适当类型的机器学习模型,例如,可为基于神经网络的机器学习模型。
图2示出根据本公开示例性实施例的获取训练视频的可调参数的实际最优值的方法的流程图。
如图2所示,在步骤S201,获取每个可调参数对应的至少一个候选值。
作为示例,可针对每个可调参数,获取该可调参数的多个适当的候选值。例如,可从为每个可调参数预设的离散的参数值候选范围中获取该可调参数对应的至少一个候选值。
在步骤S202,基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合。
每个参数值组合包括:每个可调参数对应的一个候选值。即,每个参数值组合包括:各个可调参数各自的一个候选值,且不同参数值组合至少部分不同。
例如,可每次选取每个可调参数的一个候选值,每次选取的各个可调参数各自的一个候选值构成一个参数值组合,来得到所有可能的组合。
在步骤S203,针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果。
作为示例,所述至少一个可调参数的总数可为Ncondition,{N1,…,NN_condition}表示每个可调参数的候选值的总数,其中,N1表示第一个可调参数的候选值的总数,NN_condition表示最后一个可调参数的候选值的总数,则所述至少一个可调参数所有候选值的所有可能的参数值组合的总数Ntotal_condition为:N1*N2*…*NN_condition。
相应地,针对每个训练视频,要分别进行Ntotal_condition次视频转码处理,得到Ntotal_condition个转码处理结果,每个转码处理结果各自对应于一个参数值组合。
在步骤S204,基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。例如,可基于所有训练视频的转码处理结果的总体综合评价,确定对训练视频集进行转码处理效果最好时的每个训练视频对应的参数值组合。
作为示例,可从适当的角度来衡量视频转码处理的效果。例如,可基于使用参数值组合对训练视频进行视频转码处理得到的转码处理结果对应的码率BitRate和/或转码处理结果相对于原视频的转码质量评分来衡量使用参数值组合对训练视频进行视频转码处理的效果,进而可以确定针对每个训练视频进行视频转码处理效果最好的参数值组合。
作为示例,转码质量评分可为用于评价转码处理对原视频的优化情况、损失情况等方面。例如,转码质量评分可基于VMAF(视频质量评测标准)或VMAF_NEG得到的评分。
作为示例,可先确定每个训练视频的每个转码处理结果对应的码率和转码质量评分;然后,从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合,或者,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合;接下来,针对确定的转码处理结果组合中的每个转码处理结果,将该转码处理结果所对应的参数值组合中的各个候选值,确定为该转码处理结果所对应的训练视频的各个可调参数的实际最优值。
每个转码处理结果组合包括:各个训练视频各自的一个转码处理结果,且不同转码处理结果组合至少部分不同。
转码处理结果组合的总转码质量评分为该转码处理结果组合中的各个转码处理结果对应的转码质量评分之和;转码处理结果组合的总码率为该转码处理结果组合中的各个转码处理结果对应的码率之和。
作为示例,可使用寻优算法(也即,最优化算法),从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合。
作为示例,可使用寻优算法,从所有可能的转码处理结果组合中,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合。
作为示例,所述寻优算法可包括但不限于以下项中的至少一项:背包算法、动态规划算法、贪心算法。
图3示出根据本公开示例性实施例的转码参数模型的训练方法的示例。如图3所示,可获取包括多个训练视频的视频集,然后针对每个训练视频提取多个视频特征的特征值。并且,分别使用所有可能的参数值组合对每个训练视频进行视频转码处理(即,增强处理和编码处理)得到对应的转码处理结果及其对应的码率和转码质量评分,针对每个训练视频,基于该训练视频的各个转码处理结果对应的码率和转码质量评分,确定针对该训练视频进行视频转码处理时每个可调参数的实际最优值,经过上述步骤,获取到训练样本集,接下来,可基于训练样本集,训练各个转码参数模型。
可基于最新训练得到的转码参数模型来更新线上使用的转码参数模型,并使用线上转码参数模型预测线上视频进行视频转码处理时的可调参数的最优值,并使用预测的可调参数最优值对线上视频进行视频转码处理。数据收集主要是对线上视频进行定期收集,并使用其对模型进行更新,以保证线上模型的持续更新迭代。
图4示出根据本公开示例性实施例的转码参数模型的训练方法的另一示例。
如图4所示,在特征计算的过程中,获取视频样本(包括,测试集中的测试视频和训练集中的训练视频)的至少一个质量特征和至少一个复杂度特征。
在视频处理及质量分析的过程中,可分别使用所有可能的参数值组合(Ntotal_condition个参数值组合)对每个视频样本进行视频转码处理(即,增强处理和编码处理)得到对应的转码处理结果及其对应的码率和转码质量评分。
在最优参数集生成的过程中,可针对每个视频样本,基于该视频样本的各个转码处理结果对应的码率和转码质量评分,确定针对该视频样本进行视频转码处理时每个可调参数的实际最优值,以得到最优参数集GroundTruth。
作为示例,训练集和测试集中的视频样本经过上述Ntotal_condition个参数值组合进行视频转码处理得到码率{Bij}(i=1,…,Ntrain/Ntest,j=1,…,Ntotal_condition),并经过质量分析得到质量分评分{Qij}(i=1,…,Ntrain/Ntest,j=1,…,Ntotal_condition)。
可对训练集和测试集分别规定总目标码率Tbitrate(即,码率阈值)或总目标质量评分Tquality(即,评分阈值),总目标码率Tbitrate和总目标质量评分Tquality可称为模型期望。
作为示例,利用动态规划问题对GroundTruth生成方案的描述可如下所示:
对于训练集,在给定总目标码率Tbitrate的情况下,对于Ntrain个训练视频中的各个分别选择各自的一个参数值组合使得Btotal尽可能逼近Tbitrate并使得对应的Qtotal最大。或者,在给定总目标质量评分Tquality的情况下,对于Ntrain个训练视频中的各个分别选择各自的一个参数值组合使得Qtotal尽可能逼近Tquality并使得对应的Btotal最小。
Btotal=B(1,pick1)+B(2,pick2)+…+B(N_train,pick N_train)
Qtotal=Q(1,pick1)+Q(2,pick2)+…+Q(N_train,pick N_train)
其中,B(1,pick1)表示第一个训练视频按照一个参数值组合进行视频转码处理得到的转码处理结果对应的码率,Q(1,pick1)表示第一个训练视频按照一个参数值组合进行视频转码处理得到的转码处理结果对应的转码质量评分。应该理解,pick1和pick2可相同或不同。
对于测试集,可做与训练集同样处理获取最优参数集GroundTruth,用于对模型进行测试使用。
此外,还可基于训练集的最优参数集GroundTruth,确定每个可调参数的关联视频特征。
在模型训练的过程中,可将训练集中的每个训练视频的针对各个可调参数的关联视频特征的特征值输入模型,并根据预测最优参数值和实际最优参数值确定损失函数,以对模型进行训练。
测试集中的测试视频用于对模型进行测试,评测模型的预测效果以验证模型效果。可将测试集中的每个从测试视频的针对各个可调参数的关联视频特征的特征值输入模型,并根据预测最优参数值和实际最优参数值,对模型的预测效果进行评价。
图5示出根据本公开示例性实施例的视频转码方法的流程图。
参照图5,在步骤S301,获取待进行视频转码处理的目标视频。
在步骤S302,针对视频转码处理中所使用的至少一个可调参数中的每个可调参数,确定目标视频的针对该可调参数的关联视频特征的特征值。
在步骤S303,将目标视频的针对每个可调参数的关联视频特征的特征值,输入与该可调参数对应的转码参数模型,得到针对目标视频的该可调参数的预测最优值。
在步骤S304,使用针对目标视频的各个可调参数的预测最优值,对目标视频进行转码处理。
作为示例,每个转码参数模型可以是使用如上述示例性实施例所述的训练方法训练得到的。
作为示例,每个转码参数模型可基于训练样本集训练得到;其中,所述训练样本集包括:每个训练视频的多个视频特征的特征值和针对每个训练视频进行视频转码处理时每个可调参数的实际最优值。
作为示例,每个可调参数的关联视频特征可基于所述训练样本集通过下述方式确定:针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。
作为示例,针对每个训练视频进行视频转码处理时每个可调参数的实际最优值可通过下述方式得到:获取每个可调参数对应的至少一个候选值;基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合,其中,每个参数值组合包括:每个可调参数对应的一个候选值;针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果;基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。例如,可基于所有训练视频的转码处理结果的总体综合评价,确定对训练视频集进行转码处理效果最好时的每个训练视频对应的参数值组合。
作为示例,视频转码处理中所使用的至少一个可调参数可包括:视频编码前处理中所使用的至少一个参数和/或编码处理中所使用的至少一个参数。
作为示例,所述关联视频特征可包括:至少一个用于描述视频品质的特征和/或至少一个用于描述视频复杂度的特征。
图6示出根据本公开示例性实施例的转码参数模型的训练装置的结构框图。
如图6所示,根据本公开示例性实施例的转码参数模型的训练装置10包括:可调参数获取单元101、训练样本集获取单元102、关联特征确定单元103、训练单元104。
具体说来,可调参数获取单元101被配置为获取视频转码处理中所使用的至少一个可调参数中的每个可调参数。
训练样本集获取单元102被配置为获取训练样本集,其中,所述训练样本集包括:每个训练视频的多个视频特征的特征值。
关联特征确定单元103被配置为基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征。
训练单元104被配置为基于所述关联视频特征,训练各个转码参数模型,其中,各个转码参数模型是与视频转码处理中所使用的每个可调参数相对应的转码参数模型。
其中,每个转码参数模型的输入为:与该转码参数模型对应的可调参数的关联视频特征的特征值;每个转码参数模型的输出为:针对视频进行视频转码处理时与该转码参数模型对应的可调参数的预测最优值。
作为示例,所述训练样本集还可包括:针对每个训练视频进行视频转码处理时每个可调参数的实际最优值;其中,训练单元104可被配置为:针对每个转码参数模型,将每个训练视频的与该转码参数模型对应的关联视频特征的特征值输入该转码参数模型,得到针对该训练视频的与该转码参数模型对应的可调参数的预测最优值;基于针对该训练视频的与该转码参数模型对应的可调参数的实际最优值和预测最优值,确定该转码参数模型的损失函数;通过根据所述损失函数调整该转码参数模型的参数,对该转码参数模型进行训练。
作为示例,关联特征确定单元103可被配置为:针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。
作为示例,训练样本集获取单元102可被配置为:获取每个可调参数对应的至少一个候选值;基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合,其中,每个参数值组合包括:每个可调参数对应的一个候选值;针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果;基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。
作为示例,训练样本集获取单元102可被配置为:确定每个训练视频的每个转码处理结果对应的码率和转码质量评分;从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合,或者,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合;针对确定的转码处理结果组合中的每个转码处理结果,将该转码处理结果所对应的参数值组合中的各个候选值,确定为该转码处理结果所对应的训练视频的各个可调参数的实际最优值;其中,每个转码处理结果组合包括:各个训练视频各自的一个转码处理结果;其中,转码处理结果组合的总转码质量评分为该转码处理结果组合中的各个转码处理结果对应的转码质量评分之和;转码处理结果组合的总码率为该转码处理结果组合中的各个转码处理结果对应的码率之和。
作为示例,训练样本集获取单元102可被配置为:使用寻优算法,从所有可能的转码处理结果组合中,确定总转码质量评分大于或等于评分阈值的转码处理结果组合之中总码率最小的转码处理结果组合;其中,训练样本集获取单元102可被配置为:使用寻优算法,从所有可能的转码处理结果组合中,确定总码率小于或等于码率阈值的转码处理结果组合之中总转码质量评分最大的转码处理结果组合;其中,所述寻优算法包括以下项中的至少一项:背包算法、动态规划算法、贪心算法。
作为示例,视频转码处理中所使用的至少一个可调参数可包括:视频编码前处理中所使用的至少一个参数和/或编码处理中所使用的至少一个参数。
作为示例,所述多个视频特征可包括:至少一个用于描述视频品质的特征和/或至少一个用于描述视频复杂度的特征。
图7示出根据本公开示例性实施例的视频转码装置的结构框图。
如图7所示,根据本公开示例性实施例的视频转码装置20包括:目标视频获取单元201、特征值确定单元202、预测单元203、转码处理单元204。
具体说来,目标视频获取单元201被配置为获取待转码处理的目标视频。
特征值确定单元202被配置为针对视频转码处理中所使用的至少一个可调参数中的每个可调参数,确定目标视频的针对该可调参数的关联视频特征的特征值。
预测单元203被配置为将目标视频的针对每个可调参数的关联视频特征的特征值,输入与该可调参数对应的转码参数模型,得到针对目标视频的该可调参数的预测最优值。
转码处理单元204被配置为使用针对目标视频的各个可调参数的预测最优值,对目标视频进行转码处理。
作为示例,每个转码参数模型可基于训练样本集训练得到;其中,所述训练样本集可包括:每个训练视频的多个视频特征的特征值和针对每个训练视频进行视频转码处理时每个可调参数的实际最优值。
作为示例,每个可调参数的关联视频特征基于所述训练样本集可通过下述方式确定:针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。
作为示例,针对每个训练视频进行视频转码处理时每个可调参数的实际最优值可通过下述方式得到:获取每个可调参数对应的至少一个候选值;基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合,其中,每个参数值组合包括:每个可调参数对应的一个候选值;针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果;基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。
作为示例,视频转码处理中所使用的至少一个可调参数可包括:视频编码前处理中所使用的至少一个参数和/或编码处理中所使用的至少一个参数。
作为示例,所述关联视频特征可包括:至少一个用于描述视频品质的特征和/或至少一个用于描述视频复杂度的特征。
本公开考虑到实际进行视频转码处理的视频内容特性各异,尤其对于各大视频平台来说,每天处理的视频数以万计,如果可以因地制宜,根据每个视频动态地调整前处理策略以及编码参数,视频压缩效率会大大得到优化,因此节省的带宽成本也会相当可观。因此,本公开提出根据每个视频的特征将其进行分类并对应不同的前处理策略以及编码参数,从而可以根据每个视频动态地调整前处理策略以及编码参数。根据本公开的示例性实施例可应用于视频压缩场景,应该理解,也可应用于其他场景,本公开对此不作限制。
关于上述实施例中的转码参数模型的训练装置10和视频转码装置20,其中各个单元执行操作的具体方式已经在相关方法的实施例中进行了详细描述,此处将不做详细阐述说明。
此外,应该理解,根据本公开示例性实施例的转码参数模型的训练装置10和视频转码装置20中的各个单元可被实现硬件组件和/或软件组件。本领域技术人员根据限定的各个单元所执行的处理,可以例如使用现场可编程门阵列(FPGA)或专用集成电路(ASIC)来实现各个单元。
图8示出根据本公开示例性实施例的电子设备的结构框图。参照图8,该电子设备30包括:至少一个存储器301和至少一个处理器302,所述至少一个存储器301中存储有计算机可执行指令集合,当计算机可执行指令集合被至少一个处理器302执行时,执行如上述示例性实施例所述的转码参数模型的训练方法和/或如上述示例性实施例所述的视频转码方法。
作为示例,电子设备30可以是PC计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里,电子设备30并非必须是单个的电子设备,还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备30还可以是集成控制系统或系统管理器的一部分,或者可被配置为与本地或远程(例如,经由无线传输)以接口互联的便携式电子设备。
在电子设备30中,处理器302可包括中央处理器(CPU)、图形处理器(GPU)、可编程逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制,处理器302还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
处理器302可运行存储在存储器301中的指令或代码,其中,存储器301还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收,其中,网络接口装置可采用任何已知的传输协议。
存储器301可与处理器302集成为一体,例如,将RAM或闪存布置在集成电路微处理器等之内。此外,存储器301可包括独立的装置,诸如,外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器301和处理器302可在操作上进行耦合,或者可例如通过I/O端口、网络连接等互相通信,使得处理器302能够读取存储在存储器中的文件。
此外,电子设备30还可包括视频显示器(诸如,液晶显示器)和用户交互接口(诸如,键盘、鼠标、触摸输入装置等)。电子设备30的所有组件可经由总线和/或网络而彼此连接。
根据本公开的示例性实施例,还可提供一种存储指令的计算机可读存储介质,其中,当指令被至少一个处理器运行时,促使至少一个处理器执行如上述示例性实施例所述的转码参数模型的训练方法和/或如上述示例性实施例所述的视频转码方法。这里的计算机可读存储介质的示例包括:只读存储器(ROM)、随机存取可编程只读存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、非易失性存储器、CD-ROM、CD-R、CD+R、CD-RW、CD+RW、DVD-ROM、DVD-R、DVD+R、DVD-RW、DVD+RW、DVD-RAM、BD-ROM、BD-R、BD-R LTH、BD-RE、蓝光或光盘存储器、硬盘驱动器(HDD)、固态硬盘(SSD)、卡式存储器(诸如,多媒体卡、安全数字(SD)卡或极速数字(XD)卡)、磁带、软盘、磁光数据存储装置、光学数据存储装置、硬盘、固态盘以及任何其他装置,所述任何其他装置被配置为以非暂时性方式存储计算机程序以及任何相关联的数据、数据文件和数据结构并将所述计算机程序以及任何相关联的数据、数据文件和数据结构提供给处理器或计算机使得处理器或计算机能执行所述计算机程序。上述计算机可读存储介质中的计算机程序可在诸如客户端、主机、代理装置、服务器等计算机设备中部署的环境中运行,此外,在一个示例中,计算机程序以及任何相关联的数据、数据文件和数据结构分布在联网的计算机系统上,使得计算机程序以及任何相关联的数据、数据文件和数据结构通过一个或多个处理器或计算机以分布式方式存储、访问和执行。
根据本公开的示例性实施例,还可提供一种计算机程序产品,该计算机程序产品中的指令可由至少一个处理器执行以完成如上述示例性实施例所述的转码参数模型的训练方法和/或如上述示例性实施例所述的视频转码方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种转码参数模型的训练方法,其特征在于,包括:
获取视频转码处理中所使用的至少一个可调参数中的每个可调参数;
获取训练样本集,其中,所述训练样本集包括:每个训练视频的多个视频特征的特征值;
基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征;
基于所述关联视频特征,训练各个转码参数模型,其中,各个转码参数模型是与视频转码处理中所使用的每个可调参数相对应的转码参数模型;
其中,每个转码参数模型的输入为:与该转码参数模型对应的可调参数的关联视频特征的特征值;每个转码参数模型的输出为:针对视频进行视频转码处理时与该转码参数模型对应的可调参数的预测最优值。
2.根据权利要求1所述的训练方法,其特征在于,所述训练样本集还包括:针对每个训练视频进行视频转码处理时每个可调参数的实际最优值;
其中,基于所述关联视频特征,训练各个转码参数模型的步骤包括:
针对每个转码参数模型,将每个训练视频的与该转码参数模型对应的关联视频特征的特征值输入该转码参数模型,得到针对该训练视频的与该转码参数模型对应的可调参数的预测最优值;
基于针对该训练视频的与该转码参数模型对应的可调参数的实际最优值和预测最优值,确定该转码参数模型的损失函数;
通过根据所述损失函数调整该转码参数模型的参数,对该转码参数模型进行训练。
3.根据权利要求1所述的训练方法,其特征在于,基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征的步骤包括:
针对每个可调参数,分别确定训练视频的该可调参数的实际最优值与训练视频的每个视频特征的特征值之间的相关性;
将相关性最高的预设数量个视频特征确定为该可调参数的关联视频特征。
4.根据权利要求1所述的训练方法,其特征在于,获取训练样本集的步骤包括:
获取每个可调参数对应的至少一个候选值;
基于每个可调参数对应的至少一个候选值确定所有可能的参数值组合,其中,每个参数值组合包括:每个可调参数对应的一个候选值;
针对每个训练视频,按照每个参数值组合对该训练视频进行视频转码处理,得到该训练视频的与该个参数值组合对应的转码处理结果;
基于每个训练视频的转码处理结果,确定对该训练视频进行视频转码处理效果最好的参数值组合,并将该参数值组合中的各个候选值,确定为针对该训练视频的各个可调参数的实际最优值。
5.一种视频转码方法,其特征在于,包括:
获取待转码处理的目标视频;
针对视频转码处理中所使用的至少一个可调参数中的每个可调参数,确定目标视频的针对该可调参数的关联视频特征的特征值;
将目标视频的针对每个可调参数的关联视频特征的特征值,输入与该可调参数对应的转码参数模型,得到针对目标视频的该可调参数的预测最优值;
使用针对目标视频的各个可调参数的预测最优值,对目标视频进行转码处理。
6.一种转码参数模型的训练装置,其特征在于,包括:
可调参数获取单元,被配置为获取视频转码处理中所使用的至少一个可调参数中的每个可调参数;
训练样本集获取单元,被配置为获取训练样本集,其中,所述训练样本集包括:每个训练视频的多个视频特征的特征值;
关联特征确定单元,被配置为基于所述训练样本集,从所述多个视频特征中确定与每个可调参数相关的关联视频特征;
训练单元,被配置为基于所述关联视频特征,训练各个转码参数模型,其中,各个转码参数模型是与视频转码处理中所使用的每个可调参数相对应的转码参数模型;
其中,每个转码参数模型的输入为:与该转码参数模型对应的可调参数的关联视频特征的特征值;每个转码参数模型的输出为:针对视频进行视频转码处理时与该转码参数模型对应的可调参数的预测最优值。
7.一种视频转码装置,其特征在于,包括:
目标视频获取单元,被配置为获取待转码处理的目标视频;
特征值确定单元,被配置为针对视频转码处理中所使用的至少一个可调参数中的每个可调参数,确定目标视频的针对该可调参数的关联视频特征的特征值;
预测单元,被配置为将目标视频的针对每个可调参数的关联视频特征的特征值,输入与该可调参数对应的转码参数模型,得到针对目标视频的该可调参数的预测最优值;
转码处理单元,被配置为使用针对目标视频的各个可调参数的预测最优值,对目标视频进行转码处理。
8.一种电子设备,其特征在于,包括:
至少一个处理器;
至少一个存储计算机可执行指令的存储器,
其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1至4中任一项所述的转码参数模型的训练方法和/或如权利要求5所述的视频转码方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令被至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1至4中任一项所述的转码参数模型的训练方法和/或如权利要求5所述的视频转码方法。
10.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被至少一个处理器执行时实现如权利要求1至4中任一项所述的转码参数模型的训练方法和/或如权利要求5所述的视频转码方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111588656.6A CN114298199A (zh) | 2021-12-23 | 2021-12-23 | 转码参数模型的训练方法、视频转码方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111588656.6A CN114298199A (zh) | 2021-12-23 | 2021-12-23 | 转码参数模型的训练方法、视频转码方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114298199A true CN114298199A (zh) | 2022-04-08 |
Family
ID=80968800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111588656.6A Pending CN114298199A (zh) | 2021-12-23 | 2021-12-23 | 转码参数模型的训练方法、视频转码方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114298199A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115396683A (zh) * | 2022-08-22 | 2022-11-25 | 广州博冠信息科技有限公司 | 视频优化处理方法、装置、电子设备及计算机可读介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107146015A (zh) * | 2017-05-02 | 2017-09-08 | 联想(北京)有限公司 | 多变量时间序列预测方法和系统 |
CN111277826A (zh) * | 2020-01-22 | 2020-06-12 | 腾讯科技(深圳)有限公司 | 一种视频数据处理方法、装置及存储介质 |
CN112383777A (zh) * | 2020-09-28 | 2021-02-19 | 北京达佳互联信息技术有限公司 | 视频编码方法、装置、电子设备及存储介质 |
CN113194320A (zh) * | 2021-04-30 | 2021-07-30 | 北京达佳互联信息技术有限公司 | 参数预测模型的训练方法及装置和参数预测方法及装置 |
-
2021
- 2021-12-23 CN CN202111588656.6A patent/CN114298199A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107146015A (zh) * | 2017-05-02 | 2017-09-08 | 联想(北京)有限公司 | 多变量时间序列预测方法和系统 |
CN111277826A (zh) * | 2020-01-22 | 2020-06-12 | 腾讯科技(深圳)有限公司 | 一种视频数据处理方法、装置及存储介质 |
CN112383777A (zh) * | 2020-09-28 | 2021-02-19 | 北京达佳互联信息技术有限公司 | 视频编码方法、装置、电子设备及存储介质 |
CN113194320A (zh) * | 2021-04-30 | 2021-07-30 | 北京达佳互联信息技术有限公司 | 参数预测模型的训练方法及装置和参数预测方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115396683A (zh) * | 2022-08-22 | 2022-11-25 | 广州博冠信息科技有限公司 | 视频优化处理方法、装置、电子设备及计算机可读介质 |
CN115396683B (zh) * | 2022-08-22 | 2024-04-09 | 广州博冠信息科技有限公司 | 视频优化处理方法、装置、电子设备及计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11310509B2 (en) | Method and apparatus for applying deep learning techniques in video coding, restoration and video quality analysis (VQA) | |
US10671889B2 (en) | Committed information rate variational autoencoders | |
CN108133222B (zh) | 为数据库确定卷积神经网络cnn模型的装置和方法 | |
CN113194320B (zh) | 参数预测模型的训练方法及装置和参数预测方法及装置 | |
CN111144483B (zh) | 一种图像特征点过滤方法以及终端 | |
JP7451716B2 (ja) | 予測される視覚的品質に基づくビデオプレーヤのための最適なフォーマット選択 | |
CN104822068A (zh) | 流媒体代理缓存替换方法及装置 | |
CN111369299A (zh) | 识别的方法、装置、设备及计算机可读存储介质 | |
CN106844550B (zh) | 一种虚拟化平台操作推荐方法及装置 | |
CN114298199A (zh) | 转码参数模型的训练方法、视频转码方法及装置 | |
CN112906883B (zh) | 用于深度神经网络的混合精度量化策略确定方法和系统 | |
CN117478886A (zh) | 多媒体数据编码方法、装置、电子设备及存储介质 | |
CN117193841A (zh) | 软件系统的配置参数调优方法及装置 | |
US12088823B2 (en) | Rate control machine learning models with feedback control for video encoding | |
CN115080856A (zh) | 推荐方法及装置、推荐模型的训练方法及装置 | |
CN114970670A (zh) | 模型公平性评估方法及装置 | |
CN114692888A (zh) | 系统参数处理方法、装置、设备及存储介质 | |
AU2022279597B2 (en) | Training rate control neural networks through reinforcement learning | |
CN117370215B (zh) | 寻优抽样方法、装置、电子设备及存储介质 | |
CN117523060B (zh) | 元宇宙数字人的画质处理方法、装置、设备及存储介质 | |
CN118035323B (zh) | 应用于数字化校园软件服务的数据挖掘方法及系统 | |
CN113411521A (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN118658032A (zh) | 视频生成模型的训练方法、装置、电子设备及存储介质 | |
CN116010697A (zh) | 数据处理方法、电子设备以及存储介质 | |
CN113610713A (zh) | 视频超分辨模型的训练方法、视频超分辨方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |