CN110351555A - 基于强化学习的多遍历视频编码码率分配与控制优化方法 - Google Patents
基于强化学习的多遍历视频编码码率分配与控制优化方法 Download PDFInfo
- Publication number
- CN110351555A CN110351555A CN201810298281.1A CN201810298281A CN110351555A CN 110351555 A CN110351555 A CN 110351555A CN 201810298281 A CN201810298281 A CN 201810298281A CN 110351555 A CN110351555 A CN 110351555A
- Authority
- CN
- China
- Prior art keywords
- coding
- data rate
- rate distribution
- network
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009826 distribution Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000005457 optimization Methods 0.000 title claims abstract description 18
- 230000006835 compression Effects 0.000 claims abstract description 18
- 238000007906 compression Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims abstract description 6
- 230000004069 differentiation Effects 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000003321 amplification Effects 0.000 claims description 3
- 238000012804 iterative process Methods 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 238000013441 quality evaluation Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 2
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 238000011156 evaluation Methods 0.000 claims 1
- 230000011218 segmentation Effects 0.000 abstract description 3
- 230000003252 repetitive effect Effects 0.000 abstract 1
- 238000013135 deep learning Methods 0.000 description 5
- 241000208340 Araliaceae Species 0.000 description 4
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 235000008434 ginseng Nutrition 0.000 description 4
- 230000006872 improvement Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011217 control strategy Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种基于强化学习的视频多次遍历(Multipass)编码中码率分配与控制的优化解决方案。在第一次编码结束之后,视频分割为多个不重叠的连续的画面组。针对不同的画面组在第一次遍历(pass)后采集的对组内各帧图像的综合统计信息,通过预测网络得到码率分配和控制决策参数,并执行第二次遍历编码和获取编码结果评分。将统计信息和码控决策参数输入判别网络得到估分,执行强化学习的迭代训练过程。利用强化学习训练得到的预测网络,在编码视频图像第二次遍历前,得到各个画面组的码率分配与控制的最优化策略参数,从而最大可能的提升编码压缩效率。
Description
技术领域
本发明涉及视频编码和深度学习,特别是一种基于强化学习的多遍历视频编码码率分配与控制的优化方法。
背景技术
随着多媒体数字视频应用的不断发展和人们对视频云计算需求的不断提高,原始视频信源的数据量以使现有传输网络带宽和存储资源无法承受。因而,视频信号的压缩已成为目前国内外学术研究和工业应用的热点之一。视频压缩,也称视频编码,其目的是消除视频信号间存在的冗余信息。至今,国内外标准化组织已相继制定了多种不同的视频编码标准。自H.261视频编码标准以来,主流的视频编码标准均采用“基于块的预测和变换”的混合编码框架,即输入的视频信号经过编码器中预测、变换、量化、扫描、熵编码等编码技术处理后,最后输出比特流,以备传输或存储。经过几十年的发展,视频编码标准中的工具日趋精细和复杂,基于传统混合编码框架要取得压缩效率的显著提升变得愈发困难。
深度神经网络是人工智能的一个重要分支,从20世纪80年代以来,深度神经网络提供的识别和预测能力一直在提高,在图像与视频、语音与语言处理等领域表现尤为出色。深度学习在计算机视觉领域(如分类、识别等)的成功也带动了一些视频图像处理领域的发展,基于深度学习的图像超分辨率、边缘检测技术迅速发展,性能提升非常显著。受深度学习在图像处理领域的巨大优势启发,可以将深度学习引入视频或图像编码框架中以提升编码效率。目前学术界和业界关于深度学习在视频或图像编码中的应用大体有以下几类:一、系统级地改造图像编码框架;二、基于传统的混合编码框架,改造其中的部分模块,比如熵编码、变换、环路滤波、亚像素插值等;三、前处理或后处理;四、视频编码快速算法。其中第一类和第二类技术需要改变现有标准,有望在将来新的标准中予以实施,但对于工业界还比较遥远。第三类技术着重于提升主观质量。第四类技术以牺牲一定压缩效率为代价,着重于加快编码速度。
在现有主流的视频图像编码标准基础上提升压缩效率,与生态兼容,具有更好的现实意义和产业价值。视频图像内容具有极大的多样性,现有主流的视频编码标准提供给编码器设计很大的灵活性,针对不同图像内容通过调节一些码率分配和控制策略参数,有很大的压缩效率提升空间。其中,码率分配与控制的策略参数,是最关键的码率分配和控制策略参数,对视频图像压缩效率影响大,且对不同视频图像内容有适配性。码率分配与控制策略参数包括图像组大小,图像组中各帧图像的码率分配加权值(可以大于1,即加权后分配码率大于平均设定值;也可以小于1,即加权后分配码率小于平均设定值),图像组中相应的帧QP值,以及图像组参考结构。图像组中的各帧对编码效率的重要性是有分别的,并且与图像组的编码结构紧密相关。编码结构可以是依次编码,即每一帧图像的解码顺序与其解码后的显示顺序完全一致。也可以是分层结构,即每一帧的解码顺序与其解码后的显示顺序可以不同,每一帧在图像组中的作为参考帧的重要性取决于其所位于的参考层,层数越低,重要性越大。底层的图像可以作为本层图像或者上层图像的参考帧,但上层图像不可以作为位于其层面以下的任何图像的任何参考帧。这些策略参数通过传统的方法求解全局最优值的复杂度为NP问题。
发明内容
有鉴于此,本发明提出本发明公开了一种基于强化学习的视频多次编码中码率分配与控制的优化解决方案。本发明解决了传统方法无法获取全局最优解,以及机器学习方法难以生成标签来进行训练的问题。本发明在编码时只需要推断过程,速度较快,并且具有较高的鲁棒性。
为了达到上述目的,本发明采用的而技术方案为,
步骤(1),创建预测网络和判别网络,并完成网络参数初始化。
预测网络为全连接神经网络,负责根据编码第一次遍历生成的综合统计信息,决策画面组中的码率分配与控制对应的码率分配和控制策略参数最优值。预测网络在实际推断和编码过程中,用作编码器第二次遍历的前置模块,得到预处理参数。
判别网络为全连接神经网络,负责判别预测网络生成的预测值好坏。判别网络的输入为预测网络输出的多个图像组中各帧图像由第一次遍历采集的统计数据,并以每一帧图像的码率分配与控制的码率分配和控制策略参数p;输出为判别码率分配和控制策略参数好坏的实数值V。
步骤(2),执行第一次遍历编码,编码整个视频序列分段,生成的综合统计信息。
综合统计信息包括但不限于:帧内编码后的各个像素分块的方差,各帧帧内预测分块数目与帧间预测分块数目的比例,帧间预测所得运动矢量的分布,帧间放大/缩小的概率预测,帧内预测或帧间预测所得残差的绝对误差和(SAD)或者差值平方和(SSE)数值,等等。
步骤(3),输入综合统计信息,由预测网络得到码率分配和控制的策略参数。
图像组各帧图像的码率分配与控制的策略参数p。这里码率分配与控制的策略参数,图像组大小,图像组中各帧图像的码率分配加权值,图像组中相应的帧QP值,以及图像组参考结构。预测网络的输入为多个图像组由第一次遍历采集的各帧统计数据,对于第二次遍历或以后的遍历,不是从该遍历编码过程中提取的参数,不需要编码器的额外反馈,保持较强解耦性。
步骤(4),根据码率分配和控制的策略参数,执行第二次遍历编码。
步骤(5),编码结果评分。在第二次遍历视频序列分段编码完成以后,得到的压缩效率综合评分R。
步骤(6),判别网络估分。根据输入综合统计信息以及码率分配和控制的策略参数,得到估分V。
步骤(7),强化学习训练迭代。更新预测网络和判别网络参数,并执行迭代过程。通过最小化|R-V|2得到最优化的判别网络的参数θC;通过最大化V得到最优的预测网络的参数θA;将θC和θA分别更新到预测网络和判别网络;迭代到指定终止条件。
步骤(8),编码决策。负责为视频编码中的任一画面组,在第一次遍历结束之后,第二次遍历开始之前,生成最优化的码率分配与控制的码率分配和控制策略参数,从而提升编码多遍历的编码压缩效率。
本发明的有益效果是:本发明专利的视频多次编码(Multipass)中码率分配与控制的优化方法,1.针对视频编码中码率分配与控制的关键策略参数,本发明解决了传统方法无法获取全局最优解,以及机器学习方法难以生成标签来进行训练的问题。2.本发明在现有主流视频图像编码标准范围内实施,能够在兼容现有标准生态的前提下提升压缩效率,具有更好的现实意义和产业价值。3.本发明可以有效提升编码压缩效率,也可以有效地按照设定目标进行码率控制,将码率的平稳度,视频质量稳定性等控制在更合理的范围。
附图说明
图1为强化学习训练步骤示意图;
图2为编码决策步骤示意图。
具体实施方式
下面将结合说明书附图,以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本发明的视频多次编码中码率分配与控制的优化方法,具体优化了视频编码第二次遍历的码控分配与控制策略参数,包括以下步骤,
步骤(1),创建预测网络和判别网络,并完成网络参数初始化。
预测网络为全连接神经网络,负责根据编码第一次遍历生成的综合统计信息,决策画面组中的码率分配与控制对应的码率分配和控制策略参数最优值。预测网络在实际推断和编码过程中,用作编码器第二次遍历的前置模块,得到预处理参数。
判别网络为全连接神经网络,负责判别预测网络生成的预测值好坏。判别网络的输入为预测网络输出的多个图像组中各帧图像由第一次遍历采集的统计数据,并以每一帧图像的码率分配与控制的码率分配和控制策略参数p;输出为判别码率分配和控制策略参数好坏的实数值V。
其中,网络参数的初始化包括但不限于:全零初始化;随机初始化;根据编码器自带的默认配置,执行编码后得到各个图像分块的策略参数以及编码结果评分,然后对预测网络和判别网络进行监督学习的初始化;采用进化算法得到优化的初始策略参数以及编码结果评分,然后对预测网络和判别网络进行监督学习的初始化。所述进化算法方法包括但不仅限于:遗传算法,差分进化算法,模拟退火算法,粒子群优化算法,蚁群算法。在本发明的实施例中,采用差分进化算法,对每组图像得到对应的编码策略参数a;将编码策略参数a输入编码器,执行编码过程得到评分值R。通过R对a进行调整。迭代到指定终止条件,输出最终的a和R。然后利用a和R对预测网络和判别网络进行监督学习,得到优化的初始化网络参数。
步骤(2),执行第一次遍历编码,编码整个视频序列分段,生成的综合统计信息。
综合统计信息包括但不限于:帧内编码后的各个像素分块的方差,各帧帧内预测分块数目与帧间预测分块数目的比例,帧间预测所得运动矢量的分布,帧间放大/缩小的概率预测,帧内预测或帧间预测所得残差的绝对误差和(SAD)或者差值平方和(SSE)数值,等等。
步骤(3),输入综合统计信息,由预测网络得到码率分配和控制的策略参数。
其中,码率分配与控制的策略参数,包括但不限于,对图像组大小,图像组中各帧图像的码率分配加权值,以及相应的帧QP值,以及图像组的编码结构。其中图像组中各帧码率分配加权值可以大于1,即加权后分配码率大于平均设定值;也可以小于1,即加权后分配码率小于平均设定值。图像组中的各帧对编码效率的重要性是有分别的,并且与图像组的编码结构紧密相关。编码结构可以是依次编码,即每一帧图像的解码顺序与其解码后的显示顺序完全一致。也可以是分层结构,即每一帧的解码顺序与其解码后的显示顺序可以不同,每一帧在图像组中的作为参考帧的重要性取决于其所位于的参考层,层数越低,重要性越大。底层的图像可以作为本层图像或者上层图像的参考帧,但上层图像不可以作为位于其层面以下的任何图像的任何参考帧。
预测网络的输入为多个图像组由第一次遍历采集的各帧统计数据,对于第二次遍历或以后的遍历,不是从该遍历编码过程中提取的参数,不需要编码器的额外反馈,保持较强解耦性。
步骤(4),根据码率分配和控制的策略参数,执行第二次遍历编码。
步骤(5),编码结果评分。在第二次遍历视频序列分段编码完成以后,得到的压缩效率综合评分R。
其中,编码结果评分,包括但不限于根据码率和质量评价得到的综合评分。在本发明的实施例中,对每个视频段执行4次编码,设定4个不同的码率值,得到码率和平均结构相似性指标(SSIM),并与上一组策略参数产生的编码结果计算BD率(BDRate),将-BDRate值作为评分。
步骤(6),判别网络估分。根据输入综合统计信息以及码率分配和控制的策略参数,得到估分V。
步骤(7),强化学习训练迭代。更新预测网络和判别网络参数,并执行迭代过程。通过最小化|R-V|2得到最优化的判别网络的参数θC;通过最大化V得到最优的预测网络的参数θA;将θC和θA分别更新到预测网络和判别网络;迭代到指定终止条件。
步骤(8),编码决策。执行第一次遍历编码之后,将一组包含多个图像采集的各帧图像的统计数据输入到预测网络,得到一组码率分配和控制策略参数p;将码率分配和控制策略参数p输入编码器,执行第二次遍历编码,达到提升压缩效率的目的。
以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (8)
1.一种基于强化学习的视频编码多遍历中码率分配与控制的优化方法,其特征在于,包括:
步骤1,创建预测网络和判别网络,并完成网络参数初始化;预测网络负责决策码率分配和控制策略参数最优值;判别网络负责判别预测网络生成的预测值好坏;
步骤2,执行第一次遍历编码,编码整段视频序列,生成的综合统计信息;
步骤3,输入综合统计信息,由预测网络得到码率分配和控制的策略参数;
步骤4,根据码率分配和控制的策略参数,执行第二次遍历编码;
步骤5,编码结果评分,在第二次遍历整段视频序列编码完成以后,得到的压缩效率综合评分R;
步骤6,判别网络估分,根据输入综合统计信息以及码率分配和控制的策略参数,得到估分V;
步骤7,强化学习训练迭代,更新预测网络和判别网络参数,并执行迭代过程;
步骤8,编码决策,负责为视频编码中的任一画面组,在第一次遍历结束之后,第二次遍历开始之前,生成最优化的码率分配与控制的码率分配和控制策略参数,从而提升编码多遍历的编码压缩效率。
2.根据权利要求1所述的基于强化学习的视频编码多遍历中码率分配与控制优化方法,其特征在于,包括:
图像组中不同图像所对应的码率分配与控制的策略参数,包括但不限于图像组大小,图像组中各帧图像的码率分配加权值,图像组中相应的帧QP值,以及图像组参考结构;
所述图像组中每一幅图像所对应的码率分配与控制的策略参数,是视频码率分配和控制策略中最关键参数,对视频图像压缩效率影响大,且对不同视频图像内容有适配性的关键策略参数;所述图像组中各帧图像的码率分配加权值可以大于1,即加权后分配码率大于平均设定值;也可以小于1,即加权后分配码率小于平均设定值;
所述图像组中的各帧对编码效率的重要性是有分别的,并且与图像组的编码结构紧密相关;编码结构可以是依次编码,即每一帧图像的解码顺序与其解码后的显示顺序完全一致;也可以是分层结构,即每一帧的解码顺序与其解码后的显示顺序可以不同,每一帧在图像组中的作为参考帧的重要性取决于其所位于的参考层,层数越低,重要性越大;底层的图像可以作为本层图像或者上层图像的参考帧,但上层图像不可以作为位于其层面以下的任何图像的任何参考帧;
所述策略参数通过传统的方法求解全局最优值的复杂度为多确定多项式问题,NP问题。
3.根据权利要求1所述的基于强化学习的视频编码多遍历中码率分配与控制优化方法,其特征在于,包括:执行第一次遍历编码,编码整段视频序列,生成综合统计信息;
所述综合统计信息为多个图像组从第一次遍历编码后所采集的各帧统计数据,包括但不限于:帧内编码后的各个像素分块的方差,各帧帧内预测分块数目与帧间预测分块数目的比例,帧间预测所得运动矢量的分布,帧间放大/缩小的概率预测,帧内预测或帧间预测所得残差的绝对误差和SAD或者差值平方和SSE数值,等等。
4.根据权利要求1所述的基于强化学习的的视频编码多遍历中码率分配与控制优化方法,其特征在于,包括:编码结果评分,
所述编码结果评分,是在对整段视频序列编码完成之后,得到的压缩效率综合评分,包括但不限于根据码率和质量评价得到的综合评分,比如BD率BDRate数值;
所述质量评价包括但不限于全参考质量评价峰值信噪比PSNR和结构相似性指标SSIM;
所述编码结果评分不需要编码过程中的额外计算或反馈,不需要对编码器做定制化改动,与编码器耦合性弱,且能够综合反映图像组内部各帧编码质量之间的相互影响。
5.根据权利要求1所述的基于强化学习的视频编码多遍历中码率分配与控制优化方法,其特征在于,包括:预测网络负责决策图像组中各帧图像所对应的码率分配与控制的策略参数,
所述预测网络为全连接神经网络,预测网络输入为包含多个图像组从第一次遍历编码后所采集的各帧统计数据,输出图像组各帧图像的码率分配与控制的策略参数p;预测网络的输入为多个图像组由第一次遍历采集的各帧统计数据,对于第二次遍历或以后的遍历,不是从该遍历编码过程中提取的参数,不需要编码器的额外反馈,保持较强解耦性;预测网络在实际推断和编码过程中,用作编码器第二次遍历的前置模块,得到预处理参数。
6.根据权利要求1所述的基于强化学习的视频编码多遍历中码率分配与控制优化方法,其特征在于,包括:判别网络负责判别预测网络生成的预测值好坏,
所述判别网络为全连接神经网络;判别网络负责判别预测网络生成的预测值好坏,判别网络仅在训练中使用,推断中不使用;判别网络的输入为预测网络输出的多个图像组中各帧图像由第一次遍历采集的统计数据,并以每一帧图像的码率分配与控制的码率分配和控制策略参数p;输出为判别码率分配和控制策略参数好坏的实数值V。
7.根据权利要求1所述的基于强化学习的视频编码多遍历中码率分配与控制优化方法,其特征在于,包括:强化学习训练过程,
所述强化学习训练过程负责训练生成预测网络的最优化网络参数θA;首先,将一组包含多个图像组由第一次遍历采集的各帧图像的统计数据输入到预测网络,得到一组对该多个图像组的码率分配与控制的码率分配和控制策略参数p;将码率分配和控制策略参数p输入编码器,执行编码过程得到评分值R;将码率分配和控制策略参数p和对应的图像组统计数据输入到判别网络,得到评分值V;通过最小化|R-V|2得到最优化的判别网络的参数θC;通过最大化V得到最优的预测网络的参数θA;将θC和θA分别更新到预测网络和判别网络;迭代到指定终止条件;
所述迭代终止条件包括但不限于迭代次数。
8.根据权利要求1所述的基于强化学习的视频编码多遍历中码率分配与控制优化方法,其特征在于,包括:编码决策过程,
所述编码决策过程,使用训练好的预测网络作为编码器的前置模块,为编码生成第二次遍历开始前的最优化的各个图像组中各帧图像的码率加权值与帧QP数值等的码率分配和控制策略参数;执行第一次遍历编码之后,将一组包含多个图像采集的各帧图像的统计数据输入到预测网络,得到一组码率分配和控制策略参数p;将码率分配和控制策略参数p输入编码器,执行第二次遍历编码,达到提升压缩效率的目的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810298281.1A CN110351555B (zh) | 2018-04-03 | 2018-04-03 | 基于强化学习的多遍历视频编码码率分配与控制优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810298281.1A CN110351555B (zh) | 2018-04-03 | 2018-04-03 | 基于强化学习的多遍历视频编码码率分配与控制优化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110351555A true CN110351555A (zh) | 2019-10-18 |
CN110351555B CN110351555B (zh) | 2021-04-23 |
Family
ID=68173698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810298281.1A Active CN110351555B (zh) | 2018-04-03 | 2018-04-03 | 基于强化学习的多遍历视频编码码率分配与控制优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110351555B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111031387A (zh) * | 2019-11-21 | 2020-04-17 | 南京大学 | 一种监控视频发送端视频编码流速控制的方法 |
CN111901642A (zh) * | 2020-07-31 | 2020-11-06 | 成都云格致力科技有限公司 | 基于强化学习的实时视频码率自适应调控方法与系统 |
CN114554211A (zh) * | 2022-01-14 | 2022-05-27 | 百果园技术(新加坡)有限公司 | 内容自适应视频编码方法、装置、设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6775415B1 (en) * | 1999-05-25 | 2004-08-10 | George Mason University | Fractal image compression using reinforcement learning |
CN104159109A (zh) * | 2014-05-28 | 2014-11-19 | 百视通网络电视技术发展有限责任公司 | 基于vbr视频编码的码率控制方法及系统 |
CN106791848A (zh) * | 2016-12-20 | 2017-05-31 | 河南省电力勘测设计院 | 一种基于HEVC的Two‑Pass码率控制方法 |
CN106937115A (zh) * | 2017-03-02 | 2017-07-07 | 杭州当虹科技有限公司 | 在视频编码中对比特数预测器进行比特数训练的方法 |
-
2018
- 2018-04-03 CN CN201810298281.1A patent/CN110351555B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6775415B1 (en) * | 1999-05-25 | 2004-08-10 | George Mason University | Fractal image compression using reinforcement learning |
CN104159109A (zh) * | 2014-05-28 | 2014-11-19 | 百视通网络电视技术发展有限责任公司 | 基于vbr视频编码的码率控制方法及系统 |
CN106791848A (zh) * | 2016-12-20 | 2017-05-31 | 河南省电力勘测设计院 | 一种基于HEVC的Two‑Pass码率控制方法 |
CN106937115A (zh) * | 2017-03-02 | 2017-07-07 | 杭州当虹科技有限公司 | 在视频编码中对比特数预测器进行比特数训练的方法 |
Non-Patent Citations (2)
Title |
---|
PHILIPP HELLE 等: "Reinforcement Learning for Video Encoder Control in HEVC", 《2017 INTERNATIONAL CONFERENCE ON SYSTEMS, SIGNALS AND IMAGE PROCESSING,IWSSIP》 * |
熊丽荣 等: "基于Q-learning的HTTP自适应流码率控制方法研究", 《通信学报》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111031387A (zh) * | 2019-11-21 | 2020-04-17 | 南京大学 | 一种监控视频发送端视频编码流速控制的方法 |
CN111031387B (zh) * | 2019-11-21 | 2020-12-04 | 南京大学 | 一种监控视频发送端视频编码流速控制的方法 |
CN111901642A (zh) * | 2020-07-31 | 2020-11-06 | 成都云格致力科技有限公司 | 基于强化学习的实时视频码率自适应调控方法与系统 |
CN111901642B (zh) * | 2020-07-31 | 2022-09-30 | 成都云格致力科技有限公司 | 基于强化学习的实时视频码率自适应调控方法与系统 |
CN114554211A (zh) * | 2022-01-14 | 2022-05-27 | 百果园技术(新加坡)有限公司 | 内容自适应视频编码方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110351555B (zh) | 2021-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Deep contextual video compression | |
CN106162167B (zh) | 基于学习的高效视频编码方法 | |
CN101583036B (zh) | 像素域视频转码中确定运动特征和高效编码模式关系的方法 | |
CN108495135B (zh) | 一种屏幕内容视频编码的快速编码方法 | |
CN110351555A (zh) | 基于强化学习的多遍历视频编码码率分配与控制优化方法 | |
CN100496127C (zh) | Mpeg-2到h.264码的快速转换方法 | |
CN101924943B (zh) | 一种实时的基于h.264的低比特率视频转码方法 | |
CN105306947B (zh) | 基于机器学习的视频转码方法 | |
CN111462261A (zh) | 针对h.266/vvc的快速cu分区和帧内决策方法 | |
CN109040764B (zh) | 一种基于决策树的hevc屏幕内容帧内快速编码算法 | |
CN111355956A (zh) | 一种hevc帧内编码中基于深度学习的率失真优化快速决策系统及其方法 | |
CN108769696A (zh) | 一种基于Fisher判别式的DVC-HEVC视频转码方法 | |
CN110351561B (zh) | 一种用于视频编码优化的高效强化学习训练方法 | |
WO2020125363A1 (zh) | 一种低复杂度视频信号编码处理方法 | |
CN107404653B (zh) | 一种hevc码流的停车事件快速检测方法 | |
CN110213584A (zh) | 基于纹理复杂度的编码单元分类方法和编码单元分类设备 | |
CN110351558A (zh) | 一种基于强化学习的视频图像编码压缩效率提升方法 | |
CN109743575A (zh) | 一种基于朴素贝叶斯的dvc-hevc视频转码方法 | |
CN109819260A (zh) | 基于多嵌入域融合的视频隐写方法和装置 | |
CN107257464A (zh) | 基于Sobel算子和线性回归的高清视频编码码率控制算法 | |
CN110049338A (zh) | 基于多层次分类的hevc快速帧间编码方法 | |
CN105681803B (zh) | 一种大容量的hevc视频信息隐藏方法 | |
CN107547902A (zh) | 面向监控视频编码的自适应率失真优化方法 | |
Shindo et al. | Accuracy improvement of object detection in VVC coded video using YOLO-v7 features | |
CN107690069A (zh) | 一种数据驱动的级联视频编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191108 Address after: 310000 Building D, building D, Tiantang Software Park, No.3 xidoumen Road, Xihu District, Hangzhou City, Zhejiang Province Applicant after: Hangzhou Microframe Information Technology Co., Ltd. Address before: 310012 Room 202, unit 1, building 20, Zigui garden, 268 Wener West Road, Wenxin street, Xihu District, Hangzhou City, Zhejiang Province Applicant before: Zhu Zheng |
|
GR01 | Patent grant | ||
GR01 | Patent grant |