CN107277520B - 帧内预测的码率控制方法 - Google Patents

帧内预测的码率控制方法 Download PDF

Info

Publication number
CN107277520B
CN107277520B CN201710563668.0A CN201710563668A CN107277520B CN 107277520 B CN107277520 B CN 107277520B CN 201710563668 A CN201710563668 A CN 201710563668A CN 107277520 B CN107277520 B CN 107277520B
Authority
CN
China
Prior art keywords
coding tree
rate control
intra
frame
model parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710563668.0A
Other languages
English (en)
Other versions
CN107277520A (zh
Inventor
陈志波
李业
刘�东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Original Assignee
University of Science and Technology of China USTC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC filed Critical University of Science and Technology of China USTC
Priority to CN201710563668.0A priority Critical patent/CN107277520B/zh
Publication of CN107277520A publication Critical patent/CN107277520A/zh
Application granted granted Critical
Publication of CN107277520B publication Critical patent/CN107277520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种帧内预测的码率控制方法,采用R‑λ模型,包括以下步骤:将视频中用于帧内编码的帧分成多个编码树单元;将多个编码树单元输入至预训练的卷积神经网络中,经运算得到多个编码树单元中每一个的模型参数;根据模型参数对多个编码树单元进行比特分配;得到多个编码树单元中每一个的目标比特数,完成帧内预测的码率控制。本发明由于通过卷积神经网络来预测R‑λ模型的参数,因此实现了对视频内容编码特性的精确刻画,从而提高了帧内预测编码的码率控制性能。

Description

帧内预测的码率控制方法
技术领域
本发明属于视频编码及码率控制领域,更具体地涉及一种帧内预测的码率控制方法。
背景技术
在视频编码中,码率控制的目的是在给定编码速率的限制下,使得编码后重建视频的质量达到最优。对于视频序列来说,采用帧内预测编码的帧(intra帧)比采用帧间预测编码的帧(inter帧)的码率控制更重要,主要体现在两个方面。一是与inter帧相比,intra帧通常消耗的比特更多;二是因为在帧间预测时会将intra帧作为参考,因此intra帧编码的质量会影响后续帧的编码。
在当前新一代的视频编码标准High Efficiency Video Coding(HEVC)中,针对intra帧的码率控制引入一个表征内容复杂度的量complexity(C)。复杂度的量是通过计算原始像素值的哈达玛变换,取变换系数的绝对值进行累加得到的。C的引入在一定程度上提高了intra帧的码率控制性能。但是由于复杂度不能代表所有内容的编码特性,因此这种方法依然有不完善之处。
发明内容
基于以上问题,本发明的主要目的在于提出一种帧内预测的码率控制方法,用于解决以上技术问题的至少之一。
为了实现上述目的,本发明提出了一种帧内预测的码率控制方法,采用R-λ模型,包括以下步骤:
步骤1、将视频中用于帧内编码的帧分成多个编码树单元;
步骤2、将多个编码树单元输入至预训练的卷积神经网络中,经运算得到多个编码树单元中每一个的模型参数;
步骤3、根据模型参数对多个编码树单元进行比特分配;得到多个编码树单元中每一个的目标比特数,完成帧内预测的码率控制。
在本发明的一些实施例中,上述R-λ模型为:
λ=α·Rβ
其中,λ为拉格朗日乘子,R为编码比特值;α及β为上述的模型参数。
在本发明的一些实施例中,上述步骤3具体包括以下步骤:
步骤31、根据模型参数,采用二分法得到帧级别的拉格朗日乘子;
步骤32、根据帧级别的拉格朗日乘子计算得到多个编码树单元中每一个的初始比特分配数;
步骤33、根据每一个编码树单元的初始比特分配数,及编码多个编码树单元中的每一个之前实际剩余的比特数,得到多个编码树单元中每一个的目标比特数,完成帧内预测的码率控制。
在本发明的一些实施例中,上述步骤33具体包括以下步骤:
设定多个编码树单元中第一个的目标比特数为其初始比特分配数;
后续的每一个编码树单元的目标比特数表示为:
Figure BDA0001347232790000021
其中,i表示第i个编码树单元,
Figure BDA0001347232790000022
表示第i个编码树单元的初始比特分配数;
Figure BDA0001347232790000023
表示自第i个编码树单元开始、剩余编码树单元的初始比特分配数的总和;
Figure BDA0001347232790000024
表示编码该第i个编码树单元前,当前剩余的目标比特数;SW表示滑动窗口值;优选地,SW=4。
在本发明的一些实施例中,上述步骤31具体包括以下步骤:
采用二分法迭代求解如下方程,得到帧级别的拉格朗日乘子;
Figure BDA0001347232790000025
其中,Nf为用于帧内编码的帧中当前帧分成的多个编码树单元的总数目;Rf表示当前帧的目标比特数;
Figure BDA0001347232790000026
Figure BDA0001347232790000027
为模型参数的变形值,λf为帧级别的拉格朗日乘子,此处,假设多个编码树单元的拉格朗日乘子即为帧级别的拉格朗日乘子。
在本发明的一些实施例中,上述多个编码树单元中每一个的初始比特分配数
Figure BDA0001347232790000031
表示为:
Figure BDA0001347232790000032
在本发明的一些实施例中,对于边缘非标准大小的编码树单元,在步骤2之前,填充到标准大小后再输入到预训练的神经网络中,经运算得到的模型参数为填充后编码树单元的模型参数,根据填充后编码树单元的模型参数及一校正因子得到边缘非标准大小的编码树单元的模型参数。
在本发明的一些实施例中,根据上述填充后编码树单元的模型参数及一校正因子得到边缘非标准大小的编码树单元的模型参数时,采用以下公式:
α(a)=α(b)·Sab
β(a)=β(b)
其中,α(a)、β(a)为边缘非标准大小的编码树单元的模型参数;α(b)、β(b)为填充后编码树单元的模型参数,Sab为校正因子。
在本发明的一些实施例中,上述校正因子为:
Figure BDA0001347232790000033
其中,
Figure BDA0001347232790000034
为边缘非标准大小的编码树单元的大小;
Figure BDA0001347232790000035
为填充后编码树单元的大小;优选地,该校正因子的取值范围为1≤Sab≤4。
在本发明的一些实施例中,在训练所述卷积神经网络时,预先得到每个样本的R-λ模型的拟合曲线,并以该拟合曲线表征的α及β值作为每个样本的标签。
在本发明的一些实施例中,上述卷积神经网络运算包括四个卷积层、两个池化层和三个全连接层。
在本发明的一些实施例中,上述预训练的卷积神经网络采用模型参数的预测值和实际值的欧氏距离作为损失函数。
在本发明的一些实施例中,采用随机梯度下降方法优化卷积神经网络的网络参数。
在本发明的一些实施例中,步骤2中,输入的多个编码树单元,经所述卷积神经网络运算时,采用的数据为多个编码树单元中每一个的亮度分量。
本发明提出的帧内预测的码率控制方法,具有以下有益效果:
1、由于通过卷积神经网络来预测R-λ模型的参数,因此实现了对视频内容编码特性的精确刻画,从而提高了帧内预测编码的码率控制性能;
2、根据帧级别的拉格朗日乘子计算得到多个编码树单元中每一个的初始比特分配数,再根据初始比特分配数,且采用帧间帧码率的控制方法为参考,得到多个编码树单元中每一个的目标比特数,在每个序列编码一帧的情况下,可使帧内码率控制误差平均减小0.46%,同时Y分量BD-rate平均降低0.7%,U、V分量BD-rate平均降低约2%。
附图说明
图1是本发明一实施例提出的帧内预测的码率控制方法的框架示意图;
图2是本发明一实施例中运算得到模型参数的卷积神经网络结构示意图;
图3(a)是本发明一实施例中边缘非标准大小的编码树单元的示意图;
图3(b)是本发明一实施例中边缘非标准大小的编码树单元填充后的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
R-λ模型刻画了编码比特(R)和拉格朗日乘子(λ)之间的关系:
λ=α·Rβ; (1)
其中α和β是模型参数,与视频内容有关。该模型把λ作为决定R的首要因素。通过实验验证了在帧内预测编码的帧(intra帧)编码的编码树单元(CTU)级别上,以上模型也同样适用,问题就在于如何获得与内容相关的参数α和β。
基于此,本发明提出了一种帧内预测的码率控制方法,采用R-λ模型,包括以下步骤:
步骤1、将视频中用于帧内编码的帧分成多个编码树单元;
步骤2、将多个编码树单元输入至预训练的卷积神经网络中,经运算得到多个编码树单元中每一个的模型参数;
步骤3、根据模型参数对多个编码树单元进行比特分配;得到多个编码树单元中每一个的目标比特数,完成帧内预测的码率控制。
因此,本发明由于通过卷积神经网络来预测R-λ模型的参数,因此实现了对视频内容编码特性的精确刻画,从而提高了intra帧的码率控制性能。
在本发明的一些实施例中,上述步骤3具体包括以下步骤:
步骤31、根据模型参数,采用二分法得到帧级别的拉格朗日乘子;
步骤32、根据帧级别的拉格朗日乘子计算得到多个编码树单元中每一个的初始比特分配数;
步骤33、根据每一个编码树单元的初始比特分配数,及编码多个编码树单元中的每一个之前实际剩余的比特数,得到多个编码树单元中每一个的目标比特数,完成帧内预测的码率控制。
在本发明的一些实施例中,上述步骤33具体为:
设定多个编码树单元中第一个的目标比特数为其初始比特分配数;
后续的每一个编码树单元的目标比特数表示为:
Figure BDA0001347232790000051
其中,i表示第i个编码树单元,
Figure BDA0001347232790000052
表示第i个编码树单元的初始比特分配数;
Figure BDA0001347232790000053
表示自第i个编码树单元开始、剩余编码树单元的初始比特分配数的总和;
Figure BDA0001347232790000054
表示编码该第i个编码树单元前,当前剩余的目标比特数;SW表示滑动窗口值;优选地,SW=4。
在本发明的一些实施例中,上述步骤31具体为:
采用二分法迭代求解如下方程,得到帧级别的拉格朗日乘子;
Figure BDA0001347232790000061
其中,Nf为用于帧内编码的帧中当前帧分成的多个编码树单元的总数目;Rf表示当前帧的目标比特数;
Figure BDA0001347232790000062
Figure BDA0001347232790000063
为模型参数的变形值,λf为帧级别的拉格朗日乘子,此处,假设多个编码树单元的拉格朗日乘子即为帧级别的拉格朗日乘子。
根据公式(1)可推算得到:
Figure BDA0001347232790000064
因此,
Figure BDA0001347232790000065
Figure BDA0001347232790000066
的值分别为:
Figure BDA0001347232790000067
Figure BDA0001347232790000068
在本发明的一些实施例中,上述多个编码树单元中每一个的初始比特分配数表示为:
Figure BDA0001347232790000069
在本发明的一些实施例中,对于边缘非标准大小的编码树单元,在步骤2之前,填充到标准大小后再输入到预训练的神经网络中,经进行运算得到的模型参数为填充后编码树单元的模型参数,根据填充后编码树单元的模型参数及一校正因子得到边缘非标准大小的编码树单元的模型参数。
在本发明的一些实施例中,根据上述填充后编码树单元的模型参数及一校正因子得到边缘非标准大小的编码树单元的模型参数时,采用以下公式(7)及公式(8):
α(a)=α(b)·Sab; (7)
β(a)=β(b); (8)
其中,α(a)、β(a)为边缘非标准大小的编码树单元的模型参数;α(b)、β(b)为填充后编码树单元的模型参数,Sab为校正因子。
在本发明的一些实施例中,上述校正因子为:
Figure BDA0001347232790000071
其中,
Figure BDA0001347232790000072
为边缘非标准大小的编码树单元的大小;
Figure BDA0001347232790000073
为填充后编码树单元的大小;优选地,该校正因子的取值范围为1≤Sab≤4。
在本发明的一些实施例中,上述卷积神经网络预先得到R-λ模型的拟合曲线,并以该拟合曲线表征的α及β值作为标签。例如,使用自然图片来训练网络,首先将图像转化成YUV420格式,然后利用HEVC参考软件在All intra模式下以11个不同的量化参数(QP)值(从20到40,取值间隔为2)进行压缩,得到每个编码树单元(CTU)的R和λ数值对。然后根据上述R-λ模型的关系式拟合曲线(我们以平均比特数,bits perpixel,bpp)作为R的度量,得到拟合结果的α和β值,作为标签。
在本发明的一些实施例中,步骤2中,卷积神经网络运算时,采用的数据为多个编码树单元中每一个的亮度分量,即提取每个64×64块(编码树单元)的亮度分量(Y)作为数据。
在本发明的一些实施例中,采用参数的预测值和实际值的欧氏距离作为损失函数,并且采用随机梯度下降方法优化网络参数。
训练完成后,在实际模型运用中,编码每一帧之前,提取每个CTU的Y分量,输入到两个训练好的网络,分别预测模型参数α和β。对于尺寸小于64×64的边缘CTU,首先采用填充的方法,用固定值128填充到正常大小,然后送入网络。之后通过把填充效应考虑在内,再对网络输出参数进行校正。
在本发明的一些实施例中,卷积神经网络包括4个卷积层、3个全连接层和2个池化层,该卷积神经网络以64×64的块作为输入,在最后一个全连接层输出模型参数的预测值。
以下通过具体实施例,对本发明提出的帧内预测的码率控制方法进行详细描述。
实施例
本实施例提出了一种基于卷积神经网络intra帧的码率控制方法,该方法采用的系统架构如图1所示。其中有两个网络分别用于学习输入CTU的α和β参数。对于输入的整帧图像,首先划分为若干个CTU,再将每个CTU分别作为两个网络的输入,经预测得到参数α和β。最后进行CTU级别的比特分配,得到每个CTU各自的λ参数。
该方法采用R-λ模型,包括以下步骤:
步骤1、将视频中用于帧内编码的帧分成多个编码树单元;
步骤2、将多个编码树单元输入至预训练的卷积神经网络中,经运算得到多个编码树单元中每一个的模型参数;
步骤3、根据模型参数对多个编码树单元进行比特分配;得到多个编码树单元中每一个的目标比特数,完成帧内预测的码率控制。
如图2所示,为用于计算得到模型参数的卷积神经网络结构,可以看出该网络结构包括4个卷积层(每层后面都接有非线性激活层ReLU),2个池化(max pooling)层和3个全连接层。其中最后一个全连接层输出模型参数的预测值α或β。
对于边缘非标准大小的CTU,则需要先进行填充,再通过上述步骤二中的卷积神经网络运算。如图3(a)表示边缘非标准大小的CTU的原始结构,图3(b)表示图3(a)中CTU填充后的结构。卷积神经网络预测输出是图3(b)的参数,假定两个CTU的β值近似相等(通过对训练数据集的经验观察,发现不同CTU之间的β值相差不大,可看做近似相等),然后使用公式(8)和公式(9),从图3(b)的α参数得到图3(a)的α参数,其中校正因子Sab的值限制在区间[1,4]上。
具体地,上述步骤3为:得到每个CTU的模型参数后,按照以下步骤实施CTU级别的比特数分配:
1)采用二分法解出下面方程,得到帧级别的λ值(λf):
Figure BDA0001347232790000081
其中Nf为一帧中包含的CTU总数目,αBi,βBi为模型参数的变形值,其表达式如公式(4)和公式(5)所示,Rf表示当前帧的目标比特数。
2)根据公式(6)计算得到每个CTU的初始比特分配数;
3)将每帧内的第一个CTU的目标比特数设为初始分配数,对于后续的CTU,第i个CTU的目标比特数按照公式(2)计算得到。
其中
Figure BDA0001347232790000091
表示自第i个编码树单元开始、剩余编码树单元的初始比特分配数的总和:
Figure BDA0001347232790000092
Remfi表示编码第i个CTU前,当前帧的剩余目标比特数。
综上所述,本实施例中的码率控制方法,可整体概括为:将训练好的两个卷积神经网络植入HEVC intra码率控制中。实际码率控制中,如果当前帧为intra帧,则通过上述方法依次求解帧级别的λ值,并计算得到每个CTU的目标比特数,最后根据每个CTU的目标比特数,计算每个CTU的编码参数λ,即所述的拉格朗日乘子,以用于视频压缩编码。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种帧内预测的码率控制方法,采用R-λ模型,包括以下步骤:
步骤1、将视频中用于帧内编码的帧分成多个编码树单元;
步骤2、将所述多个编码树单元输入至预训练的卷积神经网络中,经运算得到所述多个编码树单元中每一个的模型参数;
步骤3、根据所述模型参数对所述多个编码树单元进行比特分配;得到所述多个编码树单元中每一个的目标比特数,完成所述帧内预测的码率控制,所述步骤3包括:
步骤31、根据所述模型参数,采用二分法得到帧级别的拉格朗日乘子;
步骤32、根据所述帧级别的拉格朗日乘子计算得到所述多个编码树单元中每一个的初始比特分配数;
步骤33、根据所述每一个编码树单元的初始比特分配数,及编码所述多个编码树单元中的每一个之前实际剩余的比特数,得到所述多个编码树单元中每一个的目标比特数,完成所述帧内预测的码率控制。
2.如权利要求1所述的帧内预测的码率控制方法,其中,所述R-λ模型为:
λ=α·Rβ
其中,λ为拉格朗日乘子,R为编码比特值;α及β为所述的模型参数。
3.如权利要求2所述的帧内预测的码率控制方法,其中,所述步骤33具体包括以下步骤:
设定所述多个编码树单元中第一个的目标比特数为其初始比特分配数;
后续的每一个编码树单元的目标比特数表示为:
Figure FDA0002276465640000011
其中,i表示第i个编码树单元,
Figure FDA0002276465640000021
表示第i个编码树单元的初始比特分配数;
Figure FDA0002276465640000022
表示自第i个编码树单元开始、剩余编码树单元的初始比特分配数的总和;
Figure FDA0002276465640000023
表示编码该第i个编码树单元前,当前剩余的目标比特数;SW表示滑动窗口值。
4.根据权利要求3所述的帧内预测的码率控制方法,其中,所述滑动窗口值SW=4。
5.如权利要求2所述的帧内预测的码率控制方法,其中,所述步骤31具体包括以下步骤:
采用二分法迭代求解如下方程,得到所述帧级别的拉格朗日乘子;
Figure FDA0002276465640000024
其中,Nf为所述用于帧内编码的帧中当前帧分成的多个编码树单元的总数目;Rf表示当前帧的目标比特数;
Figure FDA0002276465640000025
Figure FDA0002276465640000026
为所述模型参数的变形值,λf为所述帧级别的拉格朗日乘子;其中,所述多个编码树单元的拉格朗日乘子为所述帧级别的拉格朗日乘子。
6.如权利要求5所述的帧内预测的码率控制方法,其中,所述多个编码树单元中每一个的初始比特分配数
Figure FDA0002276465640000027
表示为:
Figure FDA0002276465640000028
7.如权利要求2所述的帧内预测的码率控制方法,其中,对于边缘非标准大小的编码树单元,在所述步骤2之前,填充到标准大小后再输入到所述预训练的神经网络中,经运算得到的模型参数为填充后编码树单元的模型参数,根据所述填充后编码树单元的模型参数及一校正因子得到所述边缘非标准大小的编码树单元的模型参数。
8.如权利要求7所述的帧内预测的码率控制方法,其中,根据所述填充后编码树单元的模型参数及一校正因子得到所述边缘非标准大小的编码树单元的模型参数时,采用以下公式:
α(a)=α(b)·Sab
β(a)=β(b)
其中,α(a)、β(a)为所述边缘非标准大小的编码树单元的模型参数;α(b)、β(b)为所述填充后编码树单元的模型参数,Sab为所述校正因子。
9.根据权利要求8所述的帧内预测的码率控制方法,其中,所述校正因子为:
Figure FDA0002276465640000031
其中,
Figure FDA0002276465640000032
为所述边缘非标准大小的编码树单元的大小;
Figure FDA0002276465640000033
为所述填充后编码树单元的大小。
10.根据权利要求8所述的帧内预测的码率控制方法,其中,所述校正因子Sab的取值为:1≤Sab≤4。
11.如权利要求2所述的帧内预测的码率控制方法,其中,在训练所述卷积神经网络时,预先得到每个样本的所述R-λ模型的拟合曲线,并以该拟合曲线表征的α及β值作为每个样本的标签。
12.如权利要求1所述的帧内预测的码率控制方法,其中,所述卷积神经网络包括四个卷积层、两个池化层和三个全连接层。
13.根据权利要求1所述的帧内预测的码率控制方法,其中,所述预训练的卷积神经网络采用所述模型参数的预测值和实际值的欧氏距离作为损失函数。
14.根据权利要求1所述的帧内预测的码率控制方法,其中,步骤2中,输入的所述多个编码树单元,经所述卷积神经网络运算时,采用的数据为所述多个编码树单元中每一个的亮度分量。
CN201710563668.0A 2017-07-11 2017-07-11 帧内预测的码率控制方法 Active CN107277520B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710563668.0A CN107277520B (zh) 2017-07-11 2017-07-11 帧内预测的码率控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710563668.0A CN107277520B (zh) 2017-07-11 2017-07-11 帧内预测的码率控制方法

Publications (2)

Publication Number Publication Date
CN107277520A CN107277520A (zh) 2017-10-20
CN107277520B true CN107277520B (zh) 2020-05-12

Family

ID=60073510

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710563668.0A Active CN107277520B (zh) 2017-07-11 2017-07-11 帧内预测的码率控制方法

Country Status (1)

Country Link
CN (1) CN107277520B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109842799B (zh) * 2017-11-29 2021-02-09 杭州海康威视数字技术股份有限公司 颜色分量的帧内预测方法、装置及计算机设备
US10674152B2 (en) * 2018-09-18 2020-06-02 Google Llc Efficient use of quantization parameters in machine-learning models for video coding
CN109996071B (zh) * 2019-03-27 2020-03-27 上海交通大学 基于深度学习的可变码率图像编码、解码系统及方法
CN111294595B (zh) * 2020-02-04 2022-01-07 清华大学深圳国际研究生院 一种基于深度强化学习的视频编码帧内码率控制方法
CN114827622A (zh) * 2021-01-19 2022-07-29 华为技术有限公司 分层编解码的方法及装置
CN113225554B (zh) * 2021-03-17 2022-08-16 北京大学 一种基于神经网络的图像编解码方法、装置、存储介质及终端
CN116320529A (zh) * 2021-12-10 2023-06-23 深圳市中兴微电子技术有限公司 视频码率控制方法及装置、计算机可读存储介质
CN114827607A (zh) * 2022-03-25 2022-07-29 李勤来 改进的大数据视频高保真传输编码调控方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103237210A (zh) * 2013-04-03 2013-08-07 中国科学技术大学 一种视频编码中比特分配的方法及系统
CN103888765A (zh) * 2014-03-27 2014-06-25 天格科技(杭州)有限公司 一种改进型R-λ模型H.265码率控制方法
CN106572351A (zh) * 2015-10-13 2017-04-19 腾讯科技(北京)有限公司 视频编码中的码率控制方法及装置
CN106791848A (zh) * 2016-12-20 2017-05-31 河南省电力勘测设计院 一种基于HEVC的Two‑Pass码率控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103237210A (zh) * 2013-04-03 2013-08-07 中国科学技术大学 一种视频编码中比特分配的方法及系统
CN103888765A (zh) * 2014-03-27 2014-06-25 天格科技(杭州)有限公司 一种改进型R-λ模型H.265码率控制方法
CN106572351A (zh) * 2015-10-13 2017-04-19 腾讯科技(北京)有限公司 视频编码中的码率控制方法及装置
CN106791848A (zh) * 2016-12-20 2017-05-31 河南省电力勘测设计院 一种基于HEVC的Two‑Pass码率控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"A convolutional neural network-based approach to rate control in HEVC intra coding";Ye Li et.al;《2017 IEEE Visual Communications and Image Processing(VCIP)》;20171213;全文 *
"Rate control by R-lambda model for HEVC";Bin Li.et.al;《Joint Collaborative Team on Video Coding (JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 11th Meeting: Shanghai, CN, 10–19 Oct. 2012,JCTVC-K0103》;20121010;全文 *
"基于支持向量机的HEVC中码率控制研究";余嘉旭;《中国优秀硕士学位论文全文数据库信息科技辑》;20150815;第I136-277页 *

Also Published As

Publication number Publication date
CN107277520A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN107277520B (zh) 帧内预测的码率控制方法
CN104796705B (zh) 一种基于ssim的hevc视频编码率失真优化与码率控制算法
CN101795415B (zh) 一种视频编码中的码率控制方法及其装置
CN106358040B (zh) 一种基于显著性的码率控制比特分配方法
CN108200431B (zh) 一种视频编码码率控制帧层比特分配方法
CN101507277A (zh) 图像编码/解码方法和设备
CN103782598A (zh) 用于无损编码的快速编码方法
CN111294595B (zh) 一种基于深度强化学习的视频编码帧内码率控制方法
CN106791848B (zh) 一种基于HEVC的Two-Pass码率控制方法
CN110225343B (zh) 一种视频编码的码率控制方法及装置
CN103327325A (zh) 基于hevc标准的帧内预测模式快速自适应选择方法
CN107846593B (zh) 一种率失真优化方法及装置
CN104185024B (zh) 一种基于总码率与信息熵模型的hevc量化参数优化方法
CN104104951A (zh) Hevc中屏幕内容编码的码率控制方法
CN111741300B (zh) 一种视频处理方法
CN106937112A (zh) 基于h.264视频压缩标准的码率控制方法
CN111314698A (zh) 一种图像编码处理方法及装置
CN103533365A (zh) 比特率控制方法与比特率控制系统
CN104994382A (zh) 一种感知率失真的优化方法
CN102300094A (zh) 一种视频编码方法
CN108040256A (zh) 一种基于h.265的码率控制方法、系统及装置
CN104333761A (zh) 一种hevc基本单元级码率分配方法
CN104601992A (zh) 基于贝叶斯最小风险决策的skip模式快速选择方法
CN112468808B (zh) 一种基于强化学习的i帧目标带宽分配方法及装置
CN108881905A (zh) 基于概率的帧内编码器优化方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant