CN101547349B - 一种对视频信号的二次avs编码码率控制的方法 - Google Patents
一种对视频信号的二次avs编码码率控制的方法 Download PDFInfo
- Publication number
- CN101547349B CN101547349B CN 200910097981 CN200910097981A CN101547349B CN 101547349 B CN101547349 B CN 101547349B CN 200910097981 CN200910097981 CN 200910097981 CN 200910097981 A CN200910097981 A CN 200910097981A CN 101547349 B CN101547349 B CN 101547349B
- Authority
- CN
- China
- Prior art keywords
- field picture
- time
- image
- scene
- present image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种对视频信号的二次AVS编码码率控制的方法,优点在于结合分析AVS编码的重要特征,在初次编码中详细统计和记录视频信号的重要编码信息,更符合人眼系统的SSIM值;在数据处理过程中,根据前面的统计数据,分析每个场景、每个帧的复杂度等视频特性,在满足VBR码率和缓冲区下溢约束的前提下,将比特总数有效地重新调整和分配给每一帧;在第二次编码中,再根据R-D模型计算量化参数,并且对量化参数进行适当轻微的调整,本发明不仅能够保证总体比特数预算和缓冲区约束,而且能够获得SSIM和PSNR极小波动的恒定视频质量,是单次码率控制方法所不能及的,在视频存储应用领域,较好的解决了视频质量和总存储空间之间的矛盾。
Description
技术领域
本发明涉及一种视频信号的码率控制方法,尤其是涉及一种对视频信号的二次AVS编码码率控制的方法。
背景技术
AVS(Audio Video coding Standard,数字音视频编解码技术标准)是中国第一个具有自主知识产权的第二代数字音视频编解码标准,全称是《信息技术先进音视频编码标准》,它的编码效率和竞争性与国际标准MPEG-4/H.264相当,代表了当前国际先进水平。
码率控制是视频编码的重要组成部分,特别是在视频传输、视频存储等应用领域中都起着极为突出的作用。码率控制直接影响着视频编码的性能,针对具体应用需求,开发适当的码率控制方法,是视频编码重要的研究方向。
码率控制根据输出码率特点,可以分为CBR(Constant Bit Rate,恒定码率)和VBR(Variable Bit Rate,可变码率)码率控制。在CBR码率控制方式下,不管视频复杂与否,码率总是保持不变,这样造成简单的场景图像质量较高,复杂的场景图像质量相对较低,整个视频质量波动较大。而在VBR码率控制方式下允许码率在一定范围内变化,简单的场景分配较少的比特数,节省下来的比特数分配给复杂度较高的场景,在一定程度上使视频前后质量波动较小。
码率控制根据编码次数,可以分为单次编码和多次编码码率控制。单次编码码率控制利用先前已编码图像的统计信息、预测当前编码图像的特性再结合缓冲器约束等因素来控制编码参数,单次编码码率控制主要用于实时编码系统,但由于未编码图像的复杂度特征具有不确定性,因此单次编码码率控制很难达到理想的效果。多次编码码率控制在无需实时的编码系统中有广泛应用,如DVD(Digital Video Disk,数字视频光盘)、VOD(Video On Demand,视频点播)存储等并不要求实时编码,只需在给定的最大存储空间内使视频质量达到最优。这样就允许首先对整个视频信号序列进行初次编码,然后对初次编码后的视频信号序列的各个图像的特征统计信息进行分析,再计算调整编码参数,使编码性能趋向最优,如果不考虑编码时间,可对一个视频信号序列进行多次编码,直到编码性能达到给定要求,只有进行多次编码码率控制,比特数分配才能更加合理,从而整个视频序列在编码后产生相对恒定的视频质量。以经典的二次编码码率控制方法为例:第一阶段,在第一次编码中,编码器采用CBR码率控制方式,在编码过程中保存采用CBR码率控制进行编码得到的图像特征数据;第二阶段,对第一次编码得到的图像特征数据进行分析处理,为第二次编码所用;第三阶段,编码器根据第二阶段分析得到的信息调整编码参数进行第二次编码,编码器采用VBR码率控制方式,基本原理如图1所示。但目前利用上述经典的二次编码码率控制方法,在AVS在视频存储中应用还没有记载。
发明内容
本发明所要解决的技术问题是提供一种不但能有效解决存储空间和视频质量之间的矛盾,而且能保证视频质量更加平缓的AVS二次编码码率控制方法。
本发明解决上述技术问题所采用的技术方案是:一种对视频信号的二次AVS编码码率控制的方法,整个处理过程包括第一次编码阶段、数据处理阶段和第二次编码阶段,在所述的第一次编码阶段中采用CBR码率控制AVS编码方式进行编码,在所述的第二次编码阶段采用VBR码率控制AVS编码方式进行编码,在所述的第一次编码阶段首先给每个图像组预分配目标比特数,然后计算每个图像组中各帧图像的量化参数,再根据各帧图像的量化参数,采用CBR码率控制AVS编码方式对各帧图像进行第一次编码,编码后统计各帧图像的帧类型、各帧图像的量化步长、各帧图像的实际消耗比特数、各帧图像的全局复杂度及各帧图像的结构相似度值;在所述的数据处理阶段首先计算视频信号中除第1个P帧图像以外的各个P帧图像的实际消耗比特数与结构相似度值的比值,根据前后两个P帧图像的实际消耗比特数与结构相似度值的比值判断是否发生场景切换,当发生场景切换时将后一个P帧图像所在的图像组的前部分图像并入前一个图像组中及将该P帧图像和该P帧图像所在的图像组的后部分图像并入下一个图像组中,然后计算重组图像组后视频信号中的各帧图像的复杂度、视频信号的总复杂度及各帧图像在第二次编码阶段中所需的目标比特数,再将重组图像组后得到的每个图像组作为一个场景,计算所有场景的场景复杂度调整因子,根据场景复杂度调整因子调整各帧图像在第二次编码阶段中所需的目标比特数,最后根据每个场景中的各帧图像移出之前的缓冲区状态和各帧图像在第二次编码阶段中所需的目标比特数,确定是否调整每个场景中的部分图像在第二次编码阶段中所需的目标比特数;在所述的第二次编码阶段判断进行第二次编码的当前图像是否为视频信号的第1帧图像或第2帧图像,如果是,则直接根据第一次编码后统计得到的当前图像的全局复杂度和当前图像在第二次编码阶段中所需的目标比特数,计算当前图像在第二次编码时所需的量化步长,将量化步长转换为量化参数,根据量化参数对当前图像进行第二次编码,否则,首先微调当前图像在第二次编码阶段中所需的目标比特数,然后根据第一次编码后统计得到的当前图像的全局复杂度和微调后的目标比特数,计算当前图像在第二次编码时所需的量化步长,再将量化步长转换为量化参数,并对量化参数进行修正,同时将量化参数限制在AVS量化参数极值范围内,最后根据量化参数对当前图像进行第二次编码。
具体包括以下步骤:
①-1、将输入的视频信号划分成多个图像组,每个图像组在AVS编码格式下包括I帧、P帧和B帧三种类型的图像,给每个图像组预分配目标比特数,记预分配给第i个图像组的目标比特数为T(i), 其中,R为目标码率,F为帧率,Ngop,i为第i个图像组所包含的图像的帧数,Tremaning(i-1)表示第i-1个图像组的剩余比特数,Tremaning(i-1)的值为第i-1个图像组的目标比特数T(i-1)与第i-1个图像组所包含的所有图像的实际消耗比特数和的差,Tremaning(0)=0,i∈[1,n1],n1为输入的视频信号所包含的图像组的个数;
①-2、计算每个图像组中各帧图像的量化参数,对于第i个图像组,定义第i个图像组为当前图像组,定义当前正在处理的第j帧图像为当前图像,当当前图像为I帧图像时,判断当前图像组是否为第1个图像组,如果是,则该当前图像的量化参数为设定值,否则,该当前图像的量化参数值为当前图像组的前一个图像组所包含的所有图像的量化参数的平均值;当当前图像为P帧图像时,判断当前图像组是否为第1个图像组,如果是,则该当前图像的量化参数为设定值,否则,首先计算该当前图像的目标比特数 其中,β=0.5, R为目标码率,F为帧率, Wp(ni,j-1)=b(ni,j-1)×QP(ni,j-1), b(ni,j-1)为当前图像组中的第j-1帧图像的实际消耗比特数,QP(ni,j-1)为当前图像组中的第j-1帧图像的量化参数,Tr(ni,j)为当前图像组的剩余可用比特数,Np,r(j-1)为当前图像组中未编码的P帧图像的帧数,Nb,r(j-1)为当前图像组中未编码的B帧图像的帧数,i∈[1,n1],n1为输入的视频信号所包含的图像组的个数,j∈[1,Ngop,i],Ngop,i为当前图像组所包含的图像的帧数,然后计算当前图像的量化步长QPStep, 其中,X为前一个P帧图像的全局复杂度,其值为前一个P帧图像的实际消耗比特数和前一个P帧图像的量化步长的乘积,再将计算得到的量化步长转换成量化参数;当当前图像为B帧图像时,利用线性插值方法计算当前图像的量化参数;
①-3、根据计算得到的每个图像组中各帧图像的量化参数,采用CBR码率控制AVS编码方式对各帧图像进行第一次编码,第一次编码后统计各帧图像的帧类型、各帧图像的量化步长、各帧图像的实际消耗比特数、各帧图像的全局复杂度及各帧图像的结构相似度值,对于视频信号中的第l帧图像,记第l帧图像的量化步长为Q_Stepl,记第l帧图像的实际消耗比特数为bl,记第l帧图像的全局复杂度为xl,记第l帧图像的结构相似度值为SSIMl,根据各帧图像的结构相似度值计算所有图像的结构相似度值的平均值SSIMave, 其中,l∈[1,Total_pic],Total_pic表示视频信号所包含的图像的总帧数;
②-1、计算视频信号中除第1个P帧图像以外的各个P帧图像的实际消耗比特数与结构相似度值的比值,对于第k个P帧图像,记该P帧图像的实际消耗比特数与结构相似度值的比值为ratiok,记该P帧图像的前一个P帧图像的实际消耗比特数与结构相似度值的比值为ratiok-1,判断ratiok和ratiok-1的商是否超出设定的阈值区间,如果是,则确定发生场景切换,并以该P帧图像为界将该P帧图像所在的图像组中的前部分图像并入该P帧图像所在的图像组的前一个图像组中,以及将该P帧图像和该P帧图像所在的图像组中的后部分图像并入该P帧图像所在的图像组的下一个图像组中,然后将该P帧图像的帧类型修改为I帧图像,再将下一个图像组中的I帧图像的帧类型修改为P帧图像;否则,确定未发生场景切换;
②-2、计算重组图像组后视频信号中的各帧图像的复杂度,对于视频信号中的第l帧图像,记该帧图像的复杂度为SSIM_Xl, 其中,Kl T为该帧图像的帧类型权重系数,bl为第一次编码后统计的第l帧图像的实际消耗比特数,Q_Stepl是第一次编码后统计的第l帧图像的量化步长,SSIMl为第一次编码后统计的第l帧图像的结构相似度值,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值;
②-3、计算视频信号的总复杂度TotalSSIM_X, 其中,Total_pic表示视频信号所包含图像的总帧数;然后计算各帧图像在第二次编码阶段中所需的目标比特数,对于视频信号中的第l帧图像,记该帧图像在第二次编码阶段中所需的目标比特数为b2,l, 其中,b2,total表示视频信号的总目标比特数;
②-4、将重组图像组后得到的每个图像组作为一个场景,计算所有场景的场景复杂度调整因子,对于第m个场景,记该场景的场景复杂度调整因子为μm, 其中,sign()为取正负号函数,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值,SSIMave,m为第m个场景中所有图像的结构相似度值的平均值;当μm<1时,将第m个场景中的每帧图像在第二次编码阶段中所需的目标比特数乘以μm,对于视频信号中的第l帧图像,设该帧属于第m个场景,调整该帧图像在第二次编码阶段中所需的目标比特数,b2,l=b2,l×μm,其中,式左边的b2,l表示调整后的目标比特数,式右边的b2,l表示调整前的目标比特数,然后将该帧图像节省的比特数b2,l×(1-μm)累加到Bremaining,Bremaining=Bremaining+b2,l×(1-μm),Bremaining的初始值为0;当μm>1时,计算SUMμ,SUMμ=SUMμ+μm×NUMsence,m,其中,NUMsence,m表示第m个场景所包含图像的帧数,SUMμ的初始值为0;
②-5、在步骤②-4处理完成后再次遍历每个场景,判断μm是否大于1,如果μm>1,则修正第m个场景中的每帧图像在第二次编码阶段中所需的目标比特数,对于视频信号中的第l帧图像,设该帧图像属于第m个场景,修正该帧图像在第二次编码阶段中所需的目标比特数, 其中,式左边的b2,l表示修正后的目标比特数,式右边的b2,l表示修正前的目标比特数,μm为第m个场景的场景复杂度调整因子;
②-6、首先计算每个场景中的每帧图像的缓冲区溢出的比特数,对于第m个场景中的第q帧图像,判断Bm,q-Bguard-b2,m,q是否小于0,如果Bm,q-Bguard-b2,m,q小于0,则计算该帧图像缓冲区溢出的比特数OverBm,q,OverBm,q=Bm,q-Bguard-b2,m,q,并且更新p=q以及对应的OverBm,OverBm=OverBm+OverBm,q,其中,OverBm的初始值为0,Bm,q表示第m个场景中的第q帧图像移出之前的缓冲区状态,Bmax为缓冲区的大小,为第m-1个场景中的最后一帧图像移出之前的缓冲区状态,Bm,q-1表示第m个场景中的第q-1帧图像移出之前的缓冲区状态,Rmax为传输带宽允许最大码率,F为帧率,Bguard为缓冲区保护值,Bguard=0.2Bmax,b2,m,q为第m个场景中的第q帧图像在第二次编码阶段中所需的目标比特数;如果OverBm小于零,然后修正第m-1个场景中所有图像和第m个场景中第1帧到第p帧图像在第二次编码阶段中所需的目标比特数,对于第m个场景中第1帧到第p帧图像中的第q帧图像,修正该图像在第二次编码阶段中所需的目标比特数,b2,m,q=b2,m,q+OverBm/(NUMsence,m-1+p),其中,式左边的b2,m,q表示修正后的目标比特数,式右边的b2,m,q表示修正前的目标比特数,OverBm表示第m个场景中溢出的比特总数,OverBm的初始值为0,NUMsence,m-1表示第m-1个场景所包含图像的帧数,对于第m-1个场景中的NUMsence,m-1帧图像,采用b2,m-1,q=b2,m-1,q+OverBm/(NUMsence,m-1+p)修正NUMsence,m-1帧图像在第二次编码阶段中所需的目标比特数;如果第m个场景中的所有图像均没有发生缓冲区溢出,则在此步骤中对第m-1个场景中的所有图像和第m个场景中的所有图像在第二次编码阶段中所需的目标比特数不进行修正;
③-1、采用VBR码率控制AVS编码方式对经第一次编码后的视频信号的各帧图像进行第二次编码,对于需进行第二次编码的视频信号中的第l帧图像,定义第l帧图像为当前图像,判断当前图像是否为第1帧图像或第2帧图像,如果是,则根据第一次编码后统计得到的当前图像的全局复杂度Xl和当前图像在第二次编码阶段中所需的目标比特数b2,l,计算当前图像在第二次编码时所需的量化步长QStep2,l, 再将当前图像在第二次编码时所需的量化步长QStep2,l转化成量化参数QP2,l,其中,l∈[1,Total_pic′],Total_pic′表示需进行第二次编码的视频信号所包含的图像的总帧数,Total_pic′=Total_pic,然后转到步骤③-5并继续执行;否则,继续执行;
③-2、对当前图像在第二次编码阶段中所需的目标比特数b2,l进行微调, 其中,式左边的b2,l表示微调后的目标比特数,式右边的b2,l表示微调前的目标比特数,λl-1为第l-1帧图像的调整因子,λl-2为第l-2帧图像的调整因子,然后根据第一次编码后统计得到的当前图像的全局复杂度Xl和微调后的目标比特数b2,l,计算当前图像在第二次编码时所需的量化步长QStep2,l,
③-3、判断或者是否成立,如果成立,通过 调整当前图像在第二次编码时所需的量化步长,其中,式左边的QStep2,l表示调整后的量化步长,式右边的QStep2,l表示调整前的量化步长,η为一个乘法因子, Bmax为缓冲区的大小,λl-1为第l-1帧图像的调整因子,λl-2为第l-2帧图像的调整因子;
③-4、将当前图像在第二次编码时所需的量化步长QStep2,l转化为量化参数QP2,l,然后通过QP2,l=min{QP2,l+3,max{QP2,l-1-3,QP2,l}}对当前图像在第二次编码时所需的量化参数进行修正,其中,式左边的QP2,l表示修正后的量化参数,式右边的QP2,l表示修正前的量化参数,QP2,l-1为第l-1帧图像在第二次编码时所需的量化参数,再通过QP2,l=min{63,max{QP2,l,1}}将修正后的量化参数限制在AVS量化参数极值范围内,其中,式左边的QP2,l表示限制后的量化参数,式右边的QP2,l表示限制前的量化参数;
③-5、利用当前图像的量化参数对当前图像进行第二次编码,然后计算当前图像的结构相似度值SSIM2,l,再判断当前图像的帧类型是否为I帧图像,如果是,则当前图像的调整因为λl=1,否则,当前图像的调整因子为λl=sqrt(SSIM2,l/SSIMave),其中,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值;
③-6、计算δl=δl-1+actual_bits2,l-1-b2,l-1,其中,δ0=0,actual_bits2,l-1为第l-1帧图像第二次编码后的实际消耗比特数,b2,l-1为第l-1帧图像在第二次编码阶段中所需的目标比特数。
所述的步骤①-2中的设定值为30。
所述的步骤①-2中利用线性插值方法计算当前图像的量化参数的具体过程为:a.记两个P帧图像之间的连续B帧图像的帧数为L,记前一个P帧图像的量化参数为QP1,记后一个P帧图像的量化参数为QP2;b.根据QP1和QP2,计算当前图像的量化参数,当L=1时,当前图像的量化参数为 当L>1且当前图像为两个P帧图像之间的第s个B帧图像时,当前图像的量化参数为 其中,s∈[1,L],
所述的步骤②-1中设定的阈值区间为[0.6,1.5]。
与现有技术相比,本发明的优点在于结合分析AVS编码的重要特征,在初次编码中详细统计和记录视频信号的重要编码信息如各帧图像的帧类型、各帧图像的量化步长、各帧图像的实际消耗比特数、各帧图像的全局复杂度及各帧图像的结构相似度值,更符合人眼系统的SSIM值;在数据处理过程中,根据前面的统计数据,深入分析每个场景、每个帧的复杂度等视频特性,对整个视频信号序列有全体统筹的前提下,根据每一帧和每个场景的特性,在满足VBR码率和缓冲区下溢约束的前提下,将比特总数精确有效地重新调整和分配给每一帧;在第二次编码中,再根据已获知的R-D模型计算量化参数,然后精细效果,并且对量化参数进行适当轻微的调整,本发明不仅能够保证总体比特数预算和缓冲区约束,而且能够获得SSIM和PSNR极小波动的恒定视频质量,是单次码率控制方法所不能及的,在视频存储应用领域,较好的解决了视频质量和总存储空间之间的矛盾。
附图说明
图1为视频信号的二次编码码率控制的基本原理框图;
图2为本发明方法的初次CBR流程图;
图3为在初始目标码率为1Mbps时采用本发明方法与采用JVT-H017方法产生的PSNR统计曲线的统计比较图;
图4为在初始目标码率为1Mbps时采用本发明方法与采用JVT-H017方法产生的SSIM统计曲线的统计比较图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
图像质量评价方法可用来评价图像质量的好坏、码率控制方法的优劣,从而指导码率控制方法的发展,因此在图像处理领域,图像质量评价至关重要。
目前较常用的视频质量客观评价方法有均方误差(MSE,Mean Square Error)、峰值信噪比(PSNR,Peak Signal to Noise Ratio)或MSE的变形,这些方法计算简单,物理意义明确,但都没有充分考虑人眼视觉特性,以致造成客观评价结果与视觉效果不一致,因此研究基于人类视觉系统(HVS,Human Visual System),且和主观评分相一致的视频质量客观评价方法,一直是研究追求的目标。
大量的事实证明,图像具有很强的结构特性,图像的结构携带了图像最主要的信息,人类视觉系统的主要功能是提取视觉区域的图像的结构性信息。在此理论基础上,ZhouWang等人在2004年提出了结构相似度(SSIM,Structural Similarity)图像质量评价方法,该方法将原始图像和失真的重构图像都分成重叠或不重叠的子块,计算重构图像中的子块和相应位置的原图图像中的子块的结构相似度,计算公式为:SSIM(x,y)=[l(x,y)]α·[c(x,y)]β·[s(x,y)]γ,其中,x和y表示参考图像和失真图像的子块;l(x,y)代表亮度比较,c(x,y)代表对比度比较,s(x,y)代表结构比较;其中 其中 N为子块像素点的数目,参数α,β,γ均大于零,用来调整三个比较函数所占比重,在实际应用中参数α,β,γ的值可均取1。
整幅图像结构相似度定义为: 其中,X和Y表示参考图像和失真图像,M是图像分块的数目,xj和yj是对应的第j个子块图像。大量的实验证明SSIM优于PSNR,所以本发明方法采用了SSIM值来调整码率控制的相关参数。
本发明方法的整个处理过程包括第一次编码阶段、数据处理阶段和第二次编码阶段,在第一次编码阶段中采用CBR码率控制AVS编码方式进行编码,在第二次编码阶段采用VBR码率控制AVS编码方式进行编码。如图2所示,在第一次编码阶段首先给每个图像组预分配目标比特数,然后计算每个图像组中各帧图像的量化参数,再根据各帧图像的量化参数,采用CBR码率控制AVS编码方式对各帧图像进行第一次编码,编码后统计各帧图像的帧类型、各帧图像的量化步长、各帧图像的实际消耗比特数、各帧图像的全局复杂度及各帧图像的结构相似度值,给预分配给各帧图像在第二次编码阶段中所需的目标比特数提供了可靠的依据。在数据处理阶段首先计算视频信号中除第1个P帧图像以外的各个P帧图像的实际消耗比特数与结构相似度值的比值,根据前后两个P帧图像的实际消耗比特数与结构相似度值的比值可以精确的检测到视频信号中是否发生场景切换,当发生场景切换时将后一个P帧图像所在的图像组的前部分图像并入前一个图像组中及将该P帧图像和该P帧图像所在的图像组的后部分图像并入下一个图像组中,然后计算重组图像组后视频信号中的各帧图像的复杂度、视频信号的总复杂度及各帧图像在第二次编码阶段中所需的目标比特数,再将重组图像组后得到的每个图像组作为一个场景,计算所有场景的场景复杂度调整因子等视频特性,根据场景复杂度调整因子调整各帧图像在第二次编码阶段中所需的目标比特数,最后根据每个场景中的各帧图像移出之前的缓冲区状态和各帧图像在第二次编码阶段中所需的目标比特数,确定是否调整每个场景中的部分图像在第二次编码阶段中所需的目标比特数,即在满足VBR的码率和缓冲区下溢约束的前提下,将每帧图像在第二次编码阶段中所需的目标比特数精确有效地分配给每帧图像。在第二次编码阶段判断当前需进行第二次编码的当前图像是否为视频信号的第1帧图像或第2帧图像,如果是,则直接根据第一次编码后统计得到的当前图像的全局复杂度和当前图像在第二次编码阶段中所需的目标比特数,计算当前图像在第二次编码时所需的量化步长,将量化步长转换为量化参数,根据量化参数对当前图像进行第二次编码,否则,首先适当的微调当前图像在第二次编码阶段中所需的目标比特数,然后根据第一次编码后统计得到的当前图像的全局复杂度和微调后的目标比特数,计算当前图像在第二次编码时所需的量化步长,再将量化步长转换为量化参数,并对量化参数进行修正,同时将量化参数限制在AVS量化参数极值范围内,最后根据量化参数对当前图像进行第二次编码。
本发明方法包括以下具体步骤:
①-1、将输入的视频信号划分成多个图像组,每个图像组在AVS编码格式下包括I帧、P帧和B帧三种类型的图像,不管图像组的视频特性,给每个图像组预分配基本相同的目标比特数,记预分配给第i个图像组的目标比特数为T(i), 其中,R为目标码率,F为帧率,Ngop,i为第i个图像组所包含的图像的帧数,Tremaning(i-1)表示第i-1个图像组的剩余比特数,Tremaning(i-1)的值为第i-1个图像组的目标比特数T(i-1)与第i-1个图像组所包含的所有图像的实际消耗比特数和的差,Tremaning(0)=0,i∈[1,n1],n1为输入的视频信号所包含的图像组的个数。
①-2、计算每个图像组中各帧图像的量化参数,对于第i个图像组,定义第i个图像组为当前图像组,定义当前正在处理的第j帧图像为当前图像,当当前图像为I帧图像时,判断当前图像组是否为第1个图像组,如果是,则该当前图像的量化参数为设定值,否则,该当前图像的量化参数值为当前图像组的前一个图像组所包含的所有图像的量化参数的平均值;当当前图像为P帧图像时,判断当前图像组是否为第1个图像组,如果是,则该当前图像的量化参数为设定值,否则,首先计算该当前图像的目标比特数f(ni,j), 其中,β=0.5, R为目标码率,F为帧率, Wp(ni,j-1)=b(ni,j-1)×QP(ni,j-1), b(ni,j-1)为当前图像组中的第j-1帧图像的实际消耗比特数,QP(ni,j-1)为当前图像组中的第j-1帧图像的量化参数,Tr(ni,j)为当前图像组的剩余可用比特数,Np,r(j-1)为当前图像组中未编码的P帧图像的帧数,Nb,r(j-1)为当前图像组中未编码的B帧图像的帧数,i∈[1,n1],n1为输入的视频信号所包含的图像组的个数,j∈[1,Ngop,i],Ngop,i为当前图像组所包含的图像的帧数,然后计算当前图像的量化步长QPStep, 其中,X为前一个P帧图像的全局复杂度,其值为前一个P帧图像的实际消耗比特数和前一个P帧图像的量化步长的乘积,再将计算得到的量化步长转换成量化参数;当当前图像为B帧图像时,利用线性插值方法计算当前图像的量化参数。
在此步骤中设定值的值取30,因为AVS标准中的量化参数的取值范围是1到63,在本实施例中取30,也可取其它值。
在此步骤中利用线性插值方法计算当前图像的量化参数的具体过程为:a.记两个P帧图像之间的连续B帧图像的帧数为L,记前一个P帧图像的量化参数为QP1,记后一个P帧图像的量化参数为QP2;b.根据QP1和QP2,计算当前图像的量化参数,当L=1时,当前图像的量化参数为 当L>1且当前图像为两个P帧图像之间的第s个B帧图像时,当前图像的量化参数为 其中,s∈[1,L],
①-3、根据计算得到的每个图像组中各帧图像的量化参数,采用CBR码率控制AVS编码方式对各帧图像进行第一次编码,第一次编码后统计各帧图像的帧类型、各帧图像的量化步长、各帧图像的实际消耗比特数、各帧图像的全局复杂度及各帧图像的结构相似度值,对于视频信号中的第l帧图像,记第l帧图像的量化步长为Q_Stepl,记第l帧图像的实际消耗比特数为bl,记第l帧图像的全局复杂度为Xl,记第l帧图像的结构相似度值为SSIMl,根据各帧图像的结构相似度值计算所有图像的结构相似度值的平均值SSIMave, 其中,l∈[1,Total_pic],Total_pic表示视频信号所包含的图像总帧数。
②-1、计算视频信号中除第1个P帧图像以外的各个P帧图像的实际消耗比特数与结构相似度值的比值,对于第k个P帧图像,记该P帧图像的实际消耗比特数与结构相似度值的比值为ratiok,记该P帧图像的前一个P帧图像的实际消耗比特数与结构相似度值的比值为ratiok-1,判断ratiok和ratiok-1的商是否超出设定的阈值区间,如果是,则确定发生场景切换,并以该P帧图像为界将该P帧图像所在的图像组中的前部分图像并入该P帧图像所在的图像组的前一个图像组中,以及将该P帧图像和该P帧图像所在的图像组中的后部分图像并入该P帧图像所在的图像组的下一个图像组中,然后将该P帧图像的帧类型修改为I帧图像,再将下一个图像组中的I帧图像的帧类型修改为P帧图像;否则,确定未发生场景切换。
在此步骤中设定的阈值区间为[0.6,1.5]。
②-2、计算重组图像组后视频信号中的各帧图像的复杂度,对于视频信号中的第l帧图像,记该帧图像的复杂度为SSIM_Xl, 其中,Kl T为该帧图像的帧类型权重系数,bl为第一次编码后统计的第l帧图像的实际消耗比特数,Q_Stepl是第一次编码后统计的第l帧图像的量化步长,SSIMl为第一次编码后统计的第l帧图像的结构相似度值,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值。
②-3、计算视频信号的总复杂度TotalSSIM_X, 其中,Total_pic表示视频信号所包含的图像的总帧数;然后计算各帧图像在第二次编码阶段中所需的目标比特数,对于视频信号中的第l帧图像,记该帧图像在第二次编码阶段中所需的目标比特数为b2,l, 其中,b2,total表示视频信号的总目标比特数。
②-4、将重组图像组后得到的每个图像组作为一个场景,计算所有场景的场景复杂度调整因子,对于第m个场景,记该场景的场景复杂度调整因子为μm, 其中,sign()为取正负号函数,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值,SSIMave,m为第m个场景中所有图像的结构相似度值的平均值;当μm<1时,将第m个场景中的每帧图像在第二次编码阶段中所需的目标比特数乘以μm,对于视频信号中的第l帧图像,设该帧图像属于第m个场景,调整该帧图像在第二次编码阶段中所需的目标比特数,b2,l=b2,l×μm,其中,式左边的b2,l表示调整后的目标比特数,式右边的b2,l表示调整前的目标比特数,然后将该帧图像节省的比特数b2,l×(1-μm)累加到Bremaining中,Bremaining+=b2,l×(1-μm),Bremaining的初始值为0;当μm>1时,计算SUMμ,SUMμ+=μm×NUMsence,m,其中,NUMsence,m表示第m个场景所包含图像的帧数,SUMμ的初始值为0。
②-5、在步骤②-4处理完成后再次遍历每个场景,判断μm是否大于1,如果μm>1,则修正第m个场景中的每帧图像在第二次编码阶段中所需的目标比特数,对于视频信号中的第l帧图像,设该图像属于第m个场景,修正该图像在第二次编码阶段中所需的目标比特数, 其中,式左边的b2,l表示修正后的目标比特数,式右边的b2,l表示修正前的目标比特数,μm为第m个场景的场景复杂度调整因子。
②-6、缓冲区下溢保护,缓冲区下溢保护处理原理为,更新缓冲区状态,B0=Bmax(缓冲区的初始状态为缓冲区的大小Bmax),Bt=min(Bmax,Bt-1-bt-1,real+RmaxTt-1),其中Bt-1为第t-1帧图像的缓冲区状态,bt-1,real为第t-1帧图像的实际消耗比特数,Rmax为传输带宽允许最大码率,Tt-1为编码每一帧图像所需的时间,为防止缓冲区下溢,Bt必须满足条件:Bt>=bt,real,bt,real为第t帧图像的实际消耗比特数。
在上述原理的基础上,本发明方法采用如下方法:首先计算每个场景中的每帧图像的缓冲区溢出的比特数,对于第m个场景中的第q帧图像,判断Bm,q-Bguard-b2,m,q是否小于0,如果Bm,q-Bguard-b2,m,q小于0,则计算该图像缓冲区溢出的比特数OverBm,q,OverBm,q=Bm,q-Bguard-B2,m,q,并且更新p=q以及对应的OverBm,OverBm=OverBm+OverBm,q,更新p的值目的是将q的最大值赋值给p,其中,OverBm的初始值为0,Bm,q表示第m个场景中的第q帧图像移出之前的缓冲区状态,Bmax为缓冲区的大小,为第m-1个场景中的最后一帧图像移出之前的缓冲区状态,Bm,q-1表示第m个场景中的第q-1帧图像移出之前的缓冲区状态,Rmax为传输带宽允许最大码率,F为帧率,Bguard为缓冲区保护值,Bguard=0.2Bmax,b2,m,q为第m个场景中的第q帧图像在第二次编码阶段中所需的目标比特数;如果OverBm小于零,然后修正第m-1个场景中所有图像和第m个场景中第1帧到第p帧图像在第二次编码阶段中所需的目标比特数,对于第m个场景中第1帧到第p帧图像的第q帧图像,修正该图像在第二次编码阶段中所需的目标比特数,b2,m,q=b2,m,q+OverBm/(NUMsence,m-1+p),其中,OverBm为负数,式左边的b2,m,q表示修正后的目标比特数,式右边的b2,m,q表示修正前的目标比特数,OverBm表示第m个场景中溢出的比特总数,OverBm的初始值为0,NUMsence,m-1表示第m-1个场景所包含图像的帧数,对于第m-1个场景中的NUMsence,m-1帧图像,采用b2,m-1,q=b2,m-1,q+OverBm/(NUMsence,m-1+p)修正NUMsence,m-1帧图像在第二次编码阶段中所需的目标比特数,其中OverBm为负数;如果第m个场景中的所有图像均没有发生缓冲区溢出,则在此步骤中对第m-1个场景中的所有图像和第m个场景中的所有图像在第二次编码阶段中所需的目标比特数不进行修正。
缓冲区下溢是因为连续若干帧图像的目标比特数较大而引起缓冲区所存储的比特数不足于显示下一帧图像,本发明运用以二个图像组为保护缓冲区下溢的单位,有助于图像质量的连续性。
③-1、采用VBR码率控制AVS编码方式对经第一次编码后的视频信号的各帧图像进行第二次编码,对于需进行第二次编码的视频信号中的第l帧图像,定义第l帧图像为当前图像,判断当前图像是否为第1帧图像或第2帧图像,如果是,则根据第一次编码后统计得到的当前图像的全局复杂度Xl和当前图像在第二次编码阶段中所需的目标比特数b2,l,计算当前图像在第二次编码时所需的量化步长QStep2,l, 再将当前图像在第二次编码时所需的量化步长QStep2,l转化成量化参数QP2,l,其中,l∈[1,Total_pic′],Total_pic′表示需进行第二次编码的视频信号所包含的图像的总帧数,Total_pic′Total_pic,然后转到步骤③-5并继续执行;否则,继续执行。
③-2、对当前图像在第二次编码阶段中所需的目标比特数b2,l进行微调, 其中,式左边的b2,l表示微调后的目标比特数,式右边的b2,l表示微调前的目标比特数,λl-1为第l-1帧图像的调整因子,λl-2为第l-2帧图像的调整因子,然后根据第一次编码后统计得到的当前图像的全局复杂度Xl和微调后的目标比特数b2,l,计算当前图像在第二次编码时所需的量化步长QStep2,l,
③-3、判断或者是否成立,如果成立,通过 调整当前图像在第二次编码时所需的量化步长,其中,式左边的QStep2,l表示调整后的量化步长,式右边的QStep2,l表示调整前的量化步长,η为一个乘法因子,η的经验值可用式 表示,Bmax为缓冲区的大小,λl-1为第l-1帧图像的调整因子,λl-2为第l-2帧图像的调整因子。
③-4、将当前图像在第二次编码时所需的量化步长QStep2,l转化为量化参数QP2,l,为保证视频信号质量的连续性,通过QP2,l=min{QP2,l+3,max{QP2,l-3,QP2,l}}对当前图像在第二次编码时所需的量化参数进行修正,其中,式左边的QP2,l表示修正后的量化参数,式右边的QP2,l表示修正前的量化参数,QP2,l-1为第l-1帧图像在第二次编码时所需的量化参数,再通过QP2,l=min{63,max{QP2,l,1}}将修正后的量化参数限制在AVS量化参数极值范围内,其中,式左边的QP2,l表示限制后的量化参数,式右边的QP2,l表示限制前的量化参数。
③-5、利用当前图像的量化参数对当前图像进行第二次编码,然后计算当前图像的结构相似度值SSIM2,l,再判断当前图像的帧类型是否为I帧图像,如果是,则当前图像的调整因为λl=1,否则,当前图像的调整因子为λl=sqrt(SSIM2,l/SSIMave),其中,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值。
③-6、计算δl=δl-1+actual_bits2,l-1-b2,l-1,其中,δ0=0,actual_bits2,l-1为第l-1帧图像第二次编码后的实际消耗比特数,b2,l-1为第l-1帧图像在第二次编码阶段中所需的目标比特数。
以下将对本发明方法与现有的方法进行比较,以客观的说明本发明方法是有效可行的。
在AVS编码器上实现本发明的码率控制方法,并与JVT提出的JVT-H017算法实验结果做比较。因为实际中的视频信号序列几乎都是由很多场景组成,复杂度波动性较大,为了使实验结果更具备说服力,与以往很多文献里的取单一场景复杂度波动小的测试序列不同,在此选取由coastguard、container、flower、hall、mobile、news、Sign_Irene、waterfall八个测试序列各300帧图像拼接组成CIF格式测试序列,取这样的测试序列2400帧图像在不同初始目标码率和帧率为30fps条件下进行测试,实验结果数据如表1所示。
表1采用本发明方法与JVT-H017方法SSIM值和PSNR值比较表
为了更好的说明实验结果,本发明取更代表人眼视觉系统的SSIM和普遍使用的PSNR两个方法来说明,从表1中可以轻易的发现,本发明和JVT-H017提案相比,虽然PSNR平均值稍微降低,SSIM平均值基本相当,但是从PSNR和SSIM这两个均方差来看,JVT-H017只有本发明的20%左右,可以看出视频质量的恒定性得到了可观的改善。图3为在初始目标码率为1Mbps时采用本发明方法与采用JVT-H017方法产生的PSNR统计曲线的统计比较图,图4为在初始目标码率为1Mbps时采用本发明方法与采用JVT-H017方法产生的SSIM统计曲线的统计比较图,从两个图中更能直观的看出本发明的质量更平缓。根据HVS特性,在PSNR、SSIM平均值接近的条件下,波动性对主观质量影响更大,所以本发明的效果是突出和有效的。
Claims (5)
1.一种对视频信号的二次AVS编码码率控制的方法,整个处理过程包括第一次编码阶段、数据处理阶段和第二次编码阶段,在所述的第一次编码阶段中采用CBR码率控制AVS编码方式进行编码,在所述的第二次编码阶段采用VBR码率控制AVS编码方式进行编码,其特征在于在所述的第一次编码阶段首先给每个图像组预分配目标比特数,然后计算每个图像组中各帧图像的量化参数,再根据各帧图像的量化参数,采用CBR码率控制AVS编码方式对各帧图像进行第一次编码,编码后统计各帧图像的帧类型、各帧图像的量化步长、各帧图像的实际消耗比特数、各帧图像的全局复杂度及各帧图像的结构相似度值;在所述的数据处理阶段首先计算视频信号中除第1个P帧图像以外的各个P帧图像的实际消耗比特数与结构相似度值的比值,根据前后两个P帧图像的实际消耗比特数与结构相似度值的比值判断是否发生场景切换,当发生场景切换时将后一个P帧图像所在的图像组的前部分图像并入前一个图像组中及将后一个P帧图像和后一个P帧图像所在的图像组的后部分图像并入下一个图像组中,然后计算重组图像组后视频信号中的各帧图像的复杂度、视频信号的总复杂度及各帧图像在第二次编码阶段中所需的目标比特数,再将重组图像组后得到的每个图像组作为一个场景,计算所有场景的场景复杂度调整因子,根据场景复杂度调整因子调整各帧图像在第二次编码阶段中所需的目标比特数,最后根据每个场景中的各帧图像移出之前的缓冲区状态和各帧图像在第二次编码阶段中所需的目标比特数,确定是否调整每个场景中的部分图像在第二次编码阶段中所需的目标比特数;在所述的第二次编码阶段判断进行第二次编码的当前图像是否为视频信号的第1帧图像或第2帧图像,如果是,则直接根据第一次编码后统计得到的当前图像的全局复杂度和当前图像在第二次编码阶段中所需的目标比特数,计算当前图像在第二次编码时所需的量化步长,将量化步长转换为量化参数,根据量化参数对当前图像进行第二次编码,否则,首先微调当前图像在第二次编码阶段中所需的目标比特数,然后根据第一次编码后统计得到的当前图像的全局复杂度和微调后的目标比特数,计算当前图像在第二次编码时所需的量化步长,再将量化步长转换为量化参数,并对量化参数进行修正,同时将量化参数限制在AVS量化参数极值范围内,最后根据量化参数对当前图像进行第二次编码。
2.根据权利要求1所述的一种对视频信号的二次AVS编码码率控制的方法,其特征在于具体包括以下步骤:
①-1、将输入的视频信号划分成多个图像组,每个图像组在AVS编码格式下包括I帧、P帧和B帧三种类型的图像,给每个图像组预分配目标比特数,记预分配给第i个图像组的目标比特数为T(i),其中,R为目标码率,F为帧率,Ngop,i为第i个图像组所包含的图像的帧数,Tremaning(i-1)表示第i-1个图像组的剩余比特数,Tremaning(i-1)的值为第i-1个图像组的目标比特数T(i-1)与第i-1个图像组所包含的所有图像的实际消耗比特数和的差,Tremaning(0)=0,i∈[1,n1],nl为输入的视频信号所包含的图像组的个数;
①-2、计算每个图像组中各帧图像的量化参数,对于第i个图像组,定义第i个图像组为当前图像组,定义当前正在处理的第j帧图像为当前图像,当当前图像为I帧图像时,判断当前图像组是否为第1个图像组,如果是,则该当前图像的量化参数为设定值,否则,该当前图像的量化参数值为当前图像组的前一个图像组所包含的所有图像的量化参数的平均值;当当前图像为P帧图像时,判断当前图像组是否为第1个图像组,如果是,则该当前图像的量化参数为设定值,否则,首先计算该当前图像的目标比特数f(ni,j),其中,β=0.5,R为目标码率,F为帧率,Wp(ni,j-1)=b(ni,j-1)×QP(ni,j-1),b(ni,j-1)为当前图像组中的第j-1帧图像的实际消耗比特数,QP(ni,j-1)为当前图像组中的第j-1帧图像的量化参数,Tr(ni,j)为当前图像组的剩余可用比特数,Np,r(j-1)为当前图像组中未编码的P帧图像的帧数,Nb,r(j-1)为当前图像组中未编码的B帧图像的帧数,i∈[1,n1],n1为输入的视频信号所包含的图像组的个数,j∈[1,Ngop,i],Ngop,i为当前图像组所包含的图像的帧数,然后计算当前图像的量化步长QPStep,其中,X为前一个P帧图像的全局复杂度,其值为前一个P帧图像的实际消耗比特数和前一个P帧图像的量化步长的乘积,再将计算得到的量化步长转换成量化参数;当当前图像为B帧图像时,利用线性插值方法计算当前图像的量化参数;
①-3、根据计算得到的每个图像组中各帧图像的量化参数,采用CBR码率控制AVS编码方式对各帧图像进行第一次编码,第一次编码后统计各帧图像的帧类型、各帧图像的量化步长、各帧图像的实际消耗比特数、各帧图像的全局复杂度及各帧图像的结构相似度值,对于视频信号中的第l帧图像,记第l帧图像的量化步长为Q_Stepl,记第l帧图像的实际消耗比特数为bl,记第l帧图像的全局复杂度为Xl,记第l帧图像的结构相似度值为SSIMl,根据各帧图像的结构相似度值计算所有图像的结构相似度值的平均值SSIMave,其中,l∈[1,Total_pic],Total_pic表示视频信号所包含的图像的总帧数;
②-1、计算视频信号中除第1个P帧图像以外的各个P帧图像的实际消耗比特数与结构相似度值的比值,对于第k个P帧图像,记该P帧图像的实际消耗比特数与结构相似度值的比值为ratiok,记该P帧图像的前一个P帧图像的实际消耗比特数与结构相似度值的比值为ratiok-1,判断ratiok和ratiok-1的商是否超出设定的阈值区间,如果是,则确定发生场景切换,并以该P帧图像为界将该P帧图像所在的图像组中的前部分图像并入该P帧图像所在的图像组的前一个图像组中,以及将该P帧图像和该P帧图像所在的图像组中的后部分图像并入该P帧图像所在的图像组的下一个图像组中,然后将该P帧图像的帧类型修改为I帧图像,再将下一个图像组中的I帧图像的帧类型修改为P帧图像;否则,确定未发生场景切换;
②-2、计算重组图像组后视频信号中的各帧图像的复杂度,对于视频信号中的第l帧图像,记该帧图像的复杂度为SSIM_Xl,其中,Kl T为该帧图像的帧类型权重系数,bl为第一次编码后统计的第l帧图像的实际消耗比特数,Q_Stepl是第一次编码后统计的第l帧图像的量化步长,SSIMl为第一次编码后统计的第l帧图像的结构相似度值,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值;
②-3、计算视频信号的总复杂度TotalSSIM_X,其中,Total_pic表示视频信号所包含图像的总帧数;然后计算各帧图像在第二次编码阶段中所需的目标比特数,对于视频信号中的第l帧图像,记该帧图像在第二次编码阶段中所需的目标比特数为b2,l,其中,b2,total表示视频信号的总目标比特数;
②-4、将重组图像组后得到的每个图像组作为一个场景,计算所有场景的场景复杂度调整因子,对于第m个场景,记该场景的场景复杂度调整因子为μm,其中,sign()为取正负号函数,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值,SSIMave,m为第m个场景中所有图像的结构相似度值的平均值;当μm<1时,将第m个场景中的每帧图像在第二次编码阶段中所需的目标比特数乘以μm,对于视频信号中的第l帧图像,设该帧图像属于第m个场景,调整该帧图像在第二次编码阶段中所需的目标比特数,b2,l=b2,l×μm,其中,式左边的b2,l表示调整后的目标比特数,式右边的b2,l表示调整前的目标比特数,然后将该帧图像节省的比特数b2,l×(1-μm)累加到Bremaining,Bremaining=Bremaining+b2,l×(1-μm),Bremaining的初始值为0;当μm>1时,计算SUMμ,SUMμ=SUMμ+μm×NUMsence,m,其中,NUMsence,m表示第m个场景所包含图像的帧数,SUMμ的初始值为0;
②-5、在步骤②-4处理完成后再次遍历每个场景,判断μm是否大于1,如果μm>1,则修正第m个场景中的每帧图像在第二次编码阶段中所需的目标比特数,对于视频信号中的第l帧图像,设该帧图像属于第m个场景,修正该帧图像在第二次编码阶段中所需的目标比特数,其中,式左边的b2,l表示修正后的目标比特数,式右边的b2,l表示修正前的目标比特数,μm为第m个场景的场景复杂度调整因子;
②-6、首先计算每个场景中的每帧图像的缓冲区溢出的比特数,对于第m个场景中的第q帧图像,判断Bm,q-Bguard-b2,m,q是否小于0,如果Bm,q-Bguard-b2,m,q小于0,则计算该帧图像缓冲区溢出的比特数OverBm,q,OverBm,q=Bm,q-Bguard-b2,m,q,并且更新p=q以及对应的OverBm,OverBm=OverBm+OverBm,q,其中,OverBm的初始值为0,Bm,q表示第m个场景中的第q帧图像移出之前的缓冲区状态,Bmax为缓冲区的大小,为第m-1个场景中的最后一帧图像移出之前的缓冲区状态,Bm,q-1表示第m个场景中的第q-1帧图像移出之前的缓冲区状态,Rmax为传输带宽允许最大码率,F为帧率,Bguard为缓冲区保护值,Bguard=0.2Bmax,b2,m,q为第m个场景中的第q帧图像在第二次编码阶段中所需的目标比特数;如果OverBm小于零,然后修正第m-1个场景中所有图像和第m个场景中第1帧到第p帧图像在第二次编码阶段中所需的目标比特数,对于第m个场景中第1帧到第p帧图像中的第q帧图像,修正该图像在第二次编码阶段中所需的目标比特数,b2,m,q=b2,m,q+OverBm/(NUMsence,m-1+p),其中,式左边的b2,m,q表示修正后的目标比特数,式右边的b2,m,q表示修正前的目标比特数,OverBm表示第m个场景中溢出的比特总数,OverBm的初始值为0,NUMsence,m-1表示第m-1个场景所包含图像的帧数,对于第m-1个场景中的NUMsence,m-1帧图像,采用b2,m-1,q=b2,m-1,q+OverBm/(NUMsence,m-1+p)修正NUMsence,m-1帧图像在第二次编码阶段中所需的目标比特数;如果第m个场景中的所有图像均没有发生缓冲区溢出,则在此步骤中对第m-1个场景中的所有图像和第m个场景中的所有图像在第二次编码阶段中所需的目标比特数不进行修正;
③-1、采用VBR码率控制AVS编码方式对经第一次编码后的视频信号的各帧图像进行第二次编码,对于需进行第二次编码的视频信号中的第l帧图像,定义第l帧图像为当前图像,判断当前图像是否为第1帧图像或第2帧图像,如果是,则根据第一次编码后统计得到的当前图像的全局复杂度Xl和当前图像在第二次编码阶段中所需的目标比特数b2,l,计算当前图像在第二次编码时所需的量化步长QStep2,l,再将当前图像在第二次编码时所需的量化步长QStep2,l转化成量化参数QP2,l,其中,l∈[1,Total_pic′],Total_pic′表示需进行第二次编码的视频信号所包含的图像的总帧数,Total_pic′=Total_pic,然后转到步骤③-5并继续执行;否则,继续执行;
③-2、对当前图像在第二次编码阶段中所需的目标比特数b2,l进行微调,其中,式左边的b2,l表示微调后的目标比特数,式右边的b2,l表示微调前的目标比特数,λl-1为第l-1帧图像的调整因子,λl-2为第l-2帧图像的调整因子,然后根据第一次编码后统计得到的当前图像的全局复杂度Xl和微调后的目标比特数b2,l,计算当前图像在第二次编码时所需的量化步长QStep2,l,
③-3、判断或者是否成立,如果成立,通过调整当前图像在第二次编码时所需的量化步长,其中,式左边的QStep2,l表示调整后的量化步长,式右边的QStep2,l表示调整前的量化步长,η为一个乘法因子,Rmax为缓冲区的大小,λl-1为第l-1帧图像的调整因子,λl-2为第l-2帧图像的调整因子;
③-4、将当前图像在第二次编码时所需的量化步长QStep2,l转化为量化参数QP2,l,然后通过QP2,l=min{QP2,l+3,max{QP2,l-1-3,QP2,l}}对当前图像在第二次编码时所需的量化参数进行修正,其中,式左边的QP2,l表示修正后的量化参数,式右边的QP2,l表示修正前的量化参数,QP2,l-1为第l-1帧图像在第二次编码时所需的量化参数,再通过QP2,l=min{63,max{QP2,l,1}}将修正后的量化参数限制在AVS量化参数极值范围内,其中,式左边的QP2,l表示限制后的量化参数,式右边的QP2,l表示限制前的量化参数;
③-5、利用当前图像的量化参数对当前图像进行第二次编码,然后计算当前图像的结构相似度值SSIM2,l,再判断当前图像的类型是否为I帧图像,如果是,则当前图像的调整因为λl=1,否则,当前图像的调整因子为λl=sqrt(SSIM2,l/SSIMave),其中,SSIMave为视频信号第一次编码后所有图像的结构相似度值的平均值;
③-6、计算δl=δl-1+actual_bits2,l-1-b2,l-1,其中,δ0=0,actual_bits2,l-1为第l-1帧图像第二次编码后的实际消耗比特数,b2,l-1为第l-1帧图像在第二次编码阶段中所需的目标比特数。
3.根据权利要求2所述的一种对视频信号的二次AVS编码码率控制的方法,其特征在于所述的步骤①-2中的设定值为30。
5.根据权利要求2所述的一种对视频信号的二次AVS编码码率控制的方法,其特征在于所述的步骤②-1中设定的阈值区间为[0.6,1.5]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910097981 CN101547349B (zh) | 2009-04-27 | 2009-04-27 | 一种对视频信号的二次avs编码码率控制的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910097981 CN101547349B (zh) | 2009-04-27 | 2009-04-27 | 一种对视频信号的二次avs编码码率控制的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101547349A CN101547349A (zh) | 2009-09-30 |
CN101547349B true CN101547349B (zh) | 2010-10-13 |
Family
ID=41194178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200910097981 Expired - Fee Related CN101547349B (zh) | 2009-04-27 | 2009-04-27 | 一种对视频信号的二次avs编码码率控制的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101547349B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101984665A (zh) * | 2010-10-29 | 2011-03-09 | 深圳市同洲电子股份有限公司 | 一种视频传输质量评测的方法与系统 |
WO2013053385A1 (en) * | 2011-10-11 | 2013-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Scene change detection for perceptual quality evaluation in video sequences |
CN102647591B (zh) * | 2012-04-17 | 2014-07-02 | 中国科学院声学研究所 | 基于ssim评价的容错率失真优化视频编码方法 |
CN103517080A (zh) * | 2012-06-21 | 2014-01-15 | 北京数码视讯科技股份有限公司 | 实时视频流编码器和实时视频流编码方法 |
CN103647963A (zh) * | 2013-12-04 | 2014-03-19 | 北京邮电大学 | 基于GoP场景复杂度的视频质量评价方法 |
CN104954792B (zh) * | 2014-03-24 | 2018-02-27 | 兴唐通信科技有限公司 | 一种对p帧序列进行主观视频质量优化编码的方法及装置 |
CN104202660A (zh) * | 2014-09-15 | 2014-12-10 | 乐视网信息技术(北京)股份有限公司 | 分片转码方法及装置 |
CN104780367B (zh) * | 2015-04-13 | 2018-05-01 | 浙江宇视科技有限公司 | 一种动态调整gop长度的方法和装置 |
CN108124155B (zh) * | 2016-11-30 | 2021-02-05 | 阿里巴巴集团控股有限公司 | 一种码率控制方法、装置及电子设备 |
CN106688233A (zh) * | 2016-12-08 | 2017-05-17 | 深圳市大疆创新科技有限公司 | 用于传输图像的方法、设备和无人机 |
CN108574841B (zh) * | 2017-03-07 | 2020-10-30 | 北京金山云网络技术有限公司 | 一种基于自适应量化参数的编码方法及装置 |
CN107948646B (zh) * | 2017-09-26 | 2019-02-05 | 北京字节跳动网络技术有限公司 | 一种视频摘要生成方法与视频再编码方法 |
CN110139168B (zh) * | 2018-02-02 | 2021-07-13 | 中南大学 | 视频编码方法、装置、计算机设备及存储介质 |
CN108540807B (zh) * | 2018-02-28 | 2019-05-31 | 北京达佳互联信息技术有限公司 | 视频文件转码的方法、装置及终端 |
CN108810545B (zh) * | 2018-07-04 | 2023-04-18 | 中南大学 | 用于视频编码的方法、装置、计算机可读介质及电子设备 |
CN112954348B (zh) * | 2021-02-20 | 2024-04-02 | 浙江商汤科技开发有限公司 | 视频编码方法及装置、电子设备和存储介质 |
CN113038130B (zh) * | 2021-03-17 | 2024-06-04 | 百果园技术(新加坡)有限公司 | 一种视频编码方法、装置、电子设备及可读存储介质 |
CN112929663B (zh) * | 2021-04-08 | 2022-07-15 | 中国科学技术大学 | 一种基于知识蒸馏的图像压缩质量增强方法 |
CN114051139B (zh) * | 2021-11-09 | 2024-02-02 | 京东科技信息技术有限公司 | 视频编码方法和装置 |
CN114422783B (zh) * | 2021-12-07 | 2024-04-12 | 网宿科技股份有限公司 | 视频编码方法、电子设备及存储介质 |
-
2009
- 2009-04-27 CN CN 200910097981 patent/CN101547349B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101547349A (zh) | 2009-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101547349B (zh) | 一种对视频信号的二次avs编码码率控制的方法 | |
CN101185337B (zh) | 具有预见的准恒定质量速率控制 | |
CN102630013B (zh) | 基于场景切换的码率控制视频压缩方法和装置 | |
CN1190974C (zh) | 立体数字式视频编码的速率控制 | |
CN100574427C (zh) | 视频编码比特率的控制方法 | |
US7436886B2 (en) | Coding scene transitions in video coding | |
CN100562116C (zh) | 一种面向多视点视频的码率控制方法 | |
CN101466035B (zh) | 一种基于h.264的视频图像组比特分配方法 | |
CN101742319B (zh) | 基于背景建模的静态摄像机视频压缩方法与系统 | |
CN100358364C (zh) | 基于h.264的精细颗粒可伸缩编码的码率控制方法 | |
CN102137258B (zh) | 一种立体视频码率控制方法 | |
JPH10108187A (ja) | ビデオ符号化のための量子化方法 | |
CN101547365B (zh) | 保证特定区域显示质量的视频编码的方法和装置 | |
CN108235016A (zh) | 一种码率控制方法及装置 | |
JP7015183B2 (ja) | 画像符号化装置及びその制御方法及びプログラム | |
CN102932641A (zh) | 一种恒定质量码率控制方法 | |
CN101917614A (zh) | 一种基于h.264分层b帧编码结构的码率控制方法 | |
CN101621683A (zh) | 一种基于avs的快速立体视频编码方法 | |
CN108200431A (zh) | 一种视频编码码率控制帧层比特分配方法 | |
EP4333433A1 (en) | Video coding method and apparatus, and electronic device | |
CN101110957A (zh) | 金字塔式双向预测模式的视频恒定质量控制方法 | |
CN102752598A (zh) | 快速自适应码率控制方法 | |
CN100448295C (zh) | 一种低复杂度的积分码率控制方法 | |
CN100515021C (zh) | 基于图像质量和码率约束的jpeg2000码率控制方法 | |
CN106210717B (zh) | 一种基于视频显著性的hevc解码复杂度控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20101013 Termination date: 20130427 |