CN103634600B - 一种基于ssim评价的视频编码模式选择方法、系统 - Google Patents
一种基于ssim评价的视频编码模式选择方法、系统 Download PDFInfo
- Publication number
- CN103634600B CN103634600B CN201210301141.8A CN201210301141A CN103634600B CN 103634600 B CN103634600 B CN 103634600B CN 201210301141 A CN201210301141 A CN 201210301141A CN 103634600 B CN103634600 B CN 103634600B
- Authority
- CN
- China
- Prior art keywords
- frame
- macro block
- distortion
- coded
- ssim
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 75
- 238000005457 optimization Methods 0.000 claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000004364 calculation method Methods 0.000 claims description 24
- 230000000007 visual effect Effects 0.000 claims description 19
- 230000016776 visual perception Effects 0.000 claims description 10
- 238000005259 measurement Methods 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 16
- 238000010187 selection method Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004438 eyesight Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 206010021403 Illusion Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明涉及一种基于SSIM评价的视频编码模式选择方法及系统,所述的方法包含:步骤101)建立率失真优化模型,用于对每一个待编码的宏块获取其各种编码模式的拉格朗日代价值;步骤102)根据当前待编码宏块所属帧的前两帧的基于SSE评价的失真值和基于SSIM评价的失真值之间比值的平均值,确定该帧的帧层次的拉格朗日因子,然后利用所述待编码宏块的重要性测量对得到的帧层次的拉格朗日因子进一步缩放,求得该待编码宏块的宏块层次的拉格朗日因子;步骤103)依据获取的当前待编码宏块的拉格朗日因子,计算当前编码宏块的各种编码模式的拉格朗日代价值,最后选择拉格朗日代价值最小的编码模式作为当前待编码宏块的编码模式进行编码。
Description
技术领域
本发明涉及视频编码与通信领域,特别涉及一种基于SSIM评价的视频编码模式选择方法、系统。
背景技术
随着网络技术的快速发展,多媒体应用,特别是视频应用得越来越广泛。由于传输带宽的限制,视频编码与压缩对高效的视频通信起着重要的作用。H.264/AVC编码已经取得了很好的压缩性能和广泛的应用。H.264/AVC标准其较好地编码性能得益于它所采用的率失真优化(rate-distortion optimization,RDO)模型与一系列的编码模式等。所述率失真优化RDO中所采用的客观的失真描述方式(如SAD,MSE等)具有计算简单实现简单的优点,但其并不能很好的体现人的视觉特性,因此H.264/AVC中已有的RDO模型并没有很好的考虑到人类的视觉特性。
近年来的研究表明,主观视觉结构相似性SSIM在视频质量评价中相对于以往的失真评价方法在人类视觉特性匹配上具有一定的优越性。因此现有技术将主观视觉结构相似性SSIM引入到了H.264/AVC编码的预测模式和宏块模式选择中,实验结果表明主观视觉结构相似性SSIM的引入在一定程度上提高了编码性能,较以往的SAD等失真描述方式,在相同的码率下,更能够提高人视觉感知到的视频质量。
但是,虽然现有技术将主观视觉结构相似性SSIM作为RDO模式选择的失真度量被引入到了H.264/AVC的编码过程中,提高了编码后的重构视频的视觉感知质量,但目前的方法都引入了一定的计算复杂度,文献[Huang,Y.H.,Ou,T.S.,Su,P.Y.,Chen,H.:Perceptualrate-distortion optimization using structural similarity index as qualitymetric.IEEE Trans.CSV T,1614-1624(November 2010)]中,作者采用对关键帧重复编码两次的方式来预测以后几帧的拉格朗日因子,并不利于实时编码的应用。特别是在率失真优化模型中拉格朗日因子决策过程中,其与视频内容相关的特性,以及传统基于均方误差评价的率失真优化模型中拉格朗日因子的优势没有被很好的利用,导致现有技术并不能取得最优的编码性能。
发明内容
本发明的目的在于,解决如何利用SSIM指导,进行低复杂度主观率失真优化视频编码,提高视频编码的主观质量,即本发明提供一种基于SSIM评价的视频编码模式选择方法、系统。
为了实现上述目的,本发明提供了一种基于SSIM评价的视频编码模式选择方法,所述的方法包含:
步骤101)采用以下公式建立率失真优化模型,用于对每一个待编码的宏块获取其各种编码模式的拉格朗日代价值:
其中,J表示某种编码模式的拉格朗日代价值,代表基于待编码宏块对应某种编码模式的SSIM评价的失真值,是该待编码宏块对应的拉格朗日因子,R表示待编码宏块的某种编码模式的编码需要的比特数;
步骤102)根据当前待编码宏块所属帧的前两帧的基于SSE评价的失真值和基于SSIM评价的失真值之间比值的平均值,确定该帧的帧层次的拉格朗日因子然后利用所述待编码宏块的重要性测量对得到的帧层次的拉格朗日因子进一步缩放,求得该待编码宏块的宏块层次的拉格朗日因子
步骤103)依据获取的当前待编码宏块的的值,计算当前编码宏块的各种编码模式的拉格朗日代价值,最后选择拉格朗日代价值最小的编码模式作为当前待编码宏块的编码模式进行编码;
其中,所述编码模式包含:帧内16×16,帧内8×8,帧内4×4,帧间16×16,帧间16×8,帧间8×16,帧间8×8,帧间8×4,帧间4×8,帧间4×4,跳过模式以及直接模式。
上述技术方案中,所述步骤101)还包含:
用于获取每个宏块的基于SSIM评价的失真值的步骤,该失真值表现为原始图像和重构图像之间的结构相似性度量,对于第n帧,第m个宏块的SSIM失真,具体计算公式为:
其中,n为待编码视频图像信号中的任意一帧的帧序号,m为该帧中的某个宏块的序号,fn,m为第n帧原始图像第m个宏块的图像信号,为解码端重构第n帧的第m个宏块图像信号。
上述技术方案中,步骤102)所述的帧层次的拉格朗日因子具体采用如下方式获取:
首先,按如下公式计算当前待编码宏块所属帧的前两帧的基于SSE评价失真值和基于SSIM评价的失真值的比值的预测值si′,其中i=2,3,4…:
其中,i表示帧序号;表示第i帧的基于SSE评价的失真值,表示第i帧的基于SSIM评价的失真值,其为所述第i帧对应的图像包含的所有宏块的SSIM失真值的和;
然后,利用如下公式得到当前待编码宏块所属帧的帧层次的拉格朗日因子:
其中,表示基于SSIM评价的当前待编码宏块所属第i帧的帧层次的拉格朗日因子,表示基于SSE评价的当前待编码宏块对应的第i帧的拉格朗日因子。
上述技术方案中,步骤102)所述的宏块层的拉格朗日因子具体采用如下方式获取:
首先,利用当前待编码宏块的前一帧中对应位置的宏块以及周围相邻宏块的码率分布情况预测当前宏块编码比特数,具体预测公式如下:
Bc=ρp·Bp+ρu·Bu+ρd·Bd+ρl·Bl+ρr·Br,
其中,Bc,Bp,Bu,Bd,Bl,Br分别表示当前待编码宏块c,当前待编码宏块c所属帧的前一帧中对应位置宏块p以及它周围的宏块u,d,l和r的编码比特数;ρp,ρu,ρd,ρl和ρr分别表示每一个宏块的权重,且它们满足ρp+ρu+ρd+ρl+ρr=1;
然后,通过预测的当前待编码宏块的编码比特数,估计当前待编码宏块在其所属帧中的视觉感知重要性Ic,且该重要性计算公式如下:
其中,AVG_Bp表示当前待编码宏块所属帧的前一帧的平均的宏块编码比特数,也表示当前待编码宏块所属帧的平均的宏块编码比特数的预测值;
最后,根据当前待编码宏块的视觉感知重要性值Ic,依据以下公式确定当前待编码宏块层的拉格朗日因子:
其中,表示当前待编码宏块的宏块层的拉格朗日因子,表示待编码宏块所属帧的帧层次的拉格朗日因子,且η是一个取值小于1的缩放因子。
基于上述方法本发明还提供了一种基于SSIM评价的视频编码模式选择系统,所述系统包含:
模型建立及结果输出模块,用于采用以下公式建立所有待编码宏块的率失真优化模型,并根据该模型各参数的具体取值输出待编码宏块对应的各种编码模式的拉格朗日代价值:
其中,J表示待编码宏块对应的某种编码模式的拉格朗日代价值,代表基于待编码宏块的某种编码模式的SSIM评价的失真值,是拉格朗日因子,R表示待编码宏块的某种编码模式的编码需要的比特数;
参数值确定模块,用于确定拉格朗日代价值所涉及的基于SSIM评价的失真值并根据当前待编码宏块所属帧的前两帧的基于SSE评价的失真值以及基于SSIM评价的失真值之间比值的平均值,确定该当前待编码宏块所属帧的帧层次的拉格朗日因子,然后利用所述待编码宏块的视觉重要性测量对所述帧层次的拉格朗日因子进一步缩放,获得待编码宏块层次的拉格朗日因子并将获取的和值输入所属模型建立及结果输出模块;和
编码模式选择决策模块,用于选取拉格朗日代价值最小的编码模式作为待编码宏块的编码方式对其进行编码。
上述技术方案中,所述参数值确定模块进一步包含:
基于SSIM评价失真和SSE评价失真值计算模块,用于对图像每一帧的SSIM失真值和SSE失真值进行计算;和
帧层次拉格朗日因子确定模块,用于利用当前待编码宏块所属帧的前两帧的SSE失真和SSIM失真比例的平均值,缩放拉格朗日因子得到帧层次的拉格朗日因子。
所述参数取值确定模块还包含:
宏块层的拉格朗日因子决策模块,用于利用当前待编码宏块所属帧的前一帧的对应宏块的码率预测当前待编码宏块在当前待编码宏块所属帧中的视觉重要性,进而对所述帧层次拉格朗日因子再一次进行缩放,作为宏块层的拉格朗日因子,并将该宏块层的拉格朗日因子作为计算拉格朗日代价值的拉格朗日因子值。和
基于待编码宏块的SSIM评价的失真值获取模块,用于依据下式计算该失真值:
其中,n为待编码视频图像信号中的任意一帧的帧序号,m为该帧中的某个宏块的序号,fn,m为第n帧原始图像第m个宏块的图像信号,为解码端重构的第n帧的第m个宏块图像信号。
总之针对现有技术的问题,本发明提供一种视频编码中基于SSIM评价的低复杂度率失真优化模式选择方法、系统。
在第一方面,本发明实施例提供一种视频编码中基于结构相似性SSIM主观评价的低复杂度的率失真优化视频编码模式选择方法,所述方法包括:在编码过程中计算SSIM失真和SSE失真;利用待编码宏块所属帧的前两帧的SSE失真和SSIM失真的关系和当前编码帧基于SSE评价的传统率失真优化拉格朗日因子,决策当前待编码宏块所属帧的层次的拉格朗日因子;利用待编码宏块所属帧的前一帧编码的宏块码率预测当前待编码宏块在其所属帧中的视觉重要性,进而依据该视觉重要性调整当前编码宏块的拉格朗日因子;利用得到的当前编码宏块的拉格朗日因子进行率失真优化的编码模式选择,并进行编码。
在第二方面,本发明实施例还提供一种视频编码中的基于结构相似性SSIM主观评价的低复杂度率失真优化视频编码模式选择系统,所述系统包括:失真值计算模块,用于在编码端进行基于SSIM失真和SSE失真计算;帧层次拉格朗日因子决策模块,用于利用前两帧的SSE失真和SSIM失真之间的比例关系以及当前编码传统的基于SSE失真评价的率失真优化拉格朗日因子,计算当前帧的基于SSIM失真评价的拉格朗日因子;宏块层拉格朗日因子决策模块,用于在编码当前宏块时,利用该宏块所属帧的前一帧编码的宏块码率来预测当前编码宏块在当前帧中的视觉重要性,决策当前编码宏块的率失真优化拉格朗日因子;编码模式选择模块,利用得到的拉格朗日因子对待编码宏块的每种模式进行拉格朗日代价计算,然后选择拉格朗日代价最小的模式进行编码。
与现有技术相比,本发明的技术优势在于,本发明解决了在主观率失真优化编码中如何随着视频内容变化选择拉格朗日因子,同时不增加计算复杂度的问题。本发明能够快速的确定拉格朗日因子,增强主观率失真优化编码性能。最终本发明提供的视频编码中的低复杂度主观SSIM失真评价的率失真优化模式选择方法,能有效的提高视频编码的主观质量。
附图说明
图1-a是SSIM失真和SSE失真的关系示意图;
图1-b是SSIM失真和SSE失真的关系示意图;
图2是宏块编码的对应位置关系示意图;
图3是视频编码中基于主观SSIM失真评价的低复杂度率失真优化模式选择方法示意图;
图4是本发明的视频编码中基于主观SSIM失真评价的低复杂度率失真优化模式选择系统示意图。
具体实施方式
下面结合附图对本发明的技术内容作出如下详细阐述。
本发明提供了一种视频编码中基于SSIM评价的低复杂度率失真优化的模式选择方法,该方法通过计算SSIM失真和SSE失真,利用前后帧的内容相关性,在帧编码层次和宏块编码层次决策率失真优化的拉格朗日优化因子,进行率失真优化的编码模式选择,进而实现一种低复杂度的主观率失真优化模式选择编码方法,优化视频编码的主观质量。
本发明提供的一种视频编码中基于SSIM评价的低复杂度率失真优化模式选择方法,该方法计算SSIM失真和SSE失真,利用前后帧视频内容的相关性,计算前两帧的SSE失真与SSIM失真的比例关系,用这个比例关系来缩放传统的拉格朗日因子,作为当前编码帧的拉格朗日因子以进行编码中的码率与失真的均衡,进而选择最优的编码模式。为了在宏块编码层次进一步优化拉格朗日因子,本发明提出利用前一帧(即,帧级的比例关系是利用当前帧的前两帧进行估计,宏块级的宏块视觉重要性是利用当前帧的前一帧进行估计的)的编码宏块码率来预测当前待编码宏块所在帧中的视觉重要性,来继续缩放拉格朗日因子,所提出的方法包含以下步骤,
步骤1):利用传统基于SSE评价的拉格朗日因子编码第1帧,在编码过程中进行基于SSIM评价的失真计算和SSE失真计算,建立率失真优化模型。
其中,所述的基于SSIM评价的失真的计算公式为:
其中,n为帧序号(该处只是待编码视频图像信号的第n帧中第m个宏块的SSIM失真的计算公式,不特指哪一帧),m为第n帧中对应某个宏块的宏块序号,fn,m为第n帧原始图像第m个宏块图像信号,为解码端重构的第n帧的第m个宏块图像信号。
上述的SSIM(x,y)是表示图像块x和y之间结构相似性度量,可以按如下公式计算:
其中,μx和μy为图像块x和图像块y的均值,σx和σy为图像块x和图像块y的标准差,σxy为图像块x和图像块y之间的协方差。其中,所述图像块x和图像块y分别对应所述参量fn,m和参量
所述建立的率失真优化模型如下:
其中,J表示待编码宏块对应的某种编码模式的拉格朗日代价值,(本发明通过利用该代价的大小对候选的编码模式进行选择),代表待编码宏块的某种编码模式的SSIM评价的失真值,是拉格朗日因子,R表示待编码宏块的某种编码模式的编码比特数。
在后续第ith(i=2,3,4.....)帧编码时,在编码过程中进行基于上述的SSIM评价的失真计算和SSE失真计算。
步骤2):编码后续第ith(i=2,3,4.....)时,计算帧编码层次的拉格朗日因子。
首先,按如下公式计算当前编码帧ith(i=2,3,4.....)的前两帧的SSE失真和SSIM失真的比例关系的预测值si′:
其中,i表示帧序号;对第1帧,本发明采用传统的基于SSE评价的率失真优化编码,对s1直接进行计算;表示第i帧的SSE失真,表示第i帧的SSIM失真。
然后,利用如下公式得到当前帧的拉格朗日因子:
其中,表示当前编码第i帧的基于SSIM失真刻画的帧层次拉格朗日因子,表示当前编码第i帧的基于SSE失真刻画的拉格朗日因子。
步骤3):计算宏块编码层次的拉格朗日因子。
首先,利用当前编码宏块的前一帧中对应位置的宏块以及周围相邻宏块的码率分布情况来预测当前宏块编码比特数,具体预测如下:
Bc=ρp·Bp+ρu·Bu+ρd·Bd+ρl·Bl+ρr·Br,
其中,Bc,Bp,Bu,Bd,Bl,Br分别表示当前宏块c,前一帧中对应位置宏块p以及它周围的宏块u,d,l和r的编码比特数.;ρp,ρu,ρd,ρl和ρr分别表示每一个宏块的权重,且他们满足ρp+ρu+ρd+ρl+ρr=1(即,四者之和满足等于1的固定关系,其每个的值是经验设定的)。
通过预测的当前宏块编码比特数,估计当前宏块在整帧中的视觉感知重要性Ic,具体估计公式如下:
其中,AVG_Bp表示整帧(这里指当前帧的前一帧)中平均宏块的比特数,它代表了当前宏块所属帧的平均宏块的比特数的预测值。
然后,根据当前宏块的视觉感知重要性,宏块编码层次的拉格朗日因子决策如下:
其中,表示待编码宏块的宏块层的拉格朗日因子,表示待编码宏块的帧层次的拉格朗日因子,经验的设定η=0.8,所述参量η表示缩放因子,其取值范围为0~1之间的一个数值。
最后,针对当前编码宏块的每个候选编码模式,利用以上描述的计算SSIM失真的方式计算其基于SSIM的编码失真,统计其编码码率,并利用以上得到的拉格朗日因子可得出该编码模式的拉格朗日代价,进而选择最小拉格朗日代价的编码模式作为当前宏块的编码模式进行编码。
本发明的优点在于可以实现一种视频编码中的低复杂度的基于主观失真评价的率失真优化方法,使得视频编码的主观率失真性能较好。本发明提供的率失真优化编码方法可以应用于快速的实时视频编码平台,特别是针对实时应用的硬件编码平台。
现有技术的率失真优化视频编码方法采用SSE(均方误差和)作为编码失真的评价标准,尽管SSE可以刻画信号方面的损失情况,但是并不能很好的反应人类视觉对视频质量的感知情况。SSIM作为结构相似性的评价准则,能够很好的体现人类主观视觉的感知情况。但是SSIM和视频内容有很大的相关性。并且传统的率失真优化拉格朗日因子对码率和SSE失真有很好的均衡效果。通过SSE失真和SSIM失真的比例关系,缩放传统的率失真优化拉格朗日因子可以很好的在帧编码层做到模式选择的优化效果。通过比较宏块的视觉感知重要性,在宏块编码层可以继续优化拉格朗日因子,提高编码的主观率失真效果。详细的拉格朗日因子决策过程参考附图3。
实施例
首先,利用传统的率失真优化拉格朗日因子编码第1帧,并计算SSE失真和SSIM失真的比例s1。当编码第2帧时,首先决定帧层的基于SSIM失真评价的率失真优化拉格朗日因子,然后决定宏块层的率失真拉格朗日因子,其中基于SSIM评价的失真计算具体步骤如下:
步骤1):在每一帧编码过程中进行基于SSIM评价的失真计算和SSE失真计算,建立率失真优化模型。所述基于SSIM评价的失真采用如下公式进行计算:
其中,n为帧号,m为宏块号,fn,m为第n帧原始图像第m个宏块图像信号,为解码端重构第n帧的第m个宏块图像信号。
所述的SSIM(x,y)是表示图像x和y之间结构相似性度量,可以按如下公式计算。
其中,μx和μy为x和y的均值,σx和σy为x和y的标准差,σxy为x和y之间的协方差。将fn,m和分别替换上式中的x和y,即可得到
所述率失真优化模型建立如下:
其中,J表示某种编码模式的拉格朗日代价值,代表待编码宏块对应某种编码模式的基于SSIM评价的失真值,是拉格朗日因子,R表示待编码宏块对应某种编码模式的编码比特数。
步骤2):计算帧编码层次的拉格朗日因子。
对于不同的视频序列,编码后的SSIM失真和SSE失真会随着帧的变化而变化,并不保持一个恒定的关系,参考附图1-a和图1-b,且图1-a和图1-b两个图分别展示了两个不同序列(Soccer和Football)在量化参数(QP)为37时的SSIM失真和SSE失真随着视频内容变化的变化情况。为了准确的预测当前帧的SSE失真和SSIM失真的比例关系,我们利用当前帧的前两帧的SSE失真和SSIM失真的比例平均值作为当前的SSE失真和SSIM失真的比例,且具体按如下公式计算当前编码帧ith(i=2,3,4.....)SSIM失真和SSE失真的比例关系的预测值si′,
其中,i表示帧序号。对第1帧,我们采用传统的基于SSE评价的率失真优化编码,对s1直接进行计算。表示第i帧的SSE失真,表示第i帧的SSIM失真。
然后利用如下公式得到当前帧的拉格朗日因子,
其中,表示当前编码第i帧的基于SSIM失真刻画的帧层次的拉格朗日因子,表示当前编码第i帧的基于SSE失真刻画的拉格朗日因子。
步骤3):计算宏块编码层次的拉格朗日因子。
首先利用当前编码宏块的前一帧中对应位置的宏块以及周围相邻宏块的码率分布情况来预测当前宏块编码比特数。具体预测如下,
Bc=ρp·Bp+ρu·Bu+ρd·Bd+ρl·Bl+ρr·Br,
其中Bc,Bp,Bu,Bd,Bl,Br分别表示当前宏块c,前一帧中对应位置宏块p以及它周围的宏块u,d,l和r的编码比特数.ρp,ρu,ρd,ρl和ρr分别表示每一个宏块的权重,且他们满足ρp+ρu+ρd+ρl+ρr=1,经验的设定ρp=1/2,ρu=ρd=ρi=ρr=1/8。所述的上述宏块的位置关系参考如附图2所示。
通过预测的比特数Bc,我们来估计当前宏块在整帧中的视觉感知重要性Ic,估计公式如下:
其中,AVG_Bp表示整帧(这里指当前帧的前一帧)中平均宏块的比特数,由于前后帧的内容相关性很大,它也代表了当前待编码宏块所属帧的编码比特数的预测值。
根据当前宏块的视觉感知重要性Ic,宏块编码层次的拉格朗日因子决策如下,
其中,表示宏块层的拉格朗日因子,表示帧层次的拉格朗日因子,η是一个小于1的缩放因子,这里经验的取η=0.8。
最后,针对当前编码宏块的每个候选编码模式,利用以上步骤1)描述的计算SSIM失真的方式计算其基于SSIM的编码失真统计其编码码率R,并利用步骤1)建立的得到率失真优化模型可得出每个编码模式的拉格朗日代价,进而选择最小拉格朗日代价的编码模式作为当前宏块的编码模式进行编码。
图4是视频编码中的基于主观SSIM失真评价的低复杂度率失真优化模式选择系统示意图。所述系统包括:SSIM失真和SSE失真计算模块300,用于在编码每一帧时进行基于SSIM失真和SSE失真的计算,便于后续对传统拉格朗日因子进行内容自适应的缩放做准备;帧层次拉格朗日因子计算模块302,用于在帧编码这一层次初步决定拉格朗日因子;宏块编码层次拉格朗日因子计算模块304,用于在宏块编码是继续优化初步决定的拉格朗日因子,提高编码效率;宏块层编码模式选择模块306,利用上述模块得到的拉格朗日因子进行拉格朗日优化找到最优的编码模式进行编码。
总之,本发明提供的一种视频编码中基于主观视觉结构相似性(SSIM)评价的低复杂度的率失真优化模式选择方法。所述方法包括利用SSIM作为失真的评价标准,在编码模式决策过程中计算SSIM失真和SSE(均方误差和)失真;根据前后帧的内容相关性,利用当前编码帧的前两帧的SSE和SSIM失真之间的比例的平均值,在帧编码层次对传统的拉格朗日因子进行缩放作为当前帧编码的拉格朗日因子;通过计算前一帧对应位置的宏块在整帧中的视觉重要性,在宏块编码层次来调整当前编码宏块的拉格朗日因子;最后利用所得的拉格朗日因子对当前宏块进行编码模式选择。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元、器件可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于SSIM评价的视频编码模式选择方法,所述的方法包含:
步骤101)采用以下公式建立率失真优化模型,用于对每一个待编码的宏块获取其各种编码模式的拉格朗日代价值:
其中,J表示某种编码模式的拉格朗日代价值,代表基于待编码宏块对应某种编码模式的SSIM评价的失真值,是该待编码宏块对应的拉格朗日因子,R表示待编码宏块的某种编码模式的编码比特数;
步骤102)根据当前待编码宏块所属帧的前两帧的基于SSE评价的失真值和基于SSIM评价的失真值之间比值的平均值,确定该帧的帧层次的拉格朗日因子然后利用所述待编码宏块的重要性测量对得到的帧层次的拉格朗日因子进一步缩放,求得该待编码宏块的宏块层次的拉格朗日因子
步骤103)依据获取的当前待编码宏块的的值,计算当前编码宏块的各种编码模式的拉格朗日代价值,最后选择拉格朗日代价值最小的编码模式作为当前待编码宏块的编码模式进行编码;
其中,所述编码模式包含:帧内16×16,帧内8×8,帧内4×4,帧间16×16,帧间16×8,帧间8×16,帧间8×8,帧间8×4,帧间4×8,帧间4×4,跳过模式以及直接模式。
2.根据权利要求1所述的基于SSIM评价的视频编码模式选择方法,其特征在于,所述步骤101)还包含:
用于获取每个宏块的基于SSIM评价的失真值的步骤,该失真值表现为原始图像和重构图像之间的结构相似性度量,对于第n帧,第m个宏块的SSIM失真,具体计算公式为:
其中,n为待编码视频图像信号中的任意一帧的帧序号,m为该帧中的某个宏块的序号,fn,m为第n帧原始图像第m个宏块的图像信号,为解码端重构的第n帧的第m个宏块图像信号。
3.根据权利要求1所述的基于SSIM评价的视频编码模式选择方法,其特征在于,步骤102)所述的帧层次的拉格朗日因子具体采用如下方式获取:
首先,按如下公式计算当前待编码宏块所属帧的前两帧的基于SSE评价失真值和基于SSIM评价的失真值的比值的预测值s′i,其中i=2,3,4…:
其中,i表示帧序号;表示第i帧的基于SSE评价的失真值,表示第i帧的基于SSIM评价的失真值,其为所述第i帧对应图像包含的所有宏块的SSIM失真值的和;
然后,利用如下公式得到当前待编码宏块所属帧的帧层次的拉格朗日因子:
其中,表示基于SSIM评价的当前待编码宏块所属第i帧的帧层次的拉格朗日因子,表示基于SSE评价的当前待编码宏块所属第i帧的拉格朗日因子。
4.根据权利要求1所述的基于SSIM评价的视频编码模式选择方法,其特征在于,步骤102)所述的宏块层的拉格朗日因子具体采用如下方式获取:
首先,利用当前待编码宏块的前一帧中对应位置的宏块以及周围相邻宏块的码率分布情况预测当前宏块编码比特数,具体预测公式如下:
Bc=ρp·Bp+ρu·Bu+ρd·Bd+ρl·Bl+ρr·Br,
其中,Bc,Bp,Bu,Bd,Bl,Br分别表示当前待编码宏块c的编码比特数,当前待编码宏块c所属帧的前一帧中对应位置宏块p以及它周围的宏块u,d,l和r的编码比特数;ρp,ρu,ρd,ρl和ρr分别表示每一个宏块的权重,且它们满足ρp+ρu+ρd+ρl+ρr=1;
然后,通过预测的当前待编码宏块的编码比特数Bc,估计当前待编码宏块在其所属帧中的视觉感知重要性Ic,且该视觉感知重要性计算公式如下:
其中,AVG_Bp表示当前待编码宏块所属帧的前一帧的平均的宏块编码比特数,它同时代表当前待编码宏块所属帧的平均的宏块编码比特数的预测值;
最后,根据当前待编码宏块的视觉感知重要性值Ic,依据以下公式确定当前待编码宏块层的拉格朗日因子:
其中,表示当前待编码宏块层的拉格朗日因子,表示待编码宏块所属帧的帧层次的拉格朗日因子,且η是一个取值小于1的缩放因子。
5.一种基于SSIM评价的视频编码模式选择系统,所述系统包含:
模型建立及结果输出模块,用于采用以下公式建立所有待编码宏块的率失真优化模型,并根据该模型各参数的具体取值输出待编码宏块对应的各种编码模式的拉格朗日代价值:
其中,J表示拉格朗日代价值,代表基于待编码宏块的SSIM评价的失真值,是拉格朗日因子,R表示待编码宏块的某种编码模式的编码需要的比特数;
参数值确定模块,用于确定拉格朗日代价值所涉及的基于SSIM评价的失真值并根据当前待编码宏块所属帧的前两帧的基于SSE评价的失真值以及基于SSIM评价的失真值之间比值的平均值,确定该当前待编码宏块所属帧的帧层次的拉格朗日因子,然后利用所述待编码宏块的视觉重要性测量对所述帧层次的拉格朗日因子进一步缩放,获得待编码宏块层次的拉格朗日因子并将获取的和值输入所属模型建立及结果输出模块;和
编码模式选择决策模块,用于选取拉格朗日代价值最小的编码模式作为待编码宏块的编码方式对其进行编码。
6.根据权利要求5所述的基于SSIM评价的视频编码模式选择系统,其特征在于,所述参数值确定模块进一步包含:
基于SSIM评价失真和SSE评价失真值计算模块,用于对图像每一帧的SSIM失真值和SSE失真值进行计算;和
帧层次拉格朗日因子确定模块,用于利用当前待编码宏块所属帧的前两帧的SSE失真和SSIM失真比例的平均值:
其中,i表示帧序号;表示第i帧的基于SSE评价的失真值,表示第i帧的基于SSIM评价的失真值,其为所述第i帧对应图像包含的所有宏块的SSIM失真值的和,
缩放拉格朗日因子得到帧层次的拉格朗日因子。
7.根据权利要求5所述的基于SSIM评价的视频编码模式选择系统,其特征在于,所述参数取值确定模块还包含:
宏块层的拉格朗日因子决策模块,用于利用当前待编码宏块所属帧的前一帧的对应宏块的码率预测当前待编码宏块在当前带编码宏块所属帧中的视觉重要性,进而对所述帧层次拉格朗日因子再一次进行缩放,作为宏块层的拉格朗日因子,并将该宏块层的拉格朗日因子作为计算拉格朗日代价值的拉格朗日因子值。
8.根据权利要求7所述的基于SSIM评价的视频编码模式选择系统,其特征在于,所述参数取值确定模块还包含:
基于待编码宏块的SSIM评价的失真值获取模块,用于依据下式计算该失真值:
其中,n为待编码视频图像信号中的任意一帧的帧序号,m为该帧中的某个宏块的序号,fn,m为第n帧原始图像第m个宏块的图像信号,为解码端重构的第n帧的第m个宏块图像信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210301141.8A CN103634600B (zh) | 2012-08-22 | 2012-08-22 | 一种基于ssim评价的视频编码模式选择方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210301141.8A CN103634600B (zh) | 2012-08-22 | 2012-08-22 | 一种基于ssim评价的视频编码模式选择方法、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103634600A CN103634600A (zh) | 2014-03-12 |
CN103634600B true CN103634600B (zh) | 2016-09-28 |
Family
ID=50215174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210301141.8A Expired - Fee Related CN103634600B (zh) | 2012-08-22 | 2012-08-22 | 一种基于ssim评价的视频编码模式选择方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103634600B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104270634B (zh) * | 2014-10-11 | 2017-05-10 | 武汉大学 | 一种质量自适应的无线视频编码方法 |
CN104301724B (zh) * | 2014-10-17 | 2017-12-01 | 华为技术有限公司 | 视频处理方法、编码设备和解码设备 |
CN106358040B (zh) * | 2016-08-30 | 2020-07-14 | 上海交通大学 | 一种基于显著性的码率控制比特分配方法 |
CN113099227B (zh) * | 2021-03-12 | 2022-08-16 | 西安交通大学 | 一种联合优化码率分配和率失真性能的视频编码方法 |
CN112929663B (zh) * | 2021-04-08 | 2022-07-15 | 中国科学技术大学 | 一种基于知识蒸馏的图像压缩质量增强方法 |
CN115988201B (zh) * | 2023-03-14 | 2023-05-30 | 杭州微帧信息科技有限公司 | 一种编码胶片颗粒的方法、装置、电子设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101742355A (zh) * | 2009-12-24 | 2010-06-16 | 厦门大学 | 基于空时域特征提取的无线视频部分参考测评方法 |
CN101778281A (zh) * | 2010-01-13 | 2010-07-14 | 中国移动通信集团广东有限公司中山分公司 | 一种基于结构相似度的h.264快速运动估算方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8620092B2 (en) * | 2010-03-04 | 2013-12-31 | Hewlett-Packard Development Company, L.P. | Determining similarity of two images |
-
2012
- 2012-08-22 CN CN201210301141.8A patent/CN103634600B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101742355A (zh) * | 2009-12-24 | 2010-06-16 | 厦门大学 | 基于空时域特征提取的无线视频部分参考测评方法 |
CN101778281A (zh) * | 2010-01-13 | 2010-07-14 | 中国移动通信集团广东有限公司中山分公司 | 一种基于结构相似度的h.264快速运动估算方法 |
Non-Patent Citations (1)
Title |
---|
基于SSE和SSIM的H.264帧内预测模式选择改进算法;杨春玲,肖冬琴;《电子与信息学报》;20110228 * |
Also Published As
Publication number | Publication date |
---|---|
CN103634600A (zh) | 2014-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103634600B (zh) | 一种基于ssim评价的视频编码模式选择方法、系统 | |
CN101895751B (zh) | 帧内预测的方法及装置、基于帧内预测的编/解码方法及系统 | |
CN103918262A (zh) | 基于结构相似度的码率失真优化感知视频编码方法和系统 | |
CN103596004A (zh) | Hevc中基于数学统计和分类训练的帧内预测方法及装置 | |
CN102300094B (zh) | 一种视频编码方法 | |
CN102158709B (zh) | 一种解码端可推导的运动补偿预测方法 | |
CN103873861A (zh) | 一种用于hevc的编码模式选择方法 | |
CN101710993A (zh) | 基于块的自适应超分辨率视频处理方法及系统 | |
CN103634601B (zh) | 基于结构相似度的高效视频编码感知码率控制优化方法 | |
CN101895758B (zh) | 基于帧复杂度的h.264码率控制方法 | |
CN103327327B (zh) | 用于高性能视频编码hevc的帧间预测编码单元选择方法 | |
CN109286812B (zh) | 一种hevc视频质量估计方法 | |
CN101534448A (zh) | 视频编码中基于人类视觉容差的编码工具选择 | |
CN101056408B (zh) | 用于确定视频编码中跳跃模式的阈值的方法和装置 | |
CN107846593A (zh) | 一种率失真优化方法及装置 | |
CN102984541B (zh) | 一种基于像素域失真度估计的视频质量评价方法 | |
CN103957410A (zh) | 一种基于残差频域复杂度的i帧码率控制方法 | |
Chen et al. | Improving video coding quality by perceptual rate-distortion optimization | |
CN103096076B (zh) | 视频编码方法 | |
CN106534855B (zh) | 一种面向satd的拉格朗日因子计算方法 | |
CN104113761A (zh) | 一种视频编码中的码率控制方法及编码器 | |
MX2014007041A (es) | Metodo y aparato para medicion de calidad de video. | |
CN113099227A (zh) | 一种联合优化码率分配和率失真性能的视频编码方法 | |
CN110446040A (zh) | 一种适用于hevc标准的帧间编码方法与系统 | |
CN102158710A (zh) | 一种面向虚拟视图质量的深度图编码率失真判断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160928 Termination date: 20190822 |
|
CF01 | Termination of patent right due to non-payment of annual fee |