CN103607590B - 基于结构相似度的高效视频编码感知率失真优化方法 - Google Patents

基于结构相似度的高效视频编码感知率失真优化方法 Download PDF

Info

Publication number
CN103607590B
CN103607590B CN201310617003.5A CN201310617003A CN103607590B CN 103607590 B CN103607590 B CN 103607590B CN 201310617003 A CN201310617003 A CN 201310617003A CN 103607590 B CN103607590 B CN 103607590B
Authority
CN
China
Prior art keywords
ssim
sigma
coding
present encoding
distortion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310617003.5A
Other languages
English (en)
Other versions
CN103607590A (zh
Inventor
黄孝建
祁跻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201310617003.5A priority Critical patent/CN103607590B/zh
Publication of CN103607590A publication Critical patent/CN103607590A/zh
Application granted granted Critical
Publication of CN103607590B publication Critical patent/CN103607590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种基于结构相似度的高效视频编码感知率失真优化方法,包括以下步骤:在高效视频编码器编码端进行模式判决前,利用结构相似度作为失真的评价标准进行图像失真的计算,并用其替代高效视频编码器编码端率失真判决中的编码图像失真值的计算;根据编码图像空域和时域上邻近区域的运动强度一致性来修正高效视频编码率失真判决计算中的拉格朗日因子,进行当前编码区域率失真优化计算。本发明将结构相似度作为图像失真的评价标准,同时利用帧间编码中前后帧空间和时间相关性,推导当前编码区域的运动强度一致性,并据此修正率失真判决中用到的参数,从而在没有太大增加计算复杂度的情况下,大幅度地提高了编码图像的感知视觉质量。

Description

基于结构相似度的高效视频编码感知率失真优化方法
技术领域
本发明属于视频编解码技术领域,尤其是一种基于结构相似度的高效视频编码感知率失真优化方法。
背景技术
近年来,高清/超高清视频编码技术作为未来家庭影院、数字广播电视、网络视频、高清电影等业务的基础核心技术成为业界关注的焦点。针对高清/超高清视频通信,现有的视频编码标准在压缩比和实际的应用需求相比还有一定的差距。为此,国际标准化组织ISO/IEC(MPEG)和ITU-T启动了下一代数字视频压缩标准的规划——高效视频编码(HighEfficiency Video Coding,HEVC),目标是在H.264/AVC高档次的基础上,压缩效率提高一倍以上。
HEVC依然沿用H.264的混合编码框架,采用帧间和帧内预测编码消除时间域和空间域的相关性,变换编码对残差进行变换编码以消除空间相关性,熵编码消除统计上的冗余度。与H.264类似,HEVC编码器依据图像内容,采用率失真优化的方法,在帧内和帧间众多的可选模式里选取最佳的编码模式。虽然在一定程度上,率失真模式判决会使编码过程变得复杂,但是,正是由于率失真优化技术的应用,编码器才能够尽可能获得最佳预测信息,从而保证了图像质量,提高了编码器的整体性能。
在HEVC现有的率失真优化方法中,是通过以下流程完成率失真判决的:
对于帧内预测编码,首先应用下式为每个编码块选择一个最优的角度预测模式:
JAng=SA(T)D+λAngBit(IntraMode)
其中,SA(T)D为当前编码块各像素点原始值与预测值的(变换域)绝对误差和,λAng为此处的率失真评价的拉格朗日因子,Bit(IntraMode)为编码角度预测模式的比特数。
然后应用下式为每个编码块选择一个最优的划分深度:
J=DSSEIntraBit(CB)
其中,DSSE为当前编码块各像素点原始值与重建值的绝对误差平方和,λIntra为此处率失真评价的拉格朗日因子,其值为λAng的平方,Bit(CB)为编码当前编码块所需的比特数。
对于帧间预测编码,首先应用下式为每个编码块匹配一个最优的预测块:
JME=SA(T)D+λMotionBit(Mvd)
JMerge=SA(T)D+λMotionBit(MergeIndex)
其中,SA(T)D为当前编码块各像素点原始值与预测值的(变换域)绝对误差和,λMotion为此处的率失真评价的拉格朗日因子,Bit(Mvd)和Bit(MergeIndex)分别表示编码运动矢量残差和Merge模式索引的比特数。由于帧间编码有运动估计和Merge两种模式,因此编码器需要比较JME和JMerge从而得到最优的预测块。
然后应用下式为每个编码块选择一个最优的预测方式和划分深度:
J=DSSEInterBit(CB)
其中,DSSE为当前编码块各像素点原始值与重建值的绝对误差平方和,λInter为此处率失真评价的拉格朗日因子,其值为λMotion的平方,Bit(CB)为编码当前编码块所需的比特数。
帧内/帧间预测编码中率失真判决用到的拉格朗日因子可通过下式计算:
λScale=Clip3(0,0.5,(1-0.05*(GopSize-1)))
λInter=λScale*2(QP-12)/3
λIntra=0.57*λInter
其中,GopSize为编码图像组的大小,QP是编码时的量化参数,Clip3实现的是限幅的功能。
现有的率失真优化通常采用客观的失真描述方式,如绝对误差和(Sum ofAbsolute Difference,SAD)、变换域绝对误差和(Sum of Absolute TransformedDifference,SATD)和误差平方和(Sum of Squared Error,SSE)。这种描述方式具有计算简单容易实现的优点,但并不能很好的体现人眼的主观视觉特性。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于结构相似度的高效视频编码感知率失真优化方法,通过修改HEVC编码器的率失真判决过程,使经过编码重建的图像具有更好的主观视觉质量。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于结构相似度的高效视频编码感知率失真优化方法,包括以下步骤:
步骤1、在高效视频编码器编码端进行模式判决前,利用结构相似度作为失真的评价标准进行图像失真的计算,并用其替代高效视频编码器编码端率失真判决中的编码图像失真值的计算;
步骤2、根据编码图像空域和时域上邻近区域的运动强度一致性来修正高效视频编码率失真判决计算中的拉格朗日因子,进行当前编码区域率失真优化计算,找到最优的编码模式;所述步骤2的具体步骤包括:
步骤2.1、按如下公式计算当前编码区域运动强度的空间相关性因子ΔSpatial
其中,分别表示对应空间相关编码区域内各编码块运动矢量的方差,即当前编码区域内的左侧、上侧、左上侧、右上侧的编码块运动矢量的方差,α1、α2、α3和α4可通过下式计算:
其中,SSIMLeft、SSIMAbove、SSIMAbove-Left和SSIMAbove-Right分别表示对应空间相关编码区域的结构相似度的值,即当前编码区域内的左侧、上侧、左上侧、右上侧的结构相似度的值,∑SSIMSpatialCTBs则表示这四个空间编码区域的结构相似度的值的总和;
步骤2.2、计算当前编码区域运动强度的时间相关性因子ΔTemporal
步骤2.3、按下述公式计算当前编码区域同质性的度量因子ΔCTB
ΔCTB=γ*ΔTemporal+(1-γ)ΔSpatial
其中,加权系数γ通过下式计算:
其中,n表示前一编码帧中同质性区域的个数,N表示前一编码帧中编码区域的总个数;
步骤2.4、计算当前编码区域率失真判决所用拉格朗日因子的修正参数ScaleMotion,其计算公式为:
其中,θ可通过下式计算:
其中,μ表示当前编码区域亮度的均值;
Threshold为判断当前编码区域是否为同质性区域的阈值,其计算公式为:
Threshold=AvrΔ*SSIMCodedFrame
其中,AvrΔ表示前一编码帧中所有编码区域同质性度量因子的平均值,SSIMCodedFrame表示所有已编码帧的结构相似度的值的平均数;
步骤2.5、进行当前编码区域率失真优化计算。
所述步骤1的具体步骤包括:
步骤1.1、计算当前编码块的结构相似度并将结构相似度的倒数作为率失真判决中编码图像的失真值,当前编码块的结构相似度的计算公式为:
其中,SSIM(x,y)为前编码块的结构相似度,x、y分别代表当前编码块的原始值与重建值,μx、μy分别表示进行比较的两幅图像各像素值的均值,分别表示进行比较的两幅图像各像素值的方差,σxy表示进行比较的两幅图像各像素值的协方差,C1是一个常数,其值为6.5025;
步骤1.2、使用下式替代高效视频编码原有的率失真判决公式:
其中,R表示编码当前编码块所有编码信息所需的比特数,编码块的大小为16×16,32×32,64×64,DSSE表示选取当前编码块各像素点的原始值与重建值误差的平方和作为当前编码块的失真值,表示当前编码块各像素值的方差,C2是一个常数,其值为58.5225,而对应的拉格朗日因子λSSIM通过下式计算:
其中,表示当前编码块各像素值的方差,N表示当前编码区域内编码块的个数,表示当前编码区域中第j个编码块各像素值的方差,表示高效视频编码原始率失真判决所用的拉格朗日因子。
所述步骤2的编码区域为固定大小的编码树块,该编码树块为高效视频编码器编码端最大的基本编码单元,其大小为64×64。
所述步骤2.2计算当前编码区域运动强度的时间相关性因子ΔTemporal的公式为:
其中,分别表示对应时间相关编码区域内各编码块运动矢量的方差,即当前编码区域内的同位、同位左侧、同位上侧、同位右侧、同位下侧的各编码块运动矢量的方差,β1、β2、β3、β4和β5可通过下式计算:
其中,SSIMCo、SSIMCo-Left、SSIMCo-Above、SSIMCo-Right和SSIMCo-Below分别表示对应时间相关编码区域的结构相似度的值,即当前编码区域内同位、同位左侧、同位上侧、同位右侧、同位下侧的结构相似度的值,∑SSIMTemporalCTBs表示这五个时间编码区域的结构相似度的总和。
所述相关编码区域内各编码块运动矢量的方差通过下式计算:
其中,分别表示相关编码区域内各编码块运动水平分量的方差和垂直分量的方差。
所述步骤2.5进行当前编码区域率失真优化计算公式为:
其中,ScaleMotion为拉格朗日因子的修正参数,R表示编码当前编码块所有编码信息所需的比特数,编码块的大小为16×16,32×32,64×64,DSSE表示选取当前编码块各像素点的原始值与重建值误差的平方和作为当前编码块的失真值,表示当前编码块各像素值的方差,C2是一个常数,其值为58.5225,而对应的拉格朗日因子λSSIM通过下式计算:
其中,表示当前编码块各像素值的方差,N表示当前编码区域内编码块的个数,表示当前编码区域中第j个编码块各像素值的方差,表示高效视频编码原始率失真判决所用的拉格朗日因子。
本发明的优点和积极效果是:
本发明在视频编码率失真优化判决中,引入结构相似度(SSIM)作为图像失真的评价标准,同时利用帧间编码中前后帧空间和时间相关性,结合已编码区域的运动信息,推导当前编码区域的运动强度一致性,并据此修正率失真判决中用到的参数,模拟人眼的主观视觉特性,从而在没有太大增加计算复杂度的情况下,大幅度地提高了编码图像的感知视觉质量。
附图说明
图1为本发明的当前编码块空间相关编码区域示意图;
图2为本发明的当前编码块时间相关编码区域示意图;
图3为本发明的同质性区域判定示意图;
图4为三种编码下重建图像主观效果对比图。
具体实施方式
以下结合附图对本发明做进一步详述:
一种基于结构相似度的高效视频编码感知率失真优化方法,是基于以下方面的因素实现的:
一方面,随着能够良好反映人眼主观视觉特性的图像质量评价标准纷纷涌现,其中,图像结构相似度(Structural Similarity Index Measurement,SSIM)在视频质量评价中在人类视觉特效匹配上具有一定的优越性,同时在计算复杂度上相对来说并不是太高。将SSIM引入到HEVC编码的率失真模式判决中,较以往的失真描述方式,在相同的码率下,能够提高视频的主观视觉质量。
另一方面,利用人眼对于运动图像的某些特性,通常在图像运动强度一致区域,人眼能够容忍更大程度的失真。针对HEVC具有的编码结构和帧间编码方式,选用反映视频前后帧编码块之间运动信息的运动矢量为参考评价参数。通过计算和预测编码区域运动矢量的方差,可以判定当前编码区域是否属于运动强度一致区域。并且,进一步利用运动图像的空间相关性和时间相关性,预测当前编码块是否属于运动强度一致的区域。
本高效视频编码感知率失真优化方法包括以下步骤:
步骤1、在高效视频编码器编码端进行模式判决前,利用结构相似度(SSIM)作为失真的评价标准进行图像失真的计算,并用其替代高效视频编码器编码端率失真判决中的编码图像失真值的计算。
由于HEVC的编码块大小可为4×4、8×8、16×16,32×32和64×64中的一种,而当讨论一块图像的结构相似度时,认为所考察的编码区域必须包含足够多的像素点才能够反映局部图像的某些特性,如纹理信息,因此,在利用SSIM作为图像失真的评价标准时,我们只将这种图像失真的计算方法应用到HEVC编码端中16×16,32×32和64×64大小的编码块中。
本步骤具体处理过程如下:
步骤1.1,编码图像SSIM值的取值范围为0到1,SSIM值越大,表示编码后重建的图像与原始图像越接近,意味着重建后的图像质量越好。我们可以认为,图像质量越好,则图像失真越不明显,即SSIM值与图像失真实际上是一个负相关的关系。我们在计算编码图像失真的时候需要利用SSIM作为评价标准,则可以利用1-SSIM或者SSIM值的倒数作为度量因子来替代编码图像的失真值。在本实施例中,选用SSIM值的倒数作为反映图像失真的参数用于HEVC率失真判决计算。
利用SSIM值的倒数进行率失真优化计算前,需要获取当前编码块的SSIM值。可通过下式得到:
其中,x、y分别表示进行比较的两幅图像,在当前步骤中,分别代表当前编码块的原始值与重建值,μx、μy分别表示进行比较的两幅图像各像素值的均值,分别表示进行比较的两幅图像各像素值的方差,σxy表示进行比较的两幅图像各像素值的协方差,C1、C2是两个常数,其值分别为6.5025和58.5225。
步骤1.2,在包括HEVC在内的混合视频编码框架中,图像的失真(即重建图像与原始图像的误差)是由变换编码后的量化与反量化过程产生的。因此,可以建立如下失真模型:
y=x+e
其中,x表示当前编码块的原始图像,y表示当前编码块的重建图像,e表示产生的量化误差。根据量化过程的特点,可以得出,量化误差e符合均值为0,方差为的随机分布。
由于μy=μx,我们可以将编码块的SSIM值计算简化为:
又由于当前编码块各像素点的原始值与重建值的平均平方误差(Mean SquaredError,MSE)可通过下式计算:
而根据大数定理可以得到,当N趋向于无穷大时,可以认为MSE与近似相等。
可以得到:
由于在HEVC中帧内帧间第二步所有的率失真判决都基于下式:
J=DSSE+λR=N*MSE+λR
因此可以得到:
故经过上述推导,可以使用下式来代替HEVC原有的率失真判决公式:
其中,R表示编码当前编码块所有编码信息所需的比特数,DSSE表示选取当前编码块各像素点的原始值与重建值误差的平方和作为当前编码块的失真值,表示当前编码块各像素值的方差,而对应的拉格朗日因子λSSIM可通过下式计算:
其中,表示当前编码块各像素值的方差,N表示当前编码区域内编码块的个数,表示当前编码区域中第j个编码块各像素值的方差,表示HEVC原始率失真判决所用的拉格朗日因子。
步骤2、根据编码图像空域和时域上邻近区域的运动强度一致性来修正高效视频编码(HEVC)率失真判决计算中的拉格朗日因子,进行率失真优化计算,找到最优的编码模式。
为充分利用人眼的主观视觉特性,可以划分相关编码区域,提取其运动信息,进一步优化率失真判决过程。通常,视频在经过HEVC编码器进行编码时,每帧图像会被划分为固定大小的最大编码单元,即编码树块,其大小为64×64。本发明将这种编码树块作为考察的编码区域,判定其运动强度一致性,并充分利用其空间和时间上的相关信息。
在HEVC帧间编码中,运动矢量是反映图像前后帧运动的重要信息。选用运动矢量为参考评价参数,通过计算编码区域运动矢量的方差,可以判定当前编码区域是否属于运动强度一致区域。通常对于运动强度一致的同质性区域,人眼可以容忍更大的失真,在此编码区域进行率失真判决时,可以适当减少失真的权重。
在实际编码过程中,在对当前编码块进行率失真判决时,不能获得其所在编码区域的运动矢量的方差。因此,需要根据运动图像时域和空域的相关性,预测推导出所需的运动强度的度量因子。
在计算相关编码区域运动强度一致性时,需要注意到在HEVC编码器中运动矢量具有水平和垂直两个分量,分别表示编码图像水平和垂直两个方向的运动信息,在评估运动强度时,这两种运动应当被同等考虑。在获得编码区域运动矢量的方差时,需要同时计算这两个分量的方差。因此,相关编码区域内各编码块运动矢量的方差可通过下式计算:
其中,分别表示相关编码区域内各编码块运动水平分量的方差和垂直分量的方差。
综上所述,本步骤具体处理过程如下:
步骤2.1、当前编码区域运动强度的空间相关性因子ΔSpatial可由其空间相关编码区域(即当前编码区域左、上、左上、右上,如图1所示)中运动矢量的方差加权得出,可通过下式计算:
其中,分别表示对应空间相关编码区域(即当前编码区域左、上、左上、右上)内各编码块运动矢量的方差。
计算加权系数α1、α2、α3和α4时,充分利用步骤1中计算得到的SSIM值,并根据SSIM值的大小来分配权重,可以得到:
其中,SSIMLeft、SSIMAbove、SSIMAbove-Left和SSIMAbove-Right分别表示对应空间相关编码区域(即当前编码区域左、上、左上、右上)的SSIM值,∑SSIMSpatialCTBs则表示这四个空间编码区域的SSIM值的总和。
步骤2.2、当前编码区域运动强度的时间相关性因子ΔTemporal可由其时间相关编码区域(即当前编码区域同位、同位之左、同位之上、同位之右、同位之下,如图2所示)中运动矢量的方差加权得出,可通过下式计算:
其中,分别表示对应时间相关编码区域(即当前编码区域同位、同位之左、同位之上、同位之右、同位之下)内各编码块运动矢量的方差。
计算加权系数β1、β2、β3、β4和β5时,充分利用步骤1中计算得到的SSIM值,并根据SSIM值的大小来分配权重,可以得到:
其中,SSIMCo、SSIMCo-Left、SSIMCo-Above、SSIMCo-Right和SSIMCo-Below分别表示对应时间相关编码区域(即当前编码区域同位、同位之左、同位之上、同位之右、同位之下)的SSIM值,∑SSIMTemporalCTBs则表示这五个时间编码区域的SSIM值的总和。
步骤2.3、预测当前编码区域同质性的度量因子,需要同时考虑其空间相关性和时间相关性的因素,因此对前面得到的相关性因子进行加权。
当前编码区域同质性的度量因子ΔCTB可通过下式计算:
ΔCTB=γ*ΔTemporal+(1-γ)ΔSpatial
利用运动图像空间上的连续性来选取加权系数γ,可通过下式计算:
其中,n表示前一编码帧中同质性区域的个数,N表示前一编码帧中编码区域的总个数。
步骤2.4、对于相关编码区域,其同质性度量因子越大,则其运动强度的一致性越差。判断的依据是,可以对一帧编码图像确定一个阈值,如果当前编码区域的运动强度度量因子小于该阈值,则被判定为同质性区域。对于判断为同质性区域的编码区域,应当在率失真判决中适当减少失真的权重,反之则应当增加失真的权重,即减小率失真判决公式中拉格朗日因子的值。实际编码时同质性区域的判定结果如图3所示(以Kimono序列为例,左侧图像为原始帧,右侧图像中黑色部分代表被判定为同质区域的编码块,白色部分代表被判定为非同质区域的编码块)。
引入一个拉格朗日因子的修正参数ScaleMotion来对率失真判决公式进行修正,可通过下式计算:
其中,θ可通过下式计算:
其中,μ表示当前编码区域亮度的均值。
利用运动图像时间上的连续性来选取阈值Threshold,可通过下式计算:
Threshold=AvrΔ*SSIMCodedFrame
其中,AvrΔ表示前一编码帧中所有编码区域同质性度量因子的平均值,SSIMCodedFrame表示所有已编码帧的SSIM值的均值。
步骤2.5、进行当前编码区域率失真优化计算。
通过上述过程,可以得到HEVC帧间预测的率失真判决公式为:
而对于HEVC帧内预测部分,考虑到编码过程中不具备可以利用的运动信息,本发明中对帧内预测的拉格朗日因子不作修正。
下面给出在HEVC中应用本率失真优化方法时,与现有HM10.0的仿真性能比较分析。其中,仿真环境为Visual Studio 2010,仿真实验分别选用HEVC官方标准视频序列库中的Kimono序列、ParkScene序列、Cactus序列、Johnny序列、FourPeople序列、BasketballDrill序列、BQMall序列、RaceHorses序列进行测试,分别在All Intra(AI)、Lowdelay P(LP)和Random Access(RA)三种编码条件下进行测试。比较结果分别如表1、表2、表3和图4所示。
表1 AI设置下编码性能比较
序列 BD rate(SSIM) BD rate(PSNR) 编码时间
Kimono -0.8% 0.4% 100%
ParkScene -1.6% 0.7% 101%
Cactus -2.2% 0.6% 100%
Johnny -2.7% 0.5% 100%
FourPeople -3.7% 1.0% 100%
BasketballDrill -1.7% 0.3% 100%
BQMall -2.3% 0.9% 101%
RaceHorses -2.1% 1.1% 100%
Average -2.1% 0.7% 100%
表2 LP设置下编码性能比较
序列 BD rate(SSIM) BD rate(PSNR) 编码时间
Kimono -1.8% 0.3% 102%
ParkScene -2.2% 0.5% 100%
Cactus -2.7% 0.7% 101%
Johnny -3.5% 0.9% 102%
FourPeople -3.1% 0.4% 101%
BasketballDrill -1.8% 0.2% 102%
BQMall -2.6% 1.0% 100%
RaceHorses -4.1% 0.8% 101%
Average -2.7% 0.6% 101%
表3 RA设置下编码性能比较
由表1、2、3可见,在应用本专利申请中的率失真优化算法条件下,与HM10.0相比有在BD-rate SSIM上对于AI、LP和RA三种编码设置分别有2.1%、2.7%和2.5%的增益,而用适合率传统失真计算的图像质量评价标准BD-rate PSNR来比较,也只有微小的性能损失。由图4可见,应用本专利申请的率失真优化算法后,相比于HM10.0在主观质量上较明显的提高,其中,图4中的(a)部分是原始视频序列,图4中的(b)部分表示由HEVC现有的率失真优化方法的得到的编码重建图像,图4中的(c)部分表示由本方法提出的率失真优化方法的得到的编码重建图像。从编码时间来看,应用本专利申请的率失真优化算法后,对HEVC编码器的总体复杂度并没有太大的提高。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (6)

1.一种基于结构相似度的高效视频编码感知率失真优化方法,其特征在于,包括以下步骤:
步骤1、在高效视频编码器编码端进行模式判决前,利用结构相似度作为失真的评价标准进行图像失真的计算,并用其替代高效视频编码器编码端率失真判决中的编码图像失真值的计算;
步骤2、根据编码图像空域和时域上邻近区域的运动强度一致性来修正高效视频编码率失真判决计算中的拉格朗日因子,进行当前编码区域率失真优化计算,找到最优的编码模式;所述步骤2的具体步骤包括:
步骤2.1、按如下公式计算当前编码区域运动强度的空间相关性因子ΔSpatial
Δ S p a t i a l = α 1 σ L e f t 2 + α 2 σ A b o v e 2 + α 3 σ A b o v e - L e f t 2 + α 4 σ A b o v e - R i g h t 2
其中,分别表示对应空间相关编码区域内各编码块运动矢量的方差,即当前编码区域内的左侧、上侧、左上侧、右上侧的编码块运动矢量的方差,α1、α2、α3和α4可通过下式计算:
α 1 = SSIM L e f t ΣSSIM S p a t i a l C T B s
α 2 = SSIM A b o v e ΣSSIM S p a t i a l C T B s
α 3 = SSIM A b o v e - L e f t ΣSSIM S p a t i a l C T B s
α 4 = SSIM A b o v e - R i g h t ΣSSIM S p a t i a l C T B s
其中,SSIMLeft、SSIMAbove、SSIMAbove-Left和SSIMAbove-Right分别表示对应空间相关编码区域的结构相似度的值,即当前编码区域内的左侧、上侧、左上侧、右上侧的结构相似度的值,ΣSSIMSpatialCTBs则表示这四个空间编码区域的结构相似度的值的总和;
步骤2.2、计算当前编码区域运动强度的时间相关性因子ΔTemporal
步骤2.3、按下述公式计算当前编码区域同质性的度量因子ΔCTB
ΔCTB=γ*ΔTemporal+(1-γ)ΔSpatial
其中,加权系数γ通过下式计算:
γ = n N
其中,n表示前一编码帧中同质性区域的个数,N表示前一编码帧中编码区域的总个数;
步骤2.4、计算当前编码区域率失真判决所用拉格朗日因子的修正参数ScaleMotion,其计算公式为:
Scale M o t i o n = &theta; &Delta; C T B &GreaterEqual; T h r e s h o l d 1 &Delta; C T B < T h r e s h o l d
其中,θ可通过下式计算:
&theta; = 0.9 + ( 50 - &mu; ) / 1500 0 < &mu; &le; 50 0 50 < &mu; < 180 ( &mu; - 180 ) / 4250 &mu; &GreaterEqual; 180
其中,μ表示当前编码区域亮度的均值;
Threshold为判断当前编码区域是否为同质性区域的阈值,其计算公式为:
Threshold=AvrΔ*SSIMCodedFrame
其中,AvrΔ表示前一编码帧中所有编码区域同质性度量因子的平均值,SSIMCodedFrame表示所有已编码帧的结构相似度的值的平均数;
步骤2.5、进行当前编码区域率失真优化计算。
2.根据权利要求1所述基于结构相似度的高效视频编码感知率失真优化方法,其特征在于:所述步骤1的具体步骤包括:
步骤1.1、计算当前编码块的结构相似度并将结构相似度的倒数作为率失真判决中编码图像的失真值,当前编码块的结构相似度的计算公式为:
S S I M ( x , y ) = ( 2 &mu; x &mu; y + C 1 ) ( 2 &sigma; x y + C 2 ) ( &mu; x 2 + &mu; y 2 + C 1 ) ( &sigma; x 2 + &sigma; y 2 + C 2 )
其中,SSIM(x,y)为前编码块的结构相似度,x、y分别代表当前编码块的原始值与重建值,μx、μy分别表示进行比较的两幅图像各像素值的均值,分别表示进行比较的两幅图像各像素值的方差,σxy表示进行比较的两幅图像各像素值的协方差,C1是一个常数,其值为6.5025;
步骤1.2、使用下式替代高效视频编码原有的率失真判决公式:
J = D S S E + ( 2 &sigma; x 2 + C 2 ) &lambda; S S I M R
其中,R表示编码当前编码块所有编码信息所需的比特数,编码块的大小为16×16,32×32,64×64,DSSE表示选取当前编码块各像素点的原始值与重建值误差的平方和作为当前编码块的失真值,表示当前编码块各像素值的方差,C2是一个常数,其值为58.5225,而对应的拉格朗日因子λSSIM通过下式计算:
&lambda; S S I M = 2 &sigma; x i 2 + C 2 exp ( 1 N &Sigma; j = 1 N l o g ( 2 &sigma; x j 2 + C 2 ) ) &lambda; ~ ~
其中,表示当前编码块各像素值的方差,N表示当前编码区域内编码块的个数,表示当前编码区域中第j个编码块各像素值的方差,表示高效视频编码原始率失真判决所用的拉格朗日因子。
3.根据权利要求1所述的基于结构相似度的高效视频编码感知率失真优化方法,其特征在于:所述步骤2的编码区域为固定大小的编码树块,该编码树块为高效视频编码器编码端最大的基本编码单元,其大小为64×64。
4.根据权利要求1所述的基于结构相似度的高效视频编码感知率失真优化方法,其特征在于:所述步骤2.2计算当前编码区域运动强度的时间相关性因子ΔTemporal的公式为:
&Delta; T e m p o r a l = &beta; 1 &sigma; C o 2 + &beta; 2 &sigma; C o - L e f t 2 + &beta; 3 &sigma; C o - A b o v e 2 + &beta; 4 &sigma; C o - R i g h t 2 + &beta; 5 &sigma; C o - B e l o w 2
其中,分别表示对应时间相关编码区域内各编码块运动矢量的方差,即当前编码区域内的同位、同位左侧、同位上侧、同位右侧、同位下侧的各编码块运动矢量的方差,β1、β2、β3、β4和β5可通过下式计算:
&beta; 1 = SSIM C o &Sigma;SSIM T e m p o r a l C T B s
&beta; 2 = SSIM C o - L e f t &Sigma;SSIM T e m p o r a l C T B s
&beta; 3 = SSIM C o - A b o v e &Sigma;SSIM T e m p o r a l C T B s
&beta; 4 = SSIM C o - R i g h t &Sigma;SSIM T e m p o r a l C T B s
&beta; 5 = SSIM C o - B e l o w &Sigma;SSIM T e m p o r a l C T B s
其中,SSIMCo、SSIMCo-Left、SSIMCo-Above、SSIMCo-Right和SSIMCo-Below分别表示对应时间相关编码区域的结构相似度的值,即当前编码区域内同位、同位左侧、同位上侧、同位右侧、同位下侧的结构相似度的值,∑SSIMTemporalCTBs表示这五个时间编码区域的结构相似度的总和。
5.根据权利要求1或4所述的基于结构相似度的高效视频编码感知率失真优化方法,其特征在于:所述相关编码区域内各编码块运动矢量的方差通过下式计算:
&sigma; M V 2 = ( &sigma; MV x 2 ) 2 + ( &sigma; MV y 2 ) 2
其中,分别表示相关编码区域内各编码块运动水平分量的方差和垂直分量的方差。
6.根据权利要求1所述的基于结构相似度的高效视频编码感知率失真优化方法,其特征在于,所述步骤2.5进行当前编码区域率失真优化计算公式为:
J = D S S E + ( 2 &sigma; x 2 + C 2 ) Scale M o t i o n &lambda; S S I M R
其中,ScaleMotion为拉格朗日因子的修正参数,R表示编码当前编码块所有编码信息所需的比特数,编码块的大小为16×16,32×32,64×64,DSSE表示选取当前编码块各像素点的原始值与重建值误差的平方和作为当前编码块的失真值,表示当前编码块各像素值的方差,C2是一个常数,其值为58.5225,而对应的拉格朗日因子λSSIM通过下式计算:
&lambda; S S I M = 2 &sigma; x i 2 + C 2 exp ( 1 N &Sigma; j = 1 N l o g ( 2 &sigma; x j 2 + C 2 ) ) &lambda; ~ ~
其中,表示当前编码块各像素值的方差,N表示当前编码区域内编码块的个数,表示当前编码区域中第j个编码块各像素值的方差,表示高效视频编码原始率失真判决所用的拉格朗日因子。
CN201310617003.5A 2013-11-28 2013-11-28 基于结构相似度的高效视频编码感知率失真优化方法 Active CN103607590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310617003.5A CN103607590B (zh) 2013-11-28 2013-11-28 基于结构相似度的高效视频编码感知率失真优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310617003.5A CN103607590B (zh) 2013-11-28 2013-11-28 基于结构相似度的高效视频编码感知率失真优化方法

Publications (2)

Publication Number Publication Date
CN103607590A CN103607590A (zh) 2014-02-26
CN103607590B true CN103607590B (zh) 2017-04-05

Family

ID=50125787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310617003.5A Active CN103607590B (zh) 2013-11-28 2013-11-28 基于结构相似度的高效视频编码感知率失真优化方法

Country Status (1)

Country Link
CN (1) CN103607590B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104301724B (zh) 2014-10-17 2017-12-01 华为技术有限公司 视频处理方法、编码设备和解码设备
CN105872545B (zh) * 2016-04-19 2019-03-29 电子科技大学 一种随机接入视频编码中层次化时域率失真优化方法
CN108717703B (zh) * 2018-03-26 2021-11-02 杭州电子科技大学 一种基于hevc的运动目标检测和跟踪方法
CN108737839B (zh) * 2018-04-11 2020-09-25 西安理工大学 一种面向帧内码率控制的拉格朗日因子计算方法
CN108873914B (zh) * 2018-09-21 2021-07-06 长安大学 一种基于深度图像数据的机器人自主导航系统及方法
CN111193931B (zh) * 2018-11-14 2023-04-07 深圳市中兴微电子技术有限公司 一种视频数据的编码处理方法和计算机存储介质
WO2020172813A1 (zh) * 2019-02-27 2020-09-03 Oppo广东移动通信有限公司 率失真优化方法及装置、计算机可读存储介质
CN110324618A (zh) * 2019-07-03 2019-10-11 上海电力学院 基于vmaf准则的提高视频质量的优化编码方法
CN110636311B (zh) * 2019-09-18 2021-10-15 浙江大华技术股份有限公司 运动矢量的获取方法及相关预测方法、装置
CN112055255B (zh) * 2020-09-15 2022-07-05 深圳创维-Rgb电子有限公司 拍摄画质优化方法、装置、智能电视和可读存储介质
CN113099227B (zh) * 2021-03-12 2022-08-16 西安交通大学 一种联合优化码率分配和率失真性能的视频编码方法
CN114205622A (zh) * 2021-12-16 2022-03-18 福州大学 一种基于HEVC标准的帧内预测的64x64 CU预处理方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945275A (zh) * 2010-08-18 2011-01-12 镇江唐桥微电子有限公司 一种基于感兴趣区域的视频编码方法
CN102647591A (zh) * 2012-04-17 2012-08-22 中国科学院声学研究所 基于ssim评价的容错率失真优化视频编码方法、装置
CN102780886A (zh) * 2012-07-23 2012-11-14 深圳广晟信源技术有限公司 一种率失真优化方法
WO2012162806A1 (en) * 2011-06-01 2012-12-06 Zhou Wang Method and system for structural similarity based perceptual video coding
WO2012171113A1 (en) * 2011-06-14 2012-12-20 Zhou Wang Method and system for structural similarity based rate-distortion optimization for perceptual video coding

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9369703B2 (en) * 2011-09-29 2016-06-14 Texas Instruments Incorporated Method and apparatus for SSIM-based bit allocation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945275A (zh) * 2010-08-18 2011-01-12 镇江唐桥微电子有限公司 一种基于感兴趣区域的视频编码方法
WO2012162806A1 (en) * 2011-06-01 2012-12-06 Zhou Wang Method and system for structural similarity based perceptual video coding
WO2012171113A1 (en) * 2011-06-14 2012-12-20 Zhou Wang Method and system for structural similarity based rate-distortion optimization for perceptual video coding
CN102647591A (zh) * 2012-04-17 2012-08-22 中国科学院声学研究所 基于ssim评价的容错率失真优化视频编码方法、装置
CN102780886A (zh) * 2012-07-23 2012-11-14 深圳广晟信源技术有限公司 一种率失真优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
On Rate Distortion Optimization;chuohao Yeo. et al;《IEEE transactions on circuits and systems for video technology》;20130628;第23卷(第7期);正文第1172页左栏倒数第5行-第1174页右栏第20行 *

Also Published As

Publication number Publication date
CN103607590A (zh) 2014-02-26

Similar Documents

Publication Publication Date Title
CN103607590B (zh) 基于结构相似度的高效视频编码感知率失真优化方法
CN101710993B (zh) 基于块的自适应超分辨率视频处理方法及系统
CN101729891B (zh) 一种多视点深度视频的编码方法
CN101715146B (zh) 压缩视频质量评价方法及评价系统
CN106131554B (zh) 基于主要边缘方向的hevc快速样点自适应补偿方法
CN103581647B (zh) 一种基于彩色视频运动矢量的深度图序列分形编码方法
Lin et al. No-reference video quality assessment in the compressed domain
CN103634601B (zh) 基于结构相似度的高效视频编码感知码率控制优化方法
CN106231312A (zh) 用于对图像进行编码的装置
CN101056408B (zh) 用于确定视频编码中跳跃模式的阈值的方法和装置
CN102209243A (zh) 基于线性模型的深度图帧内预测方法
CN107087200A (zh) 针对高效率视频编码标准的跳过编码模式提前判决方法
CN102970540A (zh) 基于关键帧码率-量化模型的多视点视频码率控制方法
CN104602028A (zh) 一种立体视频b帧整帧丢失错误隐藏方法
KR20090087471A (ko) 이미지를 인코딩하는 방법 및 그 방법을 구현하는 장치
US20170374361A1 (en) Method and System Of Controlling A Video Content System
CN101404766A (zh) 一种多视点视频信号的编码方法
CN109587503A (zh) 一种基于边缘检测的3d-hevc深度图帧内编码模式快速决策方法
CN110519591A (zh) 一种基于多用途编码中帧内编码的预测模式快速选择方法
Sun et al. Rate-distortion analysis of dead-zone plus uniform threshold scalar quantization and its application—Part II: Two-pass VBR coding for H. 264/AVC
Qi et al. Efficient rate-distortion optimization for HEVC using SSIM and motion homogeneity
Moellenhoff et al. DCT transform coding of stereo images for multimedia applications
Huang No-reference video quality assessment by HEVC codec analysis
Sun et al. An efficient quality metric for DIBR-based 3D video
Wang et al. Intra coding and refresh based on video epitomic analysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant