CN102647591A - 基于ssim评价的容错率失真优化视频编码方法、装置 - Google Patents

基于ssim评价的容错率失真优化视频编码方法、装置 Download PDF

Info

Publication number
CN102647591A
CN102647591A CN2012101131311A CN201210113131A CN102647591A CN 102647591 A CN102647591 A CN 102647591A CN 2012101131311 A CN2012101131311 A CN 2012101131311A CN 201210113131 A CN201210113131 A CN 201210113131A CN 102647591 A CN102647591 A CN 102647591A
Authority
CN
China
Prior art keywords
ssim
coding
distortion
pixel
macro block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101131311A
Other languages
English (en)
Other versions
CN102647591B (zh
Inventor
刘延伟
赵平华
要瑞宵
慈松
唐晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201210113131.1A priority Critical patent/CN102647591B/zh
Publication of CN102647591A publication Critical patent/CN102647591A/zh
Application granted granted Critical
Publication of CN102647591B publication Critical patent/CN102647591B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种基于主观视觉结构相似性SSIM评价的容错率失真优化视频编码方法、装置。所述方法包括利用SSIM作为失真的评价标准,结合信道的信息反馈,在编码端进行基于SSIM评价的端到端失真估计;根据帧内或帧间编码模式,计算该编码模式需要的比特数;通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式。本发明解决了传统联合信源信道视频编码中失真评价并不十分符合人类视觉特性的问题,同时在信源编码中引入了信道传输导致的主观失真的估计,能够抑制错误引起的主观失真传递的影响,形成了适应信道传输的容错率失真优化的主观视觉质量优化的视频编码技术。

Description

基于SSIM评价的容错率失真优化视频编码方法、装置
技术领域
本发明涉及无线通信视频编码领域,特别涉及一种基于主观视觉SSIM评价的容错率失真优化视频编码方法、装置。
背景技术
随着无线网络技术的快速发展,无线多媒体的应用得越来越广泛,例如无线视频会议系统,无线视频监控等。由于无线网络固有的不稳定,易出错的特性,为无线视频的传输质量带来了很大的影响。为提高视频传输质量,联合信源信道的方法可以相对有效的提高视频传输的质量。目前,联合信源信道编码主要采用基于MSE失真描述的率失真优化,控制端到端的视频失真。这主要是延续了H.264编码中的率失真优化的思路。H.264/AVC标准其较好地编码性能得益于它所采用的率失真优化(rate-distortion optimization,RDO)模型与一系列的编码模式等。RDO中所采用的客观的失真描述方式(如SAD,MSE等)具有计算简单实现简单的优点,但其并不能很好的体现人的视觉特性,因此H.264/AVC中已有的RDO模型并没有很好的考虑到人类的视觉特性。
近年来的研究表明,SSIM在视频质量评价中相对于以往的失真评价方法在人类视觉特性匹配上具有一定的优越性。将SSIM引入到了H.264/AVC编码的预测模式和宏块模式选择中,实验结果表明SSIM的引入在一定程度上提高了编码性能,较以往的SAD等失真描述方式,在相同的码率下,更能够提高人视觉感知到的视频质量。
虽然SSIM作为RDO模式选择的失真度量被引入到了H.264/AVC的编码过程中,提高了编码后的重构视频的视觉感知质量,但他们都没有考虑到由于传输和解码端错误隐藏所导致的视频主观质量的下降,因此不考虑信道导致主观SSIM失真的率失真优化编码方法,并不能很好的控制和适应无线传输过程中引起的端到端的视频质量下降。
发明内容
针对上述问题,本发明的目的在于提供一种基于主观视觉结构相似性SSIM评价的容错率失真优化视频编码方法、装置。
在第一方面,本发明实施例提供一种基于结构相似性SSIM主观评价的容错率失真视频编码方法,所述方法包括:在编码端进行基于SSIM评价的端到端主观失真估计,所述端到端指编码端到视频传输后的解码端;根据帧内或帧间编码模式,计算编码该模式需要的比特数;通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式;采用所述最优的编码模式进行容错率失真优化的联合信源信道编码。
在第二方面,本发明实施例提供一种基于结构相似性SSIM主观评价的容错率失真视频编码装置,所述装置包括:失真估计模块,用于在编码端进行基于SSIM评价的端到端主观失真估计,所述端到端指编码端到解码端;比特数计算模块,用于根据帧内或帧间编码模式,计算编码该模式需要的比特数;最优编码模式确定模块,用于通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式;编码模块,用于采用最优的编码模式进行容错率失真优化的联合信源信道编码。
本发明实施例的方案,借助信道导致主观SSIM失真的率失真优化编码,能较好控制和适应无线传输过程中引起的端到端的视频质量下降。
附图说明
下面结合附图,对本发明的具体实施方案做进一步的详细描述,附图中:
图1是端到端SSIM失真示意图;
图2是基于主观SSIM失真评价的容错率失真优化编码流程;
图3是基于主观SSIM失真评价的容错率失真优化编码装置示意图。
具体实施方式
本发明的目的在于,解决如何利用SSIM指导,进行主观容错率失真优化的联合信源信道编码,提高无线视频传输的主观质量,保证客户端得到较高的视频服务质量。
为了实现上述发明目的,本发明提供了一种基于SSIM评价的主观容错率失真优化的方法。该方法通过估计端到端SSIM失真,并结合编码的码率以及容错率失真优化的拉格朗日优化算子,进行率失真优化的编码模式选择,进而实现一种主观率失真优化的联合信源信道编码方法,优化无线视频的传输质量。
所述的一种基于SSIM评价的主观容错率失真优化的视频编码方法。该方法通过利用信道信息反馈,估计视频的丢包率,然后利用逐像素递归的方法估计当前编码块的端到端主观SSIM失真。通过编码码率和失真的平衡,找到最优的编码模式。率失真的平衡主要是通过拉格朗日因子来计算码率失真代价的形式来实现的。所提出的方法主要包含以下步骤,
步骤1):在编码端进行基于SSIM评价的端到端失真估计,采用如下公式进行估计:
D n , m SSIM ~ = 1 - ( 1 - ρ ) SSIM ( f n , m , f ^ n , m ) - ρ · SSIM ( f n , m , f ~ n , m )
其中n为帧号,m为宏块号,fn,m为第n帧原始图像第m个宏块,
Figure BDA0000153963600000032
为不丢包时解码端重构第n帧的第m个宏块,为丢包时解码端第n帧第m个宏块,ρ为丢包率,可以通过信道反馈SNR进行估计得到;
这里所述的SSIM(x,y)是表示图像x和y之间结构相似性度量,可以按如下公式计算。
SSIM ( x , y ) = ( 2 μ x μ y + C 1 ) ( 2 σ xy + C 2 ) ( μ x 2 + μ y 2 + C 1 ) ( σ x 2 + σ y 2 + C 2 ) ,
这里μx和μy为x和y的均值,σx和σy为x和y的标准差,σxy为x和y之间的协方差。
其中
Figure BDA0000153963600000042
Figure BDA0000153963600000043
中的像素按如下方式得到:
对于帧内编码块不丢包时,帧内编码块的像素值
Figure BDA0000153963600000044
可以正常解码得到,当发生丢包时帧内编码块的像素值通过时域拷贝错误隐藏方式得到,也就是
Figure BDA0000153963600000046
对于帧间编码块的解码端重构像素按如下方式得到。当不发生丢包时,帧间编码块像素值可以正常解码得到,即
Figure BDA0000153963600000047
当发生丢包时,帧间编码块的像素值可以通过时域拷贝错误隐藏方式得到,即 f ~ n , m i = E [ f ~ ~ n - 1 , m i ] ,
其中E[·]表示期望,
Figure BDA0000153963600000049
表示不丢包时解码端第n帧原始图像第m个宏块的第i个像素的重构值,
Figure BDA00001539636000000410
表示丢包时解码端第n帧原始图像第m个宏块的第i个像素的重构值,
Figure BDA00001539636000000411
表示解码端第n-1帧原始图像第m个宏块的第i个像素的重构值的期望值,
Figure BDA00001539636000000412
表示解码端第n帧原始图像第m个宏块的第i个像素的在第n-1帧中参考的某个宏块m′中的某个像素的期望值,
Figure BDA00001539636000000413
表示第n帧原始图像第m个宏块第i个像素相应的预测残差,
Figure BDA00001539636000000414
为编码时第n帧原始图像第m个宏块的第i个像素的在第n-1帧中参考的某个宏块m′中的某个像素值,所述的m与m′之间不存在特定的对应关系。
对于帧内编码块的
Figure BDA00001539636000000415
E [ f ~ ~ n - 1 , m i ] = ( 1 - ρ ) f ^ n - 1 , m i + ρE [ f ~ ~ n - 2 , m i ] ;
对于帧间编码块的
Figure BDA0000153963600000052
E [ f ~ ~ n - 1 , m i ] = ( 1 - ρ ) ( e ^ n - 1 , m i + E [ f ~ ~ n - 2 , m ′ ′ i ] ) + ρE [ f ~ ~ n - 2 , m i ] ,
其中
Figure BDA0000153963600000054
表示不丢包时解码端第n-1帧原始图像第m个宏块的第i个像素的重构值,
Figure BDA0000153963600000055
表示解码端第n-2帧原始图像第m个宏块的第i个像素的重构值的期望值,
Figure BDA0000153963600000056
表示解码端第n-1帧原始图像第m个宏块的第i个像素的在第n-2帧中参考的某个宏块m″中的某个像素的期望值,表示第n-1帧原始图像第m个宏块第i个像素相应的预测残差,
Figure BDA0000153963600000058
为编码时第n-1帧原始图像第m个宏块的第i个像素的在第n-2帧中参考的某个宏块m″中的某个像素值,所述的m与m″之间不存在特定的对应关系。;
对于
Figure BDA0000153963600000059
也通过上面的计算方式得到,将
Figure BDA00001539636000000510
的计算公式下标中的m替换为m′,即可得到
Figure BDA00001539636000000511
步骤2):根据帧内或帧间编码模式,计算每种编码模式需要的比特数,包括模式信息,运动信息,残差数据等必需的比特数;
步骤3):计算拉格朗日因子,通过主观容错率失真优化模型,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式。所采用的主观容错率失真优化模型如下,
J=DSSIMSSIMR
其中DSSIM是解码端重构值的SSIM主观端到端失真,λSSIM为基于主观SSIM失真评价的拉格朗日因子,R为编码产生的比特数,J为主观率失真代价。
拉格朗日因子λSSIM,在信道传输丢包环境下,通过下面公式计算,
λ SSIM = ( 1 - BER ) R ( λ ^ + λ ′ )
其中BER为信道误比特率,R为编码一个视频数据包的比特数,按照视频编码领域的理解,这里称之为码率。
Figure BDA0000153963600000061
为解码端不丢包时的SSIM失真对码率进行求导的偏导值,即为
Figure BDA0000153963600000062
其中
Figure BDA0000153963600000063
表示一个视频数据包解码后不丢包时的SSIM,
Figure BDA0000153963600000064
可以在编码端通过斜率近似法进行估计得到,λ′表达式为
λ ′ = - ( SSIM ( f n , m , f ~ n , m ) - SSIM ( f n , m , f ^ n , m ) ) ln ( 1 - BER )
本发明的优点在于可以实现一种主观失真评价的容错率失真优化编码方法,使得传输的码流能够抑制传输错误传递影响,保证客户端的主观视频服务体验。本发明提供的容错率失真编码方法可以应用于易错网络下的视频传输,特别是无线网络环境下的视频传输。
下面结合附图和具体实施方式,对本发明的方法进行进一步详细的说明。
传统的率失真优化视频编码方法采用MSE(均方误差)作为编码和传输失真的评价标准,尽管MSE可以刻画信号方面的损失情况,但是并不能很好的反应人类视觉对视频质量的感知情况。SSIM作为结构相似性的评价准则,能够很好的体现人类主观视觉的感知情况。在视频数据传输过程中,由于视频编码预测环节导致的预测依赖特性,一个数据包的丢失,不仅会给当前视频帧带来错误,还会给后续参考该帧的数据带来一定的错误传递,因此失真也必须以一种的递归的方式进行计算。
如图1所示,端到端的失真包含了编码量化引起的失真和传输错误导致的失真,这两部分失真如果都以SSIM的形式进行刻画,可以很好的支持主观率失真的编码。为了在编码端对传输丢包做出一个调整,视频编码端根据信道的丢包情况进行一定的编码适配,也就是选择率失真最优的编码模式来抑制传输错误引起的视觉主观上的影响。
下面结合实际的主观容错率失真优化编码说明本发明的具体实施步骤。
假设编码当前一帧的一个条带中的一个编码宏块an,则图2所示的详细实施步骤如下:
步骤1):首先选择一种块尺寸模式编码当前这个宏块,估计宏块an在当前编码模式下的端到端SSIM失真。
D n , m SSIM ~ = 1 - ( 1 - ρ ) SSIM ( f n , m , f ^ n , m ) - ρ · SSIM ( f n , m , f ~ n , m ) ,
其中n为帧号,m为宏块号,fn,m为第n帧原始图像第m个宏块,
Figure BDA0000153963600000072
为不丢包时解码端重构第n帧的第m个宏块,为丢包时解码端第n帧第m个宏块,ρ为丢包率,可以通过信道反馈SNR进行估计得到;
其中
Figure BDA0000153963600000074
Figure BDA0000153963600000075
中的像素按如下方式得到:
对于帧内编码块不丢包时,帧内编码块的像素值
Figure BDA0000153963600000076
可以正常解码得到,当发生丢包时帧内编码块的像素值
Figure BDA0000153963600000077
通过时域拷贝错误隐藏方式得到,也就是
Figure BDA0000153963600000078
对于帧间编码块的解码端重构像素按如下方式得到。当不发生丢包时,帧间编码块像素值可以正常解码得到,即
Figure BDA0000153963600000079
当发生丢包时,帧间编码块的像素值可以通过时域拷贝错误隐藏方式得到,即 f ~ n , m i = E [ f ~ ~ n - 1 , m i ] ,
其中E[·]表示期望,
Figure BDA00001539636000000711
表示不丢包时解码端第n帧原始图像第m个宏块的第i个像素的重构值,
Figure BDA00001539636000000712
表示丢包时解码端第n帧原始图像第m个宏块的第i个像素的重构值,
Figure BDA00001539636000000713
表示解码端第n-1帧原始图像第m个宏块的第i个像素的重构值的期望值,表示解码端第n帧原始图像第m个宏块的第i个像素的在第n-1帧中参考的某个宏块m′中的某个像素的期望值,
Figure BDA00001539636000000715
表示第n帧原始图像第m个宏块第i个像素相应的预测残差,
Figure BDA00001539636000000716
为编码时第n帧原始图像第m个宏块的第i个像素的在第n-1帧中参考的某个宏块m′中的某个像素值。
对于帧内编码块的
Figure BDA0000153963600000081
E [ f ~ ~ n - 1 , m i ] = ( 1 - ρ ) f ^ n - 1 , m i + ρE [ f ~ ~ n - 2 , m i ] ;
对于帧间编码块的
Figure BDA0000153963600000083
E [ f ~ ~ n - 1 , m i ] = ( 1 - ρ ) ( e ^ n - 1 , m i + E [ f ~ ~ n - 2 , m ′ ′ i ] ) + ρE [ f ~ ~ n - 2 , m i ] ,
其中
Figure BDA0000153963600000085
表示不丢包时解码端第n-1帧原始图像第m个宏块的第i个像素的重构值,
Figure BDA0000153963600000086
表示解码端第n-2帧原始图像第m个宏块的第i个像素的重构值的期望值,
Figure BDA0000153963600000087
表示解码端第n-1帧原始图像第m个宏块的第i个像素的在第n-2帧中参考的某个宏块m″中的某个像素的期望值,
Figure BDA0000153963600000088
表示第n-1帧原始图像第m个宏块第i个像素相应的预测残差,为编码时第n-1帧原始图像第m个宏块的第i个像素的在第n-2帧中参考的某个宏块m″中的某个像素值。
对于
Figure BDA00001539636000000810
也通过上面的计算方式得到,将的计算公式下标中的m替换为m′,即可得到
Figure BDA00001539636000000812
由于
Figure BDA00001539636000000813
的计算依赖于前一帧的
Figure BDA00001539636000000814
所以基于SSIM端到端失真估计形成了递归过程。
步骤2):根据当前宏块模式的编码,计算编码模式的比特数,包括模式信息,运动信息,残差数据等必需的比特数;
步骤3):计算拉格朗日因子,通过主观容错率失真优化模型,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式。所采用的主观容错率失真优化模型如下,
J=DSSIMSSIMR
其中DSSIM是解码端重构值的SSIM主观端到端失真,λSSIM为基于主观SSIM失真评价的拉格朗日因子,R为编码产生的比特数,J为主观率失真代价。
在信道传输丢包环境下,通过条带编码这一层次得到相应的拉格朗日因子λSSIM
λ SSIM = - ∂ D SSIM ∂ R ,
由于DSSIM可以通过估计得到,而丢包率理论上和信道的误比特率BER之间存在近似的关系
ρ=1一(1-BER)R
这样DSSIM表达式中与R有关的项为ρ和
Figure BDA0000153963600000092
则对上式求偏导为, λ SSIM = - ∂ D SSIM ∂ R
= - ∂ ( 1 - ( 1 - ρ ) SSIM ( f n , m , f ^ n , m ) - ρ · SSIM ( f n , m , f ~ n , m ) ) ∂ R
= ( 1 - ρ ) λ ^ + ∂ ( 1 - ρ ) ∂ R SSIM ( f n , m , f ^ n , m ) + ∂ ρ ∂ R SSIM ( f n , m , f ~ n , m )
= ( 1 - BER ) R λ ^ + ( SSIM ( f n , m , f ~ n , m ) - SSIM ( f n , m , f ^ n , m ) ) ∂ ( 1 - ( 1 - BER ) R ) ∂ R
= ( 1 - BER ) R λ ^ - ( 1 - BER ) R ( SSIM ( f n , m , f ~ n , m ) - SSIM ( f n , m , f ^ n , m ) ) ln ( 1 - BER )
= ( 1 - BER ) R ( λ ^ - ( SSIM ( f n , m , f ~ n , m ) - SSIM ( f n , m , f ^ n , m ) ) ln ( 1 - BER ) )
= ( 1 - BER ) R ( λ ^ + λ ′ )
其中R为编码一个视频数据包的比特数,即码率,
Figure BDA00001539636000000910
为解码端不丢包时的SSIM失真对码率进行求导的偏导值,即为
λ ^ = ∂ ( SSIM ( f , f ^ ) ) ∂ R
其中
Figure BDA00001539636000000912
表示一个视频数据包解码后不丢包时的SSIM,
Figure BDA00001539636000000913
可以在编码端通过斜率近似法进行估计得到,而λ′表达式为
λ ′ = - ( SSIM ( f n , m , f ~ n , m ) - SSIM ( f n , m , f ^ n , m ) ) ln ( 1 - BER ) .
这里λSSIM是通过条带层次编码得到的。由于λSSIM不仅和当前编码得到的码率和失真有关系,而且和信道的传输条件(误比特率)也有一定的关系,因此兼顾了信道传输丢包的影响,是一种容错率失真的编码方式,特别是考虑了丢包造成的主观质量的影响也通过SSIM端到端失真进行了体现,因此这是一种考虑主观容错率失真优化的联合信源信道编码方式。
当以宏块或者块为单元进行编码时,我们依然可以采用相同的拉格朗日因子,因此通过前边得到DSSIMSSIMR,得到当前编码模式的主观率失真代价,返回步骤1)继续执行,直到遍历完所有编码模式,然后找出一种主观率失真代价最小的模式进行码流的写入。
图3是基于主观SSIM失真评价的容错率失真优化编码装置示意图。所述装置包括:失真估计模块300,用于在编码端进行基于SSIM评价的端到端主观失真估计,所述端到端指编码端到解码端;比特数计算模块302,用于根据帧内或帧间编码模式,计算编码该模式需要的比特数;最优编码模式确定模块304,用于通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,找到最优的编码模式;编码模块306,用于采用最优的编码模式进行容错率失真优化的联合信源信道编码。
所述端到端指编码端到解码端具体指编码端到视频传输后的解码端,或者编码端到视频传输接收后的解码端。
优选地,所述最优编码模式确定模块304,用于通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元、器件可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于结构相似性SSIM主观评价的容错率失真视频编码方法,其特征在于,所述方法包括:
在编码端进行基于SSIM评价的端到端主观失真估计,所述端到端是指编码端到视频传输接收以后的解码端;
根据帧内或帧间编码模式,计算该编码模式需要的比特数;
通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,找到最优的编码模式;
采用所述最优的编码模式进行容错率失真优化的联合信源信道编码。
2.根据权利要求1所述的容错率失真视频编码方法,其特征在于所述找到最优的编码模式,具体为:在易出错网络传输的情况下找到最优的编码模式。
3.根据权利要求1所述的容错率失真视频编码方法,其特征在于所述的主观端到端失真采用SSIM评价,其表现为原始图像和重构图像期望值之间的结构相似性度量,所述端到端的失真表示为:
D n , m SSIM ~ = 1 - ( 1 - ρ ) SSIM ( f n , m , f ^ n , m ) - ρ · SSIM ( f n , m , f ~ n , m )
其中n为帧号,m为宏块号,fn,m为第n帧原始图像第m个宏块,
Figure FDA0000153963590000013
为不丢包时解码端重构第n帧的第m个宏块,
Figure FDA0000153963590000014
为丢包时解码端第n帧第m个宏块,ρ为丢包率,通过信道反馈SNR进行估计得到。
4.根据权利要求3所述的容错率失真视频编码方法,其特征在于,所述中的像素按如下方式得到:
对于帧内编码块不丢包时,帧内编码块的像素值
Figure FDA0000153963590000017
可以正常解码得到,当发生丢包时,帧内编码块的像素值
Figure FDA0000153963590000018
通过时域拷贝错误隐藏方式得到,也就是
Figure FDA0000153963590000019
对于帧间编码块的解码端重构像素,当不发生丢包时,帧间编码块像素值可以正常解码得到,即
Figure FDA0000153963590000021
当发生丢包时,帧间编码块的像素值可以通过时域拷贝错误隐藏方式得到,即
Figure FDA0000153963590000022
其中E[·]表示期望,
Figure FDA0000153963590000023
表示不丢包时解码端第n帧原始图像第m个宏块的第i个像素的重构值,表示丢包时解码端第n帧原始图像第m个宏块的第i个像素的重构值,
Figure FDA0000153963590000025
表示解码端第n-1帧原始图像第m个宏块的第i个像素的重构值的期望值,
Figure FDA0000153963590000026
表示解码端第n帧原始图像第m个宏块的第i个像素的在第n-1帧中参考的某个宏块m′中的某个像素的期望值,表示第n帧原始图像第m个宏块对应第i个像素的相应的预测残差,为编码时第n帧原始图像第m个宏块的第i个像素的在第n-1帧中参考的某个宏块m′中的某个像素值;
对于帧内编码块的
Figure FDA0000153963590000029
E [ f ~ ~ n - 1 , m i ] = ( 1 - ρ ) f ^ n - 1 , m i + ρE [ f ~ ~ n - 2 , m i ] ;
对于帧间编码块的
Figure FDA00001539635900000211
E [ f ~ ~ n - 1 , m i ] = ( 1 - ρ ) ( e ^ n - 1 , m i + E [ f ~ ~ n - 2 , m ′ ′ i ] ) + ρE [ f ~ ~ n - 2 , m i ] ,
其中
Figure FDA00001539635900000213
表示不丢包时解码端第n-1帧原始图像第m个宏块的第i个像素的重构值,
Figure FDA00001539635900000214
表示解码端第n-2帧原始图像第m个宏块的第i个像素的重构值的期望值,
Figure FDA00001539635900000215
表示解码端第n-1帧原始图像第m个宏块的第i个像素的在第n-2帧中参考的某个宏块m″中的某个像素的期望值,
Figure FDA00001539635900000216
表示第n-1帧原始图像第m个宏块第i个像素相应的预测残差,
Figure FDA00001539635900000217
为编码时第n-1帧原始图像第m个宏块的第i个像素的在第n-2帧中参考的某个宏块m″中的某个像素值;
对于
Figure FDA0000153963590000031
参照前面计算
Figure FDA0000153963590000032
的方式得到。
5.根据权利要求1所述的容错率失真视频编码方法,其特征在于所述的编码需要的比特数包括采用的编码模式产生的所有比特数目。
6.根据权利要求1所述的容错率失真视频编码方法,其特征在于所述的率失真优化模型为J=DSSIMSSIMR,其中DSSIM为解码端重构值的SSIM主观端到端失真,λSSIM为基于主观SS IM失真评价的拉格朗日因子,R为编码产生的比特数,J为率失真代价。
7.根据权利要求6所述的容错率失真视频编码方法,其特征在于所述的率失真优化模型中的拉格朗日因子λSSIM,通过公式
Figure FDA0000153963590000033
计算,其中BER为信道误比特率,R为编码一个视频数据包的比特数,即码率,
Figure FDA0000153963590000034
为解码端不丢包时的SSIM失真对码率进行求导的偏导值,即为
Figure FDA0000153963590000035
其中
Figure FDA0000153963590000036
表示一个视频数据包解码后不丢包时的SSIM,
Figure FDA0000153963590000037
可以在编码端通过斜率近似法进行估计得到,λ′表达式为 λ ′ = - ( SSIM ( f n , m , f ~ n , m ) - SSIM ( f n , m , f ^ n , m ) ) ln ( 1 - BER ) .
8.根据权利要求7所述的容错率失真视频编码方法,其特征在于,所述的率失真优化模型中的拉格朗日因子λSSIM,通过公式计算,具体为:所述的率失真优化模型中的拉格朗日因子λSSIM,在信道传输丢包环境下,通过公式
Figure FDA00001539635900000310
计算。
9.一种基于结构相似性SSIM主观评价的容错率失真视频编码装置,其特征在于,所述装置包括:
失真估计模块,用于在编码端进行基于SSIM评价的端到端主观失真估计,所述端到端是指编码端到视频传输接收以后的解码端;
比特数计算模块,用于根据帧内或帧间编码模式,计算编码该模式需要的比特数;
最优编码模式确定模块,用于通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,找到最优的编码模式;
编码模块,用于采用最优的编码模式进行容错率失真优化的联合信源信道编码。
10.如权利要求9的编码装置,其特征在于,所述最优编码模式确定模块,用于通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,找到最优的编码模式具体为:最优编码模式确定模块,用于通过计算容错拉格朗日因子,进行视频容错编码的率失真优化,在易出错网络传输的情况下找到最优的编码模式。
CN201210113131.1A 2012-04-17 2012-04-17 基于ssim评价的容错率失真优化视频编码方法 Expired - Fee Related CN102647591B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210113131.1A CN102647591B (zh) 2012-04-17 2012-04-17 基于ssim评价的容错率失真优化视频编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210113131.1A CN102647591B (zh) 2012-04-17 2012-04-17 基于ssim评价的容错率失真优化视频编码方法

Publications (2)

Publication Number Publication Date
CN102647591A true CN102647591A (zh) 2012-08-22
CN102647591B CN102647591B (zh) 2014-07-02

Family

ID=46660138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210113131.1A Expired - Fee Related CN102647591B (zh) 2012-04-17 2012-04-17 基于ssim评价的容错率失真优化视频编码方法

Country Status (1)

Country Link
CN (1) CN102647591B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103607590A (zh) * 2013-11-28 2014-02-26 北京邮电大学 基于结构相似度的高效视频编码感知率失真优化方法
CN103686444A (zh) * 2012-09-20 2014-03-26 中国科学院声学研究所 一种MIMO OFDM系统中具有端到端QoS保证的视频传输方案
CN105917651A (zh) * 2014-05-30 2016-08-31 富士通株式会社 图像编码方法、装置以及图像处理设备
CN107888905A (zh) * 2017-10-27 2018-04-06 中国矿业大学 一种基于GoP显著性加权的视频质量评价方法
CN109714557A (zh) * 2017-10-25 2019-05-03 中国移动通信集团公司 视频通话的质量评估方法、装置、电子设备和存储介质
WO2019114024A1 (zh) * 2017-12-13 2019-06-20 北京大学 一种基于拉格朗日乘子模型的点云帧内编码优化方法及装置
CN110493603A (zh) * 2019-07-25 2019-11-22 南京航空航天大学 一种基于联合信源信道的率失真优化的多视点视频传输差错控制方法
CN113099227A (zh) * 2021-03-12 2021-07-09 西安交通大学 一种联合优化码率分配和率失真性能的视频编码方法
CN115134583A (zh) * 2021-03-29 2022-09-30 中国移动通信集团山东有限公司 视频会议质量评价方法及系统
CN115134583B (zh) * 2021-03-29 2024-06-07 中国移动通信集团山东有限公司 视频会议质量评价方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101547349A (zh) * 2009-04-27 2009-09-30 宁波大学 一种对视频信号的二次avs编码码率控制的方法
CN101778281A (zh) * 2010-01-13 2010-07-14 中国移动通信集团广东有限公司中山分公司 一种基于结构相似度的h.264快速运动估算方法
WO2011133505A1 (en) * 2010-04-19 2011-10-27 Dolby Laboratories Licensing Corporation Quality assessment of high dynamic range, visual dynamic range and wide color gamut image and video
CN102300094A (zh) * 2011-09-06 2011-12-28 中国科学院计算技术研究所 一种视频编码方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101547349A (zh) * 2009-04-27 2009-09-30 宁波大学 一种对视频信号的二次avs编码码率控制的方法
CN101778281A (zh) * 2010-01-13 2010-07-14 中国移动通信集团广东有限公司中山分公司 一种基于结构相似度的h.264快速运动估算方法
WO2011133505A1 (en) * 2010-04-19 2011-10-27 Dolby Laboratories Licensing Corporation Quality assessment of high dynamic range, visual dynamic range and wide color gamut image and video
CN102300094A (zh) * 2011-09-06 2011-12-28 中国科学院计算技术研究所 一种视频编码方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103686444A (zh) * 2012-09-20 2014-03-26 中国科学院声学研究所 一种MIMO OFDM系统中具有端到端QoS保证的视频传输方案
CN103686444B (zh) * 2012-09-20 2016-09-28 中国科学院声学研究所 一种MIMO OFDM系统中具有端到端QoS保证的视频传输方案
CN103607590A (zh) * 2013-11-28 2014-02-26 北京邮电大学 基于结构相似度的高效视频编码感知率失真优化方法
CN103607590B (zh) * 2013-11-28 2017-04-05 北京邮电大学 基于结构相似度的高效视频编码感知率失真优化方法
CN105917651A (zh) * 2014-05-30 2016-08-31 富士通株式会社 图像编码方法、装置以及图像处理设备
CN109714557A (zh) * 2017-10-25 2019-05-03 中国移动通信集团公司 视频通话的质量评估方法、装置、电子设备和存储介质
CN107888905A (zh) * 2017-10-27 2018-04-06 中国矿业大学 一种基于GoP显著性加权的视频质量评价方法
CN107888905B (zh) * 2017-10-27 2019-09-06 中国矿业大学 一种基于GoP显著性加权的视频质量评价方法
WO2019114024A1 (zh) * 2017-12-13 2019-06-20 北京大学 一种基于拉格朗日乘子模型的点云帧内编码优化方法及装置
CN110493603A (zh) * 2019-07-25 2019-11-22 南京航空航天大学 一种基于联合信源信道的率失真优化的多视点视频传输差错控制方法
CN113099227A (zh) * 2021-03-12 2021-07-09 西安交通大学 一种联合优化码率分配和率失真性能的视频编码方法
CN113099227B (zh) * 2021-03-12 2022-08-16 西安交通大学 一种联合优化码率分配和率失真性能的视频编码方法
CN115134583A (zh) * 2021-03-29 2022-09-30 中国移动通信集团山东有限公司 视频会议质量评价方法及系统
CN115134583B (zh) * 2021-03-29 2024-06-07 中国移动通信集团山东有限公司 视频会议质量评价方法及系统

Also Published As

Publication number Publication date
CN102647591B (zh) 2014-07-02

Similar Documents

Publication Publication Date Title
CN102647591B (zh) 基于ssim评价的容错率失真优化视频编码方法
CN102137263B (zh) 基于cnm关键帧分类的分布式视频编码及解码方法
CN103873861B (zh) 一种用于hevc的编码模式选择方法
CN102036061B (zh) 视频数据传输处理、发送处理方法、装置和网络系统
CN101641961B (zh) 使用运动补偿滤波的图像编码和解码方法及设备
CN103262543B (zh) 用于视频解码的数据丢失隐蔽
CN103988500A (zh) 视频质量测量
CN102256133B (zh) 一种基于边信息精化的分布式视频编码及解码方法
CN100591136C (zh) 一种基于空域分解的视频帧内编码方法
CN101163250B (zh) 一种基于边界梯度的视频流容错方法
CN107580217A (zh) 编码方法及其装置
CN103139571A (zh) 基于fec与wz编解码相结合的视频容错抗误码方法
CN102026001B (zh) 基于运动信息的视频帧重要性评估方法
CN104349167A (zh) 一种视频编码率失真优化的调整方法
CN103596003B (zh) 高性能视频编码的帧间预测快速模式选择方法
CN102158702B (zh) 自适应h.264码率控制方法
CN103475884A (zh) 面向hbp编码格式的立体视频b帧整帧丢失错误隐藏方法
CN103634600B (zh) 一种基于ssim评价的视频编码模式选择方法、系统
KR20090000502A (ko) 손실된 블록의 주변 블록 특성에 적응적인 에러 은닉 방법및 장치
CN105979269A (zh) 基于新型嵌入代价的运动向量域视频隐写方法
CN102946533B (zh) 视频编码
CN103391439A (zh) 一种基于主动宏块隐藏的h.264/avc码率控制方法
CN101557519B (zh) 一种多视点视频编码方法
CN104104966A (zh) 视频块的划分方法和装置
CN101888552B (zh) 一种基于局部补偿的跳帧编解码方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140702

Termination date: 20170417