CN102595166A - 一种适用于深度图编码的拉格朗日因子计算方法 - Google Patents
一种适用于深度图编码的拉格朗日因子计算方法 Download PDFInfo
- Publication number
- CN102595166A CN102595166A CN2012100556808A CN201210055680A CN102595166A CN 102595166 A CN102595166 A CN 102595166A CN 2012100556808 A CN2012100556808 A CN 2012100556808A CN 201210055680 A CN201210055680 A CN 201210055680A CN 102595166 A CN102595166 A CN 102595166A
- Authority
- CN
- China
- Prior art keywords
- sigma
- depth map
- ssd
- pixel
- video image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种适用于深度图编码的拉格朗日因子计算方法,该方法首先是确定虚拟视图失真与深度图编码误差之间的关系,依据摄像机参数计算深度图的编码误差对虚拟视图失真的影响程度,进而采用深度图对应的纹理视频估算模型参数,最后计算拉格朗日因子。本发明依据深度图的压缩失真对合成虚拟视图质量的影响,更好的反映深度图的压缩失真对合成虚拟视图质量的影响,提高三维立体视频编码的效率,可应用于三位立体视频的编码标准中。
Description
技术领域
本发明涉及到三维视频编码标准中的深度图编码技术,具体是一种深度图编码器率失真优化过程中计算拉格朗日因子的方法,属于深度图编码技术领域。
背景技术
三维视频作为未来主要的视频应用技术,是指用户通过三维视频显示设备可以享受到真实的三维视频内容。三维视频的相关技术,比如,三维视频采集、三维视频编码、三维视频的显示等技术已经得到广泛的关注。为了推动三维视频技术的标准化,2002年,运动图像专家组(Motion Picture Experts Group,MPEG)提出任意视点电视(Free View Television,FTV)的概念。它能够提供生动真实的、交互式的三维视听系统。用户可以从不同的角度观看该角度的三维视频,使得用户有融入视频场景中的真实感受。FTV可广泛应用于广播通信、娱乐、教育、医疗和视频监控等领域。为了使用户可以观看到任意角度的三维视频,FTV系统服务端使用已标定好的摄像机阵列获得一定视点上的视频。并对不同视点上的视频校正,利用校正过的视频信息通过虚拟视图合成技术生成虚拟视点的虚拟视图。目前MPEG建议具体使用基于深度-图像(Depth-Image Based Rendering,DIBR)的虚拟视图合成技术。深度信息一般通过深度图表示。
虚拟视图合成的主要过程如下:
1).确定要虚拟视点在摄像机阵列中的相对位置。
2).确定用于合成虚拟视点的纹理视频
3).确定步骤2)的纹理视频对应的深度图
4).依据步骤2)与3)中的纹理视频和深度图,采用DIBR技术,合成虚拟视图。
FTV的标准化工作分为两个阶段进行。第一阶段是2006年至2008年由JVT(Joint VideoTeam),联合视频编码组制定的H.264/AVC的扩展方案-MVC(Multi-View Video Coding)。MVC可以对多视点纹理视频进行编码。但是要最终实现FTV系统的功能,还必须要对深度信息进行编码。目前FTV的标准化制定工作已经进入第二阶段,即3DVC(Three Dimensional VideoCoding)。3DVC主要关注深度信息的表示与编码,以及纹理视频与深度信息的联合编码。3DVC中,深度信息通过深度图表示。
衡量3DVC性能的主要指标是合成虚拟视图的质量,以及纹理视频、深度图的编码码率。虚拟视图的质量:
通常采用峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)来衡量视频的质量。PSNR的计算公式如下式所示,
其中MSE表示原始视图与合成虚拟视图之间的均方误差,用来衡量虚拟视图的失真,以及纹理视频的编码失真、深度图的编码失真。
在实际应用中,虚拟视点的视图是不存在的,也即不存在原始视图。但是由于3DVC主要关注编码性能,因此为衡量3DVC的性能,首先采用未经编码的已有纹理视频及其对应的深度图合成虚拟视图Vorig,然后采用经过编码后的重建的纹理视频以及编码后重建的深度图合成虚拟视图Vrec,最后通过计算Vrec与Vorig之间的的MSE,进而得到PSNR,以衡量3DVC的性能。
在H.264/AVC视频编码标准中,首先对当前编码块进行预测,然后计算当前编码块与预测块之间的平均平方误差MSE作为失真D;然后将当前编码块的像素灰度值减去预测块的像素灰度值,得到预测差值,对预测差值进行离散余弦变换、量化和熵编码,继而得到当前编码块的编码码率R;最后采用下式计算当前编码块的率失真代价J,
J=D+λmode·R,
其中λmode为拉格朗日因子。编码器在模式选择的过程中,λmode的计算方法如下,
其中,Dd为深度图的编码失真,Qd为深度图的量化步长,Rd为深度图的编码码率,QP为深度图的量化参数。
在运动估计过程中,采用平均绝对差作为失真准则,因此运动估计过程中的拉格朗日因子λmotion为:
H.264/AVC采用的拉格朗日因子计算方法没有考虑到深度图的压缩失真对合成虚拟视图的质量的影响,因此采用H.264/AVC的率失真判断准则对深度图进行编码的效率不高。在三维视频编码中,深度图的编码需要面向虚拟视图;因此深度图编码拉格朗日因子应综合考虑虚拟视图的失真,以及深度图的编码码率。
发明内容
针对H.264/AVC采用的拉格朗日因子计算方法没有考虑到深度图的压缩失真对合成虚拟视图质量影响的问题,本发明依据深度图的压缩失真对合成虚拟视图质量的影响,提出一种在相同深度图编码码率的条件下合成虚拟视图质量更高的适用于深度图编码的拉格朗日因子计算方法。
在虚拟视图合成过程中,深度图的编码误差|ed|会改变像素的投射位置,使像素的投射位置平移i个像素,
其中,f为摄像机焦距,L为当前视点与虚拟视点之间的距离,Znear和Zfar分别表示场景的最近最远物体的深度值,参数α表示深度图的编码失真对像素投射位置的变化的影响程度。
像素的投射位置平移i个像素所引起虚拟视图的失真可表示为,
其中,Dv表示虚拟视图的失真,T为深度图对应的纹理视频图像,Ti为将该纹理视频图像平移i个像素所得到的图像,SSDi表示T与Ti之间的平方差和(Sum of Squared Difference,SSD),j为纹理视频图像中的第j个像素,M为纹理视频图像中像素的数量,A0,A1,A2表示像素投射位置的变化对虚拟视图失真的影响程度。
进一步,由理论分析知,深度图编码中拉格朗日因子λd的计算方法为,
因此,深度图编码中拉格朗日因子λd的计算方法应为,
根据以上论述,本发明的适用于深度图编码的拉格朗日因子计算方法,是依据摄像机焦距f、当前视点与虚拟视点之间的距离L以及场景的最近最远物体的深度值Znear和Zfar计算参数α;确定深度图对应的纹理视频图像T,将该纹理视频图像依次平移1~N个像素,记为Ti,i∈[1,N];计算T与Ti之间的平方差和(Sum of Squared Difference,SSD),记为SSDi;依据SSDi与深度图编码误差|ed|使像素的投射位置平移的像素个数i之间的关系,估计出参数A1和A2;进而计算深度图编码中拉格朗日因子λd;具体步骤如下:
(1)建立虚拟视图失真Dv与深度图编码误差之间的关系为,
其中,Dv表示虚拟视图的失真,T为深度图对应的纹理视频图像,Ti为将该纹理视频图像平移i个像素所得到的图像,SSDi表示T与Ti之间的平方差和,j为纹理视频图像中的第j个像素,M为纹理视频图像中像素的数量,|ed|为深度图的编码误差,Dd为深度图的编码失真,A0,A1,A2表示像素投射位置的变化对虚拟视图失真的影响程度,参数α表示深度图的编码失真对像素投射位置的变化的影响程度;
(2)依据摄像机焦距f、当前视点与虚拟视点之间的距离L、场景的最近物体的深度值Znear以及最远物体的深度值Zfar计算参数α,
(3)确定深度图对应的纹理视频图像T,将该纹理视频图像依次平移i个像素,记为Ti,i的取值范围是[3,N],其中,N须小于该纹理视频图像的宽度;
(4)计算T与Ti之间的平方差和,即SSDi,
其中,j为纹理视频图像中的第j个像素,M为纹理视频图像中像素的数量;
(5)依据SSDi与i之间的关系,
通过求解三元一次方程组:
计算参数A0、A1和A2;
(6)计算深度图编码中拉格朗日因子λd,
其中,λmode为H.264/AVC中模式判决过程中采用的拉格朗日因子,λmode的计算方法如下,
其中,Dd为深度图的编码失真,Qd为深度图的量化步长,Rd为深度图的编码码率,QP为深度图的量化参数。
本发明与现有技术相比具有以下优点:
(1)本发明依据深度图的压缩失真对合成虚拟视图质量的影响,在率失真优化过程中,确定了适用于深度图的拉格朗日因子计算方法,该方法提高了三维立体视频深度图的编码效率,使得在相同深度图编码码率的条件下,合成虚拟视图质量更高;
(2)本发明依据深度图对应位置处的纹理视频图像计算拉格朗日因子,不需要进行预编码,可以实时的应用于3DV的编码器中。
附图说明
图1是本发明适用于深度图编码的拉格朗日因子计算流程图;
图2是分别采用本发明的方法与H.264/AVC的方法对三维视频序列Bookarrival的深度图进行编码后的率失真曲线比较图。
图3是分别采用本发明的方法与H.264/AVC的方法对三维视频序列Kendo的深度图进行编码后的率失真曲线比较图。
具体实施方式
如图1所示,本发明的适用于深度图编码的拉格朗日因子计算方法,具体包括以下步骤:
(1)建立虚拟视图失真Dv与深度图编码误差之间的数学模型关系,
其中,Dv表示虚拟视图的失真,T为深度图对应的纹理视频图像,Ti为将该纹理视频图像平移i个像素所得到的图像,SSDi表示T与Ti之间的平方差和(Sum of Squared Difference,SSD),j为纹理视频图像中的第j个像素,M为纹理视频图像中像素的数量,|ed|为深度图的编码误差,Dd为深度图的编码失真,A0,A1,A2表示像素投射位置的变化对虚拟视图失真的影响程度,参数α表示深度图的编码失真对像素投射位置的变化的影响程度,
(2)依据摄像机焦距f、当前视点与虚拟视点之间的距离L、场景的最近物体的深度值Znear以及最远物体的深度值Zfar计算参数α,
(3)确定深度图对应的纹理视频图像T,将该纹理视频图像依次平移i个像素,记为Ti,i的取值范围是[3,N],其中,N须小于该纹理视频图像的宽度;
(4)计算T与Ti之间的平方差和,即SSDi,
其中,j为纹理视频图像中的第j个像素,M为纹理视频图像中像素的数量;
(5)依据SSDi与i之间的关系,
通过求解三元一次方程组,
计算参数A0,A1和A2;
H.264/AVC中模式判决过程中采用的拉格朗日因子,λmode的计算方法如下,
其中,Dd为深度图的编码失真,Qd为深度图的量化步长,Rd为深度图的编码码率,QP为深度图的量化参数。
本发明的效果可以通过实验进一步说明。
实验测试了在不同的量化参数的条件下,采用本发明对深度图进行编码后的编码码率和合成虚拟视图的客观质量PSNR。图2和图3比较了采用本发明和H.264/AVC的方法对深度图编码后的率失真曲线,其中图2是对三维视频序列Bookarrival的深度图进行编码的实验结果,图3是对三维视频序列Kendo的深度图进行编码的实验结果。由图2和图3可见,与H.264/AVC相比,采用本发明进行编码后,在深度图的编码码率相同的条件下,合成的虚拟视图的客观质量更高,说明本发明提高了深度图的编码效率。
Claims (1)
1.一种适用于深度图编码的拉格朗日因子计算方法,其特征是:依据摄像机焦距f、当前视点与虚拟视点之间的距离L以及场景的最近最远物体的深度值Znear和Zfar计算参数α;确定深度图对应的纹理视频图像T,将该纹理视频图像依次平移1~N个像素,记为Ti,i∈[1,N];计算T与Ti之间的平方差和,记为SSDi;依据SSDi与深度图编码误差|ed|使像素的投射位置平移的像素个数i之间的关系,估计出参数A1和A2;进而计算深度图编码中拉格朗日因子λd;具体步骤如下:
(1)建立虚拟视图失真Dv与深度图编码误差之间的关系为,
其中,Dv表示虚拟视图的失真,T为深度图对应的纹理视频图像,Ti为将该纹理视频图像平移i个像素所得到的图像,SSDi表示T与Ti之间的平方差和,j为纹理视频图像中的第j个像素,M为纹理视频图像中像素的数量,|ed|为深度图的编码误差,Dd为深度图的编码失真,A0,A1,A2表示像素投射位置的变化对虚拟视图失真的影响程度,参数α表示深度图的编码失真对像素投射位置的变化的影响程度;
(2)依据摄像机焦距f、当前视点与虚拟视点之间的距离L、场景的最近物体的深度值Znear以及最远物体的深度值Zfar计算参数α,
(3)确定深度图对应的纹理视频图像T,将该纹理视频图像依次平移i个像素,记为Ti,i的取值范围是[3,N],其中,N须小于该纹理视频图像的宽度;
(4)计算T与Ti之间的平方差和,即SSDi,
其中,j为纹理视频图像中的第j个像素,M为纹理视频图像中像素的数量;
(5)依据SSDi与i之间的关系,
通过求解三元一次方程组:
计算参数A0、A1和A2;
其中,λmode为H.264/AVC中模式判决过程中采用的拉格朗日因子,λmode的计算方法如下,
其中,Dd为深度图的编码失真,Qd为深度图的量化步长,Rd为深度图的编码码率,QP为深度图的量化参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210055680.8A CN102595166B (zh) | 2012-03-05 | 2012-03-05 | 一种适用于深度图编码的拉格朗日因子计算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210055680.8A CN102595166B (zh) | 2012-03-05 | 2012-03-05 | 一种适用于深度图编码的拉格朗日因子计算方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102595166A true CN102595166A (zh) | 2012-07-18 |
CN102595166B CN102595166B (zh) | 2014-03-05 |
Family
ID=46483312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210055680.8A Expired - Fee Related CN102595166B (zh) | 2012-03-05 | 2012-03-05 | 一种适用于深度图编码的拉格朗日因子计算方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102595166B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103873867A (zh) * | 2014-03-31 | 2014-06-18 | 清华大学深圳研究生院 | 自由视点视频深度图失真预测方法和编码方法 |
CN104717515A (zh) * | 2015-03-24 | 2015-06-17 | 上海大学 | 基于3d-hevc的纹理视频和深度图码率分配方法 |
CN106162198A (zh) * | 2016-08-31 | 2016-11-23 | 重庆邮电大学 | 基于不规则匀质块分割的三维视频深度图编码及解码方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101860759A (zh) * | 2009-04-07 | 2010-10-13 | 华为技术有限公司 | 一种编码方法和编码装置 |
CN101888566A (zh) * | 2010-06-30 | 2010-11-17 | 清华大学 | 立体视频编码率失真性能估计方法 |
WO2010151279A1 (en) * | 2009-06-25 | 2010-12-29 | Thomson Licensing | Depth map coding |
CN102158710A (zh) * | 2011-05-27 | 2011-08-17 | 山东大学 | 一种面向虚拟视图质量的深度图编码率失真判断方法 |
CN102209243A (zh) * | 2011-05-27 | 2011-10-05 | 山东大学 | 基于线性模型的深度图帧内预测方法 |
-
2012
- 2012-03-05 CN CN201210055680.8A patent/CN102595166B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101860759A (zh) * | 2009-04-07 | 2010-10-13 | 华为技术有限公司 | 一种编码方法和编码装置 |
WO2010151279A1 (en) * | 2009-06-25 | 2010-12-29 | Thomson Licensing | Depth map coding |
CN101888566A (zh) * | 2010-06-30 | 2010-11-17 | 清华大学 | 立体视频编码率失真性能估计方法 |
CN102158710A (zh) * | 2011-05-27 | 2011-08-17 | 山东大学 | 一种面向虚拟视图质量的深度图编码率失真判断方法 |
CN102209243A (zh) * | 2011-05-27 | 2011-10-05 | 山东大学 | 基于线性模型的深度图帧内预测方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103873867A (zh) * | 2014-03-31 | 2014-06-18 | 清华大学深圳研究生院 | 自由视点视频深度图失真预测方法和编码方法 |
CN103873867B (zh) * | 2014-03-31 | 2017-01-25 | 清华大学深圳研究生院 | 自由视点视频深度图失真预测方法和编码方法 |
CN104717515A (zh) * | 2015-03-24 | 2015-06-17 | 上海大学 | 基于3d-hevc的纹理视频和深度图码率分配方法 |
CN106162198A (zh) * | 2016-08-31 | 2016-11-23 | 重庆邮电大学 | 基于不规则匀质块分割的三维视频深度图编码及解码方法 |
CN106162198B (zh) * | 2016-08-31 | 2019-02-15 | 重庆邮电大学 | 基于不规则匀质块分割的三维视频深度图编码及解码方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102595166B (zh) | 2014-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102209243B (zh) | 基于线性模型的深度图帧内预测方法 | |
CN101835056B (zh) | 基于模型的纹理视频与深度图的最优码率分配方法 | |
Kim et al. | Depth map distortion analysis for view rendering and depth coding | |
CN101917619B (zh) | 一种多视点视频编码快速运动估计方法 | |
CN102281446B (zh) | 一种分布式视频编码中基于视觉感知特性的量化方法 | |
WO2016119551A1 (zh) | 一种二维自由视点视频的深度图编码失真预测方法 | |
CN103037218B (zh) | 一种基于分形和h.264的多目立体视频压缩与解压缩方法 | |
CN101980538B (zh) | 一种基于分形的双目立体视频压缩编解码方法 | |
CN102291579B (zh) | 一种快速的多目立体视频分形压缩与解压缩方法 | |
CN103051894B (zh) | 一种基于分形和h.264的双目立体视频压缩与解压缩方法 | |
CN104469336B (zh) | 多视点深度视频信号的编码方法 | |
CN102438167B (zh) | 一种基于深度图像绘制的立体视频编码方法 | |
CN103546758A (zh) | 一种快速深度图序列帧间模式选择分形编码方法 | |
CN101990103A (zh) | 用于多视点视频编码的方法和装置 | |
CN102387368B (zh) | 一种多视点视频编码视点间预测快速选择方法 | |
CN102158710B (zh) | 一种面向虚拟视图质量的深度图编码率失真判断方法 | |
CN103634600B (zh) | 一种基于ssim评价的视频编码模式选择方法、系统 | |
CN102595166B (zh) | 一种适用于深度图编码的拉格朗日因子计算方法 | |
CN101883283B (zh) | 一种基于saqd域的立体视频码率控制方法 | |
CN106534855B (zh) | 一种面向satd的拉格朗日因子计算方法 | |
CN103188500B (zh) | 多视点视频信号的编码方法 | |
CN102316323A (zh) | 一种快速的双目立体视频分形压缩与解压缩方法 | |
CN103220532B (zh) | 立体视频的联合预测编码方法及系统 | |
CN102333230A (zh) | 一种提高三维视频系统中合成虚拟视图质量的方法 | |
CN103546747A (zh) | 一种基于彩色视频编码模式的深度图序列分形编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140305 Termination date: 20170305 |