发明内容
本发明的目的是针对现有的面向3D视频编码的深度重采样方法的不足,提出了一种基于深度增强的重采样方法。
本发明方法对彩色视频按原始分辨率进行编码,对深度视频进行降分辨率编码。为了保留原始深度图的深度特征,采用基于频率选择的滤波方法对深度视频下采样。深度下采样方法是先把采样窗口内的像素以平均值为阈值,分为两个像素集合,选取大于窗口内一半总像素数目的集合为采样集合,并选择该集合内出现次数最多的与中心像素最相似的深度值为下采样深度值。
为了在深度上采样过程中保护原始分辨率的深度图的边缘,得到连续的边缘,对于深度视频上采样,首先通过邻域预插值生成初始的原始分辨率的深度图。然后检测彩色图的边缘图,在它的引导下得到其对应深度图的可信边缘。接着构造实现深度增强的空时能量约束函数。对于该函数中的空域能量函数,根据深度图像素与可信边缘像素的相对位置,定义不同的由彩色相似性和空间相似性度量的平滑函数。对于时域能量函数,它由相邻两帧的彩色图相似性以及由深度可信边缘引导的深度图相似性来度量。最后,采用常规的置信传播算法对整个空时能量函数作最小化求解得到增强后的上采样深度图。该深度图与解码后的彩色图用典型的基于深度图渲染算法进行视点合成,得到所需的多视点视频。
本发明包括编码方法和解码方法。
编码方法的具体步骤是:
步骤(1)、将彩色视频以原始分辨率进行编码,按编码配置文件的参考顺序输入编码器;
步骤(2)、将深度视频采用基于频率选择的滤波方法进行下采样,然后送入3D视频编码器;
步骤(3)、将彩色视频编码的比特流和深度视频编码的比特流按参考编码顺序合并后输出;
解码方法的具体步骤是:
步骤(Ⅰ)、将视频编码的比特流进行解码,按参考编码顺序输出为彩色视频和深度视频;
步骤(Ⅱ)、将解码的深度视频,采用基于深度图可信边缘引导的深度增强方法进行上采样,得到与原始视频相同尺寸的解码视频;
步骤(Ⅲ)、采用典型的基于深度图渲染算法将解码后的彩色视频和上采样深度视频进行视点合成,得到所需的多视点视频。
本发明有益效果如下:
(1)本发明可使用多级采样的方式实现不同缩放系数的深度重采样,即每一级采样可以实现缩放系数为2的深度重采样,因此多级采样就可以适用于不同缩放系数的深度重采样;(2)本发明提出的面向3D视频编码的深度下采样方法是选择采样窗口内与中心像素深度值最相似的出现频率最高的深度值作为下采样深度值,因此能够很好的保留原始深度图中的深度值;(3)本发明提出的面向3D视频编码的深度上采样方法,采用基于深度图可信边缘引导的深度增强方法。首先将深度图预插值,得到原始分辨率的深度图。然后将彩色图的边缘映射到其对应的预插值深度图中,得到深度图的可信边缘。接着结合彩色图和深度图空域和时域约束关系来构造实现深度增强的能量函数,根据预插值深度图的像素与深度图可信边缘的相对位置,定义了该能量函数的空域能量函数和时域能量函数。最后,采用置信传播算法对该空时能量函数作最小化求解,得到上采样的深度图。由于充分考虑了空域和时域中彩色图和深度图的相互对应和约束关系,本发明提出的上采样方法能够很好地恢复和保护深度图的边缘特征,从而提高合成视点的质量。
具体实施步骤参照附图(1)~(4)。
3D视频的具体编码方法如图1所示:
步骤(1)、将彩色视频以原始分辨率进行编码,按编码配置文件的参考顺序输入3D-HEVC编码器。
步骤(2)、将深度视频采用基于频率选择的滤波方法进行下采样,然后送入3D-HEVC编码器。其步骤为:
a.求采样窗口w×w内像素深度的平均值:
其中,w=3,Dn(i,j)是采样窗口内的像素。
b.利用平均值Dm将Dn(i,j)划分为两个像素集合Gh,Gl:
c.下采样点像素的深度值Dd(i,j)取值为:
其中,和分别表示像素集合Gh,Gl内的下采样深度值,L=w×w表示窗口内所有像素的数目,L(Gh)表示集合Gh中的像素数目。由于从Gh中求解与从Gl中求解的步骤是一样的,这里我们统一称为从G中求解RG,其步骤如下:
1)遍历集合G内的每个像素Gp,统计G内每个深度值k出现的次数Nk:
2)把所有的Nk从大到小的顺序排列:
N1>N2>…Nk(4)
3)记N1和N2对应的深度值为D1和D2,求D1和D2与采样窗口内的中心像素深度值Dp的绝对差值:
U1=|D1-Dp|(5)
U2=|D2-Dp|(6)
4)最后,下采样深度值RG的值为:
步骤(3)、将彩色视频编码的比特流和深度视频编码的比特流按参考编码顺序合并后输出。
3D视频的具体解码方法如图1所示:
步骤(Ⅰ)、对视频编码的比特流进行解码,按参考编码顺序输出为彩色视频和深度视频;
步骤(Ⅱ)、将解码的深度视频采用基于深度图可信边缘引导的深度增强方法进行上采样,得到与原始视频相同尺寸的解码视频。其具体步骤为:
①将解码的深度视频预插值,得到原始分辨率的上采样深度图,如图2所示。根据缩放系数为2,图2中的黑色圆圈代表水平方向和垂直方向的待插值像素,它们的深度值由其相邻的两个低分辨率像素的深度值的平均值来确定。图2中三角形代表对角线方向的待插值像素,它们的深度值由其相邻的八邻域像素深度值的中值来确定。最后得到了原始分辨率的预插值上采样深度图Du。
②确定深度图的可信边缘如图3所示,其生成的方法为:首先使用Canny算子检测深度图所对应的彩色图,设定其分割阈值区间为[40,130],得到彩色图的边缘Bc,将Bc中的边缘像素p∈Bc投影到深度图得到对应的边缘像素p∈Bd,考查p与其八邻域像素q的深度值关系,由下式确定深度图的可信边缘:
其中,tr为指定阈值,优选tr=4。
③构造基于深度图可信边缘引导的深度增强的能量函数:
其中,α为比例系数,优选α=0.2,Espatial(D)是空域能量函数,定义为:
其中,是像素点p通过步骤①得到的预插值深度图的像素深度值,Ω表示原始分辨率图像网格的像素集合,邻域平滑函数Esmooth(Dp,Dq)分为3种情况,如图4所示:
1)当p属于深度图的可信边缘时,采用其八邻域像素N8(p)的平滑函数:
其中,和分别是像素p和q的彩色分量,Dp和Dq分别是像素p和q的深度值。
2)当p的任意八邻域像素N8(p)位于深度图的可信边缘时,采用其八邻域像素q中的最小平滑函数:
3)当p属于其余像素集合Θ时,采用其四邻域像素N4(p)的平滑函数:
设置式(12)~(14)中的σsc和σsp为平滑参数,优选值为:σsc=0.04和σsp=1。此外,时域能量函数Etemporal(D)定义为:
其中,是帧ft中的像素pt的深度值,是帧ft-1中对应位置像素pt-1的深度值,时域权重系数定义如图5所示,其计算式为:
ωt(pt,pt-1)=ωtc(pt,pt-1)ωtd(pt,pt-1),(15)
其中,时域彩色相似系数计算为:
式中,是帧ft中的像素pt的彩色分量,是帧ft-1中对应位置像素pt-1的彩色分量,σtc为平滑参数,优选为σtc=0.04。
时域深度相似系数计算为:
式中,帧ft的深度可信边缘和帧ft-1的深度可信边缘进行异或运算后,再作取反运算。
④采用典型的置信传播算法对步骤③得到的式(9)进行最小化求解,得到最终的上采样深度图D。
步骤(Ⅲ)、采用典型的基于深度图渲染算法将解码后的彩色视频和上采样的深度视频进行视点合成,得到所需的多视点视频。