CN103002306B

CN103002306B - 一种深度图像编码方法

Info

Publication number: CN103002306B
Application number: CN201210493120.0A
Authority: CN
Inventors: 邵枫; 蒋刚毅; 郁梅; 李福翠
Original assignee: Ningbo University
Current assignee: Sichuan Kaiyan Intellectual Property Service Co ltd; Zhejiang Qusu Technology Co ltd
Priority date: 2012-11-27
Filing date: 2012-11-27
Publication date: 2015-03-18
Anticipated expiration: 2032-11-27
Also published as: CN103002306A

Abstract

本发明公开了一种深度图像编码方法，其根据深度失真对虚拟视点图像绘制的影响，并结合人眼的视觉特性得到原始左视点深度图像的最大可容忍失真分布图像，然后通过基于深度图像绘制的方法，得到原始右视点深度图像的绘制图像，接着根据最大可容忍失真分布图像和设定的编码预测结构，对原始左视点深度图像进行编码，得到解码后的左视点深度图像，再根据设定的编码预测结构对原始右视点深度图像与其绘制图像的残差图像进行编码，得到解码后的残差图像，最后根据解码后的右视点深度图像的绘制图像和解码后的残差图像，得到解码后的右视点深度图像的重构图像，优点是本发明方法在保证虚拟视点图像绘制性能的基础上，大大提高了深度图像的编码效率。

Description

一种深度图像编码方法

技术领域

本发明涉及一种视频信号的编码压缩方法，尤其是涉及一种深度图像编码方法。

背景技术

进入本世纪以来，随着数字2D（二维）视频技术日趋成熟，以及计算机、通信及网络技术的快速发展，引发了人们对新一代视频系统的强烈需求。现行的二维视频系统在表现自然场景时，难以满足用户的立体感和视点交互等的需求。三维视频系统由于能够提供立体感、视点交互性的全新视觉体验而越来越受到人们的欢迎，因此在无线视频通信、影视娱乐、数字动漫、虚拟战场、旅游观光、远程教学等领域有着广泛的应用前景。与单通道视频相比，三维视频要处理至少翻一倍的数据量，因此在不影响三维视频主观质量的前提下，尽可能地降低三维视频的编码码率是一个亟需解决的问题。

然而，与彩色图像相比，深度图像的纹理简单，其包括较多的平坦区域，但由于深度图像获取算法的局限性，因此深度图像普遍存在时间连续性差、深度不连续等问题。目前已提出了一些针对深度图像的编码方法，然而这些编码方法考虑更多的是如何提升编码的性能，因此，如何更好地表征深度图像的局部分布特性（深度图像不同区域对绘制的影响是不一致的），如何更好地利用视点之间的冗余特性（相邻视点的深度图像存在视觉冗余信息），都是在对深度图像进行编码时需要解决的问题。

发明内容

本发明所要解决的技术问题是提供一种能够充分地消除深度图像的视觉冗余信息，并能够有效地提高虚拟视点图像质量和编码效率的深度图像编码方法。

本发明解决上述技术问题所采用的技术方案为：一种深度图像编码方法，其特征在于它具体包括以下步骤：

①将外部立体视频捕获工具捕获得到的未经处理的且颜色空间为YUV的彩色立体视频及其对应的深度立体视频定义为原始三维立体视频，该原始三维立体视频由原始左视点彩色图像、原始右视点彩色图像、原始左视点深度图像和原始右视点深度图像组成，将t时刻的原始左视点彩色图像记为将t时刻的原始右视点彩色图像记为将t时刻的原始左视点深度图像记为将t时刻的原始右视点深度图像记为其中，i＝1,2,3分别表示YUV颜色空间的三个分量，YUV颜色空间的第1个分量为亮度分量并记为Y、第2个分量为第一色度分量并记为U及第3个分量为第二色度分量并记为V，(x,y)表示彩色图像和深度图像中的像素点的坐标位置，1≤x≤W，1≤y≤H，W表示彩色图像和深度图像的宽度，H表示彩色图像和深度图像的高度，表示t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点的第i个分量的值，表示t时刻的原始右视点彩色图像中坐标位置为(x,y)的像素点的第i个分量的值，表示t时刻的原始左视点深度图像中坐标位置为(x,y)的像素点的深度值，表示t时刻的原始右视点深度图像中坐标位置为(x,y)的像素点的深度值；

②利用人类视觉对背景光照和纹理的视觉掩蔽效应，提取出t时刻的原始左视点彩色图像的最小可察觉变化步长图像，记为其中，表示中坐标位置为(x,y)的像素点的最小可察觉变化步长值；

③根据t时刻的原始左视点彩色图像的最小可察觉变化步长图像提取出t时刻的原始左视点深度图像的最大可容忍失真分布图像，记为其中，表示中坐标位置为(x,y)的像素点的最大可容忍失真值；

④采用基于深度图像绘制的方法，将t时刻的原始左视点深度图像从左视点投影到右视点，得到t时刻的原始右视点深度图像的绘制图像，记为其中，表示t时刻的原始右视点深度图像的绘制图像中坐标位置为(x,y)的像素点的深度值；

⑤计算t时刻的原始右视点深度图像与t时刻的原始右视点深度图像的绘制图像的残差图像，记为将中坐标位置为(x,y)的像素点的像素值记为

E_{t}^{R} (x, y) = D_{t}^{R} (x, y) - {\tilde{D}}_{t}^{R} (x, y);

⑥根据t时刻的原始左视点深度图像的最大可容忍失真分布图像并根据设定的编码预测结构对t时刻的原始左视点深度图像进行编码，再将编码后的t时刻的左视点深度图像经网络传输给解码端；在解码端对编码后的t时刻的左视点深度图像进行解码，获得解码后的t时刻的左视点深度图像，记为其中，表示解码后的t时刻的左视点深度图像中坐标位置为(x,y)的像素点的深度值；

⑦根据设定的编码预测结构对t时刻的原始右视点深度图像与t时刻的原始右视点深度图像的绘制图像的残差图像进行编码，再将编码后的t时刻的残差图像经网络传输给解码端；在解码端对编码后的t时刻的残差图像进行解码，获得解码后的t时刻的残差图像，记为其中，表示解码后的t时刻的残差图像中坐标位置为(x,y)的像素点的像素值；

⑧采用与步骤④相同的操作，将解码后的t时刻的左视点深度图像从左视点投影到右视点，得到解码后的t时刻的右视点深度图像的绘制图像，记为其中，表示解码后的t时刻的右视点深度图像的绘制图像中坐标位置为(x,y)的像素点的深度值；

⑨根据解码后的t时刻的右视点深度图像的绘制图像和解码后的t时刻的残差图像得到解码后的t时刻的右视点深度图像的重构图像，记为其中，表示解码后的t时刻的右视点深度图像的重构图像中坐标位置为(x,y)的像素点的深度值。

所述的步骤②的具体过程为：

②-1、计算t时刻的原始左视点彩色图像的背景光照的视觉掩蔽效应的可视化阈值集合，记为{T_l(x,y)}，其中，T_l(x,y)表示t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点的背景光照的视觉掩蔽效应的可视化阈值，表示t时刻的原始左视点彩色图像中以坐标位置为(x,y)的像素点为中心的N×N邻域窗口内的所有像素点的亮度平均值；

②-2、计算t时刻的原始左视点彩色图像的纹理的视觉掩蔽效应的可视化阈值集合，记为{T_t(x,y)}，T_t(x,y)=η×G(x,y)×W_e(x,y)，其中，T_t(x,y)表示t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点的纹理的视觉掩蔽效应的可视化阈值，η为大于0的控制因子，G(x,y)表示对t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点进行定向高通滤波得到的最大加权平均值，W_e(x,y)表示对t时刻的原始左视点彩色图像的边缘图像中坐标位置为(x,y)的像素点进行高斯低通滤波得到的边缘加权值；

②-3、对t时刻的原始左视点彩色图像的背景光照的视觉掩蔽效应的可视化阈值集合{T_l(x,y)}和纹理的视觉掩蔽效应的可视化阈值集合{T_t(x,y)}进行融合，得到t时刻的原始左视点彩色图像的最小可察觉变化步长图像，记为将中坐标位置为(x,y)的像素点的最小可察觉变化步长值记为

J_{t}^{L} (x, y) = T_{l} (x, y) + T_{t} (x, y) - C_{l, t} \times \min {T_{l} (x, y), T_{t} (x, y)},

其中，C_l，t表示控制背景光照和纹理的视觉掩蔽效应重叠影响的参数，0<C_l,t<1，min{}为取最小值函数。

所述的步骤②-1中取N的值为5；所述的步骤②-2中取η=0.05；所述的步骤②-3中取C_l，t=0.5。

所述的步骤③的具体过程为：

③-1、定义t时刻的原始左视点深度图像中当前正在处理的像素点为当前像素点；

③-2、将当前像素点的坐标位置记为(x₁,y₁)，将与当前像素点水平相邻的像素点的坐标位置记为(x₁+Δx,y₁)，计算当前像素点和与其水平相邻的像素点之间的颜色距离，记为Ψ(x₁+Δx,y₁)，

Ψ (x_{1} + Δx, y_{1}) = | I_{t, 1}^{L} (x_{1}, y_{1}) - I_{t, 1}^{L} (x_{1} + Δx, y_{1}) |,

计算当前像素点和与其水平相邻的像素点之间的深度距离，记为Φ(x₁+Δx,y₁)，

Φ (x_{1} + Δx, y_{1}) = | D_{t}^{L} (x_{1}, y_{1}) - D_{t}^{L} (x_{1} + Δx, y_{1}) |,

其中，x₁∈[1,W]，y₁∈[1,H]，Δx表示水平偏移量，-W'≤Δx<0或0<Δx≤W'，W'表示最大水平偏移量，“||”为取绝对值符号，表示t时刻原始左视点彩色图像中坐标位置为(x₁,y₁)的像素点的Y分量的值，表示t时刻原始左视点彩色图像中坐标位置为(x₁+Δx,y₁)的像素点的Y分量的值，表示t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值，表示t时刻的原始左视点深度图像中坐标位置为(x₁+Δx,y₁)的像素点的深度值；

③-3、从当前像素点的左方向水平偏移量集合{Δx_L|-W'≤Δx_L≤-1}中任取一个ΔxL，如果且Φ(x₁+Δx_L,y₁)≤T同时成立，则认为Δx_L为当前像素点的一个左方向可容忍失真值；采用相同的方法计算当前像素点的左方向水平偏移量集合中的所有左方向可容忍失真值，再从所有左方向可容忍失真值中找出绝对值最大的左方向可容忍失真值，将绝对值最大的左方向可容忍失真值作为当前像素点的左方向最大可容忍失真值，记为Δ_L(x₁,y₁)，其中，Ψ(x₁+Δx_L,y₁)表示当前像素点和坐标位置为(x₁+Δx_L,y₁)的像素点之间的颜色距离，表示中坐标位置为(x₁+Δx_L,y₁)的像素点的最小可察觉变化步长值，Φ(x₁+Δx_L,y₁)表示当前像素点和坐标位置为(x₁+Δx_L,y₁)的像素点之间的深度距离，T为深度敏感性阈值；

③-4、从当前像素点的右方向水平偏移量集合{Δx_R|1≤Δx_R≤W'}中任取一个Δx_R，如果且Φ(x₁+Δx_R,y₁)≤T同时成立，则认为Δx_R为当前像素点的一个右方向可容忍失真值；采用相同的方法计算当前像素点的右方向水平偏移量集合中的所有右方向可容忍失真值，再从所有右方向可容忍失真值中找出绝对值最大的右方向可容忍失真值，将绝对值最大的右方向可容忍失真值作为当前像素点的右方向最大可容忍失真值，记为Δ_R(x₁,y₁)，其中，Ψ(x₁+Δx_R,y₁)表示当前像素点和坐标位置为(x₁+Δx_R,y₁)的像素点之间的颜色距离，表示中坐标位置为(x₁+Δx_R,y₁)的像素点的最小可察觉变化步长值，Φ(x₁+Δx_R,y₁)表示当前像素点和坐标位置为(x₁+Δx_R,y₁)的像素点之间的深度距离；

③-5、找出当前像素点的左方向最大可容忍失真值Δ_L(x₁,y₁)和右方向最大可容忍失真值Δ_R(x₁,y₁)中绝对值最小的可容忍失真值，作为当前像素点的最大可容忍失真值，记为

S_{t}^{L} (x_{1}, y_{1}) = \min {| Δ_{L} (x_{1}, y_{1}) |, | Δ_{R} (x_{1}, y_{1}) |},

min{}为取最小值函数，“||”为取绝对值符号；

③-6、将t时刻的原始左视点深度图像中下一个待处理的像素点作为当前像素点，然后返回步骤③-2继续执行，直至t时刻的原始左视点深度图像中的所有像素点处理完毕，得到t时刻的原始左视点深度图像的最大可容忍失真分布图像，记为

所述的深度敏感性阈值T的值由t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值决定，如果则取T=21；如果

64 \leq D_{t}^{L} (x_{1}, y_{1}) < 128,

则取T=19；如果

128 \leq D_{t}^{L} (x_{1}, y_{1}) < 192,

则取T=18；如果

192 \leq D_{t}^{L} (x_{1}, y_{1}) < 255,

则取T=20。

所述的步骤④的具体过程为：

④-1、定义t时刻的原始左视点深度图像中当前正在处理的像素点为当前像素点；

④-2、将当前像素点的坐标位置记为(x₁,y₁)，将当前像素点的坐标位置(x₁,y₁)从二维图像平面投影到三维场景平面，得到当前像素点的坐标位置(x₁,y₁)的投影坐标位置，记为(u,v,w)，

{(u, v, w)}^{T} = R_{1} {A_{1}}^{- 1} {(x_{1}, y_{1}, 1)}^{T} Z_{t}^{L} (x_{1}, y_{1}) + T_{1},

其中，x₁∈[1,W]，y₁∈[1,H]，(u,v,w)^T为(u,v,w)的转置矩阵，R₁为左视点相机的旋转矩阵，A₁为左视点相机的内参矩阵，A₁ ^-1为A₁的逆矩阵，(x₁,y₁,1)^T为(x₁,y1_,1)的转置矩阵，表示t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的场景深度，

Z_{t}^{L} (x_{1}, y_{1}) {(\frac{1}{255} \times D_{t}^{L} (x_{1}, y_{1}) \times (\frac{1}{Z_{near}} - \frac{1}{Z_{far}}) + \frac{1}{Z_{far}})}^{- 1},

表示t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值，Z_near表示深度图像中最小的场景深度值，Z_far表示深度图像中最大的场景深度值，T₁为左视点相机的平移矩阵；

④-3、将当前像素点的坐标位置(x₁,y₁)的投影坐标位置(u,v,w)从三维场景平面投影到二维图像平面，得到当前像素点的坐标位置(x₁,y₁)的投影坐标位置(u,v,w)在t时刻的原始右视点深度图像中的坐标位置，记为(x₂,y₂)，x₂=x'/z，y₂=y′/z，(x',y',z)^T=A₂R₂ ^-1(u,v,w)^T-A₂R₂ ^-1T₂，其中，x₂∈[1,W]，y₂∈[1,H]，(x',y',z)^T为(x',y',z)的转置矩阵，A₂为右视点相机的内参矩阵，R₂为右视点相机的旋转矩阵，R₂ ^-1为R₂的逆矩阵，t₂为右视点相机的平移矩阵；

④-4、利用当前像素点的坐标位置(x₁,y₁)与t时刻的原始右视点深度图像中的坐标位置(x₂,y₂)的映射关系，将t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值映射到t时刻的原始右视点深度图像中，对应作为t时刻的原始右视点深度图像的绘制图像中坐标位置为(x₂,y₂)的像素点的深度值，将t时刻的原始右视点深度图像的绘制图像中坐标位置为(x₂,y₂)的像素点的深度值记为

{\tilde{D}}_{t}^{R} (x_{2}, y_{2}),

{\tilde{D}}_{t}^{R} (x_{2}, y_{2}) = D_{t}^{L} (x_{1,} y_{1});

④-5、将t时刻的原始左视点深度图像中下一个待处理的像素点作为当前像素点，然后返回步骤④-2继续执行，直至t时刻的原始左视点深度图像中的所有像素点处理完毕，得到t时刻的原始右视点深度图像的绘制图像，记为

所述的步骤⑥中对t时刻的原始左视点深度图像进行编码的具体过程为：

⑥-1、任取一个编码量化参数作为t时刻的原始左视点深度图像的基本编码量化参数，并记为QP1，其中，QP1的值为[22,50]区间内的一个正整数；

⑥-2、将t时刻的原始左视点深度图像及t时刻的原始左视点深度图像的最大可容忍失真分布图像分别分割成个互不重叠的尺寸大小为16×16的子块，将中当前正在处理的第k个子块定义为当前第一子块，记为{f_t ^D(i',j′)}，将的最大可容忍失真分布图像中当前正在处理的第k个子块定义为当前第二子块，记为{f_t ^S(i',j')}，其中，(i′，j')表示当前第一子块{f_t ^D(i',j')}与当前第二子块{f_t ^S(i',j')}中的像素点的坐标位置，1≤i'≤16,1≤j'≤16，f_t ^D(i',j')表示当前第一子块{f_t ^D(i',j')}中坐标位置为(i',j')的像素点的深度值，f_t ^S(i',j')表示当前第二子块{f_t ^S(i',j')}中坐标位置为(i',j')的像素点的最大可容忍失真值；

⑥-3、计算当前第二子块{f_t ^S(i',j')}的均值和标准差，分别记为μ₁和σ₁，然后判断μ₁>T₁′且σ₁<T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP1对当前第一子块{f_t ^D(i',j')}进行编码，其中，ΔQP1∈[0,10]，再执行步骤⑥-7，否则，执行步骤⑥-4；

⑥-4、判断μ₁>T₁′且σ₁>T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP2对当前第一子块{f_t ^D(i',j')}进行编码，ΔQP2∈[0,10]，然后执行步骤⑥-7，否则，执行步骤⑥-5；

⑥-5、判断μ₁<T₁′且σ₁<T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP3对当前第一子块{f_t ^D(i',j')}进行编码，ΔQP3∈[0,10]，然后执行步骤⑥-7，否则，执行步骤⑥-6；

⑥-6、根据QP1并采用设定的编码预测结构，利用编码量化参数QP1对当前第一子块{f_t ^D(i',j')}进行编码；

⑥-7、令k″=k+1，k=k″，将t时刻的原始左视点深度图像中的下一个待处理的子块作为当前第一子块，将t时刻的原始左视点深度图像的最大可容忍失真分布图像中的下一个待处理的子块作为当前第二子块，然后返回步骤⑥-3继续执行，直至t时刻的原始左视点深度图像及t时刻的原始左视点深度图像的最大可容忍失真分布图像中的所有子块均处理完毕，完成t时刻的原始左视点深度图像的编码，其中，k″的初始值为0，k″=k+1和k=k″中的“=”为赋值符号。

所述的步骤⑥-3至所述的步骤⑥-5中取T₁'=13，取T₂'=768；所述的设定的编码预测结构为HBP编码预测结构。

所述的步骤⑨的具体过程为：

⑨-1、根据解码后的t时刻右视点深度图像的绘制图像和解码后的t时刻的残差图像得到解码后的t时刻的右视点深度图像的初始重建图像，记为将中坐标位置为(x,y)的像素点的深度值记为

⑨-2、计算解码后的t时刻的右视点深度图像的初始重建图像的空洞掩膜图像，记为将中坐标位置为(x,y)的像素点的像素值记为

M_{t}^{R} (x, y),

如果则

M_{t}^{R} (x, y) = 0,

否则

M_{t}^{R} (x, y) = 1;

⑨-3、将解码后的t时刻的右视点深度图像的初始重建图像中当前正在处理的像素点定义为当前像素点；

⑨-4、判断空洞掩膜图像中与当前像素点的坐标位置对应的像素点的像素值是否为0，如果是，则执行步骤⑨-5，否则，执行步骤⑨-6；

⑨-5、通过采用图像修复技术得到当前像素点的重建像素值，将当前像素点的重建像素值作为解码后的t时刻的右视点深度图像的重构图像中对应坐标位置的像素点的像素值；

⑨-6、将当前像素点的像素值作为解码后的t时刻的右视点深度图像的重构图像中对应坐标位置的像素点的像素值；

⑨-7、将解码后的t时刻的右视点深度图像的初始重建图像中下一个待处理的像素点作为当前像素点，然后返回步骤⑨-4继续执行，直至解码后的t时刻的右视点深度图像的初始重建图像中的所有像素点均处理完毕，得到解码后的t时刻的右视点深度图像的重构图像，记为

与现有技术相比，本发明的优点在于：

1）本发明方法根据人眼的视觉特性得到原始左视点深度图像的最大可容忍失真分布图像，对最大可容忍失真值较小的区域采用较小的量化步长进行编码，对最大可容忍失真值较大的区域采用较大的量化步长进行编码，这样在保证虚拟视点图像绘制性能的基础上，大大提高了深度图像的编码效率。

2）本发明方法通过基于深度图像绘制的方法，将原始左视点深度图像从左视点投影到右视点，得到原始右视点深度图像与原始右视点深度图像的绘制图像的残差图像，然后对残差图像进行编码，最后根据解码后的右视点深度图像的绘制图像和解码后的残差图像，得到解码后的右视点深度图像的重构图像，这样在保证较高的右视点深度图像的重构质量的前提下，大大提高了深度图像的编码效率。

附图说明

图1为本发明方法的流程框图；

图2a为“Alt Moabit”三维立体视频测试序列的一帧左视点彩色图像；

图2b为“Alt Moabit”三维立体视频测试序列的一帧左视点深度图像；

图3a为“BookArrival”三维立体视频测试序列的一帧左视点彩色图像；

图3b为“BookArrival”三维立体视频测试序列的另一帧左视点深度图像；

图4a为“Dog”三维立体视频测试序列的一帧左视点彩色图像；

图4b为“Dog”三维立体视频测试序列的另一帧左视点深度图像；

图5a为“Pantomime”三维立体视频测试序列的一帧左视点彩色图像；

图5b为“Pantomime”三维立体视频测试序列的另一帧左视点深度图像；

图6为“Alt Moabit”三维立体视频测试序列的原始深度图像采用本发明方法与采用原始编码方法的视点绘制率失真性能曲线比较示意图；

图7为“Book Arrival”三维立体视频测试序列的原始深度图像采用本发明方法与采用原始编码方法的视点绘制率失真性能曲线比较示意图；

图8为“Dog”三维立体视频测试序列的原始深度图像采用本发明方法与采用原始编码方法的视点绘制率失真性能曲线比较示意图；

图9为“Pantomime”三维立体视频测试序列的原始深度图像采用本发明方法与采用原始编码方法的视点绘制率失真性能曲线比较示意图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种深度图像编码方法，其流程框图如图1所示，其具体包括以下步骤：

①将外部立体视频捕获工具捕获得到的未经处理的且颜色空间为YUV的彩色立体视频及其对应的深度立体视频定义为原始三维立体视频，该原始三维立体视频由原始左视点彩色图像、原始右视点彩色图像、原始左视点深度图像和原始右视点深度图像组成，将t时刻的原始左视点彩色图像记为将t时刻的原始右视点彩色图像记为将t时刻的原始左视点深度图像记为将t时刻的原始右视点深度图像记为其中，i＝1,2,3分别表示YUV颜色空间的三个分量，YUV颜色空间的第1个分量为亮度分量并记为Y、第2个分量为第一色度分量并记为U及第3个分量为第二色度分量并记为V，(x,y)表示彩色图像和深度图像中的像素点的坐标位置，1≤x≤W，1≤y≤H，W表示彩色图像和深度图像的宽度，H表示彩色图像和深度图像的高度，表示t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点的第i个分量的值，表示t时刻的原始右视点彩色图像中坐标位置为(x,y)的像素点的第i个分量的值，表示t时刻的原始左视点深度图像中坐标位置为(x,y)的像素点的深度值，表示t时刻的原始右视点深度图像中坐标位置为(x,y)的像素点的深度值。

在此，截取德国HHI研究所提供的多视点视频序列“Alt Moabit”和“Book Arrival”，日本Nagoya大学提供的多视点视频序列“Dog”和“Pantomime”作为原始三维立体视频，原始三维立体视频中各幅立体图像的分辨率都为1024×768，是ISO/MPEG所推荐的标准测试序列，是在立体视频研究领域广泛采用的实验测试序列，图2a和图2b分别给出了多视点视频序列“Alt Moabit”的左视点原始视频中的一帧左视点彩色图像和一帧左视点深度图像；图3a和图3b分别给出了多视点视频序列“Book Arrival”的左视点原始视频中的一帧左视点彩色图像和一帧左视点深度图像；图4a和图4b分别给出了多视点视频序列“Dog”的左视点原始视频中的一帧左视点彩色图像和一帧左视点深度图像；图5a和图5b给出了多视点视频序列“Pantomime”的左视点原始视频中的一帧左视点彩色图像和一帧左视点深度图像。

②视觉心理学的研究结果表明，人眼视觉感知存在视觉掩蔽效应，通常以最小可察觉变化步长（Just Noticeable Difference，JND）来进行定量描述，而人眼的视觉掩蔽受背景照度、纹理复杂度等因素的影响，背景越亮，纹理越复杂，界限值就越高。因此本发明利用人类视觉对背景光照和纹理的视觉掩蔽效应，提取出t时刻的原始左视点彩色图像的最小可察觉变化步长图像，记为其中，表示中坐标位置为(x,y)的像素点的最小可察觉变化步长值。

在此具体实施例中，步骤②的具体过程为：

②-1、计算t时刻的原始左视点彩色图像的背景光照的视觉掩蔽效应的可视化阈值集合，记为{T_l(x,y)}，其中，T_l(x,y)表示t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点的背景光照的视觉掩蔽效应的可视化阈值，表示t时刻的原始左视点彩色图像中以坐标位置为(x,y)的像素点为中心的N×N邻域窗口内的所有像素点的亮度平均值，在本实施例中取N的值为5，即N×N为5×5。

②-2、计算t时刻的原始左视点彩色图像的纹理的视觉掩蔽效应的可视化阈值集合，记为{T_t(x,y)}，T_t(x,y)=η×G(x,y)×W_e(x,y)，其中，T_t(x,y)表示t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点的纹理的视觉掩蔽效应的可视化阈值，η为大于0的控制因子，在本实施例中取η=0.05，G(x,y)表示对t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点进行定向高通滤波得到的最大加权平均值，W_e(x,y)表示对t时刻的原始左视点彩色图像的边缘图像中坐标位置为(x,y)的像素点进行高斯低通滤波得到的边缘加权值。

J_{t}^{L} (x, y) = T_{l} (x, y) + T_{t} (x, y) - C_{l, t} \times \min {T_{l} (x, y), T_{t} (x, y)},

其中，C_l，t表示控制背景光照和纹理的视觉掩蔽效应重叠影响的参数，0<C_l,t<1，在本实施例中取C_l,t=0.5，min{}为取最小值函数。

③由于深度图像的失真并不会对视觉感知产生影响，但会对虚拟视点绘制质量产生影响（几何位置失真），并进而影响三维视觉感知，因此需要测量深度失真与几何失真的关系。因此本发明根据t时刻的原始左视点彩色图像的最小可察觉变化步长图像提取出t时刻的原始左视点深度图像的最大可容忍失真分布图像，记为其中，表示中坐标位置为(x,y)的像素点的最大可容忍失真值。

在此具体实施例中，步骤③的具体过程为：

③-1、定义t时刻的原始左视点深度图像中当前正在处理的像素点为当前像素点。

Ψ (x_{1} + Δx, y_{1}) = | I_{t, 1}^{L} (x_{1}, y_{1}) - I_{t, 1}^{L} (x_{1} + Δx, y_{1}) |,

Φ (x_{1} + Δx, y_{1}) = | D_{t}^{L} (x_{1}, y_{1}) - D_{t}^{L} (x_{1} + Δx, y_{1}) |,

其中，x₁∈[1,W]，y₁∈[1,H]，Δx表示水平偏移量，-W'≤Δx<0或0<Δx≤W'，W'表示最大水平偏移量，在本实施例中取W'=15，“||”为取绝对值符号，表示t时刻原始左视点彩色图像中坐标位置为(x₁,y₁)的像素点的Y分量的值，表示t时刻原始左视点彩色图像中坐标位置为(x₁+Δx,y₁)的像素点的Y分量的值，表示t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值，表示t时刻的原始左视点深度图像中坐标位置为(x₁+Δx,y₁)的像素点的深度值。

③-3、从当前像素点的左方向水平偏移量集合{Δx_L|-W'≤Δx_L≤-1}中任取一个Δx_L，如果

Ψ (x_{1} + Δ x_{L}, y_{1}) \leq J_{t}^{L} (x_{1} + Δ x_{L}, y_{1})

且Φ(x₁+Δx_L,y₁)≤T同时成立，则认为Δx_L为当前像素点的一个左方向可容忍失真值；采用相同的方法计算当前像素点的左方向水平偏移量集合中的所有左方向可容忍失真值，再从所有左方向可容忍失真值中找出绝对值最大的左方向可容忍失真值，将绝对值最大的左方向可容忍失真值作为当前像素点的左方向最大可容忍失真值，记为Δ_L(x₁,y₁)，其中，Ψ(x₁+Δx_L,y₁)表示当前像素点和坐标位置为(x₁+Δx_L,y₁)的像素点之间的颜色距离，表示中坐标位置为(x₁+Δx_L,y₁)的像素点的最小可察觉变化步长值，Φ(x₁+Δx_L,y₁)表示当前像素点和坐标位置为(x₁+Δx_L,y₁)的像素点之间的深度距离，T为深度敏感性阈值。

③-4、从当前像素点的右方向水平偏移量集合{Δx_R|1≤Δx_R≤W'}中任取一个Δx_R，如果

Ψ (x_{1} + Δ x_{R}, y_{1}) \leq J_{t}^{L} (x_{1} + Δ x_{R}, y_{1})

且Φ(x₁+Δx_R,y₁)≤T同时成立，则认为Δx_R为当前像素点的一个右方向可容忍失真值；采用相同的方法计算当前像素点的右方向水平偏移量集合中的所有右方向可容忍失真值，再从所有右方向可容忍失真值中找出绝对值最大的右方向可容忍失真值，将绝对值最大的右方向可容忍失真值作为当前像素点的右方向最大可容忍失真值，记为Δ_R(x₁,y₁)，其中，Ψ(x₁+Δx_R,y₁)表示当前像素点和坐标位置为(x₁+Δx_R,y₁)的像素点之间的颜色距离，表示中坐标位置为(x₁+Δx_R,y₁)的像素点的最小可察觉变化步长值，Φ(x₁+Δx_R,y₁)表示当前像素点和坐标位置为(x₁+Δx_R,y₁)的像素点之间的深度距离。

S_{t}^{L} (x_{1}, y_{1}) = \min {| Δ_{L} (x_{1}, y_{1}) |, | Δ_{R} (x_{1}, y_{1}) |},

min{}为取最小值函数，“||”为取绝对值符号。

在本实施例中，深度敏感性阈值T的值由t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值决定，如果则取T=21；如果

64 \leq D_{t}^{L} (x_{1}, y_{1}) < 128,

则取T=19；如果

128 \leq D_{t}^{L} (x_{1}, y_{1}) < 192,

则取T=18；如果

192 \leq D_{t}^{L} (x_{1}, y_{1}) < 255,

则取T=20。

④由于深度是用来表征场景几何的负载信息，立体视频左右视点图像的相关性可以通过基于深度图像的绘制来反映，因此本发明采用基于深度图像绘制的方法，将t时刻的原始左视点深度图像从左视点投影到右视点，得到t时刻的原始右视点深度图像的绘制图像，记为其中，表示t时刻的原始右视点深度图像的绘制图像中坐标位置为(x,y)的像素点的深度值。

在此具体实施例中，步骤④的具体过程为：

④-1、定义t时刻的原始左视点深度图像中当前正在处理的像素点为当前像素点。

{(u, v, w)}^{T} = R_{1} {A_{1}}^{- 1} {(x_{1}, y_{1}, 1)}^{T} Z_{t}^{L} (x_{1}, y_{1}) + T_{1},

其中，x₁∈[1,W]，y₁∈[1,H]，(u,v,w)^T为(u,v,w)的转置矩阵，R₁为左视点相机的旋转矩阵，A₁为左视点相机的内参矩阵，A₁ ^-1为A₁的逆矩阵，(x₁,y₁,1)^T为(x₁,y₁,1)的转置矩阵，表示t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的场景深度，

Z_{t}^{L} (x_{1}, y_{1}) = {(\frac{1}{255} \times D_{t}^{L} (x_{1}, y_{1}) \times (\frac{1}{Z_{near}} - \frac{1}{Z_{far}}) + \frac{1}{Z_{far}})}^{- 1},

表示t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值，Z_near表示深度图像中最小的场景深度值，Z_far表示深度图像中最大的场景深度值，T₁为左视点相机的平移矩阵。

在本实施例中，“Alt Moabit”三维立体视频测试序列的Z_near和Z_far分别为11.83775和189.404006，“Book Arrival”三维立体视频测试序列的Z_near和Z_far分别为23.175928和54.077165，“Dog”三维立体视频测试序列的Z_near和Z_far分别为3907.725727和8221.650623，“Pantomime”三维立体视频测试序列的Z_near和Z_far分别为3907.725727和8221.650623。

④-3、将当前像素点的坐标位置(x₁,y₁)的投影坐标位置(u,v,w)从三维场景平面投影到二维图像平面，得到当前像素点的坐标位置(x₁,y₁)的投影坐标位置(u,v,w)在t时刻的原始右视点深度图像中的坐标位置，记为(x₂,y₂)，x₂=x'/z，y₂=y′/z，(x',y',z)^T=A₂R₂ ^-1(u,v,w)^T-A₂R₂ ^-1T₂，其中，x₂∈[1,W]，y₂∈[1,H]，(x',y',z)^T为(x',y',z)的转置矩阵，A₂为右视点相机的内参矩阵，R₂为右视点相机的旋转矩阵，R₂ ^-1为R₂的逆矩阵，T₂为右视点相机的平移矩阵。

{\tilde{D}}_{t}^{R} (x_{2}, y_{2}),

{\tilde{D}}_{t}^{R} (x_{2}, y_{2}) = D_{t}^{L} (x_{1,} y_{1});

⑤由于受到空洞、遮挡及深度不一致等因素的影响，通过绘制得到的右视点彩色图像与原始右视点彩色图像之间存在一定的差异，为此本发明计算t时刻的原始右视点深度图像与t时刻的原始右视点深度图像的绘制图像的残差图像，记为将中坐标位置为(x,y)的像素点的像素值记为

E_{t}^{R} (x . y) = D_{t}^{R} (x, y) - {\tilde{D}}_{t}^{R} (x, y) .

⑥根据t时刻的原始左视点深度图像的最大可容忍失真分布图像并根据设定的编码预测结构对t时刻的原始左视点深度图像进行编码，再将编码后的t时刻的左视点深度图像经网络传输给解码端；在解码端对编码后的t时刻的左视点深度图像进行解码，获得解码后的t时刻的左视点深度图像，记为其中，表示解码后的t时刻的左视点深度图像中坐标位置为(x,y)的像素点的深度值。

在此具体实施例中，步骤⑥中对t时刻的原始左视点深度图像进行编码的具体过程为：

⑥-1、任取一个编码量化参数作为t时刻的原始左视点深度图像的基本编码量化参数，并记为QP1，其中，QP1的值可为[22,50]区间内的一个正整数。

⑥-2、将t时刻的原始左视点深度图像及t时刻的原始左视点深度图像的最大可容忍失真分布图像分别分割成个互不重叠的尺寸大小为16×16的子块，将中当前正在处理的第k个子块定义为当前第一子块，记为{f_t ^D(i',j')}，将的最大可容忍失真分布图像中当前正在处理的第k个子块定义为当前第二子块，记为{f_t ^S(i',j')}，其中，(i′，j')表示当前第一子块{f_t ^D(i',j')}与当前第二子块{f_t ^S(i',j')}中的像素点的坐标位置，1≤i'≤16,1≤j'≤16，f_t ^D(i',j')表示当前第一子块{f_t ^D(i',j')}中坐标位置为(i',j')的像素点的深度值，f_t ^S(i',j')表示当前第二子块{f_t ^S(i',j')}中坐标位置为(i',j')的像素点的最大可容忍失真值。

⑥-3、计算当前第二子块{f_t ^S(i',j')}的均值和标准差，分别记为μ₁和σ₁，然后判断μ₁>T₁′且σ₁<T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP1对当前第一子块{f_t ^D(i',j')}进行编码，其中，ΔQP1∈[0,10]，再执行步骤⑥-7，否则，执行步骤⑥-4。

⑥-4、判断μ₁>T₁′且σ₁>T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP2对当前第一子块{f_t ^D(i',j')}进行编码，ΔQP2∈[0,10]，然后执行步骤⑥-7，否则，执行步骤⑥-5。

⑥-5、判断μ₁<T₁′且σ₁<T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP3对当前第一子块{f_t ^D(i',j′)}进行编码，ΔQP3∈[0,10]，然后执行步骤⑥-7，否则，执行步骤⑥-6。

⑥-6、根据QP1并采用设定的编码预测结构，利用编码量化参数QP1对当前第一子块{f_t ^D(i',j')}进行编码。

在本实施例中，设定的编码预测结构采用公知的HBP编码预测结构。

在本实施例中，取T₁'=13，取T₂'=768。

在本实施例中，通过统计实验对不同的三维立体视频测试序列采用相同的ΔQP1、ΔQP2和ΔQP3进行编码，ΔQP1、ΔQP2和ΔQP3分别取值为8、5和2。

⑦根据设定的编码预测结构即公知的HBP编码预测结构对t时刻的原始右视点深度图像与t时刻的原始右视点深度图像的绘制图像的残差图像进行编码，再将编码后的t时刻的残差图像经网络传输给解码端；在解码端对编码后的t时刻的残差图像进行解码，获得解码后的t时刻的残差图像，记为其中，表示解码后的t时刻的残差图像中坐标位置为(x,y)的像素点的像素值。

⑧采用与步骤④相同的操作，将解码后的t时刻的左视点深度图像从左视点投影到右视点，得到解码后的t时刻的右视点深度图像的绘制图像，记为其中，表示解码后的t时刻的右视点深度图像的绘制图像中坐标位置为(x,y)的像素点的深度值。具体过程如下：⑧-1、定义解码后的t时刻的左视点深度图像中当前正在处理的像素点为当前像素点；⑧-2、将当前像素点的坐标位置记为(x₁,y₁)，将当前像素点的坐标位置(x₁,y₁)从二维图像平面投影到三维场景平面，得到当前像素点的坐标位置(x₁,y₁)的投影坐标位置，记为(u',v',w')，

{(u^{'}, v^{'}, w^{'})}^{T} = R_{1} {A_{1}}^{- 1} {(x_{1}, y_{1}, 1)}^{T} {\hat{Z}}_{t}^{L} (x_{1}, y_{1}) + T_{1},

其中，x₁∈[1,W]，y₁∈[1,H]，(u',v',w′)^T为(u',v',w')的转置矩阵，R₁为左视点相机的旋转矩阵，A₁为左视点相机的内参矩阵，A₁ ^-1为A₁的逆矩阵，(x₁,y₁,1)^T为(x₁,y₁,1)的转置矩阵，表示解码后的t时刻的左视点深度图像中坐标位置为(x₁,y₁)的像素点的场景深度，

{\hat{Z}}_{t}^{L} (x_{1}, y_{1}) = {(\frac{1}{255} \times {\hat{D}}_{t}^{L} (x_{1}, y_{1}) \times (\frac{1}{Z_{near}} - \frac{1}{Z_{far}}) + \frac{1}{Z_{far}})}^{- 1},

表示解码后的t时刻的左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值，Z_near表示深度图像中最小的场景深度值，Z_far表示深度图像中最大的场景深度值，T₁为左视点相机的平移矩阵；⑧-3、将当前像素点的坐标位置(x₁,y₁)的投影坐标位置(u',v',w')从三维场景平面投影到二维图像平面，得到当前像素点的坐标位置(x₁,y₁)的投影坐标位置(u',v',w′)在解码后的t时刻的右视点深度图像中的坐标位置，记为(x₂',y₂′)，x₂'=x'″/z'，y₂'=y'″/z'，(x″,y″,z')^T=A₂R₂ ^-1(u',v',w')^T-A₂R₂ ^-1T₂，其中，x₂'∈[1,W]，y₂'∈[1,H]，(x″,y″,z′)^T为(x″,y″,z')的转置矩阵，A₂为右视点相机的内参矩阵，R₂为右视点相机的旋转矩阵，R₂ ^-1为R₂的逆矩阵，T₁为右视点相机的平移矩阵；⑧-4、利用当前像素点的坐标位置(x₁,y₁)与解码后的t时刻的右视点深度图像中的坐标位置(x₂',y₂')的映射关系，将解码后的t时刻的左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值映射到解码后的t时刻的右视点深度图像中，对应作为解码后的t时刻的右视点深度图像的绘制图像中坐标位置为(x₂',y₂')的像素点的深度值，将解码后的t时刻的右视点深度图像的绘制图像中坐标位置为(x₂',y₂')的像素点的深度值记为 ⑧-5、将解码后的t时刻的左视点深度图像中下一个待处理的像素点作为当前像素点，然后返回步骤⑧-2继续执行，直至解码后的t时刻的左视点深度图像中的所有像素点处理完毕，得到解码后的t时刻的右视点深度图像的绘制图像，记为

{{\overset{&OverBar;}{D}}_{t}^{R} (x, y)} .

在此具体实施例中，步骤⑨的具体过程为：

M_{t}^{R} (x, y),

如果则

M_{t}^{R} (x, y) = 0,

否则

M_{t}^{R} (x, y) = 1 .

⑨-3、将解码后的t时刻的右视点深度图像的初始重建图像中当前正在处理的像素点定义为当前像素点。

⑨-4、判断空洞掩膜图像中与当前像素点的坐标位置对应的像素点的像素值是否为0，如果是，则执行步骤⑨-5，否则，执行步骤⑨-6。

⑨-5、通过采用图像修复技术得到当前像素点的重建像素值，将当前像素点的重建像素值作为解码后的t时刻的右视点深度图像的重构图像中对应坐标位置的像素点的像素值。

⑨-6、将当前像素点的像素值作为解码后的t时刻的右视点深度图像的重构图像中对应坐标位置的像素点的像素值。

以下就利用本发明方法对“Alt Moabit”、“Book Arrival”、“Dog”和“Pantomime”三维立体视频测试序列进行立体视频编码的编码性能进行比较。

由于本发明方法只考虑深度图像的编码失真对绘制图像的影响，因此此处只对深度图像的编码性能进行比较。表1给出了利用本发明方法与传统编码方法的深度图像的编码性能比较，从表1中所列的数据可以看出，对于“Alt Moabit”、“Book Arrival”、“Dog”和“Pantomime”采用本发明方法处理后，深度图像的最低的码率节省也能达到8.73%左右，最高的码率节省能达到50.15%左右，足以说明本发明方法是有效可行的。

将采用本发明方法的视点绘制性能与采用原始编码方法的视点绘制性能进行比较，图6给出了“Alt Moabit”三维立体视频测试序列的原始深度图像采用本发明方法与原始编码方法的视点绘制率失真性能曲线比较示意图，图7给出了“BookArrival”三维立体视频测试序列的原始深度图像采用本发明方法与原始编码方法的视点绘制率失真性能曲线比较示意图，图8给出了“Dog”三维立体视频测试序列的原始深度图像采用本发明方法与原始编码方法的视点绘制率失真性能曲线比较示意图，图9给出了“Pantomime”三维立体视频测试序列的原始深度图像采用本发明方法与原始编码方法的视点绘制率失真性能曲线比较示意图，从图6至图9中可以看出，采用本发明方法处理后，大大提高了虚拟视点绘制的性能，足以说明本发明方法是有效可行的。

表1利用本发明方法与传统编码方法的深度图像的编码性能比较

。

Claims

1.一种深度图像编码方法，其特征在于它具体包括以下步骤：

E_{t}^{R} (x, y) = D_{t}^{R} (x, y) - {\tilde{D}}_{t}^{R} (x, y);

⑥-2、将t时刻的原始左视点深度图像及t时刻的原始左视点深度图像的最大可容忍失真分布图像分别分割成个互不重叠的尺寸大小为16×16的子块，将中当前正在处理的第k个子块定义为当前第一子块，记为{f_t ^D(i',j')}，将的最大可容忍失真分布图像中当前正在处理的第k个子块定义为当前第二子块，记为{f_t ^S(i',j')}，其中，(i',j')表示当前第一子块{f_t ^D(i',j')}与当前第二子块{f_t ^S(i',j')}中的像素点的坐标位置，1≤i'≤16,1≤j'≤16，f_t ^D(i',j')表示当前第一子块{f_t ^D(i',j')}中坐标位置为(i',j')的像素点的深度值，f_t ^S(i',j')表示当前第二子块{f_t ^S(i',j')}中坐标位置为(i',j')的像素点的最大可容忍失真值；

⑥-3、计算当前第二子块{f_t ^S(i',j')}的均值和标准差，分别记为μ₁和σ₁，然后判断μ₁>T₁'且σ₁<T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP1对当前第一子块{f_t ^D(i',j')}进行编码，其中，ΔQP1∈[0,10]，再执行步骤⑥-7，否则，执行步骤⑥-4；

⑥-4、判断μ₁>T₁'且σ₁>T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP2对当前第一子块{f_t ^D(i',j')}进行编码，ΔQP2∈[0,10]，然后执行步骤⑥-7，否则，执行步骤⑥-5；

⑥-5、判断μ₁<T₁'且σ₁<T₂'是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP3对当前第一子块{f_t ^D(i',j')}进行编码，ΔQP3∈[0,10]，然后执行步骤⑥-7，否则，执行步骤⑥-6；

⑥-7、令k″＝k+1，k＝k″，将t时刻的原始左视点深度图像中的下一个待处理的子块作为当前第一子块，将t时刻的原始左视点深度图像的最大可容忍失真分布图像中的下一个待处理的子块作为当前第二子块，然后返回步骤⑥-3继续执行，直至t时刻的原始左视点深度图像及t时刻的原始左视点深度图像的最大可容忍失真分布图像中的所有子块均处理完毕，完成t时刻的原始左视点深度图像的编码，其中，k″的初始值为0，k″＝k+1和k＝k″中的“＝”为赋值符号；

2.根据权利要求1所述的一种深度图像编码方法，其特征在于所述的步骤②的具体过程为：

②-2、计算t时刻的原始左视点彩色图像的纹理的视觉掩蔽效应的可视化阈值集合，记为{T_t(x,y)}，T_t(x,y)＝η×G(x,y)×W_e(x,y)，其中，T_t(x,y)表示t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点的纹理的视觉掩蔽效应的可视化阈值，η为大于0的控制因子，G(x,y)表示对t时刻的原始左视点彩色图像中坐标位置为(x,y)的像素点进行定向高通滤波得到的最大加权平均值，W_e(x,y)表示对t时刻的原始左视点彩色图像的边缘图像中坐标位置为(x,y)的像素点进行高斯低通滤波得到的边缘加权值；

J_{t}^{L} (x, y) = T_{l} (x, y) + T_{t} (x, y) - C_{l, t} \times \min {T_{l} (x, y), T_{t} (x, y)},

其中，C_l,t表示控制背景光照和纹理的视觉掩蔽效应重叠影响的参数，0<C_l,t<1，min{}为取最小值函数。

3.根据权利要求2所述的一种深度图像编码方法，其特征在于所述的步骤②-1中取N的值为5；所述的步骤②-2中取η＝0.05；所述的步骤②-3中取C_l,t＝0.5。

4.根据权利要求1至3中任一项所述的一种深度图像编码方法，其特征在于所述的步骤③的具体过程为：

Ψ (x_{1} + Δx, y_{1}) = | I_{t, 1}^{L} (x_{1}, y_{1}) - I_{t, 1}^{L} (x_{1} + Δx, y_{1}) |,

Φ (x_{1} + Δx, y_{1}) = | D_{t}^{L} (x_{1}, y_{1}) - D_{t}^{L} (x_{1} + Δx, y_{1}) |,

③-3、从当前像素点的左方向水平偏移量集合{Δx_L|-W'≤Δx_L≤-1}中任取一个Δx_L，如果且Φ(x₁+Δx_L,y₁)≤T同时成立，则认为Δx_L为当前像素点的一个左方向可容忍失真值；采用相同的方法计算当前像素点的左方向水平偏移量集合中的所有左方向可容忍失真值，再从所有左方向可容忍失真值中找出绝对值最大的左方向可容忍失真值，将绝对值最大的左方向可容忍失真值作为当前像素点的左方向最大可容忍失真值，记为Δ_L(x₁,y₁)，其中，Ψ(x₁+Δx_L,y₁)表示当前像素点和坐标位置为(x₁+Δx_L,y₁)的像素点之间的颜色距离，表示中坐标位置为(x₁+Δx_L,y₁)的像素点的最小可察觉变化步长值，Φ(x₁+Δx_L,y₁)表示当前像素点和坐标位置为(x₁+Δx_L,y₁)的像素点之间的深度距离，T为深度敏感性阈值；

S_{t}^{L} (x_{1}, y_{1}) = \min {| Δ_{L} (x_{1}, y_{1}) |, | Δ_{R} (x_{1}, y_{1}) |},

min{}为取最小值函数，“||”为取绝对值符号；

5.根据权利要求4所述的一种深度图像编码方法，其特征在于所述的深度敏感性阈值T的值由t时刻的原始左视点深度图像中坐标位置为(x₁,y₁)的像素点的深度值决定，如果

0 \leq D_{t}^{L} (x_{1}, y_{1}) < 64,

则取T＝21；如果

64 \leq D_{t}^{L} (x_{1}, y_{1}) < 128,

则取T＝19；如果

128 \leq D_{t}^{L} (x_{1}, y_{1}) < 192,

则取T＝18；如果

192 \leq D_{t}^{L} (x_{1}, y_{1}) < 255,

则取T＝20。

6.根据权利要求5所述的一种深度图像编码方法，其特征在于所述的步骤④的具体过程为：

{(u, v, w)}^{T} = R_{1} {A_{1}}^{- 1} {(x_{1}, y_{1}, 1)}^{T} Z_{t}^{L} (x_{1}, y_{1}) + T_{1},

Z_{t}^{L} (x_{1}, y_{1}) = {(\frac{1}{255} \times D_{t}^{L} (x_{1}, y_{1}) \times (\frac{1}{Z_{near}} - \frac{1}{Z_{far}}) + \frac{1}{Z_{far}})}^{- 1},

④-3、将当前像素点的坐标位置(x₁,y₁)的投影坐标位置(u,v,w)从三维场景平面投影到二维图像平面，得到当前像素点的坐标位置(x₁,y₁)的投影坐标位置(u,v,w)在t时刻的原始右视点深度图像中的坐标位置，记为(x₂,y₂)，x₂＝x'/z，y₂＝y'/z，(x',y',z)^T＝A₂R₂ ^-1(u,v,w)^T-A₂R₂ ^-1T₂，其中，x₂∈[1,W]，y₂∈[1,H]，(x',y',z)^T为(x',y',z)的转置矩阵，A₂为右视点相机的内参矩阵，R₂为右视点相机的旋转矩阵，R₂ ^-1为R₂的逆矩阵，T₂为右视点相机的平移矩阵；

{\tilde{D}}_{t}^{R} (x_{2}, y_{2}) = D_{t}^{L} (x_{1}, y_{1});

7.根据权利要求1所述的一种深度图像编码方法，其特征在于所述的步骤⑥-3至所述的步骤⑥-5中取T₁'＝13，取T₂'＝768；所述的设定的编码预测结构为HBP编码预测结构。

8.根据权利要求7所述的一种深度图像编码方法，其特征在于所述的步骤⑨的具体过程为：

⑨-2、计算解码后的t时刻的右视点深度图像的初始重建图像的空洞掩膜图像，记为将中坐标位置为(x,y)的像素点的像素值记为如果则

M_{t}^{R} (x, y) = 0,

否则

M_{t}^{R} (x, y) = 1;