CN102710949A

CN102710949A - 一种基于视觉感知的立体视频编码方法

Info

Publication number: CN102710949A
Application number: CN2012101461171A
Authority: CN
Inventors: 邵枫; 江东; 郁梅; 蒋刚毅; 李福翠
Original assignee: Ningbo University
Current assignee: Ningbo University
Priority date: 2012-05-11
Filing date: 2012-05-11
Publication date: 2012-10-03
Anticipated expiration: 2032-05-11
Also published as: CN102710949B

Abstract

本发明公开了一种基于视觉感知的立体视频编码方法，其通过利用人类立体视觉感知对背景光照和对比度的双目视觉掩蔽效应、时域掩蔽效应和深度感知特性，得到人眼可感知立体图像质量变化时右视点图像的立体最小可察觉变化图像，然后在左视点图像质量固定不变的情况下，根据左视点图像的基本编码量化参数和右视点图像的立体最小可察觉变化值，对右视点图像的不同区域采用不同的编码量化参数进行编码，不仅能充分消除立体视频的视觉冗余信息，而且在保证立体图像质量的整体质量的前提下，能大大提高立体视频的编码效率。

Description

一种基于视觉感知的立体视频编码方法

技术领域

本发明涉及一种视频信号的编码压缩方法，尤其是涉及一种基于视觉感知的立体视频编码方法。

背景技术

进入本世纪以来，随着数字2D（二维）视频技术日趋成熟，以及计算机、通信及网络技术的快速发展，引发了人们对新一代视频系统的强烈需求。现行的二维视频系统在表现自然场景时，难以满足用户的立体感和视点交互等的需求。（立体）三维视频系统由于能够提供立体感、视点交互性的全新视觉体验而越来越受到人们的欢迎，因此在无线视频通信、影视娱乐、数字动漫、虚拟战场、旅游观光、远程教学等领域有着广泛的应用前景。与单通道视频相比，立体视频要处理至少翻一倍的数据量，因此在不影响立体视频主观质量的前提下，尽可能地降低立体视频的编码码率是一个亟需解决的问题。

然而，现有的立体视频编码的研究更多地考虑了视点间的冗余信息，而并没有充分利用立体视频的冗余信息。心理学研究结果表明，立体视觉中存在视觉掩蔽效益，即构成立体视频的两个视点视频，质量好的视点视频的质量对立体视频的整体质量贡献较大，并且不同区域的掩蔽效应是各不相同的。利用人类立体视觉系统的这一特性，对立体视频采用非对称编码方法，即对左视点视频进行正常编码，而对右视点视频进行降低质量的编码方式，因此，如何建立立体视频的双目立体掩蔽（最小可察觉变化）模型，是对立体视频进行基于视觉感知的编码过程中需要研究解决的问题。

发明内容

本发明所要解决的技术问题是提供一种能够充分地消除立体视频的视觉冗余信息，并能够有效地提高立体视频的编码效率的基于视觉感知的立体视频编码方法。

本发明解决上述技术问题所采用的技术方案为：一种基于视觉感知的立体视频编码方法，其特征在于包括以下步骤：

①将外部立体视频捕获工具捕获得到的未经处理的且颜色空间为YUV的立体视频定义为原始立体视频，在空域上该原始立体视频包括左视点原始视频和右视点原始视频，左视点原始视频主要由若干个帧组的左视点图像组成，右视点原始视频主要由若干个帧组的右视点图像组成，对于左视点原始视频中t时刻的左视点图像，将其记为对于右视点原始视频中t时刻的右视点图像，将其记为

其中，i＝1,2,3分别表示YUV颜色空间的三个分量，YUV颜色空间的第1个分量为亮度分量并记为Y、第2个分量为第一色度分量并记为U及第3个分量为第二色度分量并记为V，(x,y)表示图像中的像素点的坐标位置，1≤x≤W，1≤y≤H，W表示图像的宽度，H表示图像的高度，

表示

中坐标位置为(x,y)的像素点的第i个分量的值，

表示

中坐标位置为(x,y)的像素点的第i个分量的值；

②采用块匹配法分别计算左视点原始视频中每一时刻的左视点图像和右视点原始视频中对应时刻的右视点图像之间的视差图像，对于

和

之间的视差图像，将其记为

其中，

表示

中坐标位置为(x,y)的像素点的像素值；

③利用人类立体视觉感知对背景光照和对比度的视觉掩蔽效应，分别提取出右视点原始视频中每一时刻的右视点图像的双目最小可察觉变化图像，对于

的双目最小可察觉变化图像，将其记为

其中，

表示

中坐标位置为(x,y)的像素点的像素值；

④根据时域掩蔽效应，分别提取出右视点原始视频中每一时刻的右视点图像的时域掩蔽因子，对于的时域掩蔽因子，将其记为

其中，

表示

中坐标位置为(x,y)的像素点的时域掩蔽因子，max()为取最大值函数，τ表示尺度因子，exp()为底数e=2.71828的指数运算操作，

Δ (x, y, t) = 0.5 \times (I_{t, 1}^{R} (x, y) - I_{t - 1,1}^{R} (x, y) - \overset{&OverBar;}{I_{t, 1}^{R} (x, y)} + \overset{&OverBar;}{I_{t - 1,1}^{R} (x, y)}),

表示

中坐标位置为(x,y)的像素点的第1个分量的值，

表示右视点原始视频中t-1时刻的右视点图像

中坐标位置为(x,y)的像素点的第1个分量的值，

表示

中所有像素点的第1个分量的平均值，

表示

中所有像素点的第1个分量的平均值；

⑤根据深度感知特性，分别提取出右视点原始视频中每一时刻的右视点图像的深度加权因子集合，对于

的深度加权因子集合，将其记为

η_{t}^{R} (x, y) = \frac{ζ}{γ} \times (1 - \exp (- | \frac{(β_{\max} + δ)}{d_{t}^{R} (x, y)} |)),

其中，

表示

中坐标位置为(x,y)的像素点的深度加权因子，

ζ = \frac{4}{3} \times β_{center} + β_{\min},

γ = \frac{3}{2} \times β_{center} + β_{\min},

δ = \frac{1}{2} \times β_{center} + β_{\min},

表示

和

之间的视差图像

中坐标位置为(x,y)的像素点的像素值，β_max表示

中的最大视差值，β_min表示

中的最小视差值，β_center表示中的所有像素点的平均视差值，符号“||”为取绝对值符号；

⑥对右视点原始视频中每一时刻的右视点图像的双目最小可察觉变化图像、时域掩蔽因子及深度加权因子进行结合，对应获得右视点原始视频中每一时刻的右视点图像的立体最小可察觉变化图像，对于

的双目最小可察觉变化图像

的时域掩蔽因子

及

的深度加权因子

进行结合后获得的的立体最小可察觉变化图像，将其记为

S_{t}^{R} (x, y) = ρ_{t}^{R} (x, y) \times η_{t}^{R} (x, y) \times J_{t}^{R} (x, y),

其中，

表示

中坐标位置为(x,y)的像素点的像素值；

⑦采用设定的编码预测结构对左视点原始视频中每一时刻的左视点图像进行编码，采用设定的编码预测结构并根据右视点原始视频中每一时刻的右视点图像的立体最小可察觉变化图像对右视点原始视频中对应时刻的右视点图像进行编码，然后将编码得到的左视点码流和右视点码流经网络传输给解码端。

所述的步骤③中

的双目最小可察觉变化图像

的获取过程为：

③-1、计算

的亮度掩蔽效应的可视化阈值集合，记为{T_l(x,y)}，其中，T_l(x,y)表示

中坐标位置为(x,y)的像素点的亮度掩蔽效应的可视化阈值，bg_l(x,y)表示中以坐标位置为(x,y)的像素点为中心的5×5窗口内的所有像素点的亮度平均值；

③-2、计算

的对比度掩蔽效应的可视化阈值集合，记为{T_c(x,y)}，T_c(x,y)=K(bg_l(x,y))+eh_l(x,y)，其中，T_c(x,y)表示

中坐标位置为(x,y)的像素点的对比度掩蔽效应的可视化阈值，eh₁(x,y)表示对中坐标位置为(x,y)的像素点分别进行水平方向和垂直方向边缘滤波后得到的平均梯度值，K(bg_l(x,y))=-10^-6×(0.7×bg_l(x,y)²+32×bg_l(x,y))+0.07；

③-3、对

的亮度掩蔽效应的可视化阈值集合{T_l(x,y)}和的对比度掩蔽效应的可视化阈值集合{T_c(x,y)}进行融合，得到

的双目最小可察觉变化图像，记为

其中，

表示

中坐标位置为(x,y)的像素点的像素值；

③-4、根据

和

之间的视差图像

得到

的双目最小可察觉变化图像，记为

其中，

表示

中坐标位置为的像素点的像素值。

所述的步骤⑦的具体过程为：

⑦-1、任取一个编码量化参数作为左视点原始视频中所有时刻的左视点图像的基本编码量化参数，并记为QP1；

⑦-2、采用设定的编码预测结构，利用QP1对左视点原始视频中所有时刻的左视点图像的亮度分量Y、第一色度分量U和第二色度分量V分别进行编码，得到左视点码流；

⑦-3、将右视点原始视频中当前正在处理的t时刻的右视点图像

定义为当前右视点图像；

⑦-4、计算当前右视点图像

的立体最小可察觉变化图像的均值和标准差，分别记为μ₁和σ₁；

⑦-5、将当前右视点图像

及当前右视点图像

的立体最小可察觉变化图像分别分成个互不重叠的尺寸大小为16×16的子块，将

中当前正在处理的第k个子块定义为当前第一子块，记为

将的立体最小可察觉变化图像中当前正在处理的第k个子块定义为当前第二子块，记为

其中，(x₁,y₁)表示当前第一子块

与当前第二子块

中的像素点的坐标位置，1≤x₁≤16,1≤y₁≤16，

表示当前第一子块

中坐标位置为(x₁,y₁)的像素点的第i个分量的值，

表示当前第二子块

中坐标位置为(x₁,y₁)的像素点的像素值；

⑦-6、计算当前第二子块

的均值，记为μ，然后判断μ≥μ₁+σ₁是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP1对当前第一子块

进行编码，ΔQP1∈[0,10]，再执行步骤⑦-9，否则，执行步骤⑦-7；

⑦-7、判断μ₁-σ₁≤μ<μ₁+σ₁是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP2对当前第一子块

进行编码，ΔQP2∈[0,10]，然后执行步骤⑦-9，否则，执行步骤⑦-8；

⑦-8、判断μ<μ₁-σ₁是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP3对当前第一子块

进行编码，ΔQP3∈[0,10]；

⑦-9、令k″=k+1，k=k″，将当前右视点图像

中的下一个待处理的子块作为当前第一子块，将当前右视点图像

的立体最小可察觉变化图像

中的下一个待处理的子块作为当前第二子块，然后返回步骤⑦-6继续执行，直至当前右视点图像

及当前右视点图像

的立体最小可察觉变化图像

中的所有子块均处理完毕，其中，k″的初始值为0，k″=k+1和k=k″中的“=”为赋值符号；

⑦-10、令t″=t+1，t=t″，将右视点原始视频中下一个待处理的右视点图像作为当前右视点图像，然后返回步骤⑦-4继续执行，直至右视点原始视频中的所有右视点图像处理完毕，得到右视点码流，其中，t″的初始值为0，t″=t+1和t=t″中的“=”为赋值符号；

⑦-11、将编码得到的左视点码流和右视点码流经网络传输给解码端。

与现有技术相比，本发明的优点在于：

1）本发明方法通过利用人类立体视觉感知对背景光照和对比度的视觉掩蔽效应、时域掩蔽效应和深度感知特性，在左视点图像质量固定不变的情况下，得到人眼可感知立体图像质量变化时右视点图像的立体最小可察觉变化图像，能充分消除立体视频的视觉冗余信息。

2）本发明方法通过利用计算得到的右视点图像的立体最小可察觉变化图像对立体视频图像进行编码，根据左视点图像的基本编码量化参数和右视点图像的立体最小可察觉变化值，对右视点图像的不同区域采用不同的编码量化参数进行编码，在保证立体图像质量的同时大大提高立体视频的编码效率。

附图说明

图1为本发明方法的流程框图；

图2a为“Door Flowers 体视频测试序列的左视点原始视频中的一帧图像；

图2b为“Door Flowers 体视频测试序列的右视点原始视频中的一帧图像；

图3a为“Alt Moabit”立体视频测试序列的左视点原始视频中的一帧图像；

图3b为“Alt Moabit”立体视频测试序列的右视点原始视频中的一帧图像；

图4a为“Champagne”体视频测试序列的左视点原始视频中的一帧图像；

图4b为“Champagne”立体视频测试序列的右视点原始视频中的一帧图像；

图5a为“Dog”立体视频测试序列的左视点原始视频中的一帧图像；

图5b为“Dog”立体视频测试序列的右视点原始视频中的一帧图像；

图6a为“Lovebird1”立体视频测试序列的左视点原始视频中的一帧图像；

图6b为“Lovebird1”立体视频测试序列的右视点原始视频中的一帧图像；

图7a为“Newspaper 体视频测试序列的左视点原始视频中的一帧图像；

图7b为“Newspaper”立体视频测试序列的右视点原始视频中的一帧图像；

图8为“DoorFlowers 体视频测试序列的右视点图像的立体最小可察觉变化图像；

图9为“Alt Moabit”立体视频测试序列的右视点图像的立体最小可察觉变化图像；

图10为“Champagne”立体视频测试序列的右视点图像的立体最小可察觉变化图像；

图11为“Dog”立体视频测试序列的右视点图像的立体最小可察觉变化图像；

图12为“Lovebird1”立体视频测试序列的右视点图像的立体最小可察觉变化图像；

图13为“Newspaper 体视频测试序列的右视点图像的立体最小可察觉变化图像。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种基于视觉感知的立体视频编码方法，其流程框图如图1所示，其包括以下步骤：

①将外部立体视频捕获工具捕获得到的未经处理的且颜色空间为YUV的立体视频定义为原始立体视频，在空域上该原始立体视频包括左视点原始视频和右视点原始视频，左视点原始视频主要由若干个帧组的左视点图像组成，右视点原始视频主要由若干个帧组的右视点图像组成，对于左视点原始视频中t时刻的左视点图像，将其记为

对于右视点原始视频中t时刻的右视点图像，将其记为

表示

中坐标位置为(x,y)的像素点的第i个分量的值，表示

中坐标位置为(x,y)的像素点的第i个分量的值。

在此，截取德国HHI研究所提供的多视点视频序列“Door Flowers”和“Alt Moabit”，日本Nagoya大学提供的多视点视频序列“Champagne”和“Dog”及韩国光州科学技术学院（GIST）提供的多视点视频序列“Lovebird1”和“Newspaper”的两个视点视频作为原始立体视频，原始立体视频中各幅立体图像的分辨率都为1024×768，是ISO/MPEG所推荐的标准测试序列，是在立体视频研究领域广泛采用的实验测试序列，图2a和图2b分别给出了多视点视频序列“Door Flowers”的左视点原始视频中的一帧左视点图像和右视点原始视频中对应的一帧右视点图像；图3a和图3b分别给出了多视点视频序列“AltMoabit”的左视点原始视频中的一帧左视点图像和右视点原始视频中对应的一帧右视点图像；图4a和图4b分别给出了多视点视频序列“Champagne”的左视点原始视频中的一帧左视点图像和右视点原始视频中对应的一帧右视点图像；图5a和图5b给出了多视点视频序列“Dog”的左视点原始视频中的一帧左视点图像和右视点原始视频中对应的一帧右视点图像；图6a和图6b给出了多视点视频序列“Lovebird1”的左视点原始视频中的一帧左视点图像和右视点原始视频中对应的一帧右视点图像；图7a和图7b给出了多视点视频序列“Newspaper”的左视点原始视频中的一帧左视点图像和右视点原始视频中对应的一帧右视点图像。

②采用现有的经典的块匹配法分别计算左视点原始视频中每一时刻的左视点图像和右视点原始视频中对应时刻的右视点图像之间的视差图像，对于

和之间的视差图像，将其记为

其中，

表示

中坐标位置为(x,y)的像素点的像素值。经典的块匹配法的基本思想是将图像分成小块，对左视点原始视频中的左视点图像的每一小块，在右视点原始视频图像中寻找相关性最大的小块，两个小块之间的空间位移量就是视差。

③人类视觉特性表明，人眼对图像中变化较小的属性或噪声是不可感知的，除非该属性或噪声的变化强度超过某一阈值，该阈值就是最小可察觉失真（Just noticeabledifference，JND）。而人眼的视觉掩蔽效应是一种局部效应，受背景照度、纹理复杂度等因素的影响，背景越亮，纹理越复杂，界限值就越高。因此本发明利用人类立体视觉感知对背景光照和对比度的视觉掩蔽效应，分别提取出右视点原始视频中每一时刻的右视点图像的双目最小可察觉变化图像，对于

的双目最小可察觉变化图像，将其记为

其中，

表示

中坐标位置为(x,y)的像素点的像素值。

在此具体实施例中，步骤③中

的双目最小可察觉变化图像

的获取过程为：

③-1、计算

的亮度掩蔽效应的可视化阈值集合，记为{T_l(x,y)}，

其中，T_l(x,y)表示中坐标位置为(x,y)的像素点的亮度掩蔽效应的可视化阈值，bg_l(x,y)表示

中以坐标位置为(x,y)的像素点为中心的5×5窗口内的所有像素点的亮度平均值。

③-2、计算

中坐标位置为(x,y)的像素点的对比度掩蔽效应的可视化阈值，eh_l(x,y)表示对

中坐标位置为(x,y)的像素点分别进行水平方向和垂直方向边缘滤波后得到的平均梯度值，K(bg_l(x,y))=-10^-6×(0.7×bg_l(x,y)²+32×bg_l(x,y))+0.07。

③-3、对

的亮度掩蔽效应的可视化阈值集合{T_l(x,y)}和

的对比度掩蔽效应的可视化阈值集合{T_c(x,y)}进行融合，得到

的双目最小可察觉变化图像，记为

其中，

表示

中坐标位置为(x,y)的像素点的像素值。

③-4、根据

和

之间的视差图像

得到

的双目最小可察觉变化图像，记为

其中，表示

中坐标位置为

的像素点的像素值。

④人类视觉特性表明，如果视频中帧间变化越明显（剧烈），其时域掩蔽效应也会越大，而时域掩蔽效应能够反映人眼对运动区域的敏感程度。因此本发明根据时域掩蔽效应，分别提取出右视点原始视频中每一时刻的右视点图像的时域掩蔽因子集合，对于

的时域掩蔽因子集合，将其记为

其中，

表示

中坐标位置为(x,y)的像素点的时域掩蔽因子，max()为取最大值函数，τ表示尺度因子，在此，取τ=0.8，exp()为底数e=2.71828的指数运算操作，

Δ (x, y, t) = 0.5 \times (I_{t, 1}^{R} (x, y) - I_{t - 1,1}^{R} (x, y) - \overset{&OverBar;}{I_{t, 1}^{R} (x, y)} + \overset{&OverBar;}{I_{t - 1,1}^{R} (x, y)}),

表示

中坐标位置为(x,y)的像素点的第1个分量的值即亮度值，表示右视点原始视频中t-1时刻的右视点图像

中坐标位置为(x,y)的像素点的第1个分量的值即亮度值，

表示

中所有像素点的第1个分量的平均值即平均亮度值，

表示

中所有像素点的第1个分量的平均值即平均亮度值。

⑤人类的双目视觉特性表明，人眼会对离自己越近（深度越小）的物体更加感兴趣。因此本发明根据深度感知特性，分别提取出右视点原始视频中每一时刻的右视点图像的深度加权因子集合，对于

的深度加权因子集合，将其记为

η_{t}^{R} (x, y) = \frac{ζ}{γ} \times (1 - \exp (- | \frac{(β_{\max} + δ)}{d_{t}^{R} (x, y)} |)),

其中，

表示中坐标位置为(x,y)的像素点的深度加权因子，

ζ = \frac{4}{3} \times β_{center} + β_{\min},

γ = \frac{3}{2} \times β_{center} + β_{\min},

δ = \frac{1}{2} \times β_{center} + β_{\min},

表示

和

之间的视差图像

中坐标位置为(x,y)的像素点的像素值，β_max表示中的最大视差值，β_min表示中的最小视差值，β_center表示

中的所有像素点的平均视差值，符号“||”为取绝对值符号。

的双目最小可察觉变化图像的时域掩蔽因子

及的深度加权因子

进行结合后获得的

的立体最小可察觉变化图像，将其记为

S_{t}^{R} (x, y) = ρ_{t}^{R} (x, y) \times η_{t}^{R} (x, y) \times J_{t}^{R} (x, y),

其中，

表示

中坐标位置为(x,y)的像素点的像素值。

图8给出了多视点视频序列“Door Flowers”的右视点图像的立体最小可察觉变化图像，图9给出了多视点视频序列“Alt Moabit”的右视点图像的立体最小可察觉变化图像，图10给出了多视点视频序列“Champagne”的右视点图像的立体最小可察觉变化图像，图11给出了多视点视频序列“Dog”的右视点图像的立体最小可察觉变化图像，图12给出了多视点视频序列“Lovebird1”的右视点图像的立体最小可察觉变化图像，图13给出了多视点视频序列“Newspaper”的右视点图像的立体最小可察觉变化图像，从图8至图13中可以看出，由于右视点图像的右边区域部分在左视点图像中没有匹配，在右视点的立体最小可察觉变化图像中会出现遮挡（标记为白色区域），除此之外，所获得的立体最小可察觉变化图像能够很好地反映人眼的视觉敏感度特性。

在此具体实施例中，步骤⑦的具体过程为：

⑦-1、任取一个编码量化参数作为左视点原始视频中所有时刻的左视点图像的基本编码量化参数，并记为QP1。

⑦-2、采用设定的编码预测结构，利用QP1对左视点原始视频中所有时刻的左视点图像的亮度分量Y、第一色度分量U和第二色度分量V分别进行编码，得到左视点码流。

定义为当前右视点图像。

⑦-4、计算当前右视点图像

的立体最小可察觉变化图像

的均值和标准差，分别记为μ₁和σ₁。

⑦-5、将当前右视点图像

及当前右视点图像

的立体最小可察觉变化图像

分别分成个互不重叠的尺寸大小为16×16的子块，将

中当前正在处理的第k个子块定义为当前第一子块，记为

将

的立体最小可察觉变化图像

中当前正在处理的第k个子块定义为当前第二子块，记为

其中，

(x₁,y₁)表示当前第一子块

与当前第二子块

中的像素点的坐标位置，1≤x₁≤16,1≤y₁≤16，表示当前第一子块

中坐标位置为(x₁,y₁)的像素点的第i个分量的值，表示当前第二子块

中坐标位置为(x₁,y₁)的像素点的像素值。

⑦-6、计算当前第二子块

进行编码，ΔQP1∈[0,10]，再执行步骤⑦-9，否则，执行步骤⑦-7。

进行编码，ΔQP2∈[0,10]，然后执行步骤⑦-9，否则，执行步骤⑦-8。

⑦-8、判断μ<μ₁-σ₁是否成立，如果成立，则根据QP1并采用设定的编码预测结构，利用编码量化参数QP1+ΔQP3对当前第一子块进行编码，ΔQP3∈[0,10]。

⑦-9、令k″=k+1，k=k″，将当前右视点图像

的立体最小可察觉变化图像

及当前右视点图像

的立体最小可察觉变化图像

中的所有子块均处理完毕，其中，k″的初始值为0，k″=k+1和k=k″中的“=”为赋值符号。

⑦-10、令t″=t+1，t=t″，将右视点原始视频中下一个待处理的右视点图像作为当前右视点图像，然后返回步骤⑦-4继续执行，直至右视点原始视频中的所有右视点图像处理完毕，得到右视点码流，其中，t″的初始值为0，t″=t+1和t=t″中的“=”为赋值符号。

在本实施例中，通过统计实验对不同的多视点视频序列采用不同的ΔQP1、ΔQP2和ΔQP3进行编码，多视点视频序列“Door Flowers”的ΔQP1、ΔQP2和ΔQP3分别为8、9和10，多视点视频序列“Alt Moabit”的ΔQP1、ΔQP2和ΔQP3分别为6、7和8，多视点视频序列“Champagne”的ΔQP1、ΔQP2和ΔQP3分别为1、2和3，多视点视频序列“Dog”的ΔQP1、ΔQP2和ΔQP3分别为3、4和5，多视点视频序列“Lovebird1”的ΔQP1、ΔQP2和ΔQP3分别为2、3和4，多视点视频序列“Newspaper”的ΔQP1、ΔQP2和ΔQP3分别为3、4和5。

在此具体实施例中，设定的编码预测结构采用公知的HBP编码预测结构。

以下就利用本发明方法对“Door Flowers”、“Alt Moabit”、“Champagne”、“Dog”、“Lovebird1”和Newspaper 体测试集进行立体视频编码的编码性能进行比较。

由于本发明方法只对右视点视频根据其立体最小可察觉变化图像，对不同区域进行不同程度的编码，因此此处只对右视点视频的编码性能进行比较。表1给出了利用本发明方法与传统编码方法的右视点视频编码性能比较，从表1中所列的数据可以看出，对于“Door Flowers”、“Alt Moabit”、“Champagne”、“Dog”、“Lovebird1”和“Newspaper”采用本发明方法处理后，右视点视频的最低的码率节省也能达到17.89%左右，最高的码率节省能达到83.60%左右，足以说明本发明方法是有效可行的。

表1 利用本发明方法与传统编码方法的右视点视频编码性能比较

Claims

1.一种基于视觉感知的立体视频编码方法，其特征在于包括以下步骤：

其中，i＝1,2,3分别表示YUV颜色空间的三个分量，YUV颜色空间的第1个分量为亮度分量并记为Y、第2个分量为第一色度分量并记为U及第3个分量为第二色度分量并记为V，(x,y)表示图像中的像素点的坐标位置，1≤x≤W，1≤y≤H，W表示图像的宽度，H表示图像的高度，表示中坐标位置为(x,y)的像素点的第i个分量的值，