CN112770105A

CN112770105A - 一种基于结构特征的重定位立体图像质量评价方法

Info

Publication number: CN112770105A
Application number: CN202011416906.3A
Authority: CN
Inventors: 邵枫; 王雪津
Original assignee: Ningbo University
Current assignee: Ningbo University
Priority date: 2020-12-07
Filing date: 2020-12-07
Publication date: 2021-05-07
Anticipated expiration: 2040-12-07
Also published as: CN112770105B

Abstract

本发明公开了一种基于结构特征的重定位立体图像质量评价方法，其计算重定位虚拟视点图像的局部信息保持特征、原始虚拟视点图像的前向信息损失、从原始虚拟视点图像中重构的虚拟视点图像的后向信息损失，获得重定位虚拟视点图像的空间结构特征矢量，计算重定位立体图像的左、右视点图像之间的视差图像中的所有各属于匹配区域、属于视觉舒适区域、属于交叉视差区域的像素点的视差幅值特征及所有属于遮挡区域的像素点的相对宽度特征，获得深度结构特征矢量，最终得到重定位立体图像的结构特征矢量；然后利用支持向量回归对所有结构特征矢量进行训练，得到支持向量回归训练模型；优点是提高了客观评价结果与人眼主观感知之间的相关性。

Description

一种基于结构特征的重定位立体图像质量评价方法

技术领域

本发明涉及一种图像质量评价方法，尤其是涉及一种基于结构特征的重定位立体图像质量评价方法。

背景技术

随着具有不同分辨率和屏幕高宽比的智能手机、平板电脑、电视等终端显示设备的应用普及，当需要显示的图像或视频的分辨率与屏幕的分辨率不相符时，如何在尽可能不改变用户观看体验的前提下，改变图像或视频的分辨率使之适应不同尺寸的终端显示设备，这就是适配显示问题。当前典型的适配显示方法有：缩放(scaling)、裁切(cropping)和变形(warping)等。然而，这些适配显示方法没有充分利用终端显示设备的尺寸优势，降低了用户体验效果，因此对不同适配显示方法的性能进行客观评价是十分必要的。

传统的平面重定位方法，如裁剪、均匀缩放等，其在调整图像的分辨率的同时，将图像的重要区域的几何形变和信息损失最小化。然而，立体图像的质量不仅包含图像内容本身，而且过大的双目视差、双目不对称以及双眼调节和辐辏冲突等因素都会严重影响立体图像的观看舒适度。因此，相比于平面重定位方法，立体图像重定位技术需要考虑的几何失真因素更多，这也大大增加了立体图像重定位技术的复杂度。因此，在客观评价过程中如何有效地提取出结构失真信息，使得客观评价结果更加感觉符合人类视觉系统，是在对重定位立体图像进行客观质量评价过程中需要研究解决的问题。

发明内容

本发明所要解决的技术问题是提供一种基于结构特征的重定位立体图像质量评价方法，其能够有效地提高客观评价结果与人眼主观感知之间的相关性。

本发明解决上述技术问题所采用的技术方案为：一种基于结构特征的重定位立体图像质量评价方法，其特征在于包括以下步骤：

步骤一：令S_org表示原始的立体图像，令S_ret表示S_org对应的重定位立体图像；将S_org的左视点图像记为{L_org(x,y)}，将S_org的右视点图像记为{R_org(x,y)}，将S_ret的左视点图像记为{L_ret(x',y)}，将S_ret的右视点图像记为{R_ret(x',y)}；其中，1≤x≤W，1≤y≤H，1≤x'≤W'，W表示S_org的宽度，W'表示S_ret的宽度，H表示S_org和S_ret的高度，L_org(x,y)表示{L_org(x,y)}中坐标位置为(x,y)的像素点的像素值，R_org(x,y)表示{R_org(x,y)}中坐标位置为(x,y)的像素点的像素值，L_ret(x',y)表示{L_ret(x',y)}中坐标位置为(x',y)的像素点的像素值，R_ret(x',y)表示{R_ret(x',y)}中坐标位置为(x',y)的像素点的像素值；

步骤二：根据{L_org(x,y)}与{R_org(x,y)}之间的双向匹配关系，获得S_org的虚拟视点图像，记为{V_org(x,y)}；同样，根据{L_ret(x',y)}与{R_ret(x',y)}之间的双向匹配关系，获得S_ret的虚拟视点图像，记为{V_ret(x',y)}；其中，V_org(x,y)表示{V_org(x,y)}中坐标位置为(x,y)的像素点的像素值，V_ret(x',y)表示{V_ret(x',y)}中坐标位置为(x',y)的像素点的像素值；

步骤三：采用SIFT-Flow方法建立{V_org(x,y)}与{V_ret(x',y)}之间的匹配关系，得到{V_org(x,y)}中的每个像素点的SIFT-Flow向量，将{V_org(x,y)}中坐标位置为(x,y)的像素点的SIFT-Flow向量记为v_o(x,y)，

然后根据{V_org(x,y)}中的所有像素点的SIFT-Flow向量，从{V_org(x,y)}中重构得到虚拟视点图像，记为

将

中坐标位置为

的像素点的像素值记为

再找出

中的所有空洞像素点，并将值0作为

中的每个空洞像素点的像素值；其中，

用于表示水平方向，

用于表示垂直方向，

表示v_o(x,y)的水平偏移量，

表示v_o(x,y)的垂直偏移量，

表示

中坐标位置为(x',y)的像素点的像素值，

中的“＝”为赋值符号；

同样，采用SIFT-Flow方法建立{V_ret(x',y)}与{V_org(x,y)}之间的匹配关系，得到{V_ret(x',y)}中的每个像素点的SIFT-Flow向量，将{V_ret(x',y)}中坐标位置为(x',y)的像素点的SIFT-Flow向量记为v_r(x',y)，

然后根据{V_ret(x',y)}中的所有像素点的SIFT-Flow向量，从{V_ret(x',y)}中重构得到虚拟视点图像，记为

将

中坐标位置为

的像素点的像素值记为

再找出

中的所有空洞像素点，并将值0作为

中的每个空洞像素点的像素值；其中，

表示v_r(x',y)的水平偏移量，

表示v_r(x',y)的垂直偏移量，

表示

中坐标位置为(x,y)的像素点的像素值，

中的“＝”为赋值符号；

步骤四：采用超像素分割技术将{V_org(x,y)}分割成Num个互不重叠的六边形网格，将{V_org(x,y)}中的第h个六边形网格构成的区域记为SP_org,h，SP_org,h以其6个网格顶点构成的集合来描述，

其中，Num≥1，1≤h≤Num，

对应表示SP_org,h的第1个网格顶点、第2个网格顶点、第3个网格顶点、第4个网格顶点、第5个网格顶点、第6个网格顶点，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

然后根据{V_org(x,y)}中的每个六边形网格构成的区域的6个网格顶点的SIFT-Flow向量，确定{V_org(x,y)}中的每个六边形网格在{V_ret(x',y)}中匹配的六边形网格，将{V_org(x,y)}中的第h个六边形网格在{V_ret(x',y)}中匹配的六边形网格构成的区域记为SP_ret,h，SP_ret,h以其6个网格顶点构成的集合来描述，

其中，

对应表示SP_ret,h的第1个网格顶点、第2个网格顶点、第3个网格顶点、第4个网格顶点、第5个网格顶点、第6个网格顶点，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量；

步骤五：采用基于图论的视觉显著模型提取出{V_org(x,y)}的显著图，记为{Z_org(x,y)}；其中，Z_org(x,y)表示{Z_org(x,y)}中坐标位置为(x,y)的像素点的像素值；

然后根据{Z_org(x,y)}和{V_org(x,y)}中的所有像素点的SIFT-Flow向量，从{Z_org(x,y)}中重构得到{V_ret(x',y)}的显著图，记为{Z_ret(x',y)}，将{Z_ret(x',y)}中坐标位置为

的像素点的像素值记为

其中，Z_ret(x',y)表示{Z_ret(x',y)}中坐标位置为(x',y)的像素点的像素值，

中的“＝”为赋值符号；

步骤六：根据{Z_org(x,y)}提取出{V_org(x,y)}的重要性区域掩码图，并根据{Z_ret(x',y)}提取出{V_ret(x',y)}的重要性区域掩码图；然后根据两幅重要性区域掩码图，计算{V_org(x,y)}中的每个六边形网格在{V_ret(x',y)}中匹配的六边形网格构成的区域的局部信息保持特征，进而计算{V_ret(x',y)}的局部信息保持特征；通过计算{V_ret(x',y)}和

各自中的所有像素点的亮度分量的直方图，计算{V_org(x,y)}的前向信息损失；并通过计算{V_org(x,y)}和

各自中的所有像素点的亮度分量的直方图，计算

的后向信息损失；再根据{V_ret(x',y)}的局部信息保持特征、{V_org(x,y)}的前向信息损失、

的后向信息损失，获得{V_ret(x',y)}的空间结构特征矢量，记为F_G；其中，F_G的维数为1×3；

步骤七：根据{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像，计算{L_ret(x',y)}中的每个像素点的深度值；然后根据{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像，计算{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像中的所有属于匹配区域的像素点的视差幅值特征和所有属于遮挡区域的像素点的相对宽度特征；并根据{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像及{L_ret(x',y)}中的所有像素点的深度值，计算{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像中的所有属于匹配区域中的视觉舒适区域的像素点的视差幅值特征和所有属于匹配区域中的交叉视差区域的像素点的视差幅值特征；再根据{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像中的所有属于匹配区域的像素点的视差幅值特征、所有属于匹配区域中的视觉舒适区域的像素点的视差幅值特征、所有属于匹配区域中的交叉视差区域的像素点的视差幅值特征、所有属于遮挡区域的像素点的相对宽度特征，获得{V_ret(x',y)}的深度结构特征矢量，记为F_D；其中，F_D的维数为1×4；

步骤八：根据F_G和F_D，获取S_ret的结构特征矢量，记为F，F＝[F_G,F_D]；其中，F的维数为1×7，[F_G,F_D]表示将F_G和F_D连接起来形成一个特征矢量；

步骤九：将n'幅原始的立体图像对应的共n幅重定位立体图像构成重定位立体图像集合；然后采用主观质量评价方法，获取重定位立体图像集合中的每幅重定位立体图像的平均主观评分差值，将重定位立体图像集合中的第j幅重定位立体图像的平均主观评分差值记为DMOS_j；并按照步骤一至步骤八的过程，以相同的方式获取重定位立体图像集合中的每幅重定位立体图像的结构特征矢量，将重定位立体图像集合中的第j幅重定位立体图像的结构特征矢量记为F_j；其中，n'为正整数，n'＞1，n为正整数，n≥n'，j为正整数，1≤j≤n，DMOS_j∈[0,100]，F_j的维数为1×7；

步骤十：从重定位立体图像集合中随机选择m幅重定位立体图像构成训练集，将重定位立体图像集合中剩余的n-m幅重定位立体图像构成测试集；然后将训练集中的所有重定位立体图像的结构特征矢量和平均主观评分差值构成训练样本数据集合；接着采用支持向量回归作为机器学习的方法，对训练样本数据集合中的所有结构特征矢量进行训练，使得经过训练得到的回归函数值与平均主观评分差值之间的误差最小，拟合得到最优的权重矢量

和最优的偏置项

再利用得到的最优的权重矢量

和最优的偏置项

构造重定位立体图像的支持向量回归训练模型，记为s(F_inp)，

其中，m为正整数，1≤m＜n，s()为函数表示形式，F_inp表示重定位立体图像的支持向量回归训练模型的输入矢量，为重定位立体图像的结构特征矢量，F_inp的维数为1×7，

为

的转置，

表示重定位立体图像的支持向量回归训练模型的输入矢量F_inp的线性函数；

步骤十一：将测试集中的所有重定位立体图像的结构特征矢量构成测试样本数据集合；然后根据构造得到的重定位立体图像的支持向量回归训练模型，对测试样本数据集合中的每个结构特征矢量进行测试，预测得到测试样本数据集合中的每个结构特征矢量对应的重定位立体图像的客观质量评价预测值，将测试样本数据集合中的第η个结构特征矢量对应的重定位立体图像的客观质量评价预测值记为Q_η，Q_η＝s(F_η)，

其中，η为正整数，1≤η≤n-m，F_η表示测试样本数据集合中的第η个结构特征矢量，F_η的维数为1×7，

表示F_η的线性函数；

步骤十二：重复执行步骤十至步骤十一共Number次，并使重定位立体图像集合中的每幅重定位立体图像至少有一次属于测试集，经过Number次执行后计算重定位立体图像集合中的每幅重定位立体图像的若干个客观质量评价预测值的平均值，再将重定位立体图像集合中的每幅重定位立体图像的若干个客观质量评价预测值的平均值作为该幅重定位立体图像的最终的客观质量评价预测值；其中，Number为正整数，Number≥100。

所述的步骤二中，{V_org(x,y)}的获取过程为：

步骤A1：采用SIFT-Flow方法建立{L_org(x,y)}与{R_org(x,y)}之间的匹配关系，得到{L_org(x,y)}中的每个像素点的SIFT-Flow向量，将{L_org(x,y)}中坐标位置为(x,y)的像素点的SIFT-Flow向量记为

其中，

用于表示水平方向，

用于表示垂直方向，

表示

的水平偏移量，

表示

的垂直偏移量；

步骤A2：采用SIFT-Flow方法建立{R_org(x,y)}与{L_org(x,y)}之间的匹配关系，得到{R_org(x,y)}中的每个像素点的SIFT-Flow向量，将{R_org(x,y)}中坐标位置为(x,y)的像素点的SIFT-Flow向量记为

其中，

表示

的水平偏移量，

表示

的垂直偏移量；

步骤A3：根据{L_org(x,y)}中的所有像素点的SIFT-Flow向量和{R_org(x,y)}中的所有像素点的SIFT-Flow向量，获得S_org的虚拟视点图像{V_org(x,y)}，

其中，

表示{R_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{R_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{L_org(x,y)}中坐标位置为

的像素点的像素值，

表示{R_org(x,y)}中坐标位置为

的像素点的像素值；

所述的步骤二中，{V_ret(x',y)}的获取过程为：

步骤B1：采用SIFT-Flow方法建立{L_ret(x',y)}与{R_ret(x',y)}之间的匹配关系，得到{L_ret(x',y)}中的每个像素点的SIFT-Flow向量，将{L_ret(x',y)}中坐标位置为(x',y)的像素点的SIFT-Flow向量记为

其中，

用于表示水平方向，

用于表示垂直方向，

表示

的水平偏移量，

表示

的垂直偏移量；

步骤B2：采用SIFT-Flow方法建立{R_ret(x',y)}与{L_ret(x',y)}之间的匹配关系，得到{R_ret(x',y)}中的每个像素点的SIFT-Flow向量，将{R_ret(x',y)}中坐标位置为(x',y)的像素点的SIFT-Flow向量记为

其中，

表示

的水平偏移量，

表示

的垂直偏移量；

步骤B3：根据{L_ret(x',y)}中的所有像素点的SIFT-Flow向量和{R_ret(x',y)}中的所有像素点的SIFT-Flow向量，获得S_ret的虚拟视点图像{V_ret(x',y)}，

其中，

表示{R_ret(x',y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{R_ret(x',y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{L_ret(x',y)}中坐标位置为

的像素点的像素值，

表示{R_ret(x',y)}中坐标位置为

的像素点的像素值。

所述的步骤六中，F_G的获取过程为：

步骤C1：根据{Z_org(x,y)}提取出{V_org(x,y)}的重要性区域掩码图，记为{B_org(x,y)}，将{B_org(x,y)}中坐标位置为(x,y)的像素点的像素值记为B_org(x,y)，

并根据{Z_ret(x',y)}提取出{V_ret(x',y)}的重要性区域掩码图，记为{B_ret(x',y)}，将{B_ret(x',y)}中坐标位置为(x',y)的像素点的像素值记为B_ret(x',y)，

其中，th表示阈值；

步骤C2：根据{B_org(x,y)}和{B_ret(x',y)}，计算{V_org(x,y)}中的每个六边形网格在{V_ret(x',y)}中匹配的六边形网格构成的区域的局部信息保持特征，将SP_ret,h的局部信息保持特征记为g_h，

其中，

表示计算{B_org(x,y)}中与SP_org,h对应的区域中像素值为1的所有像素点占该区域的面积大小，

表示计算{B_ret(x',y)}中与SP_ret,h对应的区域中像素值为1的所有像素点占该区域的面积大小，C为控制参数；

步骤C3：计算{V_ret(x',y)}的局部信息保持特征，记为f₁，

步骤C4：计算{V_org(x,y)}中的所有像素点的亮度分量的直方图，记为q_org；同样，计算

中的所有像素点的亮度分量的直方图，记为

计算{V_ret(x',y)}中的所有像素点的亮度分量的直方图，记为q_ret；同样，计算

中的所有像素点的亮度分量的直方图，记为

其中，q_org、

q_ret和

的维数均为1×256；

步骤C5：计算{V_org(x,y)}的前向信息损失，记为f₂，

并计算

的后向信息损失，记为f₃，

其中，χ()为求卡方距离函数；

步骤C6：根据f₁、f₂和f₃，获得{V_ret(x',y)}的空间结构特征矢量F_G，F_G＝[f₁,f₂,f₃]；其中，F_G的维数为1×3，[f₁,f₂,f₃]表示将f₁、f₂和f₃连接起来形成一个特征矢量。

所述的步骤七中，F_D的获取过程为：

步骤D1：计算{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像，记为{d_L(x',y)}，将{d_L(x',y)}中坐标位置为(x',y)的像素点的像素值记为d_L(x',y)，如果{L_ret(x',y)}中坐标位置为(x',y)的像素点在{R_ret(x',y)}中能找到匹配的像素点，则将{d_L(x',y)}中坐标位置为(x',y)的像素点定义为匹配像素点，并令d_L(x',y)＝x'^*-x'；如果{L_ret(x',y)}中坐标位置为(x',y)的像素点在{R_ret(x',y)}中不能找到匹配的像素点，则将{d_L(x',y)}中坐标位置为(x',y)的像素点定义为遮挡像素点，并令d_L(x',y)＝255；再将{d_L(x',y)}中的所有匹配像素点构成匹配区域，将{d_L(x',y)}中的所有遮挡像素点构成遮挡区域；其中，x'^*表示{L_ret(x',y)}中坐标位置为(x',y)的像素点在{R_ret(x',y)}中找到的匹配的像素点的横坐标；

步骤D2：根据{d_L(x',y)}，计算{L_ret(x',y)}中的每个像素点的深度值，将{L_ret(x',y)}中坐标位置为(x',y)的像素点的深度值记为depth_L(x',y)，

其中，e表示待处理的立体图像的左视点与右视点之间的水平基线距离，J表示待处理的立体图像的左视点和右视点与显示器之间的观看距离，W_display表示显示器的水平宽度，R_display表示显示器的水平分辨率；

步骤D3：计算{d_L(x',y)}中的所有属于匹配区域的像素点的视差幅值特征，记为f₄，

其中，符号“||”为取绝对值符号，

步骤D4：计算{d_L(x',y)}中的所有属于匹配区域中的视觉舒适区域的像素点的视差幅值特征，记为f₅，

其中，匹配区域中的视觉舒适区域满足条件

CVZ_min表示最小舒适观看区域范围，

η₁表示最小舒适观看视角，CVZ_max表示最大舒适观看区域范围，

η₂表示最大舒适观看视角；

步骤D5：计算{d_L(x',y)}中的所有属于匹配区域中的交叉视差区域的像素点的视差幅值特征，记为f₆，

其中，匹配区域中的交叉视差区域满足条件

步骤D6：计算{d_L(x',y)}中的所有属于遮挡区域的像素点的相对宽度特征，记为f₇，

其中，

步骤D7：根据f₄、f₅、f₆和f₇，获得{V_ret(x',y)}的深度结构特征矢量F_D，F_D＝[f₄,f₅,f₆,f₇]；其中，F_D的维数为1×4，[f₄,f₅,f₆,f₇]表示将f₄、f₅、f₆和f₇连接起来形成一个特征矢量。

与现有技术相比，本发明的优点在于：

本发明方法考虑了结构失真对立体图像重定位的影响，通过从原始的立体图像和重定位立体图像中获得对应的虚拟视点图像，计算重定位的虚拟视点图像的局部信息保持特征、原始的虚拟视点图像的前向信息损失、从原始的虚拟视点图像中重构得到的虚拟视点图像的后向信息损失，获得重定位的虚拟视点图像的空间结构特征矢量，计算重定位立体图像的左视点图像与右视点图像之间的视差图像中的所有属于匹配区域的像素点的视差幅值特征、所有属于匹配区域中的视觉舒适区域的像素点的视差幅值特征、所有属于匹配区域中的交叉视差区域的像素点的视差幅值特征和所有属于遮挡区域的像素点的相对宽度特征，获得重定位的虚拟视点图像的深度结构特征矢量，最终得到重定位立体图像的结构特征矢量；然后在训练阶段利用支持向量回归对训练样本数据集合中的所有结构特征矢量进行训练，构造得到支持向量回归训练模型；在测试阶段利用构造的支持向量回归训练模型，预测得到测试样本数据集合中的每个结构特征矢量对应的重定位立体图像的客观质量评价预测值，由于获得的结构特征矢量具有较强的稳定性且能够较好地反映重定位立体图像的结构失真情况，因此有效地提高了客观评价结果与人眼主观感知之间的相关性。

附图说明

图1为本发明方法的总体实现框图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种基于结构特征的重定位立体图像质量评价方法，其总体实现框图如图1所示，其包括以下步骤：

步骤一：令S_org表示原始的立体图像，令S_ret表示S_org对应的重定位立体图像；将S_org的左视点图像记为{L_org(x,y)}，将S_org的右视点图像记为{R_org(x,y)}，将S_ret的左视点图像记为{L_ret(x',y)}，将S_ret的右视点图像记为{R_ret(x',y)}；其中，1≤x≤W，1≤y≤H，1≤x'≤W'，W表示S_org的宽度，W'表示S_ret的宽度，H表示S_org和S_ret的高度，L_org(x,y)表示{L_org(x,y)}中坐标位置为(x,y)的像素点的像素值，R_org(x,y)表示{R_org(x,y)}中坐标位置为(x,y)的像素点的像素值，L_ret(x',y)表示{L_ret(x',y)}中坐标位置为(x',y)的像素点的像素值，R_ret(x',y)表示{R_ret(x',y)}中坐标位置为(x',y)的像素点的像素值。

步骤二：根据{L_org(x,y)}与{R_org(x,y)}之间的双向匹配关系，获得S_org的虚拟视点图像，记为{V_org(x,y)}；同样，根据{L_ret(x',y)}与{R_ret(x',y)}之间的双向匹配关系，获得S_ret的虚拟视点图像，记为{V_ret(x',y)}；其中，V_org(x,y)表示{V_org(x,y)}中坐标位置为(x,y)的像素点的像素值，V_ret(x',y)表示{V_ret(x',y)}中坐标位置为(x',y)的像素点的像素值。

在此具体实施例中，步骤二中，{V_org(x,y)}的获取过程为：

步骤A1：采用现有的SIFT-Flow方法建立{L_org(x,y)}与{R_org(x,y)}之间的匹配关系，得到{L_org(x,y)}中的每个像素点的SIFT-Flow向量，将{L_org(x,y)}中坐标位置为(x,y)的像素点的SIFT-Flow向量记为

其中，

用于表示水平方向，

用于表示垂直方向，

表示

的水平偏移量，

表示

的垂直偏移量。

步骤A2：采用现有的SIFT-Flow方法建立{R_org(x,y)}与{L_org(x,y)}之间的匹配关系，得到{R_org(x,y)}中的每个像素点的SIFT-Flow向量，将{R_org(x,y)}中坐标位置为(x,y)的像素点的SIFT-Flow向量记为

其中，

表示

的水平偏移量，

表示

的垂直偏移量。

其中，

表示{R_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{R_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{L_org(x,y)}中坐标位置为

的像素点的像素值，

表示{R_org(x,y)}中坐标位置为

的像素点的像素值。

在此具体实施例中，步骤二中，{V_ret(x',y)}的获取过程为：

步骤B1：采用现有的SIFT-Flow方法建立{L_ret(x',y)}与{R_ret(x',y)}之间的匹配关系，得到{L_ret(x',y)}中的每个像素点的SIFT-Flow向量，将{L_ret(x',y)}中坐标位置为(x',y)的像素点的SIFT-Flow向量记为

其中，

用于表示水平方向，

用于表示垂直方向，

表示

的水平偏移量，

表示

的垂直偏移量。

步骤B2：采用现有的SIFT-Flow方法建立{R_ret(x',y)}与{L_ret(x',y)}之间的匹配关系，得到{R_ret(x',y)}中的每个像素点的SIFT-Flow向量，将{R_ret(x',y)}中坐标位置为(x',y)的像素点的SIFT-Flow向量记为

其中，

表示

的水平偏移量，

表示

的垂直偏移量。

其中，

表示{R_ret(x',y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{R_ret(x',y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{L_ret(x',y)}中坐标位置为

的像素点的像素值，

表示{R_ret(x',y)}中坐标位置为

的像素点的像素值。

步骤三：采用现有的SIFT-Flow方法建立{V_org(x,y)}与{V_ret(x',y)}之间的匹配关系，得到{V_org(x,y)}中的每个像素点的SIFT-Flow向量，将{V_org(x,y)}中坐标位置为(x,y)的像素点的SIFT-Flow向量记为v_o(x,y)，

将

中坐标位置为

的像素点的像素值记为

再找出

中的所有空洞像素点，并将值0作为

中的每个空洞像素点的像素值；其中，

用于表示水平方向，

用于表示垂直方向，

表示v_o(x,y)的水平偏移量，

表示v_o(x,y)的垂直偏移量，

表示

中坐标位置为(x',y)的像素点的像素值，

中的“＝”为赋值符号。

同样，采用现有的SIFT-Flow方法建立{V_ret(x',y)}与{V_org(x,y)}之间的匹配关系，得到{V_ret(x',y)}中的每个像素点的SIFT-Flow向量，将{V_ret(x',y)}中坐标位置为(x',y)的像素点的SIFT-Flow向量记为v_r(x',y)，

将

中坐标位置为

的像素点的像素值记为

再找出

中的所有空洞像素点，并将值0作为

中的每个空洞像素点的像素值；其中，

表示v_r(x',y)的水平偏移量，

表示v_r(x',y)的垂直偏移量，

表示

中坐标位置为(x,y)的像素点的像素值，

中的“＝”为赋值符号。

步骤四：采用现有的超像素分割技术将{V_org(x,y)}分割成Num个互不重叠的六边形网格，将{V_org(x,y)}中的第h个六边形网格构成的区域记为SP_org,h，可将{V_org(x,y)}表示为Num个区域的集合，记为{SP_org,h|1≤h≤Num}，SP_org,h以其6个网格顶点构成的集合来描述，

其中，Num≥1，在本实施例中取Num＝400，1≤h≤Num，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

然后根据{V_org(x,y)}中的每个六边形网格构成的区域的6个网格顶点的SIFT-Flow向量，确定{V_org(x,y)}中的每个六边形网格在{V_ret(x',y)}中匹配的六边形网格，将{V_org(x,y)}中的第h个六边形网格在{V_ret(x',y)}中匹配的六边形网格构成的区域记为SP_ret,h，可将{V_ret(x',y)}表示为Num个区域的集合，记为{SP_ret,h|1≤h≤Num}，SP_ret,h以其6个网格顶点构成的集合来描述，

其中，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量。

步骤五：采用现有的基于图论的视觉显著(Graph-Based Visual Saliency，GBVS)模型提取出{V_org(x,y)}的显著图，记为{Z_org(x,y)}；其中，Z_org(x,y)表示{Z_org(x,y)}中坐标位置为(x,y)的像素点的像素值。

的像素点的像素值记为

中的“＝”为赋值符号。

各自中的所有像素点的亮度分量的直方图，计算

的后向信息损失，获得{V_ret(x',y)}的空间结构特征矢量，记为F_G；其中，F_G的维数为1×3。

在此具体实施例中，步骤六中，F_G的获取过程为：

其中，th表示阈值，在本实施例中取th＝0.25。

其中，

表示计算{B_ret(x',y)}中与SP_ret,h对应的区域中像素值为1的所有像素点占该区域的面积大小，C为控制参数，在本实施例中取C＝10^-6。

步骤C3：计算{V_ret(x',y)}的局部信息保持特征，记为f₁，

中的所有像素点的亮度分量的直方图，记为

中的所有像素点的亮度分量的直方图，记为

其中，q_org、

q_ret和

的维数均为1×256。

步骤C5：计算{V_org(x,y)}的前向信息损失，记为f₂，

并计算

的后向信息损失，记为f₃，

其中，χ()为求卡方距离(Chi-distance measure)函数。

步骤七：根据{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像，计算{L_ret(x',y)}中的每个像素点的深度值；然后根据{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像，计算{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像中的所有属于匹配区域的像素点的视差幅值特征和所有属于遮挡区域的像素点的相对宽度特征；并根据{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像及{L_ret(x',y)}中的所有像素点的深度值，计算{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像中的所有属于匹配区域中的视觉舒适区域的像素点的视差幅值特征和所有属于匹配区域中的交叉视差区域的像素点的视差幅值特征；再根据{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像中的所有属于匹配区域的像素点的视差幅值特征、所有属于匹配区域中的视觉舒适区域的像素点的视差幅值特征、所有属于匹配区域中的交叉视差区域的像素点的视差幅值特征、所有属于遮挡区域的像素点的相对宽度特征，获得{V_ret(x',y)}的深度结构特征矢量，记为F_D；其中，F_D的维数为1×4。

在此具体实施例中，步骤七中，F_D的获取过程为：

步骤D1：计算{L_ret(x',y)}与{R_ret(x',y)}之间的视差图像，记为{d_L(x',y)}，将{d_L(x',y)}中坐标位置为(x',y)的像素点的像素值记为d_L(x',y)，如果{L_ret(x',y)}中坐标位置为(x',y)的像素点在{R_ret(x',y)}中能找到匹配的像素点，则将{d_L(x',y)}中坐标位置为(x',y)的像素点定义为匹配像素点，并令d_L(x',y)＝x'^*-x'；如果{L_ret(x',y)}中坐标位置为(x',y)的像素点在{R_ret(x',y)}中不能找到匹配的像素点，则将{d_L(x',y)}中坐标位置为(x',y)的像素点定义为遮挡像素点，并令d_L(x',y)＝255；再将{d_L(x',y)}中的所有匹配像素点构成匹配区域，将{d_L(x',y)}中的所有遮挡像素点构成遮挡区域；其中，x'^*表示{L_ret(x',y)}中坐标位置为(x',y)的像素点在{R_ret(x',y)}中找到的匹配的像素点的横坐标。

其中，e表示待处理的立体图像的左视点与右视点之间的水平基线距离，J表示待处理的立体图像的左视点和右视点与显示器之间的观看距离，W_display表示显示器的水平宽度，R_display表示显示器的水平分辨率，在本实施例中的e、J、W_display和R_display的值根据具体的立体图像和观看条件确定。

其中，符号“||”为取绝对值符号，

其中，匹配区域中的视觉舒适区域满足条件

CVZ_min表示最小舒适观看区域范围，

η₁表示最小舒适观看视角，在本实施例中取η₁＝-1°，CVZ_max表示最大舒适观看区域范围，

η₂表示最大舒适观看视角，在本实施例中取η₂＝1°。

其中，匹配区域中的交叉视差区域满足条件

其中，

步骤八：根据F_G和F_D，获取S_ret的结构特征矢量，记为F，F＝[F_G,F_D]；其中，F的维数为1×7，[F_G,F_D]表示将F_G和F_D连接起来形成一个特征矢量。

步骤九：将n'幅原始的立体图像对应的共n幅重定位立体图像构成重定位立体图像集合；然后采用现有的主观质量评价方法，获取重定位立体图像集合中的每幅重定位立体图像的平均主观评分差值，将重定位立体图像集合中的第j幅重定位立体图像的平均主观评分差值记为DMOS_j；并按照步骤一至步骤八的过程，以相同的方式获取重定位立体图像集合中的每幅重定位立体图像的结构特征矢量，将重定位立体图像集合中的第j幅重定位立体图像的结构特征矢量记为F_j；其中，n'为正整数，n'＞1，如取n'＝45，n为正整数，n≥n'，如取n＝720，j为正整数，1≤j≤n，DMOS_j∈[0,100]，F_j的维数为1×7。

和最优的偏置项

再利用得到的最优的权重矢量

和最优的偏置项

为

的转置，

表示重定位立体图像的支持向量回归训练模型的输入矢量F_inp的线性函数。

表示F_η的线性函数。

为了进一步说明本发明方法的可行性和有效性，对本发明方法进行试验。

在本实施例中，采用本发明方法对宁波大学建立的重定位立体图像数据库进行测试，该重定位立体图像数据库包含45幅原始的立体图像，采用8种不同重定位方法对每幅原始的立体图像进行50％和75％两种比例的重定位操作，这样该重定位立体图像数据库共有720幅重定位立体图像，并给出了每幅重定位立体图像的平均主观评分差值。这里，利用评估图像质量评价方法的3个常用客观参量作为客观评价结果的评价指标，即非线性回归条件下的Pearson相关系数(Pearson linear correlation coefficient，PLCC)、Spearman相关系数(Spearman rank order correlation coefficient，SROCC)、均方误差(root meansquared error，RMSE)，PLCC和RMSE反映重定位立体图像的客观评价结果的准确性，SROCC反映其单调性。

将采用本发明方法计算得到的720幅重定位立体图像各自的最终的客观质量评价预测值做五参数Logistic函数非线性拟合，PLCC和SROCC值越高、RMSE值越小说明客观评价结果与平均主观评分差值之间的相关性越好。表1给出了采用本发明方法得到的最终的客观质量评价预测值与平均主观评分差值之间的相关性。

表1采用本发明方法得到的最终的客观质量评价预测值与平均主观评分差值之间的相关性

方法	PLCC	SROCC	RMSE
				本发明方法	0.8076	0.7986	8.7806

从表1中可以看出，采用本发明方法得到的最终的客观质量评价预测值与平均主观评分差值之间的相关性是很高的，表明客观评价结果与人眼主观感知的结果较为一致，足以说明本发明方法的有效性。

Claims

1.一种基于结构特征的重定位立体图像质量评价方法，其特征在于包括以下步骤：

将

中坐标位置为

的像素点的像素值记为

再找出

中的所有空洞像素点，并将值0作为

中的每个空洞像素点的像素值；其中，

用于表示水平方向，

用于表示垂直方向，

表示v_o(x,y)的水平偏移量，

表示v_o(x,y)的垂直偏移量，

表示

中坐标位置为(x',y)的像素点的像素值，

中的“＝”为赋值符号；

将

中坐标位置为

的像素点的像素值记为

再找出

中的所有空洞像素点，并将值0作为

中的每个空洞像素点的像素值；其中，

表示v_r(x',y)的水平偏移量，

表示v_r(x',y)的垂直偏移量，

表示

中坐标位置为(x,y)的像素点的像素值，

中的“＝”为赋值符号；

其中，Num≥1，1≤h≤Num，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

其中，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

以

的水平坐标位置

和垂直坐标位置

来描述，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{V_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量；

的像素点的像素值记为

中的“＝”为赋值符号；

各自中的所有像素点的亮度分量的直方图，计算

和最优的偏置项

再利用得到的最优的权重矢量

和最优的偏置项

为

的转置，

表示F_η的线性函数；

2.根据权利要求1所述的一种基于结构特征的重定位立体图像质量评价方法，其特征在于所述的步骤二中，{V_org(x,y)}的获取过程为：

其中，

用于表示水平方向，

用于表示垂直方向，

表示

的水平偏移量，

表示

的垂直偏移量；

其中，

表示

的水平偏移量，

表示

的垂直偏移量；

其中，

表示{R_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{R_org(x,y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{L_org(x,y)}中坐标位置为

的像素点的像素值，

表示{R_org(x,y)}中坐标位置为

的像素点的像素值；

所述的步骤二中，{V_ret(x',y)}的获取过程为：

其中，

用于表示水平方向，

用于表示垂直方向，

表示

的水平偏移量，

表示

的垂直偏移量；

其中，

表示

的水平偏移量，

表示

的垂直偏移量；

其中，

表示{R_ret(x',y)}中坐标位置为

的像素点的SIFT-Flow向量

的水平偏移量，

表示{R_ret(x',y)}中坐标位置为

的像素点的SIFT-Flow向量

的垂直偏移量，

表示{L_ret(x',y)}中坐标位置为

的像素点的像素值，

表示{R_ret(x',y)}中坐标位置为

的像素点的像素值。

3.根据权利要求1或2所述的一种基于结构特征的重定位立体图像质量评价方法，其特征在于所述的步骤六中，F_G的获取过程为：

其中，th表示阈值；

其中，

步骤C3：计算{V_ret(x',y)}的局部信息保持特征，记为f₁，

中的所有像素点的亮度分量的直方图，记为

中的所有像素点的亮度分量的直方图，记为

其中，q_org、

q_ret和

的维数均为1×256；

步骤C5：计算{V_org(x,y)}的前向信息损失，记为f₂，

并计算

的后向信息损失，记为f₃，

其中，χ()为求卡方距离函数；

4.根据权利要求3所述的一种基于结构特征的重定位立体图像质量评价方法，其特征在于所述的步骤七中，F_D的获取过程为：

其中，符号“||”为取绝对值符号，

其中，匹配区域中的视觉舒适区域满足条件

CVZ_min表示最小舒适观看区域范围，

η₂表示最大舒适观看视角；

其中，匹配区域中的交叉视差区域满足条件

其中，