CN103200420B

CN103200420B - 一种基于三维视觉注意力的立体图像质量客观评价方法

Info

Publication number: CN103200420B
Application number: CN201310088062.8A
Authority: CN
Inventors: 邵枫; 段芬芳; 蒋刚毅; 郁梅; 李福翠; 彭宗举
Original assignee: Ningbo University
Current assignee: Shenzhen Dianwei Culture Communication Co ltd
Priority date: 2013-03-19
Filing date: 2013-03-19
Publication date: 2015-03-25
Anticipated expiration: 2033-03-19
Also published as: CN103200420A

Abstract

本发明公开了一种基于三维视觉注意力的立体图像质量客观评价方法，其首先分别计算原始的无失真的立体图像的独眼图和待评价的失真的立体图像的独眼图，然后计算两个独眼图的显著图及原始的无失真的立体图像的独眼图的中心偏移图、前景图和背景图，再获取三维视觉注意力图像，并对待评价的失真的立体图像的独眼图中的每个像素点的客观评价度量值进行融合，得到待评价的失真的立体图像的图像质量客观评价预测值，优点是获得的三维视觉注意力图像能够较好地反映空间立体视觉信息对注意的影响，使得客观评价结果能更符合人类视觉，从而有效地提高了客观评价结果与主观感知的相关性。

Description

一种基于三维视觉注意力的立体图像质量客观评价方法

技术领域

本发明涉及一种图像质量评价方法，尤其是涉及一种基于三维视觉注意力的立体图像质量客观评价方法。

背景技术

随着图像编码技术和立体显示技术的迅速发展，立体图像技术受到了越来越广泛的关注与应用，已成为当前的一个研究热点。立体图像技术利用人眼的双目视差原理，双目各自独立地接收来自同一场景的左右视点图像，通过大脑融合形成双目视差，从而欣赏到具有深度感和逼真感的立体图像。由于受到采集系统、存储压缩及传输设备的影响，立体图像会不可避免地引入一系列的失真，而与单通道图像相比，立体图像需要同时保证两个通道的图像质量，因此对其进行质量评价具有非常重要的意义。然而，目前对立体图像质量进行评价缺乏有效的客观评价方法。因此，研究有效的立体图像质量客观评价方法具有十分重要的意义。

目前的立体图像质量客观评价方法是直接将平面图像质量评价方法应用于评价立体图像质量，然而，人眼感知立体图像产生立体视觉的过程并不是简单的左右视点图像叠加的过程，因此，立体视觉特征（例如，三维视觉注意力）并不是平面视觉特性的简单拓展，如何在立体图像质量评价过程中有效地提取出立体视觉特征对评价结果进行融合，使得客观评价结果更加感觉符合人类视觉系统，都是在对立体图像进行客观质量评价过程中需要研究解决的问题。

发明内容

本发明所要解决的技术问题是提供一种能够有效地提高客观评价结果与主观感知的相关性的基于三维视觉注意力的立体图像质量客观评价方法。

本发明解决上述技术问题所采用的技术方案为：一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于它的处理过程为：

首先，根据原始的无失真的立体图像的左视点图像和右视点图像中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，及原始的无失真的立体图像的左视点图像与右视点图像之间的视差图像，获得原始的无失真的立体图像的独眼图；根据待评价的失真的立体图像的左视点图像和右视点图像中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，及原始的无失真的立体图像的左视点图像与右视点图像之间的视差图像，获得待评价的失真的立体图像的独眼图；

其次，根据原始的无失真的立体图像的独眼图的振幅和相位，获得对应的显著图；根据待评价的失真的立体图像的独眼图的振幅和相位，获得对应的显著图；

接着，根据人眼的中心偏移特性，获得原始的无失真的立体图像的独眼图的中心偏移图；并根据原始的无失真的立体图像的左视点图像与右视点图像之间的视差图像，获得原始的无失真的立体图像的独眼图的前景图和背景图；

然后，根据两个显著图、中心偏移图、前景图和背景图，得到对应的三维视觉注意力图像，之后对待评价的失真的立体图像的独眼图中的每个像素点的客观评价度量值进行融合，得到待评价的失真的立体图像的图像质量客观评价预测值；

最后，按照上述处理过程获取多幅不同失真类型不同失真程度的失真的立体图像的图像质量客观评价预测值。

上述的基于三维视觉注意力的立体图像质量客观评价方法包括以下步骤：

①令S_org为原始的无失真的立体图像，令S_dis为待评价的失真的立体图像，将S_org的左视点图像记为{L_org(x,y)}，将S_org的右视点图像记为{R_org(x,y)}，将S_dis的左视点图像记为{L_dis(x,y)}，将S_dis的右视点图像记为{R_dis(x,y)}，其中，此处(x,y)表示左视点图像和右视点图像中的像素点的坐标位置，1≤x≤W，1≤y≤H，W表示左视点图像和右视点图像的宽度，H表示左视点图像和右视点图像的高度，L_org(x,y)表示{L_org(x,y)}中坐标位置为(x,y)的像素点的像素值，R_org(x,y)表示{R_org(x,y)}中坐标位置为(x,y)的像素点的像素值，L_dis(x,y)表示{L_dis(x,y)}中坐标位置为(x,y)的像素点的像素值，R_dis(x,y)表示{R_dis(x,y)}中坐标位置为(x,y)的像素点的像素值；

②根据{L_org(x,y)}、{R_org(x,y)}、{L_dis(x,y)}、{R_dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，对应获取{L_org(x,y)}、{R_org(x,y)}、{L_dis(x,y)}、{R_dis(x,y)}中的每个像素点的振幅，然后根据{L_org(x,y)}和{R_org(x,y)}中的每个像素点的振幅及{L_org(x,y)}与{R_org(x,y)}之间的视差图像中的每个像素点的像素值，计算S_org的独眼图，记为{CM_org(x,y)}，并根据{L_dis(x,y)}和{R_dis(x,y)}中的每个像素点的振幅及{L_org(x,y)}与{R_org(x,y)}之间的视差图像中的每个像素点的像素值，计算S_dis的独眼图，记为{CM_dis(x,y)}，其中，CM_org(x,y)表示{CM_org(x,y)}中坐标位置为(x,y)的像素点的像素值，CM_dis(x,y)表示{CM_dis(x,y)}中坐标位置为(x,y)的像素点的像素值；

③根据{CM_org(x,y)}的振幅和相位，计算{CM_org(x,y)}的显著图，记为{SM_org(x,y)}，并根据{CM_dis(x,y)}的振幅和相位，计算{CM_dis(x,y)}的显著图，记为{SM_dis(x,y)}，其中，SM_org(x,y)表示{SM_org(x,y)}中坐标位置为(x,y)的像素点的像素值，SM_dis(x,y)表示{SM_dis(x,y)}中坐标位置为(x,y)的像素点的像素值；

④根据人眼的中心偏移特性，计算{CM_org(x,y)}的中心偏移图，记为{CB(x,y)}，将{CB(x,y)}中坐标位置为(x,y)的像素点的像素值记为CB(x,y)，

CB (x, y) = \exp {- (\frac{{(x - x_{c})}^{2}}{{2 σ}_{x}^{2}} + \frac{{(y - y_{c})}^{2}}{{2 σ}_{y}^{2}})},

其中，exp()为以e为底的指数函数，e=2.718281828，σ_x和σ_y为控制系数；

⑤根据{L_org(x,y)}与{R_org(x,y)}之间的视差图像，计算{CM_org(x,y)}的前景图和背景图，分别记为{FM(x,y)}和{BM(x,y)}，其中，FM(x,y)表示{FM(x,y)}中坐标位置为(x,y)的像素点的像素值，BM(x,y)表示{BM(x,y)}中坐标位置为(x,y)的像素点的像素值；

⑥根据{SM_org(x,y)}、{SM_dis(x,y)}、{CB(x,y)}、{FM(x,y)}及{BM(x,y)}，获取对应的三维视觉注意力图像，记为{S_3D(x,y)}，将{S_3D(x,y)}中坐标位置为(x,y)的像素点的三维视觉注意力值记为S_3D(x,y)，S_3D(x,y)=ω₁×SM(x,y)+ω₂×CB(x,y)+ω₃×FM(x,y)+ω₄×BM(x,y)，其中，SM(x,y)=max(SM_org(x,y),SM_dis(x,y))，max()为取最大值函数，ω₁、ω₂、ω₃和ω₄为权重系数；然后对{CM_dis(x,y)}中的每个像素点的客观评价度量值进行融合，得到S_dis的图像质量客观评价预测值，记为Q，其中，Ω表示像素域范围，Q_image(x,y)表示{CM_dis(x,y)}中坐标位置为(x,y)的像素点的客观评价度量值；

⑦采用n幅原始的无失真的立体图像，建立其在不同失真类型不同失真程度下的失真立体图像集合，该失真立体图像集合包括多幅失真的立体图像，利用主观质量评价方法分别获取该失真立体图像集合中每幅失真的立体图像的平均主观评分差值，记为DMOS，DMOS=100-MOS，其中，MOS表示主观评分均值，DMOS∈[0,100]，n≥1；

⑧按照步骤①至步骤⑥计算S_dis的图像质量客观评价预测值的操作，分别计算失真立体图像集合中每幅失真的立体图像的图像质量客观评价预测值。

所述的步骤②的具体过程为：

②-1、对{L_org(x,y)}进行滤波处理，得到{L_org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，将{L_org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为e_α,θ(x,y)，将{L_org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为o_α,θ(x,y)，其中，α表示滤波所采用的滤波器的尺度因子，1≤α≤4，θ表示滤波所采用的滤波器的方向因子，1≤θ≤4；

②-2、根据{L_org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，计算{L_org(x,y)}中的每个像素点的振幅，将{L_org(x,y)}中坐标位置为(x,y)的像素点的振幅记为

{GE}_{org}^{L} (x, y) = Σ_{θ = 1}^{4} Σ_{α = 1}^{4} \sqrt{e_{α, θ} {(x, y)}^{2} + o_{α, θ} {(x, y)}^{2}};

②-3、按照步骤②-1至步骤②-2获取{L_org(x,y)}中的每个像素点的振幅的操作，以相同的方式获取{R_org(x,y)}、{L_dis(x,y)}和{R_dis(x,y)}中的每个像素点的振幅，将{R_org(x,y)}中坐标位置为(x,y)的像素点的振幅记为将{L_dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为将{R_dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为

②-4、采用块匹配法计算{L_org(x,y)}与{R_org(x,y)}之间的视差图像，记为其中，表示中坐标位置为(x,y)的像素点的像素值；

②-5、根据{L_org(x,y)}和{R_org(x,y)}中的每个像素点的振幅及中的每个像素点的像素值，计算S_org的独眼图，记为{CM_org(x,y)}，将{CM_org(x,y)}中坐标位置为(x,y)的像素点的像素值记为CM_org(x,y)，

{CM}_{org} (x, y) = \frac{{GE}_{org}^{L} (x, y) \times L_{org} (x, y) + {GE}_{org}^{R} (x - d_{org}^{L} (x, y), y) \times R_{org} (x - d_{org}^{L} (x, y), y)}{{GE}_{org}^{L} (x, y) + {GE}_{org}^{R} (x - d_{org}^{L} (x, y), y)},

其中，表示{R_org(x,y)}中坐标位置为的像素点的振幅，表示{R_org(x,y)}中坐标位置为的像素点的像素值；

②-6、根据{L_dis(x,y)}和{R_dis(x,y)}中的每个像素点的振幅及中的每个像素点的像素值，计算S_dis的独眼图，记为{CM_dis(x,y)}，将{CM_dis(x,y)}中坐标位置为(x,y)的像素点的像素值记为CM_dis(x,y)，

{CM}_{dis} (x, y) = \frac{{GE}_{dis}^{L} (x, y) \times L_{dis} (x, y) + {GE}_{dis}^{R} (x - d_{org}^{L} (x, y), y) \times R_{dis} (x - d_{org}^{L} (x, y), y)}{{GE}_{dis}^{L} (x, y) + {GE}_{dis}^{R} (x - d_{org}^{L} (x, y), y)},

其中，表示{R_dis(x,y)}中坐标位置为的像素点的振幅，表示{R_dis(x,y)}中坐标位置为的像素点的像素值。

所述的步骤②-1中对{L_org(x,y)}进行滤波处理采用的滤波器为log-Garbor滤波器。

所述的步骤③的具体过程为：

③-1、对{CM_org(x,y)}进行离散傅立叶变换，得到{CM_org(x,y)}的振幅和相位，分别记为{M_org(u,v)}和{A_org(u,v)}，其中，u表示变换域的振幅或相位的宽度，v表示变换域的振幅或相位的高度，1≤u≤W，1≤v≤H，M_org(u,v)表示{M_org(u,v)}中坐标位置为(u,v)的像素点的振幅值，A_org(u,v)表示{A_org(u,v)}中坐标位置为(u,v)的像素点的相位值；

③-2、计算{M_org(u,v)}的高频分量的振幅，记为{F_org(u,v)}，将{F_org(u,v)}中坐标位置为(u,v)的像素点的高频分量的振幅值记为F_org(u,v)，F_org(u,v)=log(M_org(u,v))-h_m(u,v)*log(M_org(u,v))，其中，log()为以10为底的对数函数，“*”为卷积操作符号，h_m(u,v)表示m×m的均值滤波矩阵，

③-3、根据{F_org(u,v)}和{A_org(u,v)}进行离散傅立叶反变换，将获得的反变换图像作为{CM_org(x,y)}的显著图，记为{SM_org(x,y)}，其中，SM_org(x,y)表示{SM_org(x,y)}中坐标位置为(x,y)的像素点的像素值；

③-4、按照步骤③-1至步骤③-3获取{CM_org(x,y)}的显著图的操作，以相同的方式获取{CM_dis(x,y)}的显著图，记为{SM_dis(x,y)}，其中，SM_dis(x,y)表示{SM_dis(x,y)}中坐标位置为(x,y)的像素点的像素值。

所述的步骤④中

σ_{x} = \sqrt{\frac{W}{2}}, σ_{y} = \sqrt{\frac{H}{2}} .

所述的步骤⑤的具体过程为：

⑤-1、采用块匹配法计算{L_org(x,y)}与{R_org(x,y)}之间的视差图像，记为其中，表示中坐标位置为(x,y)的像素点的像素值；

⑤-2、通过Sigmoid函数对进行转换，得到转换后的视差图像，记为{f(x,y)}，将{f(x,y)}中坐标位置为(x,y)的像素点的像素值记为f(x,y)，其中，exp()为以e为底的指数函数，e=2.718281828；

⑤-3、根据{f(x,y)}，计算{CM_org(x,y)}的前景图，记为{FM(x,y)}，将{FM(x,y)}中坐标位置为(x,y)的像素点的像素值记为FM(x,y)，其中，T=(f_max+f_min)/2，

f_{\max} = \frac{1}{1 + \exp (- d_{\min})},

d_min表示中的最小像素值，d_max表示中的最大像素值；

⑤-4、根据{f(x,y)}，计算{CM_org(x,y)}的背景图，记为{BM(x,y)}，将{BM(x,y)}中坐标位置为(x,y)的像素点的像素值记为BM(x,y)，

所述的步骤⑥中取ω₁=0.8200，ω₂=0.0010，ω₃=0.1100，ω₄=0.0690。

所述的步骤⑥中Q_image(x,y)的值为{CM_org(x,y)}中坐标位置为(x,y)的像素点与{CM_dis(x,y)}中坐标位置为(x,y)的像素点之间的结构相似度。

与现有技术相比，本发明的优点在于：

1）本发明方法通过分别计算原始的无失真的立体图像的独眼图和待评价的失真的立体图像的独眼图，然后计算两个独眼图的显著图及原始的无失真的立体图像的独眼图的中心偏移图、前景图和背景图，得到的三维视觉注意力图像能够较好地反映空间立体视觉信息对注意的影响，从而提高了客观评价结果的可靠性。

2）本发明方法通过计算原始的无失真的立体图像的独眼图和待评价的失真的立体图像的独眼图的三维视觉注意力图像，并对待评价的失真的立体图像的独眼图中的每个像素点的客观评价度量值进行融合，从而有效地提高了客观评价结果与主观感知的相关性。

附图说明

图1为本发明方法的总体实现框图；

图2a为Akko（尺寸为640×480）立体图像的左视点图像；

图2b为Akko（尺寸为640×480）立体图像的右视点图像；

图3a为Altmoabit（尺寸为1024×768）立体图像的左视点图像；

图3b为Altmoabit（尺寸为1024×768）立体图像的右视点图像；

图4a为Balloons（尺寸为1024×768）立体图像的左视点图像；

图4b为Balloons（尺寸为1024×768）立体图像的右视点图像；

图5a为Doorflower（尺寸为1024×768）立体图像的左视点图像；

图5b为Doorflower（尺寸为1024×768）立体图像的右视点图像；

图6a为Kendo（尺寸为1024×768）立体图像的左视点图像；

图6b为Kendo（尺寸为1024×768）立体图像的右视点图像；

图7a为LeaveLaptop（尺寸为1024×768）立体图像的左视点图像；

图7b为LeaveLaptop（尺寸为1024×768）立体图像的右视点图像；

图8a为Lovebierd1（尺寸为1024×768）立体图像的左视点图像；

图8b为Lovebierd1（尺寸为1024×768）立体图像的右视点图像；

图9a为Newspaper（尺寸为1024×768）立体图像的左视点图像；

图9b为Newspaper（尺寸为1024×768）立体图像的右视点图像；

图10a为Puppy（尺寸为720×480）立体图像的左视点图像；

图10b为Puppy（尺寸为720×480）立体图像的右视点图像；

图11a为Soccer2（尺寸为720×480）立体图像的左视点图像；

图11b为Soccer2（尺寸为720×480）立体图像的右视点图像；

图12a为Horse（尺寸为720×480）立体图像的左视点图像；

图12b为Horse（尺寸为720×480）立体图像的右视点图像；

图13a为Xmas（尺寸为640×480）立体图像的左视点图像；

图13b为Xmas（尺寸为640×480）立体图像的右视点图像；

图14为失真立体图像集合中的各幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值的散点图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种基于三维视觉注意力的立体图像质量客观评价方法，其总体实现框图如图1所示，它的处理过程为：首先，根据原始的无失真的立体图像的左视点图像和右视点图像中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，及原始的无失真的立体图像的左视点图像与右视点图像之间的视差图像，获得原始的无失真的立体图像的独眼图；根据待评价的失真的立体图像的左视点图像和右视点图像中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，及原始的无失真的立体图像的左视点图像与右视点图像之间的视差图像，获得待评价的失真的立体图像的独眼图；其次，根据原始的无失真的立体图像的独眼图的振幅和相位，获得对应的显著图；根据待评价的失真的立体图像的独眼图的振幅和相位，获得对应的显著图；接着，根据人眼的中心偏移特性，获得原始的无失真的立体图像的独眼图的中心偏移图；并根据原始的无失真的立体图像的左视点图像与右视点图像之间的视差图像，获得原始的无失真的立体图像的独眼图的前景图和背景图；然后，根据两个显著图、中心偏移图、前景图和背景图，得到对应的三维视觉注意力图像，之后对待评价的失真的立体图像的独眼图中的每个像素点的客观评价度量值进行融合，得到待评价的失真的立体图像的图像质量客观评价预测值；最后，按照上述处理过程获取多幅不同失真类型不同失真程度的失真的立体图像的图像质量客观评价预测值。

本发明的立体图像质量客观评价方法具体包括以下步骤：

①令S_org为原始的无失真的立体图像，令S_dis为待评价的失真的立体图像，将S_org的左视点图像记为{L_org(x,y)}，将S_org的右视点图像记为{R_org(x,y)}，将S_dis的左视点图像记为{L_dis(x,y)}，将S_dis的右视点图像记为{R_dis(x,y)}，其中，此处(x,y)表示左视点图像和右视点图像中的像素点的坐标位置，1≤x≤W，1≤y≤H，W表示左视点图像和右视点图像的宽度，H表示左视点图像和右视点图像的高度，L_org(x,y)表示{L_org(x,y)}中坐标位置为(x,y)的像素点的像素值，R_org(x,y)表示{R_org(x,y)}中坐标位置为(x,y)的像素点的像素值，L_dis(x,y)表示{L_dis(x,y)}中坐标位置为(x,y)的像素点的像素值，R_dis(x,y)表示{R_dis(x,y)}中坐标位置为(x,y)的像素点的像素值。

②根据{L_org(x,y)}、{R_org(x,y)}、{L_dis(x,y)}、{R_dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，对应获取{L_org(x,y)}、{R_org(x,y)}、{L_dis(x,y)}、{R_dis(x,y)}中的每个像素点的振幅，然后根据{L_org(x,y)}和{R_org(x,y)}中的每个像素点的振幅及{L_org(x,y)}与{R_org(x,y)}之间的视差图像中的每个像素点的像素值，计算S_org的独眼图（cyclopean map），记为{CM_org(x,y)}，并根据{L_dis(x,y)}和{R_dis(x,y)}中的每个像素点的振幅及{L_org(x,y)}与{R_org(x,y)}之间的视差图像中的每个像素点的像素值，计算S_dis的独眼图，记为{CM_dis(x,y)}，其中，CM_org(x,y)表示{CM_org(x,y)}中坐标位置为(x,y)的像素点的像素值，CM_dis(x,y)表示{CM_dis(x,y)}中坐标位置为(x,y)的像素点的像素值。

在此具体实施例中，步骤②的具体过程为：

②-1、对{L_org(x,y)}进行滤波处理，得到{L_org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，将{L_org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为e_α,θ(x,y)，将{L_org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为o_α,θ(x,y)，其中，α表示滤波所采用的滤波器的尺度因子，1≤α≤4，θ表示滤波所采用的滤波器的方向因子，1≤θ≤4。

在此，对{L_org(x,y)}进行滤波处理采用的滤波器为log-Garbor滤波器。

{GE}_{org}^{L} (x, y) = Σ_{θ = 1}^{4} Σ_{α = 1}^{4} \sqrt{e_{α, θ} {(x, y)}^{2} + o_{α, θ} {(x, y)}^{2}} .

②-3、按照步骤②-1至步骤②-2获取{L_org(x,y)}中的每个像素点的振幅的操作，以相同的方式获取{R_org(x,y)}、{L_dis(x,y)}和{R_dis(x,y)}中的每个像素点的振幅，将{R_org(x,y)}中坐标位置为(x,y)的像素点的振幅记为将{L_dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为将{R_dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为例如获取{L_dis(x,y)}中的每个像素点的振幅的操作过程为：1）采用log-Garbor滤波器对{L_dis(x,y)}进行滤波处理，得到{L_dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，将{L_dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为e_α,θ'(x,y)，将{L_dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为o_α,θ'(x,y)，其中，α表示滤波所采用的滤波器的尺度因子，1≤α≤4，θ表示滤波所采用的滤波器的方向因子，1≤θ≤4；2）根据{L_dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应，计算{L_dis(x,y)}中的每个像素点的振幅，将{L_dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为

{GE}_{dis}^{L} (x, y) = Σ_{θ = 1}^{4} Σ_{α = 1}^{4} \sqrt{{e_{α, θ}}^{'} {(x, y)}^{2} + {o_{α, θ}}^{'} {(x, y)}^{2}} .

②-4、采用现有的块匹配法计算{L_org(x,y)}与{R_org(x,y)}之间的视差图像，记为其中，表示中坐标位置为(x,y)的像素点的像素值。

{CM}_{org} (x, y) = \frac{{GE}_{org}^{L} (x, y) \times L_{org} (x, y) + {GE}_{org}^{R} (x - d_{org}^{L} (x, y), y) \times R_{org} (x - d_{org}^{L} (x, y), y)}{{GE}_{org}^{L} (x, y) + {GE}_{org}^{R} (x - d_{org}^{L} (x, y), y)},

其中，表示中坐标位置为的像素点的振幅，表示{R_org(x,y)}中坐标位置为的像素点的像素值。

{CM}_{dis} (x, y) = \frac{{GE}_{dis}^{L} (x, y) \times L_{dis} (x, y) + {GE}_{dis}^{R} (x - d_{org}^{L} (x, y), y) \times R_{dis} (x - d_{org}^{L} (x, y), y)}{{GE}_{dis}^{L} (x, y) + {GE}_{dis}^{R} (x - d_{org}^{L} (x, y), y)},

③根据{CM_org(x,y)}的光谱冗余特性，即根据{CM_org(x,y)}的振幅和相位，计算{CM_org(x,y)}的显著图（saliency map），记为{SM_org(x,y)}，并根据{CM_dis(x,y)}的光谱冗余特性，即根据{CM_dis(x,y)}的振幅和相位，计算{CM_dis(x,y)}的显著图，记为{SM_dis(x,y)}，其中，SM_org(x,y)表示{SM_org(x,y)}中坐标位置为(x,y)的像素点的像素值，SM_dis(x,y)表示{SM_dis(x,y)}中坐标位置为(x,y)的像素点的像素值。

在此具体实施例中，步骤③的具体过程为：

③-1、对{CM_org(x,y)}进行离散傅立叶变换，得到{CM_org(x,y)}的振幅和相位，分别记为{M_org(u,v)}和{A_org(u,v)}，其中，u表示变换域的振幅或相位的宽度，v表示变换域的振幅或相位的高度，1≤u≤W，1≤v≤H，M_org(u,v)表示{M_org(u,v)}中坐标位置为(u,v)的像素点的振幅值，A_org(u,v)表示{A_org(u,v)}中坐标位置为(u,v)的像素点的相位值。

③-2、计算{M_org(u,v)}的高频分量的振幅，记为{F_org(u,v)}，将{F_org(u,v)}中坐标位置为(u,v)的像素点的高频分量的振幅值记为F_org(u,v)，F_org(u,v)=log(M_org(u,v))-h_m(u,v)*log(M_org(u,v))，其中，log()为以10为底的对数函数，“*”为卷积操作符号，h_m(u,v)表示m×m的均值滤波矩阵，在此取m=3。

③-3、根据{F_org(u,v)}和{A_org(u,v)}进行离散傅立叶反变换，将获得的反变换图像作为{CM_org(x,y)}的显著图，记为{SM_org(x,y)}，其中，SM_org(x,y)表示{SM_org(x,y)}中坐标位置为(x,y)的像素点的像素值。

④由于人眼可能更多的时候会比较关注场景的中心，即某一像素点更接近图像的中心，那么该像素点被关注的可能就越大，即越显著。因此本发明根据人眼的中心偏移特性，计算{CM_org(x,y)}的中心偏移图，记为{CB(x,y)}，将{CB(x,y)}中坐标位置为(x,y)的像素点的像素值记为CB(x,y)，

CB (x, y) = \exp {- (\frac{{(x - x_{c})}^{2}}{{2 σ}_{x}^{2}} + \frac{{(y - y_{c})}^{2}}{{2 σ}_{y}^{2}})},

其中，exp()为以e为底的指数函数，e=2.718281828，σ_x和σ_y为控制系数，在此取

σ_{x} = \sqrt{\frac{W}{2}}, σ_{y} = \sqrt{\frac{H}{2}} .

⑤根据{L_org(x,y)}与{R_org(x,y)}之间的视差图像，计算{CM_org(x,y)}的前景图和背景图，分别记为{FM(x,y)}和{BM(x,y)}，其中，FM(x,y)表示{FM(x,y)}中坐标位置为(x,y)的像素点的像素值，BM(x,y)表示{BM(x,y)}中坐标位置为(x,y)的像素点的像素值。

在此具体实施例中，步骤⑤的具体过程为：

⑤-1、采用现有的块匹配法计算{L_org(x,y)}与{R_org(x,y)}之间的视差图像，记为其中，表示中坐标位置为(x,y)的像素点的像素值。

⑤-2、通过Sigmoid函数对进行转换，得到转换后的视差图像，记为{f(x,y)}，将{f(x,y)}中坐标位置为(x,y)的像素点的像素值记为f(x,y)，其中，exp()为以e为底的指数函数，e=2.718281828。

⑤-3、根据{f(x,y)}，计算{CMorg(x,y)}的前景图，记为{FM(x,y)}，将{FM(x,y)}中坐标位置为(x,y)的像素点的像素值记为FM(x,y)，其中，T=(f_max+f_min)/2，

f_{\max} = \frac{1}{1 + \exp (- d_{\min})},

d_min表示中的最小像素值，d_max表示中的最大像素值。

⑥根据{SM_org(x,y)}、{SM_dis(x,y)}、{CB(x,y)}、{FM(x,y)}及{BM(x,y)}，获取对应的三维视觉注意力图像，记为{S_3D(x,y)}，将{S_3D(x,y)}中坐标位置为(x,y)的像素点的三维视觉注意力值记为S_3D(x,y)，S_3D(x,y)=ω₁×SM(x,y)+ω₂×CB(x,y)+ω₃×FM(x,y)+ω₄×BM(x,y)，其中，SM(x,y)=max(SM_org(x,y),SM_dis(x,y))，max()为取最大值函数，ω₁、ω₂、ω₃和ω₄为权重系数，在此取ω₁=0.8200，ω₂=0.0010，ω₃=0.1100，ω₄=0.0690；然后对{CM_dis(x,y)}中的每个像素点的客观评价度量值进行融合，得到S_dis的图像质量客观评价预测值，记为Q，其中，Ω表示像素域范围，Q_image(x,y)表示{CM_dis(x,y)}中坐标位置为(x,y)的像素点的客观评价度量值。

在本实施例中，以{CM_org(x,y)}与{CM_dis(x,y)}中的每个像素点之间的结构相似度（SSIM）作为{CM_dis(x,y)}中的每个像素点的客观评价度量值，即在此Q_image(x,y)的值为{CM_org(x,y)}中坐标位置为(x,y)的像素点与{CM_dis(x,y)}中坐标位置为(x,y)的像素点之间的结构相似度（SSIM）。

⑦采用n幅原始的无失真的立体图像，建立其在不同失真类型不同失真程度下的失真立体图像集合，该失真立体图像集合包括多幅失真的立体图像，利用主观质量评价方法分别获取该失真立体图像集合中每幅失真的立体图像的平均主观评分差值，记为DMOS，DMOS=100-MOS，其中，MOS表示主观评分均值，DMOS∈[0,100]，n≥1。

在本实施例中，利用如图2a和图2b构成的立体图像、图3a和图3b构成的立体图像、图4a和图4b构成的立体图像、图5a和图5b构成的立体图像、图6a和图6b构成的立体图像、图7a和图7b构成的立体图像、图8a和图8b构成的立体图像、图9a和图9b构成的立体图像、图10a和图10b构成的立体图像、图11a和图11b构成的立体图像、图12a和图12b构成的立体图像、图13a和图13b构成的立体图像共12幅（n=12）无失真的立体图像建立了其在不同失真类型不同失真程度下的失真立体图像集合，该失真立体图像集合共包括4种失真类型的252幅失真的立体图像，其中JPEG压缩的失真的立体图像共60幅，JPEG2000压缩的失真的立体图像共60幅，高斯模糊（Gaussian Blur）的失真的立体图像共60幅，H.264编码的失真的立体图像共72幅。

采用图2a至图13b所示的12幅无失真的立体图像在不同程度的JPEG压缩、JPEG2000压缩、高斯模糊和H.264编码失真情况下的252幅失真的立体图像来分析本实施例得到的失真的立体图像的图像质量客观评价预测值与平均主观评分差值之间的相关性。这里，利用评估图像质量评价方法的4个常用客观参量作为评价指标，即非线性回归条件下的Pearson相关系数（Pearson linear correlation coefficient，PLCC）、Spearman相关系数（Spearman rank order correlation coefficient，SROCC），Kendall相关系数（Kendall rank-order correlation coefficient，KROCC)，均方误差（root mean squared error，RMSE），PLCC和RMSE反映失真的立体图像客观评价结果的准确性，SROCC和KROCC反映其单调性。将按本发明方法计算得到的失真的立体图像的图像质量客观评价预测值做四参数Logistic函数非线性拟合，PLCC、SROCC和KROCC值越高，RMSE值越低说明客观评价方法与平均主观评分差值相关性越好。将分别采用本发明方法与不采用本发明方法得到失真的立体图像的图像质量客观评价预测值与主观评分之间的Pearson相关系数、Spearman相关系数、Kendall相关系数和均方误差进行比较，比较结果如表1、表2、表3和表4所示，从表1、表2、表3和表4中可以看出，采用本发明方法得到的失真的立体图像的最终的图像质量客观评价预测值与平均主观评分差值之间的相关性是很高的，表明客观评价结果与人眼主观感知的结果较为一致，足以说明本发明方法的有效性。

图14给出了失真立体图像集合中的各幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值的散点图，散点越集中，说明客观评介结果与主观感知的一致性越好。从图14中可以看出，采用本发明方法得到的散点图比较集中，与主观评价数据之间的吻合度较高。

表1利用本发明方法与不利用本发明方法得到的失真的立体图像的图像质量客观评价预测值与主观评分之间的Pearson相关系数比较

表2利用本发明方法与不利用本发明方法得到的失真的立体图像的图像质量客观评价预测值与主观评分之间的Spearman相关系数比较

表3利用本发明方法与不利用本发明方法得到的失真的立体图像的图像质量客观评价预测值与主观评分之间的Kendall相关系数比较

表4利用本发明方法与不利用本发明方法得到的失真的立体图像的图像质量客观评价预测值与主观评分之间的均方误差比较

Claims

1.一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于它的处理过程为：

最后，按照上述处理过程获取多幅不同失真类型不同失真程度的失真的立体图像的图像质量客观评价预测值；

该方法包括以下步骤：

CB (x, y) = \exp {- (\frac{{(x - x_{c})}^{2}}{{2 σ}_{x}^{2}} + \frac{{(y - y_{c})}^{2}}{{2 σ}_{y}^{2}})},

其中，exp( )为以e为底的指数函数，e＝2.718281828，σ_x和σ_y为控制系数；

⑥根据{SM_org(x,y)}、{SM_dis(x,y)}、{CB(x,y)}、{FM(x,y)}及{BM(x,y)}，获取对应的三维视觉注意力图像，记为{S_3D(x,y)}，将{S_3D(x,y)}中坐标位置为(x,y)的像素点的三维视觉注意力值记为S_3D(x,y)，S_3D(x,y)＝ω₁×SM(x,y)+ω₂×CB(x,y)+ω₃×FM(x,y)+ω₄×BM(x,y)，其中，SM(x,y)＝max(SM_org(x,y),SM_dis(x,y))，max( )为取最大值函数，ω₁、ω₂、ω₃和ω₄为权重系数；然后对{CM_dis(x,y)}中的每个像素点的客观评价度量值进行融合，得到S_dis的图像质量客观评价预测值，记为Q，其中，Ω表示像素域范围，Q_image(x,y)表示{CM_dis(x,y)}中坐标位置为(x,y)的像素点的客观评价度量值；

⑦采用n幅原始的无失真的立体图像，建立其在不同失真类型不同失真程度下的失真立体图像集合，该失真立体图像集合包括多幅失真的立体图像，利用主观质量评价方法分别获取该失真立体图像集合中每幅失真的立体图像的平均主观评分差值，记为DMOS，DMOS＝100-MOS，其中，MOS表示主观评分均值，DMOS∈[0,100]，n≥1；

2.根据权利要求1所述的一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于所述的步骤②的具体过程为：

{GE}_{org}^{L} (x, y) = Σ_{θ = 1}^{4} Σ_{α = 1}^{4} \sqrt{e_{α, θ} {(x, y)}^{2} + o_{α, θ} {(x, y)}^{2}};

{CM}_{org} (x, y) = \frac{{GE}_{org}^{L} (x, y) \times L_{org} (x, y) + {GE}_{org}^{R} (x - d_{org}^{L} (x, y), y) \times R_{org} (x - d_{org}^{L} (x, y), y)}{{GE}_{org}^{L} (x, y) + {GE}_{org}^{R} (x - d_{org}^{L} (x, y), y)},

{CM}_{dis} (x, y) = \frac{{GE}_{dis}^{L} (x, y) \times L_{dis} (x, y) + {GE}_{dis}^{R} (x - d_{dis}^{L} (x, y), y) \times R_{dis} (x - d_{dis}^{L} (x, y), y)}{{GE}_{dis}^{L} (x, y) + {GE}_{dis}^{R} (x - d_{dis}^{L} (x, y), y)},

3.根据权利要求2所述的一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于所述的步骤②-1中对{L_org(x,y)}进行滤波处理采用的滤波器为log-Garbor滤波器。

4.根据权利要求1至3中任一项所述的一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于所述的步骤③的具体过程为：

③-2、计算{M_org(u,v)}的高频分量的振幅，记为{F_org(u,v)}，将{F_org(u,v)}中坐标位置为(u,v)的像素点的高频分量的振幅值记为F_org(u,v)，F_org(u,v)＝log(M_org(u,v))-h_m(u,v)*log(M_org(u,v))，其中，log( )为以10为底的对数函数，“*”为卷积操作符号，h_m(u,v)表示m×m的均值滤波矩阵，

5.根据权利要求4所述的一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于所述的步骤④中

σ_{x} = \sqrt{\frac{W}{2}}, σ_{y} = \sqrt{\frac{H}{2}} .

6.根据权利要求5所述的一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于所述的步骤⑤的具体过程为：

⑤-2、通过Sigmoid函数对进行转换，得到转换后的视差图像，记为{f(x,y)}，将{f(x,y)}中坐标位置为(x,y)的像素点的像素值记为f(x,y)，其中，exp( )为以e为底的指数函数，e＝2.718281828；

⑤-3、根据{f(x,y)}，计算{CM_org(x,y)}的前景图，记为{FM(x,y)}，将{FM(x,y)}中坐标位置为(x,y)的像素点的像素值记为FM(x,y)，其中，

T = (f_{\max} + f_{\min}) / 2, f_{\max} = \frac{1}{1 + \exp ({- d}_{\min})},

d_min表示中的最小像素值，d_max表示中的最大像素值；

7.根据权利要求6所述的一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于所述的步骤⑥中取ω₁＝0.8200，ω₂＝0.0010，ω₃＝0.1100，ω₄＝0.0690。

8.根据权利要求7所述的一种基于三维视觉注意力的立体图像质量客观评价方法，其特征在于所述的步骤⑥中Q_image(x,y)的值为{CM_org(x,y)}中坐标位置为(x,y)的像素点与{CM_dis(x,y)}中坐标位置为(x,y)的像素点之间的结构相似度。