发明内容
本发明所要解决的技术问题是提供一种基于区域重要性分类的立体图像质量客观评价方法,其能够有效地提高客观评价结果与主观感知的相关性。
本发明解决上述技术问题所采用的技术方案为:一种基于区域重要性分类的立体图像质量客观评价方法,其特征在于包括以下步骤:
①令S
org表示原始的无失真的立体图像,令S
dis表示待评价的失真的立体图像,将S
org的左视点图像记为{L
org(x,y)},将S
org的右视点图像记为{R
org(x,y)},将S
dis的左视点图像记为{L
dis(x,y)},将S
dis的右视点图像记为{R
dis(x,y)},然后计算{L
org(x,y)}与{R
org(x,y)}之间的视差图像,记为
其中,此处(x,y)表示左视点图像和右视点图像中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示左视点图像和右视点图像的宽度,H表示左视点图像和右视点图像的高度,L
org(x,y)表示{L
org(x,y)}中坐标位置为(x,y)的像素点的像素值,R
org(x,y)表示{R
org(x,y)}中坐标位置为(x,y)的像素点的像素值,L
dis(x,y)表示{L
dis(x,y)}中坐标位置为(x,y)的像素点的像素值,R
dis(x,y)表示{R
dis(x,y)}中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值;
②根据{L
org(x,y)}、{R
org(x,y)}、{L
dis(x,y)}、{R
dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,对应获取{L
org(x,y)}、{R
org(x,y)}、{L
dis(x,y)}、{R
dis(x,y)}中的每个像素点的振幅,然后根据{L
org(x,y)}和{R
org(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算S
org的独眼图,记为{CM
org(x,y)},并根据{L
dis(x,y)}和{R
dis(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算S
dis的独眼图,记为{CM
dis(x,y)},其中,CM
org(x,y)表示{CM
org(x,y)}中坐标位置为(x,y)的像素点的像素值,CM
dis(x,y)表示{CM
dis(x,y)}中坐标位置为(x,y)的像素点的像素值;
③根据{CMorg(x,y)}、{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}与{CMdis(x,y)}之间的结构失真图,记为{Dappear(x,y)},其中,Dappear(x,y)表示{Dappear(x,y)}中坐标位置为(x,y)的像素点的像素值;
④根据{CM
org(x,y)}离散傅立叶变换后得到的振幅和相位,获取{CM
org(x,y)}的二维显著图;然后通过获取
的视差梯度图和相对视差图,获取
的深度显著图;再根据{CM
org(x,y)}的二维显著图和
的深度显著图,获取{CM
org(x,y)}的三维显著图,记为{S
3D(x,y)},其中,S
3D(x,y)表示{S
3D(x,y)}中坐标位置为(x,y)的像素点的像素值;
⑤根据{D
appear(x,y)}和{S
3D(x,y)},将{CM
dis(x,y)}分成四类区域,分别为显著失真区域
显著非失真区域
非显著失真区域
非显著非失真区域
⑥根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点的相位,并根据{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMdis(x,y)}中的每个像素点的相位;再根据{CMorg(x,y)}和{CMdis(x,y)}中的每个像素点的相位、{S3D(x,y)},并结合{CMdis(x,y)}中的每个像素点所属的区域,计算Sdis的图像质量客观评价预测值,记为Q。
所述的步骤②的具体过程为:
②-1、采用log-Gabor滤波器对{L
org(x,y)}进行滤波处理,得到{L
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{L
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{L
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4;
②-2、根据{L
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{L
org(x,y)}中的每个像素点的振幅,将{L
org(x,y)}中坐标位置为(x,y)的像素点的振幅记为
②-3、按照步骤②-1至步骤②-2获取{L
org(x,y)}中的每个像素点的振幅的操作过程,以相同的方式获取{R
org(x,y)}、{L
dis(x,y)}和{R
dis(x,y)}中的每个像素点的振幅,将{R
org(x,y)}中坐标位置为(x,y)的像素点的振幅记为
将{L
dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
将{R
dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
②-4、根据{L
org(x,y)}和{R
org(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算S
org的独眼图,记为{CM
org(x,y)},将{CM
org(x,y)}中坐标位置为(x,y)的像素点的像素值记为CM
org(x,y),
其中,
表示{R
org(x,y)}中坐标位置为
的像素点的振幅,
表示{R
org(x,y)}中坐标位置为
的像素点的像素值;
②-5、根据{L
dis(x,y)}和{R
dis(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算S
dis的独眼图,记为{CM
dis(x,y)},将{CM
dis(x,y)}中坐标位置为(x,y)的像素点的像素值记为CM
dis(x,y),
其中,
表示{R
dis(x,y)}中坐标位置为
的像素点的振幅,
表示{R
dis(x,y)}中坐标位置为
的像素点的像素值。
所述的步骤③的具体过程为:
③-1、采用log-Gabor滤波器对{CM
org(x,y)}进行滤波处理,得到{CM
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4;
③-2、根据{CM
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CM
org(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
③-3、按照步骤③-1至步骤③-2获取{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的操作过程,以相同的方式获取{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CMdis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
③-4、计算{CM
org(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅
的标准差、偏度和峰度分别对应记为
和
其中,
N(x,y)表示以坐标位置为(x,y)的像素点为中心的邻域窗口,M表示N(x,y)内包含的像素点的个数,
表示{CM
org(x,y)}中坐标位置为(x
1,y
1)的像素点在不同尺度和方向的振幅,1≤x
1≤W,1≤y
1≤H;
计算{CM
dis(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,将{CM
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅
的标准差、偏度和峰度分别对应记为
和
其中,
表示{CM
dis(x,y)}中坐标位置为(x
1,y
1)的像素点在不同尺度和方向的振幅;
③-5、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度及{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,计算{CMorg(x,y)}与{CMdis(x,y)}之间的结构失真图,记为{Dappear(x,y)},将{Dappear(x,y)}中坐标位置为(x,y)的像素点的像素值记为Dappear(x,y), ,其中,ωθ表示不同尺度的加权系数,ρ、λ和γ为控制系数,符号“||”为取绝对值符号。
所述的步骤③-4中邻域窗口N(x,y)的大小为4×4;所述的步骤③-5中当θ=1时取ωθ=0.5,当θ=2时取ωθ=0.75,当θ=3时取ωθ=1.5,当θ=4时取ωθ=6;所述的步骤③-5中取ρ=0.6、λ=0.05、γ=0.02。
所述的步骤④的具体过程为:
④-1、对{CMorg(x,y)}进行离散傅立叶变换,得到{CMorg(x,y)}的振幅和相位,分别对应记为{Morg(u,v)}和{Aorg(u,v)},其中,u表示变换域的振幅或相位的水平坐标位置,v表示变换域的振幅或相位的垂直坐标位置,1≤u≤W,1≤v≤H,Morg(u,v)表示{Morg(u,v)}中坐标位置为(u,v)的像素点的振幅值,Aorg(u,v)表示{Aorg(u,v)}中坐标位置为(u,v)的像素点的相位值;
④-2、计算{M
org(u,v)}的高频分量的振幅,记为{F
org(u,v)},将{F
org(u,v)}中坐标位置为(u,v)的像素点的高频分量的振幅值记为F
org(u,v),F
org(u,v)=ln(M
org(u,v))-h
m(u,v)*ln(M
org(u,v)),其中,ln()为以e为底的对数函数,e=2.718281828,符号“*”为卷积操作符号,h
m(u,v)表示m×m的均值滤波矩阵,
④-3、根据{Forg(u,v)}和{Aorg(u,v)}进行离散傅立叶反变换,将获得的反变换图像作为{CMorg(x,y)}的二维显著图,记为{SMorg(x,y)},其中,SMorg(x,y)表示{SMorg(x,y)}中坐标位置为(x,y)的像素点的像素值;
④-4、采用高斯差分滤波器对
进行滤波处理,得到
的视差梯度图,记为{D
1(x,y)},将{D
1(x,y)}中坐标位置为(x,y)的像素点的像素值记为D
1(x,y),
其中,符号“*”为卷积操作符号,exp()为以e为底的指数函数,e=2.718281828,σ
1为高斯算子的标准差,k
1为控制参数;
④-5、根据
中的最大视差值和最小视差值,计算
的相对视差图,记为{D
2(x,y)},将{D
2(x,y)}中坐标位置为(x,y)的像素点的像素值记为D
2(x,y),
其中,d
min表示
中的最小视差值,d
max表示
中的最大视差值;
④-6、根据
的视差梯度图{D
1(x,y)}和相对视差图{D
2(x,y)},获取
的深度显著图,记为{D(x,y)},将{D(x,y)}中坐标位置为(x,y)的像素点的像素值记为D(x,y),
其中,
表示D
1(x,y)的权重,
表示D
2(x,y)的权重,
④-7、根据{CM
org(x,y)}的二维显著图{SM
org(x,y)}和
的深度显著图{D(x,y)},获取{CM
org(x,y)}的三维显著图,记为{S
3D(x,y)},将{S
3D(x,y)}中坐标位置为(x,y)的像素点的像素值记为S
3D(x,y),
其中,
表示SM
org(x,y)的权重,
表示D(x,y)的权重,
所述的步骤④-2中取m=3;所述的步骤④-4中取σ
1=0.67,k
1=4;所述的步骤④-6中取
所述的步骤④-7中取
所述的步骤⑤的具体过程为:
⑤-1、将{CMdis(x,y)}中当前待处理的像素点定义为当前像素点;
⑤-2、假设当前像素点的坐标位置为(x1,y1),其中,1≤x1≤W,1≤y1≤H;
⑤-3、如果S
3D(x
1,y
1)>T
1且D
appear(x
1,y
1)>T
2,则将当前像素点归属为显著失真区域
如果S
3D(x
1,y
1)>T
1且D
appear(x
1,y
1)≤T
2,则将当前像素点归属为显著非失真区域
如果S
3D(x
1,y
1)≤T
1且D
appear(x
1,y
1)>T
2,则将当前像素点归属为非显著失真区域
如果S
3D(x
1,y
1)≤T
1且D
appear(x
1,y
1)≤T
2,则将当前像素点归属为非显著非失真区域
其中,T
1为{S
3D(x,y)}通过大津法得到的自适应阈值,T
2=k
2σ
2,σ
2为{D
appear(x,y)}的标准差,k
2为控制参数,S
3D(x
1,y
1)表示{S
3D(x,y)}中坐标位置为(x
1,y
1)的像素点的像素值,D
appear(x
1,y
1)表示{D
appear(x,y)}中坐标位置为(x
1,y
1)的像素点的像素值;
⑤-4、将{CMdis(x,y)}中下一个待处理的像素点作为当前像素点,然后返回步骤⑤-2继续执行,直至{CMdis(x,y)}中的所有像素点处理完毕。
所述的步骤⑤-3中取k2=1.54。
所述的步骤⑥的具体过程为:
⑥-1、采用log-Gabor滤波器对{CM
org(x,y)}进行滤波处理,得到{CM
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4;
⑥-2、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点的相位,将{CMorg(x,y)}中坐标位置为(x,y)的像素点的相位记为LPorg(x,y), 其中,arctan()为取反正切函数;
⑥-3、按照步骤⑥-1至步骤⑥-2获取{CMorg(x,y)}中的每个像素点的相位的操作过程,以相同的方式获取{CMdis(x,y)}中的每个像素点的相位,将{CMdis(x,y)}中坐标位置为(x,y)的像素点的相位记为LPdis(x,y);
⑥-4、根据{CM
org(x,y)}和{CM
dis(x,y)}中的每个像素点的相位、{S
3D(x,y)},并结合{CM
dis(x,y)}中的每个像素点所属的区域,计算S
dis的图像质量客观评价预测值,记为Q,Q=w
1×Q
1+w
2×Q
2+w
3×Q
3+w
4×Q
4,
其中,w
1表示Q
1的权重,w
2表示Q
2的权重,w
3表示Q
3的权重,w
4表示Q
4的权重,w
1+w
2+w
3+w
4=1,C
1为控制参数。
所述的步骤⑥-4中取w1=0.475,w2=0.280,w3=0.045,w4=0.200,C1=0.000001。
与现有技术相比,本发明的优点在于:
1)本发明方法分别提取出无失真的立体图像的独眼图与待评价的失真的立体图像的独眼图之间的结构失真图、待评价的失真的立体图像的独眼图的三维显著图,得到的结构失真图和三维显著图能够较好地反映人眼对不同区域的敏感程度,使得客观评价结果能更符合人类视觉,从而有效地提高了客观评价结果与主观感知的相关性。
2)本发明方法将待评价的失真的立体图像的独眼图分成显著失真、显著非失真、非显著失真和非显著非失真这四个区域分别进行评价,并对各个区域的客观评价度量值进行融合得到待评价的失真的立体图像的图像质量客观评价预测值,有效地提高了客观评价结果与主观感知的相关性。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提出的一种基于区域重要性分类的立体图像质量客观评价方法,其总体实现框图如图1所示,其首先分别计算原始的无失真的立体图像的独眼图和待评价的失真的立体图像的独眼图,然后计算两个独眼图之间的结构失真图和原始的无失真的立体图像的独眼图的三维显著图,再将待评价的失真的立体图像的独眼图分成显著失真、显著非失真、非显著失真和非显著非失真这四个区域分别进行评价,并对各个区域的客观评价度量值进行融合,得到待评价的失真的立体图像的图像质量客观评价预测值,具体包括以下步骤:
①令S
org表示原始的无失真的立体图像,令S
dis表示待评价的失真的立体图像,将S
org的左视点图像记为{L
org(x,y)},将S
org的右视点图像记为{R
org(x,y)},将S
dis的左视点图像记为{L
dis(x,y)},将S
dis的右视点图像记为{R
dis(x,y)},然后采用立体匹配法计算{L
org(x,y)}与{R
org(x,y)}之间的视差图像,记为
其中,此处(x,y)表示左视点图像和右视点图像中的像素点的坐标位置,1≤x≤W,1≤y≤H,W表示左视点图像和右视点图像的宽度,H表示左视点图像和右视点图像的高度,L
org(x,y)表示{L
org(x,y)}中坐标位置为(x,y)的像素点的像素值,R
org(x,y)表示{R
org(x,y)}中坐标位置为(x,y)的像素点的像素值,L
dis(x,y)表示{L
dis(x,y)}中坐标位置为(x,y)的像素点的像素值,R
dis(x,y)表示{R
dis(x,y)}中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值。
②根据{L
org(x,y)}、{R
org(x,y)}、{L
dis(x,y)}、{R
dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,对应获取{L
org(x,y)}、{R
org(x,y)}、{L
dis(x,y)}、{R
dis(x,y)}中的每个像素点的振幅,然后根据{L
org(x,y)}和{R
org(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算S
org的独眼图,记为{CM
org(x,y)},并根据{L
dis(x,y)}和{R
dis(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算S
dis的独眼图,记为{CM
dis(x,y)},其中,CM
org(x,y)表示{CM
org(x,y)}中坐标位置为(x,y)的像素点的像素值,CM
dis(x,y)表示{CM
dis(x,y)}中坐标位置为(x,y)的像素点的像素值。
在此具体实施例中,步骤②的具体过程为:
②-1、采用log-Gabor滤波器对{L
org(x,y)}进行滤波处理,得到{L
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{L
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{L
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4。
②-2、根据{L
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{L
org(x,y)}中的每个像素点的振幅,将{L
org(x,y)}中坐标位置为(x,y)的像素点的振幅记为
②-3、按照步骤②-1至步骤②-2获取{Lor
g(x,y)}中的每个像素点的振幅的操作过程,以相同的方式获取{R
org(x,y)}、{L
dis(x,y)}和{R
dis(x,y)}中的每个像素点的振幅,将{R
org(x,y)}中坐标位置为(x,y)的像素点的振幅记为
将{L
dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
将{R
dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
例如:获取{L
dis(x,y)}中的每个像素点的振幅的具体过程为:1)采用log-Gabor滤波器对{L
dis(x,y)}进行滤波处理,得到{L
dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{L
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{L
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
根据{L
dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{L
dis(x,y)}中的每个像素点的振幅,将{L
dis(x,y)}中坐标位置为(x,y)的像素点的振幅记为
②-4、根据{L
org(x,y)}和{R
org(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算S
org的独眼图,记为{CM
org(x,y)},将{CM
org(x,y)}中坐标位置为(x,y)的像素点的像素值记为CM
org(x,y),
其中,
表示{R
org(x,y)}中坐标位置为
的像素点的振幅,
表示{R
org(x,y)}中坐标位置为
的像素点的像素值。
②-5、根据{L
dis(x,y)}和{R
dis(x,y)}中的每个像素点的振幅及
中的每个像素点的像素值,计算S
dis的独眼图,记为{CM
dis(x,y)},将{CM
dis(x,y)}中坐标位置为(x,y)的像素点的像素值记为CM
dis(x,y),
其中,
表示{R
dis(x,y)}中坐标位置为
的像素点的振幅,
表示{R
dis(x,y)}中坐标位置为
的像素点的像素值。
③根据{CMorg(x,y)}、{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}与{CMdis(x,y)}之间的结构失真图,记为{Dappear(x,y)},其中,Dappear(x,y)表示{Dappear(x,y)}中坐标位置为(x,y)的像素点的像素值。
在此具体实施例中,步骤③的具体过程为:
③-1、采用log-Gabor滤波器对{CM
org(x,y)}进行滤波处理,得到{CM
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4。
③-2、根据{CM
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CM
org(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
③-3、按照步骤③-1至步骤③-2获取{CM
org(x,y)}中的每个像素点在不同尺度和方向的振幅的操作过程,以相同的方式获取{CM
dis(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CM
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
即获取{CM
dis(x,y)}中的每个像素点在不同尺度和方向的振幅的操作过程为:1)采用log-Gabor滤波器对{CM
dis(x,y)}进行滤波处理,得到{CM
dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CM
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{CM
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
根据{CM
dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CM
dis(x,y)}中的每个像素点在不同尺度和方向的振幅,将{CM
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅记为
③-4、计算{CM
org(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅
的标准差、偏度和峰度分别对应记为
和
其中,
N(x,y)表示以坐标位置为(x,y)的像素点为中心的邻域窗口,在此邻域窗口N(x,y)的大小为4×4,M表示N(x,y)内包含的像素点的个数,在此M=16,
表示{CM
org(x,y)}中坐标位置为(x
1,y
1)的像素点在不同尺度和方向的振幅,1≤x
1≤W,1≤y
1≤H。
计算{CM
dis(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,将{CM
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的振幅
的标准差、偏度和峰度分别对应记为
和
其中,
表示{CM
dis(x,y)}中坐标位置为(x
1,y
1)的像素点在不同尺度和方向的振幅。
③-5、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度及{CMdis(x,y)}中的每个像素点在不同尺度和方向的振幅的标准差、偏度和峰度,计算{CMorg(x,y)}与{CMdis(x,y)}之间的结构失真图,记为{Dappear(x,y)},将{Dappear(x,y)}中坐标位置为(x,y)的像素点的像素值记为Dappear(x,y), ,其中,ωθ表示不同尺度的加权系数,在本实施例中当θ=1时取ωθ=0.5,当θ=2时取ωθ=0.75,当θ=3时取ωθ=1.5,当θ=4时取ωθ=6,ρ、λ和γ为控制系数,在此取ρ=0.6、λ=0.05、γ=0.02,符号“||”为取绝对值符号。
④根据{CM
org(x,y)}离散傅立叶变换后得到的振幅和相位,获取{CM
org(x,y)}的二维显著图;然后通过获取
的视差梯度图和相对视差图,获取
的深度显著图;再根据{CM
org(x,y)}的二维显著图和
的深度显著图,获取{CM
org(x,y)}的三维显著图,记为{S
3D(x,y)},其中,S
3D(x,y)表示{S
3D(x,y)}中坐标位置为(x,y)的像素点的像素值。
在此具体实施例中,步骤④的具体过程为:
④-1、对{CMorg(x,y)}进行离散傅立叶变换,得到{CMorg(x,y)}的振幅和相位,分别对应记为{Morg(u,v)}和{Aorg(u,v)},其中,u表示变换域的振幅或相位的水平坐标位置,v表示变换域的振幅或相位的垂直坐标位置,1≤u≤W,1≤v≤H,Morg(u,v)表示{Morg(u,v)}中坐标位置为(u,v)的像素点的振幅值,Aorg(u,v)表示{Aorg(u,v)}中坐标位置为(u,v)的像素点的相位值。
④-2、计算{M
org(u,v)}的高频分量的振幅,记为{F
org(u,v)},将{F
org(u,v)}中坐标位置为(u,v)的像素点的高频分量的振幅值记为F
org(u,v),F
org(u,v)=ln(M
org(u,v))-h
m(u,v)*ln(M
org(u,v)),其中,ln()为以e为底的对数函数,e=2.718281828,符号“*”为卷积操作符号,h
m(u,v)表示m×m的均值滤波矩阵,
在此取m×m的值为3×3,即
④-3、根据{Forg(u,v)}和{Aorg(u,v)}进行离散傅立叶反变换,将获得的反变换图像作为{CMorg(x,y)}的二维显著图,记为{SMorg(x,y)},其中,SMorg(x,y)表示{SMorg(x,y)}中坐标位置为(x,y)的像素点的像素值。
④-4、采用高斯差分滤波器对
进行滤波处理,得到
的视差梯度图,记为{D
1(x,y)},将{D
1(x,y)}中坐标位置为(x,y)的像素点的像素值记为D
1(x,y),
其中,符号“*”为卷积操作符号,exp()为以e为底的指数函数,e=2.718281828,σ
1为高斯算子的标准差,在此取σ
1=0.67,k
1为控制参数,在此取k
1=4。
④-5、根据
中的最大视差值和最小视差值,计算
的相对视差图,记为{D
2(x,y)},将{D
2(x,y)}中坐标位置为(x,y)的像素点的像素值记为D
2(x,y),
其中,d
min表示
中的最小视差值,d
max表示
中的最大视差值。
④-6、根据
的视差梯度图{D
1(x,y)}和相对视差图{D
2(x,y)},获取
的深度显著图,记为{D(x,y)},将{D(x,y)}中坐标位置为(x,y)的像素点的像素值记为D(x,y),
其中,
表示D1(x,y)的权重,
表示D
2(x,y)的权重,
在此取
④-7、根据{CM
org(x,y)}的二维显著图{SM
org(x,y)}和
的深度显著图{D(x,y)},获取{CM
org(x,y)}的三维显著图,记为{S
3D(x,y)},将{S
3D(x,y)}中坐标位置为(x,y)的像素点的像素值记为S
3D(x,y),
其中,
表示SM
org(x,y)的权重,
表示D(x,y)的权重,
在此取
在此,图2a、图2b和图2c分别给出了“Akko&Kayo”的独眼图的二维显著图、“Akko&Kayo”的左视点图像与右视点图像之间的视差图像的深度显著图、“Akko&Kayo”的独眼图的三维显著图,图3a、图3b和图3c分别给出了“Door Flowers”的独眼图的二维显著图、“Door Flowers”的左视点图像与右视点图像之间的视差图像的深度显著图、“DoorFlowers”的独眼图的三维显著图,图4a、图4b和图4c分别给出了“Leaving Laptop”的独眼图的二维显著图、“Leaving Laptop”的左视点图像与右视点图像之间的视差图像的深度显著图、“Leaving Laptop”的独眼图的三维显著图,从图2c、图3c和图4c中可以看出,本发明方法提取的三维显著图能够很好地反映人类视觉注意力。
⑤根据{D
appear(x,y)}和{S
3D(x,y)},将{CM
dis(x,y)}分成四类区域,分别为显著失真区域
显著非失真区域
非显著失真区域
非显著非失真区域
在此具体实施例中,步骤⑤的具体过程为:
⑤-1、将{CMdis(x,y)}中当前待处理的像素点定义为当前像素点。
⑤-2、假设当前像素点的坐标位置为(x1,y1),其中,1≤x1≤W,1≤y1≤H。
⑤-3、如果S
3D(x
1,y
1)>T
1且D
appear(x
1,y
1)>T
2,则将当前像素点归属为显著失真区域
如果S
3D(x
1,y
1)>T
1且D
appear(x
1,y
1)≤T
2,则将当前像素点归属为显著非失真区域
如果S
3D(x
1,y
1)≤T
1且D
appear(x
1,y
1)>T
2,则将当前像素点归属为非显著失真区域
如果S
3D(x
1,y
1)≤T
1且D
appear(x
1,y
1)≤T
2,则将当前像素点归属为非显著非失真区域
其中,T
1为{S
3D(x,y)}通过大津法得到的自适应阈值,T
2=k
2σ
2,σ
2为{D
appear(x,y)}的标准差,k
2为控制参数,在此取k
2=1.54,S
3D(x
1,y
1)表示{S
3D(x,y)}中坐标位置为(x
1,y
1)的像素点的像素值,D
appear(x
1,y
1)表示{D
appear(x,y)}中坐标位置为(x
1,y
1)的像素点的像素值。
⑤-4、将{CMdis(x,y)}中下一个待处理的像素点作为当前像素点,然后返回步骤⑤-2继续执行,直至{CMdis(x,y)}中的所有像素点处理完毕。
⑥根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点的相位,并根据{CMdis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMdis(x,y)}中的每个像素点的相位;再根据{CMorg(x,y)}和{CMdis(x,y)}中的每个像素点的相位、{S3D(x,y)},并结合{CMdis(x,y)}中的每个像素点所属的区域,计算Sdis的图像质量客观评价预测值,记为Q。
在此具体实施例中,步骤⑥的具体过程为:
⑥-1、采用log-Gabor滤波器对{CM
org(x,y)}进行滤波处理,得到{CM
org(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{CM
org(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
其中,α表示log-Gabor滤波器的尺度因子,1≤α≤4,θ表示log-Gabor滤波器的方向因子,1≤θ≤4。
⑥-2、根据{CMorg(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CMorg(x,y)}中的每个像素点的相位,将{CMorg(x,y)}中坐标位置为(x,y)的像素点的相位记为LPorg(x,y), 其中,arctan()为取反正切函数。
⑥-3、按照步骤⑥-1至步骤⑥-2获取{CM
org(x,y)}中的每个像素点的相位的操作过程,以相同的方式获取{CM
dis(x,y)}中的每个像素点的相位,将{CM
dis(x,y)}中坐标位置为(x,y)的像素点的相位记为LP
dis(x,y)。即:获取{CM
dis(x,y)}中的每个像素点的相位的操作过程为:1)采用log-Gabor滤波器对{CM
dis(x,y)}进行滤波处理,得到{CM
dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,将{CM
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的偶对称频率响应记为
将{CM
dis(x,y)}中坐标位置为(x,y)的像素点在不同尺度和方向的奇对称频率响应记为
2)根据{CM
dis(x,y)}中的每个像素点在不同尺度和方向的偶对称频率响应和奇对称频率响应,计算{CM
dis(x,y)}中的每个像素点的相位,将{CM
dis(x,y)}中坐标位置为(x,y)的像素点的相位记为LP
dis(x,y),
其中,arctan()为取反正切函数。
⑥-4、根据{CM
org(x,y)}和{CM
dis(x,y)}中的每个像素点的相位、{S
3D(x,y)},并结合{CM
dis(x,y)}中的每个像素点所属的区域,计算S
dis的图像质量客观评价预测值,记为Q,Q=w
1×Q
1+w
2×Q
2+w
3×Q
3+w
4×Q
4,
其中,w
1表示Q
1的权重,w
2表示Q
2的权重,w
3表示Q
3的权重,w
4表示Q
4的权重,w
1+w
2+w
3+w
4=1,在此取w
1=0.475,w
2=0.280,w
3=0.045,w
4=0.200,C
1为控制参数,在此取C
1=0.000001。
⑦采用n幅原始的无失真的立体图像,建立其在不同失真类型不同失真程度下的失真立体图像集合,该失真立体图像集合包括多幅失真的立体图像,利用主观质量评价方法分别获取该失真立体图像集合中每幅失真的立体图像的平均主观评分差值,记为DMOS,DMOS=100-MOS,其中,MOS表示主观评分均值,DMOS∈[0,100],n≥1;然后按照步骤①至步骤⑥计算Sdis的图像质量客观评价预测值Q的操作,以相同的方式分别计算该失真立体图像集合中每幅失真的立体图像的图像质量客观评价预测值。
在本实施例中,利用9幅无失真的立体图像(图5a、图5b、图5c、图5d、图5e、图5f、图5g、图5h和图5i分别给出了立体图像的左视点图像),建立对应在高斯模糊下5个失真等级、高斯白噪声下5个失真等级、JPEG压缩下5个失真等级、JPEG2000压缩下5个失真等级、H.264压缩下6个失真等级的一共234幅失真立体图像作为测试立体图像。这234幅失真立体图像构成一个失真立体图像集合,利用现有的主观质量评价方法分别获取该失真立体图像集合中每幅失真的立体图像的平均主观评分差值,记为DMOS,DMOS=100-MOS,其中,MOS表示主观评分均值,DMOS∈[0,100];然后按照步骤①至步骤⑥计算Sdis的图像质量客观评价预测值Q的操作,以相同的方式分别计算该失真立体图像集合中每幅失真的立体图像的图像质量客观评价预测值。
采用图5a至图5i所示的9幅无失真的立体图像在不同程度的JPEG压缩、JPEG2000压缩、高斯模糊、白噪声和H.264编码失真情况下的234幅失真的立体图像来分析这234幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值之间的相关性。在本实施例中,利用评估图像质量评价方法的4个常用客观参量作为评价指标,即非线性回归条件下的Pearson相关系数(Pearson linear correlation coefficient,PLCC)、Spearman相关系数(Spearman rank order correlation coefficient,SROCC)、Kendall相关系数(Kendall rank-order correlation coefficient,KROCC)、均方误差(root mean squared error,RMSE),PLCC和RMSE反映失真的立体图像的图像质量客观评价预测值的准确性,SROCC和KROCC反映其单调性。将计算得到的234幅失真的立体图像的图像质量客观评价预测值做四参数Logistic函数非线性拟合,PLCC、SROCC和KROCC值越高、RMSE值越小说明本发明的质量客观评价方法与平均主观评分差值相关性越好。反映立体图像客观评价方法性能的PLCC、SROCC、KROCC和RMSE系数如表1所列,从表1所列的数据可知,按本发明方法得到的失真的立体图像的最终的图像质量客观评价预测值与平均主观评分差值之间的相关性是很高的,这充分表明了客观评价结果与人眼主观感知的结果较为一致,足以说明本发明方法的有效性。
将本发明方法与现有的全局评价方法的性能进行比较,全局评价方法直接从全局图像中得到图像质量评价预测值(不考虑不同区域的重要性),表2给出了本发明方法与全局评价方法的PLCC和SROCC性能的比较结果,从表2中可以看出,由于本发明方法根据区域重要性对各个区域分别进行评价,并对各个区域的客观评价度量值进行融合,得到的图像质量评价预测值与平均主观评分差值之间的相关性更强,足以说明本方法是有效的。
图6给出了234幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值的散点图,散点越集中,说明客观评价结果与主观感知的一致性越好。从图6中可以看出,采用本发明方法得到的散点图比较集中,与主观评价数据之间的吻合度较高。
表1利用本发明方法得到的234幅失真的立体图像的图像质量客观评价预测值与平均主观评分差值之间的相关性
表2本发明方法与全局评价方法的PLCC和SROCC性能的比较结果
评价方法 |
全局评价方法 |
本发明方法 |
PLCC |
0.9092 |
0.9303 |
SROCC |
0.9014 |
0.9189 |