一种基于相似性变换的重定位图像质量评价方法
技术领域
本发明涉及一种图像质量评价方法,尤其是涉及一种基于相似性变换的重定位图像质量评价方法。
背景技术
随着终端显示设备(例如智能手机、平板电脑、电视等)的快速发展与更新换代,具有不同分辨率和屏幕高宽比的终端显示设备充斥着人们的工作与生活。当需要显示的图像或视频的分辨率与屏幕的分辨率不相符时,如何在尽可能不改变用户观看体验的前提下,改变图像或视频的分辨率使之适应不同尺寸的终端显示设备,这就是重定位(retargeting)问题。当前解决重定位问题的方法有:缩放(scaling)、裁切(cropping)和变形(warping)等。然而,这些重定位方法没有充分利用终端显示设备的尺寸优势,降低了用户体验效果,因此对不同重定位方法的性能进行客观评价十分必要。
现有的重定位方法大多以像素点匹配为基础,建立原始图像和重定位图像之间的映射关系,并基于像素点匹配提取相应特征评价重定位图像质量。然而,重定位图像由不同的重定位操作得到,现有的重定位图像质量评价方法并不能很好地揭示两者之间的关系。因此,如何建立原始图像和重定位图像之间的映射关系,如何根据映射关系对图像分辨率、场景几何、语义内容等因素进行量化以反映质量退化程度,使得客观评价结果更加感觉符合人类视觉系统,都是在对重定位图像进行质量客观评价过程中需要研究解决的问题。
发明内容
本发明所要解决的技术问题是提供一种基于相似性变换的重定位图像质量评价方法,其能够有效地提高客观评价结果与主观感知之间的相关性。
本发明解决上述技术问题所采用的技术方案为:一种基于相似性变换的重定位图像质量评价方法,其特征在于包括以下步骤:
①令Iorg表示原始图像,令Iret表示Iorg对应的重定位图像;将Iorg中坐标位置为(x,y)的像素点的像素值记为Iorg(x,y),将Iret中坐标位置为(x',y)的像素点的像素值记为Iret(x',y);其中,1≤x≤W,1≤y≤H,1≤x'≤W',W表示Iorg的宽度,W'表示Iret的宽度,H表示Iorg或Iret的高度;
②采用SIFT-Flow方法建立Iorg与Iret之间的匹配关系,得到Iorg中的每个像素点的SIFT-Flow向量,将Iorg中坐标位置为(x,y)的像素点的SIFT-Flow向量记为vO(x,y),然后根据Iorg中的所有像素点的SIFT-Flow向量,从Iorg中得到重构的重定位图像,记为将中坐标位置为的像素点的像素值记为再判断中的每个像素点是否为空洞像素点,对于中坐标位置为(x',y)的像素点,若中坐标位置为(x',y)的像素点为空洞像素点,则令其中,用于表示水平方向,用于表示垂直方向,表示vO(x,y)的水平偏移量,表示vO(x,y)的垂直偏移量,中的“=”为赋值符号;
同样,采用SIFT-Flow方法建立Iret与Iorg之间的匹配关系,得到Iret中的每个像素点的SIFT-Flow向量,将Iret中坐标位置为(x',y)的像素点的SIFT-Flow向量记为vR(x',y),然后根据Iret中的所有像素点的SIFT-Flow向量,从Iret中得到重构的原始图像,记为将中坐标位置为的像素点的像素值记为再判断中的每个像素点是否为空洞像素点,对于中坐标位置为(x,y)的像素点,若中坐标位置为(x,y)的像素点为空洞像素点,则令其中,表示vR(x',y)的水平偏移量,表示vR(x',y)的垂直偏移量,中的“=”为赋值符号;
③将Iorg分割成个互不重叠的尺寸大小为16×16的四边形网格;然后以Iorg中的每个四边形网格的左上、左下、右上和右下4个网格顶点的集合来描述Iorg中的每个四边形网格,将Iorg中的第k个四边形网格记为UO,k,其中,符号为向下取整运算符号,k为正整数,1≤k≤M, 对应表示UO,k的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述,
同样,将Iret分割成个互不重叠的尺寸大小为16×16的四边形网格;然后以Iret中的每个四边形网格的左上、左下、右上和右下4个网格顶点的集合来描述Iret中的每个四边形网格,将Iret中的第k'个四边形网格记为UR,k',其中,k'为正整数,1≤k'≤M', 对应表示UR,k'的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述,
④根据Iorg中的每个四边形网格的所有网格顶点的SIFT-Flow向量,得到Iorg中的每个四边形网格在Iret中匹配的四边形网格,将UO,k在Iret中匹配的四边形网格记为 然后计算Iorg中的每个四边形网格的相似性变换矩阵,将UO,k的相似性变换矩阵记为 其中,对应表示的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,也即对应表示在Iret中匹配的网格顶点、在Iret中匹配的网格顶点、在Iret中匹配的网格顶点、在Iret中匹配的网格顶点,以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,(AO,k)T为AO,k的转置,((AO,k)TAO,k)-1为 的维数为6×1;
同样,根据Iret中的每个四边形网格的所有网格顶点的SIFT-Flow向量,得到Iret中的每个四边形网格在Iorg中匹配的四边形网格,将UR,k'在Iorg中匹配的四边形网格记为 然后计算Iret中的每个四边形网格的相似性变换矩阵,将UR,k'的相似性变换矩阵记为 其中,对应表示的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,也即对应表示在Iorg中匹配的网格顶点、在Iorg中匹配的网格顶点、在Iorg中匹配的网格顶点、在Iorg中匹配的网格顶点,以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,(AR,k')T为AR,k'的转置,((AR,k')TAR,k')-1为(AR,k')TAR,k'的逆, 的维数为6×1;
⑤采用分层显著性检测模型提取出Iorg的视觉显著图,记为{SO(x,y)};其中,SO(x,y)表示{SO(x,y)}中坐标位置为(x,y)的像素点的像素值;
同样,采用分层显著性检测模型提取出Iret的视觉显著图,记为{SR(x,y)};其中,SR(x,y)表示{SR(x,y)}中坐标位置为(x,y)的像素点的像素值;
⑥根据Iorg中的所有四边形网格的相似性变换矩阵,并结合{SO(x,y)},计算Iorg的前向几何失真,记为fFGD;
同样,根据Iret中的所有四边形网格的相似性变换矩阵,并结合{SR(x,y)},计算Iret的后向几何失真,记为fBGD;
⑦根据{SO(x,y)}、及Iorg中的所有四边形网格在Iret中匹配的四边形网格,计算Iorg的前向信息损失,记为fFIL;
同样,根据{SR(x,y)}、及Iret中的所有四边形网格在Iorg中匹配的四边形网格,计算Iret的后向信息损失,记为fBIL;
⑧根据fFGD、fBGD、fFIL和fBIL,计算Iret的客观质量评价预测值,记为Q,Q=λ1×(α1×fFGD+β1×fBGD)+λ2×(α2×fFIL+β2×fBIL),其中,α1和β1、α2和β2、λ1和λ2均为权重系数。
所述的步骤⑥中的fFGD和fBGD的计算过程为:
⑥_1、根据Iorg中的每个四边形网格的相似性变换矩阵,计算Iorg中的每个四边形网格的几何失真,将UO,k的几何失真记为ζO,k,其中,表示中的第1个元素,表示中的第2个元素,表示中的第4个元素,表示中的第5个元素;
同样,根据Iret中的每个四边形网格的相似性变换矩阵,计算Iret中的每个四边形网格的几何失真,将UR,k'的几何失真记为ζR,k',其中,表示中的第1个元素,表示中的第2个元素,表示中的第4个元素,表示中的第5个元素;
⑥_2、根据Iorg中的每个四边形网格的几何失真,并结合{SO(x,y)},计算Iorg的前向几何失真fFGD,其中,SO(k)表示UO,k中的所有像素点的视觉显著值的均值,也即表示{SO(x,y)}中与UO,k对应的区域中的所有像素点的像素值的均值;
同样,根据Iret中的每个四边形网格的几何失真,并结合{SR(x,y)},计算Iret的后向几何失真fBGD,其中,SR(k')表示UR,k'中的所有像素点的视觉显著值的均值,也即表示{SR(x,y)}中与UR,k'对应的区域中的所有像素点的像素值的均值。
所述的步骤⑦中的fFIL和fBIL的计算过程为:其中,SO(k)表示UO,k中的所有像素点的视觉显著值的均值,也即表示{SO(x,y)}中与UO,k对应的区域中的所有像素点的像素值的均值,表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小;其中,SR(k')表示UR,k'中的所有像素点的视觉显著值的均值,也即表示{SR(x,y)}中与UR,k'对应的区域中的所有像素点的像素值的均值,表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小。
与现有技术相比,本发明的优点在于:
1)本发明方法利用相似性变换矩阵建立原始图像与重定位图像的变换关系,根据相似性变换矩阵估计四边形网格形变得到的重定位图像的几何失真,并根据四边形网格的面积变化计算重定位图像的信息损失,这样能够用统一的相似性变换来模拟各种重定位操作。
2)本发明方法考虑到重定位图像相对于原始图像的信息损失及原始图像相对于重定位图像的信息保持,分别计算前向几何失真、后向几何失真、前向信息损失及后向信息损失,这样能够有效地提高客观评价结果与主观感知之间的相关性。
附图说明
图1为本发明方法的总体实现框图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提出的一种基于相似性变换的重定位图像质量评价方法,其总体实现框图如图1所示,其包括以下步骤:
①令Iorg表示原始图像,令Iret表示Iorg对应的重定位图像;将Iorg中坐标位置为(x,y)的像素点的像素值记为Iorg(x,y),将Iret中坐标位置为(x',y)的像素点的像素值记为Iret(x',y);其中,1≤x≤W,1≤y≤H,1≤x'≤W',W表示Iorg的宽度,W'表示Iret的宽度,H表示Iorg或Iret的高度。
②采用现有的SIFT-Flow方法建立Iorg与Iret之间的匹配关系,得到Iorg中的每个像素点的SIFT-Flow向量,将Iorg中坐标位置为(x,y)的像素点的SIFT-Flow向量记为然后根据Iorg中的所有像素点的SIFT-Flow向量,从Iorg中得到重构的重定位图像,记为将中坐标位置为的像素点的像素值记为 再判断中的每个像素点是否为空洞像素点,对于中坐标位置为(x',y)的像素点,若中坐标位置为(x',y)的像素点为空洞像素点,则令其中,用于表示水平方向,用于表示垂直方向,表示vO(x,y)的水平偏移量,表示vO(x,y)的垂直偏移量,中的“=”为赋值符号;
同样,采用现有的SIFT-Flow方法建立Iret与Iorg之间的匹配关系,得到Iret中的每个像素点的SIFT-Flow向量,将Iret中坐标位置为(x',y)的像素点的SIFT-Flow向量记为vR(x',y),然后根据Iret中的所有像素点的SIFT-Flow向量,从Iret中得到重构的原始图像,记为将中坐标位置为的像素点的像素值记为 再判断中的每个像素点是否为空洞像素点,对于中坐标位置为(x,y)的像素点,若中坐标位置为(x,y)的像素点为空洞像素点,则令其中,表示vR(x',y)的水平偏移量,表示vR(x',y)的垂直偏移量,中的“=”为赋值符号。
③将Iorg分割成个互不重叠的尺寸大小为16×16的四边形网格;然后以Iorg中的每个四边形网格的左上、左下、右上和右下4个网格顶点的集合来描述Iorg中的每个四边形网格,将Iorg中的第k个四边形网格记为UO,k,其中,符号为向下取整运算符号,k为正整数,1≤k≤M, 对应表示UO,k的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述,
同样,将Iret分割成个互不重叠的尺寸大小为16×16的四边形网格;然后以Iret中的每个四边形网格的左上、左下、右上和右下4个网格顶点的集合来描述Iret中的每个四边形网格,将Iret中的第k'个四边形网格记为UR,k',其中,k'为正整数,1≤k'≤M', 对应表示UR,k'的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述,
④根据Iorg中的每个四边形网格的所有网格顶点的SIFT-Flow向量,得到Iorg中的每个四边形网格在Iret中匹配的四边形网格,将UO,k在Iret中匹配的四边形网格记为 然后计算Iorg中的每个四边形网格的相似性变换矩阵,将UO,k的相似性变换矩阵记为 其中,对应表示的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,也即对应表示在Iret中匹配的网格顶点、在Iret中匹配的网格顶点、在Iret中匹配的网格顶点、在Iret中匹配的网格顶点,以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,(AO,k)T为AO,k的转置,((AO,k)TAO,k)-1为(AO,k)TAO,k的逆, 的维数为6×1;
同样,根据Iret中的每个四边形网格的所有网格顶点的SIFT-Flow向量,得到Iret中的每个四边形网格在Iorg中匹配的四边形网格,将UR,k'在Iorg中匹配的四边形网格记为 然后计算Iret中的每个四边形网格的相似性变换矩阵,将UR,k'的相似性变换矩阵记为 其中,对应表示的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点,也即对应表示在Iorg中匹配的网格顶点、在Iorg中匹配的网格顶点、在Iorg中匹配的网格顶点、在Iorg中匹配的网格顶点,以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 以的水平坐标位置和垂直坐标位置来描述, 表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,表示的SIFT-Flow向量的水平偏移量,表示的SIFT-Flow向量的垂直偏移量,(AR,k')T为AR,k'的转置,((AR,k')TAR,k')-1为(AR,k')TAR,k'的逆, 的维数为6×1。
⑤采用现有的分层显著性检测(Hierarchical saliency detection)模型提取出Iorg的视觉显著图,记为{SO(x,y)};其中,SO(x,y)表示{SO(x,y)}中坐标位置为(x,y)的像素点的像素值;
同样,采用现有的分层显著性检测(Hierarchical saliency detection)模型提取出Iret的视觉显著图,记为{SR(x,y)};其中,SR(x,y)表示{SR(x,y)}中坐标位置为(x,y)的像素点的像素值。
⑥根据Iorg中的所有四边形网格的相似性变换矩阵,并结合{SO(x,y)},计算Iorg的前向几何失真,记为fFGD;
同样,根据Iret中的所有四边形网格的相似性变换矩阵,并结合{SR(x,y)},计算Iret的后向几何失真,记为fBGD。
在此具体实施例中,步骤⑥中的fFGD和fBGD的计算过程为:
⑥_1、根据Iorg中的每个四边形网格的相似性变换矩阵,计算Iorg中的每个四边形网格的几何失真,将UO,k的几何失真记为ζO,k,其中,表示中的第1个元素,表示中的第2个元素,表示中的第4个元素,表示中的第5个元素;
同样,根据Iret中的每个四边形网格的相似性变换矩阵,计算Iret中的每个四边形网格的几何失真,将UR,k'的几何失真记为ζR,k',其中,表示中的第1个元素,表示中的第2个元素,表示中的第4个元素,表示中的第5个元素。
⑥_2、根据Iorg中的每个四边形网格的几何失真,并结合{SO(x,y)},计算Iorg的前向几何失真fFGD,其中,SO(k)表示UO,k中的所有像素点的视觉显著值的均值,也即表示{SO(x,y)}中与UO,k对应的区域中的所有像素点的像素值的均值;
同样,根据Iret中的每个四边形网格的几何失真,并结合{SR(x,y)},计算Iret的后向几何失真fBGD,其中,SR(k')表示UR,k'中的所有像素点的视觉显著值的均值,也即表示{SR(x,y)}中与UR,k'对应的区域中的所有像素点的像素值的均值。
⑦根据{SO(x,y)}、及Iorg中的所有四边形网格在Iret中匹配的四边形网格,计算Iorg的前向信息损失,记为fFIL;
同样,根据{SR(x,y)}、及Iret中的所有四边形网格在Iorg中匹配的四边形网格,计算Iret的后向信息损失,记为fBIL。
在此具体实施例中,步骤⑦中的fFIL和fBIL的计算过程为:其中,SO(k)表示UO,k中的所有像素点的视觉显著值的均值,也即表示{SO(x,y)}中与UO,k对应的区域中的所有像素点的像素值的均值,表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小;其中,SR(k')表示UR,k'中的所有像素点的视觉显著值的均值,也即表示{SR(x,y)}中与UR,k'对应的区域中的所有像素点的像素值的均值,表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小。
⑧根据fFGD、fBGD、fFIL和fBIL,计算Iret的客观质量评价预测值,记为Q,Q=λ1×(α1×fFGD+β1×fBGD)+λ2×(α2×fFIL+β2×fBIL),其中,α1和β1、α2和β2、λ1和λ2均为权重系数,在本实施例中取α1=0.71、β1=-0.29、α2=0.25、β2=-0.75、λ1=0.4、λ2=0.6。
为进一步说明本发明方法的可行性和有效性,对本发明方法进行试验。
在本实施例中,采用本发明方法对香港中文大学建立的重定位图像数据库进行测试,该重定位图像数据库包含57幅原始图像,每幅原始图像对应有由10种不同重定位方法得到的重定位图像,这样该重定位图像数据库共有570幅重定位图像,并给出了每幅重定位图像的平均主观评分均值。这里,利用评估图像质量评价方法的4个常用客观参量作为深度感知评价指标,即非线性回归条件下的Pearson相关系数(Pearson linear correlationcoefficient,PLCC)、Spearman相关系数(Spearman rank order correlationcoefficient,SROCC)、Kendall相关系数(Kendall rank-order correlationcoefficient,KROCC)、均方误差(root mean squared error,RMSE),PLCC和RMSE反映重定位图像的客观评价结果的准确性,SROCC和KROCC反映其单调性。
将利用本发明方法计算得到的570幅重定位图像各自的客观质量评价预测值做五参数Logistic函数非线性拟合,PLCC、SROCC和KROCC值越高、RMSE值越小说明本发明方法的客观评价结果与平均主观评分均值的相关性越好。表1给出了本发明方法得到的客观质量评价预测值与平均主观评分均值之间的相关性,从表1中可以看出,采用本发明方法得到的客观质量评价预测值与平均主观评分均值之间的相关性是很高的,表明客观评价结果与人眼主观感知的结果较为一致,足以说明本发明方法的有效性。
表1本发明方法得到的客观质量评价预测值与平均主观评分均值之间的相关性
方法 |
PLCC |
SROCC |
KROCC |
RMSE |
本发明方法 |
0.7056 |
0.7108 |
9.566 |
0.0117 |