CN107945151A

CN107945151A - 一种基于相似性变换的重定位图像质量评价方法

Info

Publication number: CN107945151A
Application number: CN201711017210.1A
Authority: CN
Inventors: 邵枫; 富振奇; 李福翠
Original assignee: Ningbo University
Current assignee: Benxi Steel Group Information Automation Co ltd; Dragon Totem Technology Hefei Co ltd
Priority date: 2017-10-26
Filing date: 2017-10-26
Publication date: 2018-04-20
Anticipated expiration: 2037-10-26
Also published as: CN107945151B

Abstract

本发明公开了一种基于相似性变换的重定位图像质量评价方法，其通过建立原始图像与重定位图像之间的匹配关系，得到重构的重定位图像；并通过建立重定位图像与原始图像之间的匹配关系，得到重构的原始图像；然后获取原始图像和重定位图像各自中的每个四边形网格的相似性变换矩阵；接着获取原始图像和重定位图像各自的视觉显著图；再根据上述信息，得到前向几何失真、后向几何失真、前向信息损失、后向信息损失；最后融合前向几何失真、后向几何失真、前向信息损失和后向信息损失得到重定位图像的客观质量评价预测值；优点是能够有效地提高客观评价结果与主观感知之间的相关性。

Description

一种基于相似性变换的重定位图像质量评价方法

技术领域

本发明涉及一种图像质量评价方法，尤其是涉及一种基于相似性变换的重定位图像质量评价方法。

背景技术

随着终端显示设备(例如智能手机、平板电脑、电视等)的快速发展与更新换代，具有不同分辨率和屏幕高宽比的终端显示设备充斥着人们的工作与生活。当需要显示的图像或视频的分辨率与屏幕的分辨率不相符时，如何在尽可能不改变用户观看体验的前提下，改变图像或视频的分辨率使之适应不同尺寸的终端显示设备，这就是重定位(retargeting)问题。当前解决重定位问题的方法有：缩放(scaling)、裁切(cropping)和变形(warping)等。然而，这些重定位方法没有充分利用终端显示设备的尺寸优势，降低了用户体验效果，因此对不同重定位方法的性能进行客观评价十分必要。

现有的重定位方法大多以像素点匹配为基础，建立原始图像和重定位图像之间的映射关系，并基于像素点匹配提取相应特征评价重定位图像质量。然而，重定位图像由不同的重定位操作得到，现有的重定位图像质量评价方法并不能很好地揭示两者之间的关系。因此，如何建立原始图像和重定位图像之间的映射关系，如何根据映射关系对图像分辨率、场景几何、语义内容等因素进行量化以反映质量退化程度，使得客观评价结果更加感觉符合人类视觉系统，都是在对重定位图像进行质量客观评价过程中需要研究解决的问题。

发明内容

本发明所要解决的技术问题是提供一种基于相似性变换的重定位图像质量评价方法，其能够有效地提高客观评价结果与主观感知之间的相关性。

本发明解决上述技术问题所采用的技术方案为：一种基于相似性变换的重定位图像质量评价方法，其特征在于包括以下步骤：

①令I_org表示原始图像，令I_ret表示I_org对应的重定位图像；将I_org中坐标位置为(x,y)的像素点的像素值记为I_org(x,y)，将I_ret中坐标位置为(x',y)的像素点的像素值记为I_ret(x',y)；其中，1≤x≤W，1≤y≤H，1≤x'≤W'，W表示I_org的宽度，W'表示I_ret的宽度，H表示I_org或I_ret的高度；

②采用SIFT-Flow方法建立I_org与I_ret之间的匹配关系，得到I_org中的每个像素点的SIFT-Flow向量，将I_org中坐标位置为(x,y)的像素点的SIFT-Flow向量记为v_O(x,y)，然后根据I_org中的所有像素点的SIFT-Flow向量，从I_org中得到重构的重定位图像，记为将中坐标位置为的像素点的像素值记为再判断中的每个像素点是否为空洞像素点，对于中坐标位置为(x',y)的像素点，若中坐标位置为(x',y)的像素点为空洞像素点，则令其中，用于表示水平方向，用于表示垂直方向，表示v_O(x,y)的水平偏移量，表示v_O(x,y)的垂直偏移量，中的“＝”为赋值符号；

同样，采用SIFT-Flow方法建立I_ret与I_org之间的匹配关系，得到I_ret中的每个像素点的SIFT-Flow向量，将I_ret中坐标位置为(x',y)的像素点的SIFT-Flow向量记为v_R(x',y)，然后根据I_ret中的所有像素点的SIFT-Flow向量，从I_ret中得到重构的原始图像，记为将中坐标位置为的像素点的像素值记为再判断中的每个像素点是否为空洞像素点，对于中坐标位置为(x,y)的像素点，若中坐标位置为(x,y)的像素点为空洞像素点，则令其中，表示v_R(x',y)的水平偏移量，表示v_R(x',y)的垂直偏移量，中的“＝”为赋值符号；

③将I_org分割成个互不重叠的尺寸大小为16×16的四边形网格；然后以I_org中的每个四边形网格的左上、左下、右上和右下4个网格顶点的集合来描述I_org中的每个四边形网格，将I_org中的第k个四边形网格记为U_O,k，其中，符号为向下取整运算符号，k为正整数，1≤k≤M，对应表示U_O,k的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，

同样，将I_ret分割成个互不重叠的尺寸大小为16×16的四边形网格；然后以I_ret中的每个四边形网格的左上、左下、右上和右下4个网格顶点的集合来描述I_ret中的每个四边形网格，将I_ret中的第k'个四边形网格记为U_R,k'，其中，k'为正整数，1≤k'≤M'，对应表示U_R,k'的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，

④根据I_org中的每个四边形网格的所有网格顶点的SIFT-Flow向量，得到I_org中的每个四边形网格在I_ret中匹配的四边形网格，将U_O,k在I_ret中匹配的四边形网格记为然后计算I_org中的每个四边形网格的相似性变换矩阵，将U_O,k的相似性变换矩阵记为其中，对应表示的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点，也即对应表示在I_ret中匹配的网格顶点、在I_ret中匹配的网格顶点、在I_ret中匹配的网格顶点、在I_ret中匹配的网格顶点，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，(A_O,k)^T为A_O,k的转置，((A_O,k)^TA_O,k)^-1为的维数为6×1；

同样，根据I_ret中的每个四边形网格的所有网格顶点的SIFT-Flow向量，得到I_ret中的每个四边形网格在I_org中匹配的四边形网格，将U_R,k'在I_org中匹配的四边形网格记为然后计算I_ret中的每个四边形网格的相似性变换矩阵，将U_R,k'的相似性变换矩阵记为其中，对应表示的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点，也即对应表示在I_org中匹配的网格顶点、在I_org中匹配的网格顶点、在I_org中匹配的网格顶点、在I_org中匹配的网格顶点，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，(A_R,k')^T为A_R,k'的转置，((A_R,k')^TA_R,k')^-1为(A_R,k')^TA_R,k'的逆，的维数为6×1；

⑤采用分层显著性检测模型提取出I_org的视觉显著图，记为{S_O(x,y)}；其中，S_O(x,y)表示{S_O(x,y)}中坐标位置为(x,y)的像素点的像素值；

同样，采用分层显著性检测模型提取出I_ret的视觉显著图，记为{S_R(x,y)}；其中，S_R(x,y)表示{S_R(x,y)}中坐标位置为(x,y)的像素点的像素值；

⑥根据I_org中的所有四边形网格的相似性变换矩阵，并结合{S_O(x,y)}，计算I_org的前向几何失真，记为f_FGD；

同样，根据I_ret中的所有四边形网格的相似性变换矩阵，并结合{S_R(x,y)}，计算I_ret的后向几何失真，记为f_BGD；

⑦根据{S_O(x,y)}、及I_org中的所有四边形网格在I_ret中匹配的四边形网格，计算I_org的前向信息损失，记为f_FIL；

同样，根据{S_R(x,y)}、及I_ret中的所有四边形网格在I_org中匹配的四边形网格，计算I_ret的后向信息损失，记为f_BIL；

⑧根据f_FGD、f_BGD、f_FIL和f_BIL，计算I_ret的客观质量评价预测值，记为Q，Q＝λ₁×(α₁×f_FGD+β₁×f_BGD)+λ₂×(α₂×f_FIL+β₂×f_BIL)，其中，α₁和β₁、α₂和β₂、λ₁和λ₂均为权重系数。

所述的步骤⑥中的f_FGD和f_BGD的计算过程为：

⑥_1、根据I_org中的每个四边形网格的相似性变换矩阵，计算I_org中的每个四边形网格的几何失真，将U_O,k的几何失真记为ζ_O,k，其中，表示中的第1个元素，表示中的第2个元素，表示中的第4个元素，表示中的第5个元素；

同样，根据I_ret中的每个四边形网格的相似性变换矩阵，计算I_ret中的每个四边形网格的几何失真，将U_R,k'的几何失真记为ζ_R,k'，其中，表示中的第1个元素，表示中的第2个元素，表示中的第4个元素，表示中的第5个元素；

⑥_2、根据I_org中的每个四边形网格的几何失真，并结合{S_O(x,y)}，计算I_org的前向几何失真f_FGD，其中，S_O(k)表示U_O,k中的所有像素点的视觉显著值的均值，也即表示{S_O(x,y)}中与U_O,k对应的区域中的所有像素点的像素值的均值；

同样，根据I_ret中的每个四边形网格的几何失真，并结合{S_R(x,y)}，计算I_ret的后向几何失真f_BGD，其中，S_R(k')表示U_R,k'中的所有像素点的视觉显著值的均值，也即表示{S_R(x,y)}中与U_R,k'对应的区域中的所有像素点的像素值的均值。

所述的步骤⑦中的f_FIL和f_BIL的计算过程为：其中，S_O(k)表示U_O,k中的所有像素点的视觉显著值的均值，也即表示{S_O(x,y)}中与U_O,k对应的区域中的所有像素点的像素值的均值，表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小；其中，S_R(k')表示U_R,k'中的所有像素点的视觉显著值的均值，也即表示{S_R(x,y)}中与U_R,k'对应的区域中的所有像素点的像素值的均值，表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小。

与现有技术相比，本发明的优点在于：

1)本发明方法利用相似性变换矩阵建立原始图像与重定位图像的变换关系，根据相似性变换矩阵估计四边形网格形变得到的重定位图像的几何失真，并根据四边形网格的面积变化计算重定位图像的信息损失，这样能够用统一的相似性变换来模拟各种重定位操作。

2)本发明方法考虑到重定位图像相对于原始图像的信息损失及原始图像相对于重定位图像的信息保持，分别计算前向几何失真、后向几何失真、前向信息损失及后向信息损失，这样能够有效地提高客观评价结果与主观感知之间的相关性。

附图说明

图1为本发明方法的总体实现框图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本发明提出的一种基于相似性变换的重定位图像质量评价方法，其总体实现框图如图1所示，其包括以下步骤：

①令I_org表示原始图像，令I_ret表示I_org对应的重定位图像；将I_org中坐标位置为(x,y)的像素点的像素值记为I_org(x,y)，将I_ret中坐标位置为(x',y)的像素点的像素值记为I_ret(x',y)；其中，1≤x≤W，1≤y≤H，1≤x'≤W'，W表示I_org的宽度，W'表示I_ret的宽度，H表示I_org或I_ret的高度。

②采用现有的SIFT-Flow方法建立I_org与I_ret之间的匹配关系，得到I_org中的每个像素点的SIFT-Flow向量，将I_org中坐标位置为(x,y)的像素点的SIFT-Flow向量记为然后根据I_org中的所有像素点的SIFT-Flow向量，从I_org中得到重构的重定位图像，记为将中坐标位置为的像素点的像素值记为再判断中的每个像素点是否为空洞像素点，对于中坐标位置为(x',y)的像素点，若中坐标位置为(x',y)的像素点为空洞像素点，则令其中，用于表示水平方向，用于表示垂直方向，表示v_O(x,y)的水平偏移量，表示v_O(x,y)的垂直偏移量，中的“＝”为赋值符号；

同样，采用现有的SIFT-Flow方法建立I_ret与I_org之间的匹配关系，得到I_ret中的每个像素点的SIFT-Flow向量，将I_ret中坐标位置为(x',y)的像素点的SIFT-Flow向量记为v_R(x',y)，然后根据I_ret中的所有像素点的SIFT-Flow向量，从I_ret中得到重构的原始图像，记为将中坐标位置为的像素点的像素值记为再判断中的每个像素点是否为空洞像素点，对于中坐标位置为(x,y)的像素点，若中坐标位置为(x,y)的像素点为空洞像素点，则令其中，表示v_R(x',y)的水平偏移量，表示v_R(x',y)的垂直偏移量，中的“＝”为赋值符号。

④根据I_org中的每个四边形网格的所有网格顶点的SIFT-Flow向量，得到I_org中的每个四边形网格在I_ret中匹配的四边形网格，将U_O,k在I_ret中匹配的四边形网格记为然后计算I_org中的每个四边形网格的相似性变换矩阵，将U_O,k的相似性变换矩阵记为其中，对应表示的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点，也即对应表示在I_ret中匹配的网格顶点、在I_ret中匹配的网格顶点、在I_ret中匹配的网格顶点、在I_ret中匹配的网格顶点，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，(A_O,k)^T为A_O,k的转置，((A_O,k)^TA_O,k)^-1为(A_O,k)^TA_O,k的逆，的维数为6×1；

同样，根据I_ret中的每个四边形网格的所有网格顶点的SIFT-Flow向量，得到I_ret中的每个四边形网格在I_org中匹配的四边形网格，将U_R,k'在I_org中匹配的四边形网格记为然后计算I_ret中的每个四边形网格的相似性变换矩阵，将U_R,k'的相似性变换矩阵记为其中，对应表示的左上网格顶点、左下网格顶点、右上网格顶点、右下网格顶点，也即对应表示在I_org中匹配的网格顶点、在I_org中匹配的网格顶点、在I_org中匹配的网格顶点、在I_org中匹配的网格顶点，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，以的水平坐标位置和垂直坐标位置来描述，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，表示的SIFT-Flow向量的水平偏移量，表示的SIFT-Flow向量的垂直偏移量，(A_R,k')^T为A_R,k'的转置，((A_R,k')^TA_R,k')^-1为(A_R,k')^TA_R,k'的逆，的维数为6×1。

⑤采用现有的分层显著性检测(Hierarchical saliency detection)模型提取出I_org的视觉显著图，记为{S_O(x,y)}；其中，S_O(x,y)表示{S_O(x,y)}中坐标位置为(x,y)的像素点的像素值；

同样，采用现有的分层显著性检测(Hierarchical saliency detection)模型提取出I_ret的视觉显著图，记为{S_R(x,y)}；其中，S_R(x,y)表示{S_R(x,y)}中坐标位置为(x,y)的像素点的像素值。

同样，根据I_ret中的所有四边形网格的相似性变换矩阵，并结合{S_R(x,y)}，计算I_ret的后向几何失真，记为f_BGD。

在此具体实施例中，步骤⑥中的f_FGD和f_BGD的计算过程为：

同样，根据I_ret中的每个四边形网格的相似性变换矩阵，计算I_ret中的每个四边形网格的几何失真，将U_R,k'的几何失真记为ζ_R,k'，其中，表示中的第1个元素，表示中的第2个元素，表示中的第4个元素，表示中的第5个元素。

同样，根据{S_R(x,y)}、及I_ret中的所有四边形网格在I_org中匹配的四边形网格，计算I_ret的后向信息损失，记为f_BIL。

在此具体实施例中，步骤⑦中的f_FIL和f_BIL的计算过程为：其中，S_O(k)表示U_O,k中的所有像素点的视觉显著值的均值，也即表示{S_O(x,y)}中与U_O,k对应的区域中的所有像素点的像素值的均值，表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小；其中，S_R(k')表示U_R,k'中的所有像素点的视觉显著值的均值，也即表示{S_R(x,y)}中与U_R,k'对应的区域中的所有像素点的像素值的均值，表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小。

⑧根据f_FGD、f_BGD、f_FIL和f_BIL，计算I_ret的客观质量评价预测值，记为Q，Q＝λ₁×(α₁×f_FGD+β₁×f_BGD)+λ₂×(α₂×f_FIL+β₂×f_BIL)，其中，α₁和β₁、α₂和β₂、λ₁和λ₂均为权重系数，在本实施例中取α₁＝0.71、β₁＝-0.29、α₂＝0.25、β₂＝-0.75、λ₁＝0.4、λ₂＝0.6。

为进一步说明本发明方法的可行性和有效性，对本发明方法进行试验。

在本实施例中，采用本发明方法对香港中文大学建立的重定位图像数据库进行测试，该重定位图像数据库包含57幅原始图像，每幅原始图像对应有由10种不同重定位方法得到的重定位图像，这样该重定位图像数据库共有570幅重定位图像，并给出了每幅重定位图像的平均主观评分均值。这里，利用评估图像质量评价方法的4个常用客观参量作为深度感知评价指标，即非线性回归条件下的Pearson相关系数(Pearson linear correlationcoefficient，PLCC)、Spearman相关系数(Spearman rank order correlationcoefficient，SROCC)、Kendall相关系数(Kendall rank-order correlationcoefficient，KROCC)、均方误差(root mean squared error，RMSE)，PLCC和RMSE反映重定位图像的客观评价结果的准确性，SROCC和KROCC反映其单调性。

将利用本发明方法计算得到的570幅重定位图像各自的客观质量评价预测值做五参数Logistic函数非线性拟合，PLCC、SROCC和KROCC值越高、RMSE值越小说明本发明方法的客观评价结果与平均主观评分均值的相关性越好。表1给出了本发明方法得到的客观质量评价预测值与平均主观评分均值之间的相关性，从表1中可以看出，采用本发明方法得到的客观质量评价预测值与平均主观评分均值之间的相关性是很高的，表明客观评价结果与人眼主观感知的结果较为一致，足以说明本发明方法的有效性。

表1本发明方法得到的客观质量评价预测值与平均主观评分均值之间的相关性

方法	PLCC	SROCC	KROCC	RMSE
					本发明方法	0.7056	0.7108	9.566	0.0117

Claims

1.一种基于相似性变换的重定位图像质量评价方法，其特征在于包括以下步骤：

2.根据权利要求1所述的一种基于相似性变换的重定位图像质量评价方法，其特征在于所述的步骤⑥中的f_FGD和f_BGD的计算过程为：

3.根据权利要求1或2所述的一种基于相似性变换的重定位图像质量评价方法，其特征在于所述的步骤⑦中的f_FIL和f_BIL的计算过程为：其中，S_O(k)表示U_O,k中的所有像素点的视觉显著值的均值，也即表示{S_O(x,y)}中与U_O,k对应的区域中的所有像素点的像素值的均值，表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小；其中，S_R(k')表示U_R,k'中的所有像素点的视觉显著值的均值，也即表示{S_R(x,y)}中与U_R,k'对应的区域中的所有像素点的像素值的均值，表示计算中与对应的区域中的所有非空洞像素点所占的区域面积大小。