发明内容
本发明所要解决的技术问题是提供一种全景视频质量评价方法,其能够有效地提高客观评价结果与主观感知之间的相关性。
本发明解决上述技术问题所采用的技术方案为:一种全景视频质量评价方法,其特征在于包括以下步骤:
步骤一:设定原始全景视频由若干个帧组的全景图像组成,并设定待评价的全景视频为原始全景视频对应的失真全景视频;将原始全景视频中的第u个帧组中的第t帧全景图像记为
将待评价的全景视频中的第u个帧组中的第t帧全景图像记为
其中,u和t均为正整数,u和t的初始值均为1,1≤u≤U,U为原始全景视频中包含的帧组的总个数,1≤t≤T,T为原始全景视频中的每个帧组中包含的全景图像的总帧数;
步骤二:采用立方体投影方法,将原始全景视频中的每个帧组中的每帧全景图像投影到立方体的六个作为投影面的平面上,得到原始全景视频中的每个帧组中的每帧全景图像在各个投影面上的图像,将
在第v个投影面上的图像记为
将
中坐标位置为(x,y)的像素点的像素值记为
同样,采用立方体投影方法,将待评价的全景视频中的每个帧组中的每帧全景图像投影到立方体的六个作为投影面的平面上,得到待评价的全景视频中的每个帧组中的每帧全景图像在各个投影面上的图像,将
在第v个投影面上的图像记为
将
中坐标位置为(x,y)的像素点的像素值记为
其中,v为正整数,v的初始值均为1,1≤v≤6,1≤x≤W,1≤y≤H,W表示
和
的宽度,H表示
和
的高度;
步骤三:计算原始全景视频中的每个帧组中的每帧全景图像在各个投影面上的图像与待评价的全景视频中对应帧组中的对应全景图像在对应投影面上的图像的空域相似性,将
与
的空域相似性记为η
u,v,t;然后计算原始全景视频与待评价的全景视频在每个帧组和每个投影面的空域相似性,将原始全景视频与待评价的全景视频在第u个帧组和第v个投影面的空域相似性记为η
u,v,
步骤四:计算原始全景视频与待评价的全景视频在每个帧组和每个投影面的频域相似性,将原始全景视频与待评价的全景视频在第u个帧组和第v个投影面的频域相似性记为ρu,v;
步骤五:根据原始全景视频与待评价的全景视频在所有帧组和所有投影面的空域相似性和频域相似性,计算待评价的全景视频的客观评价值,记为q,
所述的步骤三中的ηu,v,t的获取过程为:
步骤A1、采用Log-Gabor滤波器对
中的每个像素点进行滤波处理,得到
中的每个像素点在不同尺度和不同方向的偶对称频率响应和奇对称频率响应,将
中坐标位置为(x,y)的像素点在尺度因子为α和方向因子为θ的偶对称频率响应记为
将
中坐标位置为(x,y)的像素点在尺度因子为α和方向因子为θ的奇对称频率响应记为
同样,采用Log-Gabor滤波器对
中的每个像素点进行滤波处理,得到
中的每个像素点在不同尺度和不同方向的偶对称频率响应和奇对称频率响应,将
中坐标位置为(x,y)的像素点在尺度因子为α和方向因子为θ的偶对称频率响应记为
将
中坐标位置为(x,y)的像素点在尺度因子为α和方向因子为θ的奇对称频率响应记为
其中,1≤x≤W,1≤y≤H,W表示
和
的宽度,H表示
和
的高度,α表示Log-Gabor滤波器的尺度因子,α∈Ω
α,Ω
α={1.74,2.47,3.49,4.93,6.98,9.87},θ表示Log-Gabor滤波器的方向因子,θ∈Ω
θ,Ω
θ={0°,45°,90°,135°};
步骤A2、计算
中的每个像素点在不同方向的相位一致性特征,将
中坐标位置为(x,y)的像素点在方向因子为θ的相位一致性特征记为
同样,计算
中的每个像素点在不同方向的相位一致性特征,将
中坐标位置为(x,y)的像素点在方向因子为θ的相位一致性特征记为
其中,
步骤A3、根据
中的所有像素点在不同方向的相位一致性特征,获取
的相位一致性图,记为
将
中坐标位置为(x,y)的像素点的像素值记为
同样,根据
中的所有像素点在不同方向的相位一致性特征,获取
的相位一致性图,记为
将
中坐标位置为(x,y)的像素点的像素值记为
步骤A4、采用Sobel算子对
进行水平方向和垂直方向的边缘检测,得到
的水平梯度图和垂直梯度图,对应记为
和
同样,采用Sobel算子对
进行水平方向和垂直方向的边缘检测,得到
的水平梯度图和垂直梯度图,对应记为
和
然后计算
的梯度幅值图,记为
将
中坐标位置为(x,y)的像素点的像素值记为
同样,计算
的梯度幅值图,记为
将
中坐标位置为(x,y)的像素点的像素值记为
其中,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值;
步骤A5、将
从RGB颜色空间转化为YIQ颜色空间,得到
的亮度分量、第一色度分量和第二色度分量,对应记为
和
同样,将
从RGB颜色空间转化为YIQ颜色空间,得到
的亮度分量、第一色度分量和第二色度分量,对应记为
和
步骤A6、根据
和
和
和
和
计算
与
的空域相似性
其中,
其中,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,C
1和C
2为控制参数,λ为加权参数。
所述的步骤四中的ρu,v的获取过程为:
步骤B1、将原始全景视频中同一个帧组中投影到同一个投影面的所有全景图像中的像素点构成一个三维向量矩阵,将原始全景视频中的第u个帧组中投影到第v个投影面的所有全景图像中的像素点构成的三维向量矩阵记为
同样,将待评价的全景视频中同一个帧组中投影到同一个投影面的所有全景图像中的像素点构成一个三维向量矩阵,将待评价的全景视频中的第u个帧组中投影到第v个投影面的所有全景图像中的像素点构成的三维向量矩阵记为
其中,
表示
中下标位置为(x,y,t)的元素的值,
表示
中下标位置为(x,y,t)的元素的值,
和
中的“=”为赋值操作符号;
步骤B2、对
进行三维离散傅立叶变换,得到
的频率系数矩阵,记为
同样,对
进行三维离散傅立叶变换,得到
的频率系数矩阵,记为
其中,1≤h≤W,1≤k≤H,1≤s≤T,
表示
中下标位置为(h,k,s)的频率系数值,
表示
中下标位置为(h,k,s)的频率系数值;
步骤B3、计算
的二维功率谱密度矩阵,记为
同样,计算
的二维功率谱密度矩阵,记为
其中,
表示
中下标位置为(h,k)的功率谱密度值,
表示
中下标位置为(h,k)的功率谱密度值,符号“| |”为取绝对值符号;
其中,C
3为控制参数,exp()表示以自然基数为底的指数函数,
表示
中下标位置为(h+i,k+j)的功率谱密度值,
表示
中下标位置为(h+i,k+j)的功率谱密度值,
表示
中的所有功率谱密度的均值,
表示
中的所有功率谱密度的均值。
与现有技术相比,本发明的优点在于:
将原始全景视频和待评价的全景视频分成若干个帧组,并采用立方体投影方法投影到立方体的六个平面上,然后计算在每个帧组和每个投影面的空域相似性和频域相似性,并根据所有帧组和所有投影面的空域相似性和频域相似性,融合得到待评价的全景视频的客观评价值,由于立方体投影避免了复杂的视口预测,且提取的空域和时域特征具有较强的稳定性且能够较好地反映全景视频的质量变化情况,因此有效地提高了客观评价结果与主观感知之间的相关性。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提出的一种全景视频质量评价方法,其总体实现框图如图1所示,其包括以下步骤:
步骤一:设定原始全景视频由若干个帧组的全景图像组成,并设定待评价的全景视频为原始全景视频对应的失真全景视频;将原始全景视频中的第u个帧组中的第t帧全景图像记为
将待评价的全景视频中的第u个帧组中的第t帧全景图像记为
其中,u和t均为正整数,u和t的初始值均为1,1≤u≤U,U为原始全景视频中包含的帧组的总个数,U的值根据实际全景视频而定,1≤t≤T,T为原始全景视频中的每个帧组中包含的全景图像的总帧数,在本实施例中取T=30。
步骤二:采用现有的立方体投影(Cubemap Projection)方法,将原始全景视频中的每个帧组中的每帧全景图像投影到立方体的六个作为投影面的平面上,得到原始全景视频中的每个帧组中的每帧全景图像在各个投影面上的图像,将
在第v个投影面上的图像记为
将
中坐标位置为(x,y)的像素点的像素值记为
同样,采用现有的立方体投影(Cubemap Projection)方法,将待评价的全景视频中的每个帧组中的每帧全景图像投影到立方体的六个作为投影面的平面上,得到待评价的全景视频中的每个帧组中的每帧全景图像在各个投影面上的图像,将
在第v个投影面上的图像记为
将
中坐标位置为(x,y)的像素点的像素值记为
其中,v为正整数,v的初始值均为1,1≤v≤6,1≤x≤W,1≤y≤H,W表示
和
的宽度,H表示
和
的高度。
步骤三:计算原始全景视频中的每个帧组中的每帧全景图像在各个投影面上的图像与待评价的全景视频中对应帧组中的对应全景图像在对应投影面上的图像的空域相似性,将
与
的空域相似性记为η
u,v,t;然后计算原始全景视频与待评价的全景视频在每个帧组和每个投影面的空域相似性,将原始全景视频与待评价的全景视频在第u个帧组和第v个投影面的空域相似性记为η
u,v,
在此具体实施例中,步骤三中的ηu,v,t的获取过程为:
步骤A1、采用Log-Gabor滤波器对
中的每个像素点进行滤波处理,得到
中的每个像素点在不同尺度和不同方向的偶对称频率响应和奇对称频率响应,将
中坐标位置为(x,y)的像素点在尺度因子为α和方向因子为θ的偶对称频率响应记为
将
中坐标位置为(x,y)的像素点在尺度因子为α和方向因子为θ的奇对称频率响应记为
同样,采用Log-Gabor滤波器对
中的每个像素点进行滤波处理,得到
中的每个像素点在不同尺度和不同方向的偶对称频率响应和奇对称频率响应,将
中坐标位置为(x,y)的像素点在尺度因子为α和方向因子为θ的偶对称频率响应记为
将
中坐标位置为(x,y)的像素点在尺度因子为α和方向因子为θ的奇对称频率响应记为
其中,1≤x≤W,1≤y≤H,W表示
和
的宽度,H表示
和
的高度,α表示Log-Gabor滤波器的尺度因子,α∈Ω
α,Ω
α={1.74,2.47,3.49,4.93,6.98,9.87},θ表示Log-Gabor滤波器的方向因子,θ∈Ω
θ,Ω
θ={0°,45°,90°,135°}。
步骤A2、计算
中的每个像素点在不同方向的相位一致性特征,将
中坐标位置为(x,y)的像素点在方向因子为θ的相位一致性特征记为
同样,计算
中的每个像素点在不同方向的相位一致性特征,将
中坐标位置为(x,y)的像素点在方向因子为θ的相位一致性特征记为
其中,
步骤A3、根据
中的所有像素点在不同方向的相位一致性特征,获取
的相位一致性图,记为
将
中坐标位置为(x,y)的像素点的像素值记为
同样,根据
中的所有像素点在不同方向的相位一致性特征,获取
的相位一致性图,记为
将
中坐标位置为(x,y)的像素点的像素值记为
步骤A4、采用Sobel算子对
进行水平方向和垂直方向的边缘检测,得到
的水平梯度图和垂直梯度图,对应记为
和
同样,采用Sobel算子对
进行水平方向和垂直方向的边缘检测,得到
的水平梯度图和垂直梯度图,对应记为
和
然后计算
的梯度幅值图,记为
将
中坐标位置为(x,y)的像素点的像素值记为
同样,计算
的梯度幅值图,记为
将
中坐标位置为(x,y)的像素点的像素值记为
其中,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值。
步骤A5、将
从RGB颜色空间转化为YIQ颜色空间,得到
的亮度分量、第一色度分量(指分量I)和第二色度分量(指分量Q),对应记为
和
同样,将
从RGB颜色空间转化为YIQ颜色空间,得到
的亮度分量、第一色度分量(指分量I)和第二色度分量(指分量Q),对应记为
和
步骤A6、根据
和
和
和
和
计算
与
的空域相似性
其中,
其中,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,C
1和C
2为控制参数,在本实施例中取C
1=0.1、C
2=200,λ为加权参数,在本实施例中取λ=0.03。
步骤四:计算原始全景视频与待评价的全景视频在每个帧组和每个投影面的频域相似性,将原始全景视频与待评价的全景视频在第u个帧组和第v个投影面的频域相似性记为ρu,v。
在此具体实施例中,步骤四中的ρu,v的获取过程为:
步骤B1、将原始全景视频中同一个帧组中投影到同一个投影面的所有全景图像中的像素点构成一个三维向量矩阵,将原始全景视频中的第u个帧组中投影到第v个投影面的所有全景图像中的像素点构成的三维向量矩阵记为
同样,将待评价的全景视频中同一个帧组中投影到同一个投影面的所有全景图像中的像素点构成一个三维向量矩阵,将待评价的全景视频中的第u个帧组中投影到第v个投影面的所有全景图像中的像素点构成的三维向量矩阵记为
其中,
表示
中下标位置为(x,y,t)的元素的值,
表示
中下标位置为(x,y,t)的元素的值,
和
中的“=”为赋值操作符号。
步骤B2、对
进行三维离散傅立叶变换,得到
的频率系数矩阵,记为
同样,对
进行三维离散傅立叶变换,得到
的频率系数矩阵,记为
其中,1≤h≤W,1≤k≤H,1≤s≤T,
表示
中下标位置为(h,k,s)的频率系数值,
表示
中下标位置为(h,k,s)的频率系数值。
步骤B3、计算
的二维功率谱密度矩阵,记为
同样,计算
的二维功率谱密度矩阵,记为
其中,
表示
中下标位置为(h,k)的功率谱密度值,
表示
中下标位置为(h,k)的功率谱密度值,符号“| |”为取绝对值符号。
其中,C
3为控制参数,在本实施例中取C
3=4.5×10
-4,exp()表示以自然基数为底的指数函数,
表示
中下标位置为(h+i,k+j)的功率谱密度值,
表示
中下标位置为(h+i,k+j)的功率谱密度值,
表示
中的所有功率谱密度的均值,
表示
中的所有功率谱密度的均值。
步骤五:根据原始全景视频与待评价的全景视频在所有帧组和所有投影面的空域相似性和频域相似性,计算待评价的全景视频的客观评价值,记为q,
为了进一步说明本发明方法的可行性和有效性,对本发明方法进行试验。
在本实施例中,采用本发明方法对北京航天大学提供的VR-VQA48数据库和上海交通大学提供的IVQAD2017数据库进行测试,VR-VQA48数据库包含12组原始全景视频序列和36组失真全景视频序列,IVQAD2017包含10组原始全景视频序列和150组失真全景视频序列,并给出了每组失真全景视频序列的主观评分差值。这里,利用评估图像质量评价方法的4个常用客观参量作为深度感知评价指标,即非线性回归条件下的Pearson相关系数(Pearson linear correlation coefficient,PLCC)、Spearman相关系数(Spearman rankorder correlation coefficient,SROCC)、均方误差(root mean squared error,RMSE)、平均绝对误差(mean absolute error,MAE)。
将采用本发明方法分别计算VR-VQA48数据库的36组失真全景视频序列、IVQAD2017数据库的150组失真全景视频序列各自的客观评价值做五参数Logistic函数非线性拟合,PLCC和SROCC值越高、RMSE和MAE值越小说明客观评价方法与主观评分差值相关性越好。表1给出了采用本发明方法得到的客观评价值与主观评分差值之间的相关性。
表1采用本发明方法得到的客观评价值与主观评分差值之间的相关性
数据库 |
PLCC |
SROCC |
RMSE |
MAE |
VR-VQA48 |
0.863 |
0.851 |
6.245 |
5.321 |
IVQAD2017 |
0.844 |
0.774 |
0.249 |
0.210 |
从表1中可以看出,采用本发明方法得到的客观评价值与主观评分差值之间的相关性是很高的,表明客观评价结果与人眼主观感知的结果较为一致,足以说明本发明方法的有效性。