基于组合神经网络和分类神经网络的图像质量评价方法
技术领域
本发明涉及一种图像质量评价方法,尤其是涉及一种基于组合神经网络和分类神经网络的图像质量评价方法。
背景技术
随着图像处理、机器学习和计算机视觉的快速发展,图像质量评价已成为越来越受关注的研究领域,因为它在实际应用中是一个重要的技术,可以用于精确评估图像的质量。在图像的获取、传输、压缩、存储和显示等过程中,往往会有不同程度的失真,如图像模糊、视频终端图像失真、系统中图像质量不达标等,因此,建立有效的图像质量评价机制非常重要。
一般来说,图像质量评价大致可以划分为两个不同的类别:主观图像质量评价方法和客观图像质量评价方法。前一类是基于人类观察者的主观判断;而后一类是采用客观度量,快速和精确地衡量一幅失真图像的质量。虽然主观图像质量评价方法提供的最终接收机制能够更加可靠的、精确和直接的量化图像感知质量,但是主观图像质量评价方法比较繁琐,并且许多情况下不容易实现(如实时和自动化系统)。因此,客观图像质量评价方法取得了飞速的发展。客观图像质量评价方法主要分为三种评价方法,即全参考图像质量评价方法、半参考图像质量评价方法和无参考图像质量评价方法,当前研究最多的是全参考图像质量评价方法,但是由于多数应用中无法获得相应的原始图像,因此无参考图像质量评价方法的研究更具实用价值。
现有的通用无参考图像质量评价方法主要是针对多种失真的无参考图像质量评价方法,对具体某种失真的针对性不够强,因此先对多种失真进行分类,然后再针对具体某种失真进行图像质量评价已成为人们越来越关注的方向。
发明内容
本发明所要解决的技术问题是提供一种基于组合神经网络和分类神经网络的图像质量评价方法,其充分考虑了不同失真类型对视觉质量的影响,有效地提高了客观评价结果与主观感知之间的相关性。
本发明解决上述技术问题所采用的技术方案为:一种基于组合神经网络和分类神经网络的图像质量评价方法,其特征在于包括训练阶段和测试阶段两个过程;
所述的训练阶段过程的具体步骤为:
步骤①_1:选取P幅原始的无失真图像,将第p幅原始的无失真图像记为
其中,P为正整数,P>1,p为正整数,1≤p≤P,1≤x≤W,1≤y≤H,W表示
的宽度,H表示
的高度,
表示
中坐标位置为(x,y)的像素点的像素值;
步骤①_2:利用jpeg2000失真生成方法,生成每幅原始的无失真图像在jpeg2000失真类型下的K个不同失真程度的失真图像,并将所有原始的无失真图像在jpeg2000失真类型下的不同失真程度的失真图像构成第一失真训练集,将第一失真训练集中
在jpeg2000失真类型下的第k幅失真图像记为
利用jpeg失真生成方法,生成每幅原始的无失真图像在jpeg失真类型下的K个不同失真程度的失真图像,并将所有原始的无失真图像在jpeg失真类型下的不同失真程度的失真图像构成第二失真训练集,将第二失真训练集中
在jpeg失真类型下的第k幅失真图像记为
利用高斯噪声失真生成方法,生成每幅原始的无失真图像在高斯噪声失真类型下的K个不同失真程度的失真图像,并将所有原始的无失真图像在高斯噪声失真类型下的不同失真程度的失真图像构成第三失真训练集,将第三失真训练集中
在高斯噪声失真类型下的第k幅失真图像记为
利用高斯模糊失真生成方法,生成每幅原始的无失真图像在高斯模糊失真类型下的K个不同失真程度的失真图像,并将所有原始的无失真图像在高斯模糊失真类型下的不同失真程度的失真图像构成第四失真训练集,将第四失真训练集中
在高斯模糊失真类型下的第k幅失真图像记为
其中,K为正整数,K>1,k为正整数,1≤k≤K,第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自包含P×K幅失真图像,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值;
步骤①_3:利用基于特征相似度的全参考图像质量评价方法,对第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像进行质量评价,获得第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像的客观真实质量图像,将
的客观真实质量图像记为
将
的客观真实质量图像记为
将
的客观真实质量图像记为
将
的客观真实质量图像记为
利用归一化方法,对第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像进行归一化处理,获得第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像的归一化图像,将
的归一化图像记为
将
的归一化图像记为
将
的归一化图像记为
将
的归一化图像记为
其中,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值;
步骤①_4:构建组合神经网络:该组合神经网络有输入层、非线性拟合层和预测层,非线性拟合层包括两个GoogleNet模块和三层卷积神经网络,两个GoogleNet模块均包括四个分支,第1个分支包括一层卷积层,该卷积层的神经元结点数为64,第2个分支包括两层卷积层,两层卷积层的神经元结点数分别为48、64,第3个分支包括三层卷积层,三层卷积层的神经元结点数分别为64、96、96,第4个分支包括一层均值池化层和一层卷积层,均值池化层的池化窗口大小为(3,3),卷积层的神经元结点数为64,第1个GoogleNet模块的4个分支连接到一起输入到第2个GoogleNet模块中,第2个GoogleNet模块的4个分支连接到一起输入到第1层卷积神经网络中,三层卷积神经网络的神经元结点数分别为128、64、1,参数mini-batch的大小为20,编译时使用的优化器为Adam,使用的激活函数都设置为修正线性单元函数;接着利用组合神经网络,将第一失真训练集中的每幅失真图像的客观真实质量图像作为监督,对第一失真训练集中的每幅失真图像的归一化图像进行训练,使得回归得到的质量图与客观真实质量图像之间的误差最小,得到最优的第一权值矢量和最优的第一偏置项;然后将最优的第一权值矢量和最优的第一偏置项作为组合神经网络的最优参数,进而构造得到最优的第一组合神经网络回归训练模型;
同样,利用组合神经网络,将第二失真训练集中的每幅失真图像的客观真实质量图像作为监督,对第二失真训练集中的每幅失真图像的归一化图像进行训练,使得回归得到的质量图与客观真实质量图像之间的误差最小,得到最优的第二权值矢量和最优的第二偏置项;然后将最优的第二权值矢量和最优的第二偏置项作为组合神经网络的最优参数,进而构造得到最优的第二组合神经网络回归训练模型;
利用组合神经网络,将第三失真训练集中的每幅失真图像的客观真实质量图像作为监督,对第三失真训练集中的每幅失真图像的归一化图像进行训练,使得回归得到的质量图与客观真实质量图像之间的误差最小,得到最优的第三权值矢量和最优的第三偏置项;然后将最优的第三权值矢量和最优的第三偏置项作为组合神经网络的最优参数,进而构造得到最优的第三组合神经网络回归训练模型;
利用组合神经网络,将第四失真训练集中的每幅失真图像的客观真实质量图像作为监督,对第四失真训练集中的每幅失真图像的归一化图像进行训练,使得回归得到的质量图与客观真实质量图像之间的误差最小,得到最优的第四权值矢量和最优的第四偏置项;然后将最优的第四权值矢量和最优的第四偏置项作为组合神经网络的最优参数,进而构造得到最优的第四组合神经网络回归训练模型;
步骤①_5:构建分类神经网络:该分类神经网络有输入层、非线性拟合层和预测层,非线性拟合层包括四层卷积神经网络,四层卷积神经网络的神经元结点数分别为16、32、128、256,预测层包括两层全连接层和一层分类层,两层全连接层的神经元结点数均为64,分类层的神经元结点数为4,参数mini-batch的大小为64,编译时使用的优化器为rmsprop,除分类层外所有层使用的激活函数都设置为修正线性单元函数,分类层使用的激活函数设置为softmax;接着利用分类神经网络,将第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集中的所有失真图像的分类标签作为监督,对第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像的归一化图像进行训练,使得分类得到的失真类型与分类标签之间的误差最小,得到最优的分类权值矢量和最优的分类偏置项;然后将最优的分类权值矢量和最优的分类偏置项作为分类神经网络的最优参数,进而构造得到分类神经网络训练模型;
所述的测试阶段过程的具体步骤为:
步骤②_1:令
表示待评价的失真图像;其中,1≤x'≤W',1≤y'≤H',W'表示
的宽度,H'表示
的高度,
表示
中坐标位置为(x',y')的像素点的像素值;
步骤②_2:利用归一化方法,对
进行归一化处理,获得
的归一化图像,记为
其中,
表示
中坐标位置为(x',y')的像素点的像素值;
利用图像显著性特征图提取方法,提取出
的显著图,记为
其中,
表示
中坐标位置为(x',y')的像素点的像素值;
步骤②_3:将
作为输入,输入到训练阶段过程构造得到的分类神经网络训练模型中,得到
的失真类型;
步骤②_4:若
的失真类型为jpeg2000,则将
作为输入,输入到训练阶段过程构造得到的第一组合神经网络回归训练模型中,得到
的客观质量评价预测质量图,记为
其中,
表示
中坐标位置为(x',y')的像素点的像素值;
若
的失真类型为jpeg,则将
作为输入,输入到训练阶段过程构造得到的第二组合神经网络回归训练模型中,得到
的客观质量评价预测质量图,记为
若
的失真类型为高斯噪声,则将
作为输入,输入到训练阶段过程构造得到的第三组合神经网络回归训练模型中,得到
的客观质量评价预测质量图,记为
若
的失真类型为高斯模糊,则将
作为输入,输入到训练阶段过程构造得到的第四组合神经网络回归训练模型中,得到
的客观质量评价预测质量图,记为
步骤②_5:使用
对
进行加权池化,得到
的客观质量评价加权预测值,记为Q。
所述的步骤①_4中,将组合神经网络的输入层输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
组合神经网络的非线性拟合层中的每个GoogleNet模块由四个分支组成,将组合神经网络的非线性拟合层中的第1个GoogleNet模块的第i个分支输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
将组合神经网络的非线性拟合层中的第2个GoogleNet模块的第i个分支输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
将组合神经网络的非线性拟合层中的第j层卷积神经网络输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
将组合神经网络的预测层输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
其中,g为正整数,1≤g≤G,G为正整数,G表示组合神经网络的每层输出的特征图的总幅数,max()为取最大值函数,
表示输入到组合神经网络的输入层中的图像中坐标位置为(x,y)的像素点的像素值,符号“*”为卷积运算符号,ω
0表示组合神经网络的输入层的权重参数,b
0表示组合神经网络的输入层的偏置项参数,i=1,2,3,4,
表示输入到组合神经网络的非线性拟合层中的第1个GoogleNet模块中的图像中坐标位置为(x,y)的像素点的像素值,
表示
的线性函数,
表示组合神经网络的非线性拟合层中的第1个GoogleNet模块的第i个分支的权重参数,
表示组合神经网络的非线性拟合层中的第1个GoogleNet模块的第i个分支的偏置项参数,
表示输入到组合神经网络的非线性拟合层中的第2个GoogleNet模块中的图像中坐标位置为(x,y)的像素点的像素值,
表示
的线性函数,
表示组合神经网络的非线性拟合层中的第2个GoogleNet模块的第i个分支的权重参数,
表示组合神经网络的非线性拟合层中的第2个GoogleNet模块的第i个分支的偏置项参数,j=1,2,3,
表示输入到组合神经网络的非线性拟合层中的第j层卷积神经网络中的图像中坐标位置为(x,y)的像素点的像素值,
表示
的线性函数,ω
j+2表示组合神经网络的非线性拟合层中的第j层卷积神经网络的权重参数,b
j+2表示组合神经网络的非线性拟合层中的第j层卷积神经网络的偏置项参数,
表示输入到组合神经网络的预测层中的图像中坐标位置为(x,y)的像素点的像素值,
表示
的线性函数,ω
6表示组合神经网络的预测层的权重参数,b
6表示组合神经网络的预测层的偏置项参数。
所述的步骤①_5中,将分类神经网络的输入层输出的第h幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
将分类神经网络的非线性拟合层中的第m层卷积神经网络输出的第h幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
其中,h为正整数,1≤h≤D,D为正整数,D表示分类神经网络的每层输出的特征图的总幅数,max()为取最大值函数,
表示输入到分类神经网络的输入层中的图像中坐标位置为(x,y)的像素点的像素值,符号“*”为卷积运算符号,ω'
0表示分类神经网络的输入层的权重参数,b'
0表示分类神经网络的输入层的偏置项参数,m=1,2,3,4,
表示输入到分类神经网络的非线性拟合层中的第m层卷积神经网络中的图像中坐标位置为(x,y)的像素点的像素值,
为
的线性函数,ω'
m表示分类神经网络的非线性拟合层中的第m层卷积神经网络的权重参数,b'
m表示分类神经网络的非线性拟合层中的第m层卷积神经网络的偏置项参数。
与现有技术相比,本发明的优点在于:
1)本发明方法在训练阶段将不同失真类型的失真图像分开进行训练,获得针对每种失真类型的最优的组合神经网络回归训练模型,针对性极强,即充分考虑了不同失真类型对主观视觉的影响,使客观评价值能更加准确地预测失真图像,有效地提高了客观评价结果与主观感知之间的相关性。
2)本发明方法在测试阶段同时考虑了失真图像的客观质量评价预测质量图和显著图,能够很好地反映各种因素的特征变化情况,符合质量评价特征。
附图说明
图1为本发明方法的总体实现框图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
本发明提出的一种基于组合神经网络和分类神经网络的图像质量评价方法,其总体实现框图如图1所示,其包括训练阶段和测试阶段两个过程;
所述的训练阶段过程的具体步骤为:
步骤①_1:选取P幅原始的无失真图像,将第p幅原始的无失真图像记为
其中,P为正整数,P>1,如取P=100,p为正整数,1≤p≤P,1≤x≤W,1≤y≤H,W表示
的宽度,H表示
的高度,
表示
中坐标位置为(x,y)的像素点的像素值。
步骤①_2:利用现有的jpeg2000失真生成方法,生成每幅原始的无失真图像在jpeg2000失真类型下的K个不同失真程度的失真图像,并将所有原始的无失真图像在jpeg2000失真类型下的不同失真程度的失真图像构成第一失真训练集,将第一失真训练集中
在jpeg2000失真类型下的第k幅失真图像记为
利用现有的jpeg失真生成方法,生成每幅原始的无失真图像在jpeg失真类型下的K个不同失真程度的失真图像,并将所有原始的无失真图像在jpeg失真类型下的不同失真程度的失真图像构成第二失真训练集,将第二失真训练集中
在jpeg失真类型下的第k幅失真图像记为
利用现有的高斯噪声失真生成方法,生成每幅原始的无失真图像在高斯噪声失真类型下的K个不同失真程度的失真图像,并将所有原始的无失真图像在高斯噪声失真类型下的不同失真程度的失真图像构成第三失真训练集,将第三失真训练集中
在高斯噪声失真类型下的第k幅失真图像记为
利用现有的高斯模糊失真生成方法,生成每幅原始的无失真图像在高斯模糊失真类型下的K个不同失真程度的失真图像,并将所有原始的无失真图像在高斯模糊失真类型下的不同失真程度的失真图像构成第四失真训练集,将第四失真训练集中
在高斯模糊失真类型下的第k幅失真图像记为
其中,K为正整数,K>1,如取K=15,k为正整数,1≤k≤K,第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自包含P×K幅失真图像,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值。
步骤①_3:利用现有的基于特征相似度(Feature Similarity,FSIM)的全参考图像质量评价方法,对第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像进行质量评价,获得第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像的客观真实质量图像,将
的客观真实质量图像记为
将
的客观真实质量图像记为
将
的客观真实质量图像记为
将
的客观真实质量图像记为
利用现有的归一化方法,对第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像进行归一化处理,获得第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像的归一化图像,将
的归一化图像记为
将
的归一化图像记为
将
的归一化图像记为
将
的归一化图像记为
其中,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值,
表示
中坐标位置为(x,y)的像素点的像素值。
步骤①_4:构建组合神经网络:该组合神经网络有输入层、非线性拟合层和预测层,非线性拟合层包括两个GoogleNet模块和三层卷积神经网络,两个GoogleNet模块均包括四个分支,第1个分支包括一层卷积层,该卷积层的神经元结点数为64,第2个分支包括两层卷积层,两层卷积层的神经元结点数分别为48、64,第3个分支包括三层卷积层,三层卷积层的神经元结点数分别为64、96、96,第4个分支包括一层均值池化层和一层卷积层,均值池化层的池化窗口大小为(3,3),卷积层的神经元结点数为64,第1个GoogleNet模块的4个分支连接到一起输入到第2个GoogleNet模块中,第2个GoogleNet模块的4个分支连接到一起输入到第1层卷积神经网络中,三层卷积神经网络的神经元结点数分别为128、64、1,参数mini-batch的大小为20,编译时使用的优化器为Adam,使用的激活函数都设置为修正线性单元函数(Rectified Linear Unit,ReLU),使用ReLU作为激活函数的原因是:ReLU可以通过简单地将零激活矩阵阈值化来实现,ReLU不会饱和,并且使用ReLU作为激活函数可以很大程度地加快随机梯度下降的收敛;由于该组合神经网络是由两个GoogleNet模块和三层卷积神经网络组合而成的神经网络框架,其能够有效学习单种失真类型的失真图像的归一化图像与客观真实质量图像之间的相关性,因此本发明方法接着利用组合神经网络,将第一失真训练集中的每幅失真图像的客观真实质量图像作为监督,对第一失真训练集中的每幅失真图像的归一化图像进行训练,使得回归得到的质量图与客观真实质量图像之间的误差最小,得到最优的第一权值矢量和最优的第一偏置项;然后将最优的第一权值矢量和最优的第一偏置项作为组合神经网络的最优参数,进而构造得到最优的第一组合神经网络回归训练模型。
同样,利用组合神经网络,将第二失真训练集中的每幅失真图像的客观真实质量图像作为监督,对第二失真训练集中的每幅失真图像的归一化图像进行训练,使得回归得到的质量图与客观真实质量图像之间的误差最小,得到最优的第二权值矢量和最优的第二偏置项;然后将最优的第二权值矢量和最优的第二偏置项作为组合神经网络的最优参数,进而构造得到最优的第二组合神经网络回归训练模型。
利用组合神经网络,将第三失真训练集中的每幅失真图像的客观真实质量图像作为监督,对第三失真训练集中的每幅失真图像的归一化图像进行训练,使得回归得到的质量图与客观真实质量图像之间的误差最小,得到最优的第三权值矢量和最优的第三偏置项;然后将最优的第三权值矢量和最优的第三偏置项作为组合神经网络的最优参数,进而构造得到最优的第三组合神经网络回归训练模型。
利用组合神经网络,将第四失真训练集中的每幅失真图像的客观真实质量图像作为监督,对第四失真训练集中的每幅失真图像的归一化图像进行训练,使得回归得到的质量图与客观真实质量图像之间的误差最小,得到最优的第四权值矢量和最优的第四偏置项;然后将最优的第四权值矢量和最优的第四偏置项作为组合神经网络的最优参数,进而构造得到最优的第四组合神经网络回归训练模型。
在本实施例中,步骤①_4中,将组合神经网络的输入层输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
组合神经网络的非线性拟合层中的每个GoogleNet模块由四个分支组成,将组合神经网络的非线性拟合层中的第1个GoogleNet模块的第i个分支输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
将组合神经网络的非线性拟合层中的第2个GoogleNet模块的第i个分支输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
将组合神经网络的非线性拟合层中的第j层卷积神经网络输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
将组合神经网络的预测层输出的第g幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
其中,g为正整数,1≤g≤G,G为正整数,G表示组合神经网络的每层输出的特征图的总幅数,max()为取最大值函数,
表示输入到组合神经网络的输入层中的图像中坐标位置为(x,y)的像素点的像素值,符号“*”为卷积运算符号,ω
0表示组合神经网络的输入层的权重参数,b
0表示组合神经网络的输入层的偏置项参数,i=1,2,3,4,
表示输入到组合神经网络的非线性拟合层中的第1个GoogleNet模块中的图像中坐标位置为(x,y)的像素点的像素值,
表示
的线性函数,
表示组合神经网络的非线性拟合层中的第1个GoogleNet模块的第i个分支的权重参数,
表示组合神经网络的非线性拟合层中的第1个GoogleNet模块的第i个分支的偏置项参数,
表示输入到组合神经网络的非线性拟合层中的第2个GoogleNet模块中的图像中坐标位置为(x,y)的像素点的像素值,
表示
的线性函数,
表示组合神经网络的非线性拟合层中的第2个GoogleNet模块的第i个分支的权重参数,
表示组合神经网络的非线性拟合层中的第2个GoogleNet模块的第i个分支的偏置项参数,j=1,2,3,
表示输入到组合神经网络的非线性拟合层中的第j层卷积神经网络中的图像中坐标位置为(x,y)的像素点的像素值,
表示
的线性函数,ω
j+2表示组合神经网络的非线性拟合层中的第j层卷积神经网络的权重参数,b
j+2表示组合神经网络的非线性拟合层中的第j层卷积神经网络的偏置项参数,
表示输入到组合神经网络的预测层中的图像中坐标位置为(x,y)的像素点的像素值,
表示
的线性函数,ω
6表示组合神经网络的预测层的权重参数,b
6表示组合神经网络的预测层的偏置项参数。
步骤①_5:构建分类神经网络:该分类神经网络有输入层、非线性拟合层和预测层,非线性拟合层包括四层卷积神经网络,四层卷积神经网络的神经元结点数分别为16、32、128、256,预测层包括两层全连接层和一层分类层,两层全连接层的神经元结点数均为64,分类层的神经元结点数为4,参数mini-batch的大小为64,编译时使用的优化器为rmsprop,除分类层外所有层使用的激活函数都设置为修正线性单元函数(RectifiedLinear Unit,ReLU),分类层使用的激活函数设置为softmax;该分类神经网络参考了现有的VGG16模型,其能够有效分类四种不同失真,因此本发明方法接着利用分类神经网络,将第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集中的所有失真图像的分类标签作为监督,对第一失真训练集、第二失真训练集、第三失真训练集和第四失真训练集各自中的每幅失真图像的归一化图像进行训练,使得分类得到的失真类型与分类标签之间的误差最小,得到最优的分类权值矢量和最优的分类偏置项;然后将最优的分类权值矢量和最优的分类偏置项作为分类神经网络的最优参数,进而构造得到分类神经网络训练模型。
在本实施例中,步骤①_5中,将分类神经网络的输入层输出的第h幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
将分类神经网络的非线性拟合层中的第m层卷积神经网络输出的第h幅特征图记为
将
中坐标位置为(x,y)的像素点的像素值记为
其中,h为正整数,1≤h≤D,D为正整数,D表示分类神经网络的每层输出的特征图的总幅数,max()为取最大值函数,
表示输入到分类神经网络的输入层中的图像中坐标位置为(x,y)的像素点的像素值,符号“*”为卷积运算符号,ω'
0表示分类神经网络的输入层的权重参数,b'
0表示分类神经网络的输入层的偏置项参数,m=1,2,3,4,
表示输入到分类神经网络的非线性拟合层中的第m层卷积神经网络中的图像中坐标位置为(x,y)的像素点的像素值,
为
的线性函数,ω'
m表示分类神经网络的非线性拟合层中的第m层卷积神经网络的权重参数,b'
m表示分类神经网络的非线性拟合层中的第m层卷积神经网络的偏置项参数。
所述的测试阶段过程的具体步骤为:
步骤②_1:令
表示待评价的失真图像;其中,1≤x'≤W',1≤y'≤H',W'表示
的宽度,H'表示
的高度,
表示
中坐标位置为(x',y')的像素点的像素值,W'可与W相同或不相同,H'可与H相同或不相同。
步骤②_2:利用现有的归一化方法,对
进行归一化处理,获得
的归一化图像,记为
其中,
表示
中坐标位置为(x',y')的像素点的像素值。
利用现有的图像显著性特征图提取方法,提取出
的显著图,记为
其中,
表示
中坐标位置为(x',y')的像素点的像素值。
步骤②_3:将
作为输入,输入到训练阶段过程构造得到的分类神经网络训练模型中,得到
的失真类型。
步骤②_4:若
的失真类型为jpeg2000,则将
作为输入,输入到训练阶段过程构造得到的第一组合神经网络回归训练模型中,得到
的客观质量评价预测质量图,记为
其中,
表示
中坐标位置为(x',y')的像素点的像素值。
若
的失真类型为jpeg,则将
作为输入,输入到训练阶段过程构造得到的第二组合神经网络回归训练模型中,得到
的客观质量评价预测质量图,记为
若
的失真类型为高斯噪声,则将
作为输入,输入到训练阶段过程构造得到的第三组合神经网络回归训练模型中,得到
的客观质量评价预测质量图,记为
若
的失真类型为高斯模糊,则将
作为输入,输入到训练阶段过程构造得到的第四组合神经网络回归训练模型中,得到
的客观质量评价预测质量图,记为
步骤②_5:使用
对
进行加权池化,得到
的客观质量评价加权预测值,记为Q。
为了进一步验证本发明方法的可行性和有效性,进行实验。
采用LIVE、CSIQ、TID2013三个失真图像数据库来分析利用本发明方法中的分类神经网络训练模型得到的失真图像的失真类型的准确率,如表1所列。从表1所列的数据可知,按本发明方法得到的失真图像的失真类型的准确率很高。
采用LIVE、CSIQ、TID2013三个失真图像数据库来分析利用本发明方法得到的失真图像的客观质量评价加权预测值与主观评分值之间的相关性。这里,利用评估图像质量评价方法的两个常用客观参量作为评价指标,即非线性回归条件下的Pearson相关系数(Pearson linear correlation coefficient,PLCC)、Spearman相关系数(Spearman rankorder correlation coefficient,SROCC),PLCC反映失真图像的客观质量评价加权预测值的准确性,SROCC反映其单调性。
利用现有的主观质量评价方法获得LIVE、CSIQ、TID2013三个失真图像数据库中的每幅失真图像的主观评分值,再利用本发明方法计算LIVE、CSIQ、TID2013三个失真图像数据库中的每幅失真图像的客观质量评价加权预测值。将按本发明方法计算得到的失真图像的客观质量评价加权预测值做五参数Logistic函数非线性拟合,PLCC和SROCC值越高说明客观评价方法的客观评价结果与主观评分值之间的相关性越好。反映本发明方法的质量评价性能的PLCC和SROCC相关系数如表2所列。从表2所列的数据可知,按本发明方法得到的失真图像的客观质量评价加权预测值与主观评分值之间的相关性是很好的,表明客观评价结果与人眼主观感知的结果较为一致,足以说明本发明方法的可行性和有效性。
表1利用本发明方法得到的失真图像的失真类型的准确率测试结果
失真图像数据库 |
LIVE |
CSIQ |
TID2013 |
准确率 |
0.9932 |
0.9921 |
0.9883 |
表2利用本发明方法得到的失真图像的客观质量评价加权预测值与主观评分值之间的相关性