CN111353533A

CN111353533A - 基于多任务学习的无参考图像质量评价方法及系统

Info

Publication number: CN111353533A
Application number: CN202010118261.9A
Authority: CN
Inventors: 陈强; 李凯文
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2020-02-26
Filing date: 2020-02-26
Publication date: 2020-06-30
Anticipated expiration: 2040-02-26
Also published as: CN111353533B

Abstract

本发明公开了一种基于多任务学习的无参考图像质量评价方法及系统，方法包括：从图像质量评价数据库中采集若干图像；根据采集的图像构建训练标签；构建训练集和测试集；构建基于多任务学习的网络模型；利用训练集中的训练样本和对应的训练标签，对基于多任务学习的网络模型进行训练；将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数；根据预测分数求取图像的质量分数。多个公共数据库上的大量实验结果表明，本发明对各类型失真图像质量预测都能取得优良结果，具有良好的有效性及鲁棒性，所预测的图像质量分数精度较高，预测结果与全参考图像质量评价算法相当。

Description

基于多任务学习的无参考图像质量评价方法及系统

技术领域

本发明属于图像质量评价领域，特别涉及一种基于多任务学习的无参考图像质量评价方法及系统。

背景技术

因为技术和设备等方面的限制，在数字图像的采集、压缩存储、传输、解码以及显示等过程中不可避免的会遭受多种类型的失真降质，会造成一定程度的图像受损。图像质量评价技术指用主观或者客观的方法来度量图像的失真程度，通过设计图像质量相关的特征，并结合机器学习的方法来度量失真对图像质量的影响。

无参考图像质量评价方法，也称为盲图像质量评价BIQA(Blind Image QualityAssessment)，即在不需要原始无损参考图像信息的基础上直接对失真图像进行质量评价。因为完全摆脱了对原始无损参考图像的依赖性，因此与全参考和半参考方法相比，无参考方法具有更高的实际应用价值和最广阔的应用场景。

近年来无参考图像质量评价研究取得了很大的进展，出现很多优秀的算法。这些方法大多基于单任务进行学习，即学习从图像质量特征到主观意见分数的回归映射。基于深度学习的无参考图像质量评价方法是由数据驱动的，因此无参考图像质量评价任务最大的难点就是：公开数据集数据量太小，如LIVE数据库只有982幅图像；扩充数据库费时费力并且代价昂贵，如拥有3000幅图像的TID2013数据库则是由来自5个国家的971个观察者采用主观评价方法共给出524340个主观意见分数得到。一个网络模型的性能是随着其网络深度的增加提升的，越深的网络模型学习能力越强，在训练样本充足的情况下，可以取得更好的结果。但是因为训练样本数量的限制，大多数基于单任务学习的无参考图像质量评价方法网络模型都是浅层模型，其参数量远远小于大型深度网络，学习能力也远小于大型深度网络。比如有些方法采用数据增广策略，即裁剪小尺寸的图像块来作为训练样本，但是因为裁剪的图像块尺寸小，因此就只能使用浅层的网络来训练。这样就导致网络的学习能力较弱，不能够取得很好的结果。也有些方法采用预训练的方式，即在ImageNet数据库进行预训练，然后在图像质量评价数据库上精调网络，但是这种方法较为繁琐，使用起来较为不便。

上述方法均是采用单任务学习的方式，要么其浅层网络模型学习能力不强，要么其使用方法较为繁琐，都没有考虑使用多任务之间的信息交互来解决数据稀疏的问题。

发明内容

本发明的目的在于提供一种无需参考图像信息，且具有评价结果准确、泛化性良好等特点的图像质量评价方法及系统。

实现本发明目的的技术解决方案为：一种基于多任务学习的无参考图像质量评价方法，所述方法包括以下步骤：

步骤1，从图像质量评价数据库中采集若干图像；

步骤2，根据采集的图像构建训练标签；

步骤3，构建训练集和测试集；

步骤4、构建基于多任务学习的网络模型；

步骤5、利用训练集中的训练样本和对应的训练标签，对所述基于多任务学习的网络模型进行训练；

步骤6、将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数；

步骤7、根据预测分数求取图像的质量分数。

进一步地，步骤2所述根据采集的图像构建训练标签，具体过程包括：

步骤2-1、针对每一幅采集的图像，根据该图像对应的质量分数S以及选定的分数组距L，获取图像对应的质量等级G：

步骤2-2、根据所述质量等级G以及选定的分数组距L，获取图像对应的质量等级中心分数S1：

S1＝G*L-L/2

步骤2-3、根据所述质量分数S、质量等级G以及质量等级中心分数S1，构建一组1×3的一维向量即训练标签[S,G,S1]。

进一步地，步骤3所述构建训练集和测试集，具体包括：

步骤3-1，对采集的图像进行归一化预处理；

步骤3-2，将预处理后的图像划分为训练集和测试集；

步骤3-3，对训练集和测试集中的图像进行裁剪获得相应的数据样本。

进一步地，步骤3-3所述对训练集和测试集中的图像进行裁剪，获得相应的数据样本，具体包括：在图像上以步长Δl裁剪l×l大小的图像块作为数据样本，Δl和l的单位为像素。

进一步地，步骤4所述基于多任务学习的网络模型，具体包括：

依次连接的4个残差块，每个残差块均包括依次连接的3个卷积层，每个卷积层均为“CONV-BN-RELU”结构，即卷积层-BatchNorm层-ReLU激活层；

每个残差块之后均连接一个最大池化层，且最后一个最大池化层后依次连接两个全连接层，两个全连接层后均连接一个ReLU激活层；

之后连接多任务学习模块，该模块包括：分类子任务模块，用于执行图像质量等级G的分类任务，包括一个含有N个神经元的全连接层和一个SoftmaxWithLoss层，假设分数值范围为[a,b]，分数组距为L，则N＝(b-a)/L；第一线性回归子任务模块，用于执行回归到图像质量分数S的线性回归任务，包括一个含有一个神经元的全连接层和一个EuclideanLoss层；第二线性回归子任务模块，用于执行回归到对应质量等级中心S1的线性回归任务，包括一个含有一个神经元的全连接层和一个EuclideanLoss层；联系模块，用于进行线性回归，纠正所述分类子任务模块与第一线性回归子任务模块之间的偏差，包括一个EuclideanLoss层；所述第一线性回归子任务模块和分类子任务模块均与最后一个ReLU激活层相连，第二线性回归子任务模块与分类子任务模块中的全连接层相连，联系模块与第一和第二线性回归子任务模块中的全连接层均相连。

进一步地，所述卷积层卷积核的大小均为3×3；

所述4个残差块中卷积层的通道数依次为32，32，32，64，64，64，128，128，128，256，256，256；

所述卷积层的步长为1，补零设置为1；

所述最大池化层窗口大小设置为3×3，步长为2；

所述全连接层的通道数为512。

进一步地，步骤5中对所述基于多任务学习的网络模型进行训练，具体采用自适应矩估计算法进行训练。

进一步地，步骤7所述根据预测分数求取图像的质量分数，具体包括：根据来自于同一原图像的所有预测分数获取该原图像的质量分数，所用公式为：

式中，S_i为原图像对应的第i个图像块的预测分数，n为原图像裁剪后获得的图像块个数，S为原图像的质量分数。

一种基于多任务学习的无参考图像质量评价系统，所述系统包括：

采集模块，用于从图像质量评价数据库中采集若干图像；

第一构建模块，用于根据采集的图像构建训练标签；

第二构建模块，用于构建训练集和测试集；

第三构建模块，用于构建基于多任务学习的网络模型；

训练模块，用于利用训练集中的训练样本和对应的训练标签，对所述基于多任务学习的网络模型进行训练；

预测模块，用于将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数；

质量评价模块，用于根据预测分数求取图像的质量分数。

进一步地，所述第一构建模块包括：

第一求取单元，用于针对每一幅采集的图像，根据该图像对应的质量分数S以及选定的分数组距L，获取图像对应的质量等级G：

第二求取单元，用于根据所述质量等级G以及选定的分数组距L，获取图像对应的质量等级中心分数S1：

S1＝G*L-L/2

训练标签构建单元，用于根据所述质量分数S、质量等级G以及质量等级中心分数S1，构建一组1×3的一维向量即训练标签[S,G,S1]。

进一步地，所述第二构建模块，包括：

归一化单元，用于对采集的图像进行归一化预处理；

划分单元，用于将预处理后的图像划分为训练集和测试集；

样本生成单元，用于对训练集和测试集中的图像进行裁剪获得相应的数据样本。

本发明与现有技术相比，其显著优点为：1)利用多任务学习来完成无参考图像质量评价任务，选择的子任务是相关的，因此可以利用任务之间的信息交互来帮助缓解数据稀疏问题；2)与单任务学习相比，多任务学习中，一个子任务可以接受来自其他子任务的特征信息，间接增加了单个子任务样本空间的大小；3)不同任务之间通过相互提供特性信息，在一定程度上降低了单个子任务的过拟合风险，并且提高了其泛化能力；4)本发明设计了一个网络模型来同时实现图像质量分数的回归子任务和图像质量等级的分类子任务；因为两个子任务均与图像质量分数有关，因此这两个子任务的数据分布之间存在一定的相似性，即是说这两个子任务之间存在着极大的相关性，由此在训练过程中，两个子任务之间可以更好地互相学习互相促进提升；5)在两个子任务相关的基础上，加入一个联系单元用来纠正两个子任务的训练误差，不仅能进行中和处理以避免出现两者预测结果相差甚远的极端情况，如回归子任务预测分数很低，但是分类子任务预测等级很高，而且在两者预测很相近时，使得预测结果可以更加接近。

下面结合附图对本发明作进一步详细描述。

附图说明

图1为一个实施例中基于多任务学习的无参考图像质量评价方法的流程图。

图2为一个实施例中基于多任务学习的网络模型的架构图。

图3为一个实施例中不同分数组距与模型性能的关系图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在一个实施例中，结合图1，提供了一种基于多任务学习的无参考图像质量评价方法，该方法包括以下步骤：

步骤1，从图像质量评价数据库中采集若干图像；

步骤2，根据采集的图像构建训练标签；

步骤3，构建训练集和测试集；

步骤4、构建基于多任务学习的网络模型；

步骤5、利用训练集中的训练样本和对应的训练标签，对基于多任务学习的网络模型进行训练；

步骤7、根据预测分数求取图像的质量分数。

进一步地，在其中一个实施例中，上述步骤2根据采集的图像构建训练标签，具体过程包括：

步骤2-2、根据质量等级G以及选定的分数组距L，获取图像对应的质量等级中心分数S1：

S1＝G*L-L/2

步骤2-3、根据质量分数S、质量等级G以及质量等级中心分数S1，构建一组1×3的一维向量即训练标签[S,G,S1]。

进一步地，在其中一个实施例中，上述步骤3构建训练集和测试集，具体包括：

步骤3-1，对采集的图像进行归一化预处理；

步骤3-2，将预处理后的图像划分为训练集和测试集；

进一步地，在其中一个实施例中，上述步骤3-3对训练集和测试集中的图像进行裁剪，获得相应的数据样本，具体包括：在图像上以步长Δl裁剪l×l大小的图像块作为数据样本，Δl和l的单位为像素。

这里，Δl≥32，l≥32。

示例性优选地，Δl＝50，l×l＝128×128。

进一步地，在其中一个实施例中，结合图2，上述步骤4中基于多任务学习的网络模型，具体包括：

之后连接多任务学习模块，该模块包括：分类子任务模块，用于执行图像质量等级G的分类任务，包括一个含有N个神经元的全连接层和一个SoftmaxWithLoss层，假设分数值范围为[a,b]，分数组距为L，则N＝(b-a)/L；第一线性回归子任务模块，用于执行回归到图像质量分数S的线性回归任务，包括一个含有一个神经元的全连接层和一个EuclideanLoss层；第二线性回归子任务模块，用于执行回归到对应质量等级中心S1的线性回归任务，包括一个含有一个神经元的全连接层和一个EuclideanLoss层；联系模块，用于进行线性回归，纠正分类子任务模块与第一线性回归子任务模块之间的偏差，包括一个EuclideanLoss层；第一线性回归子任务模块和分类子任务模块均与最后一个ReLU激活层相连，第二线性回归子任务模块与分类子任务模块中的全连接层相连，联系模块与第一和第二线性回归子任务模块中的全连接层均相连。

进一步优选地，在其中一个实施例中，上述卷积层卷积核的大小均为3×3；

4个残差块中卷积层的通道数依次为32，32，32，64，64，64，128，128，128，256，256，256；

卷积层的步长为1，补零设置为1；

最大池化层窗口大小设置为3×3，步长为2；

全连接层的通道数为512。

进一步优选地，在其中一个实施例中，上述步骤5中对基于多任务学习的网络模型进行训练，具体采用自适应矩估计算法进行训练。

进一步地，在其中一个实施例中，上述步骤7根据预测分数求取图像的质量分数，具体包括：根据来自于同一原图像的所有预测分数获取该原图像的质量分数，所用公式为：

在一个实施例中，提供了一种基于多任务学习的无参考图像质量评价系统，该系统包括：

采集模块，用于从图像质量评价数据库中采集若干图像；

第一构建模块，用于根据采集的图像构建训练标签；

第二构建模块，用于构建训练集和测试集；

第三构建模块，用于构建基于多任务学习的网络模型；

训练模块，用于利用训练集中的训练样本和对应的训练标签，对基于多任务学习的网络模型进行训练；

质量评价模块，用于根据预测分数求取图像的质量分数。

进一步地，在其中一个实施例中，上述第一构建模块包括：

第二求取单元，用于根据质量等级G以及选定的分数组距L，获取图像对应的质量等级中心分数S1：

S1＝G*L-L/2

训练标签构建单元，用于根据质量分数S、质量等级G以及质量等级中心分数S1，构建一组1×3的一维向量即训练标签[S,G,S1]。

进一步地，在其中一个实施例中，上述第二构建模块，包括：

归一化单元，用于对采集的图像进行归一化预处理；

划分单元，用于将预处理后的图像划分为训练集和测试集；

关于基于多任务学习的无参考图像质量评价系统的进一步具体限定可以参见上文中对于基于多任务学习的无参考图像质量评价方法的限定，在此不再赘述。上述基于多任务学习的无参考图像质量评价系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

进一步地，作为一种具体示例，对本发明的基于多任务学习的无参考图像质量评价方法进行验证：

本实施例将针对下表1中所有数据库中的图像对本发明的方法进行验证。

表1本发明所用图像质量评价数据库的基本信息

首先在四个经典单重失真数据库上进行，包括：LIVE、CSIQ、TID2008和TID2013。针对每一个数据库，从中随机选择80％的参考图像对应的全部失真图像放入训练集，剩下20％参考图像对应的全部失真图像放入测试集。对训练集中的图像进行归一化处理之后，根据数据库提供的质量分数获得训练图像对应的训练标签。对预处理后的图像进行步长为50像素的裁剪，获得多个128×128尺寸大小的图像块，将图像块与对应的训练标签输入构建的模型进行训练。采用Adam算法来优化，学习率设置为0.01，每次训练的BatchSize设置为64，每迭代11个Epoch将学习率下降10倍，总共训练55个Epoch。对测试集中的图像同样进行归一化处理，然后裁剪预处理后的图像获得测试图像块，将测试图像块输入训练好的模型获得图像块的预测分数。将来自于同一原图像的所有图像块的预测分数取均值获得对应原图像的预测质量分数。然后利用图像质量评价的评价指标SROCC(预测单调性的斯皮尔曼排序相关系数)和LCC(衡量预测线性相关性的皮尔逊系数)进行算法性能对比，对比算法的结果如下表2和表3所示：

表2在LIVE、CSIQ、TID2008数据库上的性能对比

表3在TID2013数据库上的性能对比

由表2可以看出，本发明提出的基于多任务的无参考图像质量评价方法在三个数据库上均具有良好的性能，并且与全参考方法FSIM的结果相当，其中在TID2008上取得了最好的结果，甚至优于FSIM。由表3可以看出，在更具挑战性的TID2013数据库上，本发明取得了无参考方法中最好的性能结果和仅次于全参考方法VSI的性能结果。

一般来说，一个优秀的基于数据驱动的无参考图像质量评价算法，其模型应当能够在不同数据集不同图像语义的测试集上也得到良好的测试结果，也即是算法应当具有优良的泛化性能。跨数据库实验一般是用一个图像质量评价数据库来进行训练，然后在其他图像数据库上进行测试，以此来验证算法的泛化性能。因此本发明在四个数据库：LIVE、CSIQ、TID2013、IVC上进行验证。为了公平进行对比，采取在LIVE整体数据库上进行训练，在其他三个数据库上进行测试的实验方案。因为用于测试的三个数据库包含许多LIVE数据库没有的失真类型，测试过程中，我们仅选取与LIVE数据库共有的失真类型来进行测试，具体地，CSIQ和TID2013的测试数据包含白噪声失真、高斯模糊失真、JP2K压缩失真、JPEG压缩失真。IVC的测试数据包含JPEG压缩失真、JP2K压缩失真、高斯模糊失真。训练样本和测试样本的获取、测试结果的获取、优化算法的参数设置均与单重失真实验一致。同样采用评价指标SROCC和LCC来进行算法性能对比，对比算法结果如下表4所示：

表4在CSIQ、TID2013、IVC数据库上的跨库测试结果

由表4可知，本发明在三个数据库上的跨库实验都取得较优的结果。三个数据库上的对比实验表明本发明具有良好的泛化能力，即方法性能不依赖于某个特定的数据库。

接着需要验证本发明提出的多任务学习确实能取得比单任务学习更好的结果。该部分验证是在前面的基础上进一步验证的，将之前的多任务学习模块中的联系模块和分类模块均删除，所有的实验设定，如训练-测试实验划分，训练测试样本的获取、训练策略、参数的选择等，均与前面的实验相同。具体地，在2个单重失真数据库(TID2008、TID2013)上进行对比实验以及跨数据库上的对比实验。其中跨数据库实验为在LIVE整体数据库上进行训练，在其他三个数据库(CSIQ、TID2013、IVC)上进行测试的实验方案，结果如下表5和下表6所示：

表5多任务学习有效性实验I：在TID2008和TID2013的实验结果

表6多任务学习有效性实验II：跨数据库的实验结果

从表5和表6可以看出，多任务学习性能优于单任务学习性能，这表明本发明所提出的多任务学习的有效性。

然后需要证明本发明所提出的联系模块的有效性。该部分验证是在前面的基础上进一步验证的，将之前的多任务学习模块中的联系模块删除，所有的实验设定，如训练-测试实验划分，训练测试样本的获取、训练策略、参数的选择等，均与前面的实验相同。具体地，在单重失真数据库TID2013上进行对比实验，结果如下如表7所示：

表7消融实验结果

根据表2至表7中的结果，可以证明本发明提出的模型具有良好的有效性以及鲁棒性，对各类型失真图像质量预测都取得了优良性能。同时也证明了多任务学习的有效性。

最后进行实验以解释本发明为何选择2分组距作为一个质量等级。具体地，根据多个数据库的主观意见分数范围，选择1、2、5、10分作为一个质量等级。因为联系模块的回归是回归到等级中心，而过大的分数组距可能会导致误差的引入，因此就不尝试更大的分数组距。以TID2013数据库为例，10分组距中，一幅图像的主观意见分数是89，其对应的等级是9，联系模块回归的等级中心为区间[80,90]的中心85，这样就在一定程度上引入了误差，实验结果如图3所示。由图3可知，2分组距作为一个质量等级取得了最好的效果，因此选定2分组距作为本发明的训练参数。一分组距作为质量等级的情况下，因为分类差距不大，在一定程度上可以归于回归任务的范畴。而随着分数组距的增大，组距中心间接增加偏差，导致性能下降。

综上，本发明针对无参考图像质量评价问题提出了一种有效且鲁棒的方法及系统。将多任务学习引入到无参考评价领域。具体地，多任务由主观意见分数的回归子任务和图像主观意见分数质量等级的分类任务组成，并在其中加入了一个联系模块，用来纠正两个子任务的偏差，加深两个子任务之间的联系，且分类子任务中将主观意见分数转换到相应质量等级这一做法考虑到了个体的主观感知差异。多个公共数据库上的大量实验结果表明，本发明对各类型失真图像质量预测都能取得优良结果，具有良好的有效性及鲁棒性，所预测的图像质量分数精度较高，预测结果与全参考图像质量评价算法相当。

Claims

1.一种基于多任务学习的无参考图像质量评价方法，其特征在于，所述方法包括以下步骤：

步骤1，从图像质量评价数据库中采集若干图像；

步骤2，根据采集的图像构建训练标签；

步骤3，构建训练集和测试集；

步骤4、构建基于多任务学习的网络模型；

步骤7、根据预测分数求取图像的质量分数。

2.根据权利要求1所述的基于多任务学习的无参考图像质量评价方法，其特征在于，步骤2所述根据采集的图像构建训练标签，具体过程包括：

S1＝G*L-L/2

3.根据权利要求1或2所述的基于多任务学习的无参考图像质量评价方法，其特征在于，步骤3所述构建训练集和测试集，具体包括：

步骤3-1，对采集的图像进行归一化预处理；

步骤3-2，将预处理后的图像划分为训练集和测试集；

4.根据权利要求3所述的基于多任务学习的无参考图像质量评价方法，其特征在于，步骤3-3所述对训练集和测试集中的图像进行裁剪，获得相应的数据样本，具体包括：在图像上以步长Δl裁剪l×l大小的图像块作为数据样本，Δl和l的单位为像素。

5.根据权利要求4所述的基于多任务学习的无参考图像质量评价方法，其特征在于，步骤4所述基于多任务学习的网络模型，具体包括：

6.根据权利要求5所述的基于多任务学习的无参考图像质量评价方法，其特征在于，所述卷积层卷积核的大小均为3×3；

所述卷积层的步长为1，补零设置为1；

所述最大池化层窗口大小设置为3×3，步长为2；

所述全连接层的通道数为512。

7.根据权利要求6所述的基于多任务学习的无参考图像质量评价方法，其特征在于，步骤5中对所述基于多任务学习的网络模型进行训练，具体采用自适应矩估计算法进行训练。

8.根据权利要求7所述的基于多任务学习的无参考图像质量评价方法，其特征在于，步骤7所述根据预测分数求取图像的质量分数，具体包括：根据来自于同一原图像的所有预测分数获取该原图像的质量分数，所用公式为：

9.一种基于多任务学习的无参考图像质量评价系统，其特征在于，所述系统包括：

采集模块，用于从图像质量评价数据库中采集若干图像；

第一构建模块，用于根据采集的图像构建训练标签；

第二构建模块，用于构建训练集和测试集；

第三构建模块，用于构建基于多任务学习的网络模型；

质量评价模块，用于根据预测分数求取图像的质量分数。

10.根据权利要求9所述的基于多任务学习的无参考图像质量评价系统，其特征在于，所述第一构建模块包括：

S1＝G*L-L/2

训练标签构建单元，用于根据所述质量分数S、质量等级G以及质量等级中心分数S1，构建一组1×3的一维向量即训练标签[S,G,S1]；

所述第二构建模块，包括：

归一化单元，用于对采集的图像进行归一化预处理；

划分单元，用于将预处理后的图像划分为训练集和测试集；