CN111353533A - 基于多任务学习的无参考图像质量评价方法及系统 - Google Patents

基于多任务学习的无参考图像质量评价方法及系统 Download PDF

Info

Publication number
CN111353533A
CN111353533A CN202010118261.9A CN202010118261A CN111353533A CN 111353533 A CN111353533 A CN 111353533A CN 202010118261 A CN202010118261 A CN 202010118261A CN 111353533 A CN111353533 A CN 111353533A
Authority
CN
China
Prior art keywords
image
quality
training
score
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010118261.9A
Other languages
English (en)
Other versions
CN111353533B (zh
Inventor
陈强
李凯文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202010118261.9A priority Critical patent/CN111353533B/zh
Publication of CN111353533A publication Critical patent/CN111353533A/zh
Application granted granted Critical
Publication of CN111353533B publication Critical patent/CN111353533B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于多任务学习的无参考图像质量评价方法及系统,方法包括:从图像质量评价数据库中采集若干图像;根据采集的图像构建训练标签;构建训练集和测试集;构建基于多任务学习的网络模型;利用训练集中的训练样本和对应的训练标签,对基于多任务学习的网络模型进行训练;将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数;根据预测分数求取图像的质量分数。多个公共数据库上的大量实验结果表明,本发明对各类型失真图像质量预测都能取得优良结果,具有良好的有效性及鲁棒性,所预测的图像质量分数精度较高,预测结果与全参考图像质量评价算法相当。

Description

基于多任务学习的无参考图像质量评价方法及系统
技术领域
本发明属于图像质量评价领域,特别涉及一种基于多任务学习的无参考图像质量评价方法及系统。
背景技术
因为技术和设备等方面的限制,在数字图像的采集、压缩存储、传输、解码以及显示等过程中不可避免的会遭受多种类型的失真降质,会造成一定程度的图像受损。图像质量评价技术指用主观或者客观的方法来度量图像的失真程度,通过设计图像质量相关的特征,并结合机器学习的方法来度量失真对图像质量的影响。
无参考图像质量评价方法,也称为盲图像质量评价BIQA(Blind Image QualityAssessment),即在不需要原始无损参考图像信息的基础上直接对失真图像进行质量评价。因为完全摆脱了对原始无损参考图像的依赖性,因此与全参考和半参考方法相比,无参考方法具有更高的实际应用价值和最广阔的应用场景。
近年来无参考图像质量评价研究取得了很大的进展,出现很多优秀的算法。这些方法大多基于单任务进行学习,即学习从图像质量特征到主观意见分数的回归映射。基于深度学习的无参考图像质量评价方法是由数据驱动的,因此无参考图像质量评价任务最大的难点就是:公开数据集数据量太小,如LIVE数据库只有982幅图像;扩充数据库费时费力并且代价昂贵,如拥有3000幅图像的TID2013数据库则是由来自5个国家的971个观察者采用主观评价方法共给出524340个主观意见分数得到。一个网络模型的性能是随着其网络深度的增加提升的,越深的网络模型学习能力越强,在训练样本充足的情况下,可以取得更好的结果。但是因为训练样本数量的限制,大多数基于单任务学习的无参考图像质量评价方法网络模型都是浅层模型,其参数量远远小于大型深度网络,学习能力也远小于大型深度网络。比如有些方法采用数据增广策略,即裁剪小尺寸的图像块来作为训练样本,但是因为裁剪的图像块尺寸小,因此就只能使用浅层的网络来训练。这样就导致网络的学习能力较弱,不能够取得很好的结果。也有些方法采用预训练的方式,即在ImageNet数据库进行预训练,然后在图像质量评价数据库上精调网络,但是这种方法较为繁琐,使用起来较为不便。
上述方法均是采用单任务学习的方式,要么其浅层网络模型学习能力不强,要么其使用方法较为繁琐,都没有考虑使用多任务之间的信息交互来解决数据稀疏的问题。
发明内容
本发明的目的在于提供一种无需参考图像信息,且具有评价结果准确、泛化性良好等特点的图像质量评价方法及系统。
实现本发明目的的技术解决方案为:一种基于多任务学习的无参考图像质量评价方法,所述方法包括以下步骤:
步骤1,从图像质量评价数据库中采集若干图像;
步骤2,根据采集的图像构建训练标签;
步骤3,构建训练集和测试集;
步骤4、构建基于多任务学习的网络模型;
步骤5、利用训练集中的训练样本和对应的训练标签,对所述基于多任务学习的网络模型进行训练;
步骤6、将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数;
步骤7、根据预测分数求取图像的质量分数。
进一步地,步骤2所述根据采集的图像构建训练标签,具体过程包括:
步骤2-1、针对每一幅采集的图像,根据该图像对应的质量分数S以及选定的分数组距L,获取图像对应的质量等级G:
Figure BDA0002392151130000021
步骤2-2、根据所述质量等级G以及选定的分数组距L,获取图像对应的质量等级中心分数S1:
S1=G*L-L/2
步骤2-3、根据所述质量分数S、质量等级G以及质量等级中心分数S1,构建一组1×3的一维向量即训练标签[S,G,S1]。
进一步地,步骤3所述构建训练集和测试集,具体包括:
步骤3-1,对采集的图像进行归一化预处理;
步骤3-2,将预处理后的图像划分为训练集和测试集;
步骤3-3,对训练集和测试集中的图像进行裁剪获得相应的数据样本。
进一步地,步骤3-3所述对训练集和测试集中的图像进行裁剪,获得相应的数据样本,具体包括:在图像上以步长Δl裁剪l×l大小的图像块作为数据样本,Δl和l的单位为像素。
进一步地,步骤4所述基于多任务学习的网络模型,具体包括:
依次连接的4个残差块,每个残差块均包括依次连接的3个卷积层,每个卷积层均为“CONV-BN-RELU”结构,即卷积层-BatchNorm层-ReLU激活层;
每个残差块之后均连接一个最大池化层,且最后一个最大池化层后依次连接两个全连接层,两个全连接层后均连接一个ReLU激活层;
之后连接多任务学习模块,该模块包括:分类子任务模块,用于执行图像质量等级G的分类任务,包括一个含有N个神经元的全连接层和一个SoftmaxWithLoss层,假设分数值范围为[a,b],分数组距为L,则N=(b-a)/L;第一线性回归子任务模块,用于执行回归到图像质量分数S的线性回归任务,包括一个含有一个神经元的全连接层和一个EuclideanLoss层;第二线性回归子任务模块,用于执行回归到对应质量等级中心S1的线性回归任务,包括一个含有一个神经元的全连接层和一个EuclideanLoss层;联系模块,用于进行线性回归,纠正所述分类子任务模块与第一线性回归子任务模块之间的偏差,包括一个EuclideanLoss层;所述第一线性回归子任务模块和分类子任务模块均与最后一个ReLU激活层相连,第二线性回归子任务模块与分类子任务模块中的全连接层相连,联系模块与第一和第二线性回归子任务模块中的全连接层均相连。
进一步地,所述卷积层卷积核的大小均为3×3;
所述4个残差块中卷积层的通道数依次为32,32,32,64,64,64,128,128,128,256,256,256;
所述卷积层的步长为1,补零设置为1;
所述最大池化层窗口大小设置为3×3,步长为2;
所述全连接层的通道数为512。
进一步地,步骤5中对所述基于多任务学习的网络模型进行训练,具体采用自适应矩估计算法进行训练。
进一步地,步骤7所述根据预测分数求取图像的质量分数,具体包括:根据来自于同一原图像的所有预测分数获取该原图像的质量分数,所用公式为:
Figure BDA0002392151130000031
式中,Si为原图像对应的第i个图像块的预测分数,n为原图像裁剪后获得的图像块个数,S为原图像的质量分数。
一种基于多任务学习的无参考图像质量评价系统,所述系统包括:
采集模块,用于从图像质量评价数据库中采集若干图像;
第一构建模块,用于根据采集的图像构建训练标签;
第二构建模块,用于构建训练集和测试集;
第三构建模块,用于构建基于多任务学习的网络模型;
训练模块,用于利用训练集中的训练样本和对应的训练标签,对所述基于多任务学习的网络模型进行训练;
预测模块,用于将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数;
质量评价模块,用于根据预测分数求取图像的质量分数。
进一步地,所述第一构建模块包括:
第一求取单元,用于针对每一幅采集的图像,根据该图像对应的质量分数S以及选定的分数组距L,获取图像对应的质量等级G:
Figure BDA0002392151130000041
第二求取单元,用于根据所述质量等级G以及选定的分数组距L,获取图像对应的质量等级中心分数S1:
S1=G*L-L/2
训练标签构建单元,用于根据所述质量分数S、质量等级G以及质量等级中心分数S1,构建一组1×3的一维向量即训练标签[S,G,S1]。
进一步地,所述第二构建模块,包括:
归一化单元,用于对采集的图像进行归一化预处理;
划分单元,用于将预处理后的图像划分为训练集和测试集;
样本生成单元,用于对训练集和测试集中的图像进行裁剪获得相应的数据样本。
本发明与现有技术相比,其显著优点为:1)利用多任务学习来完成无参考图像质量评价任务,选择的子任务是相关的,因此可以利用任务之间的信息交互来帮助缓解数据稀疏问题;2)与单任务学习相比,多任务学习中,一个子任务可以接受来自其他子任务的特征信息,间接增加了单个子任务样本空间的大小;3)不同任务之间通过相互提供特性信息,在一定程度上降低了单个子任务的过拟合风险,并且提高了其泛化能力;4)本发明设计了一个网络模型来同时实现图像质量分数的回归子任务和图像质量等级的分类子任务;因为两个子任务均与图像质量分数有关,因此这两个子任务的数据分布之间存在一定的相似性,即是说这两个子任务之间存在着极大的相关性,由此在训练过程中,两个子任务之间可以更好地互相学习互相促进提升;5)在两个子任务相关的基础上,加入一个联系单元用来纠正两个子任务的训练误差,不仅能进行中和处理以避免出现两者预测结果相差甚远的极端情况,如回归子任务预测分数很低,但是分类子任务预测等级很高,而且在两者预测很相近时,使得预测结果可以更加接近。
下面结合附图对本发明作进一步详细描述。
附图说明
图1为一个实施例中基于多任务学习的无参考图像质量评价方法的流程图。
图2为一个实施例中基于多任务学习的网络模型的架构图。
图3为一个实施例中不同分数组距与模型性能的关系图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,结合图1,提供了一种基于多任务学习的无参考图像质量评价方法,该方法包括以下步骤:
步骤1,从图像质量评价数据库中采集若干图像;
步骤2,根据采集的图像构建训练标签;
步骤3,构建训练集和测试集;
步骤4、构建基于多任务学习的网络模型;
步骤5、利用训练集中的训练样本和对应的训练标签,对基于多任务学习的网络模型进行训练;
步骤6、将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数;
步骤7、根据预测分数求取图像的质量分数。
进一步地,在其中一个实施例中,上述步骤2根据采集的图像构建训练标签,具体过程包括:
步骤2-1、针对每一幅采集的图像,根据该图像对应的质量分数S以及选定的分数组距L,获取图像对应的质量等级G:
Figure BDA0002392151130000061
步骤2-2、根据质量等级G以及选定的分数组距L,获取图像对应的质量等级中心分数S1:
S1=G*L-L/2
步骤2-3、根据质量分数S、质量等级G以及质量等级中心分数S1,构建一组1×3的一维向量即训练标签[S,G,S1]。
进一步地,在其中一个实施例中,上述步骤3构建训练集和测试集,具体包括:
步骤3-1,对采集的图像进行归一化预处理;
步骤3-2,将预处理后的图像划分为训练集和测试集;
步骤3-3,对训练集和测试集中的图像进行裁剪获得相应的数据样本。
进一步地,在其中一个实施例中,上述步骤3-3对训练集和测试集中的图像进行裁剪,获得相应的数据样本,具体包括:在图像上以步长Δl裁剪l×l大小的图像块作为数据样本,Δl和l的单位为像素。
这里,Δl≥32,l≥32。
示例性优选地,Δl=50,l×l=128×128。
进一步地,在其中一个实施例中,结合图2,上述步骤4中基于多任务学习的网络模型,具体包括:
依次连接的4个残差块,每个残差块均包括依次连接的3个卷积层,每个卷积层均为“CONV-BN-RELU”结构,即卷积层-BatchNorm层-ReLU激活层;
每个残差块之后均连接一个最大池化层,且最后一个最大池化层后依次连接两个全连接层,两个全连接层后均连接一个ReLU激活层;
之后连接多任务学习模块,该模块包括:分类子任务模块,用于执行图像质量等级G的分类任务,包括一个含有N个神经元的全连接层和一个SoftmaxWithLoss层,假设分数值范围为[a,b],分数组距为L,则N=(b-a)/L;第一线性回归子任务模块,用于执行回归到图像质量分数S的线性回归任务,包括一个含有一个神经元的全连接层和一个EuclideanLoss层;第二线性回归子任务模块,用于执行回归到对应质量等级中心S1的线性回归任务,包括一个含有一个神经元的全连接层和一个EuclideanLoss层;联系模块,用于进行线性回归,纠正分类子任务模块与第一线性回归子任务模块之间的偏差,包括一个EuclideanLoss层;第一线性回归子任务模块和分类子任务模块均与最后一个ReLU激活层相连,第二线性回归子任务模块与分类子任务模块中的全连接层相连,联系模块与第一和第二线性回归子任务模块中的全连接层均相连。
进一步优选地,在其中一个实施例中,上述卷积层卷积核的大小均为3×3;
4个残差块中卷积层的通道数依次为32,32,32,64,64,64,128,128,128,256,256,256;
卷积层的步长为1,补零设置为1;
最大池化层窗口大小设置为3×3,步长为2;
全连接层的通道数为512。
进一步优选地,在其中一个实施例中,上述步骤5中对基于多任务学习的网络模型进行训练,具体采用自适应矩估计算法进行训练。
进一步地,在其中一个实施例中,上述步骤7根据预测分数求取图像的质量分数,具体包括:根据来自于同一原图像的所有预测分数获取该原图像的质量分数,所用公式为:
Figure BDA0002392151130000071
式中,Si为原图像对应的第i个图像块的预测分数,n为原图像裁剪后获得的图像块个数,S为原图像的质量分数。
在一个实施例中,提供了一种基于多任务学习的无参考图像质量评价系统,该系统包括:
采集模块,用于从图像质量评价数据库中采集若干图像;
第一构建模块,用于根据采集的图像构建训练标签;
第二构建模块,用于构建训练集和测试集;
第三构建模块,用于构建基于多任务学习的网络模型;
训练模块,用于利用训练集中的训练样本和对应的训练标签,对基于多任务学习的网络模型进行训练;
预测模块,用于将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数;
质量评价模块,用于根据预测分数求取图像的质量分数。
进一步地,在其中一个实施例中,上述第一构建模块包括:
第一求取单元,用于针对每一幅采集的图像,根据该图像对应的质量分数S以及选定的分数组距L,获取图像对应的质量等级G:
Figure BDA0002392151130000081
第二求取单元,用于根据质量等级G以及选定的分数组距L,获取图像对应的质量等级中心分数S1:
S1=G*L-L/2
训练标签构建单元,用于根据质量分数S、质量等级G以及质量等级中心分数S1,构建一组1×3的一维向量即训练标签[S,G,S1]。
进一步地,在其中一个实施例中,上述第二构建模块,包括:
归一化单元,用于对采集的图像进行归一化预处理;
划分单元,用于将预处理后的图像划分为训练集和测试集;
样本生成单元,用于对训练集和测试集中的图像进行裁剪获得相应的数据样本。
关于基于多任务学习的无参考图像质量评价系统的进一步具体限定可以参见上文中对于基于多任务学习的无参考图像质量评价方法的限定,在此不再赘述。上述基于多任务学习的无参考图像质量评价系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
进一步地,作为一种具体示例,对本发明的基于多任务学习的无参考图像质量评价方法进行验证:
本实施例将针对下表1中所有数据库中的图像对本发明的方法进行验证。
表1本发明所用图像质量评价数据库的基本信息
Figure BDA0002392151130000082
首先在四个经典单重失真数据库上进行,包括:LIVE、CSIQ、TID2008和TID2013。针对每一个数据库,从中随机选择80%的参考图像对应的全部失真图像放入训练集,剩下20%参考图像对应的全部失真图像放入测试集。对训练集中的图像进行归一化处理之后,根据数据库提供的质量分数获得训练图像对应的训练标签。对预处理后的图像进行步长为50像素的裁剪,获得多个128×128尺寸大小的图像块,将图像块与对应的训练标签输入构建的模型进行训练。采用Adam算法来优化,学习率设置为0.01,每次训练的BatchSize设置为64,每迭代11个Epoch将学习率下降10倍,总共训练55个Epoch。对测试集中的图像同样进行归一化处理,然后裁剪预处理后的图像获得测试图像块,将测试图像块输入训练好的模型获得图像块的预测分数。将来自于同一原图像的所有图像块的预测分数取均值获得对应原图像的预测质量分数。然后利用图像质量评价的评价指标SROCC(预测单调性的斯皮尔曼排序相关系数)和LCC(衡量预测线性相关性的皮尔逊系数)进行算法性能对比,对比算法的结果如下表2和表3所示:
表2在LIVE、CSIQ、TID2008数据库上的性能对比
Figure BDA0002392151130000091
表3在TID2013数据库上的性能对比
Figure BDA0002392151130000092
由表2可以看出,本发明提出的基于多任务的无参考图像质量评价方法在三个数据库上均具有良好的性能,并且与全参考方法FSIM的结果相当,其中在TID2008上取得了最好的结果,甚至优于FSIM。由表3可以看出,在更具挑战性的TID2013数据库上,本发明取得了无参考方法中最好的性能结果和仅次于全参考方法VSI的性能结果。
一般来说,一个优秀的基于数据驱动的无参考图像质量评价算法,其模型应当能够在不同数据集不同图像语义的测试集上也得到良好的测试结果,也即是算法应当具有优良的泛化性能。跨数据库实验一般是用一个图像质量评价数据库来进行训练,然后在其他图像数据库上进行测试,以此来验证算法的泛化性能。因此本发明在四个数据库:LIVE、CSIQ、TID2013、IVC上进行验证。为了公平进行对比,采取在LIVE整体数据库上进行训练,在其他三个数据库上进行测试的实验方案。因为用于测试的三个数据库包含许多LIVE数据库没有的失真类型,测试过程中,我们仅选取与LIVE数据库共有的失真类型来进行测试,具体地,CSIQ和TID2013的测试数据包含白噪声失真、高斯模糊失真、JP2K压缩失真、JPEG压缩失真。IVC的测试数据包含JPEG压缩失真、JP2K压缩失真、高斯模糊失真。训练样本和测试样本的获取、测试结果的获取、优化算法的参数设置均与单重失真实验一致。同样采用评价指标SROCC和LCC来进行算法性能对比,对比算法结果如下表4所示:
表4在CSIQ、TID2013、IVC数据库上的跨库测试结果
Figure BDA0002392151130000101
由表4可知,本发明在三个数据库上的跨库实验都取得较优的结果。三个数据库上的对比实验表明本发明具有良好的泛化能力,即方法性能不依赖于某个特定的数据库。
接着需要验证本发明提出的多任务学习确实能取得比单任务学习更好的结果。该部分验证是在前面的基础上进一步验证的,将之前的多任务学习模块中的联系模块和分类模块均删除,所有的实验设定,如训练-测试实验划分,训练测试样本的获取、训练策略、参数的选择等,均与前面的实验相同。具体地,在2个单重失真数据库(TID2008、TID2013)上进行对比实验以及跨数据库上的对比实验。其中跨数据库实验为在LIVE整体数据库上进行训练,在其他三个数据库(CSIQ、TID2013、IVC)上进行测试的实验方案,结果如下表5和下表6所示:
表5多任务学习有效性实验I:在TID2008和TID2013的实验结果
Figure BDA0002392151130000111
表6多任务学习有效性实验II:跨数据库的实验结果
Figure BDA0002392151130000112
从表5和表6可以看出,多任务学习性能优于单任务学习性能,这表明本发明所提出的多任务学习的有效性。
然后需要证明本发明所提出的联系模块的有效性。该部分验证是在前面的基础上进一步验证的,将之前的多任务学习模块中的联系模块删除,所有的实验设定,如训练-测试实验划分,训练测试样本的获取、训练策略、参数的选择等,均与前面的实验相同。具体地,在单重失真数据库TID2013上进行对比实验,结果如下如表7所示:
表7消融实验结果
Figure BDA0002392151130000113
根据表2至表7中的结果,可以证明本发明提出的模型具有良好的有效性以及鲁棒性,对各类型失真图像质量预测都取得了优良性能。同时也证明了多任务学习的有效性。
最后进行实验以解释本发明为何选择2分组距作为一个质量等级。具体地,根据多个数据库的主观意见分数范围,选择1、2、5、10分作为一个质量等级。因为联系模块的回归是回归到等级中心,而过大的分数组距可能会导致误差的引入,因此就不尝试更大的分数组距。以TID2013数据库为例,10分组距中,一幅图像的主观意见分数是89,其对应的等级是9,联系模块回归的等级中心为区间[80,90]的中心85,这样就在一定程度上引入了误差,实验结果如图3所示。由图3可知,2分组距作为一个质量等级取得了最好的效果,因此选定2分组距作为本发明的训练参数。一分组距作为质量等级的情况下,因为分类差距不大,在一定程度上可以归于回归任务的范畴。而随着分数组距的增大,组距中心间接增加偏差,导致性能下降。
综上,本发明针对无参考图像质量评价问题提出了一种有效且鲁棒的方法及系统。将多任务学习引入到无参考评价领域。具体地,多任务由主观意见分数的回归子任务和图像主观意见分数质量等级的分类任务组成,并在其中加入了一个联系模块,用来纠正两个子任务的偏差,加深两个子任务之间的联系,且分类子任务中将主观意见分数转换到相应质量等级这一做法考虑到了个体的主观感知差异。多个公共数据库上的大量实验结果表明,本发明对各类型失真图像质量预测都能取得优良结果,具有良好的有效性及鲁棒性,所预测的图像质量分数精度较高,预测结果与全参考图像质量评价算法相当。

Claims (10)

1.一种基于多任务学习的无参考图像质量评价方法,其特征在于,所述方法包括以下步骤:
步骤1,从图像质量评价数据库中采集若干图像;
步骤2,根据采集的图像构建训练标签;
步骤3,构建训练集和测试集;
步骤4、构建基于多任务学习的网络模型;
步骤5、利用训练集中的训练样本和对应的训练标签,对所述基于多任务学习的网络模型进行训练;
步骤6、将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数;
步骤7、根据预测分数求取图像的质量分数。
2.根据权利要求1所述的基于多任务学习的无参考图像质量评价方法,其特征在于,步骤2所述根据采集的图像构建训练标签,具体过程包括:
步骤2-1、针对每一幅采集的图像,根据该图像对应的质量分数S以及选定的分数组距L,获取图像对应的质量等级G:
Figure FDA0002392151120000011
步骤2-2、根据所述质量等级G以及选定的分数组距L,获取图像对应的质量等级中心分数S1:
S1=G*L-L/2
步骤2-3、根据所述质量分数S、质量等级G以及质量等级中心分数S1,构建一组1×3的一维向量即训练标签[S,G,S1]。
3.根据权利要求1或2所述的基于多任务学习的无参考图像质量评价方法,其特征在于,步骤3所述构建训练集和测试集,具体包括:
步骤3-1,对采集的图像进行归一化预处理;
步骤3-2,将预处理后的图像划分为训练集和测试集;
步骤3-3,对训练集和测试集中的图像进行裁剪获得相应的数据样本。
4.根据权利要求3所述的基于多任务学习的无参考图像质量评价方法,其特征在于,步骤3-3所述对训练集和测试集中的图像进行裁剪,获得相应的数据样本,具体包括:在图像上以步长Δl裁剪l×l大小的图像块作为数据样本,Δl和l的单位为像素。
5.根据权利要求4所述的基于多任务学习的无参考图像质量评价方法,其特征在于,步骤4所述基于多任务学习的网络模型,具体包括:
依次连接的4个残差块,每个残差块均包括依次连接的3个卷积层,每个卷积层均为“CONV-BN-RELU”结构,即卷积层-BatchNorm层-ReLU激活层;
每个残差块之后均连接一个最大池化层,且最后一个最大池化层后依次连接两个全连接层,两个全连接层后均连接一个ReLU激活层;
之后连接多任务学习模块,该模块包括:分类子任务模块,用于执行图像质量等级G的分类任务,包括一个含有N个神经元的全连接层和一个SoftmaxWithLoss层,假设分数值范围为[a,b],分数组距为L,则N=(b-a)/L;第一线性回归子任务模块,用于执行回归到图像质量分数S的线性回归任务,包括一个含有一个神经元的全连接层和一个EuclideanLoss层;第二线性回归子任务模块,用于执行回归到对应质量等级中心S1的线性回归任务,包括一个含有一个神经元的全连接层和一个EuclideanLoss层;联系模块,用于进行线性回归,纠正所述分类子任务模块与第一线性回归子任务模块之间的偏差,包括一个EuclideanLoss层;所述第一线性回归子任务模块和分类子任务模块均与最后一个ReLU激活层相连,第二线性回归子任务模块与分类子任务模块中的全连接层相连,联系模块与第一和第二线性回归子任务模块中的全连接层均相连。
6.根据权利要求5所述的基于多任务学习的无参考图像质量评价方法,其特征在于,所述卷积层卷积核的大小均为3×3;
所述4个残差块中卷积层的通道数依次为32,32,32,64,64,64,128,128,128,256,256,256;
所述卷积层的步长为1,补零设置为1;
所述最大池化层窗口大小设置为3×3,步长为2;
所述全连接层的通道数为512。
7.根据权利要求6所述的基于多任务学习的无参考图像质量评价方法,其特征在于,步骤5中对所述基于多任务学习的网络模型进行训练,具体采用自适应矩估计算法进行训练。
8.根据权利要求7所述的基于多任务学习的无参考图像质量评价方法,其特征在于,步骤7所述根据预测分数求取图像的质量分数,具体包括:根据来自于同一原图像的所有预测分数获取该原图像的质量分数,所用公式为:
Figure FDA0002392151120000031
式中,Si为原图像对应的第i个图像块的预测分数,n为原图像裁剪后获得的图像块个数,S为原图像的质量分数。
9.一种基于多任务学习的无参考图像质量评价系统,其特征在于,所述系统包括:
采集模块,用于从图像质量评价数据库中采集若干图像;
第一构建模块,用于根据采集的图像构建训练标签;
第二构建模块,用于构建训练集和测试集;
第三构建模块,用于构建基于多任务学习的网络模型;
训练模块,用于利用训练集中的训练样本和对应的训练标签,对所述基于多任务学习的网络模型进行训练;
预测模块,用于将测试集中的测试样本输入至基于多任务学习的网络模型获得预测分数;
质量评价模块,用于根据预测分数求取图像的质量分数。
10.根据权利要求9所述的基于多任务学习的无参考图像质量评价系统,其特征在于,所述第一构建模块包括:
第一求取单元,用于针对每一幅采集的图像,根据该图像对应的质量分数S以及选定的分数组距L,获取图像对应的质量等级G:
Figure FDA0002392151120000032
第二求取单元,用于根据所述质量等级G以及选定的分数组距L,获取图像对应的质量等级中心分数S1:
S1=G*L-L/2
训练标签构建单元,用于根据所述质量分数S、质量等级G以及质量等级中心分数S1,构建一组1×3的一维向量即训练标签[S,G,S1];
所述第二构建模块,包括:
归一化单元,用于对采集的图像进行归一化预处理;
划分单元,用于将预处理后的图像划分为训练集和测试集;
样本生成单元,用于对训练集和测试集中的图像进行裁剪获得相应的数据样本。
CN202010118261.9A 2020-02-26 2020-02-26 基于多任务学习的无参考图像质量评价方法及系统 Active CN111353533B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010118261.9A CN111353533B (zh) 2020-02-26 2020-02-26 基于多任务学习的无参考图像质量评价方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010118261.9A CN111353533B (zh) 2020-02-26 2020-02-26 基于多任务学习的无参考图像质量评价方法及系统

Publications (2)

Publication Number Publication Date
CN111353533A true CN111353533A (zh) 2020-06-30
CN111353533B CN111353533B (zh) 2022-09-13

Family

ID=71195868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010118261.9A Active CN111353533B (zh) 2020-02-26 2020-02-26 基于多任务学习的无参考图像质量评价方法及系统

Country Status (1)

Country Link
CN (1) CN111353533B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111862067A (zh) * 2020-07-28 2020-10-30 中山佳维电子有限公司 一种焊接缺陷检测方法、装置、电子设备以及存储介质
CN112116567A (zh) * 2020-09-10 2020-12-22 广东电网有限责任公司广州供电局 一种无参考图像质量评价方法、装置及存储介质
CN112907541A (zh) * 2021-02-23 2021-06-04 厦门熵基科技有限公司 一种手掌图像质量评估模型构建方法及装置
CN112950579A (zh) * 2021-02-26 2021-06-11 北京金山云网络技术有限公司 图像质量评价方法、装置和电子设备
CN113421237A (zh) * 2021-06-18 2021-09-21 西安电子科技大学 基于深度特征迁移学习的无参考图像质量评价方法
CN113592807A (zh) * 2021-07-28 2021-11-02 北京世纪好未来教育科技有限公司 一种训练方法、图像质量确定方法及装置、电子设备
CN113743111A (zh) * 2020-08-25 2021-12-03 国家计算机网络与信息安全管理中心 基于文本预训练和多任务学习的金融风险预测方法及装置
CN116563210A (zh) * 2023-03-21 2023-08-08 安徽中新云谷数字技术有限公司 一种虚拟现实图像质量评价方法及系统
CN112950579B (zh) * 2021-02-26 2024-05-31 北京金山云网络技术有限公司 图像质量评价方法、装置和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018015080A1 (en) * 2016-07-19 2018-01-25 Siemens Healthcare Gmbh Medical image segmentation with a multi-task neural network system
CN109215028A (zh) * 2018-11-06 2019-01-15 福州大学 一种基于卷积神经网络的多目标优化图像质量评估方法
CN110189291A (zh) * 2019-04-09 2019-08-30 浙江大学 一种基于多任务卷积神经网络的通用无参考图像质量评价方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018015080A1 (en) * 2016-07-19 2018-01-25 Siemens Healthcare Gmbh Medical image segmentation with a multi-task neural network system
CN109215028A (zh) * 2018-11-06 2019-01-15 福州大学 一种基于卷积神经网络的多目标优化图像质量评估方法
CN110189291A (zh) * 2019-04-09 2019-08-30 浙江大学 一种基于多任务卷积神经网络的通用无参考图像质量评价方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111862067A (zh) * 2020-07-28 2020-10-30 中山佳维电子有限公司 一种焊接缺陷检测方法、装置、电子设备以及存储介质
CN113743111A (zh) * 2020-08-25 2021-12-03 国家计算机网络与信息安全管理中心 基于文本预训练和多任务学习的金融风险预测方法及装置
CN113743111B (zh) * 2020-08-25 2024-06-04 国家计算机网络与信息安全管理中心 基于文本预训练和多任务学习的金融风险预测方法及装置
CN112116567A (zh) * 2020-09-10 2020-12-22 广东电网有限责任公司广州供电局 一种无参考图像质量评价方法、装置及存储介质
CN112907541A (zh) * 2021-02-23 2021-06-04 厦门熵基科技有限公司 一种手掌图像质量评估模型构建方法及装置
CN112907541B (zh) * 2021-02-23 2023-11-21 厦门熵基科技有限公司 一种手掌图像质量评估模型构建方法及装置
CN112950579A (zh) * 2021-02-26 2021-06-11 北京金山云网络技术有限公司 图像质量评价方法、装置和电子设备
CN112950579B (zh) * 2021-02-26 2024-05-31 北京金山云网络技术有限公司 图像质量评价方法、装置和电子设备
CN113421237A (zh) * 2021-06-18 2021-09-21 西安电子科技大学 基于深度特征迁移学习的无参考图像质量评价方法
CN113592807A (zh) * 2021-07-28 2021-11-02 北京世纪好未来教育科技有限公司 一种训练方法、图像质量确定方法及装置、电子设备
CN116563210A (zh) * 2023-03-21 2023-08-08 安徽中新云谷数字技术有限公司 一种虚拟现实图像质量评价方法及系统
CN116563210B (zh) * 2023-03-21 2023-12-08 安徽中新云谷数字技术有限公司 一种虚拟现实图像质量评价方法及系统

Also Published As

Publication number Publication date
CN111353533B (zh) 2022-09-13

Similar Documents

Publication Publication Date Title
CN111353533B (zh) 基于多任务学习的无参考图像质量评价方法及系统
US10789696B2 (en) Patch selection for neural network based no-reference image quality assessment
Yan et al. No-reference quality assessment of contrast-distorted images using contrast enhancement
Liu et al. Rankiqa: Learning from rankings for no-reference image quality assessment
Kang et al. Simultaneous estimation of image quality and distortion via multi-task convolutional neural networks
CN111696101A (zh) 一种基于SE-Inception的轻量级茄科病害识别方法
CN110717895A (zh) 基于置信分数的无参考图像质量评价方法
CN108596890B (zh) 一种基于视觉测量率自适应融合的全参考图像质量客观评价方法
CN113066065B (zh) 无参考图像质量检测方法、系统、终端及介质
US11682194B2 (en) Training method for robust neural network based on feature matching
CN112149526B (zh) 一种基于长距离信息融合的车道线检测方法及系统
CN115601751B (zh) 一种基于领域泛化的眼底图像语义分割方法
Yang et al. Convolutional neural network for visual security evaluation
CN113658091A (zh) 一种图像评价方法、存储介质及终端设备
CN116777745A (zh) 一种基于稀疏自适应聚类的图像超分辨率重建方法
CN116703932A (zh) 一种基于卷积注意力机制的CBAM-HRNet模型小麦穗粒分割与计数方法
CN114841887A (zh) 一种基于多层次差异学习的图像恢复质量评价方法
CN115761356A (zh) 图像识别方法、装置、电子设备和存储介质
CN115761888A (zh) 基于nl-c3d模型的塔吊操作人员异常行为检测方法
CN115619729A (zh) 人脸图像质量评估方法、装置及电子设备
CN114785978A (zh) 一种面向视频会议的视频图像质量确定方法
CN114283301A (zh) 一种基于Transformer的自适应医学影像分类方法及系统
Ou et al. Controllable list-wise ranking for universal no-reference image quality assessment
Chen et al. Multi-Level Feature Aggregation Network for Full-Reference Image Quality Assessment
CN111723864A (zh) 基于主动学习使用互联网图片进行对抗训练的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant