CN116245861A - 基于交叉多尺度的无参考图像质量评价方法 - Google Patents
基于交叉多尺度的无参考图像质量评价方法 Download PDFInfo
- Publication number
- CN116245861A CN116245861A CN202310256196.XA CN202310256196A CN116245861A CN 116245861 A CN116245861 A CN 116245861A CN 202310256196 A CN202310256196 A CN 202310256196A CN 116245861 A CN116245861 A CN 116245861A
- Authority
- CN
- China
- Prior art keywords
- feature
- scale
- network
- image quality
- quality evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 86
- 238000012360 testing method Methods 0.000 claims abstract description 22
- 230000000694 effects Effects 0.000 claims abstract description 4
- 230000004927 fusion Effects 0.000 claims description 47
- 238000005070 sampling Methods 0.000 claims description 44
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000007499 fusion processing Methods 0.000 claims description 7
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000001303 quality assessment method Methods 0.000 claims 3
- 238000011156 evaluation Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于交叉多尺度的无参考图像质量评价方法,包括以下步骤;步骤1,获取训练样本集B和测试样本集C;步骤2,构建基于交叉多尺度无参考图像质量评价的网络模型S;步骤3,对基于交叉多尺度无参考图像质量评价的网络模型S进行迭代训练;步骤4,获取图像的无参考质量评价结果Q:将测试样本集C作为训练完成的基于交叉多尺度网络的无参考图像质量评价网络模型S的输入进行前向推理,得到每个测试样本的质量预测分数,以验证模型效果。本发明利用图像的局部和非局部语义信息与图像金字塔的提取不同层级信息的能力,解决现有方法中单一网络模型面对复杂失真图像无法同时兼顾全局失真与局部失真的问题。
Description
技术领域
本发明属于图像质量评价技术领域,具体涉及基于交叉多尺度的无参考图像质量评价方法。
背景技术
数字图像在采集、压缩、传输与读取等过程中常产生不同程度的失真,这些不同程度的失真会降低数字图像的质量,使数字图像承载的信息与真实信息之间产生偏差,从而使人类在获取数字图像承载的真实信息时产生误判。因此,在人类获取数字图像承载的真实信息的过程中,准确评价数字图像的质量格外重要。数字图像质量的评价在许多方面有着重要的应用,例如通过评价采集的数字图像的质量从而对使用的硬件设备进行筛选;通过评价编码压缩后的数字图像的质量从而对编码压缩算法作出评价;通过评价去噪后的数字图像的质量从而确定数字图像去噪算法的优劣。
数字图像的质量由其失真程度表征,因此,通过评价数字图像的失真程度从而获取数字图像的质量。研究中采用质量分数表示数字图像的失真程度,质量分数越低,其图像质量越低,质量分数越高,其图像质量越高。数字图像质量评价分为主观质量评价和客观质量评价。其中,主观质量评价是通过人眼观测给出其质量分数,此种方法可靠性强,但人眼评价的方式存在成本高、稳定性差的缺点。而客观质量评价通过设计算法自动给出图像质量分数,具有成本低、稳定性高的优点,因而成为数字图像质量评价的重点。数字图像客观质量评价又分为全参考型、部分参考型以及无参考型。其中,全参考型数字图像质量评价通过原始图像和其对应失真图像比较而获取质量分数;部分参考型数字图像质量评价通过比较提取到的原始图像的部分信息与其对应的失真图像的信息来获取质量分数;无参考型数字图像质量评价不需要参考图像的任何信息,只依据失真图像本身提供的信息就能预测出质量分数。在实际情景中获取原始图像信息较难,因此,全参考型数字图像质量评价和部分参考型数字图像质量评价较难应用于实际。而无参考型数字图像质量评价仅需设计算法,无需原始图像的信息就能给出图像质量分数,因此,无参考型数字图像质量评价成为图像质量评价的热点,实际应用价值非常高。
申请公布号为CN 115205658 A,名称为“一种无参考全面感知全景图像质量的评价方法”的专利申请,该方法对全景图像评价更为精确,但是不足之处在于,单一的网络模型面对复杂失真图像无法同时兼顾全局失真与局部失真。随着网络的层次的加深,提取到的图像特征感受野更大,语义程度更加丰富,对局部失真的表征能力减弱,导致图像的细粒度评价精度降低。
申请公布号为CN 115272203 A,名称为“一种基于深度学习的无参考图像质量评价方法”的专利申请,该方法不仅解决了传统方法面对多失真类型时无法有效评估图像质量分数的问题,还弥补了部分基于深度学习的方法所出现的层次特征物理意义不明确、层次特征信息未充分利用的情况。该方法的不足之处在于,在融合过程中,没有考虑深层次信息对浅层次信息的影响,没有很好的符合人类视觉感知系统先感知内容后感知质量的特性,导致评价结果不准确。
现有的图像质量评价方法仅使用单一网络模型,采用单一层级的特征获取质量分数,面对复杂失真图像无法同时兼顾全局失真信息与局部失真信息,不能准确地对图像的优劣进行评价。
发明内容
为了克服上述现有技术存在的不足,本发明的目的在于提供基于交叉多尺度的无参考图像质量评价方法,利用图像的局部和非局部语义信息与图像金字塔的提取不同层级信息的能力,解决现有方法中单一网络模型面对复杂失真图像无法同时兼顾全局失真与局部失真的问题。
为了实现上述目的,本发明采用的技术方案是:
基于交叉多尺度的无参考图像质量评价方法,包括以下步骤;
步骤1,获取训练样本集B和测试样本集C;
步骤2,构建基于交叉多尺度无参考图像质量评价的网络模型S;
步骤3,对基于交叉多尺度无参考图像质量评价的网络模型S进行迭代训练;
步骤4,获取图像的无参考质量评价结果Q:
将测试样本集C作为训练完成的基于交叉多尺度网络的无参考图像质量评价网络模型S的输入进行前向推理,得到每个测试样本的质量预测分数,以验证模型效果。
所述步骤1具体为:
步骤1.1,在LIVE,TID2013,CSIQ三个数据集中,将参考图像随机划分为两部分,其中一部分用于训练,剩余的部分用于测试;将参考图像对应的失真图像划入训练样本集B1和测试样本集C1,将所有数据随机分成两个子集,其中一部分划入训练样本集B2,剩余的部分划入测试样本集C2;
步骤1.2,将集合B1中的图片及其对应的质量分数标签与集合B2中的图片及其对应的质量分数标签组合成训练样本集B,并将集合C1中的图片及其对应的质量分数标签与集合C2中的图片及其对应的质量分数标签组合成训练样本集C。
所述步骤2具体为:
步骤2.1,构建基于交叉多尺度无参考图像质量评价的竖直多尺度网络V,竖直多尺度网络V,用于提取同一图片不同尺度下特征,使得到的特征同时包含复杂的语义和较高的分辨率,既可以表达出全局空间的整体信息,也可以表达局部范围的特征,包括Resnet-50主干网络R、自上而下的上采样融合网络T-D、自底向顶的降采样融合网络B-U和竖直多尺度特征输出模块F;其中,Resnet-50主干网络R输出包括四个不同层输出的特征序列fi(i=1,2,3,4),自上而下的上采样融合网络T-D包括经融合后的四个特征序列fi,a(i=1,2,3,4),自底向顶的降采样融合网络B-U包括经融合后的四个特征序列fi,b(i=1,2,3,4),竖直多尺度特征输出模块F包括处理后的四个特征序列fi’(i=1,2,3,4);
步骤2.2,构建基于交叉多尺度无参考图像质量评价的水平多尺度网络H,用于获得局部表达最优的特征。从特征局部信息处理与统计的角度,通过不同大小的池化群对竖直多尺度网络输出的序列特征进行池化处理,使得图像局部特征得到最优表达。
步骤2.3,构建基于交叉多尺度无参考图像质量评价的质量回归网络R;
所述步骤2中,输入图片,经过竖直多尺度网络V和水平多尺度网络H后,得到了所需的特征,再将该特征输入到质量回归网络R中,得到最终的质量回归的分数。
基于交叉多尺度无参考图像质量评价的网络模型S由竖直多尺度网络V、水平多尺度网络H和质量回归网络R构成。
所述步骤2.1具体为:
步骤2.1.1,Resnet-50主干网络R提取四个级别的语义特征,从下至上的特征分辨率逐级减小,Resnet-50主干网络R中,提取四个尺度的特征从下至上分别是f1、f2、f3、f4;
步骤2.1.2,自上而下的上采样融合网络T-D的融合过程为:对顶层的特征f4进行1×1卷积得到特征f4,a,f4,a进行二倍上采样,与次顶层特征f3进行融合,得到融合特征f3,a;融合特征f3,a进行二倍上采样,与次底层特征f2进行融合,得到融合特征f2,a;融合特征f2,a进行二倍上采样,与底层特征f1进行融合,得到融合特征f1,a,其中所有特征融合操作采取的是逐元素相加,至此,自上而下的预融合完成,得到特征序列fi,a(i=1,2,3,4);上述过程表示如下式:
f4,a=Conv1(f4)
步骤2.1.3,自底向顶的降采样融合网络B-U的融合过程为:对特征f1,a卷积得到f1,b;特征f2,a进行二倍上采样后与特征f1,b相加融合,得到特征f2,b;特征f3,a进行二倍上采样后与特征f2,b相加融合,得到特征f3,b;特征f4,a进行二倍上采样后与特征f3,b相加融合,得到特征f4,b;至此,自下而上的特征融合增强完成,得到的序列特征fi,b(i=1,2,3,4),该特征同时包含了浅层特征高分辨率以及深度特征丰富语义性的优点,上述特征融合增强过程用下式表示:
f1,b=Conv1(f1,a)
步骤2.1.4,竖直多尺度特征输出模块F分别对处理后的特征进行输出,从下至上的特征分别是f1’、f2’、f3’、f4’。
所述步骤2.2具体为:
步骤2.2.1,预定义池化核序列:poolx(x=1,2,4,6),层特征fb,i通过poolx统计出不同局部大小的特征序列:
fx,i=poolx(fi’)
该操作承接竖直网络V,属于水平网络H的第一步。是对竖直网络V输出的结果fi’,进行池化(pool)操作。
步骤2.2.2,特征fx,i经过1×1的卷积进行整流去冗余,并将通道维数压缩:
fc x,i=Conv1(fx,i)
步骤2.2.3,对特征序列fc xi进行上采样使特征对齐,并按照通道维度进行拼接,形成多尺度融合特征Fi:
Fi=Comcat(fc x,1,fc x,2,fc x,3,fc x,4)
其中,poolx表示池化操作,Conv1表示卷积操作,Concat表示拼接操作;
水平多尺度网络H的输入为四个特征向量,经过水平多尺度网络H后,再输出四个特征向量,Fi为输出结果。
所述步骤2.3具体为:
步骤2.3.2,将失真特征F展平后,得到向量形式的特征其中m为特征维度,输入由三个全连接层构成的回归模块,全连接层FC1的权重矩阵为W1∈R628×m,偏置为b1∈R628,全连接层FC2的权重矩阵为W2∈R128×628,偏置为b2∈R128,全连接层Fc3的权重矩阵为W3∈R1×128,偏置为b3∈R1,全连接层的输出为:
yi=ReLU(Wiyi-1+bi)
ReLU为激活函数。全连接层FC2输出y3即是失真图像最后的质量分数Q,属于质量回归网络R的最终输出结果,对输入的特征F,经过三层全连接网络,输出为最终的质量分数。
所述步骤3具体为:
步骤3.1,初始化迭代次数为t,最大迭代次数为T,当前基于交叉多尺度网络的无参考图像质量评价网络模型为St,并令t=1,St=S;
步骤3.2,从步骤1得到的训练样本集B中不放回地随机选取b个训练样本作为无参考图像质量评价网络模型St的输入;竖直多尺度网络V对每个训练样本进行不同层次特征提取,水平多尺度网络H对同层次不同尺度的特征进行融合,质量回归网络R对输出的多层次特征和同层次不同尺度特征拼接,得到交叉多尺度特征,再使用三层全连接层对交叉多尺度特征进行回归,得到每个训练样本对应的质量预测分数;
步骤3.3,首先计算每个训练样本对应的质量预测分数与该训练样本对应的质量分数标签的均方误差作为模型St的损失值,再采用Adam优化算法,对网络模型St的各层权值参数进行更新;
计算每个训练样本对应的质量预测分数与该训练样本对应的质量分数标签的均方误差的公式为
采用Adam优化算法,除了学习率之外,其余的参数均使用默认值,为了保证模型的收敛速度和学习的精度,根据以下公式更新学习率
b表示对基于交叉多尺度网络的无参考图像质量评价网络模型S进行迭代训练时从训练样本集B中不放回地随机选取训练样本的个数,qg表示该b个训练样本中第g个训练样本对应的质量分数标签,表示该b个训练样本中第g个训练样本对应的质量预测分数;
T表示当前的迭代次数,L代表更新学习率的步长,即每经过L次迭代就会更新一次学习率,d表示学习率的衰减系数,在损失函数中加入正则化项,并在训练过程中加入权重衰减weight_decay;
b=16,L=1,d=0.5,weight_decay=5×10-4;
步骤3.4,判断是否已遍历训练样本集B,若是,执行步骤3.5,否则,执行步骤3.2和3.3;
步骤3.5,判断t=T是否成立,若是,得到训练好的基于交叉多尺度网络的无参考图像质量评价网络模型S*=St,否则,令t=t+1,并执行步骤3.3和3.4。
本发明的有益效果:
本发明利用交叉多尺度网络在语义信息丰富的图像块上对图像进行特征提取,通过分析不同层次的图像块中包含的不同信息,实现图像的无参考质量评价与分析评价。由于充分利用了图像的特征图中大感受野下的粗粒度特征和小感受野下的细粒度特征,本发明可以有效地评价出一幅既有全局失真又有局部失真的图像的质量。
附图说明
图1为本发明流程示意图。
图2为本发明交叉多尺度网络模型图。
具体实施方式
下面结合附图对本发明作进一步详细说明。
如图1、图2所示:
步骤1,获取训练样本集B和测试样本集C。
步骤1.1,在LIVE,TID2013,CSIQ三个数据集中,将参考图像随机划分为两部分,其中70%用于训练,剩余的30%用于测试。将参考图像对应的失真图像划入训练样本集B1和测试样本集C1,从而保证训练样本集和测试样本集之间没有内容相同的图像。对于LIVEC数据集,由于图像数据没有参考图像且均为真实失真,因此将所有数据随机分成两个子集,其中70%划入训练样本集B2,剩余的30%划入测试样本集C2。
步骤1.2,将集合B1中的图片及其对应的质量分数标签与集合B2中的图片及其对应的质量分数标签组合成训练样本集B,并将集合C1中的图片及其对应的质量分数标签与集合C2中的图片及其对应的质量分数标签组合成训练样本集C。
步骤2,构建基于交叉多尺度无参考图像质量评价的网络模型S。
步骤2.1,构建基于交叉多尺度无参考图像质量评价的竖直多尺度网络V,其包括Resnet-50主干网络R、自上而下的上采样融合网络T-D、自底向顶的降采样融合网络B-U和竖直多尺度特征输出模块F。其中,Resnet-50主干网络R输出包括四个不同层输出的特征序列fi(i=1,2,3,4),自上而下的上采样融合网络T-D包括经融合后的四个特征序列fi,a(i=1,2,3,4),自底向顶的降采样融合网络B-U包括经融合后的四个特征序列fi,b(i=1,2,3,4),竖直多尺度特征输出模块F包括处理后的四个特征序列fi’(i=1,2,3,4)。
步骤2.1.1,Resnet-50主干网络R提取四个级别的语义特征,从下至上的特征分辨率逐级减小,在Resnet-50主干网络R中,提取四个尺度的特征从下至上分别是f1、f2、f3、f4。
步骤2.1.2,自上而下的上采样融合网络T-D的融合过程为:对顶层的特征f4进行1×1卷积得到特征f4,a,f4,a进行二倍上采样,与次顶层特征f3进行融合,得到融合特征f3,a;融合特征f3,a进行二倍上采样,与次底层特征f2进行融合,得到融合特征f2,a;融合特征f2,a进行二倍上采样,与底层特征f1进行融合,得到融合特征f1,a,其中所有特征融合操作采取的是逐元素相加,至此,自上而下的预融合完成,得到特征序列fi,a(i=1,2,3,4)。上述过程可以表示如下式:
f4,a=Conv1(f4)
步骤2.1.3,自底向顶的降采样融合网络B-U的融合过程为:对特征f1,a卷积得到f1,b;特征f2,a进行二倍上采样后与特征f1,b相加融合,得到特征f2,b;特征f3,a进行二倍上采样后与特征f2,b相加融合,得到特征f3,b;特征f4,a进行二倍上采样后与特征f3,b相加融合,得到特征f4,b。至此,自下而上的特征融合增强完成,得到的序列特征fi,b(i=1,2,3,4),该特征同时包含了浅层特征高分辨率以及深度特征丰富语义性的优点,上述特征融合增强过程可以用下式表示:
f1,b=Conv1(f1,a)
步骤2.1.4,竖直多尺度特征输出模块F分别对处理后的特征进行输出,从下至上的特征分别是f1’、f2’、f3’、f4’。
步骤2.2,构建基于交叉多尺度无参考图像质量评价的水平多尺度网络H。
步骤2.2.1,预定义池化核序列:poolx(x=1,2,4,6),层特征fb,i通过poolx统计出不同局部大小的特征序列:
fx,i=poolx(fi’)
步骤2.2.2,特征fx,i经过1×1的卷积进行整流去冗余,并将通道维数压缩:
fc x,i=Conv1(fx,i)
步骤2.2.3,对特征序列fc xi进行上采样使特征对齐,并按照通道维度进行拼接,形成多尺度融合特征Fi:
Fi=Comcat(fc x,1,fc x,2,fc x,3,fc x,4)
本实施例中,poolx表示池化操作,Conv1表示卷积操作,Concat表示拼接操作。
步骤2.3,构建基于交叉多尺度无参考图像质量评价的质量回归网络R。
步骤2.3.2,将失真特征F展平后,得到向量形式的特征其中m为特征维度。输入由三个全连接层构成的回归模块,全连接层FC1的权重矩阵为W1∈R628×m,偏置为b1∈R628,全连接层FC2的权重矩阵为W2∈R128×628,偏置为b2∈R128,全连接层FC3的权重矩阵为W3∈R1×128,偏置为b3∈R1,全连接层的输出为:
yi=ReLU(Wiyi-1+bi)
本实施例中,ReLU为激活函数。全连接层FC2输出y3即是失真图像最后的质量分数Q
步骤3,对基于交叉多尺度无参考图像质量评价的网络模型S进行迭代训练。
步骤3.1,初始化迭代次数为t,最大迭代次数为T,当前基于交叉多尺度网络的无参考图像质量评价网络模型为St,并令t=1,St=S;
本实施例中,Y=60;
步骤3.2,从训练样本集B中不放回地随机选取b个训练样本作为无参考图像质量评价网络模型St的输入;竖直多尺度网络V对每个训练样本进行不同层次特征提取,水平多尺度网络H对同层次不同尺度的特征进行融合,质量回归网络R对输出的多层次特征和同层次不同尺度特征拼接,得到交叉多尺度特征,再使用三层全连接层对交叉多尺度特征进行回归,得到每个训练样本对应的质量预测分数;
本实施例中,b=16;
步骤3.3,首先计算每个训练样本对应的质量预测分数与该训练样本对应的质量分数标签的均方误差作为模型St的损失值,再采用Adam优化算法,对网络模型St的各层权值参数进行更新;
本实施例中,计算每个训练样本对应的质量预测分数与该训练样本对应的质量分数标签的均方误差的公式为
本实施例中,采用Adam优化算法,除了学习率之外,其余的参数均使用默认值。为了保证模型的收敛速度和学习的精度,根据以下公式更新学习率
b表示对基于交叉多尺度网络的无参考图像质量评价网络模型S进行迭代训练时从训练样本集B中不放回地随机选取训练样本的个数,qg表示该b个训练样本中第g个训练样本对应的质量分数标签,表示该b个训练样本中第g个训练样本对应的质量预测分数;
T表示当前的迭代次数,L代表更新学习率的步长,即每经过L次迭代就会更新一次学习率,d表示学习率的衰减系数,与此同时,为了防止模型在训练过程中出现过拟合的情况,在损失函数中加入正则化项,并在训练过程中加入权重衰减weight_decay;
本实施例中,b=16,L=1,d=0.5,weight_decay=5×10-4;
步骤3.4,判断是否已遍历训练样本集B,若是,执行步骤3.5,否则,执行步骤3.2和3.3;
步骤3.5,判断t=T是否成立,若是,得到训练好的基于交叉多尺度网络的无参考图像质量评价网络模型S*=St,否则,令t=t+1,并执行步骤3.3和3.4
步骤4,获取图像的无参考质量评价结果Q:
将测试样本集C作为训练完成的基于交叉多尺度网络的无参考图像质量评价网络模型S的输入进行前向推理,得到每个测试样本的质量预测分数,以验证模型效果。
Claims (7)
1.基于交叉多尺度的无参考图像质量评价方法,其特征在于,包括以下步骤;
步骤1,获取训练样本集B和测试样本集C;
步骤2,构建基于交叉多尺度无参考图像质量评价的网络模型S;
步骤3,对基于交叉多尺度无参考图像质量评价的网络模型S进行迭代训练;
步骤4,获取图像的无参考质量评价结果Q:
将测试样本集C作为训练完成的基于交叉多尺度网络的无参考图像质量评价网络模型S的输入进行前向推理,得到每个测试样本的质量预测分数,以验证模型效果。
2.根据权利要求1所述的基于交叉多尺度的无参考图像质量评价方法,其特征在于,所述步骤1具体为:
步骤1.1,在LIVE,TID2013,CSIQ三个数据集中,将参考图像随机划分为两部分,其中一部分用于训练,剩余部分用于测试;将参考图像对应的失真图像划入训练样本集B1和测试样本集C1,将所有数据随机分成两个子集,其中一部分划入训练样本集B2,剩余部分划入测试样本集C2;
步骤1.2,将集合B1中的图片及其对应的质量分数标签与集合B2中的图片及其对应的质量分数标签组合成训练样本集B,并将集合C1中的图片及其对应的质量分数标签与集合C2中的图片及其对应的质量分数标签组合成训练样本集C。
3.根据权利要求1所述的基于交叉多尺度的无参考图像质量评价方法,其特征在于,所述步骤2具体为:
步骤2.1,构建基于交叉多尺度无参考图像质量评价的竖直多尺度网络V,用于提取同一图片不同尺度下特征,包括Resnet-50主干网络R、自上而下的上采样融合网络T-D、自底向顶的降采样融合网络B-U和竖直多尺度特征输出模块F;其中,Resnet-50主干网络R输出包括四个不同层输出的特征序列fi(i=1,2,3,4),自上而下的上采样融合网络T-D包括经融合后的四个特征序列fi,a(i=1,2,3,4),自底向顶的降采样融合网络B-U包括经融合后的四个特征序列fi,b(i=1,2,3,4),竖直多尺度特征输出模块F包括处理后的四个特征序列fi’(i=1,2,3,4);
步骤2.2,构建基于交叉多尺度无参考图像质量评价的水平多尺度网络H,用于获得局部表达最优的特征;
步骤2.3,构建基于交叉多尺度无参考图像质量评价的质量回归网络R。
4.根据权利要求3所述的基于交叉多尺度的无参考图像质量评价方法,其特征在于,所述步骤2.1具体为:
步骤2.1.1,Resnet-50主干网络R提取四个级别的语义特征,从下至上的特征分辨率逐级减小,在Resnet-50主干网络R中,提取四个尺度的特征从下至上分别是f1、f2、f3、f4;
步骤2.1.2,自上而下的上采样融合网络T-D的融合过程为:对顶层的特征f4进行1×1卷积得到特征f4,a,f4,a进行二倍上采样,与次顶层特征f3进行融合,得到融合特征f3,a;融合特征f3,a进行二倍上采样,与次底层特征f2进行融合,得到融合特征f2,a;融合特征f2,a进行二倍上采样,与底层特征f1进行融合,得到融合特征f1,a,其中所有特征融合操作采取的是逐元素相加,至此,自上而下的预融合完成,得到特征序列fi,a(i=1,2,3,4);上述过程表示如下式:
f4,a=Conv1(f4)
步骤2.1.3,自底向顶的降采样融合网络B-U的融合过程为:对特征f1,a卷积得到f1,b;特征f2,a进行二倍上采样后与特征f1,b相加融合,得到特征f2,b;特征f3,a进行二倍上采样后与特征f2,b相加融合,得到特征f3,b;特征f4,a进行二倍上采样后与特征f3,b相加融合,得到特征f4,b;至此,自下而上的特征融合增强完成,得到的序列特征fi,b(i=1,2,3,4),上述特征融合增强过程用下式表示:
f1,b=Conv1(f1,a)
步骤2.1.4,竖直多尺度特征输出模块F分别对处理后的特征进行输出,从下至上的特征分别是f1’、f2’、f3’、f4’。
5.根据权利要求3所述的基于交叉多尺度的无参考图像质量评价方法,其特征在于,所述步骤2.2具体为:
步骤2.2.1,预定义池化核序列:poolx(x=1,2,4,6),层特征fb,i通过poolx统计出不同局部大小的特征序列:
fx,i=poolx(fi’)
步骤2.2.2,特征fx,i经过1×1的卷积进行整流去冗余,并将通道维数压缩:
fc x,i=Conv1(fx,i)
步骤2.2.3,对特征序列fc xi进行上采样使特征对齐,并按照通道维度进行拼接,形成多尺度融合特征Fi:
Fi=Concat(fc x,1,fc x,2,fc x,3,fc x,4)
其中,poolx表示池化操作,Conv1表示卷积操作,Concat表示拼接操作。
6.根据权利要求3所述的基于交叉多尺度的无参考图像质量评价方法,其特征在于,所述步骤2.3具体为:
步骤2.3.2,将失真特征F展平后,得到向量形式的特征其中m为特征维度,输入由三个全连接层构成的回归模块,全连接层FC1的权重矩阵为W1∈R628×m,偏置为b1∈R628,全连接层FC2的权重矩阵为W2∈R128×628,偏置为b2∈R128,全连接层FC3的权重矩阵为W3∈R1×128,偏置为b3∈R1,全连接层的输出为:
yi=ReLU(Wiyi-1+bi)
ReLU为激活函数,全连接层FC2输出y3即是失真图像最后的质量分数Q。
7.根据权利要求1所述的基于交叉多尺度的无参考图像质量评价方法,其特征在于,所述步骤3具体为:
步骤3.1,初始化迭代次数为t,最大迭代次数为T,当前基于交叉多尺度网络的无参考图像质量评价网络模型为St,并令t=1,St=S;
步骤3.2,从步骤1得到的训练样本集B中不放回地随机选取b个训练样本作为无参考图像质量评价网络模型St的输入;竖直多尺度网络V对每个训练样本进行不同层次特征提取,水平多尺度网络H对同层次不同尺度的特征进行融合,质量回归网络R对输出的多层次特征和同层次不同尺度特征拼接,得到交叉多尺度特征,再使用三层全连接层对交叉多尺度特征进行回归,得到每个训练样本对应的质量预测分数;
步骤3.3,首先计算每个训练样本对应的质量预测分数与该训练样本对应的质量分数标签的均方误差作为模型St的损失值,再采用Adam优化算法,对网络模型St的各层权值参数进行更新;
计算每个训练样本对应的质量预测分数与该训练样本对应的质量分数标签的均方误差的公式为
采用Adam优化算法,除了学习率之外,其余的参数均使用默认值,为了保证模型的收敛速度和学习的精度,根据以下公式更新学习率
b表示对基于交叉多尺度网络的无参考图像质量评价网络模型S进行迭代训练时从训练样本集B中不放回地随机选取训练样本的个数,qg表示该b个训练样本中第g个训练样本对应的质量分数标签,表示该b个训练样本中第g个训练样本对应的质量预测分数;
T表示当前的迭代次数,L代表更新学习率的步长,即每经过L次迭代就会更新一次学习率,d表示学习率的衰减系数,在损失函数中加入正则化项,并在训练过程中加入权重衰减weight_decay;
步骤3.4,判断是否已遍历训练样本集B,若是,执行步骤3.5,否则,执行步骤3.2和3.3;
步骤3.5,判断t=T是否成立,若是,得到训练好的基于交叉多尺度网络的无参考图像质量评价网络模型S*=St,否则,令t=t+1,并执行步骤3.3和3.4。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310256196.XA CN116245861A (zh) | 2023-03-16 | 2023-03-16 | 基于交叉多尺度的无参考图像质量评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310256196.XA CN116245861A (zh) | 2023-03-16 | 2023-03-16 | 基于交叉多尺度的无参考图像质量评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116245861A true CN116245861A (zh) | 2023-06-09 |
Family
ID=86633109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310256196.XA Pending CN116245861A (zh) | 2023-03-16 | 2023-03-16 | 基于交叉多尺度的无参考图像质量评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116245861A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117636134A (zh) * | 2024-01-25 | 2024-03-01 | 江西财经大学 | 基于层级移动窗口注意力的全景图像质量评价方法与系统 |
CN118096770A (zh) * | 2024-04-29 | 2024-05-28 | 江西财经大学 | 非视口依赖的抗畸变无参考全景图像质量评价方法与系统 |
CN118608927A (zh) * | 2024-08-09 | 2024-09-06 | 江西财经大学 | 一种基于多特征多重组合的图像质量评价方法 |
-
2023
- 2023-03-16 CN CN202310256196.XA patent/CN116245861A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117636134A (zh) * | 2024-01-25 | 2024-03-01 | 江西财经大学 | 基于层级移动窗口注意力的全景图像质量评价方法与系统 |
CN117636134B (zh) * | 2024-01-25 | 2024-04-16 | 江西财经大学 | 基于层级移动窗口注意力的全景图像质量评价方法与系统 |
CN118096770A (zh) * | 2024-04-29 | 2024-05-28 | 江西财经大学 | 非视口依赖的抗畸变无参考全景图像质量评价方法与系统 |
CN118608927A (zh) * | 2024-08-09 | 2024-09-06 | 江西财经大学 | 一种基于多特征多重组合的图像质量评价方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108986050B (zh) | 一种基于多分支卷积神经网络的图像和视频增强方法 | |
CN112001960B (zh) | 基于多尺度残差金字塔注意力网络模型的单目图像深度估计方法 | |
CN108428227B (zh) | 基于全卷积神经网络的无参考图像质量评价方法 | |
CN116245861A (zh) | 基于交叉多尺度的无参考图像质量评价方法 | |
CN111754446A (zh) | 一种基于生成对抗网络的图像融合方法、系统及存储介质 | |
CN109978871B (zh) | 融合概率型和确定型纤维束追踪的纤维束筛选方法 | |
CN111222519B (zh) | 一种层次化彩绘文物线稿提取模型构建、方法及装置 | |
CN109241867B (zh) | 采用人工智能算法识别数字岩心图像的方法及装置 | |
CN112950596B (zh) | 基于多区域多层次的色调映射全向图像质量评价方法 | |
CN117274760A (zh) | 一种基于多尺度混合变换器的红外与可见光图像融合方法 | |
CN111161360A (zh) | 基于Retinex理论的端到端网络的图像去雾方法 | |
CN117237279A (zh) | 一种非均匀失真全景图像盲质量评价方法及系统 | |
CN111861935B (zh) | 一种基于图像修复技术的去雨方法 | |
CN112348762A (zh) | 一种基于多尺度融合生成对抗网络的单幅图像去雨方法 | |
CN115063318A (zh) | 自适应频率分解的低光照图像增强方法与相关设备 | |
CN116823794A (zh) | 一种基于多域失真学习的无参考图像质量评价方法 | |
CN105894507A (zh) | 基于图像信息量自然场景统计特征的图像质量评价方法 | |
CN113034388B (zh) | 一种古代绘画虚拟修复方法及修复模型的构建方法 | |
Shit et al. | An encoder‐decoder based CNN architecture using end to end dehaze and detection network for proper image visualization and detection | |
CN113888417A (zh) | 基于语义解析生成指导的人脸图像修复方法 | |
CN116523985B (zh) | 一种结构和纹理特征引导的双编码器图像修复方法 | |
CN113128517A (zh) | 色调映射图像混合视觉特征提取模型建立及质量评价方法 | |
CN116958736A (zh) | 一种基于跨模态边缘引导的rgb-d显著性目标检测方法 | |
CN116468638A (zh) | 一种基于生成和鉴别平衡对抗的人脸图像修复方法及系统 | |
CN114511465B (zh) | 一种基于改进dcgan的图像修复方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |