CN107743225A - 一种利用多层深度表征进行无参考图像质量预测的方法 - Google Patents
一种利用多层深度表征进行无参考图像质量预测的方法 Download PDFInfo
- Publication number
- CN107743225A CN107743225A CN201710962452.1A CN201710962452A CN107743225A CN 107743225 A CN107743225 A CN 107743225A CN 201710962452 A CN201710962452 A CN 201710962452A CN 107743225 A CN107743225 A CN 107743225A
- Authority
- CN
- China
- Prior art keywords
- image
- layer
- feature
- prediction
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/004—Diagnosis, testing or measuring for television systems or their details for digital television systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种利用多层深度表征进行无参考图像质量预测的方法。本发明包括如下步骤:步骤(1)数据预处理:将所有图像缩放到统一的尺寸大小,减去平局值,将二进制数据转换为深度神经网络能识别的数据格式;步骤(2)特征提取及处理:利用一个在ImageNet上训练好的37层VGGnet模型进行特征提取,提取每层特征并进行处理,得到一个列向量;步骤(3)预测分数:将每层特征融合得到的列向量输入支持向量回归模型得到每层特征的预测分数;将各层分数平均值作为整张图片的质量评估分值。本发明提出了一整简单高效的针对图像质量评价的新方法。并且获得了目前在图像质量评价领域中的最好效果。
Description
技术领域
本发明提到了一种利用多层深度表征进行无参考图像质量预测(BLind Imagequality predictioN via multi-level DEep Representations,BLINDER)的方法,其中主要涉及一种利用深层次网络进行预训练,并提取处理各层特征进行分数预测的方法,以及构建一个准确率极高的分数预测模型的建模表达。
背景技术
图像质量是比较各种图像处理算法性能优劣以及优化系统参数的重要指标,因此在图像采集、编码压缩、网络传输等领域建立有效的图像质量评价机制具有重要的意义。图像质量评价从方法上可分为主观评价方法和客观评价方法,前者凭借实验人员的主观感知来评价对象的质量;后者依据模型给出的量化指标。相对于主观质量评价,客观质量评价具有操作简单、成本低、易于解析和嵌入实现等优点,已经成为图像质量评价的研究重点。
无参考质量评价是客观质量评价方法之一,无参考图像质量评估(Blind imagequality assessment BIQA)的目标是能够在没有原始图像的参考的状态下,自动评估一副图像的质量并给出和人的主观感受相一致的评价值。
近年来,随着深度学习的迅速发展,使用深度神经网络,如深度卷积神经网络(Convolutional Neural Networks,CNN)和深度循环神经网络(Recurrent NeuralNetworks,RNN)进行端到端(end-to-end)地问题建模成为目前计算机视觉方向上的主流研究方向。在图像质量评价上,利用深度神经网络进行图像质量分数评估已经大大的超越了传统的质量评估方法,但仍存在一些缺点,总体可概括为两点:
(1)现有的用于图像质量评价的深度神经网络大都是浅层的,最大的网络仅有七层。然而其它视觉研究已经证明,网络层次越多,网络模型越深,则实验效果越好。所以用深层次的网络进行图像质量评价的研究是值得深入探索的一个方向。
(2)现有的基于深度神经网络进行图像质量评级的方法中,大都是用网络模型的最后一层网络输出作为预测图像质量分数的关键,但是,对于图像质量评价来说最后一层网络可能并不是最佳的选择。深度网络的最后一层往往会过度泛化一些对质量评价有着重要影响的人工操作,比如噪声和模糊,中间层虽然不具有深层网络携带大量深层次信息的能力,但是对于这些能够影响图片质量分数的因素足够敏感,所以对于提取中间层特征信息作为评估图片质量分数的评估依据很有意义。
发明内容
本发明的目的是针对现有技术的不足,提供一种利用多层深度表征进行无参考图像质量预测的方法。我们对五个标准的图像质量评价的数据做了实验,每个数据集均有n张扭曲的图片,和每张图片对应的平均主观分数值(mean opinion scores MOS)或差别平均值(difference mean opinion scores DMOS)值。
给定图像及相应的MOS值或DMOS值作为训练集。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤(1)数据预处理
将所有图像缩放到统一的尺寸大小,减去平局值,将二进制数据转换为深度神经网络能识别的数据格式。
步骤(2)特征提取及处理
利用一个在ImageNet上训练好的37层VGGnet模型进行特征提取,提取每层特征并进行处理,得到一个列向量。
步骤(3)预测分数
将每层特征融合得到的列向量输入支持向量回归模型得到每层特征的预测分数。将各层分数平均值作为整张图片的质量评估分值。
步骤(1)所述的数据预处理:
1-1.在数据集中随机选择部分图像作为训练集,剩下的作为测试集。将训练集中图像缩放为224*224的固定尺寸,缩放后的图像中每个像素均减去RGB的平均值,测试集不作处理。
1-2.将图像的名称和分值一一对应写入txt文本(如:10.jpg4.2),读取txt文本,按名称检索图像,将二进制格式数据转换为神经网络能够识别的数据。
步骤(2)所述的特征提取及处理:
2-1.由于重新训练适用于图像质量评价的深层次网络难度大,花费大,所以我们选择用已经在ImageNet上训练好的37层VGGnet模型进行试验,并提取各层特征作为图像质量评价的依据。该VGGnet模型已经在图像分类上达到了很理想的效果。
2-2.对图像进行特征提取,使用现有的深度神经网络提取每层图像特征形成图像特征Fl,其中Fl∈Rc×h×w,l是深度神经网络的第l层,在本次发明中l=(1,2,...,37),c是图像特征的通道数,h和w分别是图像特征的高和宽。
2-3.每一层的图像特征Fl均有c个通道,即c个特征图Fl,k,Fl,k∈Rh×w,是第l层的第k个特征图,h和w依旧是图像特征的高和宽。将每个Fl,k中的最大值提取出来,组成列向量ul,k,最小值提取出来组成列向量vl,k。
ul,k=max{Fl,k}and
vl,k=min{Fl,k} (公式1)
2-4.将步骤2-3得到的c个特征向量组合得到fl作为第l层的特征进行。
fl={ul,1,...ul,c,vl,1,...vl,c} (公式2)
其中,fl的维度是2c,同时包含了每个特征图的最大值和最小值
步骤(3)所述的预测分数:
3-1.利用径向基核函数(radial basis function RBF)的支持向量回归,将fl作为输入,计算出每一层深度网络的图像质量分数sl。径向基核函数的定义如下:
K(xi,xj)=<φ(xi),φ(xj)>=exp(-xi-xj||2/2σ2) (公式3)
其中,φ(.)可以将低维向量映射到高维空间,σ是高斯核的标准差。
计算图像质量分数sl的公式如下:
sl=〈ω,φ(fl)〉+b (公式4)
其中,ω是权重,b是偏置,ω和b是在训练中得到的;
经过上述操作,能够得到深度神经网络每一层对于图片的质量评分s,s={sl|l=1,...,L};
3-2.把所有层的质量分数相加求平均作为图片的最终质量评分q;如下公式所示:
其中,l表示深度网络的第l层,L表示深度神经网络的深度,此处L=37。
本发明有益效果如下:
依据图像质量评价相关评价标准,本发明对于图像的预测分数与原分数相关度极高,在一些数据集上的预测效果处理领先地位。因此在做图像处理相关工作时,利用本发明对处理后的图像做图像质量分数预测,与主观预测分值相当,可根据预测值修正图片,提高图片质量。
附图说明
图1是本发明的框架示意图;
图2是本发明的特征提取方法示意图。
具体实施方式
下面结合附图对本发明坐进一步说明。
如图1所示,利用多层深度表征进行无参考质量评价方法,具体包括如下步骤:
步骤(1)数据预处理
将所有图像缩放到统一的尺寸大小,减去平局值,将二进制数据转换为深度神经网络能识别的数据格式。
步骤(2)特征提取及处理
利用一个在ImageNet上训练好的37层VGGnet模型进行特征提取,提取每层特征并进行处理,得到一个列向量。
步骤(3)预测分数
将每层特征融合得到的列向量输入支持向量回归模型得到每层特征的预测分数。将各层分数平均值作为整张图片的质量评估分值。
步骤(1)所述的数据预处理:
1-1.在数据集中随机选择部分图像作为训练集,剩下的作为测试集。将训练集中图像缩放为224*224的固定尺寸,缩放后的图像中每个像素均减去RGB的平均值,测试集不作处理。
1-2.将图像的名称和分值一一对应写入txt文本(如:10.jpg4.2),读取txt文本,按名称检索图像,将二进制格式数据转换为神经网络能够识别的数据。
步骤(2)所述的特征提取及处理:
2-1.由于重新训练适用于图像质量评价的深层次网络难度大,花费大,所以我们选择用已经在ImageNet上训练好的37层VGGnet模型进行试验,并提取各层特征作为图像质量评价的依据。该VGGnet模型已经在图像分类上达到了很理想的效果。
2-2.对图像进行特征提取,使用现有的深度神经网络提取每层图像特征形成图像特征Fl,其中Fl∈Rc×h×w,l是深度神经网络的第l层,在本次发明中l=(1,2,...,37),c是图像特征的通道数,h和w分别是图像特征的高和宽。
2-3.每一层的图像特征Fl均有c个通道,即c个特征图Fl,k,Fl,k∈Rh×w,是第l层的第k个特征图,h和w依旧是图像特征的高和宽。将每个Fl,k中的最大值提取出来,组成列向量ul,k,最小值提取出来组成列向量vl,k。
ul,k=max{Fl,k}and
vl,k=min{Fl,k} (公式1)
2-4.将步骤2-3得到的c个特征向量组合得到fl作为第l层的特征进行。
fl={ul,1,...ul,c,vl,1,...vl,c} (公式2)
其中,fl的维度是2c,同时包含了每个特征图的最大值和最小值
步骤(3)所述的预测分数:
3-1.利用径向基核函数(radial basis function RBF)的支持向量回归,将fl作为输入,计算出每一层深度网络的图像质量分数sl。径向基核函数的定义如下:
K(xi,xj)=〈φ(xi),φ(xj)〉=exp(-||xi-xj||2/2σ2) (公式3)
其中,φ(.)可以将低维向量映射到高维空间,σ是高斯核的标准差。
计算图像质量分数sl的公式如下:
sl=〈ω,φ(fl)〉+b (公式4)
其中,ω是权重,b是偏置,ω和b是在训练中得到的。
3-2.经过上述操作,能够得到深度神经网络每一层对于图片的质量评分,s={sll=1,...,L}。然后,把所有层的质量分数相加求平均作为图片的最终质量评分q。如下公式所示:
其中,l表示深度网络的第l层,L表示深度神经网络的深度,此处L=37。
Claims (4)
1.一种利用多层深度表征进行无参考图像质量预测的方法,其特征在于包括如下步骤:
步骤(1)数据预处理
将所有图像缩放到统一的尺寸大小,减去平局值,将二进制数据转换为深度神经网络能识别的数据格式;
步骤(2)特征提取及处理
利用一个在ImageNet上训练好的37层VGGnet模型进行特征提取,提取每层特征并进行处理,得到一个列向量;
步骤(3)预测分数
将每层特征融合得到的列向量输入支持向量回归模型得到每层特征的预测分数;将各层分数平均值作为整张图片的质量评估分值。
2.根据权利要求1所述的一种利用多层深度表征进行无参考图像质量预测的方法,其特征在于步骤(1)所述的数据预处理:
1-1.在数据集中随机选择部分图像作为训练集,剩下的作为测试集;将训练集中图像缩放为224*224的固定尺寸,缩放后的图像中每个像素均减去RGB的平均值,测试集不作处理;
1-2.将图像的名称和分值一一对应写入txt文本,读取txt文本,按名称检索图像,将二进制格式数据转换为神经网络能够识别的数据。
3.根据权利要求2所述的一种利用多层深度表征进行无参考图像质量预测的方法,其特征在于步骤(2)所述的特征提取及处理:
2-1.选择用已经在ImageNet上训练好的37层VGGnet模型进行试验,并提取各层特征作为图像质量评价的依据;
2-2.对图像进行特征提取,使用深度神经网络提取每层图像特征形成图像特征Fl,其中Fl∈Rc×h×w,l是深度神经网络的第l层,l=(1,2,...,37),c是图像特征的通道数,h和w分别是图像特征的高和宽;
2-3.每一层的图像特征Fl均有c个通道,即c个特征图Fl,k,Fl,k∈Rh×w,是第l层的第k个特征图,h和w依旧是图像特征的高和宽;将每个Fl,k中的最大值提取出来,组成列向量ul,k,最小值提取出来组成列向量vl,k;
ul,k=max{Fl,k}and
vl,k=min{Fl,k} (公式1)
2-4.将步骤2-3得到的c个特征向量组合得到fl作为第l层的特征进行;
fl={ul,1,...ul,c,vl,1,...vl,c} (公式2)
其中,fl的维度是2c,同时包含了每个特征图的最大值和最小值。
4.根据权利要求3所述的一种利用多层深度表征进行无参考图像质量预测的方法,其特征在于步骤(3)所述的预测分数:
3-1.利用径向基核函数的支持向量回归,将fl作为输入,计算出每一层深度网络的图像质量分数sl;径向基核函数的定义如下:
其中,φ(.)能够将低维向量映射到高维空间,σ是高斯核的标准差;
计算图像质量分数sl的公式如下:
sl=<ω,φ(fl)>+b (公式4)
其中,ω是权重,b是偏置,ω和b是在训练中得到的;
经过上述操作,能够得到深度神经网络每一层对于图片的质量评分s,s={sl|l=1,...,L};
3-2.把所有层的质量分数相加求平均作为图片的最终质量评分q;如下公式所示:
其中,l表示深度网络的第l层,L表示深度神经网络的深度,此处L=37。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710962452.1A CN107743225B (zh) | 2017-10-16 | 2017-10-16 | 一种利用多层深度表征进行无参考图像质量预测的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710962452.1A CN107743225B (zh) | 2017-10-16 | 2017-10-16 | 一种利用多层深度表征进行无参考图像质量预测的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107743225A true CN107743225A (zh) | 2018-02-27 |
CN107743225B CN107743225B (zh) | 2019-08-06 |
Family
ID=61236736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710962452.1A Active CN107743225B (zh) | 2017-10-16 | 2017-10-16 | 一种利用多层深度表征进行无参考图像质量预测的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107743225B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647696A (zh) * | 2018-05-08 | 2018-10-12 | 北京三快在线科技有限公司 | 图片颜值确定方法及装置、电子设备、存储介质 |
CN109615627A (zh) * | 2018-12-14 | 2019-04-12 | 国网山东省电力公司信息通信公司 | 一种输变电巡检图像质量评价方法及系统 |
CN109754391A (zh) * | 2018-12-18 | 2019-05-14 | 北京爱奇艺科技有限公司 | 一种图像质量评价方法、装置及电子设备 |
CN111210426A (zh) * | 2020-01-15 | 2020-05-29 | 浙江大学 | 一种基于非限制标准模板的图像质量评分方法 |
CN112598614A (zh) * | 2019-09-17 | 2021-04-02 | 南京大学 | 一种基于深度神经网络的司法图像质量度量方法 |
CN112700425A (zh) * | 2021-01-07 | 2021-04-23 | 云南电网有限责任公司电力科学研究院 | 一种用于电力设备x射线图像质量的判定方法 |
CN112734733A (zh) * | 2021-01-12 | 2021-04-30 | 天津大学 | 基于通道重组与特征融合的无参考图像质量监测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160678A (zh) * | 2015-09-02 | 2015-12-16 | 山东大学 | 基于卷积神经网络的无参考立体图像质量评估方法 |
CN105208374A (zh) * | 2015-08-24 | 2015-12-30 | 宁波大学 | 一种基于深度学习的无参考图像质量客观评价方法 |
US20160035078A1 (en) * | 2014-07-30 | 2016-02-04 | Adobe Systems Incorporated | Image assessment using deep convolutional neural networks |
WO2016145571A1 (zh) * | 2015-03-13 | 2016-09-22 | 深圳大学 | 基于条件直方图码书的盲图像质量评价方法 |
CN106686377A (zh) * | 2016-12-30 | 2017-05-17 | 佳都新太科技股份有限公司 | 一种基于深层神经网络的视频重点区域确定算法 |
CN106780434A (zh) * | 2016-11-15 | 2017-05-31 | 天津大学 | 水下图像视觉质量评价方法 |
CN107027023A (zh) * | 2017-04-24 | 2017-08-08 | 北京理工大学 | 基于神经网络的VoIP无参考视频通信质量客观评价方法 |
-
2017
- 2017-10-16 CN CN201710962452.1A patent/CN107743225B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160035078A1 (en) * | 2014-07-30 | 2016-02-04 | Adobe Systems Incorporated | Image assessment using deep convolutional neural networks |
WO2016145571A1 (zh) * | 2015-03-13 | 2016-09-22 | 深圳大学 | 基于条件直方图码书的盲图像质量评价方法 |
CN105208374A (zh) * | 2015-08-24 | 2015-12-30 | 宁波大学 | 一种基于深度学习的无参考图像质量客观评价方法 |
CN105160678A (zh) * | 2015-09-02 | 2015-12-16 | 山东大学 | 基于卷积神经网络的无参考立体图像质量评估方法 |
CN106780434A (zh) * | 2016-11-15 | 2017-05-31 | 天津大学 | 水下图像视觉质量评价方法 |
CN106686377A (zh) * | 2016-12-30 | 2017-05-17 | 佳都新太科技股份有限公司 | 一种基于深层神经网络的视频重点区域确定算法 |
CN107027023A (zh) * | 2017-04-24 | 2017-08-08 | 北京理工大学 | 基于神经网络的VoIP无参考视频通信质量客观评价方法 |
Non-Patent Citations (2)
Title |
---|
KE GU等: "Deep Learing Network For Blind Image Quality Assessment", 《IEEE INTERNATIONAL CONFERENCE ON INAGE PROCESSING》 * |
QINGBO WU: "Q-dnn: A Quality-Aware Deep Neural Network for Blind Assessment of Enhanced Images", 《VISUAL COMMUNICATIONS &IMAGE PROCESSING》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647696A (zh) * | 2018-05-08 | 2018-10-12 | 北京三快在线科技有限公司 | 图片颜值确定方法及装置、电子设备、存储介质 |
CN108647696B (zh) * | 2018-05-08 | 2021-07-23 | 北京三快在线科技有限公司 | 图片颜值确定方法及装置、电子设备、存储介质 |
CN109615627A (zh) * | 2018-12-14 | 2019-04-12 | 国网山东省电力公司信息通信公司 | 一种输变电巡检图像质量评价方法及系统 |
CN109615627B (zh) * | 2018-12-14 | 2021-07-27 | 国网智能科技股份有限公司 | 一种输变电巡检图像质量评价方法及系统 |
CN109754391A (zh) * | 2018-12-18 | 2019-05-14 | 北京爱奇艺科技有限公司 | 一种图像质量评价方法、装置及电子设备 |
CN109754391B (zh) * | 2018-12-18 | 2021-10-22 | 北京爱奇艺科技有限公司 | 一种图像质量评价方法、装置及电子设备 |
CN112598614A (zh) * | 2019-09-17 | 2021-04-02 | 南京大学 | 一种基于深度神经网络的司法图像质量度量方法 |
CN111210426A (zh) * | 2020-01-15 | 2020-05-29 | 浙江大学 | 一种基于非限制标准模板的图像质量评分方法 |
CN112700425A (zh) * | 2021-01-07 | 2021-04-23 | 云南电网有限责任公司电力科学研究院 | 一种用于电力设备x射线图像质量的判定方法 |
CN112700425B (zh) * | 2021-01-07 | 2024-04-26 | 云南电网有限责任公司电力科学研究院 | 一种用于电力设备x射线图像质量的判定方法 |
CN112734733A (zh) * | 2021-01-12 | 2021-04-30 | 天津大学 | 基于通道重组与特征融合的无参考图像质量监测方法 |
CN112734733B (zh) * | 2021-01-12 | 2022-11-01 | 天津大学 | 基于通道重组与特征融合的无参考图像质量监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107743225B (zh) | 2019-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107743225B (zh) | 一种利用多层深度表征进行无参考图像质量预测的方法 | |
CN108090902B (zh) | 一种基于多尺度生成对抗网络的无参考图像质量客观评价方法 | |
CN108428227B (zh) | 基于全卷积神经网络的无参考图像质量评价方法 | |
CN106650737B (zh) | 图像自动裁剪方法 | |
CN107633520A (zh) | 一种基于深度残差网络的超分辨率图像质量评估方法 | |
CN110033446A (zh) | 基于孪生网络的增强图像质量评价方法 | |
CN107146220B (zh) | 一种通用型无参考图像质量评价方法 | |
CN109961434A (zh) | 面向层级语义衰减的无参考图像质量评价方法 | |
CN108074239A (zh) | 一种基于先验感知质量特征图的无参考图像质量客观评价方法 | |
CN112767385B (zh) | 基于显著性策略与特征融合无参考图像质量评价方法 | |
CN111429402A (zh) | 高级视觉感知特征与深度特征融合的图像质量评价方法 | |
CN114066812B (zh) | 基于空间注意力机制的无参考图像质量评价方法 | |
CN113284100A (zh) | 基于恢复图像对混合域注意力机制的图像质量评价方法 | |
CN109788275A (zh) | 自然性、结构和双目不对称无参考立体图像质量评价方法 | |
CN109886945A (zh) | 基于对比度增强的无参考对比度失真图像质量评价方法 | |
CN115272203A (zh) | 一种基于深度学习的无参考图像质量评价方法 | |
CN113888501A (zh) | 一种基于注意力定位网络的无参考型图像质量评价方法 | |
CN112348809A (zh) | 基于多任务深度学习的无参考屏幕内容图像质量评价方法 | |
Wang et al. | Distortion recognition for image quality assessment with convolutional neural network | |
CN106022362A (zh) | 针对jpeg2000压缩失真的无参考图像质量客观评价方法 | |
CN106210710A (zh) | 一种基于多尺度字典的立体图像视觉舒适度评价方法 | |
Yang et al. | EHNQ: Subjective and objective quality evaluation of enhanced night-time images | |
CN104766299A (zh) | 一种基于概率图模型的图像质量评估方法 | |
Chen et al. | Gap-Closing Matters: Perceptual Quality Evaluation and Optimization of Low-Light Image Enhancement | |
CN112508847A (zh) | 一种基于深度特征与结构加权lbp特征的图像质量评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |