CN109886924A - 基于cnn的屏幕失真图像无参考质量评价方法 - Google Patents
基于cnn的屏幕失真图像无参考质量评价方法 Download PDFInfo
- Publication number
- CN109886924A CN109886924A CN201910050569.1A CN201910050569A CN109886924A CN 109886924 A CN109886924 A CN 109886924A CN 201910050569 A CN201910050569 A CN 201910050569A CN 109886924 A CN109886924 A CN 109886924A
- Authority
- CN
- China
- Prior art keywords
- image
- cnn
- predicted
- divided
- unpredicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 16
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 7
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 22
- 230000004913 activation Effects 0.000 claims abstract description 5
- 230000008447 perception Effects 0.000 claims abstract description 5
- 238000011176 pooling Methods 0.000 claims description 16
- 238000000354 decomposition reaction Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 230000002146 bilateral effect Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 230000015556 catabolic process Effects 0.000 abstract description 2
- 238000006243 chemical reaction Methods 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 4
- 238000012549 training Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种基于CNN的屏幕失真图像无参考质量评价方法,包括以下步骤:图像分解:给定一张图像,将其调整到227x 227大小,采用半参数模型将图像分为预测部分和未预测部分;将分解得到的预测图和未预测图转化为灰度图,分别对转化后的灰度图进行归一化处理;设计分为两路的卷积神经网络CNN,将经过归一化处理的预测图和未预测图作为输入,上下两路网络结构相同;网络分为6个卷积层,3个池化层以及两个跳层连接,采用ReLU作为激活函数,融合上下两路输出,将其送入多层感知MLP中处理,得到预测图像的质量分数。
Description
技术领域
本发明属于图像处理领域,尤其是涉及一种针对屏幕失真图像的无参考质量评价方法。
背景技术
近年来,随着互联网发展和社交软件的普及,人们借助于一类屏幕内容图像来传递信息和分享喜悦。这类图像由自然场景图像和计算机生成的图形内容组合而成,相比于自然图像,屏幕内容图像是通过截屏得到的,而不是通过照相机拍摄;屏幕内容图像色彩和亮度的变化较小,结构相对简单。屏幕内容图像经过网络传输,往往会产生严重的失真情况。此外,屏幕失真图像由于自身具有自然图像和文本图像的特点,传统的特征提取方法难以表示其失真特性,因此当务之急是寻找一种高效的特征表示方法。卷积神经网络(ConvolutionalNeural Network,CNN)的提出取代了传统手工特征的设计过程,并且学者们已经证明了其在分类、回归等问题上的显著性能。
发明内容
本发明利用CNN进行特征表示,提出一种无参考屏幕失真图像质量评价方法,该方法与主观评价分数有着较高的一致性。技术方案如下。
一种基于CNN的屏幕失真图像无参考质量评价方法,包括以下步骤:
第一步,图像分解
给定一张图像,将其调整到227 x 227大小,采用半参数模型将图像分为预测部分和未预测部分方法如下:
(1)建立自回归模型:
χi=Xk(χi)·a+εi
其中,χi表示图像的第i个像素值,Xk(χi)表示邻近χi的k个像素组成的向量,a表示自回归参数,εi表示误差项;
(2)预测部分通过自回归模型和双边滤波的线性融合得到:
其中,和b分别表示自回归模型和双边滤波器的估计参数,ω=0.2用于控制两部分的重要程度;
(3)未预测部分可以通过输入像素yi和预测部分的差导出:
(4)根据半参数模型将图像分为预测部分和未预测部分;
第二步,将分解得到的预测图和未预测图转化为灰度图,分别对转化后的灰度图进行归一化处理;
第三步,CNN
设计分为两路的卷积神经网络CNN,将经过归一化处理的预测图和未预测图作为输入,上下两路网络结构相同;网络分为6个卷积层,3个池化层以及两个跳层连接,采用ReLU作为激活函数,融合上下两路输出,将其送入多层感知MLP中处理,得到预测图像的质量分数Sp。
本发明提出一种基于CNN的屏幕失真图像质量评价方法,无需引入参考图像,可以有效评价屏幕失真图像质量。
附图说明
图1算法框架
具体实施方式
本发明提出一种无参考屏幕失真图像质量评价方法,框架如图1所示。
(1)图像分解
首先将图像调整到227x 227大小,以适应后续网络的输入。本发明采用半参数模型将图像分为预测部分和未预测部分首先自回归模型可以表示为:
χi=Xk(χi)·a+εi \*MERGEFORMAT (1)
其中,χi表示图像的第i个像素值,Xk(χi)表示邻近χi的k个像素组成的向量,a表示自回归参数,εi表示误差项。
预测部分通过自回归模型和双边滤波的线性融合得到:
其中,和b分别表示自回归模型和双边滤波器的估计参数,ω=0.2用于控制两部分的重要程度。
未预测部分可以通过输入像素yi和预测部分的差导出:
(2)归一化
给定一张图像在(x,y)处的灰度图I(x,y),归一化过程可以表示如下:
其中,C取1以免分母趋于0,μ(x,y)和σ(x,y)分别表示输入图像的均值和方差。
(3)CNN
本发明提出的CNN分为上下两路,网络结构等同。输入图像是分解以及归一化预处理之后的,图像尺寸为227x227。网络包括6个卷积层,3个池化层,以及两个跳层连接,采用ReLU作为激活函数。上下两路输出融合后得到200维特征向量,经过多层感知MLP得到最终的预测图像质量分数Sp。
1)卷积
本发明采用6个卷积层对输入图像进行局部卷积运算,卷积核的设置如下:
表1卷积核参数设置
卷积过程可以表示如下:
其中,和ηk表示卷积参数,表示第k个特征图,Υxy表示感受野对应的图像区域,总的特征图设置为50。
为了解决深层网络退化问题,在两层卷积之间加入跳层连接模块。具体的,第一个跳层连接设置为28 x 28 x 50,28 x 28 x 50,第二个跳层连接设置为14 x 14 x 50,14 x14 x 50。
2)池化
本发明采用了两种池化形式,最大池化和平均池化。三个池化层的参数设置见下表:
表2池化参数设置
池化层 | 核尺寸 | 步长 |
pool1 | 3 | 2 |
pool2 | 2 | 2 |
pool3 | 14 | 14 |
最大池化可以表示为:
其中,表示第k个最大池化的值,Ω表示最大池化的局部窗口大小,如表2所示。
平均池化可以表示为:
其中,表示第k个平均池化的值,Nh,Nv分别表示水平和竖直方向上的局部窗口。
3)多层感知MLP
池化后,网络的每一支会得到100维特征向量,将网络上下两支输出融合得到200维特征向量。为了回归得到一张图片的客观质量分数,采用多层感知MLP。MLP由两层全连接层组成,如图1所示。预测的质量分数可以表示为:
Sp=ωs(λ(ωh(θim)+ζh))+ζs \*MERGEFORMAT (8)
其中,λ(·)表示非线性激活函数ReLU,ωh,ζh表示将特征向量(θim)映射到隐藏层上表示的参数,ωs,ζs表示计算预测值Sp的参数。
4)训练
在分解的预测图和未预测图上训练网络,两路输入的标签均取自分解前的图像,将训练的目标函数表示如下:
其中,Sl表示一批中第l张图像,L=256,表示训练的标签。通过随机梯度下降和反向传播来最小化目标函数,从而更新CNN中各层参数。
为了提供海量的训练数据验证网络的性能,人工挑选1000张高质量的屏幕内容图像,经过对比度改变,高斯噪声,运动模糊,高斯模糊,JPEG和JEPG2000压缩处理得到30000张屏幕失真图像,采用SQMS算法得到每张图的标签。训练得到CNN模型后,在SIQAD数据库的80%数据微调,剩余的20%进行测试。采用斯皮尔曼秩相关系数(Spearman Rank-orderCorrelation Coefficient,SRCC)和皮尔森线性相关系数(Pearson Linear CorrelationCoefficient,PLCC)作为评估准则,PLCC和SRCC越高,说明算法性能越好。取10次训练-测试分割的均值分数作为结果,PLCC达到了0.8834,SRCC也高达0.8634,说明本方法的预测值与主观评分之间的相关性高,表明本发明适用于评价屏幕失真图像质量。
Claims (1)
1.一种基于CNN的屏幕失真图像无参考质量评价方法,包括以下步骤:
第一步,图像分解
给定一张图像,将其调整到227x227大小,采用半参数模型将图像分为预测部分和未预测部分方法如下:
(1)建立自回归模型:
χi=Xk(χi)·a+εi
其中,χi表示图像的第i个像素值,Xk(χi)表示邻近χi的k个像素组成的向量,a表示自回归参数,εi表示误差项;
(2)预测部分通过自回归模型和双边滤波的线性融合得到:
其中,和b分别表示自回归模型和双边滤波器的估计参数,ω=0.2用于控制两部分的重要程度;
(3)未预测部分可以通过输入像素yi和预测部分的差导出:
(4)根据半参数模型将图像分为预测部分和未预测部分;
第二步,将分解得到的预测图和未预测图转化为灰度图,分别对转化后的灰度图进行归一化处理;
第三步,卷积神经网络CNN
设计分为两路的卷积神经网络CNN,将经过归一化处理的预测图和未预测图作为输入,上下两路网络结构相同;网络分为6个卷积层,3个池化层以及两个跳层连接,采用ReLU作为激活函数,融合上下两路输出,将其送入多层感知MLP中处理,得到预测图像的质量分数Sp。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910050569.1A CN109886924A (zh) | 2019-01-19 | 2019-01-19 | 基于cnn的屏幕失真图像无参考质量评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910050569.1A CN109886924A (zh) | 2019-01-19 | 2019-01-19 | 基于cnn的屏幕失真图像无参考质量评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109886924A true CN109886924A (zh) | 2019-06-14 |
Family
ID=66926316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910050569.1A Pending CN109886924A (zh) | 2019-01-19 | 2019-01-19 | 基于cnn的屏幕失真图像无参考质量评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109886924A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348809A (zh) * | 2020-11-30 | 2021-02-09 | 天津大学 | 基于多任务深度学习的无参考屏幕内容图像质量评价方法 |
CN112734728A (zh) * | 2021-01-11 | 2021-04-30 | 西安邮电大学 | 一种改进的cnn无参考图像质量评估方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108074239A (zh) * | 2017-12-30 | 2018-05-25 | 中国传媒大学 | 一种基于先验感知质量特征图的无参考图像质量客观评价方法 |
CN108428227A (zh) * | 2018-02-27 | 2018-08-21 | 浙江科技学院 | 基于全卷积神经网络的无参考图像质量评价方法 |
CN109167996A (zh) * | 2018-09-21 | 2019-01-08 | 浙江科技学院 | 一种基于卷积神经网络的无参考立体图像质量评价方法 |
-
2019
- 2019-01-19 CN CN201910050569.1A patent/CN109886924A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108074239A (zh) * | 2017-12-30 | 2018-05-25 | 中国传媒大学 | 一种基于先验感知质量特征图的无参考图像质量客观评价方法 |
CN108428227A (zh) * | 2018-02-27 | 2018-08-21 | 浙江科技学院 | 基于全卷积神经网络的无参考图像质量评价方法 |
CN109167996A (zh) * | 2018-09-21 | 2019-01-08 | 浙江科技学院 | 一种基于卷积神经网络的无参考立体图像质量评价方法 |
Non-Patent Citations (1)
Title |
---|
GUANGHUI YUE: "Blind quality assessment for screen content images via convolutional neural network", 《ELSEVIER》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348809A (zh) * | 2020-11-30 | 2021-02-09 | 天津大学 | 基于多任务深度学习的无参考屏幕内容图像质量评价方法 |
CN112348809B (zh) * | 2020-11-30 | 2023-05-23 | 天津大学 | 基于多任务深度学习的无参考屏幕内容图像质量评价方法 |
CN112734728A (zh) * | 2021-01-11 | 2021-04-30 | 西安邮电大学 | 一种改进的cnn无参考图像质量评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108932697B (zh) | 一种失真图像的去失真方法、装置及电子设备 | |
CN110992275B (zh) | 一种基于生成对抗网络的细化单幅图像去雨方法 | |
CN107633520A (zh) | 一种基于深度残差网络的超分辨率图像质量评估方法 | |
CN111260591B (zh) | 一种基于注意力机制的图像自适应去噪方法 | |
CN114066747B (zh) | 一种基于光照和反射互补性的低照度图像增强方法 | |
CN107464217B (zh) | 一种图像处理方法及装置 | |
CN111105376B (zh) | 基于双分支神经网络的单曝光高动态范围图像生成方法 | |
CN113658130B (zh) | 基于双重孪生网络的无参考屏幕内容图像质量评估方法 | |
CN109871790B (zh) | 一种基于混合神经网络模型的视频去色方法 | |
CN112634238A (zh) | 一种基于注意力模块的图像质量评价方法 | |
CN112070688A (zh) | 一种基于上下文引导生成对抗网络的单幅图像去雾方法 | |
CN109886924A (zh) | 基于cnn的屏幕失真图像无参考质量评价方法 | |
CN110458784A (zh) | 一种基于图像感知质量的去压缩噪声方法 | |
CN113222875A (zh) | 一种基于色彩恒常性的图像和谐化合成方法 | |
CN111105357A (zh) | 一种失真图像的去失真方法、装置及电子设备 | |
CN113627302A (zh) | 一种登高施工合规性检测方法及系统 | |
CN113128517A (zh) | 色调映射图像混合视觉特征提取模型建立及质量评价方法 | |
CN117078553A (zh) | 一种基于多尺度深度学习的图像去雾方法 | |
CN116912114A (zh) | 基于高阶曲线迭代的无参考低光照图像增强方法 | |
CN116563133A (zh) | 基于模拟曝光和多尺度融合的低照度彩色图像增强方法 | |
CN114821174B (zh) | 一种基于内容感知的输电线路航拍图像数据清洗方法 | |
CN115760640A (zh) | 基于含噪Retinex模型的煤矿低光照图像增强方法 | |
CN113379641B (zh) | 一种基于自编码卷积神经网络的单幅图像去雨方法及系统 | |
CN114627005B (zh) | 一种雨密度分类引导的双阶段单幅图像去雨方法 | |
Liu et al. | The First Comprehensive Dataset with Multiple Distortion Types for Visual Just-Noticeable Differences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190614 |
|
WD01 | Invention patent application deemed withdrawn after publication |