CN108537747A - 一种基于带对称跨层连接的卷积神经网络的图像修复方法 - Google Patents
一种基于带对称跨层连接的卷积神经网络的图像修复方法 Download PDFInfo
- Publication number
- CN108537747A CN108537747A CN201810239695.7A CN201810239695A CN108537747A CN 108537747 A CN108537747 A CN 108537747A CN 201810239695 A CN201810239695 A CN 201810239695A CN 108537747 A CN108537747 A CN 108537747A
- Authority
- CN
- China
- Prior art keywords
- image
- layer
- network
- training
- train
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 22
- 230000008439 repair process Effects 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 53
- 238000013528 artificial neural network Methods 0.000 claims abstract description 37
- 230000000694 effects Effects 0.000 claims abstract description 30
- 238000012795 verification Methods 0.000 claims abstract description 29
- 230000008569 process Effects 0.000 claims abstract description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000003475 lamination Methods 0.000 claims description 19
- 230000006378 damage Effects 0.000 claims description 18
- 238000005520 cutting process Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 16
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 15
- 230000009467 reduction Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000011084 recovery Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 8
- 238000005070 sampling Methods 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 230000004438 eyesight Effects 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于带对称跨层连接的卷积神经网络的图像修复方法,包含如下步骤:训练数据预处理;自动生成模糊训练图像;构建神经网络;训练神经网络;验证修复效果并进行参数调整。本发明能从受损图像基础上,修复出更为清晰的原图像,提升传统图像去噪、图像超分辨率、图像补全等方法的效果。此外,通过在卷积神经网络中加入对称跨层连接,可以更容易优化更深层次的神经网络,提高模型泛化能力,同时保留底层图像细节,得到更好的修复后图像。本发明实现了高效、清晰的图像还原,因此具有较高的实用价值。
Description
技术领域
本发明涉及图像还原领域,尤其涉及一种基于带对称跨层连接的卷积神经网络(Convolutional Neural Network,CNN)的图像修复方法。
背景技术
随着信息技术的不断飞速发展,各个领域每天都在以惊人的速度产生各种类型的图像数据。在大量的图像数据获取、传播过程中,图像往往会被人为压缩、降低分辨率,或非人为地造成扰动噪声,而如何从受到破坏的图像中尽可能真实地恢复原图像,成为了一个十分重要的问题。随着越来越多的具有拍照功能的移动设备如照相机、手机、平板等的日益普及,以及社交网络的兴起,人们获取图像的方式越来越多,也进一步促使图像数据急剧增长,如何从有损坏的图像中尽可能清晰地还原原图像也成为了十分重要的问题。人们迫切希望计算机能帮助人类,对互联网中海量低质量或有损坏图像进行分析,并充分理解底层图像特征,进而更有效地对其进行修复。
图像修复作为底层图像理解最主要的技术之一,一直受到了学术界和工业界的广泛关注,并且经常作为各种图像相关国际学术会议的重要主题,是跨计算机视觉和图像处理领域一个非常重要的研究课题。图像修复是指根据图像内部结构关联性信息,通过一定的技术手段,从受到外部原因破坏后的损坏图像数据中恢复清晰的图像的问题,其具体问题包括图像去噪声,图像超分辨率,和JPEG压缩图像还原等。图像修复不仅是单一的底层图像恢复问题,也同时作为许多高层图像语义研究的突破口,成为了图像理解任务不可分割的部分。科学研究人员已经渐渐意识到以上问题的重要性并不断深入分析。近几年,基于深度神经网络,特别是深度卷积神经网络的方法广泛应用于许多计算机视觉和模式识别任务,在许多高层图像理解任务,如图像分类,图像分割等问题上取得令人瞩目的效果,但在底层图像分析和修复领域,仍有许多研究点尚未涉及,因此在该领域仍有巨大的突破空间。基于卷积神经网络的图像修复方法的研究,已成为当前相关领域研究的的热点,对积极推进社会信息化起到重要作用。在创造了无可替代的社会价值的同时,该领域仍有许多关键技术问题尚未解决,仍有许多功能实现需要进一步完善,因此,如何利用深度卷积神经网络,更有效地学习修复受损图像,并加深对图像数据的理解,以更灵活地实现计算机视觉的研究,具有深远的意义。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于带跨层连接的卷积神经网络的图像修复方法,通过在海量受损-清晰图像数据中训练卷积神经网络模型,最终提高图像修复的效果。
为了解决上述技术问题,本发明公开了一种基于带跨层连接的卷积神经网络(Convolutional Neural Network,CNN)的图像修复方法,包含如下步骤:
步骤1,图像预处理,采集无损图像数据,对每张图像做随机采样得到无损图像集合Y;
步骤2,生成训练集和验证集:根据要解决的图像修复任务,对无损图像集合Y中的图像进行破坏,得到破坏后的图像集X,在(X,Y)中随机取出90%作为训练集(Xtrain,Ytrain),另外10%作为验证集(Xval,Yval);
步骤3,构建神经网络:根据输入图像大小构建卷积神经网络,设网络总深度为D层,D为偶数,其中前D/2层为卷积层,后D/2层为反卷积层,卷积核大小为3x3,步长为1,输入为破坏后的图像集X中的图像,输出为网络恢复后图像;
步骤4,使用ADAM优化算法(Kingma,Diederik P.,and Jimmy Ba."Adam:A methodfor stochastic optimization."arXiv preprint arXiv:1412.6980(2014).),采用步骤2得到的训练集(Xtrain,Ytrain)对所构建神经网络进行训练,以破坏后的图像集X中的图像作为输入,并以无损图像集合Y中对应的无损图像作为网络监督信息,优化图像网络输出和Y中图片的欧式距离;
步骤5,将步骤4得到的训练后网络作为模型,在验证集(Xval,Yval)上测试模型图像还原效果,并调整ADAM优化算法步长继续训练,直到验证集还原效果不变。
步骤1包括如下步骤:
步骤1-1,采集无损图像数据,对每幅图像进行局部裁剪,采用随机采样的方式,得到若干大小相同的裁剪后图像,裁剪后图像块大小为50*50;
步骤1-2,对每个裁剪后图像块,将其进行归一化和中心化处理;首先计算裁剪后图像数据集合上每个像素的均值和标准差,设这些图像均值图像为标准差为std,对于一张特定图像x,对其进行归一化和中心化如下:
x′为图像x处理后的图像;
步骤1-3,对于所有图像进行步骤1-2的操作,最终得到无损图像集合Y=[y_1,y_2,…y_n]∈R^(W*H*C),其中R为实数集,n为所提取的裁剪图像总数,y_n表示无损图像集合Y中第n副图像,W和H分别为裁剪图像的宽度和高度,C为图像通道数,对于黑白图像C=1,彩色图像C=3。
步骤2包括:
步骤2-1,对无损图像集合Y中的图像根据修复任务不同进行破坏:
如果是图像去噪任务,对图像的每个像素加高斯噪声,设pi表示图像集Y中一幅图像I的第i个像素点,i∈[0,W*H*C),并且设目标噪声等级为ε,第i个像素点噪声为ci,则ci服从正态分布:ci~N(0,ε),N表示正态分布,最终噪声图像的第i个像素点p′i=pi+i;
如果是图像超分辨率任务,将图像I缩小k倍,得到缩小后图像I,,为保证输入图像大小与输出相同,将缩小后图像I,再次放大到原图像大小,最终得到同大小低分辨率的图像;
如果是图像补全任务,在图像中随机选出一部分像素点,将其值置为0,其他像素点保持不变,得到需要补全的破坏图像,最终得到受破坏图像集合X;
步骤2-2,划分训练集与验证集,在(X,Y)中随机取出90%的数据作为训练集(Xtrain,Ytrain),另外10%的数据作为验证集(Xval,Yval),Xtrain表示从破坏后的图像集X中随机选出的90%的数据组成的集合,Ytrain表示从无损图像集合Y中随机选出的90%的数据组成的集合,Xval表示破坏后的图像集X中剩下的10%的数据组成的集合,Yval表示无损图像集合Y中剩下的10%的数据组成的集合;
步骤3具体包括如下步骤:
步骤3-1,设神经网络总深度为D层,D为偶数,其中前D/2层使用卷积层,后D/2层使用反卷积层,对于第i层卷积或反卷积层,其可训练参数为权重向量Wi和偏移向量bi,卷积核大小为3x3,步长为1,在每层卷积层和反卷积层之后添加ReLU(Rectified Linear Unit)非线性层,网络输入为步骤2中生成的破坏后的图像,输出为网络恢复后图像;
步骤3-2,每隔两层,在卷积层和反卷积层之间加入对称跨层连接:设COi表示第i层卷积层输出,DIi代表第i层反卷积层输入,Doi代表第i层反卷积层输出,则跨层连接表示为:
DID-i+1=DOD-i+COi
则DID+1为网络输出,CO0为网络输入,第一次跨层连接从输入层开始连接到输出层,网络最终层输入与无损图像集合Y中对应图像计算欧氏距离作为网络的优化目标如下:
其中Xi为训练数据受损图片集Xtrain中第i张图片,Yi为训练数据清晰图片集Ytrain中第i张图片,为神经网络代表的函数,N为训练集图片数量,θ为网络所有可训练参数。
步骤4包括如下步骤:
步骤4-1,利用反向传播算法训练步骤3中所构建的神经网络的参数Wi和bi,其中优化算法采用ADAM算法,学习率设置为1e-4;
步骤4-2,设网络深度为7层,以步骤3-2中方式添加跨层连接,X0为输入,Xi为第i层输出。在前向计算时,给定一张破坏后的图像集X中的图像X0,用函数fi表示第i层神经网络的映射,得到最后一层神经网络输出X7为:
X7=f7(X0,X6);
步骤4-3,X7进一步表示为:
X7=f7(X0,X6)
=f7(X0,f6(X5))
=f7(X0,f6(f5(X1,X4)))
=f7(X0,f6(f5(X1,f4(X3))))
=f7(X0,f6(f5(X1,f4(fk(X2)))))
其中X1和X2分别表示第1个卷积层得到的特征图和第2个卷积层得到的特征图;
步骤4-4,在梯度反向传播时,神经网络中的一层直接从其顶层获得梯度来更新每一层的参数θi,具体包括权重Wi和偏置bi,计算每一层网络对应顶层的偏导数;以该网络第一层为例,为更新第一层参数θ1需要计算损失函数ζ关于θ1的偏导数:
步骤4-5,在得到每一层对应顶层的偏导数之后,使用ADAM算法对应的更新规则更新每一层参数,训练在(Xtrain,Ytrain)上进行,以Ytrain中清晰图片作为网络监督信息,优化步骤3-2中的欧式距离函数,直到使用了所有训练数据训练20轮之后停止。
步骤5包括如下步骤:
使用验证集(Xval,Yval)对步骤4中训练的神经网络进行验证,计算神经网络在验证集上的PSNR值,具体如下:
其中I(i,j)为原图像坐标(i,j)位置的像素值,K(i,j)为恢复图像坐标(i,j)位置像素值,m,n分别为图像高度和宽度,MAXI为最大像素值;对于一般图片MAXI=255,MSE(meansquare error)为像素平均距离,用于计算PSNR;。
根据验证集图像还原结果的PSNR(Peak Signal to Noise Ratio,峰值信噪比)值的变化降低步骤4中学习率,若PSNR值有降低,将学习率在原值基础上乘以0.2,当三次验证集还原PSNR值不变时,判定神经网络收敛,停止训练过程,使用训练好的神经网络作为图像还原网络。
本发明针对图像的修复领域中的深度卷积神经网络方法,本发明具有如下特征:1)本发明在使用深度神经网络进行图像恢复时,加入了跨层连接,使得网络可以更快收敛,同时网络在更深层时保留足够图像细节,使得图像恢复效果更好2)本发明方法不同于以往图像修复方法只针对一类破坏图像类型进行建模,而是可以用同一套算法解决不同的图像修复问题,具有普适性。
有益效果:本发明充分考虑了神经网络的连接方式不易于保留图像细节,在卷积自编码器网络中加入跨层连接,使得底层图像细节更易于在网络中传递,同时易于优化。因此,最终得到的恢复后图像具有清晰的细节,从而提升图像恢复的效果。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述或其他方面的优点将会变得更加清楚。
图1为本发明流程图。
图2为网络结构示意图。
图3a为本发明方法图像去噪效果示意图。
图3b为BM3D方法效果示意图。
图3c为EPLL方法效果示意图。
图4a为本发明方法图像超分辨率效果示意图。
图4b为ARFL+方法效果示意图。
图4c为CSC方法效果示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
如图1所示,本发明公开了一种基于带跨层连接的卷积神经网络的图像修复方法,包含如下步骤:
步骤1,图像预处理,从大量清晰图像数据中,对每张图像做随机采样得到清晰图像集合Y;
步骤2,生成训练集:根据要解决的图像修复任务,对无损图像集合Y中的图像进行破坏,得到破坏后的图像集X,在(X,Y)中随机取出90%作为训练集(Xtrain,Ytrain),另外10%作为验证集(Xval,Yval);
步骤3,构建神经网络:根据输入图像大小构建卷积神经网络,设网络总深度为D层,D为偶数,其中前D/2层为卷积层,后D/2层为反卷积层,卷积核大小为3x3,步长为1。输入为步骤2中生成的破坏后的图像,输出为网络恢复后图像;
步骤4,使用ADAM优化算法,采用步骤2得到的训练集(Xtrain,Ytrain)对所构建神经网络进行训练,以破坏后的图像集X中的图像作为输入,并以无损图像集合Y中对应的无损图像作为网络监督信息,优化图像网络输出和Y中图片的欧式距离;
步骤5,将步骤4得到的训练后网络作为模型,在验证集(Xval,Yval)上测试模型图像还原效果,并调整ADAM优化算法步长继续训练,直到验证集还原效果不变。
步骤1具体包括如下步骤:
对每幅图像I进行局部采样,采用随机采样的方式,得到若干大小相同的区域块。其中区域块数量取决于原始图像数量,和模型大小。对每个区域块进行裁剪,得到裁剪后图像块,将其进行归一化和中心化处理。对于所有图像进行此操作,最终得到无损图像集合Y=[y1,y2,…yn]∈RW*H*c,其中n为所提取的裁剪图像总数,W和H分别为裁剪图像的宽度和高度,C为图像通道数,对于黑白图像C=1,彩色图像C=3。
步骤2具体包括如下步骤:
以集合Y为输入,对Y中图像块根据修复任务不同进行破坏,产生训练数据集合X。对每幅Y中图像块,针对每种任务分别说明:
图像去噪:对图像的每个像素加高斯噪声,设pi表示Y中一幅图像I的第i个像素点,i∈[0,W*H*C),并且设目标噪声等级为ε,i∈[0,W*H*C),并且设目标噪声等级为ε,第i个像素点噪声为ci,则ci服从正态分布:ci~N(0,ε),最终噪声图像的第i个像素点p′i=pi+ci。
图像超分辨率:将图像I缩小k倍,得到缩小后图像I,,为保证输入图像大小与输出相同,将缩小后图像I,再次使用线性插值算法放大,最终得到同大小低分辨率的图像。
图像补全:在图像中随机选出一部分像素点,置0的像素点为随机选取10个相邻的8*8区域,将其值置为0,其他像素点保持不变,得到需要补全的破坏图像。
步骤3具体包括如下步骤:
本步骤描述对模型神经网络的构建过程,设网络总深度为D层,D为偶数,其中前D/2层使用卷积层,后D/2层使用反卷积层,卷积核大小为3x3,步长为1。在每层卷积层和反卷积层之后添加ReLU(Rectified Linear Unit)非线性层。网络输入为步骤2中生成的破坏后的图像,输出为网络恢复后图像;每隔两层,在卷积层和反卷积层之间加入对称跨层连接。具体地,设COi表示第i层卷积层输出,DIi代表第i层反卷积层输入,DOi代表第i层反卷积层输出,则跨层连接可表示为:
DID-i+1=DOD-i+COi
特别的,DID+1为网络输出,CO0为网络输入,即第一次跨层连接从输入层开始连接到输出层。网络最终层输入与原图像数据集Y中对应图像计算欧氏距离作为损失函数。网络结构如图2所示。
步骤4具体包括如下步骤:
本步骤使用数据,利用反向传播算法训练步骤3中所构建网络的参数,其中优化算法采用ADAM算法,学习率设置为1e-4。设网络为如图2所示结构,以步骤3中描述方式添加跨层连接,X0为输入,Xi为第i层输出。在前向计算时,给定一张破坏后的图像集X中的图像X0,用函数fi表示第i层神经网络的映射,,得到最后一层神经网络输出X7为:
X7=f7(X0,X6)
X7可以进一步表示为:
X7=f7(X0,X6)
=f7(-X0,f6(X5))
=f7(X0,f6(f5(X1,X4)))
=f7(X0,f6(f5(X1,f4(X3))))
=f7(X0,f6(f5(X1,f4(fk(X2)))))
其中X1和X2表示第1、2个卷积层得到的特征图。
在梯度反向传播时,网络中的一层直接从其顶层获得梯度来更新每一层的参数θi,具体包括权重Wi和偏置bi,以该网络第一层为例,为更新第一层参数θ1需要计算损失函数ζ关于θ1的偏导数:
在得到每一层对应顶层的偏导数之后,使用ADAM算法对应的更新规则更新每一层参数,训练在(Xtrain,Ytrain)上进行,以Ytrain中清晰图片作为网络监督信息,直到使用了所有训练数据训练20轮之后停止。
步骤5具体包括如下步骤:
本步骤使用验证集(Xval,Yval)对步骤4中训练的神经网络进行验证,根据验证集图像还原结果的PSNR(Peak Signal to Noise Ratio,峰值信噪比)值的变化降低步骤4中学习率,若PSNR值有降低,将学习率在原值基础上乘以0.2,当三次验证集还原PSNR值不变时,判定神经网络收敛,停止训练过程,使用训练好的神经网络作为图像还原网络。
实施例1
本实施例描述图像去噪,包括以下部分:
1、首先在BSD自然图像数据集上,随机截取50*50的图像块共500,000张,在图像上附加均值为0,标准差分别为σ的高斯噪声(σ取10、30、50、70分别进行四次实验)。对于加噪声后的图像和不加噪声的图像分别进行归一化。由此得到大小为50万的数据集,其中使用45万图像块为训练集,5万为验证集。
2、构建30层的带跨层连接的卷积神经网络,使用ADAM算法在构建的数据集上进行训练,学习率统一设置为1e-4,每训练一轮使用验证集验证参数预训练效果,最终得到收敛后的网络。
3、在BSD200测试集原图像上进行测试,测试结果PSNR值如下表1所示:
表1
RED10、RED20和RED30分别为本方法采用10层、20层和30层网络结果,左边6列为对照方法结果,可以看到本方法在图像去噪任务中比原有方法可以得到更高PSNR结果,即更清晰的图像还原效果,且随着网络深度的增加,本方法的去噪效果随之增加。图3a~图3c展示图像去噪效果示例,图3a为本方法效果,图3b和图3c分别为BM3D和EPLL方法效果,可以看到本方法还原图像相比其他方法有更高的图像细节。
实施例2
本实施例描述图像超分辨率,包括以下部分:
1、首先在BSD自然图像数据集上,随机截取50*50的图像块共500,000张,对于每张图像块,使用线性插值算法进行s倍缩小(s取2、3和4进行三次实验),在缩小后的图像基础上,在进行s倍放大得到与原图像大小相同,但清晰度低的低分辨率图像。将低分辨率图像和原图像组合,得到大小为50万的数据集,其中使用45万图像块为训练集,5万为验证集。
2、构建20层的带跨层连接的卷积神经网络,使用ADAM算法在构建的数据集上进行训练,学习率统一设置为1e-4,每训练一轮使用验证集验证参数预训练效果,最终得到收敛后的网络。
3、在BSD200测试集原图像上进行测试,并报告测试结果PSNR如下表2:
表2
RED10、RED20和RED30分别为本方法采用10层、20层和30层网络结果,左边6列为对照方法结果,可以看到本方法在图像超分辨率任务中比传统方法可以得到更高PSNR结果,即更清晰的图像还原效果,且随着网络深度的增加,本方法的超分辨率效果随之增加。图4a~图4c展示了图像超分辨率效果示例,图4a为本方法效果,图4b和图4c分别为ARFL+和CSC方法效果,可以看到本方法还原图像相比其他方法有更好的图像细节。
本发明提供了一种基于带对称跨层连接的卷积神经网络的图像修复方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (6)
1.一种基于带对称跨层连接的卷积神经网络的图像修复方法,其特征在于,包括如下步骤:
步骤1,图像预处理,采集无损图像数据,对每张图像做随机采样得到无损图像集合Y;
步骤2,生成训练集和验证集:根据要解决的图像修复任务,对无损图像集合Y中的图像进行破坏,得到破坏后的图像集X,在(X,Y)中随机取出90%的数据作为训练集(Xtrain,Ytrain),另外10%的数据作为验证集(Xval,Yval);
步骤3,构建神经网络:根据输入图像大小构建卷积神经网络,设网络总深度为D层,D为偶数,其中前D/2层为卷积层,后D/2层为反卷积层,卷积核大小为3x3,步长为1,输出为网络恢复后图像;
步骤4,训练神经网络:使用ADAM优化算法,采用步骤2得到的训练集(Xtrain,Ytrain)对所构建神经网络进行训练,以破坏后的图像集X中的图像作为输入,并以无损图像集合Y中对应的无损图像作为网络监督信息,优化图像网络输出和Y中图片的欧式距离;
步骤5,将步骤4得到的训练后网络作为模型,在验证集(Xval,Yval)上测试模型图像还原效果,并调整ADAM优化算法步长继续训练,直到验证集还原效果不变。
2.根据权利要求1所述的方法,其特征在于,步骤1包括如下步骤:
步骤1-1,采集无损图像数据,对每幅图像进行局部裁剪,采用随机采样的方式,得到大小相同的裁剪后图像,裁剪后图像块大小为50*50;
步骤1-2,对每个裁剪后图像块,将其进行归一化和中心化处理;首先计算裁剪后图像数据集合上每个像素的均值和标准差,设这些图像均值图像为标准差为std,对于一张特定图像x,对其进行归一化和中心化如下:
x′为图像x处理后的图像;
步骤1-3,对于所有图像进行步骤1-2的操作,最终得到无损图像集合Y=[y_1,y_2,…y_n]∈R^(W*H*C),其中R为实数集,n为所提取的裁剪图像总数,y_n表示无损图像集合Y中第n副图像,W和H分别为裁剪图像的宽度和高度,C为图像通道数,对于黑白图像C=1,彩色图像C=3。
3.根据权利要求2所述的方法,其特征在于,步骤2包括:
步骤2-1,对无损图像集合Y中的图像根据修复任务不同进行破坏:
如果是图像去噪任务,对图像的每个像素加高斯噪声,设pi表示图像集Y中一幅图像I的第i个像素点,i∈[0,W*H*C),并且设目标噪声等级为ε,第i个像素点噪声为ci,则ci服从正态分布:ci~N(0,ε),N表示正态分布,最终噪声图像的第i个像素点p′i=pi+i;
如果是图像超分辨率任务,将图像I缩小k倍,得到缩小后图像I’,为保证输入图像大小与输出相同,将缩小后图像I’再次放大到原图像大小,最终得到同大小低分辨率的图像;
如果是图像补全任务,在图像中随机选出一部分像素点,将其值置为0,其他像素点保持不变,得到需要补全的破坏图像,最终得到受破坏图像集合X;
步骤2-2,划分训练集与验证集,在(X,Y)中随机取出90%的数据作为训练集(Xtrain,Ytrain),另外10%的数据作为验证集(Xval,Yval),Xtrain表示从破坏后的图像集X中随机选出的90%的数据组成的集合,Ytrain表示从无损图像集合Y中随机选出的90%的数据组成的集合,Xval表示破坏后的图像集X中剩下的10%的数据组成的集合,Yval表示无损图像集合Y中剩下的10%的数据组成的集合。
4.根据权利要求3所述的方法,其特征在于,步骤3包括如下步骤:
步骤3-1,设神经网络总深度为D层,D为偶数,其中前D/2层使用卷积层,后D/2层使用反卷积层,对于第i层卷积或反卷积层,其可训练参数为权重向量Wi和偏移向量bi,卷积核大小为3x3,步长为1,在每层卷积层和反卷积层之后添加ReLU非线性层,网络输入为步骤2中生成的破坏后的图像,输出为网络恢复后图像;
步骤3-2,每隔两层,在卷积层和反卷积层之间加入对称跨层连接:设COi表示第i层卷积层输出,DIi代表第i层反卷积层输入,DOi代表第i层反卷积层输出,则跨层连接表示为:
DID-i+1=DOD-i+COi
则DID+1为网络输出,CO0为网络输入,第一次跨层连接从输入层开始连接到输出层,网络最终层输入与无损图像集合Y中对应图像计算欧氏距离作为网络的优化目标如下:
其中Xi为训练数据受损图片集Xtrain中第i张图片,Yi为训练数据清晰图片集Ytrain中第i张图片,为神经网络代表的函数,N为训练集图片数量,θ为网络所有可训练参数。
5.根据权利要求4所述的方法,其特征在于,步骤4包括如下步骤:
步骤4-1,利用反向传播训练步骤3中所构建的神经网络的参数Wi和bi,其中优化算法采用ADAM算法,学习率设置为1e-4;
步骤4-2,设网络深度为7层,以步骤3-2中方式添加跨层连接,X0为输入,Xi为第i层输出,在前向计算时,给定一张破坏后的图像集X中的图像X0,用函数fi表示第i层神经网络的映射,得到最后一层神经网络输出X7为:
X7=f7(X0,X6);
步骤4-3,X7进一步表示为:
X7=f7(X0,X6)
=f7(X0,f6(X5))
=f7(X0,f6(f5(X1,X4)))
=f7(X0,f6(f5(X1,f4(X3))))
=f7(X0,f6(f5(X1,f4(fk(X2)))))
其中X1和X2分别表示第1个卷积层得到的特征图和第2个卷积层得到的特征图;
步骤4-4,在梯度反向传播时,神经网络中的一层直接从其顶层获得梯度来更新每一层的参数θi,具体包括权重Wi和偏置bi,计算每一层网络对应顶层的偏导数;
步骤4-5,在得到每一层对应顶层的偏导数之后,使用ADAM算法对应的更新规则更新每一层参数,训练在(Xtrain,Ytrain)上进行,以Ytrain中清晰图片作为网络监督信息,优化步骤3-2中的欧式距离函数,直到使用了所有训练数据训练20轮之后停止。
6.根据权利要求5所述方法,其特征在于,步骤5包括如下步骤:
使用验证集(Xval,Yval)对步骤4中训练的神经网络进行验证,计算神经网络在验证集上的PSNR值,具体如下:
其中I(i,j)为原图像坐标(i,j)位置的像素值,K(i,j)为恢复图像坐标(i,j)位置像素值,m,n分别为图像高度和宽度,MAXI为最大像素值,MSE为像素平均距离,用于计算PSNR;
根据验证集图像还原结果的PSNR值的变化降低步骤4中学习率,若PSNR值有变化,将学习率在原值基础上乘以0.2,当三次验证集还原PSNR值不变时,判定神经网络收敛,停止训练过程,使用训练好的神经网络作为图像还原网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810239695.7A CN108537747A (zh) | 2018-03-22 | 2018-03-22 | 一种基于带对称跨层连接的卷积神经网络的图像修复方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810239695.7A CN108537747A (zh) | 2018-03-22 | 2018-03-22 | 一种基于带对称跨层连接的卷积神经网络的图像修复方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108537747A true CN108537747A (zh) | 2018-09-14 |
Family
ID=63484105
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810239695.7A Pending CN108537747A (zh) | 2018-03-22 | 2018-03-22 | 一种基于带对称跨层连接的卷积神经网络的图像修复方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108537747A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766848A (zh) * | 2019-01-15 | 2019-05-17 | 四川大学 | 一种基于监控视频的行人视力状况调查分析方法 |
CN110390646A (zh) * | 2019-06-12 | 2019-10-29 | 西南科技大学 | 一种细节保持图像去噪方法 |
CN111127366A (zh) * | 2019-12-26 | 2020-05-08 | 山东浪潮人工智能研究院有限公司 | 一种人像图片还原方法、装置以及设备 |
CN111597846A (zh) * | 2019-02-20 | 2020-08-28 | 中科院微电子研究所昆山分所 | 一种褶皱二维码恢复方法、装置、设备及可读存储介质 |
CN111654621A (zh) * | 2020-05-26 | 2020-09-11 | 浙江大学 | 一种基于卷积神经网络模型的双焦相机连续数字变焦方法 |
CN112396136A (zh) * | 2019-08-15 | 2021-02-23 | 北京神州泰岳软件股份有限公司 | 一种手写数字识别方法、装置、电子设备和可读存储介质 |
CN112836718A (zh) * | 2020-12-08 | 2021-05-25 | 上海大学 | 一种基于模糊知识神经网络的图像情感识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204449A (zh) * | 2016-07-06 | 2016-12-07 | 安徽工业大学 | 一种基于对称深度网络的单幅图像超分辨率重建方法 |
CN107358576A (zh) * | 2017-06-24 | 2017-11-17 | 天津大学 | 基于卷积神经网络的深度图超分辨率重建方法 |
CN107784308A (zh) * | 2017-10-09 | 2018-03-09 | 哈尔滨工业大学 | 基于链式多尺度全卷积网络的显著性目标检测方法 |
US20180075581A1 (en) * | 2016-09-15 | 2018-03-15 | Twitter, Inc. | Super resolution using a generative adversarial network |
-
2018
- 2018-03-22 CN CN201810239695.7A patent/CN108537747A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204449A (zh) * | 2016-07-06 | 2016-12-07 | 安徽工业大学 | 一种基于对称深度网络的单幅图像超分辨率重建方法 |
US20180075581A1 (en) * | 2016-09-15 | 2018-03-15 | Twitter, Inc. | Super resolution using a generative adversarial network |
CN107358576A (zh) * | 2017-06-24 | 2017-11-17 | 天津大学 | 基于卷积神经网络的深度图超分辨率重建方法 |
CN107784308A (zh) * | 2017-10-09 | 2018-03-09 | 哈尔滨工业大学 | 基于链式多尺度全卷积网络的显著性目标检测方法 |
Non-Patent Citations (2)
Title |
---|
JIANRUI CAI等: "Learning a Deep Single Image Contrast Enhancer from Multi-Exposure Images", 《 IEEE TRANSACTIONS ON IMAGE PROCESSING》 * |
XIAO-JIAO MAO等: "Image Restoration Using Very Deep Convolutional Encoder-Decoder Networks with Symmetric Skip Connections", 《ADVANCES IN NEURAL INFORMATION PROCESSING SYSTEMS》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766848A (zh) * | 2019-01-15 | 2019-05-17 | 四川大学 | 一种基于监控视频的行人视力状况调查分析方法 |
CN109766848B (zh) * | 2019-01-15 | 2022-05-03 | 四川大学 | 一种基于监控视频的行人视力状况调查分析方法 |
CN111597846A (zh) * | 2019-02-20 | 2020-08-28 | 中科院微电子研究所昆山分所 | 一种褶皱二维码恢复方法、装置、设备及可读存储介质 |
CN110390646A (zh) * | 2019-06-12 | 2019-10-29 | 西南科技大学 | 一种细节保持图像去噪方法 |
CN110390646B (zh) * | 2019-06-12 | 2023-10-17 | 西南科技大学 | 一种细节保持图像去噪方法 |
CN112396136A (zh) * | 2019-08-15 | 2021-02-23 | 北京神州泰岳软件股份有限公司 | 一种手写数字识别方法、装置、电子设备和可读存储介质 |
CN111127366A (zh) * | 2019-12-26 | 2020-05-08 | 山东浪潮人工智能研究院有限公司 | 一种人像图片还原方法、装置以及设备 |
CN111654621A (zh) * | 2020-05-26 | 2020-09-11 | 浙江大学 | 一种基于卷积神经网络模型的双焦相机连续数字变焦方法 |
CN111654621B (zh) * | 2020-05-26 | 2021-04-16 | 浙江大学 | 一种基于卷积神经网络模型的双焦相机连续数字变焦方法 |
CN112836718A (zh) * | 2020-12-08 | 2021-05-25 | 上海大学 | 一种基于模糊知识神经网络的图像情感识别方法 |
CN112836718B (zh) * | 2020-12-08 | 2022-12-23 | 上海大学 | 一种基于模糊知识神经网络的图像情感识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108537747A (zh) | 一种基于带对称跨层连接的卷积神经网络的图像修复方法 | |
CN108510485B (zh) | 一种基于卷积神经网络的无参照图像质量评估方法 | |
WO2023092813A1 (zh) | 一种基于通道注意力的Swin-Transformer图像去噪方法及系统 | |
CN107862668A (zh) | 一种基于gnn的文物图像复原方法 | |
CN108986050A (zh) | 一种基于多分支卷积神经网络的图像和视频增强方法 | |
CN113344806A (zh) | 一种基于全局特征融合注意力网络的图像去雾方法与系统 | |
CN107123089A (zh) | 基于深度卷积网络的遥感图像超分辨重建方法及系统 | |
CN102243711B (zh) | 一种基于邻域嵌套的图像超分辨率重建方法 | |
CN111402145B (zh) | 一种基于深度学习的自监督低照度图像增强方法 | |
CN104217404A (zh) | 雾霾天视频图像清晰化处理方法及其装置 | |
CN110349087B (zh) | 基于适应性卷积的rgb-d图像高质量网格生成方法 | |
CN108564166A (zh) | 基于带对称跨层连接的卷积神经网络半监督特征学习方法 | |
CN109886159B (zh) | 一种非限定条件下的人脸检测方法 | |
CN110569875A (zh) | 一种基于特征复用的深度神经网络目标检测方法 | |
CN111179196B (zh) | 一种基于分而治之的多分辨率深度网络图像去高光方法 | |
CN111768326B (zh) | 一种基于gan扩增图像前景物体的高容量数据保护方法 | |
CN117372881B (zh) | 一种烟叶病虫害智能识别方法、介质及系统 | |
CN113298024A (zh) | 一种基于轻量化神经网络的无人机对地小目标识别方法 | |
CN110097522A (zh) | 一种基于多尺度卷积神经网络的单幅户外图像去雾方法 | |
CN110097110A (zh) | 一种基于目标优化的语义图像修复方法 | |
CN112164010A (zh) | 一种多尺度融合卷积神经网络图像去雾方法 | |
CN107749048A (zh) | 图像矫正系统及方法、色盲图像矫正系统及方法 | |
CN111192206A (zh) | 一种提高图像清晰度的方法 | |
CN108764287A (zh) | 基于深度学习和分组卷积的目标检测方法及系统 | |
Tang et al. | Reinforcement learning of non-additive joint steganographic embedding costs with attention mechanism |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180914 |