CN109978792A - 一种生成图像增强模型的方法 - Google Patents
一种生成图像增强模型的方法 Download PDFInfo
- Publication number
- CN109978792A CN109978792A CN201910246026.7A CN201910246026A CN109978792A CN 109978792 A CN109978792 A CN 109978792A CN 201910246026 A CN201910246026 A CN 201910246026A CN 109978792 A CN109978792 A CN 109978792A
- Authority
- CN
- China
- Prior art keywords
- picture
- generator
- value
- penalty values
- original image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 230000000694 effects Effects 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims description 32
- 230000006870 function Effects 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 235000013399 edible fruits Nutrition 0.000 claims description 2
- 238000003786 synthesis reaction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 16
- 230000004913 activation Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 7
- 230000003014 reinforcing effect Effects 0.000 description 7
- 230000004069 differentiation Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20088—Trinocular vision calculations; trifocal tensor
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种生成图像增强模型的方法,包括:获取原始图片和对原始图片进行处理后的目标图片;将原始图片和目标图片分别输入第一生成对抗网络和第二生成对抗网络进行处理,以对应输出第一图片和第一判别值以及第二图片和第二判别值:将第一图片输入第二生成器,得到第一生成图片,并将第二图片输入第一生成器,得到第二生成图片;确定第一损失值,并根据第一损失值调整第一生成器和第二生成器的网络参数;确定第二损失值,并根据第二损失值调整第一判别器和第二判别器的网络参数;直到第一损失值和第二损失值满足预定条件时,将对应的第一生成器和/或第二生成器作为生成的图像增强模型。该方案能够进一步提升图像增强效果。
Description
技术领域
本发明涉及深度学习技术领域,尤其涉及一种生成图像增强模型的方法、图像增强方法、计算设备及存储介质。
背景技术
在对图像的处理和应用过程中,包括图像采集、压缩、编码、存储、通信、显示等各个环节都可能导致图像质量变差。虽然手机的分辨率、拍摄性能有了极大的改善,但是由于拍摄场景等问题可能会导致图片质量较差。因此,仍然需要对图像将进一步的处理。例如,使用图像增强技术来改善图片的视觉效果,可以有目的地强调图像的整体或局部特征,将原来不清晰的图像变得清晰,扩大图像中不同物体特征之间的差别,改善图像质量。
图像增强一般是调整图像的明暗、饱和度和对比度。目前大部分图像增强算法是用固定的参数值调整各个通道的像素值,这种方法效果单一,容易出现效果不自然、色块等问题。基于卷积神经网络的图像增强算法虽然在某些方面优于传统算法,但是总体调色效果较为保守,对用户没有足够的吸引力。
因此,需要一种图像增强方法,能够进一步强化图像增强效果。
发明内容
为此,本发明提供了一种生成图像增强模型的方法以及图像增强方法,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明的一个方面,提供了一种生成图像增强模型的方法,该方法适于在计算设备中执行,包括:首先,获取原始图片和对原始图片进行处理后的目标图片。然后,将原始图片和目标图片分别输入第一生成对抗网络和第二生成对抗网络进行处理,以对应输出第一图片和第一判别值以及第二图片和第二判别值,其中,所述第一生成对抗网络包括第一生成器和第一判别器,所述第二生成对抗网络包括第二生成器和第二判别器。随后,将第一图片输入第二生成器,得到第一生成图片,并将第二图片输入第一生成器,得到第二生成图片。然后,确定第一图片与目标图片之间、第一生成图片与原始图片之间、第二图片与原始图片之间、第二生成图片与目标图片之间、第一判别值与预设正标签值之间、第二判别值与预设正标签值之间的第一损失值,并根据第一损失值调整第一生成器和第二生成器的网络参数;以及确定第一判别值与预设负标签值之间、第二判别值与预设负标签值之间的第二损失值,并根据第二损失值调整第一判别器和第二判别器的网络参数。最后,重复确定第一损失值和第二损失值并调整网络参数的步骤,直到第一损失值和第二损失值满足预定条件时,将对应的第一生成器和/或第二生成器作为生成的图像增强模型。
可选地,在上述方法中,预定条件包括:第一损失值和第二损失值不再减少或者前后两次迭代计算的差值小于预定阈值。
可选地,在上述方法中,第一生成器/第二生成器为编码器-解码器网络结构,包括多个卷积处理层、反卷积处理层和跳转连接层。
可选地,在上述方法中,还可以对获取的原始图片和目标图片分别进行预处理。
可选地,在上述方法中,分别取出预定数量的原始图片和与其对应的目标图片,并从所取出的原始图片和与其对应的目标图片中的相同位置处截取出预定尺寸的图像。
可选地,在上述方法中,对原始图片的处理可以包括调整图像亮度、饱和度和对比度。
可选地,在上述方法中,利用第一损失函数,分别计算第一图片与目标图片之间、第一生成图片与原始图片之间、第二图片与原始图片之间、第二生成图片与目标图片之间的损失值;利用第二损失函数,分别计算第一判别值与预设正标签值之间、第二判别值与预设正标签值之间的损失值;综合所计算得的损失值,确定出第一损失值。
可选地,在上述方法中,利用第二损失函数,分别计算第一判别值与预设负标签值之间、第二判别值与预设负标签值之间损失值;综合所算得的损失值,确定出第二损失值。
可选地,在上述方法中,预设正标签值和预设负标签值之和为1。
根据本发明另一个方面,提供了一种图像增强方法,该方法适于在计算s设备中执行,包括将待处理图片输入经过上述方法训练后的第一生成器或第二生成器中进行处理,以得到图像增强效果图。
根据本发明的又一方面,提供了一种计算设备,包括:一个或多个处理器;和存储器;一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行如上所述方法的指令。
根据本发明的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令当计算设备执行时,使得计算设备执行如上所述的方法。
根据本发明方案,通过将循环对抗网络的学习方式应用到图像增强中,来训练生成图像增强模型。利用生成的图像增强模型,能够较好地逼近目标图,达到预期的图像增强效果。并且生成网络可以根据不同场景给予合适的增强效果,从而提升图像增强效果。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明的一个实施例的计算设备100的构造示意图;
图2示出了根据本发明的一个实施例的生成图像增强模型的方法200的示意性流程图;
图3示出了根据本发明的一个实施例的原始图片和对原始图片处理后的目标图片的示意图;
图4示出了根据本发明的一个实施例的图像增强模型的结构示意图;
图5示出了根据本发明的一个实施例的图像增强效果示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。在一些实施例中,计算设备100被配置为执行生成图像增强模型的方法200以及图像增强方法,程序数据124中就包含了用于执行方法200的指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、图像输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中以编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。在一些实施例中,计算机可读介质中存储一个或多个程序,这一个或多个程序中包括执行某些方法的指令。
计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、数码照相机、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。当然,计算设备100也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机,或者是具有上述配置的服务器。本发明的实施方式对此均不作限制。
图像增强是一种提升图像视觉效果的方法,可以是有目的地强调图像的整体或局部特性。例如,将原来不清晰的图像变得清晰或者强调某些感兴趣的特征,使之改善图像质量、加强图像的识别效果。传统的图像增强方法包括灰度线性变换法、直方图均衡变换法、线性滤波等。为了使图像增强的效果能够根据不同场景进行调整,更好地达到预期效果,本方案首先提供一种基于循环生成对抗网络生成图像增强模型的方法,然后利用生成的图像增强模型对图像进行图像增强处理。
图2示出了根据本发明的一个实施例的生成图像增强模型的方法200的示意性流程图。其中图像增强模型为生成对抗网络中的生成器。本方案使用两个互为镜像对称的生成对抗网络,即循环对抗网络进行模型的训练,两个生成对抗网络构成一个环形网络,包括两个生成网络(即,生成器)和两个判别网络(即,判别器)。
生成器适于生成增强效果图,根据本发明的实施例,生成器可以使用编码器-解码器网络结构,包括卷积处理层、反卷积处理层和跳转连接层。卷积处理层用于从输入图片中提取特征向量,反卷积处理层从特征向量中还原出低级特征,跳转连接层通过组合图像的不同特征,将特征在通道维度上拼接在一起,可以实现多尺度特征融合。
在构建出生成器的结构后,还有一些参数需要预先设置,例如,每一个卷积处理层所采用的卷积核(kernel)的数量和尺寸、卷积核的移动步长、四周填充边的数量等。表1示出了根据本发明一个实施例的生成器的部分网络参数示例,如表1所示,根据本发明实施例的生成器包含多个卷积处理层、反卷积处理层和跳转连接层。并且,在每一个卷积处理层和反卷积处理层中,除卷积处理外,还包括激活处理,激活处理时仅需确定选用哪种激活函数,故在每个卷积处理层和反卷积处理层中,标注出了其中的激活处理所采用的激活函数(如ReLU,但不限于此)。
表1
在表1中,EM代表了生成器(Enhance Model),其中,EM_Con1_ReLU表示第一个卷积处理层,包含卷积处理(Con1)和激活处理(ReLU),其中的卷积参数包括:卷积核尺寸(kernel)、输入图像数量,输出特征图数量,填充值,步长。EM_DeCon1_ReLU表示第一个反卷积处理层,包含反卷积处理(DeCon1)和激活处理(ReLU),其中的参数包括:卷积核尺寸(kernel)、输入图像数量,输出特征图数量,填充值,步长。EM_Skip1_Con4_DeCon1为第一个跳转连接层,表示将Con4层的输出(激活后的输出)和DeCon1层的输出(激活后的输出)进行通道合并操作。应当了解,上表中各参数值仅仅是示例性的。依据上述描述,本领域技术人员即可类推出生成器中其他处理层的参数。篇幅所限,此处不再对表1中的参数进行一一解释。
判别器适于判断生成器生成的增强效果图是否达到了预期增强效果,即预测输入图像为原始图像还是生成器生成的图像。一般地,若生成器生成的增强效果图没有达到要求,判别器则会向生成器反向传播一个损失值,用该损失值监督生成器的训练,从而让生成器生成更好的结果。
在构建出判别器的结构后,需要预先设置某些参数,例如,每一个卷积处理层所采用的卷积核(kernel)的数量和尺寸、卷积核的移动步长、四周填充边的数量等。表2示出了根据本发明一个实施例的判别器的部分网络参数示例,如表2所示,根据本发明实施例的判别器包含缩放层、多个卷积处理层、全连接层。在每一个卷积处理层中,包括卷积、激活处理,激活处理时仅需确定选用哪种激活函数,故标注出了其中的激活处理所采用的激活函数(如ReLU,但不限于此)。
表2
判别器可以对输入的图片进行判别,确定是来自数据集的图片还是由生成器生成的图片,每完成一次判断,将结果误差反传给生成器。根据本发明的一个实施例,可以首先对输入网络的图片进行裁切,得到尺寸一致的训练图片。例如可以对获取的图片进行随机剪裁处理,一方面可以使训练图片得到数据增强,一方面可以便于网络的训练。如上表2所示,DM代表了生成器(Discr iminate Model),其中,缩放层可以将生成器输出的图片进行缩放处理,使输入判别器的图片具有相同的尺寸(如512*512)。DM_Con1_ReLU表示判别器的第一个卷积处理层,包含卷积处理(Con1)和激活处理(ReLU),其中的卷积参数包括:卷积核尺寸(kernel)、输入图像数量,输出特征图数量,填充值,步长。DM_FC_Softmax表示全连接层,其中的参数包括:输入特征图数量,输出数据数量。应当了解,上表中各参数值仅仅是示例性的。依据上述描述,本领域技术人员即可类推出生成器中其他处理层的参数。篇幅所限,此处不再对表2中的参数进行一一解释。
以下详细阐述本发明方案,如图2所示,方法200始于步骤S210,获取原始图片和对原始图片进行处理后的目标图片。
其中,原始图片即未经任何处理的图片。由于单反相机拍出的照片噪点少、细节信息丰富,可以使用单反相机或其他专业相机拍摄大量的各个场景下的高质量的图片,也可以直接从网络上下载大量各种场景下的高质量图片。目标图片即想要得到的图片。为了得到更高质量的目标图片,可以对获取的原始图片进行图像增强处理。例如,可以使用传统的图像增强方法如灰度变换法、直方图修正法、高通或低通滤波法、彩色增强方法等,对获取的原始图片去除噪声、提高图像清晰度,使处理后的图片具有较好的明暗、饱和度和对比度。也可以突出图像中感兴趣的部分,使图像中的物体轮廓清晰、细节明显等。可以依据应用场景和需求,对原始图片进行处理后,得到所期望效果的目标图片,此处不再一一列举。
图3示出了根据本发明的一个实施例的原始图片和对原始图片进行处理后的目标图片的示意图。如图3所示,目标图片相对于原始图片具有更好的亮度和对比度。
需要说明的是,目标图片并不局限于图像增强处理,原始图片和目标图片可以是任意类型的两种图片。例如,原始图片为黑白图片目标图片为油画风格图片、原始图片为男性目标图片为女性,原始图片为猫目标图片为狗等等。可以看作两个样本空间,目的是将一个空间中的样本转换为另一个空间中的样本。
为了提高模型的精度和稳定性,可以对获取的原始图片和目标图片进行预处理。预处理可以包括数据增强、归一化处理等,根据本发明的一个实施例,可以从获取的图片中随机取出预定数量的原始图片和目标图片并进行随机剪裁处理。对于大型的训练数据库,一次性把所有的数据输入网络,会引起内存的爆炸。可以从获取的图片中随机取出batchsize张训练图片,batchsize即一次训练所需的样本数,可以设置。通过并行化提高内存的利用率,可以使得模型训练更加准确。为了对训练图片进行数据扩充,提高模型的精度和稳定性,可以对取出的图片进行随机剪裁。例如,对取出的每张图随机剪裁出512*512大小的图像块,对于原始图片及其对应的目标图片进行裁剪的位置是一致的。
随后在步骤S220中,将原始图片和目标图片分别输入第一生成对抗网络和第二生成对抗网络进行处理,以对应输出第一图片和第一判别值以及第二图片和第二判别值,其中,第一生成对抗网络包括第一生成器和第一判别器,第二生成对抗网络包括第二生成器和第二判别器。
第一生成对抗网络和第二生成对抗网络构成循环生成对抗网络。即第一生成对抗网络可以将原始域的图片转换为目标域的风格,而第二生成对抗网络可以将目标域的图片转换为原始域的风格。可以首先初始化两个生成器和两个判别器的网络参数,例如可以将权重初始化为0,或者进行随机初始化,或者基于预训练的网络初始化生成器的权重等,本方案对此不做限定。然后从训练数据集中出一次批量化处理所需的原始图片和目标图片分别输入初始化后的第一生成对抗网络和第二生成对抗网络。
随后在步骤S230中,将第一图片输入第二生成器,得到第一生成图片,并将第二图片输入第一生成器,得到第二生成图片。
图4示出了根据本发明的一个实施例的图像增强模型的结构示意图。如图4所示,生成器有两个G和F,即从和从同理判别器也有两个Dx和Dy,由此构成一个循环。同时定义其相应的损失函数,包括前向循环一致损失:x→G(x)→F(G(x))≈x和后向循环一致损失y→F(y)→G(F(y))≈y。
一方面,将一次批量化训练所需的原始图片x输入第一生成器中可以得到第一图片,随后将第一图片输入第一判别器中,得到第一图片的第一判别值,并将第一图片输入第二生成器,得到第一生成图片。
另一方面,将一次批量化训练所需的目标图片输入第二生成器,得到第二图片;接着将第二图片输入第二判别器中,得到第二图片的第二判别值,并将第二图片输入第一生成器,得到第二生成图片。
接着在步骤S240中,确定第一图片与目标图片之间、第一生成图片与原始图片之间、第二图片与原始图片之间、第二生成图片与目标图片之间、第一判别值与预设正标签值之间、第二判别值与预设正标签值之间的第一损失值,并根据第一损失值调整第一生成器和第二生成器的网络参数。
其中,第一图片与目标图片之间、第一生成图片与原始图片之间、第二图片与原始图片之间、第二生成图片与目标图片之间的损失函数为L1绝对值误差损失函数,可以称为重建损失函数。
此外,判别器损失函数的损失值一方面可以反向更新第一生成器和第二生成器的参数,另一方面可以反向更新第一判别器和第二判别器的参数。根据本发明的一个实施例,可以基于第一判别值与预设正标签值之间、第二判别值与预设正标签值之间的判别损失函数的损失值,结合上述重建损失函数的损失值,调整更新第一生成器和第二生成器的参数。
可以利用第一损失函数计算第一图片与目标图片之间的损失值:
同理,利用第一损失函数计算第一生成图片与原始图片之间的损失值:
利用第一损失函数计算第二图片与原始图片之间的损失值:
利用第一损失函数计算第二图片与原始图片之间的损失值:
其中,output1i、output2i、output3i、output4i分别表示第一图片、第一生成图片、第二图片和第二生成图片中的第i个像素点的像素值,inputi表示原始图片第i个像素点的像素值,targeti表示目标图片第i个像素点的像素值,W和H分别表示图片的宽度和高度,N为像素点的个数。
判别损失函数可以使用二元交叉熵损失函数,可以利用第二损失函数计算第一判别值与预设正标签值、第二判别值与预设正标签值之间的损失值:
t1*log(S)+(1-t1)*log(1-S)
式中,t1表示预设正标签值,S表示第一判别值/第二判别值。
在步骤S250中,确定第一判别值与预设负标签值之间、第二判别值与预设负标签值之间的第二损失值,并根据第二损失值调整第一判别器和第二判别器的网络参数。
可以利用第二损失函数计算第一判别值与预设负标签值、第二判别值与预设负标签值之间的损失值:
t2*log(S)+(1-t2)*log(1-S)
式中,t2表示预设正标签值,S表示第一判别值/第二判别值。预设正标签值和预设负标签值的和为1,标签值越接近1为正标签,标签值越接近0为负标签。
最后在步骤S260中,重复确定第一损失值和第二损失值并调整网络参数的步骤,直到第一损失值和第二损失值满足预定条件时,将对应的第一生成器和/或第二生成器作为生成的图像增强模型。
可以不断从训练数据集中随机取出batchsize张原始图片和对应的目标图片输入模型,使用反向传播算法进行训练,直到步骤S240和步骤S250中计算得到的第一损失值和第二损失值都不再减小,或者前后两次迭代计算的损失值相差很小,整个模型训练完成。
最后就可以将待处理的图片输入训练后的图像增强模型中的第一生成器或第二生成器中,输出结果就是图像增强效果图。图5示出了根据本发明的一个实施例的图像增强效果示意图。如图5所示,左图为未经处理的输入图片,右图为经本方案训练的图像增强模型处理后的图像增强效果图。可以看出模型输出的图片相比于输入图片具有更好的亮度、对比度和清晰度。
根据本发明的方案,通过将循环对抗网络的学习方式应用到图像增强中,能够较好地逼近目标图,达到预期的图像增强效果。并且生成网络可以根据不同场景给与合适的增强效果。其中一个生成网络用生成的结果去骗其中一个判别网络它就是理想的效果,另一个生成网络用生成的结果去骗另一个判别网络它就是真实的输入。两个网络循环对抗学习,保证了网络输出较好地逼近目标图,从而提升图像增强效果。
A3、如A2所述方法,其中,所述对获取的原始图片和目标图片分别进行预处理的步骤包括:
分别取出预定数量的原始图片和与其对应的目标图片,并从所取出的原始图片和与其对应的目标图片中的相同位置处截取出预定尺寸的图像。
A4、如A1所述的方法,其中,所述对原始图片进行的处理至少包括调整图像亮度、饱和度和对比度。应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明所述的方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (10)
1.一种生成图像增强模型的方法,该方法适于在计算设备中执行,包括:
获取原始图片和对原始图片进行处理后的目标图片;
将原始图片和目标图片分别输入第一生成对抗网络和第二生成对抗网络进行处理,以对应输出第一图片和第一判别值以及第二图片和第二判别值,其中,所述第一生成对抗网络包括第一生成器和第一判别器,所述第二生成对抗网络包括第二生成器和第二判别器;
将第一图片输入第二生成器,得到第一生成图片,并将第二图片输入第一生成器,得到第二生成图片;
确定第一图片与目标图片之间、第一生成图片与原始图片之间、第二图片与原始图片之间、第二生成图片与目标图片之间、第一判别值与预设正标签值之间、第二判别值与预设正标签值之间的第一损失值,并根据第一损失值调整第一生成器和第二生成器的网络参数;
确定第一判别值与预设负标签值之间、第二判别值与预设负标签值之间的第二损失值,并根据第二损失值调整第一判别器和第二判别器的网络参数;
重复确定第一损失值和第二损失值并调整网络参数的步骤,直到所述第一损失值和第二损失值满足预定条件时,将对应的第一生成器和/或第二生成器作为生成的图像增强模型。
2.如权利要求1所述的方法,其中,所述方法还包括:
对获取的原始图片和目标图片分别进行预处理。
3.如权利要求1所述的方法,其中,所述确定第一损失值的步骤包括:
利用第一损失函数,分别计算第一图片与目标图片之间、第一生成图片与原始图片之间、第二图片与原始图片之间、第二生成图片与目标图片之间的损失值;
利用第二损失函数,分别计算第一判别值与预设正标签值之间、第二判别值与预设正标签值之间的损失值;
综合所计算得的损失值,确定出第一损失值。
4.如权利要求1所述的方法,其中,所述确定第二损失值的步骤包括:
利用第二损失函数,分别计算第一判别值与预设负标签值之间、第二判别值与预设负标签值之间损失值;
综合所算得的损失值,确定出第二损失值。
5.如权利要求1所述的方法,其中,所述预设正标签值和预设负标签值之和为1。
6.如权利要求1所述的方法,其中,所述预定条件包括:
第一损失值和第二损失值不再减少或者前后两次迭代计算的差值小于预定阈值。
7.如权利要求1所述的方法,其中,所述第一生成器/第二生成器为编码器-解码器网络结构,包括多个卷积处理层、反卷积处理层和跳转连接层。
8.一种图像增强方法,其中,所述方法适于在计算设备中执行,包括:
将待处理图片输入训练后的第一生成器或第二生成器中进行处理,以得到图像增强效果图,
其中所述第一生成器或第二生成器为基于权利要求1-7任意一项中所述训练方法生成的。
9.一种计算设备,包括:
存储器;
一个或多个处理器;
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行根据权利要求1-8所述方法中的任一方法的指令。
10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当计算设备执行时,使得所述计算设备执行根据权利要求1-8所述的方法中的任一方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910246026.7A CN109978792A (zh) | 2019-03-28 | 2019-03-28 | 一种生成图像增强模型的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910246026.7A CN109978792A (zh) | 2019-03-28 | 2019-03-28 | 一种生成图像增强模型的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109978792A true CN109978792A (zh) | 2019-07-05 |
Family
ID=67081434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910246026.7A Pending CN109978792A (zh) | 2019-03-28 | 2019-03-28 | 一种生成图像增强模型的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109978792A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414378A (zh) * | 2019-07-10 | 2019-11-05 | 南京信息工程大学 | 一种基于异质人脸图像融合特征的人脸识别方法 |
CN110675334A (zh) * | 2019-08-28 | 2020-01-10 | 苏州千视通视觉科技股份有限公司 | 一种图像增强方法及装置 |
CN111291810A (zh) * | 2020-02-05 | 2020-06-16 | 深圳大学 | 基于目标属性解耦的信息处理模型生成方法及相关设备 |
CN111461997A (zh) * | 2020-03-09 | 2020-07-28 | 厦门大学 | 水下图像增强生成对抗网络的训练方法、介质及装置 |
CN112241640A (zh) * | 2019-07-18 | 2021-01-19 | 杭州海康威视数字技术股份有限公司 | 一种图形码确定方法、装置和工业相机 |
CN112258381A (zh) * | 2020-09-29 | 2021-01-22 | 北京达佳互联信息技术有限公司 | 模型训练方法、图像处理方法、装置、设备及存储介质 |
CN112580309A (zh) * | 2020-12-22 | 2021-03-30 | 平安国际智慧城市科技股份有限公司 | 文档数据处理方法、装置、计算机设备及存储介质 |
CN113240605A (zh) * | 2021-05-21 | 2021-08-10 | 南开大学 | 基于对称神经网络进行正反双向学习的图像增强方法 |
CN113780534A (zh) * | 2021-09-24 | 2021-12-10 | 北京字跳网络技术有限公司 | 网络模型的压缩方法、图像生成方法、装置、设备及介质 |
CN114445301A (zh) * | 2022-01-30 | 2022-05-06 | 北京字跳网络技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN114821681A (zh) * | 2022-06-27 | 2022-07-29 | 深圳市魔力信息技术有限公司 | 一种指纹增广方法 |
CN116109496A (zh) * | 2022-11-15 | 2023-05-12 | 济南大学 | 基于双流结构保护网络的x光片增强方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229349A (zh) * | 2017-12-21 | 2018-06-29 | 中国科学院自动化研究所 | 网纹人脸图像识别装置 |
CN109064423A (zh) * | 2018-07-23 | 2018-12-21 | 福建帝视信息科技有限公司 | 一种基于非对称循环生成对抗损失的智能修图方法 |
US20190066281A1 (en) * | 2017-08-24 | 2019-02-28 | Siemens Healthcare Gmbh | Synthesizing and Segmenting Cross-Domain Medical Images |
CN109472817A (zh) * | 2018-09-27 | 2019-03-15 | 浙江工业大学 | 一种基于循环生成对抗网络的多序列磁共振图像配准方法 |
CN109508717A (zh) * | 2018-10-09 | 2019-03-22 | 苏州科达科技股份有限公司 | 一种车牌识别方法、识别装置、识别设备及可读存储介质 |
-
2019
- 2019-03-28 CN CN201910246026.7A patent/CN109978792A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190066281A1 (en) * | 2017-08-24 | 2019-02-28 | Siemens Healthcare Gmbh | Synthesizing and Segmenting Cross-Domain Medical Images |
CN108229349A (zh) * | 2017-12-21 | 2018-06-29 | 中国科学院自动化研究所 | 网纹人脸图像识别装置 |
CN109064423A (zh) * | 2018-07-23 | 2018-12-21 | 福建帝视信息科技有限公司 | 一种基于非对称循环生成对抗损失的智能修图方法 |
CN109472817A (zh) * | 2018-09-27 | 2019-03-15 | 浙江工业大学 | 一种基于循环生成对抗网络的多序列磁共振图像配准方法 |
CN109508717A (zh) * | 2018-10-09 | 2019-03-22 | 苏州科达科技股份有限公司 | 一种车牌识别方法、识别装置、识别设备及可读存储介质 |
Non-Patent Citations (3)
Title |
---|
DEEPAK PATHAK ET AL: ""Context Encoders: Feature Learning by Inpainting"", 《ARXIV》 * |
IAN J. GOODFELLOW ET AL: ""Generative Adversarial Nets"", 《ARXIV》 * |
JUN-YAN ZHU ET AL: ""Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks"", 《ARXIV》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110414378A (zh) * | 2019-07-10 | 2019-11-05 | 南京信息工程大学 | 一种基于异质人脸图像融合特征的人脸识别方法 |
CN112241640A (zh) * | 2019-07-18 | 2021-01-19 | 杭州海康威视数字技术股份有限公司 | 一种图形码确定方法、装置和工业相机 |
CN110675334A (zh) * | 2019-08-28 | 2020-01-10 | 苏州千视通视觉科技股份有限公司 | 一种图像增强方法及装置 |
CN111291810B (zh) * | 2020-02-05 | 2023-03-14 | 深圳大学 | 基于目标属性解耦的信息处理模型生成方法及相关设备 |
CN111291810A (zh) * | 2020-02-05 | 2020-06-16 | 深圳大学 | 基于目标属性解耦的信息处理模型生成方法及相关设备 |
CN111461997A (zh) * | 2020-03-09 | 2020-07-28 | 厦门大学 | 水下图像增强生成对抗网络的训练方法、介质及装置 |
CN111461997B (zh) * | 2020-03-09 | 2022-07-19 | 厦门大学 | 水下图像增强生成对抗网络的训练方法、介质及装置 |
CN112258381A (zh) * | 2020-09-29 | 2021-01-22 | 北京达佳互联信息技术有限公司 | 模型训练方法、图像处理方法、装置、设备及存储介质 |
CN112258381B (zh) * | 2020-09-29 | 2024-02-09 | 北京达佳互联信息技术有限公司 | 模型训练方法、图像处理方法、装置、设备及存储介质 |
CN112580309A (zh) * | 2020-12-22 | 2021-03-30 | 平安国际智慧城市科技股份有限公司 | 文档数据处理方法、装置、计算机设备及存储介质 |
CN112580309B (zh) * | 2020-12-22 | 2023-08-04 | 深圳平安智慧医健科技有限公司 | 文档数据处理方法、装置、计算机设备及存储介质 |
CN113240605A (zh) * | 2021-05-21 | 2021-08-10 | 南开大学 | 基于对称神经网络进行正反双向学习的图像增强方法 |
CN113780534B (zh) * | 2021-09-24 | 2023-08-22 | 北京字跳网络技术有限公司 | 网络模型的压缩方法、图像生成方法、装置、设备及介质 |
CN113780534A (zh) * | 2021-09-24 | 2021-12-10 | 北京字跳网络技术有限公司 | 网络模型的压缩方法、图像生成方法、装置、设备及介质 |
CN114445301A (zh) * | 2022-01-30 | 2022-05-06 | 北京字跳网络技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN114821681A (zh) * | 2022-06-27 | 2022-07-29 | 深圳市魔力信息技术有限公司 | 一种指纹增广方法 |
CN116109496A (zh) * | 2022-11-15 | 2023-05-12 | 济南大学 | 基于双流结构保护网络的x光片增强方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109978792A (zh) | 一种生成图像增强模型的方法 | |
Li et al. | Luminance-aware pyramid network for low-light image enhancement | |
Furuta et al. | Pixelrl: Fully convolutional network with reinforcement learning for image processing | |
Li et al. | Recurrent squeeze-and-excitation context aggregation net for single image deraining | |
CN109255769A (zh) | 图像增强网络的训练方法和训练模型、及图像增强方法 | |
CN110163267A (zh) | 一种图像生成模型的训练方法和生成图像的方法 | |
US11055828B2 (en) | Video inpainting with deep internal learning | |
CN113658051B (zh) | 一种基于循环生成对抗网络的图像去雾方法及系统 | |
CN109816011A (zh) | 生成人像分割模型的方法和视频关键帧提取方法 | |
US20230080693A1 (en) | Image processing method, electronic device and readable storage medium | |
CN109658344A (zh) | 基于深度学习的图像去噪方法、装置、设备和存储介质 | |
CN108038823A (zh) | 图像型变网络模型的训练方法、图像型变方法及计算设备 | |
CN109978063A (zh) | 一种生成目标对象的对齐模型的方法 | |
Yang et al. | Adaint: Learning adaptive intervals for 3d lookup tables on real-time image enhancement | |
CN110096964A (zh) | 一种生成图像识别模型的方法 | |
CN110197229A (zh) | 图像处理模型的训练方法、装置及存储介质 | |
CN109544482A (zh) | 一种卷积神经网络模型生成方法及图像增强方法 | |
CN108648163A (zh) | 一种人脸图像的增强方法及计算设备 | |
CN110276289A (zh) | 生成匹配模型的方法和人脸特征点追踪方法 | |
CN111047543A (zh) | 图像增强方法、装置和存储介质 | |
CN115424088A (zh) | 图像处理模型训练方法以及装置 | |
CN109671061A (zh) | 一种图像分析方法、装置、计算设备及存储介质 | |
CN109685750A (zh) | 图像增强方法及计算设备 | |
CN110070498A (zh) | 一种基于卷积自编码器的图像增强方法 | |
CN110349102A (zh) | 图像美化的处理方法、图像美化的处理装置以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190705 |