CN110570375A - 一种图像处理方法、装置、电子设置以及存储介质 - Google Patents

一种图像处理方法、装置、电子设置以及存储介质 Download PDF

Info

Publication number
CN110570375A
CN110570375A CN201910842646.7A CN201910842646A CN110570375A CN 110570375 A CN110570375 A CN 110570375A CN 201910842646 A CN201910842646 A CN 201910842646A CN 110570375 A CN110570375 A CN 110570375A
Authority
CN
China
Prior art keywords
image
sample
deblurring
blurred
sample image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910842646.7A
Other languages
English (en)
Other versions
CN110570375B (zh
Inventor
张凯皓
马林
李志锋
刘威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910842646.7A priority Critical patent/CN110570375B/zh
Publication of CN110570375A publication Critical patent/CN110570375A/zh
Application granted granted Critical
Publication of CN110570375B publication Critical patent/CN110570375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

本申请实施例公开了一种图像处理方法、装置、电子设置以及存储介质,本申请属于人工智能领域,方法包括:获取原始模糊图像,获取去模糊生成模型;模糊生成模型包括顶部卷积层、第一卷积层和第二卷积层;基于顶部卷积层中的卷积函数,对原始模糊图像进行卷积,得到输入模糊图像编码特征;基于第一卷积层中的卷积函数和激活函数,对输入模糊图像编码特征进行卷积,得到第一模糊图像编码特征;将输入模糊图像编码特征和第一模糊图像编码特征叠加为第二模糊图像编码特征;基于第二卷积层中的卷积函数和激活函数,对第二模糊图像编码特征进行卷积,得到与原始模糊图像对应的目标清晰图像。采用本申请,可以提高将模糊图像去模糊的效率。

Description

一种图像处理方法、装置、电子设置以及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像处理方法、装置以及相关设备。
背景技术
图像去模糊技术,即是对输入的一张带有噪声的模糊图像进行去模糊处理,生成清晰图像的技术。图像去模糊技术在无人驾驶,公安侦查,媒体处理等领域具有广泛的应用。例如,在无人驾驶系统中,对捕捉到的由于运动速度较快而带有噪声的障碍物模糊图像,通过去模糊技术,使得该障碍物模糊图像更加清晰,提高障碍物的识别率,进而提高无人驾驶系统的安全性能。
现有方案中,通过为模糊图像设置锐化参数,以将模糊图像去模糊化。若设置的锐化参数过大,得到的图像就会失真,图中出现晕影和噪点,导致与原图图像内容不一致;若设置的锐化参数过小,去模糊化效果不明显。
现有方案中,锐化参数的确定是通过人工根据模糊图像的模糊程度,多次手动试验、调整,造成模糊图像去模糊化效率低下。
发明内容
本申请实施例提供一种图像处理方法、装置以及相关设备,可以提高将模糊图像去模糊的效率。
本申请实施例一方面提供了一种图像处理方法,包括:
获取原始模糊图像,获取去模糊生成模型;所述模糊生成模型包括顶部卷积层、第一卷积层和第二卷积层;
基于所述顶部卷积层中的卷积函数,对所述原始模糊图像进行卷积,得到输入模糊图像编码特征;
基于所述第一卷积层中的卷积函数和激活函数,对所述输入模糊图像编码特征进行卷积,得到第一模糊图像编码特征;
将所述输入模糊图像编码特征和所述第一模糊图像编码特征叠加为第二模糊图像编码特征;
基于所述第二卷积层中的卷积函数和激活函数,对所述第二模糊图像编码特征进行卷积,得到与所述原始模糊图像对应的目标清晰图像。
其中,所述第一卷积层和所述第二卷积层属于N个第一编码层;所述N个第一编码层包括N-1个第二编码层;所述N-1个第二编码层是在所述N个第一编码层中除位于底部的第一编码层以外的第一编码层;所述N是大于1的整数;
第二编码层Sj+1包括卷积激活单元Ck、卷积激活单元以及卷积激活单元Ck+2;所述j是大于0小于N-1的整数;所述k是大于0的整数;
所述卷积激活单元Ck的输入特征信息是所述第二编码层Sj的输出特征信息和所述第二编码层Sj的输入特征信息叠加后的特征信息;
所述卷积激活单元Ck+1的输入特征信息是所述卷积激活单元Ck的输出特征信息和所述卷积激活单元Ck的输入特征信息叠加后的特征信息;
所述卷积激活单元Ck+2的输入特征信息是所述卷积激活单元Ck+1的输出特征信息、所述卷积激活单元Ck+1的输入特征信息以及所述所述卷积激活单元Ck的输入特征信息叠加后的特征信息。
其中,还包括:
获取第一清晰样本图像;
基于样本模糊生成模型调整所述第一清晰样本图像的模糊度,得到模糊样本图像;
基于样本去模糊生成模型调整所述模糊样本图像的清晰度,得到第二清晰样本图像;
根据所述第一清晰样本图像、所述模糊样本图像和所述第二清晰样本图像训练所述样本去模糊生成模型,得到所述去模糊生成模型。
本申请实施例另一方面提供了一种图像处理方法,包括:
获取第一清晰样本图像,基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像;
基于样本去模糊生成模型将所述第一模糊样本图像转换为第二清晰样本图像;
根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型。
其中,所述根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型,包括:
获取与所述样本去模糊生成模型对应的去模糊生成函数,根据所述去模糊生成函数、所述第一清晰样本图像和所述第一模糊样本图像,确定第一像素损失函数;所述去模糊生成函数是用于调整模糊图像的清晰度;
根据所述去模糊生成函数、所述第一清晰样本图像、所述第二清晰样本图像以及所述第一模糊样本图像,确定相对去模糊损失函数;
将所述第一像素损失函数和所述相对去模糊损失函数组合为第一损失函数;
基于梯度下降规则确定所述第一损失函数中模型变量参数的参数值,作为第一目标参数值;
根据所述第一目标参数值更新所述去模糊生成函数中的模型变量参数;
当训练次数达到次数阈值时,将模型变量参数更新后的样本去模糊生成模型确定为所述去模糊生成模型。
其中,所述样本去模糊生成模型和样本去模糊判别模型属于去模糊生成对抗网络;
所述根据所述去模糊生成函数、所述第一清晰样本图像、所述第二清晰样本图像以及所述第一模糊样本图像,确定相对去模糊损失函数,包括:
获取与所述样本去模糊判别模型对应的去模糊判别函数;所述去模糊判别函数是用于识别清晰图像属于图像采集类型的概率;
根据所述去模糊判别函数、所述第一清晰样本图像和所述第二清晰样本图像,确定去模糊判别损失函数;
根据所述去模糊生成函数、所述去模糊判别函数、所述第一模糊样本图像,确定去模糊生成损失函数;
将所述去模糊判别损失函数和所述去模糊生成损失函数组合为所述相对去模糊损失函数。
其中,还包括:
获取基准模糊样本图像;
根据所述第一清晰样本图像、所述第一模糊样本图像、所述基准模糊样本图像以及所述去模糊生成函数训练所述样本模糊生成模型,得到用于将清晰图像转换为模糊图像的模糊生成模型。
其中,所述根据所述第一清晰样本图像、所述第一模糊样本图像、所述基准模糊样本图像以及所述去模糊生成函数训练所述样本模糊生成模型,得到用于将清晰图像转换为模糊图像的模糊生成模型,包括:
获取与所述样本模糊生成模型对应的模糊生成函数;所述模糊生成函数是用于调整清晰图像的模糊度;
根据所述模糊生成函数、所述去模糊生成函数以及所述第一清晰样本图像,确定第二像素损失函数;
根据所述模糊生成函数、所述第一清晰样本图像、所述第一模糊样本图像以及所述基准模糊样本图像,生成相对模糊损失函数;
将所述第二像素损失函数和所述相对模糊损失函数组合为第二损失函数;
基于梯度下降规则确定所述第二损失函数中模型变量参数的参数值,作为第二目标参数值;
根据所述第二目标参数值更新所述模糊生成函数中的模型变量参数;
当训练次数达到所述次数阈值时,将模型变量参数更新后的样本模糊生成模型确定为所述模糊生成模型。
其中,所述样本模糊生成模型和样本模糊判别模型属于模糊生成对抗网络;
所述根据所述模糊生成函数、所述第一清晰样本图像、所述第一模糊样本图像以及所述基准模糊样本图像,生成相对模糊损失函数,包括:
获取与所述样本模糊判别模型对应的模糊判别函数;所述去模糊判别函数是用于识别模糊图像属于图像采集类型的概率;
根据所述模糊判别函数、所述基准模糊样本图像、所述第一模糊样本图像确定模糊判别损失函数;
根据所述模糊生成函数、所述模糊判别函数、所述第一清晰样本图像,确定模糊生成损失函数;
将所述模糊判别损失函数和所述模糊生成损失函数组合为所述相对模糊损失函数。
其中,所述基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像,包括:
获取噪声图像;
将所述第一清晰样本图像的像素与所述噪声图像的像素进行加权平均,得到输入图像;
基于所述样本模糊生成模型将所述输入图像转换为所述第一模糊样本图像。
其中,还包括:
获取待调整模糊图像,获取尺寸阈值,根据所述尺寸阈值调整所述待调整模糊图像的图像尺寸,得到原始模糊图像;
基于所述去模糊生成模型调整所述原始模糊图像的清晰度,得到与所述原始模糊图像对应的目标清晰图像。
本申请实施例另一方面提供了一种图像处理装置,包括:
第一获取模块,用于获取原始模糊图像,获取去模糊生成模型;所述模糊生成模型包括顶部卷积层、第一卷积层和第二卷积层;
第一调整模块,用于基于所述顶部卷积层中的卷积函数,对所述原始模糊图像进行卷积,得到输入模糊图像编码特征,基于所述第一卷积层中的卷积函数和激活函数,对所述输入模糊图像编码特征进行卷积,得到第一模糊图像编码特征,将所述输入模糊图像编码特征和所述第一模糊图像编码特征叠加为第二模糊图像编码特征,基于所述第二卷积层中的卷积函数和激活函数,对所述第二模糊图像编码特征进行卷积,得到与所述原始模糊图像对应的目标清晰图像。
其中,所述第一卷积层和所述第二卷积层属于N个第一编码层;所述N个第一编码层包括N-1个第二编码层;所述N-1个第二编码层是在所述N个第一编码层中除位于底部的第一编码层以外的第一编码层;所述N是大于1的整数;
第二编码层Sj+1包括卷积激活单元Ck、卷积激活单元以及卷积激活单元Ck+2;所述j是大于0小于N-1的整数;所述k是大于0的整数;
所述卷积激活单元Ck的输入特征信息是所述第二编码层Sj的输出特征信息和所述第二编码层Sj的输入特征信息叠加后的特征信息;
所述卷积激活单元Ck+1的输入特征信息是所述卷积激活单元Ck的输出特征信息和所述卷积激活单元Ck的输入特征信息叠加后的特征信息;
所述卷积激活单元Ck+2的输入特征信息是所述卷积激活单元Ck+1的输出特征信息、所述卷积激活单元Ck+1的输入特征信息以及所述所述卷积激活单元Ck的输入特征信息叠加后的特征信息。
其中,第一调整模块还用于:获取第一清晰样本图像,基于样本模糊生成模型调整所述第一清晰样本图像的模糊度,得到模糊样本图像,基于样本去模糊生成模型调整所述模糊样本图像的清晰度,得到第二清晰样本图像,根据所述第一清晰样本图像、所述模糊样本图像和所述第二清晰样本图像训练所述样本去模糊生成模型,得到所述去模糊生成模型。
本申请实施例另一方面提供了一种图像处理装置,包括:
第二获取模块,用于获取第一清晰样本图像;
第一转换模块,用于基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像;
第二转换模块,用于基于样本去模糊生成模型将所述第一模糊样本图像转换为第二清晰样本图像;
第一训练模块,用于根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型。
其中,所述第一训练模块,包括:
第一获取单元,用于获取与所述样本去模糊生成模型对应的去模糊生成函数,根据所述去模糊生成函数、所述第一清晰样本图像和所述第一模糊样本图像,确定第一像素损失函数;所述去模糊生成函数是用于调整模糊图像的清晰度;
第一生成单元,用于根据所述去模糊生成函数、所述第一清晰样本图像、所述第二清晰样本图像以及所述第一模糊样本图像,确定相对去模糊损失函数;
第一组合单元,用于将所述第一像素损失函数和所述相对去模糊损失函数组合为第一损失函数;
所述第一组合单元,还用于基于梯度下降规则确定所述第一损失函数中模型变量参数的参数值,作为第一目标参数值;
所述第一组合单元,还用于根据所述第一目标参数值更新所述去模糊生成函数中的模型变量参数;
所述第一组合单元,还用于当训练次数达到次数阈值时,将模型变量参数更新后的样本去模糊生成模型确定为所述去模糊生成模型。
其中,所述样本去模糊生成模型和样本去模糊判别模型属于去模糊生成对抗网络;
所述第一生成单元,包括:
第一获取子单元,用于获取与所述样本去模糊判别模型对应的去模糊判别函数;所述去模糊判别函数是用于识别清晰图像属于图像采集类型的概率;
第一确定子单元,用于根据所述去模糊判别函数、所述第一清晰样本图像和所述第二清晰样本图像,确定去模糊判别损失函数;
所述第一确定子单元,还用于根据所述去模糊生成函数、所述去模糊判别函数、所述第一模糊样本图像,确定去模糊生成损失函数;
所述第一确定子单元,还用于将所述去模糊判别损失函数和所述去模糊生成损失函数组合为所述相对去模糊损失函数。
其中,还包括:
第三获取模块,用于获取基准模糊样本图像;
第二训练模块,用于根据所述第一清晰样本图像、所述第一模糊样本图像、所述基准模糊样本图像以及所述去模糊生成函数训练所述样本模糊生成模型,得到用于将清晰图像转换为模糊图像的模糊生成模型。
其中,所述第二训练模块,包括:
第二获取单元,用于获取与所述样本模糊生成模型对应的模糊生成函数;所述模糊生成函数是用于调整清晰图像的模糊度;
所述第二获取单元,还用于根据所述模糊生成函数、所述去模糊生成函数以及所述第一清晰样本图像,确定第二像素损失函数;
第二生成单元,用于根据所述模糊生成函数、所述第一清晰样本图像、所述第一模糊样本图像以及所述基准模糊样本图像,生成相对模糊损失函数;
第二组合单元,用于将所述第二像素损失函数和所述相对模糊损失函数组合为第二损失函数;
所述第二组合单元,还用于基于梯度下降规则确定所述第二损失函数中模型变量参数的参数值,作为第二目标参数值;
所述第二组合单元,还用于根据所述第二目标参数值更新所述模糊生成函数中的模型变量参数;
所述第二组合单元,还用于当训练次数达到所述次数阈值时,将模型变量参数更新后的样本模糊生成模型确定为所述模糊生成模型。
其中,所述样本模糊生成模型和样本模糊判别模型属于模糊生成对抗网络;
所述第二生成单元,包括:
第二获取子单元,用于获取与所述样本模糊判别模型对应的模糊判别函数;所述去模糊判别函数是用于识别模糊图像属于图像采集类型的概率;
第二确定子单元,用于根据所述模糊判别函数、所述基准模糊样本图像、所述第一模糊样本图像确定模糊判别损失函数;
所述第二确定子单元,还用于根据所述模糊生成函数、所述模糊判别函数、所述第一清晰样本图像,确定模糊生成损失函数;
所述第二确定子单元,还用于将所述模糊判别损失函数和所述模糊生成损失函数组合为所述相对模糊损失函数。
其中,所述第一转换模块,包括:
加权平均单元,用于获取噪声图像,并将所述第一清晰样本图像的像素与所述噪声图像的像素进行加权平均,得到输入图像;
转换单元,用于基于所述样本模糊生成模型将所述输入图像转换为所述第一模糊样本图像。
其中,还包括:
第二调整模块,用于获取待调整模糊图像,获取尺寸阈值,根据所述尺寸阈值调整所述待调整模糊图像的图像尺寸,得到原始模糊图像;
所述第二调整模块,还用于基于所述去模糊生成模型调整所述原始模糊图像的清晰度,得到与所述原始模糊图像对应的目标清晰图像。
本申请实施例另一方面提供了一种电子设备,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如本申请实施例中一方面中的方法。
本申请实施例另一方面提供了一种电子设备,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如本申请实施例中另一方面中的方法。
本申请实施例另一方面提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如本申请实施例中一方面中的方法。
本申请实施例另一方面提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如本申请实施例中另一方面中的方法。
本申请实施例通过去模糊生成模型,自动调整原始模糊图像的清晰度,得到与原始模糊图像对应的清晰图像,其中去模糊生成模型是通过清晰样本图像以及与清晰图像具有相同图像内容的模糊样本图像训练得到的。上述可知,本申请通过去模糊生成模型自动地将模糊图像调整为清晰图像,且去模糊生成模型是通过成对的模糊图像和清晰图像构建得到的,因此基于去模糊生成模型得到的清晰图像,不仅与输入模糊图像的图像内容相同,且去模糊化效果明显。因此,采用本申请,在保证去模糊化的视觉效果前提下,还可以提高去模糊化的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图像处理的系统架构图;
图2a-图2b是本申请实施例提供的一种图像处理的场景示意图;
图3是本申请实施例提供的一种图像处理方法的流程示意图;
图4是本申请实施例提供的一种去模糊生成模型的示意图;
图5是本申请实施例提供的另一种图像处理方法的流程示意图;
图6是本申请实施例提供的一种模型训练示意图;
图7是本申请实施例提供的一种图像处理装置的结构示意图;
图8是本申请实施例提供的另一种图像处理装置的结构示意图;
图9是本发明实施例提供的一种电子设备的结构示意图;
图10是本发明实施例提供的另一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的方案属于人工智能领域下属的计算机视觉技术(ComputerVision,CV)和机器学习(Machine Learning,ML)。
计算机视觉技术是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。在本申请中,即是将视觉效果差的模糊图像去模糊化,得到视觉效果较好的清晰图像。
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。在本申请中,具体的技术手段涉及机器学习中的人工神经网络、生成对抗网络等技术。
请参见图1,是本申请实施例提供的一种图像处理的系统架构图。本申请涉及后台服务器10d以及终端设备集群,终端设备集群可以包括:终端设备10a、终端设备10b、...、终端设备10c等。
以终端设备10a为例,终端设备10a获取待调整的模糊图像,并将该模糊图像发送至后台服务器10d,后台服务器10d获取已经训练好的去模糊生成模型,将模糊图像输入该去模糊生成模型,基于去模糊生成模型中的卷积函数和激活函数调整模糊图像的清晰度,得到与模糊图像对应的清晰图像;其中,去模糊生成模型是由成对的清晰样本图像和模糊样本图像训练得到的,且模糊样本图像是由清晰样本图像,以及模糊生成模型生成的。后台服务器10d可以将去模糊后的清晰图像下发至终端设备10a,终端设备10a可以在屏幕中显示去模糊后的清晰图像。
训练去模糊生成模型,以及基于去模糊生成模型调整模糊图像的清晰度也可以由终端设备10a来完成。
其中,图1所示的终端设备10a、终端设备10b、...、终端设备10c等可以包括手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(MID,mobile internet device)、可穿戴设备(例如智能手表、智能手环等)等。
下述图2a-图2b以终端设备如何训练去模糊生成模型,以及如图调整模糊图像的清晰度得到清晰图像为例进行具体的说明。
请参见图2a-图2b,是本申请实施例提供的一种图像处理的场景示意图。下述图2a对应的实施例说明如何训练去模糊生成模型,图2b对应的实施例说明如何基于训练好的去模糊生成模型调整模糊图像的清晰度,以得到清晰图像。
请参见图2a,终端设备获取清晰样本图像20b,并获取噪声图像20a,其中噪声图像20a可以是随机生成的图像,且清晰样本图像20b的图像尺寸与噪声图像20a的图像尺寸相同,且都等于模型尺寸输入阈值。
清晰样本图像20b是真实的清晰图像,也即是该图像是通过成像设备采集得到的。
终端设备将噪声图像20a与清晰样本图像20b进行叠加,得到输入图像。将输入图像输入模糊生成模型20c,基于模糊生成模型20c中的卷积模块1、卷积模块2、...、卷积模块N,将清晰样本图像20b转换为模糊样本图像20d。上述可知,模糊生成模型20c是用于将清晰图像转换为模糊图像。
其中,模糊生成模型20c中除了卷积模块1和卷积模块2外,其余的卷积模块满足如下公式:第N个卷积模块的输入=第N-1个卷积模块的输出+第N-1个卷积模块的输入。例如,第N-1个卷积模块的输入为[1,1,1],第N-1个卷积模块的输出为[2,2,2],叠加后,第N个卷积模块的输入为[3,3,3]。
模糊生成模型20c中,第1个卷积模块可以只包含1个卷积函数,最后一个卷积模块可以包含2个卷积函数和1个激活函数,其余中间的卷积模块的结构都相同,都包含4个卷积函数和3个激活函数。
模糊生成模型20c输出模糊样本图像20d后,将模糊样本图像20d输入去模糊生成模型20e,基于模糊生成模型20e中的卷积模块1、卷积模块2、...、卷积模块N,将模糊样本图像20d转换为清晰样本图像20f。可以知道,去模糊生成模型20e是用于将模糊图像转换为清晰图像。
清晰样本图像20f是由模型生成的清晰图像,换句话说,清晰样本图像20f是模拟的清晰图像;清晰样本图像20b是真实的清晰图像。
同样地,去模糊生成模型20e中除了卷积模块1和卷积模块2外,其余的卷积模块满足如下公式:第N个卷积模块的输入=第N-1个卷积模块的输出+第N-1个卷积模块的输入。
去模糊生成模型20e中,第1个卷积模块可以只包含1个卷积函数,最后一个卷积模块可以包含2个卷积函数和1个激活函数,其余中间的卷积模块的结构都相同,都包含4个卷积函数和3个激活函数;也即是说,模糊生成模型20c与去模糊生成模型20e的模型结构完全相同,只是模型参数不同。
计算生成的清晰样本图像20f与真实的清晰样本图像20b之间像素损失。
获取与去模糊生成模型20e对应的去模糊判别模型,该去模糊判别模型可以识别清晰样本图像20f与清晰样本图像20b之间的相对去模糊损失,将像素损失以及相对去模糊损失组合为去模糊损失,基于该去模糊损失调整交替调整去模糊生成模型20e中的模型参数以及去模糊判别模型中的模型参数。
其中,去模糊生成模型20e以及去模糊判别模型属于一个生成对抗网络,去模糊生成模型20e用于生成清晰图像,去模糊判别模型是用于判别生成的清晰图像的真实性。
获取与模糊生成模型20c对应的模糊判别模型,该模糊判别模型可以识别模糊样本图像20d与模糊样本图像20g之间的相对模糊损失,将前述中的像素损失以及相对模糊损失组合为模糊损失,基于该模糊损失调整交替调整模糊生成模型20c中的模型参数以及模糊判别模型中的模型参数。
其中,模糊样本图像20d是由模型生成的模拟的模糊图像,模糊样本图像20g是通过成像设备采集得到的,即模糊样本图像20g是真实的模糊图像,且模糊样本图像20g的图像内容可以与清晰样本图像20b、模糊样本图像20d都不相同,即模糊样本图像20g与清晰样本图像20b不是成对图像。
模糊生成模型20c以及模糊判别模型属于一个生成对抗网络,模糊生成模型20c用于生成模糊图像,模糊判别模型是用于判别生成的模糊图像的真实性。
简单来说,模糊生成模型20c可以生成与清晰图像1成对的模糊图像1,去模糊生成模型20e可以生成与模糊图像1成对的清晰图像2,后续基于清晰图像1、模糊图像1、清晰图像2、以及真实的模糊图像调整模糊生成模型20c;基于清晰图像1、模糊图像1、以及清晰图像2调整去模糊生成模型20e。
采用上述方式,不断地调整模糊生成模型20c中的模型参数、以及去模糊生成模型20e中的模型参数。
当调整次数达到次数阈值,或者去模糊生成模型20e收敛时,将模型参数调整后的去模糊生成模型20e作为去模糊模型20e,其中去模糊生成模型20e收敛是指调整前的模型参数与调整后的模型参数之间的差值小于差异阈值。
去模糊模型20e训练完毕后,可以基于去模糊模型20e调整模糊图像的清晰度。如图2b所示,终端设备获取模糊图像30a,将模糊图像30a输入去模糊模型20e,基于去模糊模型20e中的N个卷积模块对应的卷积函数和激活函数,调整模糊图像30a的清晰度,得到与模糊图像30a具有相同图像内容的清晰图像30b,
终端设备在生成清晰图像30b的过程中,可以在屏幕上播放预设的动画。当检测到清晰图像30b生成完毕时,停止播放动画,将模糊图像30a以及生成的清晰图像30b一同显示在屏幕上。
其中,基于去模糊生成模型(如上述图2b对应实施例中的去模糊模型20e)调整原始模糊图像(如上述图2b对应实施例中的模糊图像30a)的清晰度,得到目标清晰图像(如上述图2b对应实施例中的清晰图像30b),训练样本去模糊生成模型(如上述图2a对应实施例中的去模糊生成模型20e)的具体过程可以参见下述图3-图6对应的实施例。
请参见图3,是本申请实施例提供的一种图像处理方法的流程示意图,下述实施例主要描述模型的使用,如图3所示,该方法可以包括如下步骤:
步骤S101,获取原始模糊图像,获取去模糊生成模型;模糊生成模型包括顶部卷积层、第一卷积层和第二卷积层.。
具体的,终端设备(如上述图2a-图2b对应实施例中的终端设备)获取待去模糊的模糊图像,称为原始模糊图像(如上述图2b对应实施例中的模糊图像30a)。
模糊图像是包含模糊噪声,不能体现图像内容的图像,对应地,清晰图像是不包含模糊噪声,可以准确体现图像内容的图像。
终端设备获取去模糊生成模型(如上述图2b对应实施例中的去模糊模型20e),其中,去模糊生成模型是由清晰样本图像(如上述图2a对应实施例中的清晰样本图像20b),以及与该清晰样本图像具有相同图像内容的模糊样本图像(如上述图2a对应实施例中的模糊样本图像20d)训练样本去模糊生成模型(如上述图2a对应实施例中的去模糊生成模型20e)后得到的。具有相同图像内容的清晰样本图像和模糊样本图像是指上述两个图像中包含的对象完全相同,换句话说,清晰样本图像与模糊样本图像是成对图像。
模糊样本图像是将清晰样本图像输入模糊生成模型后,由模糊生成模型生成的模糊图像,因此,模糊样本图像属于图像模拟类型,清晰样本图像属于图像采集类型,或者说模糊样本图像是模拟图像,清晰样本图像是真实图像。
其中,图像模拟类型是指对应的图像是由模型生成的,而不是通过成像设备(例如,摄像头、照相机等)采集的;对应地,图像采集类型是指对应的图像是由成像设备采集得到的。
模糊生成模型是由清晰样本图像,以及基准模糊图像(如上述图2a对应实施例中的样本模糊图像20g)训练样本模糊生成模型(如上述图2a对应实施例中的模糊生成模型20c)后得到的,其中基准模糊图像属于图像采集类型。
尤其注意的是,此处的清晰样本图像与模糊基准图像可以不是成对图像,即清晰样本图像的图像内容与模糊基准图像的图像内容可以不同,只要模糊基准图像属于图像采集类型即可。
简单来说,训练样本去模糊生成模型时,是由成对的清晰样本图像和模糊样本图像作为样本图像,且清晰样本图像是真实图像,模糊样本图像是模拟图像;但训练样本模糊生成模型时,可以由不成对的清晰样本图像和基准模糊图像作为样本图像,但清晰样本图像和基准模糊图像都是真实图像。
模糊生成模型包括多个卷积层,位于模糊生成模型顶部的卷积层称为顶部卷积层,除顶部卷积层以外的卷积层都称为第一编码层,设第一编码层的数量是N个,N是大于1的整数,N可以等于16。每个第一编码层都可以对应一个ResNet,区别于以往的线性神经网络(线性神经网络中第N+1个编码层的输入等于第N个编码层的输出)的线性结构,本申请中去模糊生成模型中的多个N个第一编码层满足如下关系:
每个第一编码层的输入是由前一个第一编码层的输出,在加上前一个第一编码层的输入共同确定的,即第i+1个第一编码层Si+1的输入特征信息=第i个第一编码层Si的输出特征信息+第i个第一编码层Si的输入特征信息,采用这种方式,在训练过程中可以避免退化问题,即训练的准确率会趋于平缓,但是训练误差不会变大。
为了保证特征信息可以叠加,前提是第i个第一编码层Si的输出特征信息的特征图尺寸、通道数,与第i个第一编码层Si的输入特征信息的特征图尺寸、通道数对应相同。
下述以N编码层可以分为第一卷积层和第二卷积层进行具体说明:
步骤S102,基于所述顶部卷积层中的卷积函数,对所述原始模糊图像进行卷积,得到输入模糊图像编码特征。
具体的,获取尺寸阈值,若原始模糊图像的尺寸与尺寸阈值相同,终端设备可以直接将原始模糊图像输入去模糊生成模型;若原始模糊图像的尺寸与尺寸阈值不相同,终端设备可以首先调整原始模糊图像的图像尺寸,使得调整后的原始模糊图像的尺寸与尺寸阈值相同,再将尺寸调整后的原始模糊图像输入去模糊生成模型。
基于去模糊生成模型的顶部卷积层中的卷积函数,对原始模糊图像进行卷积,得到输入模糊图像编码特征,其中顶部卷积层可以包含1个卷积函数。
步骤S103,基于所述第一卷积层中的卷积函数和激活函数,对所述输入模糊图像编码特征进行卷积,得到第一模糊图像编码特征。
具体的,若第一编码层的数量N等于2,那么与顶部卷积层相邻的第一编码层的即是第一卷积层,与第一卷积层相邻的是第二卷积层。
若第一编码层的数量N大于2,那么与顶部卷积层相邻的第一编码层的即是第一卷积层,剩余的第一编码层都是第二卷积层。
基于第一卷积层中的卷积函数和激活函数(其中,激活函数可以是Relu函数,Sigma函数等),对输入模糊图像编码特征进行函数运算,得到第一模糊图像编码特征。
其中,第一卷积层可以包括4个卷积函数和3个激活函数,排列顺序依次为:卷积函数1、激活函数1、卷积函数2、激活函数2、卷积函数3、激活函数3、卷积函数4。可以将卷积函数1和激活函数1组合为第1个卷积激活单元Ck,将卷积函数2和激活函数2组合为第2个卷积激活单元Ck+1,将卷积函数3和激活函数3组合为第3个卷积激活单元Ck+2,将卷积函数4作为第4个卷积激活单元Ck+3;k是大于0的整数。
步骤S104,将所述输入模糊图像编码特征和所述第一模糊图像编码特征叠加为第二模糊图像编码特征。
具体的,将前述中的输入模糊图像编码特征和第一模糊图像编码特征相加,得到第二模糊图像编码特征。
步骤S105,基于所述第二卷积层中的卷积函数和激活函数,对所述第二模糊图像编码特征进行卷积,得到与所述原始模糊图像对应的目标清晰图像。
具体的,若当前第二卷积层的数量为1,基于第二卷积层中的卷积函数和激活函数,再对第二模糊图像编码特征进行函数运算,得到与所述原始模糊图像对应的目标清晰图像(如上述图2b对应实施例中的清晰图像30b)。
若当前第二卷积层的数量大于1,从多个第二卷积层中提取与当前第一卷积层相邻的第二卷积层,作为新的第一卷积层(此时,第二卷积层的数量就减少一个)。将叠加后得到的第二模糊图像编码特征作为新的输入模糊图像编码特征。再执行步骤S103-步骤S105,即是基于新的第一和卷积层中的卷积函数和激活函数,对新的输入模糊图像编码特征进行函数运算,得到新的第一模糊图像编码特征。将新的输入模糊图像编码特征和新的第一模糊图像编码特征叠加为新的第二模糊图像编码特征。再检测当前的第二卷积层的数量,不断迭代,直到第二卷积层的数量为1,基于第二卷积层的函数运算后,可以输出目标清晰图像,也就是说当所有的第一编码层都参与了运算,就会输出目标清晰图像。
N个第一编码层(也是第一卷积层和第二卷积层)还可以进一步细分为:位于底部的第一编码层以及N-1个第二编码层。总的来说,去模糊生成模型可以包括顶部卷积层,N-1个第二编码层(第二编码层的数量可以等于15),以及位于底部的第一编码层;且N-1个第二编码层以及位于底部的第一编码层又可以称为N个第一编码层。
其中,位于底部的第一编码层(可以理解为是位于底部的第二卷积层)可以包括2个卷积函数和1个激活函数;每个第二编码层(可以理解为是位于中间的多个第一卷积层)的结构都完全相同,都可以包含4个卷积函数和3个激活函数。
下述以一个第二编码层Sj+1为例,说明第二编码层Sj+1中的结构:j是大于0小于N-1的整数。
第二编码层Sj+1中包括多个卷积激活单元(包括卷积激活单元Ck、卷积激活单元Ck+1、卷积激活单元Ck+2...),每个卷积激活单元可以包括一个卷积函数和一个激活函数,k是大于0的整数;或者位于底部的卷积激活单元只包括一个卷积函数,其余的卷积激活单元都包括一个卷积函数和一个激活函数。
第二编码层Sj+1的卷积激活单元Ck的输入特征信息=第二编码层Sj的输出特征信息+第二编码层Sj的输入特征信息;
第二编码层Sj+1的卷积激活单元Ck+1的输入特征信息=卷积激活单元Ck的输出特征信息+卷积激活单元Ck的输入特征信息;
第二编码层Sj+1的卷积激活单元Ck+2的输入特征信息=卷积激活单元Ck+1的输出特征信息+卷积激活单元Ck+1的输入特征信息+卷积激活单元Ck的输入特征信息。
第二编码层Sj+1的卷积激活单元Ck+3的输入特征信息=卷积激活单元Ck+2的输出特征信息+卷积激活单元Ck+2的输入特征信息+卷积激活单元Ck+1的输入特征信息+卷积层Ck的输入特征信息;
...
即,每个卷积激活单元的输入都等于前一个卷积激活单元的输出+前一个卷积激活单元的输入+前面所有卷积激活单元的输入之和。
当第二编码层Sj是位于首位的第二编码层时,即该第二编码层Sj与顶部卷积层相邻,该第二编码层Sj的输入特征信息=顶部卷积层的输出特征信息,也就是说第1个第二编码层的输入特征信息=顶部卷积层的输出特征信息。
其中,为了保证特征信息可以叠加,第二编码层Sj的输出特征信息的特征图尺寸、通道数,与第二编码层Sj的输入特征信息的特征图尺寸、通道数,与卷积激活单元Ck的输出特征信息的特征图尺寸、通道数,与卷积激活单元Ck+1的输出特征信息的特征图尺寸、通道数,与卷积激活单元Ck+2的输出特征信息的特征图尺寸、通道数对应相同。
请参见图4,是本申请实施例提供的一种去模糊生成模型的示意图,去模糊生成模型包括编码层1、编码层2、编码层3、...、编码层N,编码层N+1,其中,编码层1即是顶部卷积层,编码层2、编码层3、...、编码层N+1均是第一编码层,编码层N+1是位于底部的第一编码层,且编码层2、编码层3、...、编码层N也是第二编码层。
从图4中可以看出,编码层3的输入特征信息=编码层2的输出特征信息+编码层2的输入特征信息;编码层4的输入特征信息=编码层3的输出特征信息+编码层3的输入特征信息;...;除编码层1和编码层2以外,其余的编码层满足如下关系:编码层N+1的输入特征信息=编码层N的输出特征信息+编码层N的输入特征信息。对第二编码层(即是编码层2、编码层3、...、编码层N)来说,每个第二编码层都包括:卷积激活单元1,卷积激活单元2,卷积激活单元3和卷积激活单元4,下述以编码层2为例进行说明:
卷积激活单元1的输入特征信息=编码层1的输出特征信息;
卷积激活单元2的输入特征信息=卷积激活单元1的输出特征信息+卷积激活单元1的输入特征信息;
卷积激活单元3的输入特征信息=卷积激活单元2的输出特征信息+卷积激活单元2的输入特征信息+卷积激活单元1的输入特征信息;
卷积激活单元4的输入特征信息=卷积激活单元3的输出特征信息+卷积激活单元3的输入特征信息+卷积激活单元2的输入特征信息+卷积激活单元1的输入特征信息。
下述以编码层3为例进行说明:
卷积激活单元1的输入特征信息=编码层2的输出特征信息+编码层2的输入特征信息;
后续,编码层3中的卷积激活单元2、卷积激活单元3以及卷积激活单元4的输入特征信息的确定方式和编码层2中的卷积激活单元2、卷积激活单元3以及卷积激活单元4的输入特征信息的确定方式都相同,此处就不再复述。
可选的,获取第一清晰样本图像,其中第一清晰样本图像是通过成像设备采集的真实图像。基于样本模糊生成模型调整第一清晰样本图像的模糊度,得到模糊样本图像。基于样本去模糊生成模型调整模糊样本图像的清晰度,得到第二清晰样本图像。可以知道,模糊样本图像和第二清晰样本图像都是模型生成的模拟图像。根据第一清晰样本图像、模糊样本图像以及第二清晰样本图像训练样本去模糊生成模型,得到去模糊生成模型。
请参见图5,是本申请实施例提供的另一种图像处理方法的流程示意图,下述实施例主要描述模型的训练,如图5所示,该方法可以包括如下步骤:
步骤S201,获取第一清晰样本图像,基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像。
具体的,终端设备获取用于模型训练的清晰样本图像,作为第一清晰样本图像(如上述图2a对应实施例中的清晰样本图像20b),其中第一清晰样本图像属于图像采集类型,即第一清晰样本图像是真实图像。
终端设备获取噪声图像,获取尺寸阈值,调整第一清晰样本图像的图像尺寸以及噪声图像的图像尺寸,使得调整后的第一清晰样本图像的图像尺寸与尺寸阈值相同,调整后的噪声图像的图像尺寸与尺寸阈值相同。
将尺寸调整后的第一清晰样本图像和尺寸调整后的噪声图像对应像素进行加权平均,得到输入图像,当然,输入图像的尺寸与尺寸阈值仍旧相同。
例如,尺寸调整后的第一清晰图像可以表示为:尺寸调整后的噪声图像可以表示为:那么将上述第一清晰图像和噪声图像叠加后,输入图像可以表示为:
终端设备获取待训练的模糊生成模型,称为样本模糊生成模型(如上述图2a对应实施例中的模糊生成模型20c)。
需要说明的是,模型训练前的模型结构和模型训练后的模型结构是不变的,变化的是模型中的模型参数(也可以称为模型变量参数),模型结构是指模型包含的卷积层数量、以及激活函数等。
其中,样本模糊生成模型的模型结构与前述中的去模糊生成模型的模型结构相同,可以包括位于顶部的顶部卷积层,N-1个第二编码层(第二编码层的数量可以等于15),以及位于底部的第一编码层;且N-1个第二编码层以及位于底部的第一编码层又可以称为N个第一编码层。
顶部卷积层可以包括1个卷积函数;位于底部的第一编码层可以包括2个卷积函数和1个激活函数;每个第二编码层的结构都完全相同,都可以包含4个卷积函数和3个激活函数。
每个第一编码层的输入是由前一个第一编码层的输出,在加上前一个第一编码层的输入共同确定的;第二编码层的每个卷积激活单元的输入都等于前一个卷积激活单元的输出+前一个卷积激活单元的输入+前面所有卷积激活单元的输入之和。
终端设备将输入图像输入样本模糊生成模型中,基于样本模糊生成模型的卷积层,将输入图像转换为模糊图像,称为第一模糊样本图像(如上述图2a对应实施例中的模糊样本图像20d),其中第一模糊样本图像的图像尺寸与输入图像的图像尺寸相同。
步骤S202,基于样本去模糊生成模型将所述第一模糊样本图像转换为第二清晰样本图像。
具体的,终端设备获取待训练的去模糊生成模型,称为样本去模糊生成模型(如上述图2a对应实施例中的去模糊生成模型20e),需要说明的是,样本去模糊生成模型的模型结构和样本模糊生成模型的模型结构相同,也与模糊生成模型的模型结构相同。
终端设备将第一模糊样本图像输入样本去模糊生成模型中,基于样本去模糊生成模型的卷积层,将第一模糊样本图像转换为清晰图像,称为第二清晰样本图像(如上述图2a对应实施例中的清晰样本图像20f),其中第二清晰样本图像的尺寸与输入图像尺寸相同。
总的来说,样本模糊生成模型是用于将清晰图像转换为模糊图像,且转换后的模糊图像属于图像模拟类型;样本去模糊生成模型是用于将模糊图像转换为清晰图像,且转换后的清晰图像也属于图像模拟类型。
步骤S203,根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型。
具体的,终端设备获取样本去模糊生成模型的模型函数(模型函数包括前述中的卷积函数和激活函数),称为去模糊生成函数G1=hθG1(IG1)=θG1IG1,可以知道去模糊生成函数是用于调整模糊图像的清晰度,使得模糊图像调整后为清晰图像。去模糊生成函数包括模型变量参数θG1和输入参数IG1,根据下述公式(1)可以确定第一像素损失函数Lcontent1
其中,W,H分别表示尺寸调整后的第一清晰样本图像的宽和高,表示第一清晰样本图像在位置(x,y)位置上的像素值;Iblurry表示第一模糊样本图像,G1(Iblurry)表示由样本去模糊生成的第二清晰样本图像;通过第一像素损失函数,可以表示第一样本清晰图像与第二清晰样本图像之间的差别。
从公式(1)可以知道,第一像素损失函数Lcontent1是关于去模糊生成函数G1中模型变量参数θG1的表达式。
终端设备获取与样本去模糊生成模型对应的样本去模糊判别模型,且样本去模糊生成模型和样本去模糊判别模型属于去模糊生成对抗网络。去模糊生成对抗网络由于包含样本去模糊生成模型和样本去模糊判别模型,因此训练时,是对上述两个模型交替迭代训练,在训练一个其中模型时,另一个模型的模型变量参数保持不变。
终端设备获取样本去模糊判别模型的模型函数,称为去模糊判别函数D1=hθD1(ID1)=θD1ID1,可以知道去模糊判别函数是用于判断清晰图像(例如,第二清晰样本图像)属于图像采集类型的概率,即判断清晰图像是真实的图像的概率。去模糊判别函数D1包括模型变量参数θD1和输入参数ID1
终端设备根据下述公式(2),确定去模糊判别损失函数LRDBL-D
其中,是第一清晰样本图像,Isharp表示第二清晰样本图像,函数C1是去模糊判别函数D1中激活函数之前的函数表达式,E表示期望,当有多个样本图像一起参与训练时,用于求概率的平均值。
从公式(2)可以看出,去模糊判别损失函数LRDBL-D是关于去模糊判别函数D1中模型变量参数θD1的表达式。
终端设备根据下述公式(3),确定去模糊生成损失函数LRDBL-G
LRDBL-G=-[log(-E(C1(G1(Iblurry))))+log(1-D1(G1(Iblurry)))] (3)
其中,Iblurry表示第一模糊样本图像,函数C1是去模糊判别函数D1中激活函数之前的函数表达式,此时该函数的模型变量参数是已知量,去模糊判别函数D1中的模型变量参数θD1也是已知量。
从公式(2)可以看出,去模糊生成损失函数LRDBL-G是关于去模糊生成函数G1中模型变量参数θG1的表达式。
终端设备可以将去模糊判别损失函数和去模糊生成损失函数组合为相对去模糊损失函数LRDBL
相对去模糊损失函数LRDBL可以拆分为去模糊生成模型对应的去模糊生成损失函数LRDBL-G,以及去模糊判别模型对应的去模糊判别损失函数LRDBL-D
终端设备可以将相对去模糊损失函数LRDBL以及第一像素损失函数Lcontent1组合为第一损失函数Lloss1
Lloss1=Lcontent1+αLRDBL (5)
其中,α是权重系数,经过多次试验证明,α取值为0.2时,模型训练效果较好。
公式(1)的损失函数以及公式(3)的损失函数可以保证由样本去模糊生成模型生成的第二清晰样本图像的数据分布与第一清晰样本图像的数据分布尽可能接近;公式(2)的损失函数可以保证由样本去模糊生成模型生成的第二清晰样本图尽可能的真实。
由于两个模型是交替迭代训练,首先训练样本去模糊生成模型:根据公式(2)、公式(5),以及梯度下降规则,计算损失函数αLRDBL-D最小时,去模糊判别函数D1中模型变量参数θD1的取值,根据计算出来的模型变量参数θD1的取值,更新去模糊判别函数D1中的模型变量参数;也等价于根据计算出来的型变量参数θD1的取值,更新样本去模糊判别模型中的模型变量参数。
训练完样本去模糊判别模型后,接着训练样本去模糊生成模型,此时样本去模糊判别模型中的模型变量参数θD1的取值保持不变,根据公式(5)、公式(3)以及公式(1),以及梯度下降规则,计算损失函数(Lcontent1+αLRDBL-G),最小时,去模糊生成函数G1中模型变量参数θG1的取值,根据计算出来的模型变量参数θG1的取值,更新去模糊生成函数G1中的模型变量参数;也等价于根据计算出来的模型变量参数θG1的取值,更新样本去模糊生成模型中的模型变量参数。
终端设备可以将训练时计算出来的模型变量参数θD1的取值以及模型变量参数θG1的取值确定为第一目标参数值,即是根据第一目标参数值中的模型变量参数θD1的取值更新去模糊判别函数D1中的模型变量参数,根据根据第一目标参数值中的模型变量参数θG1的取值更新去模糊生成函数G1中的模型变量参数。
上述描述了1次训练样本去模糊生成模型的过程,当训练次数达到次数阈值,或者当训练后的样本去模糊生成模型的模型变量参数与训练前的样本去模糊模型变量参数之间的差异量小于差异阈值,说明训练后的样本去模糊生成模型达到模型收敛条件,此时可以停止训练,并将训练后的样本去模糊生成模型作为去模糊生成模型(如上述图2b对应实施例中的去模糊模型20e),该去模糊生成模型是用于将模糊图像转换为清晰图像。
上述步骤S203详细描述了如何训练样本去模糊生成模型,以得到用于将模糊图像转换为清晰图像的去模糊生成模型,下面将描述如何训练样本模糊生成模型,以得到用于将清晰图像转换为模糊图像的模糊生成模型。
终端设备获取用于模型训练的模糊样本图像,作为基准模糊样本图像(如上述图2a对应实施例中的样本模糊图像20g),其中基准模糊样本图像属于图像采集类型,即基准模糊样本图像是真实图像。
终端设备获取样本模糊生成模型的模型函数,称为模糊生成函数G2=hθG2(IG2)=θG2IG2,可以知道模糊生成函数是用于调整清晰图像的模糊度,使得清晰图像调整后为模糊图像。模糊生成函数包括模型变量参数θG2和输入参数IG2,根据下述公式(6)确定第二像素损失函数Lcontent2
其中,W,H分别表示尺寸调整后的第一清晰样本图像的宽和高,表示第一清晰样本图像在位置(x,y)位置上的像素值;G1是样本去模糊生成模型对应的去模糊生成函数,此时,去模糊生成函数中的模型变量参数θG1是已知量。
从公式(6)可以知道,第二像素损失函数Lcontent2是关于模糊生成函数G2中模型变量参数θG2的表达式。
终端设备获取与样本模糊生成模型对应的样本模糊判别模型,且样本模糊生成模型和样本模糊判别模型属于模糊生成对抗网络。模糊生成对抗网络由于包含样本模糊生成模型和样本模糊判别模型,因此训练时,是对上述两个模型交替迭代训练,在训练一个其中模型时,另一个模型的模型变量参数保持不变。
终端设备获取样本模糊判别模型的模型函数,称为模糊判别函数D2=hθD2(ID2)=θD2ID2,可以知道模糊判别函数是用于判断模糊图像(例如,第一模糊样本图像)属于图像采集类型的概率,即判断模糊图像是真实的图像的概率。模糊判别函数D2包括模型变量参数θD2和输入参数ID2
终端设备根据下述公式(7),确定模糊判别损失函数LRBL-D
其中,是基准模糊样本图像,Iblurry表示第一模糊样本图像,函数C2是模糊判别函数D2中激活函数之前的函数表达式,E表示期望,当有多个样本图像一起参与训练时,用于求概率的平均值。
从公式(7)可以看出,模糊判别损失函数LRBL-D是关于模糊判别函数D2中模型变量参数θD2的表达式。
终端设备根据下述公式(8),确定模糊生成损失函数LRBL-G
LRBL-G=-[log(-E(C2(G2(Isharp))))+log(1-D2(G2(Isharp)))] (8)
其中,Isharp表示第一清晰样本图像,函数C2是模糊判别函数D2中激活函数之前的函数表达式,此时该函数的模型变量参数是已知量,去模糊判别函数D2中的模型变量参数θD2也是已知量。
从公式(8)可以看出,模糊生成损失函数LRBL-G是关于模糊生成函数G2中模型变量参数θG2的表达式。
终端设备可以将模糊判别损失函数和模糊生成损失函数组合为相对模糊损失函数LRBL
相对模糊损失函数LRBL可以拆分为模糊生成模型对应的模糊生成损失函数LRBL-G,以及模糊判别模型对应的模糊判别损失函数LRBL-D
终端设备可以将相对模糊损失函数LRBL以及第二像素损失函数Lcontent2组合为第二损失函数Lloss2
Lloss2=Lcontent2+αLRBL (10)
其中,α是权重系数,经过多次试验证明,α取值为0.2时,模型训练效果较好。
公式(6)的损失函数可以保证由样本模糊生成模型生成的第一模糊样本图像去模糊后得到的第二清晰样本图像的数据分布与第一清晰样本图像的数据分布尽可能接近;公式(7)的损失函数可以保证由样本模糊生成模型生成的第一模糊样本图尽可能的真实;公式(8)的损失函数可以保证由样本模糊生成模型生成的第一模糊样本图像的数据分布与基准模糊样本图像的数据分布尽可能的接近。
由于两个模型是交替迭代训练,首先训练样本模糊生成模型:根据公式(7)、公式(10),以及梯度下降规则,计算损失函数αLRBL-D最小时,模糊判别函数D2中模型变量参数θD2的取值,根据计算出来的模型变量参数θD2的取值,更新模糊判别函数D2中的模型变量参数;也等价于根据计算出来的型变量参数θD2的取值,更新样本模糊判别模型中的模型变量参数。
训练完样本模糊判别模型后,接着训练样本模糊生成模型,此时样本模糊判别模型中的模型变量参数θD2的取值保持不变,根据公式(10)、公式(8)以及公式(6),以及梯度下降规则,计算损失函数(Lcontent2+αLRBL-G),最小时,模糊生成函数G2中模型变量参数θG2的取值,根据计算出来的模型变量参数θG2的取值,更新模糊生成函数G2中的模型变量参数;也等价于根据计算出来的模型变量参数θG2的取值,更新样本模糊生成模型中的模型变量参数。
终端设备可以将训练时计算出来的模型变量参数θD2的取值以及模型变量参数θG2的取值确定为第二目标参数值,即是根据第二目标参数值中的模型变量参数θD2的取值更新模糊判别函数D2中的模型变量参数,根据根据第二目标参数值中的模型变量参数θG2的取值更新模糊生成函数G2中的模型变量参数。
上述描述了1次训练样本模糊生成模型的过程,当训练次数达到次数阈值,或者当训练后的样本模糊生成模型的模型变量参数与训练前的样本模糊模型变量参数之间的差异量小于差异阈值,说明训练后的样本模糊生成模型达到模型收敛条件,此时可以停止训练,并将训练后的样本模糊生成模型作为模糊生成模型,该模糊生成模型是用于将模糊图像转换为清晰图像,且模糊图像和清晰图像具有相同的图像内容。
总结训练样本模糊生成模型,以及训练样本去模糊生成模型的具体过程如下:真实的第一清晰样本图像输入样本模糊生成模型,得到模拟的第一模糊样本图像,在将第一模糊样本图像输入样本去模糊生成模型,得到模拟的第二清晰样本图像。由第一清晰样本图像、第一模糊样本图像以及第二清晰样本图像可以调整样本去模糊生成模型;由基准模糊样本图像、第一清晰样本图像、第一模糊样本图像以及第二清晰样本图像可以调整样本模糊生成模型;且基准模糊样本图像与第一清晰样本图像可以是不成对的图像,但第一清晰样本图像和第一模糊样本图像就是成对图像。换句话说,训练样本去模糊模型时,采用的是成对的清晰图像-模糊图像来训练,但模糊图像不是采集得到的,是由清晰图像和模型生成的。
需要说明的是,在训练过程中,训练样本去模糊生成模型和训练样本模糊生成模型的前后顺序没有限定,若样本模糊生成模型收敛,但样本去模糊生成模型未收敛,下一次可以只训练样本去模糊生成模型;当然,只要样本去模糊生成模型收敛,无论样本模糊生成模型是否收敛,样本模糊生成模型的训练都可以停止,这是因为后续使用过程中,只需要使用收敛的样本去模糊生成模型(即是去模糊生成模型)。
可选的,终端设备获取待去模糊的图像,称为待调整模糊图像,获取尺寸阈值,调整待调整模糊图像的图像尺寸,得到原始模糊图像,其中原始模糊图像的图像尺寸与尺寸阈值相同。
终端设备将原始模糊图像输入去模糊生成模型,去模糊生成模型调整原始模糊图像的清晰度,得到与原始模糊图像对应的清晰图像,称为目标清晰图像。
请参见图6,是本申请实施例提供的一种模型训练示意图,将真实清晰图和噪声图像融合后,输入样本模糊生成模型中,基于样本模糊生成模型,得到与真实清晰图对应的生成模糊图。将生成模糊图输入样本去模糊生成模型中,基于样本去模糊生成模型,得到与生成模糊图对应的生成清晰图。至此,前向传播完毕,下面进行反向调整样本去模糊生成模型的模型变量参数和调整样本模糊生成模型的模型变量参数。基于真实清晰图、生成清晰图以及生成模糊图,反向传播交替调整样本去模糊判别模型的模型变量参数和样本去模糊生成模型的模型变量参数;基于真实清晰图、生成模糊图、生成清晰图以及真实模糊图反向传播交替调整样本模糊判别模型的模型变量参数和样本模糊生成模型的模型变量参数。当调整次数达到次数阈值,或者样本去模糊生成模型达到模型收敛条件,终端设备可以将样本去模糊生成模型作为用于调整模糊图像清晰度的去模糊生成模型。
本申请在训练去模糊生成模型时,不需要通过成像设备采集成对的模糊图像-清晰图像作为模型训练的样本图像,而是由模糊生成模型自动生成与清晰图像成对的模糊图像;可以降低样本图像的采集难度,扩大样本图像的数量,通过大量样本训练得到的去模糊生成模型,可以准确重构出清晰图像,提高模糊图像去模糊后的视觉效果。
进一步的,请参见图7,是本申请实施例提供的一种图像处理装置的结构示意图。如图7所示,图像处理装置1可以应用于上述图3-图4对应实施例中的终端设备,图像处理装置1可以包括:第一获取模块11以及第一调整模块12。
第一获取模块11,用于获取原始模糊图像,获取去模糊生成模型;所述模糊生成模型包括顶部卷积层、第一卷积层和第二卷积层;
第一调整模块12,用于基于所述顶部卷积层中的卷积函数,对所述原始模糊图像进行卷积,得到输入模糊图像编码特征,基于所述第一卷积层中的卷积函数和激活函数,对所述输入模糊图像编码特征进行卷积,得到第一模糊图像编码特征,将所述输入模糊图像编码特征和所述第一模糊图像编码特征叠加为第二模糊图像编码特征,基于所述第二卷积层中的卷积函数和激活函数,对所述第二模糊图像编码特征进行卷积,得到与所述原始模糊图像对应的目标清晰图像;
第一调整模块12还用于:获取第一清晰样本图像,基于样本模糊生成模型调整所述第一清晰样本图像的模糊度,得到模糊样本图像,基于样本去模糊生成模型调整所述模糊样本图像的清晰度,得到第二清晰样本图像,根据所述第一清晰样本图像、所述模糊样本图像和所述第二清晰样本图像训练所述样本去模糊生成模型,得到所述去模糊生成模型。
其中,第一获取模块11、第一调整模块12的具体功能实现方式可以参见上述图3对应实施例中的步骤S101-步骤S105,这里不再进行赘述。
请参见图7,所述第一卷积层和所述第二卷积层属于N个第一编码层;所述N个第一编码层包括N-1个第二编码层;所述N-1个第二编码层是在所述N个
第一编码层中除位于底部的第一编码层以外的第一编码层;所述N是大于1的整数;
第二编码层Sj+1包括卷积激活单元Ck、卷积激活单元以及卷积激活单元Ck+2;所述j是大于0小于N-1的整数;所述k是大于0的整数;
所述卷积激活单元Ck的输入特征信息是所述第二编码层Sj的输出特征信息和所述第二编码层Sj的输入特征信息叠加后的特征信息;
所述卷积激活单元Ck+1的输入特征信息是所述卷积激活单元Ck的输出特征信息和所述卷积激活单元Ck的输入特征信息叠加后的特征信息;
所述卷积激活单元Ck+2的输入特征信息是所述卷积激活单元Ck+1的输出特征信息、所述卷积激活单元Ck+1的输入特征信息以及所述所述卷积激活单元Ck的输入特征信息叠加后的特征信息。
进一步的,请参见图8,是本申请实施例提供的另一种图像处理装置的结构示意图。如图8所示,图像处理装置1可以应用于上述图5-图6对应实施例中的终端设备,图像处理装置2可以包括:第二获取模块21、第一转换模块22、第二转换模块23以及第一训练模块24。
第二获取模块21,用于获取第一清晰样本图像;
第一转换模块22,用于基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像;
第二转换模块23,用于基于样本去模糊生成模型将所述第一模糊样本图像转换为第二清晰样本图像;
第一训练模块24,用于根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型。
其中,第二获取模块21、第一转换模块22、第二转换模块23以及第一训练模块24的具体功能实现方式可以参见上述图5对应实施例中的步骤S201-步骤S203,这里不再进行赘述。
请参见图8,第一训练模块24可以包括:第一获取单元241、第一生成单元242以及第一组合单元243。
第一获取单元241,用于获取与所述样本去模糊生成模型对应的去模糊生成函数,根据所述去模糊生成函数、所述第一清晰样本图像和所述第一模糊样本图像,确定第一像素损失函数;所述去模糊生成函数是用于调整模糊图像的清晰度;
第一生成单元242,用于根据所述去模糊生成函数、所述第一清晰样本图像、所述第二清晰样本图像以及所述第一模糊样本图像,确定相对去模糊损失函数;
第一组合单元243,用于将所述第一像素损失函数和所述相对去模糊损失函数组合为第一损失函数;
所述第一组合单元243,还用于基于梯度下降规则确定所述第一损失函数中模型变量参数的参数值,作为第一目标参数值;
所述第一组合单元243,还用于根据所述第一目标参数值更新所述去模糊生成函数中的模型变量参数;
所述第一组合单元243,还用于当训练次数达到次数阈值时,将模型变量参数更新后的样本去模糊生成模型确定为所述去模糊生成模型。
其中,第一获取单元241、第一生成单元242以及第一组合单元243的具体功能实现方式可以参见上述图5对应实施例中的步骤S203,这里不再进行赘述。
请参见图8,样本去模糊生成模型和样本去模糊判别模型属于去模糊生成对抗网络;
第一生成单元242可以包括:第一获取子单元2421以及第一确定子单元2422。
第一获取子单元2421,用于获取与所述样本去模糊判别模型对应的去模糊判别函数;所述去模糊判别函数是用于识别清晰图像属于图像采集类型的概率;
第一确定子单元2422,用于根据所述去模糊判别函数、所述第一清晰样本图像和所述第二清晰样本图像,确定去模糊判别损失函数;
所述第一确定子单元2422,还用于根据所述去模糊生成函数、所述去模糊判别函数、所述第一模糊样本图像,确定去模糊生成损失函数;
所述第一确定子单元2422,还用于将所述去模糊判别损失函数和所述去模糊生成损失函数组合为所述相对去模糊损失函数。
其中,第一获取子单元2421以及第一确定子单元2422的具体功能实现方式可以参见上述图5对应实施例中的步骤S203,这里不再进行赘述。
请参见图8,图像处理装置2可以包括:第二获取模块21、第一转换模块22、第二转换模块23以及第一训练模块24;还可以包括:第三获取模块25以及第二训练模块26。
第三获取模块25,用于获取基准模糊样本图像;
第二训练模块26,用于根据所述第一清晰样本图像、所述第一模糊样本图像、所述基准模糊样本图像以及所述去模糊生成函数训练所述样本模糊生成模型,得到用于将清晰图像转换为模糊图像的模糊生成模型。
其中,第三获取模块25以及第二训练模块26的具体功能实现方式可以参见上述图5对应实施例中的步骤S203,这里不再进行赘述。
请参见图8,第二训练模块26可以包括:第二获取单元261、第二生成单元262以及第二组合单元263。
第二获取单元261,用于获取与所述样本模糊生成模型对应的模糊生成函数;所述模糊生成函数是用于调整清晰图像的模糊度;
所述第二获取单元261,还用于根据所述模糊生成函数、所述去模糊生成函数以及所述第一清晰样本图像,确定第二像素损失函数;
第二生成单元262,用于根据所述模糊生成函数、所述第一清晰样本图像、所述第一模糊样本图像以及所述基准模糊样本图像,生成相对模糊损失函数;
第二组合单元263,用于将所述第二像素损失函数和所述相对模糊损失函数组合为第二损失函数;
所述第二组合单元263,还用于基于梯度下降规则确定所述第二损失函数中模型变量参数的参数值,作为第二目标参数值;
所述第二组合单元263,还用于根据所述第二目标参数值更新所述模糊生成函数中的模型变量参数;
所述第二组合单元263,还用于当训练次数达到所述次数阈值时,将模型变量参数更新后的样本模糊生成模型确定为所述模糊生成模型。
其中,第二获取单元261、第二生成单元262以及第二组合单元263的具体功能实现方式可以参见上述图5对应实施例中的步骤S203,这里不再进行赘述。
请参见图8,所述样本模糊生成模型和样本模糊判别模型属于模糊生成对抗网络;
第二生成单元262可以包括:第二获取子单元2621以及第二确定子单元2622。
第二获取子单元2621,用于获取与所述样本模糊判别模型对应的模糊判别函数;所述去模糊判别函数是用于识别模糊图像属于图像采集类型的概率;
第二确定子单元2622,用于根据所述模糊判别函数、所述基准模糊样本图像、所述第一模糊样本图像确定模糊判别损失函数;
所述第二确定子单元2622,还用于根据所述模糊生成函数、所述模糊判别函数、所述第一清晰样本图像,确定模糊生成损失函数;
所述第二确定子单元2622,还用于将所述模糊判别损失函数和所述模糊生成损失函数组合为所述相对模糊损失函数。
其中,第二获取子单元2621以及第二确定子单元2622的具体功能实现方式可以参见上述图5对应实施例中的步骤S203,这里不再进行赘述。
请参见图8,第一转换模块22可以包括:加权平均单元221以及转换单元222。
加权平均单元221,用于获取噪声图像,并将所述第一清晰样本图像的像素与所述噪声图像的像素进行加权平均,得到输入图像;
转换单元222,用于基于所述样本模糊生成模型将所述输入图像转换为所述第一模糊样本图像。
其中,加权平均单元221以及转换单元222的具体功能实现方式可以参见上述图5对应实施例中的步骤S201,这里不再进行赘述。
请参见图8,图像处理装置2可以包括:第二获取模块21、第一转换模块22、第二转换模块23以及第一训练模块24;还可以包括:第二调整模块27。
第二调整模块27,用于获取待调整模糊图像,获取尺寸阈值,根据所述尺寸阈值调整所述待调整模糊图像的图像尺寸,得到原始模糊图像;
所述第二调整模块27,还用于基于所述去模糊生成模型调整所述原始模糊图像的清晰度,得到与所述原始模糊图像对应的目标清晰图像。
其中,第二调整模块27的具体功能实现方式可以参见上述图5对应实施例中的步骤S203,这里不再进行赘述。
进一步地,请参见图9,是本发明实施例提供的一种电子设备的结构示意图。上述图3-图4对应实施例中的终端设备可以为电子设备1000,如图9所示,所述电子设备1000可以包括:用户接口1002、处理器1004、编码器1006以及存储器1008。信号接收器1016用于经由蜂窝接口1010、WIFI接口1012、...、或NFC接口1014接收或者发送数据。编码器1006将接收到的数据编码为计算机处理的数据格式。存储器1008中存储有计算机程序,处理器1004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。存储器1008可包括易失性存储器(例如,动态随机存取存储器DRAM),还可以包括非易失性存储器(例如,一次性可编程只读存储器OTPROM)。在一些实例中,存储器1008可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至电子设备1000。用户接口1002可以包括:键盘1018和显示器1020。
在图9所示的电子设备1000中,处理器1004可以用于调用存储器1008中存储计算机程序,以实现:
获取原始模糊图像,获取去模糊生成模型;所述模糊生成模型包括顶部卷积层、第一卷积层和第二卷积层;
基于所述顶部卷积层中的卷积函数,对所述原始模糊图像进行卷积,得到输入模糊图像编码特征;
基于所述第一卷积层中的卷积函数和激活函数,对所述输入模糊图像编码特征进行卷积,得到第一模糊图像编码特征;
将所述输入模糊图像编码特征和所述第一模糊图像编码特征叠加为第二模糊图像编码特征;
基于所述第二卷积层中的卷积函数和激活函数,对所述第二模糊图像编码特征进行卷积,得到与所述原始模糊图像对应的目标清晰图像。
在一个实施例中,处理器1004还执行以下步骤:
获取第一清晰样本图像;
基于样本模糊生成模型调整所述第一清晰样本图像的模糊度,得到模糊样本图像;
基于样本去模糊生成模型调整所述模糊样本图像的清晰度,得到第二清晰样本图像;
根据所述第一清晰样本图像、所述模糊样本图像和所述第二清晰样本图像训练所述样本去模糊生成模型,得到所述去模糊生成模型。
应当理解,本发明实施例中所描述的电子设备1000可执行前文图3到图4所对应实施例中对所述图像处理方法的描述,也可执行前文图7所对应实施例中对所述图像处理装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本发明实施例还提供了一种计算机存储介质,且所述计算机存储介质中存储有前文提及的图像处理装置1所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图3到图4所对应实施例中对所述图像处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节,请参照本发明方法实施例的描述。
进一步地,请参见图10,是本发明实施例提供的另一种电子设备的结构示意图。上述图5-图6对应实施例中的终端设备可以为电子设备2000,如图10所示,所述电子设备2000可以包括:用户接口2002、处理器2004、编码器2006以及存储器2008。信号接收器2016用于经由蜂窝接口2010、WIFI接口2012、...、或NFC接口2014接收或者发送数据。编码器2006将接收到的数据编码为计算机处理的数据格式。存储器2008中存储有计算机程序,处理器2004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。存储器2008可包括易失性存储器(例如,动态随机存取存储器DRAM),还可以包括非易失性存储器(例如,一次性可编程只读存储器OTPROM)。在一些实例中,存储器2008可进一步包括相对于处理器2004远程设置的存储器,这些远程存储器可以通过网络连接至电子设备2000。用户接口2002可以包括:键盘2018和显示器2020。
在图10所示的电子设备2000中,处理器2004可以用于调用存储器2008中存储计算机程序,以实现:
获取第一清晰样本图像,基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像;
基于样本去模糊生成模型将所述第一模糊样本图像转换为第二清晰样本图像;
根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型。
在一个实施例中,处理器2004在执行根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型时,具体执行以下步骤:
获取与所述样本去模糊生成模型对应的去模糊生成函数,根据所述去模糊生成函数、所述第一清晰样本图像和所述第一模糊样本图像,确定第一像素损失函数;所述去模糊生成函数是用于调整模糊图像的清晰度;
根据所述去模糊生成函数、所述第一清晰样本图像、所述第二清晰样本图像以及所述第一模糊样本图像,确定相对去模糊损失函数;
将所述第一像素损失函数和所述相对去模糊损失函数组合为第一损失函数;
基于梯度下降规则确定所述第一损失函数中模型变量参数的参数值,作为第一目标参数值;
根据所述第一目标参数值更新所述去模糊生成函数中的模型变量参数;
当训练次数达到次数阈值时,将模型变量参数更新后的样本去模糊生成模型确定为所述去模糊生成模型。
在一个实施例中,所述样本去模糊生成模型和样本去模糊判别模型属于去模糊生成对抗网络;
处理器2004在执行根据所述去模糊生成函数、所述第一清晰样本图像、所述第二清晰样本图像以及所述第一模糊样本图像,确定相对去模糊损失函数时,具体执行以下步骤:
获取与所述样本去模糊判别模型对应的去模糊判别函数;所述去模糊判别函数是用于识别清晰图像属于图像采集类型的概率;
根据所述去模糊判别函数、所述第一清晰样本图像和所述第二清晰样本图像,确定去模糊判别损失函数;
根据所述去模糊生成函数、所述去模糊判别函数、所述第一模糊样本图像,确定去模糊生成损失函数;
将所述去模糊判别损失函数和所述去模糊生成损失函数组合为所述相对去模糊损失函数。
在一个实施例中,处理器2004还执行以下步骤:
获取基准模糊样本图像;
根据所述第一清晰样本图像、所述第一模糊样本图像、所述基准模糊样本图像以及所述去模糊生成函数训练所述样本模糊生成模型,得到用于将清晰图像转换为模糊图像的模糊生成模型。
在一个实施例中,处理器2004在执行根据所述第一清晰样本图像、所述第一模糊样本图像、所述基准模糊样本图像以及所述去模糊生成函数训练所述样本模糊生成模型,得到用于将清晰图像转换为模糊图像的模糊生成模型时,具体执行以下步骤:
获取与所述样本模糊生成模型对应的模糊生成函数;所述模糊生成函数是用于调整清晰图像的模糊度;
根据所述模糊生成函数、所述去模糊生成函数以及所述第一清晰样本图像,确定第二像素损失函数;
根据所述模糊生成函数、所述第一清晰样本图像、所述第一模糊样本图像以及所述基准模糊样本图像,生成相对模糊损失函数;
将所述第二像素损失函数和所述相对模糊损失函数组合为第二损失函数;
基于梯度下降规则确定所述第二损失函数中模型变量参数的参数值,作为第二目标参数值;
根据所述第二目标参数值更新所述模糊生成函数中的模型变量参数;
当训练次数达到所述次数阈值时,将模型变量参数更新后的样本模糊生成模型确定为所述模糊生成模型。
在一个实施例中,样本模糊生成模型和样本模糊判别模型属于模糊生成对抗网络;
处理器2004在执行根据所述模糊生成函数、所述第一清晰样本图像、所述第一模糊样本图像以及所述基准模糊样本图像,生成相对模糊损失函数时,具体执行以下步骤:
获取与所述样本模糊判别模型对应的模糊判别函数;所述去模糊判别函数是用于识别模糊图像属于图像采集类型的概率;
根据所述模糊判别函数、所述基准模糊样本图像、所述第一模糊样本图像确定模糊判别损失函数;
根据所述模糊生成函数、所述模糊判别函数、所述第一清晰样本图像,确定模糊生成损失函数;
将所述模糊判别损失函数和所述模糊生成损失函数组合为所述相对模糊损失函数。
处理器2004在执行基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像时,具体执行以下步骤:
获取噪声图像;
将所述第一清晰样本图像的像素与所述噪声图像的像素进行加权平均,得到输入图像;
基于所述样本模糊生成模型将所述输入图像转换为所述第一模糊样本图像。
处理器2004还执行以下步骤:
获取待调整模糊图像,获取尺寸阈值,根据所述尺寸阈值调整所述待调整模糊图像的图像尺寸,得到原始模糊图像;
基于所述去模糊生成模型调整所述原始模糊图像的清晰度,得到与所述原始模糊图像对应的目标清晰图像。
应当理解,本发明实施例中所描述的电子设备2000可执行前文图5到图6所对应实施例中对所述图像处理方法的描述,也可执行前文图8所对应实施例中对所述图像处理装置2的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本发明实施例还提供了一种计算机存储介质,且所述计算机存储介质中存储有前文提及的图像处理装置2所执行的计算机程序,且所述计算机程序包括程序指令,当所述处理器执行所述程序指令时,能够执行前文图5到图6所对应实施例中对所述图像处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节,请参照本发明方法实施例的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (15)

1.一种图像处理方法,其特征在于,包括:
获取原始模糊图像,获取去模糊生成模型;所述模糊生成模型包括顶部卷积层、第一卷积层和第二卷积层;
基于所述顶部卷积层中的卷积函数,对所述原始模糊图像进行卷积,得到输入模糊图像编码特征;
基于所述第一卷积层中的卷积函数和激活函数,对所述输入模糊图像编码特征进行卷积,得到第一模糊图像编码特征;
将所述输入模糊图像编码特征和所述第一模糊图像编码特征叠加为第二模糊图像编码特征;
基于所述第二卷积层中的卷积函数和激活函数,对所述第二模糊图像编码特征进行卷积,得到与所述原始模糊图像对应的目标清晰图像。
2.根据权利要求1所述的方法,其特征在于,所述第一卷积层和所述第二卷积层属于N个第一编码层;所述N个第一编码层包括N-1个第二编码层;所述N-1个第二编码层是在所述N个第一编码层中除位于底部的第一编码层以外的第一编码层;所述N是大于1的整数;
第二编码层Sj+1包括卷积激活单元Ck、卷积激活单元以及卷积激活单元Ck+2;所述j是大于0小于N-1的整数;所述k是大于0的整数;
所述卷积激活单元Ck的输入特征信息是所述第二编码层Sj的输出特征信息和所述第二编码层Sj的输入特征信息叠加后的特征信息;
所述卷积激活单元Ck+1的输入特征信息是所述卷积激活单元Ck的输出特征信息和所述卷积激活单元Ck的输入特征信息叠加后的特征信息;
所述卷积激活单元Ck+2的输入特征信息是所述卷积激活单元Ck+1的输出特征信息、所述卷积激活单元Ck+1的输入特征信息以及所述所述卷积激活单元Ck的输入特征信息叠加后的特征信息。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取第一清晰样本图像;
基于样本模糊生成模型调整所述第一清晰样本图像的模糊度,得到模糊样本图像;
基于样本去模糊生成模型调整所述模糊样本图像的清晰度,得到第二清晰样本图像;
根据所述第一清晰样本图像、所述模糊样本图像和所述第二清晰样本图像训练所述样本去模糊生成模型,得到所述去模糊生成模型。
4.一种图像处理方法,其特征在于,包括:
获取第一清晰样本图像,基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像;
基于样本去模糊生成模型将所述第一模糊样本图像转换为第二清晰样本图像;
根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型,包括:
获取与所述样本去模糊生成模型对应的去模糊生成函数,根据所述去模糊生成函数、所述第一清晰样本图像和所述第一模糊样本图像,确定第一像素损失函数;所述去模糊生成函数是用于调整模糊图像的清晰度;
根据所述去模糊生成函数、所述第一清晰样本图像、所述第二清晰样本图像以及所述第一模糊样本图像,确定相对去模糊损失函数;
将所述第一像素损失函数和所述相对去模糊损失函数组合为第一损失函数;
基于梯度下降规则确定所述第一损失函数中模型变量参数的参数值,作为第一目标参数值;
根据所述第一目标参数值更新所述去模糊生成函数中的模型变量参数;
当训练次数达到次数阈值时,将模型变量参数更新后的样本去模糊生成模型确定为所述去模糊生成模型。
6.根据权利要求5所述的方法,其特征在于,所述样本去模糊生成模型和样本去模糊判别模型属于去模糊生成对抗网络;
所述根据所述去模糊生成函数、所述第一清晰样本图像、所述第二清晰样本图像以及所述第一模糊样本图像,确定相对去模糊损失函数,包括:
获取与所述样本去模糊判别模型对应的去模糊判别函数;所述去模糊判别函数是用于识别清晰图像属于图像采集类型的概率;
根据所述去模糊判别函数、所述第一清晰样本图像和所述第二清晰样本图像,确定去模糊判别损失函数;
根据所述去模糊生成函数、所述去模糊判别函数、所述第一模糊样本图像,确定去模糊生成损失函数;
将所述去模糊判别损失函数和所述去模糊生成损失函数组合为所述相对去模糊损失函数。
7.根据权利要求5所述的方法,其特征在于,还包括:
获取基准模糊样本图像;
根据所述第一清晰样本图像、所述第一模糊样本图像、所述基准模糊样本图像以及所述去模糊生成函数训练所述样本模糊生成模型,得到用于将清晰图像转换为模糊图像的模糊生成模型。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一清晰样本图像、所述第一模糊样本图像、所述基准模糊样本图像以及所述去模糊生成函数训练所述样本模糊生成模型,得到用于将清晰图像转换为模糊图像的模糊生成模型,包括:
获取与所述样本模糊生成模型对应的模糊生成函数;所述模糊生成函数是用于调整清晰图像的模糊度;
根据所述模糊生成函数、所述去模糊生成函数以及所述第一清晰样本图像,确定第二像素损失函数;
根据所述模糊生成函数、所述第一清晰样本图像、所述第一模糊样本图像以及所述基准模糊样本图像,生成相对模糊损失函数;
将所述第二像素损失函数和所述相对模糊损失函数组合为第二损失函数;
基于梯度下降规则确定所述第二损失函数中模型变量参数的参数值,作为第二目标参数值;
根据所述第二目标参数值更新所述模糊生成函数中的模型变量参数;
当训练次数达到所述次数阈值时,将模型变量参数更新后的样本模糊生成模型确定为所述模糊生成模型。
9.根据权利要求8所述的方法,其特征在于,所述样本模糊生成模型和样本模糊判别模型属于模糊生成对抗网络;
所述根据所述模糊生成函数、所述第一清晰样本图像、所述第一模糊样本图像以及所述基准模糊样本图像,生成相对模糊损失函数,包括:
获取与所述样本模糊判别模型对应的模糊判别函数;所述去模糊判别函数是用于识别模糊图像属于图像采集类型的概率;
根据所述模糊判别函数、所述基准模糊样本图像、所述第一模糊样本图像确定模糊判别损失函数;
根据所述模糊生成函数、所述模糊判别函数、所述第一清晰样本图像,确定模糊生成损失函数;
将所述模糊判别损失函数和所述模糊生成损失函数组合为所述相对模糊损失函数。
10.根据权利要求4所述的方法,其特征在于,所述基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像,包括:
获取噪声图像;
将所述第一清晰样本图像的像素与所述噪声图像的像素进行加权平均,得到输入图像;
基于所述样本模糊生成模型将所述输入图像转换为所述第一模糊样本图像。
11.根据权利要求4所述的方法,其特征在于,还包括:
获取待调整模糊图像,获取尺寸阈值,根据所述尺寸阈值调整所述待调整模糊图像的图像尺寸,得到原始模糊图像;
基于所述去模糊生成模型调整所述原始模糊图像的清晰度,得到与所述原始模糊图像对应的目标清晰图像。
12.一种图像处理装置,其特征在于,包括:
第一获取模块,用于获取原始模糊图像,获取去模糊生成模型;
第一调整模块,用于基于所述去模糊生成模型调整所述原始模糊图像的清晰度,得到与所述原始模糊图像对应的目标清晰图像;
所述去模糊生成模型是由清晰样本图像、以及与所述清晰样本图像具有相同图像内容的模糊样本图像训练样本去模糊生成模型后得到的;所述模糊样本图像是根据所述清晰样本图像和模糊生成模型所生成的;所述模糊生成模型是根据所述清晰样本图像和基准模糊图像训练样本模糊生成模型后得到的。
13.一种图像处理装置,其特征在于,包括:
第二获取模块,用于获取第一清晰样本图像;
第一转换模块,用于基于样本模糊生成模型将所述第一清晰样本图像转换为第一模糊样本图像;
第二转换模块,用于基于样本去模糊生成模型将所述第一模糊样本图像转换为第二清晰样本图像;
第一训练模块,用于根据所述第一清晰样本图像、所述第一模糊样本图像以及所述第二清晰样本图像训练所述样本去模糊生成模型,得到用于将模糊图像调整为清晰图像的去模糊生成模型。
14.一种电子设备,其特征在于,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以执行如权利要求1-11任一项所述的方法。
15.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-11任一项所述的方法。
CN201910842646.7A 2019-09-06 2019-09-06 一种图像处理方法、装置、电子设置以及存储介质 Active CN110570375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910842646.7A CN110570375B (zh) 2019-09-06 2019-09-06 一种图像处理方法、装置、电子设置以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910842646.7A CN110570375B (zh) 2019-09-06 2019-09-06 一种图像处理方法、装置、电子设置以及存储介质

Publications (2)

Publication Number Publication Date
CN110570375A true CN110570375A (zh) 2019-12-13
CN110570375B CN110570375B (zh) 2022-12-09

Family

ID=68778201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910842646.7A Active CN110570375B (zh) 2019-09-06 2019-09-06 一种图像处理方法、装置、电子设置以及存储介质

Country Status (1)

Country Link
CN (1) CN110570375B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112634163A (zh) * 2020-12-29 2021-04-09 南京大学 基于改进型循环生成对抗网络去图像运动模糊方法
WO2022100490A1 (en) * 2020-11-16 2022-05-19 Huawei Technologies Co.,Ltd. Methods and systems for deblurring blurry images
CN115439375A (zh) * 2022-11-02 2022-12-06 国仪量子(合肥)技术有限公司 图像去模糊模型的训练方法和装置以及应用方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108416752A (zh) * 2018-03-12 2018-08-17 中山大学 一种基于生成式对抗网络进行图像去运动模糊的方法
CN109410146A (zh) * 2018-11-02 2019-03-01 北京大学深圳研究生院 一种基于Bi-Skip-Net的图像去模糊算法
CN109712092A (zh) * 2018-12-18 2019-05-03 上海中信信息发展股份有限公司 档案扫描图像修复方法、装置及电子设备
CN109727201A (zh) * 2017-10-30 2019-05-07 富士通株式会社 信息处理设备、图像处理方法以及存储介质
US20190213719A1 (en) * 2018-01-10 2019-07-11 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and storage medium
CN110136075A (zh) * 2019-04-18 2019-08-16 中国地质大学(武汉) 一种基于边缘锐化循环生成对抗网络的遥感影像去雾方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109727201A (zh) * 2017-10-30 2019-05-07 富士通株式会社 信息处理设备、图像处理方法以及存储介质
US20190213719A1 (en) * 2018-01-10 2019-07-11 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and storage medium
CN108416752A (zh) * 2018-03-12 2018-08-17 中山大学 一种基于生成式对抗网络进行图像去运动模糊的方法
CN109410146A (zh) * 2018-11-02 2019-03-01 北京大学深圳研究生院 一种基于Bi-Skip-Net的图像去模糊算法
CN109712092A (zh) * 2018-12-18 2019-05-03 上海中信信息发展股份有限公司 档案扫描图像修复方法、装置及电子设备
CN110136075A (zh) * 2019-04-18 2019-08-16 中国地质大学(武汉) 一种基于边缘锐化循环生成对抗网络的遥感影像去雾方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
KAIHAO ZHANG 等: "Deblurring by Realistic Blurring", 《ARXIV》 *
OREST KUPYN 等: "DeblurGAN-v2: Deblurring (Orders-of-Magnitude) Faster and Better", 《ARXIV》 *
QUAN YUAN 等: "Blind Motion Deblurring with Cycle Generative Adversarial Networks", 《ARXIV》 *
张云飞: "基于生成对抗网络的模糊图像复原研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
高媛 等: "基于深度残差生成对抗网络的医学影像超分辨率算法", 《计算机应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022100490A1 (en) * 2020-11-16 2022-05-19 Huawei Technologies Co.,Ltd. Methods and systems for deblurring blurry images
US11741579B2 (en) 2020-11-16 2023-08-29 Huawei Technologies Co., Ltd. Methods and systems for deblurring blurry images
CN112634163A (zh) * 2020-12-29 2021-04-09 南京大学 基于改进型循环生成对抗网络去图像运动模糊方法
CN115439375A (zh) * 2022-11-02 2022-12-06 国仪量子(合肥)技术有限公司 图像去模糊模型的训练方法和装置以及应用方法和装置

Also Published As

Publication number Publication date
CN110570375B (zh) 2022-12-09

Similar Documents

Publication Publication Date Title
CN111340711B (zh) 一种超分辨率重建方法、装置、设备和存储介质
CN113240580A (zh) 一种基于多维度知识蒸馏的轻量级图像超分辨率重建方法
CN113592736B (zh) 一种基于融合注意力机制的半监督图像去模糊方法
CN112541864A (zh) 一种基于多尺度生成式对抗网络模型的图像修复方法
CN112541877B (zh) 基于条件生成对抗网络的去模糊方法、系统、设备及介质
CN110570375B (zh) 一种图像处理方法、装置、电子设置以及存储介质
CN111488865A (zh) 图像优化方法、装置、计算机存储介质以及电子设备
CN111861894B (zh) 基于生成式对抗网络的图像去运动模糊方法
CN111695421B (zh) 图像识别方法、装置及电子设备
CN108629753A (zh) 一种基于循环神经网络的人脸图像恢复方法及装置
CN114332578A (zh) 图像异常检测模型训练方法、图像异常检测方法和装置
CN114339409B (zh) 视频处理方法、装置、计算机设备及存储介质
CN111047543A (zh) 图像增强方法、装置和存储介质
CN110807757A (zh) 基于人工智能的图像质量评估方法、装置及计算机设备
CN112581370A (zh) 人脸图像的超分辨率重建模型的训练及重建方法
CN113066034A (zh) 人脸图像的修复方法与装置、修复模型、介质和设备
CN112509144A (zh) 人脸图像处理方法、装置、电子设备及存储介质
CN113763268A (zh) 人脸图像盲修复方法及系统
CN113628139A (zh) 一种基于生成对抗网络的模糊图像复原方法及系统
CN116977200A (zh) 视频去噪模型的处理方法、装置、计算机设备和存储介质
CN111597847A (zh) 一种二维码识别方法、装置、设备及可读存储介质
CN113920023A (zh) 图像处理方法及装置、计算机可读介质和电子设备
She et al. Facial image inpainting algorithm based on attention mechanism and dual discriminators
CN108665455B (zh) 图像显著性预测结果的评价方法和装置
CN116977195A (zh) 复原模型的调整方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40018733

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant