CN108876745B - 图像处理方法及装置 - Google Patents
图像处理方法及装置 Download PDFInfo
- Publication number
- CN108876745B CN108876745B CN201810679695.9A CN201810679695A CN108876745B CN 108876745 B CN108876745 B CN 108876745B CN 201810679695 A CN201810679695 A CN 201810679695A CN 108876745 B CN108876745 B CN 108876745B
- Authority
- CN
- China
- Prior art keywords
- image
- enhanced
- enhanced image
- image processing
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 90
- 238000012545 processing Methods 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000004364 calculation method Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims description 12
- 230000002708 enhancing effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 34
- 230000000694 effects Effects 0.000 abstract description 11
- 230000000007 visual effect Effects 0.000 abstract description 10
- 238000013135 deep learning Methods 0.000 abstract description 6
- 230000007704 transition Effects 0.000 abstract description 6
- 238000013527 convolutional neural network Methods 0.000 description 38
- 238000010586 diagram Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G06T5/73—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Abstract
本申请实施例提供一种图像处理方法及装置。该方法包括:获取训练样本集,所述训练样本集包括多个原始图像样本和对应的增强图像样本;基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型;基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像;获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像。由此,本申请结合深度学习和拟合函数对图像进行增强处理,能够根据不同场景给予图像合适的增强效果,从而达到用户预期视觉效果,大大改善了传统方案中图像增强效果单一、容易出现颜色不自然、色块、色偏、过渡不自然等问题。
Description
技术领域
本申请涉及深度学习领域,具体而言,涉及一种图像处理方法及装置。
背景技术
图像增强是一种提升图像视觉效果的方法,通常来说,图像增强是指调整图像的亮暗、饱和度和对比度。当前,互联网上传播的大量图片的视觉效果都较差,互联网用户经常很难找到图像内容和图像色彩都较佳的图片。另一方面,手机拍照也成了大部分人的一种记录生活的方式,但手机拍摄的照片往往很难满足用户的视觉需求。
发明内容
为了克服现有技术中的上述不足,本申请的目的在于提供一种图像处理方法及装置,以解决或者改善上述问题。
为了实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供一种图像处理方法,应用于电子设备,所述方法包括:
获取训练样本集,所述训练样本集包括多个原始图像样本和对应的增强图像样本;
基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型;
基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像;
获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像。
可选地,所述获取训练样本集的步骤,包括:
获取各种场景下的多个原始图像样本;
响应用户操作,对每个所述原始图像样本的图像参数进行图像增强,生成图像增强后的增强图像样本。
可选地,所述基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型的步骤,包括:
对所述训练样本集进行图像处理,得到预设数量个目标尺寸的原始图像和对应的增强图像;
将所述预设数量个目标尺寸的原始图像输入到预先构建的CNN图像处理网络中,得到与各个原始图像对应的输出图像;
计算输出图像和增强图像之间的loss值;
基于所述loss值对所述CNN图像处理网络进行训练,并在训练过程中更新所述CNN图像处理网络的网络参数;
判断所述CNN图像处理网络是否达到训练收敛条件,在达到训练收敛条件时,输出对应的图像增强模型。
可选地,所述对所述训练样本集进行图像处理,得到预设数量个目标尺寸的原始图像和对应的增强图像的步骤,包括:
从所述训练样本集中选取预设数量个原始图像样本和对应的预设数量个增强图像样本;
针对选取出的每个原始图像样本和对应的预设数量个增强图像样本,在该原始图像样本和对应的增强图像样本中的相同位置处随机裁剪目标尺寸的图像,以得到预设数量个目标尺寸的原始图像和对应的增强图像。
可选地,所述计算输出图像和增强图像之间的loss值的步骤,包括:
分别计算所述输出图像和增强图像之间的color_loss值以及vgg_loss值;
基于所述color_loss值以及所述vgg_loss值的权重分别对所述color_loss值以及所述vgg_loss值进行数据处理,得到输出图像和增强图像之间的loss值。
可选地,所述分别计算所述输出图像和增强图像之间的color_loss值以及vgg_loss值的步骤,包括:
利用均值模糊方法对所述输出图像和所述增强图像进行模糊处理,并计算模糊处理后的输出图像和增强图像的均值误差值,得到color_loss值;
将所述输出图像和所述增强图像经过所述CNN图像处理网络在同一个层输出的特征图进行误差计算,得到vgg_loss值。
可选地,所述判断所述CNN图像处理网络是否达到训练收敛条件的步骤,包括:
判断所述loss值的变化值是否小于预设值;
若所述loss值的变化值小于预设值,则判定所述CNN图像处理网络达到训练收敛条件,否则判定所述CNN图像处理网络未达到训练收敛条件。
可选地,所述获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中,得到最终增强图像的步骤,包括:
获取所述初步增强图像在Photoshop中曲线的坐标图;
对所述坐标图进行尺寸调整,得到调整后的坐标图;
从所述调整后的坐标图中选取多个坐标点,并对所述多个坐标点进行调整,得到调整后的多个坐标点,所述调整后的多个坐标点作为多项式拟合点;
将所述多项式拟合点输入到多项式拟合工具中,得到对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中,得到最终增强图像。
可选地,在所述基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型的步骤之前,所述方法还包括:
构建所述CNN图像处理网络。
第二方面,本申请实施例还提供一种图像处理装置,应用于电子设备,所述装置包括:
获取模块,用于获取训练样本集,所述训练样本集包括多个原始图像样本和对应的增强图像样本;
训练模块,用于基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型;
图像增强模块,用于基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像;
拟合计算模块,用于获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像。
第三方面,本申请实施例还提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被执行时实现上述的图像处理方法。
相对于现有技术而言,本申请具有以下有益效果:
本申请实施例提供的图像处理方法及装置,首先,获取训练样本集,所述训练样本集包括多个原始图像样本和对应的增强图像样本。接着,基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型。而后,基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像。最后,获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像。由此,本申请结合深度学习和拟合函数对图像进行增强处理,能够根据不同场景给予图像合适的增强效果,从而达到用户预期视觉效果,大大改善了传统方案中图像增强效果单一、容易出现颜色不自然、色块、色偏、过渡不自然等问题。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1为本申请实施例提供的图像处理方法的流程示意图;
图2为图1中所示的步骤S220包括的各个子步骤的流程示意图;
图3为本申请实施例提供的图像处理装置的功能模块图;
图4为本申请实施例提供的电子设备的结构示意框图。
图标:100-电子设备;110-总线;120-处理器;130-存储介质;140-总线接口;150-网络适配器;160-用户接口;200-图像处理装置;210-获取模块;220-训练模块;230-图像增强模块;240-拟合计算模块。
具体实施方式
图像增强是一种提升图像视觉效果的方法,通常来说,图像增强是指调整图像的亮暗、饱和度和对比度。当前,互联网上传播的大量图片的视觉效果都较差,互联网用户经常很难找到图像内容和图像色彩都较佳的图片。另一方面,手机拍照也成了大部分人的一种记录生活的方式,但手机拍摄的照片往往很难满足用户的视觉需求。
发明人在实现本申请技术方案的过程中发现,当前大部分图像增强算法都是使用固定的参数值来调整图像中的各个通道的像素值,甚至用固定的参数来调整三个通道(RGB通道)的像素值。但是这类方法效果单一,容易出现颜色不自然、色块、色偏、过渡不自然等问题,因为有这些问题的存在,这类方法较难利用到实际产品中。此外,虽然有小部分图像增强算法利用卷积神经网络来改善增强效果,其在某些方面尽管优于传统算法,但是基本还处于研究阶段,而且带来了新的问题:容易出现过渡不自然、色偏等问题。
以上现有技术中的方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请实施例针对上述问题所提出的解决方案,都应该是发明人在本申请过程中对本申请做出的贡献。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
请参阅图1,为本申请实施例提供的图像处理方法的一种流程示意图。所应说明的是,本申请实施例提供的图像处理方法不以图1及以下所述的具体顺序为限制。所述方法的具体流程如下:
步骤S210,获取训练样本集。
作为一种实施方式,首先可以获取各种场景下的多个原始图像样本,所述原始图像样本可以是从网页上下载的图像,也可以是由专业相机拍摄的图像等。例如,单反相机拍出的照片噪点少、细节信息丰富,因此本实施例可以使用单反相机拍摄各种场景,获取多张高质量的原始图像样本。
接着,响应用户操作,对每个所述原始图像样本的图像参数进行图像增强,生成图像增强后的增强图像样本。例如,可以通过专业的特效设计师来调整每张原始图像样本,得到图像增强后的增强图像样本,使得增强图像样本具又有比较好的明暗和饱和度。
本实施例中,所述训练样本集即包括上述的多个原始图像样本和对应的增强图像样本。
步骤S220,基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型。
详细地,在对所述步骤S220之前,还需要构建所述CNN图像增强网络,本实施例构建的所述CNN图像增强网络的具体结构如表1所示:
表1
在表1中,凡带_ConX_ReLU的表示卷积层操作后会进行ReLU激活操作,凡带_Skip_LayerX_LayerY的表示LayerX层的输出(激活后的输出)会和LayerY层的输出(激活后的输出)进行相加操作。
请进一步参阅图2,在上述基础上,作为一种实施方式,所述步骤S220可以通过如下子步骤实现:
子步骤S221,对所述训练样本集进行图像处理,得到预设数量个目标尺寸的原始图像和对应的增强图像。
本实施例中,首先,从所述训练样本集中选取预设数量个原始图像样本和对应的预设数量个增强图像样本。接着,针对选取出的每个原始图像样本和对应的预设数量个增强图像样本,在该原始图像样本和对应的增强图像样本中的相同位置处随机裁剪目标尺寸的图像,以得到预设数量个目标尺寸的原始图像和对应的增强图像。例如,所述预设数量可以为16,所述目标尺寸可以为100*100。也即,从所述训练样本集中选取16个原始图像样本和对应的16个增强图像样本,接着,从每个原始图像样本的任意位置裁剪出100*100的图像,同时从每个增强图像样本的对应位置也裁剪出100*100的图像,由此得到16个100*100的原始图像和16个对应的100*100的增强图像。
子步骤S222,将所述预设数量个目标尺寸的原始图像输入到预先构建的CNN图像增强网络中,得到与各个原始图像对应的输出图像。
本实施例中,将上述的16个100*100的原始图像输入到上述构建的CNN图像增强网络中,可以得到与16个100*100的原始图像对应的16个输出图像。
子步骤S223,计算输出图像和增强图像之间的loss值。
可选地,首先,分别计算所述输出图像和增强图像之间的color_loss值以及vgg_loss值。
示例性地,可以利用均值模糊方法对所述输出图像和所述增强图像进行模糊处理,并计算模糊处理后的输出图像和增强图像的均值误差值,得到color_loss值。通过利用均值模糊方法对所述输出图像和所述增强图像进行模糊处理,以此来消除高频信息的干扰,而让网络更多地学习颜色信息。在实际实现中,可以用CNN图像增强网络中的均值池化层并设置stride为1来实现end2end的训练,从而对模糊处理后的输出图像和增强图像进行l2loss(也即Mean Square Error Loss)以得到所述color_loss值。
进一步地,将所述输出图像和所述增强图像经过所述CNN图像增强网络在同一个层输出的特征图进行误差计算,得到vgg_loss值。其中,vgg_loss是一种语义类型的loss,可以更好地生成语义信息。示例性地,本实施例可以使用vgg19作为生成不同层特征图(feature map)的网络结构,同时使用在ImageNet数据集上训练好的网络参数初始化vgg19网络。所述输出图像和所述增强图像经过vgg19网络在同一个层输出的特征图上进行l2loss以得到vgg_loss值。
在得到所述color_loss值以及所述vgg_loss值后,可以基于所述color_loss值以及所述vgg_loss值的权重分别对所述color_loss值以及所述vgg_loss值进行数据处理,得到输出图像和增强图像之间的loss值。所述color_loss值以及所述vgg_loss值的权重可以可以预先设置,当权重设置好后,在后续的训练过程中不会再发生改变。例如,可以设置color_loss值、vgg_loss值和texture_loss值的权重分别为10.0和1.0,那么则分别使所述color_loss值以及所述vgg_loss值乘以10.0和1.0以得到总的loss值。
子步骤S224,基于所述loss值对所述CNN图像增强网络进行训练,并在训练过程中更新所述CNN图像增强网络的网络参数。
本实施例中,在得到所述loss值后,基于该loss值监督所述CNN图像增强网络的训练并更新网络参数。
子步骤S225,判断所述CNN图像处理网络是否达到训练收敛条件,在达到训练收敛条件时,输出对应的图像增强模型。
作为一种实施方式,判断所述CNN图像增强网络是否达到训练收敛条件的方式可以是:判断所述loss值的变化值是否小于预设值,若所述loss值的变化值小于预设值,则判定所述CNN图像增强网络达到训练收敛条件,否则判定所述CNN图像增强网络未达到训练收敛条件。所述预设值可以根据实际需求进行设置,例如所述预设值可以设置为接近0的数值,或者也可以设置为0,如果所述预设值为0,则所述loss值不产生变化时,判定所述CNN图像增强网络达到训练收敛条件,否则判定所述CNN图像增强网络未达到训练收敛条件。若所述CNN图像增强网络未达到训练收敛条件,则重复上述步骤继续进行训练。
当然,所述训练收敛条件也可以不仅限于上述条件,在其它实施方式中,所述训练收敛条件还可以是迭代次数达到预定次数(例如100次)等。
当所述CNN图像增强网络达到训练收敛条件时,更新所述述CNN图像增强网络的网络参数,从而输出对应的图像增强模型。所述图像增强模型可以对输入的图像进行图像增强。
步骤S230,基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像。
本实施例中,在接收到待处理图像后,可将所述待处理图像输入到所述图像增强模型中,得到该待处理图像对应的增强图像。例如,用户将手机拍摄的图像作为待处理图像,输入到训练好的所述图像增强模型中,再经过网络的层层计算得到对应的初步增强图像,所述对应的初步增强图像即为图像初步增强后的结果。
步骤S240,获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像。
由于上述的初步增强图像还存在过亮、偏灰等问题,本实施例还需要结合拟合函数对上述的初步增强图像进行进一步处理,作为一种实施方式,所述步骤S240可以通过如下方式实现:
首先,获取所述初步增强图像在Photoshop中曲线的坐标图。例如,可以用Photoshop打开所述初步增强图像,调整好曲线,并用截图的方式获取曲线的xy坐标图。
接着,对所述坐标图进行尺寸调整,得到调整后的坐标图。例如,可以将所述坐标图调整为256*256大小。
接着,从所述调整后的坐标图中选取多个坐标点,并对所述多个坐标点进行调整,得到调整后的多个坐标点,所述调整后的多个坐标点作为多项式拟合点。例如,从所述调整后的坐标图中可以选取坐标点(2,255)、(70,195)、(110,152)、(197,55)、(256,1),然后将这些点转换为xy坐标点,用(1,256)减去上述坐标点,并取绝对值,这样可以得到xy坐标点(1,1)、(69,61)、(109,104)、(196,201)、(255,255)。
最后,将所述多项式拟合点输入到多项式拟合工具中,得到对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中,得到最终增强图像。例如,可以选取一个多项式拟合工具,例如可以选用常见的在线拟合工具,输入上述的拟合点,拟合曲线,得到拟合函数F(x)=-5.943341119210896e-9*x*x*x*x-0.00000530591867894599*x*x*x+0.002878201315494426*x*x+0.7084928955807155*x+0.28863421496581015。而后,将所述初步增强图像输入到所述拟合函数F(x)中,得到最终增强图像。
基于上述设计,本实施例结合深度学习和拟合函数对图像进行增强处理,不仅很好地发挥了深度学习强大的学习能力,能学习到训练样本集中多变的增强效果,同时也发挥了传统算法直接微调效果的优势,具有直接、快速的优点。由此,能够根据不同场景给予图像合适的增强效果,从而达到用户预期视觉效果,大大改善了传统方案中图像增强效果单一、容易出现颜色不自然、色块、色偏、过渡不自然等问题。
进一步地,请参阅图3,本申请实施例还提供一种图像处理装置200,所述装置可以包括:
获取模块210,用于获取训练样本集,所述训练样本集包括多个原始图像样本和对应的增强图像样本。
训练模块220,用于基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型。
图像增强模块230,用于基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像。
拟合计算模块240,用于获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像。
可以理解的是,本实施例中的各功能模块的具体操作方法可参照上述方法实施例中相应步骤的详细描述,在此不再重复赘述。
进一步地,请参阅图4,为本申请实施例提供的电子设备100的一种结构示意框图。本实施例中,所述电子设备100可以是智能手机、笔记本电脑、平板电脑、智能上网设备、智能穿戴设备等等,在此不作具体限制。
如图4所示,电子设备100可以由总线110作一般性的总线体系结构来实现。根据电子设备100的具体应用和整体设计约束条件,总线110可以包括任意数量的互连总线和桥接。总线110将各种电路连接在一起,这些电路包括处理器120、存储介质130和总线接口140。可选地,电子设备100可以使用总线接口140将网络适配器150等经由总线110连接。网络适配器150可用于实现电子设备100中物理层的信号处理功能,并通过天线实现射频信号的发送和接收。用户接口160可以连接外部设备,例如:键盘、显示器、鼠标或者操纵杆等。总线110还可以连接各种其它电路,如定时源、外围设备、电压调节器或者功率管理电路等,这些电路是本领域所熟知的,因此不再详述。
可以替换的,电子设备100也可配置成通用处理系统,例如通称为芯片,该通用处理系统包括:提供处理功能的一个或多个微处理器,以及提供存储介质130的至少一部分的外部存储器,所有这些都通过外部总线体系结构与其它支持电路连接在一起。
可替换的,电子设备100可以使用下述来实现:具有处理器120、总线接口140、用户接口160的ASIC(专用集成电路);以及集成在单个芯片中的存储介质130的至少一部分,或者,电子设备100可以使用下述来实现:一个或多个FPGA(现场可编程门阵列)、PLD(可编程逻辑器件)、控制器、状态机、门逻辑、分立硬件部件、任何其它适合的电路、或者能够执行本申请通篇所描述的各种功能的电路的任意组合。
其中,处理器120负责管理总线110和一般处理(包括执行存储在存储介质130上的软件)。处理器120可以使用一个或多个通用处理器和/或专用处理器来实现。处理器120的例子包括微处理器、微控制器、DSP处理器和能够执行软件的其它电路。应当将软件广义地解释为表示指令、数据或其任意组合,而不论是将其称作为软件、固件、中间件、微代码、硬件描述语言还是其它。
在图4中存储介质130被示为与处理器120分离,然而,本领域技术人员很容易明白,存储介质130或其任意部分可位于电子设备100之外。举例来说,存储介质130可以包括传输线、用数据调制的载波波形、和/或与无线节点分离开的计算机制品,这些介质均可以由处理器120通过总线接口140来访问。可替换地,存储介质130或其任意部分可以集成到处理器120中,例如,可以是高速缓存和/或通用寄存器。
所述处理器120可执行上述实施例,具体地,所述存储介质130中可以存储有所述图像处理装置200,所述处理器120可以用于执行所述图像处理装置200。
综上所述,本申请实施例提供的图像处理方法及装置,首先,获取训练样本集,所述训练样本集包括多个原始图像样本和对应的增强图像样本。接着,基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型。而后,基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像。最后,获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像。由此,本申请结合深度学习和拟合函数对图像进行增强处理,能够根据不同场景给予图像合适的增强效果,从而达到用户预期视觉效果,大大改善了传统方案中图像增强效果单一、容易出现颜色不自然、色块、色偏、过渡不自然等问题。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
可以替换的,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其它可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的电子设备、服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (9)
1.一种图像处理方法,其特征在于,应用于电子设备,所述方法包括:
获取训练样本集,所述训练样本集包括多个原始图像样本和对应的增强图像样本;
基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型;
基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像;
获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像;
其中,所述获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中,得到最终增强图像的步骤,包括:
获取所述初步增强图像在Photoshop中曲线的坐标图;
对所述坐标图进行尺寸调整,得到调整后的坐标图;
从所述调整后的坐标图中选取多个坐标点,并对所述多个坐标点进行调整,得到调整后的多个坐标点,所述调整后的多个坐标点作为多项式拟合点,其中,所述对所述多个坐标点进行调整包括:针对每个坐标点,计算该坐标点的坐标与预设坐标之差,并将该差作为该坐标点所对应的调整后的坐标点的坐标;
将所述多项式拟合点输入到多项式拟合工具中,得到对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中,得到最终增强图像。
2.根据权利要求1所述的图像处理方法,其特征在于,所述获取训练样本集的步骤,包括:
获取各种场景下的多个原始图像样本;
响应用户操作,对每个所述原始图像样本的图像参数进行图像增强,生成图像增强后的增强图像样本。
3.根据权利要求1所述的图像处理方法,其特征在于,所述基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型的步骤,包括:
对所述训练样本集进行图像处理,得到预设数量个目标尺寸的原始图像和对应的增强图像;
将所述预设数量个目标尺寸的原始图像输入到预先构建的CNN图像处理网络中,得到与各个原始图像对应的输出图像;
计算输出图像和增强图像之间的loss值;
基于所述loss值对所述CNN图像处理网络进行训练,并在训练过程中更新所述CNN图像处理网络的网络参数;
判断所述CNN图像处理网络是否达到训练收敛条件,在达到训练收敛条件时,输出对应的图像增强模型。
4.根据权利要求3所述的图像处理方法,其特征在于,所述对所述训练样本集进行图像处理,得到预设数量个目标尺寸的原始图像和对应的增强图像的步骤,包括:
从所述训练样本集中选取预设数量个原始图像样本和对应的预设数量个增强图像样本;
针对选取出的每个原始图像样本和对应的预设数量个增强图像样本,在该原始图像样本和对应的增强图像样本中的相同位置处随机裁剪目标尺寸的图像,以得到预设数量个目标尺寸的原始图像和对应的增强图像。
5.根据权利要求3所述的图像处理方法,其特征在于,所述计算输出图像和增强图像之间的loss值的步骤,包括:
分别计算所述输出图像和增强图像之间的color_loss值以及vgg_loss值;
基于所述color_loss值以及所述vgg_loss值的权重分别对所述color_loss值以及所述vgg_loss值进行数据处理,得到输出图像和增强图像之间的loss值。
6.根据权利要求5所述的图像处理方法,其特征在于,所述分别计算所述输出图像和增强图像之间的color_loss值以及vgg_loss值的步骤,包括:
利用均值模糊方法对所述输出图像和所述增强图像进行模糊处理,并计算模糊处理后的输出图像和增强图像的均值误差值,得到color_loss值;
将所述输出图像和所述增强图像经过所述CNN图像处理网络在同一个层输出的特征图进行误差计算,得到vgg_loss值。
7.根据权利要求3所述的图像处理方法,其特征在于,所述判断所述CNN图像处理网络是否达到训练收敛条件的步骤,包括:
判断所述loss值的变化值是否小于预设值;
若所述loss值的变化值小于预设值,则判定所述CNN图像处理网络达到训练收敛条件,否则判定所述CNN图像处理网络未达到训练收敛条件。
8.根据权利要求1所述的图像处理方法,其特征在于,在所述基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型的步骤之前,所述方法还包括:
构建所述CNN图像处理网络。
9.一种图像处理装置,其特征在于,应用于电子设备,所述装置包括:
获取模块,用于获取训练样本集,所述训练样本集包括多个原始图像样本和对应的增强图像样本;
训练模块,用于基于所述训练样本集对预先构建的CNN图像处理网络训练,得到对应的图像增强模型;
图像增强模块,用于基于所述图像增强模型对输入的图像进行图像增强,得到初步增强图像;
拟合计算模块,用于获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中进行拟合计算,得到最终增强图像;
其中,所述拟合计算模块获取所述初步增强图像对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中,得到最终增强图像的方式,包括:
获取所述初步增强图像在Photoshop中曲线的坐标图;
对所述坐标图进行尺寸调整,得到调整后的坐标图;
从所述调整后的坐标图中选取多个坐标点,并对所述多个坐标点进行调整,得到调整后的多个坐标点,所述调整后的多个坐标点作为多项式拟合点,其中,所述对所述多个坐标点进行调整包括:针对每个坐标点,计算该坐标点的坐标与预设坐标之差,并将该差作为该坐标点所对应的调整后的坐标点的坐标;
将所述多项式拟合点输入到多项式拟合工具中,得到对应的拟合函数,并将所述初步增强图像输入到所述拟合函数中,得到最终增强图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810679695.9A CN108876745B (zh) | 2018-06-27 | 2018-06-27 | 图像处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810679695.9A CN108876745B (zh) | 2018-06-27 | 2018-06-27 | 图像处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108876745A CN108876745A (zh) | 2018-11-23 |
CN108876745B true CN108876745B (zh) | 2020-09-01 |
Family
ID=64295239
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810679695.9A Active CN108876745B (zh) | 2018-06-27 | 2018-06-27 | 图像处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108876745B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109544482A (zh) * | 2018-11-29 | 2019-03-29 | 厦门美图之家科技有限公司 | 一种卷积神经网络模型生成方法及图像增强方法 |
CN109711286B (zh) * | 2018-12-11 | 2022-11-11 | 中国科学院深圳先进技术研究院 | 一种基于人工视网膜空间感知的控制方法及装置 |
CN109685750A (zh) * | 2018-12-14 | 2019-04-26 | 厦门美图之家科技有限公司 | 图像增强方法及计算设备 |
WO2020124374A1 (zh) * | 2018-12-18 | 2020-06-25 | 深圳市大疆创新科技有限公司 | 图像处理方法、终端设备及存储介质 |
CN109859152B (zh) * | 2018-12-25 | 2021-05-25 | 北京奇艺世纪科技有限公司 | 模型生成方法、图像增强方法、装置及计算机可读存储介质 |
CN109949250B (zh) * | 2019-03-29 | 2021-05-18 | 北京奇艺世纪科技有限公司 | 一种图像处理方法及装置 |
CN110310239B (zh) * | 2019-06-20 | 2023-05-05 | 四川阿泰因机器人智能装备有限公司 | 一种基于特性值拟合消除光照影响的图像处理方法 |
CN110349107B (zh) * | 2019-07-10 | 2023-05-26 | 北京字节跳动网络技术有限公司 | 图像增强的方法、装置、电子设备、及存储介质 |
CN110378852A (zh) * | 2019-07-11 | 2019-10-25 | 北京奇艺世纪科技有限公司 | 图像增强方法、装置、计算机设备和存储介质 |
CN112396558A (zh) * | 2019-08-15 | 2021-02-23 | 株式会社理光 | 图像处理方法、装置及计算机可读存储介质 |
CN111598799A (zh) * | 2020-04-30 | 2020-08-28 | 中国科学院深圳先进技术研究院 | 图像调色增强方法和图像调色增强神经网络训练方法 |
CN112019827B (zh) * | 2020-09-02 | 2022-01-25 | 上海网达软件股份有限公司 | 视频图像色彩增强的方法、装置、设备及存储介质 |
CN112465709B (zh) * | 2020-10-26 | 2024-04-12 | 华为技术有限公司 | 一种图像增强方法、装置、存储介质及设备 |
CN114282581B (zh) * | 2021-01-29 | 2023-10-13 | 北京有竹居网络技术有限公司 | 基于数据增强的训练样本获取方法、装置和电子设备 |
CN113505848B (zh) * | 2021-07-27 | 2023-09-26 | 京东科技控股股份有限公司 | 模型训练方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372622A (zh) * | 2016-09-30 | 2017-02-01 | 北京奇虎科技有限公司 | 一种人脸表情分类方法及装置 |
EP3319039A1 (en) * | 2016-11-07 | 2018-05-09 | UMBO CV Inc. | A method and system for providing high resolution image through super-resolution reconstruction |
CN108186051A (zh) * | 2017-12-26 | 2018-06-22 | 珠海艾博罗生物技术股份有限公司 | 一种从超声图像中自动测量胎儿双顶径长度的图像处理方法及处理系统 |
-
2018
- 2018-06-27 CN CN201810679695.9A patent/CN108876745B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372622A (zh) * | 2016-09-30 | 2017-02-01 | 北京奇虎科技有限公司 | 一种人脸表情分类方法及装置 |
EP3319039A1 (en) * | 2016-11-07 | 2018-05-09 | UMBO CV Inc. | A method and system for providing high resolution image through super-resolution reconstruction |
CN108186051A (zh) * | 2017-12-26 | 2018-06-22 | 珠海艾博罗生物技术股份有限公司 | 一种从超声图像中自动测量胎儿双顶径长度的图像处理方法及处理系统 |
Non-Patent Citations (2)
Title |
---|
"WESPE: Weakly Supervised Photo Enhancer for Digital Cameras";Andrey Ignatov等;《https://arxiv.org/abs/1709.01118》;20180331;第1-10页 * |
"改进的单尺度Retinex雾天图像增强算法";张赛楠等;《张赛楠等》;20130620;第43卷(第6期);第698-702页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108876745A (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108876745B (zh) | 图像处理方法及装置 | |
CN108830816B (zh) | 图像增强方法及装置 | |
CN109670558B (zh) | 使用深度学习的数字图像完成 | |
US11593615B2 (en) | Image stylization based on learning network | |
CN109146825B (zh) | 摄影风格转换方法、装置及可读存储介质 | |
CN108961303A (zh) | 一种图像处理方法、装置、电子设备和计算机可读介质 | |
CN110363753B (zh) | 图像质量评估方法、装置及电子设备 | |
CN112235520B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN111507993A (zh) | 一种基于生成对抗网络的图像分割方法、装置及存储介质 | |
CN114511576B (zh) | 尺度自适应特征增强深度神经网络的图像分割方法与系统 | |
Yan et al. | Enhanced network optimized generative adversarial network for image enhancement | |
CN112116620B (zh) | 一种室内图像语义分割与涂装展示的方法 | |
CN111383232A (zh) | 抠图方法、装置、终端设备及计算机可读存储介质 | |
CN114463223A (zh) | 一种图像增强的处理方法、装置、计算机设备及介质 | |
CN110211017B (zh) | 图像处理方法、装置及电子设备 | |
CN113516697B (zh) | 图像配准的方法、装置、电子设备及计算机可读存储介质 | |
CN112329752B (zh) | 人眼图像处理模型的训练方法、图像处理方法及装置 | |
CN108734712B (zh) | 背景分割的方法、装置及计算机存储介质 | |
WO2024041108A1 (zh) | 图像矫正模型训练及图像矫正方法、装置和计算机设备 | |
Li et al. | Enhancing pencil drawing patterns via using semantic information | |
CN109410121B (zh) | 人像胡须生成方法及装置 | |
CN110689478B (zh) | 图像风格化处理方法、装置、电子设备及可读介质 | |
CN110866866A (zh) | 图像仿色处理方法、装置、电子设备及存储介质 | |
CN112561822B (zh) | 美颜方法、装置、电子设备及存储介质 | |
CN111383289A (zh) | 图像处理方法、装置、终端设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |