CN113706410A - 图像处理方法、装置、电子设备和存储介质 - Google Patents
图像处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113706410A CN113706410A CN202110956618.5A CN202110956618A CN113706410A CN 113706410 A CN113706410 A CN 113706410A CN 202110956618 A CN202110956618 A CN 202110956618A CN 113706410 A CN113706410 A CN 113706410A
- Authority
- CN
- China
- Prior art keywords
- layer
- image
- convolution
- channel
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 21
- 238000012545 processing Methods 0.000 title claims description 26
- 238000013528 artificial neural network Methods 0.000 claims abstract description 72
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 22
- 230000001174 ascending effect Effects 0.000 claims abstract description 11
- 238000005070 sampling Methods 0.000 claims description 13
- 230000000630 rising effect Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 2
- 230000009467 reduction Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G06T5/70—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Abstract
本公开是关于一种图像处理方法、装置、电子设备和存储介质,所述方法应用于终端设备,所述方法包括:将待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,其中,所述神经网络包括至少一个卷积层组,所述卷积层组包括依次连接的降通道层、核心卷积层和升通道层;根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,其中,所述目标图像的亮度在标准亮度范围内。
Description
技术领域
本公开涉及图像处理技术领域,具体涉及一种图像处理方法、装置、电子设备和存储介质。
背景技术
人们在日常生活中大量使用图像,然而在暗光条件下,受到低信噪比和低亮度的影响,图像的成像质量会受到很大的影响,因此需要对图像进行增强,改善图像的视觉效果。相关技术中的图像亮度增强方法是基于直方图均衡,但是这类方法容易造成图片局部过饱和,并且可能会降低有用信息的对比度。
发明内容
为克服相关技术中存在的问题,本公开实施例提供一种图像处理方法、装置、电子设备和存储介质,用以解决相关技术中的缺陷。
根据本公开实施例的第一方面,提供一种图像处理方法,应用于终端设备,包括:
将所述待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,其中,所述神经网络包括至少一个卷积层组,所述卷积层组包括依次连接的降通道层、核心卷积层和升通道层;
根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,其中,所述目标图像的亮度在标准亮度范围内。
在一个实施例中,所述降通道层的卷积核的宽和高均为1,所述降通道层的输出通道数小于所述降通道层的输入通道数;
所述升通道层的卷积核的宽和高均为1,所述升通道层的输出通道数大于所述降通道层的输入通道数。
在一个实施例中,所述核心卷积层的卷积核的宽和高均大于1,所述核心卷积层的输入通道数与所述降通道层的输出通道数相等,所述核心卷积层的输出通道数与所述降通道层的入出通道数相等。
在一个实施例中,所述核心卷积层的的卷积核的数量与所述核心卷积层的输入通道数相同,每个所述卷积核用于对所述核心卷积层的一个通道的输入进行卷积。
在一个实施例中,所述神经网络还包括设置在所述至少一个卷积层组之前的初始卷积层,所述初始卷积层的输入为所述待处理图像,所述初始卷积层的卷积核的宽和高均大于1,所述初始卷积层的输出通道数为,所述至少一个卷积层组中第一个卷积层组的所述降通道层的输入通道数。
在一个实施例中,所述初始卷积层的卷积步长大于1;所述至少一个卷积层组中的每个卷积层组的卷积步长均为1。
在一个实施例中,所述至少一个卷积层组中,最后一个卷积层组中的所述升通道层的输出通道数大于所述降通道层的输入通道数,其他卷积层组中的所述升通道层的输出通道数等于所述降通道层的输入通道数;
所述神经网络还包括设于所述最后一个卷积层组之后的上采样层,所述上采样层用于根据所述最后一个卷积层组的输出生成所述至少一级曲线参数图,其中,所述曲线参数图的高和宽等于所述待处理图像的高和宽。
在一个实施例中,所述神经网络还包括设置在所述至少一个卷积层组之间的拼接层;所述拼接层用于将之前的至少两个所述卷积层组的输出作为输入,并将全连接结果输出至之后的所述卷积层组。
在一个实施例中,所述根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,包括:
根据第i-1级图像和第i级曲线参数图确定第i+1级图像,其中,i≥1,所述待处理图像为第0级图像;
将第N级图像确定为所述目标图像,其中,N为所述至少一级曲线参数图的级数。
在一个实施例中,还包括:
将图像训练集中的多个图像输入至所述神经网络,所述神经网络输出每个图像对应的至少一级曲线参数图,其中,所述多个图像的亮度值不等;
根据每个图像和对应的所述至少一级曲线参数图,确定对应的预测图像;
根据每个图像对应的所述至少一级曲线参数图确定平滑损失值,以及根据每个图像对应的预测图像和预设的参考亮度值,确定亮度损失值;
根据每个图像的平滑损失值和亮度损失值,调节所述神经网络的网络参数。
根据本公开实施例的第二方面,提供一种图像处理装置,应用于终端设备,包括:
预测模块,用于将所述待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,其中,所述神经网络包括至少一个卷积层组,所述卷积层组包括依次连接的降通道层、核心卷积层和升通道层;
确定模块,用于根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,其中,所述目标图像的亮度在标准亮度范围内。
在一个实施例中,所述降通道层的卷积核的宽和高均为1,所述降通道层的输出通道数小于所述降通道层的输入通道数;
所述升通道层的卷积核的宽和高均为1,所述升通道层的输出通道数大于所述降通道层的输入通道数。
在一个实施例中,所述核心卷积层的卷积核的宽和高均大于1,所述核心卷积层的输入通道数与所述降通道层的输出通道数相等,所述核心卷积层的输出通道数与所述降通道层的入出通道数相等。
在一个实施例中,所述核心卷积层的的卷积核的数量与所述核心卷积层的输入通道数相同,每个所述卷积核用于对所述核心卷积层的一个通道的输入进行卷积。
在一个实施例中,所述神经网络还包括设置在所述至少一个卷积层组之前的初始卷积层,所述初始卷积层的输入为所述待处理图像,所述初始卷积层的卷积核的宽和高均大于1,所述初始卷积层的输出通道数为,所述至少一个卷积层组中第一个卷积层组的所述降通道层的输入通道数。
在一个实施例中,所述初始卷积层的卷积步长大于1;所述至少一个卷积层组中的每个卷积层组的卷积步长均为1。
在一个实施例中,所述至少一个卷积层组中,最后一个卷积层组中的所述升通道层的输出通道数大于所述降通道层的输入通道数,其他卷积层组中的所述升通道层的输出通道数等于所述降通道层的输入通道数;
所述神经网络还包括设于所述最后一个卷积层组之后的上采样层,所述上采样层用于根据所述最后一个卷积层组的输出生成所述至少一级曲线参数图,其中,所述曲线参数图的高和宽等于所述待处理图像的高和宽。
在一个实施例中,所述神经网络还包括设置在所述至少一个卷积层组之间的拼接层;所述拼接层将之前的至少两个所述卷积层组的输出作为输入,并将全连接结果输出至之后的所述卷积层组。
在一个实施例中,所述确定模块具体用于:
根据第i-1级图像和第i级曲线参数图确定第i级图像,其中,i≥1,所述待处理图像为第0级图像;
将第N级图像确定为所述目标图像,其中,N为所述至少一级曲线参数图的级数。
在一个实施例中,还包括训练模块,用于:
将图像训练集中的多个图像输入至所述神经网络,所述神经网络输出每个图像对应的至少一级曲线参数图,其中,所述多个图像的亮度值不等;
根据每个图像和对应的所述至少一级曲线参数图,确定对应的预测图像;
根据每个图像对应的所述至少一级曲线参数图确定平滑损失值,以及根据每个图像对应的预测图像和预设的参考亮度值,确定亮度损失值;
根据每个图像的平滑损失值和亮度损失值,调节所述神经网络的网络参数。
根据本公开实施例的第三方面,提供一种电子设备,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于第一方面所述的图像处理方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现第一方面所述的方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开将待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,并进一步根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,从而使目标图像的亮度在标准亮度范围内。该目标图像的亮度较为均衡,避免了直方图均衡方式增强的图像的局部过饱和问题,而且保留了待处理图像的对比度,而且由于神经网络包括由降通道层、核心卷积层和升通道层组成的卷积层组,因此相对于传统的卷积层可以增加网络的深度,同时可以减少核心卷积层的卷积核数量,提高了曲线参数图的预测准确度、运算速度,降低了运算负荷,减少了运算内存的占用。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是本公开一示例性实施例示出的图像处理方法的流程图;
图2是本公开一示例性实施例示出的图像采集设备和电子设备的连接示意图;
图3是本公开一示例性实施例示出的根据曲线参数图确定目标图像的过程示意图;
图4是本公开一示例性实施例示出的神经网络的结构示意图;
图5是本公开一示例性实施例示出的卷及模组的结构示意图;
图6是本公开一示例性实施例示出的图像处理装置的结构示意图;
图7是本公开一示例性实施例示出的电子设备框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
基于此,第一方面,本公开至少一个实施例提供了一种图像处理方法,请参照附图1,其示出了该方法的流程,包括步骤S101和步骤S102。
其中,该声音处理方法可以由终端设备或服务器等电子设备执行,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)手持设备、计算设备、车载设备、可穿戴设备等,该方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者,可以通过服务器执行该方法,服务器可以为本地服务器、云端服务器等。
在步骤S101中,将所述待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,其中,所述神经网络包括至少一个卷积层组,所述卷积层组包括依次连接的降通道层、核心卷积层和升通道层。
其中,请参照附图2,待处理图像可以是网络摄像头等图像采集设备201所采集的图像,或上述图像采集设备201所采集的视频中的一帧图像,可以通过执行该方法的电子设备202对待处理图像进行处理,并对处理结果进行查看。待处理图像的局部或全部范围内的亮度未在标准亮度范围内,因此需要通过该方法进行处理,以使其全部范围内的亮度均在标准亮度范围内。当图像采集设备201所采集的图像的全部范围内的亮度均在标准亮度范围内时,执行该方法的电子设备202可以直接显示所采集的图像。
需要注意的是,上述标准亮度范围是根据图像标准生成的,或根据用户设置生成的。换句话说,当图像的全部范围内的亮度均在标准亮度范围内时,该图像能够被用户清晰舒适的查看。例如,上述图像采集设备在环境光线较暗的条件下所采集的图像无法看清,可以通过该方法进行亮度增强,从而对图像采集设备采集的图像或视频实时处理,增强了亮度,改善了视觉效果。
作为神经网络的输入,待处理图像包括至少一个通道的数据。当待处理图像为灰度图像时,至少可以包括一个通道的数据,即待处理图像的每个像素的亮度所构成的数据;当待处理图像为彩色图像时,至少可以包括三个通道的数据,即待处理图像的红(R)、绿(G)、蓝(B)三个通道的数据,每个通道也包括待处理图像的每个像素的颜色分量。
卷积层组的降通道层、核心卷积层和升通道层依次连接,数据在三层间依次传输,即降通道层的输出作为核心卷积层的输入,核心卷积层的输出作升通道层的输入。卷积层组可以在核心卷积层的前后,控制其输入和输出的通道数,即降低其输入的通道数,升高其输出的通道数,该卷积层组相对于传统的卷积层,能够降低核心卷积层的卷积核的通道数以及卷积核的数量。
在步骤S102中,根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,其中,所述目标图像的亮度在标准亮度范围内。
本公开将待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,并进一步根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,从而使目标图像的亮度在标准亮度范围内。该目标图像的亮度较为均衡,避免了直方图均衡方式增强的图像的局部过饱和问题,而且保留了待处理图像的对比度,而且由于神经网络包括由降通道层、核心卷积层和升通道层组成的卷积层组,因此相对于传统的卷积层可以增加网络的深度,同时可以减少核心卷积层的卷积核数量,提高了曲线参数图的预测准确度、运算速度,降低了运算负荷,减少了运算内存的占用。
本公开的一个实施例中,所述降通道层的卷积核的宽和高均为1,所述降通道层的输出通道数小于所述降通道层的输入通道数;所述升通道层的卷积核的宽和高均为1,所述升通道层的输出通道数大于所述降通道层的输入通道数。
其中,降通道层的卷积核的宽和高均为1,可以降低卷积运算的运算量,使降通道层仅仅用于降低其输入数据的通道数量。降通道层的卷积层的通道数,与降通道层的输入通道数相同,因此可以在卷积运算中使每个卷积核的多个通道与输入数据的多个通道一一对应进行运算,然后将卷积核在一个位置上所有通道的运算结果之和作为卷积结果的对应位置的值。降通道层的卷积核的数量,与降通道层的输出通道数相同,因此每个卷积核的卷积结果可以作为输出数据的一个通道。
其中,升通道层的卷积核的宽和高均为1,可以降低卷积运算的运算量,使升通道层仅仅用于升高核心卷积层的输出数据的通道数。升通道层的卷积层的通道数,与升通道层的输入通道数(即核心卷积层的输出通道数)相同,因此可以在卷积运算中使每个卷积核的多个通道与输入数据的多个通道一一对应进行运算,然后将卷积核在一个位置上所有通道的运算结果之和作为卷积结果的对应位置的值。升通道层的卷积核的数量,与升通道层的输出通道数相同,因此每个卷积核的卷积结果可以作为输出数据的一个通道。
相对应的,所述核心卷积层的卷积核的宽和高均大于1,所述核心卷积层的输入通道数与所述降通道层的输出通道数相等,所述核心卷积层的输出通道数与所述降通道层的入出通道数相等。
其中,核心卷积层的卷积核可以为3*3的卷积核,能够更为准确的提取输入数据的特征。所述核心卷积层的卷积核的数量与所述核心卷积层的输入通道数相同,每个所述卷积核用于对所述核心卷积层的一个通道的输入进行卷积。也就是说,核心卷积层仅具有一个卷积核,且该卷积核的多个通道与核心卷积层的输入数据的多个通道一一对应,每个卷积核的通道与其对应的数据的通道进行卷积,得到输出数据的一个通道。通过这种卷积核的设置,可以进一步降低运算负荷,提高运算效率。而且该核心卷积层的输出数据的通道数,能够在之后的升通道层进行增加。
本公开的一些实施例中,所述神经网络还包括设置在所述至少一个卷积层组之前的初始卷积层,所述初始卷积层的输入为所述待处理图像,所述初始卷积层的卷积核的宽和高均大于1,所述初始卷积层的输出通道数为,所述至少一个卷积层组中第一个卷积层组的所述降通道层的输入通道数。
其中,初始卷积层为传统的卷积层,其可以对待处理图像进行最初的卷积运算,从而使通道较少的数据增加通道数,例如使通道数为1的灰度图像的数据或通道数为3的彩色图像的数据增加至24个通道或32个通道等。
初始卷积层的卷积核可以为3*3的卷积核,卷积核的通道数可以和待处理图像数据的通道数相同,因此可以在卷积运算中使每个卷积核的多个通道与图像数据的多个通道一一对应进行运算,然后将卷积核在一个位置上所有通道的运算结果之和作为卷积结果的对应位置的值。例如,待处理图像为通道数为1的灰度图像数据时,卷积核的通道数可以为1;待处理图像为通道数为3的彩色图像数据时,卷积核的通道数可以为3。卷积核的个数可以和输出数据的通道数相同,例如,想要将图像数据的通道数增加至24,则卷积核的数量可以为24,每个卷积核的卷积结果作为输出数据的一个通道;想要将图像数据的通道数增加至32,则卷积核的数量可以为32,每个卷积核的卷积结果作为输出数据的一个通道。
另外,初始卷积层的输出可以作为第一个卷积层组的输入数据。而卷积层组的降通道层可以将输入数据的通道数降低一半,例如,将24通道的输入数据降低至12通道,将32通道的输入数据降低至16通道。
可选的,所述初始卷积层的卷积步长大于1;所述至少一个卷积层组中的每个卷积层组的卷积步长均为1。卷积步长的大小能够影响卷积运算结果的宽和高,即卷积步长越大,则卷积运算结果的宽和高越小,卷积步长越小,则卷积运算结果的宽和高越大。因此,初始卷积层的卷积步长大于1,可以使初始卷积层的输出数据的宽和高相对于输入数据的宽和高减小,进而使输入到卷积层组的数据的宽和高,相对于待处理图像数据的宽和高减小,从而进一步减少卷积层组的运算负荷,提高运算效率。而卷积层组的卷积步长为1,可以使输入到卷积层组的数据保持宽和高不变。初试卷积层通过卷积步长大于1使卷积运算街过的宽和高减小,即可以使输入的图像的分辨率降低,从而能够使后续的运算符合降低,而这种通过降低图像分辨率来降低运算负荷的方式,相对于相关技术中的各种降低运算负荷的方式调整更为简单,效果更加明显。
基于上述初始卷积层通过卷积步长减小待处理图像数据的宽和高,所述至少一个卷积层组中,最后一个卷积层组中的所述升通道层的输出通道数大于所述降通道层的输入通道数,其他卷积层组中的所述升通道层的输出通道数等于所述降通道层的输入通道数;所述神经网络还包括设于所述最后一个卷积层组之后的上采样层,所述上采样层用于根据所述最后一个卷积层组的输出生成所述至少一级曲线参数图,其中,所述曲线参数图的高和宽等于所述待处理图像的高和宽。
最后一个卷积层组的输出通道数可以为n*r2,其中,n为卷积层组的输入数据的通道数,r为初始卷积层的卷积步长。例如,卷积层组的输入数据的通道数为24,而初始卷积层的卷积步长为2,则最后一卷积层组的输出通道数可以为96。这是因为除最后一个卷积层组之外的其他卷积层组的输入通道数等于其输出通道数,即不改变输入数据的通道数,因此最后一个卷积层组的输入通道数即为初始卷积层的输出通道数,而初始卷积层的卷积步长从宽和高两个方向减小输出数据的尺寸,因此增加最后一个卷积层组的输出通道数,能够使输出数据的整体尺寸与初始卷积层的卷积步长为1时的输出数据的整体尺寸相等。因此上采样层可以根据所述最后一个卷积层组的输出生成所述至少一级曲线参数图,例如最后一个卷积层组的输出数据的通道数为96,则上采样层可以生成24个通道的数据,再根据这24个通道的数据生成至少一级曲线参数图。需要注意的是,曲线参数图的通道数与待处理图像的通道数相同,即待处理图像为三通道的彩色图像数据,则曲线参数图也包括三个通道。例如,上采样层的输出数据包括24个通道的数据,则每3个通道的数据组成一级曲线参数图。
本公开的一些实施例中,所述神经网络还包括设置在所述至少一个卷积层组之间的拼接层(cancat);所述拼接层用于将之前的至少两个所述卷积层组的输出作为输入,并将全连接结果输出至之后的所述卷积层组。拼接层能够将多个卷积层组的输出在通道维度进行拼接。
本公开的一些实施例中,可以按照下述方式根据所述待处理图像和所述至少一级曲线参数图,确定目标图像:首先,根据第i-1级图像和第i级曲线参数图确定第i级图像,其中,i≥1,所述待处理图像为第0级图像;再将第N级图像确定为所述目标图像,其中,N为所述至少一级曲线参数图的级数。
请参照附图3,待处理图像301与第一级曲线参数图302确定第一级图像303,进而第一级图像303与第二级曲线参数图304确定第二级图像305,以此类推,直至根据最后一级曲线参数图306确定出最后一级图像307作为目标图像。可以按照下述公式确定第i级图像:LEi(x)=LEi-1(x)+Ai(x)LEi-1(x)(1-LEi-1(x)),其中,LEi(x)为第i级图像,LEi-1(x)为第i-1级图像,Ai(x)为第i级曲线参数图。可选的,N为8。
本公开的一些实施例中,所述方法还包括下述神经网络的训练过程:首先,将图像训练集中的多个图像输入至所述神经网络,所述神经网络输出每个图像对应的至少一级曲线参数图,其中,所述多个图像的亮度值不等;接下来,根据每个图像和对应的所述至少一级曲线参数图,确定对应的预测图像;接下来,根据每个图像对应的所述至少一级曲线参数图确定平滑损失值,以及根据每个图像对应的预测图像和预设的参考亮度值,确定亮度损失值;最后,根据每个图像的平滑损失值和亮度损失值,调节所述神经网络的网络参数。
其中,训练集中的图像可以被分为多批,每次输入的多个图像为一批,且不同批的图像可以存在重叠。上述训练过程仅是训练集中某一批图像的训练过程,而训练集中每一批图像都可以按照上述方式对神经网络进行训练,即逐批次的输入到神经网络中,并按照上述方式对神经网络进行训练,直至收敛。
其中,训练集中的多个图像在输入神经网络前,可以调整为相同尺寸,例如256*256;并进行归一化处理,即每个像素值除以255。
其中,根据每个图像的平滑损失值和亮度损失值,调节所述神经网络的网络参数时,可以采用梯度下降法进行调节。
请参照附图4,本公开的一个实施例示例性的示出了神经网络的结构,其中,初始卷积层401的卷积核为3*3的卷积核,输出通道数为24,用于输入待处理图像;然后是依次连接的第一级卷积层组402、第二级卷积层组403、第一级拼接层404、第三级卷积层组405、第二级拼接层406、第四级卷积层组407和上采样层408;第一级卷积层组402和第二级卷积层组403的输出均输入至第一级拼接层404,初始卷积层401和第三级卷积层组405的输出均输入至第二级拼接层406;初始卷积层401的输出为24通道,第一级卷积层组402、第二级卷积层组403、第三级卷积层组405的输出为24通道,第四级卷积层组407的输出为96通道,上采样层408输出8级曲线参数图。
另外,请参照附图5,其示出了上述实施例中的卷积层组与传统的卷积层的区别,从中可以看出,卷积层组的降通道层501的卷积核为1*1、通道数为24的卷积核,卷积步长为1,卷积核数量为12,因此输出通道为12,核心卷积层502的卷积核为3*3、通道数为为12的卷积核,卷积步长为1,输出通道为12,卷积核的数量为1,其卷积运算是卷积核的一个通道用于卷积输入数据的一个通道,从而得到输出数据的一个通道,升通道层503的卷积核为1*1、通道数为12的卷积核,卷积步长为1,输出通道为24;而传统的卷积层的卷积核为3*3,且通道数为24的卷积核,卷积步长为1,输出通道为24,卷积核的数量为24,每个卷积核的全部通道用于和输入数据进行卷积运算,以得到输出数据的一个通道。
相对于传统的卷积层,以及卷积方式,本实施例可以减少网络计算量,降低耗时。同时,本实施例增加了网络深度,所以本方案减少了3×3卷积的层数,并减少了每层卷积的卷积核数目,这样可以加速网络运算并减少内存占用。
根据本公开实施例的第二方面,提供一种图像处理装置,应用于终端设备,请参照附图6,其示出了该装置的结构示意图,包括:
预测模块601,用于将所述待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,其中,所述神经网络包括至少一个卷积层组,所述卷积层组包括依次连接的降通道层、核心卷积层和升通道层;
确定模块602,用于根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,其中,所述目标图像的亮度在标准亮度范围内。
在本公开的一些实施例中,所述降通道层的卷积核的宽和高均为1,所述降通道层的输出通道数小于所述降通道层的输入通道数;
所述升通道层的卷积核的宽和高均为1,所述升通道层的输出通道数大于所述降通道层的输入通道数。
在本公开的一些实施例中,所述核心卷积层的卷积核的宽和高均大于1,所述核心卷积层的输入通道数与所述降通道层的输出通道数相等,所述核心卷积层的输出通道数与所述降通道层的入出通道数相等。
在本公开的一些实施例中,所述核心卷积层的的卷积核的数量与所述核心卷积层的输入通道数相同,每个所述卷积核用于对所述核心卷积层的一个通道的输入进行卷积。
在本公开的一些实施例中,所述神经网络还包括设置在所述至少一个卷积层组之前的初始卷积层,所述初始卷积层的输入为所述待处理图像,所述初始卷积层的卷积核的宽和高均大于1,所述初始卷积层的输出通道数为,所述至少一个卷积层组中第一个卷积层组的所述降通道层的输入通道数。
在本公开的一些实施例中,所述初始卷积层的卷积步长大于1;所述至少一个卷积层组中的每个卷积层组的卷积步长均为1。
在本公开的一些实施例中,所述至少一个卷积层组中,最后一个卷积层组中的所述升通道层的输出通道数大于所述降通道层的输入通道数,其他卷积层组中的所述升通道层的输出通道数等于所述降通道层的输入通道数;
所述神经网络还包括设于所述最后一个卷积层组之后的上采样层,所述上采样层用于根据所述最后一个卷积层组的输出生成所述至少一级曲线参数图,其中,所述曲线参数图的高和宽等于所述待处理图像的高和宽。
在本公开的一些实施例中,所述神经网络还包括设置在所述至少一个卷积层组之间的拼接层;所述拼接层将之前的至少两个所述卷积层组的输出作为输入,并将全连接结果输出至之后的所述卷积层组。
在本公开的一些实施例中,所述确定模块具体用于:
根据第i-1级图像和第i级曲线参数图确定第i级图像,其中,i≥1,所述待处理图像为第0级图像;
将第N级图像确定为所述目标图像,其中,N为所述至少一级曲线参数图的级数。
在本公开的一些实施例中,还包括训练模块,用于:
将图像训练集中的多个图像输入至所述神经网络,所述神经网络输出每个图像对应的至少一级曲线参数图,其中,所述多个图像的亮度值不等;
根据每个图像和对应的所述至少一级曲线参数图,确定对应的预测图像;
根据每个图像对应的所述至少一级曲线参数图确定平滑损失值,以及根据每个图像对应的预测图像和预设的参考亮度值,确定亮度损失值;
根据每个图像的平滑损失值和亮度损失值,调节所述神经网络的网络参数。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在第一方面有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本公开实施例的第三方面,请参照附图7,其示例性的示出了一种电子设备的框图。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理部件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在设备700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件706为装置700的各种组件提供电力。电力组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714还可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,4G或5G或它们的组合。在一个示例性实施例中,通信部件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述电子设备的供电方法。
第四方面,本公开在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述电子设备的供电方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (22)
1.一种图像处理方法,其特征在于,应用于终端设备,包括:
将待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,其中,所述神经网络包括至少一个卷积层组,所述卷积层组包括依次连接的降通道层、核心卷积层和升通道层;
根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,其中,所述目标图像的亮度在标准亮度范围内。
2.根据权利要求1所述的图像处理方法,其特征在于,所述降通道层的卷积核的宽和高均为1,所述降通道层的输出通道数小于所述降通道层的输入通道数;
所述升通道层的卷积核的宽和高均为1,所述升通道层的输出通道数大于所述降通道层的输入通道数。
3.根据权利要求1所述的图像处理方法,其特征在于,所述核心卷积层的卷积核的宽和高均大于1,所述核心卷积层的输入通道数与所述降通道层的输出通道数相等,所述核心卷积层的输出通道数与所述降通道层的入出通道数相等。
4.根据权利要求3所述的图像处理方法,其特征在于,所述核心卷积层的的卷积核的数量与所述核心卷积层的输入通道数相同,每个所述卷积核用于对所述核心卷积层的一个通道的输入进行卷积。
5.根据权利要求1所述的图像处理方法,其特征在于,所述神经网络还包括设置在所述至少一个卷积层组之前的初始卷积层,所述初始卷积层的输入为所述待处理图像,所述初始卷积层的卷积核的宽和高均大于1,所述初始卷积层的输出通道数为,所述至少一个卷积层组中第一个卷积层组的所述降通道层的输入通道数。
6.根据权利要求5所述的图像处理方法,其特征在于,所述初始卷积层的卷积步长大于1;所述至少一个卷积层组中的每个卷积层组的卷积步长均为1。
7.根据权利要求6所述的图像处理方法,其特征在于,所述至少一个卷积层组中,最后一个卷积层组中的所述升通道层的输出通道数大于所述降通道层的输入通道数,其他卷积层组中的所述升通道层的输出通道数等于所述降通道层的输入通道数;
所述神经网络还包括设于所述最后一个卷积层组之后的上采样层,所述上采样层用于根据所述最后一个卷积层组的输出生成所述至少一级曲线参数图,其中,所述曲线参数图的高和宽等于所述待处理图像的高和宽。
8.根据权利要求1所述的图像处理方法,其特征在于,所述神经网络还包括设置在所述至少一个卷积层组之间的拼接层;所述拼接层用于将之前的至少两个所述卷积层组的输出作为输入,并将全连接结果输出至之后的所述卷积层组。
9.根据权利要求1所述的图像处理方法,其特征在于,所述根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,包括:
根据第i-1级图像和第i级曲线参数图确定第i级图像,其中,i≥1,所述待处理图像为第0级图像;
将第N级图像确定为所述目标图像,其中,N为所述至少一级曲线参数图的级数。
10.根据权利要求1所述的图像处理方法,其特征在于,还包括:
将图像训练集中的多个图像输入至所述神经网络,所述神经网络输出每个图像对应的至少一级曲线参数图,其中,所述多个图像的亮度值不等;
根据每个图像和对应的所述至少一级曲线参数图,确定对应的预测图像;
根据每个图像对应的所述至少一级曲线参数图确定平滑损失值,以及根据每个图像对应的预测图像和预设的参考亮度值,确定亮度损失值;
根据每个图像的平滑损失值和亮度损失值,调节所述神经网络的网络参数。
11.一种图像处理装置,其特征在于,应用于终端设备,包括:
预测模块,用于将待处理图像输入至预先完成训练的神经网络,所述神经网络输出至少一级曲线参数图,其中,所述神经网络包括至少一个卷积层组,所述卷积层组包括依次连接的降通道层、核心卷积层和升通道层;
确定模块,用于根据所述待处理图像和所述至少一级曲线参数图,确定目标图像,其中,所述目标图像的亮度在标准亮度范围内。
12.根据权利要求11所述的图像处理装置,其特征在于,所述降通道层的卷积核的宽和高均为1,所述降通道层的输出通道数小于所述降通道层的输入通道数;
所述升通道层的卷积核的宽和高均为1,所述升通道层的输出通道数大于所述降通道层的输入通道数。
13.根据权利要求11所述的图像处理装置,其特征在于,所述核心卷积层的卷积核的宽和高均大于1,所述核心卷积层的输入通道数与所述降通道层的输出通道数相等,所述核心卷积层的输出通道数与所述降通道层的入出通道数相等。
14.根据权利要求13所述的图像处理装置,其特征在于,所述核心卷积层的的卷积核的数量与所述核心卷积层的输入通道数相同,每个所述卷积核用于对所述核心卷积层的一个通道的输入进行卷积。
15.根据权利要求11所述的图像处理装置,其特征在于,所述神经网络还包括设置在所述至少一个卷积层组之前的初始卷积层,所述初始卷积层的输入为所述待处理图像,所述初始卷积层的卷积核的宽和高均大于1,所述初始卷积层的输出通道数为,所述至少一个卷积层组中第一个卷积层组的所述降通道层的输入通道数。
16.根据权利要求15所述的图像处理装置,其特征在于,所述初始卷积层的卷积步长大于1;所述至少一个卷积层组中的每个卷积层组的卷积步长均为1。
17.根据权利要求16所述的图像处理装置,其特征在于,所述至少一个卷积层组中,最后一个卷积层组中的所述升通道层的输出通道数大于所述降通道层的输入通道数,其他卷积层组中的所述升通道层的输出通道数等于所述降通道层的输入通道数;
所述神经网络还包括设于所述最后一个卷积层组之后的上采样层,所述上采样层用于根据所述最后一个卷积层组的输出生成所述至少一级曲线参数图,其中,所述曲线参数图的高和宽等于所述待处理图像的高和宽。
18.根据权利要求11所述的图像处理装置,其特征在于,所述神经网络还包括设置在所述至少一个卷积层组之间的拼接层;所述拼接层将之前的至少两个所述卷积层组的输出作为输入,并将全连接结果输出至之后的所述卷积层组。
19.根据权利要求11所述的图像处理装置,其特征在于,所述确定模块具体用于:
根据第i-1级图像和第i级曲线参数图确定第i级图像,其中,i≥1,所述待处理图像为第0级图像;
将第N级图像确定为所述目标图像,其中,N为所述至少一级曲线参数图的级数。
20.根据权利要求11所述的图像处理装置,其特征在于,还包括训练模块,用于:
将图像训练集中的多个图像输入至所述神经网络,所述神经网络输出每个图像对应的至少一级曲线参数图,其中,所述多个图像的亮度值不等;
根据每个图像和对应的所述至少一级曲线参数图,确定对应的预测图像;
根据每个图像对应的所述至少一级曲线参数图确定平滑损失值,以及根据每个图像对应的预测图像和预设的参考亮度值,确定亮度损失值;
根据每个图像的平滑损失值和亮度损失值,调节所述神经网络的网络参数。
21.一种电子设备,其特征在于,所述电子设备包括存储器、处理器,所述存储器用于存储可在处理器上运行的计算机指令,所述处理器用于在执行所述计算机指令时基于权利要求1至10中任一项所述的图像处理方法。
22.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110956618.5A CN113706410A (zh) | 2021-08-19 | 2021-08-19 | 图像处理方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110956618.5A CN113706410A (zh) | 2021-08-19 | 2021-08-19 | 图像处理方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113706410A true CN113706410A (zh) | 2021-11-26 |
Family
ID=78653546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110956618.5A Pending CN113706410A (zh) | 2021-08-19 | 2021-08-19 | 图像处理方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113706410A (zh) |
-
2021
- 2021-08-19 CN CN202110956618.5A patent/CN113706410A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3770847A1 (en) | Method and device for processing image, and storage medium | |
CN109345485B (zh) | 一种图像增强方法、装置、电子设备及存储介质 | |
CN111586282B (zh) | 拍摄方法、装置、终端及可读存储介质 | |
US11061202B2 (en) | Methods and devices for adjusting lens position | |
CN107967459B (zh) | 卷积处理方法、装置及存储介质 | |
US11580327B2 (en) | Image denoising model training method, imaging denoising method, devices and storage medium | |
US10109248B2 (en) | Method and device for adjusting liquid crystal display | |
CN105957037B (zh) | 图像增强方法及装置 | |
CN111611034A (zh) | 屏幕显示调节方法、装置及存储介质 | |
US10204403B2 (en) | Method, device and medium for enhancing saturation | |
CN104536713B (zh) | 显示图像中的字符的方法及装置 | |
CN107657608B (zh) | 图像质量确定方法、装置及电子设备 | |
CN111835941B (zh) | 图像生成方法及装置、电子设备、计算机可读存储介质 | |
CN111586280B (zh) | 拍摄方法、装置、终端及可读存储介质 | |
CN112669231B (zh) | 图像处理方法、图像处理模型的训练方法、装置、介质 | |
CN114500821B (zh) | 拍照方法及装置、终端及存储介质 | |
CN110910304B (zh) | 图像处理方法、装置、电子设备及介质 | |
CN113706410A (zh) | 图像处理方法、装置、电子设备和存储介质 | |
CN115145662A (zh) | 屏幕显示亮度调节方法、装置及存储介质 | |
CN109389547B (zh) | 图像显示方法及装置 | |
CN114338956A (zh) | 图像处理方法、图像处理装置及存储介质 | |
CN113066452A (zh) | 显示控制方法及装置、电子设备、计算机可读存储介质 | |
CN113191994A (zh) | 图像处理方法、装置及存储介质 | |
CN115564637A (zh) | 图像处理方法、装置、终端及存储介质 | |
CN115691418A (zh) | 亮度补偿方法、亮度补偿装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |