CN111953888B - 暗光成像方法、装置、计算机可读存储介质及终端设备 - Google Patents
暗光成像方法、装置、计算机可读存储介质及终端设备 Download PDFInfo
- Publication number
- CN111953888B CN111953888B CN201910407527.9A CN201910407527A CN111953888B CN 111953888 B CN111953888 B CN 111953888B CN 201910407527 A CN201910407527 A CN 201910407527A CN 111953888 B CN111953888 B CN 111953888B
- Authority
- CN
- China
- Prior art keywords
- image data
- data
- processing
- neural network
- deep neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003384 imaging method Methods 0.000 title claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 89
- 238000013528 artificial neural network Methods 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 37
- 230000008569 process Effects 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 21
- 238000005286 illumination Methods 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 21
- 238000012937 correction Methods 0.000 claims description 18
- 238000000926 separation method Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 230000008447 perception Effects 0.000 claims description 9
- 230000003321 amplification Effects 0.000 claims description 5
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 238000007500 overflow downdraw method Methods 0.000 claims description 3
- 230000000007 visual effect Effects 0.000 abstract description 4
- 238000004590 computer program Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 230000004927 fusion Effects 0.000 description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000053 physical method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/64—Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/97—Determining parameters from multiple pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/71—Circuitry for evaluating the brightness variation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/70—Circuitry for compensating brightness variation in the scene
- H04N23/73—Circuitry for compensating brightness variation in the scene by influencing the exposure time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Studio Devices (AREA)
Abstract
本发明属于图像处理技术领域,尤其涉及一种暗光成像方法、装置、计算机可读存储介质及终端设备。所述方法对第一图像数据进行预处理操作,得到第二图像数据,所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据;使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据;根据所述第三图像数据生成目标图像。本发明通过一个深度神经网络来学习低照度下单帧原始数据的图像处理流程,可对极暗环境下的短曝光单帧图像数据进行处理,其处理生成的图像具有较高的信噪比和较低的噪声,能够呈现更好的视觉效果。
Description
技术领域
本发明属于图像处理技术领域,尤其涉及一种暗光成像方法、装置、计算机可读存储介质及终端设备。
背景技术
图像成像过程中,或多或少都会受到不同水平噪声的影响,在亮度越大的情况下,成像图像的信噪比越高,效果越好,但在低照度情况下,由于光子数量少的原因,成像图像的信噪比很低,而如何去除噪声,呈现出更好的视觉效果是低照度下图像成像任务的一个重要挑战。现有技术中已提出了各种在暗光下拍照成像的技术方案,通常分为两类方案:物理方法和图像信号处理(Image Signal Processing,ISP)方法,常见的物理方法包括提高感光度(ISO),增大光圈,延长曝光时间和使用闪光灯等;常见的ISP处理方法包括单帧传统多步骤处理和多帧合成处理。但这些方法都各有缺陷,例如,高ISO会放大噪声,增加曝光时间会因相机抖动或物体运动而引入模糊,闪光灯会造成光线不均匀且对中远景失效,单帧传统多步骤处理过程繁琐且效果不理想,多帧合成处理存在匹配图像困难的问题且合成的图像易模糊。并且通常这些技术只适用于中等噪声水平的暗光环境,而对于极暗环境下的短曝光快速成像任务,这些方法的处理效果都不太理想。
发明内容
有鉴于此,本发明提供了一种暗光成像方法、装置、计算机可读存储介质及终端设备,以解决现有技术对于极暗环境下的短曝光快速成像任务的处理效果都不太理想的问题。
本发明的第一方面提供了一种暗光成像方法,可以包括:
对第一图像数据进行预处理操作,得到第二图像数据,所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据;
使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据;
根据所述第三图像数据生成目标图像。
本发明的第二方面提供了一种暗光成像装置,可以包括:
预处理模块,用于对第一图像数据进行预处理操作,得到第二图像数据,所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据;
深度神经网络处理模块,用于使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据;
目标图像生成模块,用于根据所述第三图像数据生成目标图像。
本发明的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述暗光成像方法的步骤。
本发明的第四方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述暗光成像方法的步骤。
本发明与现有技术相比存在的有益效果是:本发明首先对第一图像数据进行预处理操作,得到第二图像数据,所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据,然后使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据,最后根据所述第三图像数据生成目标图像。本发明通过一个深度神经网络来学习低照度下单帧原始数据的图像处理流程,可对极暗环境下的短曝光单帧图像数据进行处理,其处理生成的图像具有较高的信噪比和较低的噪声,能够呈现更好的视觉效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中一种暗光成像方法的流程图;
图2为预处理操作的示意图;
图3为预处理操作的流程图;
图4为使用深度神经网络进行图像数据处理的示意图;
图5为深度神经网络的网络结构图;
图6为生成目标图像的示意图;
图7为生成目标图像的流程图;
图8为线性加权融合模型的示意图;
图9为效果对比图;
图10为本发明实施例中一种暗光成像装置的结构图;
图11为本发明实施例中一种终端设备的示意框图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种暗光成像方法的一个实施例可以包括:
步骤S101、对第一图像数据进行预处理操作,得到第二图像数据。
所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据,也即在极暗环境下的短曝光原始图像数据。所述光强阈值可以根据实际情况进行设置,本实施例对此不作具体限定。
所述预处理操作可以包括但不限于如图2中所示的颜色通道分离处理、黑电平校正处理、归一化处理、放大处理、钳制处理以及裁剪处理等具体操作。
具体地,步骤S101可以包括如图3所示的过程:
步骤S1011、对所述第一图像数据进行颜色通道分离处理,得到通道分离数据。
在进行颜色通道分离处理时,按照所述第一图像数据的颜色顺序将其提取后分为4个颜色通道,如原始图像数颜色顺序为RGBG,则4个颜色通道分别存储RGBG数据。
步骤S1012、对所述通道分离数据进行黑电平校正处理,得到校正数据。
在进行黑电平校正处理时,将所述通道分离数据减去预设的黑电平数值,以校正数据偏差。所述黑电平数值可以根据实际情况进行设置,本实施例对此不作具体限定。
步骤S1013、对所述校正数据进行归一化处理,得到归一化数据。
归一化处理是将所述校正数据归一化至[0,1]之间,定义归一化系数为存储图像数据的最大数值与所述黑电平数值的差值,单反相机存储图像通常为14位,其最大数值为16383,手机存储图像通常为8位,其最大数值为255,归一化处理就是将所述校正数据除以所述归一化系数,从而得到所述归一化数据。
步骤S1014、对所述归一化数据进行放大处理,得到放大数据。
放大处理是将所述归一化数据乘以一个曝光系数,该曝光系数为期望的长曝光时间与成像短曝光时间之间的倍数,通常暗光拍照的短曝光时间为0.1s,而期望的长曝光时间为10s,则乘以的曝光系数为100。
步骤S1015、对所述放大数据进行钳制处理,得到第一钳制数据。
钳制处理是将所述放大数据钳制到[0,1]之间,将所述放大数据中大于1的数据全部设置为1,从而达到防止过曝的目的。
步骤S1016、将所述第一钳制数据进行裁剪处理,得到所述第二图像数据。
例如,可以将所述第一钳制数据中并排的4个颜色通道裁剪等分为4块,每块之间需重叠一定的像素点以保证后续融合的自然过渡,重叠像素的个数可以根据实际情况进行设置,此处优选将其设置为120个像素点。
步骤S102、使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据。
如图4所示,所述第二图像数据将被送入训练好的深度神经网络进行前向计算后得到模型输出结果,也即所述第三图像数据。
相比与传统的网络结构,本实施例中所采用的是一种轻量化的深度神经网络,其核心思想是先通过快速下采样方法提取高质量的高阶特征,然后通过多个反向残差块(Inverted residuals)增大网络的学习存储容量来学习不同对象的细节纹理信息和感知特征,紧接着通过快速上采样的方法生成输出图像。从而使得其表达能力大大增强,运算时间大大降低,能够将其应用在移动端上达到实时的效果。相对于现有方案来说,具有防抖、快速和成像效果好的优势。
在本实施例的一种具体实现中,所述深度神经网络可以包括1个特征提取层、4个下采样层、1个中间处理层和6个上采样层,其具体的网络结构如图5所示。所述特征提取层采用一个步长为2的5*5卷积层提取特征,然后紧接着一个步长为1的1*1卷积层压缩特征,其通道数分别为[32,16]。4个下采样层操作均采用步长为2的3*3卷积层和一个扩张系数为4的反向残差块,其通道数分别为[32,64,128,256]。1个中间处理层采用4个扩张系数为4的反向残差块,其通道数都为256。6个上采样层中,其前4个上采样层结合了双线性插值、步长为1的1*1卷积层、短连接以及2个扩张系数为4的反向残差块,其前4个上采样层的通道层数分别为[128,64,32,16],其中步长为1的1*1卷积层将双线性插值进行上采样后的结果进行通道压缩,使其通道数减少一半,其中短连接操作具体为将步长为1的1*1卷积层处理后的结果与下采样过程中相同通道层数的最后结果进行点对点相加,目的在于融合低阶特征和高阶特征,第5个和第6个上采样层均采用步长为2的2*2的反卷积层,其通道数分别为[16,3]。整个网络中的激活函数都采用Relu激活函数。
所述深度神经网络在使用之前,需要对其网络参数进行训练,具体地:
首先获取预设的训练样本集合,所述训练样本集合中的每个训练样本均包括输入图像数据和输出图像数据,所述输入图像数据为曝光时长小于预设的第一时长阈值的图像数据,所述输出图像数据为曝光时长大于预设的第二时长阈值的图像数据,所述第一时长阈值小于所述第二时长阈值。容易理解地,所述输入图像数据和所述输出图像数据应为在相同的拍摄参数(仅曝光时长不同,其余拍摄参数均相同)下针对同一拍摄对象进行拍摄所得到的图像数据。
然后,使用所述训练样本集合对所述深度神经网络进行训练,将所述输入图像数据作为所述深度神经网络的输入,将所述输入图像数据作为所述深度神经网络的预期输入,采用MS-SSIM损失函数和Adam优化器训练调整所述网络模型的网络参数直至收敛,得到训练好的深度神经网络。容易理解地,所述输入图像数据在输入到所述深度神经网络之前,也需要进行如图2所示的一系列预处理过程,此处不再赘述。
本实施例中所采取的损失函数是多尺度结构相似性损失函数(MultiscaleStructural Similarity Index,MS-SSIM),相比现有技术中常用的L1损失、L2损失、SSIM损失、感知损失等而言,更能恢复出图像的结构信息,呈现出更清晰的图像效果。MS-SSIM损失函数的具体参数可以根据实际情况进行设置,在本实施例的一种具体实现中,可以设置:M=5,β1=γ1=0.0448,β2=γ2=0.2856,β3=γ3=0.3001,β4=γ4=0.2363,、α5=β5=γ5=0.1333。
在完成了对所述深度神经网络的训练之后,即可使用所述深度神经网络对所述第二图像数据进行处理,首先使用所述特征提取层提取出所述第二图像数据的图像特征,然后使用所述下采样层逐步从所述图像特征中提取出高阶特征,再使用所述中间处理层获取所述高阶特征中的细节纹理信息和感知特征,最后使用所述上采样层对所述细节纹理信息和感知特征进行双线性插值和通道压缩,最终得到所述第三图像数据。
步骤S103、根据所述第三图像数据生成目标图像。
对所述第三图像数据的处理操作可以包括但不限于如图6中所示的钳制处理、拉伸处理、拼接处理等具体操作。
具体地,步骤S103可以包括如图7所示的过程:
步骤S1031、对所述第三图像数据进行钳制处理,得到第二钳制数据。
钳制处理是将所述第三图像数据钳制到[0,1]之间,将所述第三图像数据中大于1的数据全部设置为1,从而达到防止过曝的目的。
步骤S1032、对所述第二钳制数据进行拉伸处理,得到拉伸数据。
拉伸处理是将所述第二钳制数据拉伸到整个像素值区间,将所述第二钳制数据乘以存储图像数据的最大数值即可得到所述拉伸数据。如前所述,单反相机存储图像通常为14位,其最大数值为16383,手机存储图像通常为8位,其最大数值为255。
步骤S1033、采用线性加权融合方法对所述拉伸数据进行拼接,生成所述目标图像。
如图8所示,本实施例中可以采用如下式所示的线性加权融合模型对所述拉伸数据进行拼接:
其中,图8中的[0,x2]为图像a的长度,[x1,x3]为图像b的长度,图像a和图像b分别为两个待融合的图像,[x1,x2]为图像的重合区域,[0,x3]为图像a和图像b融合后的图像长度,x1为两张图像重叠处的左边界,x2为两张图像重叠处的右边界,x为两张图像重叠处的具体某一列位置,wa为该位置上图像a的融合权重,wb为该位置上图像b的融合权重,xa为该位置上a图像上的数据,xb为该位置上b图像上的数据,xmerge为该位置上融合后的图像数据。
图9所示为使用本实施例中所述的暗光成像方法的效果对比图,其中,左侧图像为在暗光条件下,快门时间为80ms的原始输出,中间图像为现有技术的最终成像结果,右侧图像为使用本实施例中所述的暗光成像方法的最终成像结果,可见,该方法在暗光条件下能够生成更加清晰的图像。
综上所述,本发明首先对第一图像数据进行预处理操作,得到第二图像数据,所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据,然后使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据,最后根据所述第三图像数据生成目标图像。本发明通过一个深度神经网络来学习低照度下单帧原始数据的图像处理流程,可对极暗环境下的短曝光单帧图像数据进行处理,其处理生成的图像具有较高的信噪比和较低的噪声,能够呈现更好的视觉效果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种暗光成像方法,图10示出了本发明实施例提供的一种暗光成像装置的一个实施例结构图。
本实施例中,一种暗光成像装置可以包括:
预处理模块1001,用于对第一图像数据进行预处理操作,得到第二图像数据,所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据;
深度神经网络处理模块1002,用于使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据;
目标图像生成模块1003,用于根据所述第三图像数据生成目标图像。
进一步地,所述深度神经网络包括特征提取层、下采样层、中间处理层和上采样层,所述深度神经网络处理模块可以包括:
特征提取单元,用于使用所述特征提取层提取出所述第二图像数据的图像特征;
下采样单元,用于使用所述下采样层逐步从所述图像特征中提取出高阶特征;
中间处理单元,用于使用所述中间处理层获取所述高阶特征中的细节纹理信息和感知特征;
上采样单元,用于使用所述上采样层对所述细节纹理信息和感知特征进行双线性插值和通道压缩,得到所述第三图像数据。
进一步地,所述暗光成像装置还可以包括:
训练样本集合获取模块,用于获取预设的训练样本集合,所述训练样本集合中的每个训练样本均包括输入图像数据和输出图像数据,所述输入图像数据为曝光时长小于预设的第一时长阈值的图像数据,所述输出图像数据为曝光时长大于预设的第二时长阈值的图像数据,所述第一时长阈值小于所述第二时长阈值;
样本训练模块,用于使用所述训练样本集合对所述深度神经网络进行训练,将所述输入图像数据作为所述深度神经网络的输入,将所述输入图像数据作为所述深度神经网络的预期输入;
参数调整模块,用于采用MS-SSIM损失函数和Adam优化器训练调整所述网络模型的网络参数直至收敛,得到训练好的深度神经网络。
进一步地,所述预处理模块可以包括:
颜色通道分离单元,用于对所述第一图像数据进行颜色通道分离处理,得到通道分离数据;
黑电平校正单元,用于对所述通道分离数据进行黑电平校正处理,得到校正数据;
归一化处理单元,用于对所述校正数据进行归一化处理,得到归一化数据;
放大处理单元,用于对所述归一化数据进行放大处理,得到放大数据;
第一钳制处理单元,用于对所述放大数据进行钳制处理,得到第一钳制数据;
裁剪处理单元,用于将所述第一钳制数据进行裁剪处理,得到所述第二图像数据。
进一步地,所述目标图像生成模块可以包括:
第二钳制处理单元,用于对所述第三图像数据进行钳制处理,得到第二钳制数据;
拉伸处理单元,用于对所述第二钳制数据进行拉伸处理,得到拉伸数据;
拼接处理单元,用于采用线性加权融合方法对所述拉伸数据进行拼接,生成所述目标图像。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图11示出了本发明实施例提供的一种终端设备的示意框图,为了便于说明,仅示出了与本发明实施例相关的部分。
如图11所示,该实施例的终端设备11包括:处理器110、存储器111以及存储在所述存储器111中并可在所述处理器110上运行的计算机程序112。所述处理器110执行所述计算机程序112时实现上述各个暗光成像方法实施例中的步骤,例如图1所示的步骤S101至步骤S103。或者,所述处理器110执行所述计算机程序112时实现上述各装置实施例中各模块/单元的功能,例如图10所示模块1001至模块1003的功能。
示例性的,所述计算机程序112可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器111中,并由所述处理器110执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序112在所述终端设备11中的执行过程。
所述终端设备11可以是手机、平板电脑、桌上型计算机、笔记本及云端服务器等计算设备。本领域技术人员可以理解,图11仅仅是终端设备11的示例,并不构成对终端设备11的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备11还可以包括输入输出设备、网络接入设备、总线等。
所述处理器110可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器111可以是所述终端设备11的内部存储单元,例如终端设备11的硬盘或内存。所述存储器111也可以是所述终端设备11的外部存储设备,例如所述终端设备11上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器111还可以既包括所述终端设备11的内部存储单元也包括外部存储设备。所述存储器111用于存储所述计算机程序以及所述终端设备11所需的其它程序和数据。所述存储器111还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (9)
1.一种暗光成像方法,其特征在于,包括:
对第一图像数据进行预处理操作,得到第二图像数据,所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据;
使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据;
根据所述第三图像数据生成目标图像;
所述对第一图像数据进行预处理操作,得到第二图像数据包括:
对所述第一图像数据进行颜色通道分离处理,得到通道分离数据;
对所述通道分离数据进行黑电平校正处理,得到校正数据;
对所述校正数据进行归一化处理,得到归一化数据;
对所述归一化数据进行放大处理,得到放大数据;
对所述放大数据进行钳制处理,得到第一钳制数据;
将所述第一钳制数据进行裁剪处理,得到所述第二图像数据。
2.根据权利要求1所述的暗光成像方法,其特征在于,所述深度神经网络包括特征提取层、下采样层、中间处理层和上采样层,所述使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据包括:
使用所述特征提取层提取出所述第二图像数据的图像特征;
使用所述下采样层逐步从所述图像特征中提取出高阶特征;
使用所述中间处理层获取所述高阶特征中的细节纹理信息和感知特征;
使用所述上采样层对所述细节纹理信息和感知特征进行双线性插值和通道压缩,得到所述第三图像数据。
3.根据权利要求1所述的暗光成像方法,其特征在于,所述深度神经网络的训练过程包括:
获取预设的训练样本集合,所述训练样本集合中的每个训练样本均包括输入图像数据和输出图像数据,所述输入图像数据为曝光时长小于预设的第一时长阈值的图像数据,所述输出图像数据为曝光时长大于预设的第二时长阈值的图像数据,所述第一时长阈值小于所述第二时长阈值;
使用所述训练样本集合对所述深度神经网络进行训练,将所述输入图像数据作为所述深度神经网络的输入,将所述输出图像数据作为所述深度神经网络的预期输出;
采用MS-SSIM损失函数和Adam优化器训练调整所述网络模型的网络参数直至收敛,得到训练好的深度神经网络。
4.根据权利要求1至3中任一项所述的暗光成像方法,其特征在于,所述根据所述第三图像数据生成目标图像包括:
对所述第三图像数据进行钳制处理,得到第二钳制数据;
对所述第二钳制数据进行拉伸处理,得到拉伸数据;
采用线性加权融合方法对所述拉伸数据进行拼接,生成所述目标图像。
5.一种暗光成像装置,其特征在于,包括:
预处理模块,用于对第一图像数据进行预处理操作,得到第二图像数据,所述第一图像数据为在光照强度小于预设的光强阈值的环境中采集的图像数据;
深度神经网络处理模块,用于使用预设的深度神经网络对所述第二图像数据进行处理,得到第三图像数据;
目标图像生成模块,用于根据所述第三图像数据生成目标图像;
所述预处理模块包括:
颜色通道分离单元,用于对所述第一图像数据进行颜色通道分离处理,得到通道分离数据;
黑电平校正单元,用于对所述通道分离数据进行黑电平校正处理,得到校正数据;
归一化处理单元,用于对所述校正数据进行归一化处理,得到归一化数据;
放大处理单元,用于对所述归一化数据进行放大处理,得到放大数据;
第一钳制处理单元,用于对所述放大数据进行钳制处理,得到第一钳制数据;
裁剪处理单元,用于将所述第一钳制数据进行裁剪处理,得到所述第二图像数据。
6.根据权利要求5所述的暗光成像装置,其特征在于,所述深度神经网络包括特征提取层、下采样层、中间处理层和上采样层,所述深度神经网络处理模块包括:
特征提取单元,用于使用所述特征提取层提取出所述第二图像数据的图像特征;
下采样单元,用于使用所述下采样层逐步从所述图像特征中提取出高阶特征;
中间处理单元,用于使用所述中间处理层获取所述高阶特征中的细节纹理信息和感知特征;
上采样单元,用于使用所述上采样层对所述细节纹理信息和感知特征进行双线性插值和通道压缩,得到所述第三图像数据。
7.根据权利要求5所述的暗光成像装置,其特征在于,所述暗光成像装置还包括:
训练样本集合获取模块,用于获取预设的训练样本集合,所述训练样本集合中的每个训练样本均包括输入图像数据和输出图像数据,所述输入图像数据为曝光时长小于预设的第一时长阈值的图像数据,所述输出图像数据为曝光时长大于预设的第二时长阈值的图像数据,所述第一时长阈值小于所述第二时长阈值;
样本训练模块,用于使用所述训练样本集合对所述深度神经网络进行训练,将所述输入图像数据作为所述深度神经网络的输入,将所述输出图像数据作为所述深度神经网络的预期输出;
参数调整模块,用于采用MS-SSIM损失函数和Adam优化器训练调整所述网络模型的网络参数直至收敛,得到训练好的深度神经网络。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至4中任一项所述的暗光成像方法的步骤。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至4中任一项所述的暗光成像方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910407527.9A CN111953888B (zh) | 2019-05-16 | 2019-05-16 | 暗光成像方法、装置、计算机可读存储介质及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910407527.9A CN111953888B (zh) | 2019-05-16 | 2019-05-16 | 暗光成像方法、装置、计算机可读存储介质及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111953888A CN111953888A (zh) | 2020-11-17 |
CN111953888B true CN111953888B (zh) | 2021-12-24 |
Family
ID=73335866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910407527.9A Active CN111953888B (zh) | 2019-05-16 | 2019-05-16 | 暗光成像方法、装置、计算机可读存储介质及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111953888B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112802139A (zh) * | 2021-02-05 | 2021-05-14 | 歌尔股份有限公司 | 一种图像处理方法、装置、电子设备及可读存储介质 |
CN113542591A (zh) * | 2021-06-02 | 2021-10-22 | 惠州Tcl移动通信有限公司 | 缩时摄影处理方法、装置、移动终端及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875751A (zh) * | 2017-11-02 | 2018-11-23 | 北京旷视科技有限公司 | 图像处理方法和装置、神经网络的训练方法、存储介质 |
CN108965731A (zh) * | 2018-08-22 | 2018-12-07 | Oppo广东移动通信有限公司 | 一种暗光图像处理方法及装置、终端、存储介质 |
CN109118447A (zh) * | 2018-08-01 | 2019-01-01 | Oppo广东移动通信有限公司 | 一种图片处理方法、图片处理装置及终端设备 |
JP2019026256A (ja) * | 2017-07-25 | 2019-02-21 | メクラ・ラング・ゲーエムベーハー・ウント・コー・カーゲーMEKRA Lang GmbH & Co. KG | 車両用の間接視システム |
CN109389120A (zh) * | 2018-10-29 | 2019-02-26 | 济南浪潮高新科技投资发展有限公司 | 一种基于zynqMP的目标检测装置 |
-
2019
- 2019-05-16 CN CN201910407527.9A patent/CN111953888B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019026256A (ja) * | 2017-07-25 | 2019-02-21 | メクラ・ラング・ゲーエムベーハー・ウント・コー・カーゲーMEKRA Lang GmbH & Co. KG | 車両用の間接視システム |
CN108875751A (zh) * | 2017-11-02 | 2018-11-23 | 北京旷视科技有限公司 | 图像处理方法和装置、神经网络的训练方法、存储介质 |
CN109118447A (zh) * | 2018-08-01 | 2019-01-01 | Oppo广东移动通信有限公司 | 一种图片处理方法、图片处理装置及终端设备 |
CN108965731A (zh) * | 2018-08-22 | 2018-12-07 | Oppo广东移动通信有限公司 | 一种暗光图像处理方法及装置、终端、存储介质 |
CN109389120A (zh) * | 2018-10-29 | 2019-02-26 | 济南浪潮高新科技投资发展有限公司 | 一种基于zynqMP的目标检测装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111953888A (zh) | 2020-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ignatov et al. | Replacing mobile camera isp with a single deep learning model | |
US11107205B2 (en) | Techniques for convolutional neural network-based multi-exposure fusion of multiple image frames and for deblurring multiple image frames | |
US20230080693A1 (en) | Image processing method, electronic device and readable storage medium | |
CN110675336A (zh) | 一种低照度图像增强方法及装置 | |
CN111598799A (zh) | 图像调色增强方法和图像调色增强神经网络训练方法 | |
CN113228094A (zh) | 图像处理器 | |
CN111372006B (zh) | 一种面向移动端的高动态范围成像方法及系统 | |
CN113674159A (zh) | 图像处理方法、装置、电子设备及可读存储介质 | |
WO2023202200A1 (zh) | 一种重建hdr图像的方法、终端及电子设备 | |
CN111953888B (zh) | 暗光成像方法、装置、计算机可读存储介质及终端设备 | |
CN111383188B (zh) | 一种图像处理方法、系统及终端设备 | |
CN112602088A (zh) | 提高弱光图像的质量的方法、系统和计算机可读介质 | |
CN113052768B (zh) | 一种处理图像的方法、终端及计算机可读存储介质 | |
CN113450290A (zh) | 基于图像修补技术的低照度图像增强方法及系统 | |
CN113781318A (zh) | 一种图像颜色映射方法、装置、终端设备及存储介质 | |
CN110838088B (zh) | 一种基于深度学习的多帧降噪方法、装置及终端设备 | |
CN110717864B (zh) | 一种图像增强方法、装置、终端设备及计算机可读介质 | |
CN112308785A (zh) | 图像去噪方法、存储介质及终端设备 | |
WO2022247232A1 (zh) | 一种图像增强方法、装置、终端设备及存储介质 | |
CN117391987A (zh) | 基于多阶段联合增强机制的暗光图像处理方法 | |
CN110971837B (zh) | 基于ConvNets的暗光图像处理方法及终端设备 | |
CN111383171B (zh) | 一种图片处理方法、系统及终端设备 | |
CN111754412A (zh) | 构建数据对的方法、装置及终端设备 | |
CN111382772B (zh) | 一种图像处理方法、装置及终端设备 | |
CN112087556B (zh) | 一种暗光成像方法、装置、可读存储介质及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |