基于人工智能的多曝光图像融合方法及系统
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的多曝光图像融合方法及系统。
背景技术
在同一场景不同光线下得到的图像,无论图像的曝光时间长短,都会出现曝光过度或曝光不足的现象,这样会造成图像信息少,重要信息丢失等问题。
高动态范围(HDR)技术目的是产生类似于人类感知的高质量图像,HDR图像获取有三种传统方法:1、使用兼容HDR的捕获和显示设备;2、使用色调映射操作符将HDR映射到LDR显示器上;3、使用多曝光LDR融合(MEF)为LDR屏幕创建类似HDR的内容。前两种方法对于硬件的成本比较高,而第三种方法使用MEF的成本明显低于前两种方法,还可以避免与色调映射相关的问题,如主观对比度低和颜色饱和度低等。
但传统MEF需要通过使用参数设置解决曝光权重的尺度问题,该参数通常为通过一些相关软件或者人为调节制定的一个固定参数。但对于不同图像的不同曝光程度所适用的参数不同,设定的固定参数并不能适用于各个情况下的曝光图像,所融合的图像在图像细节丢失方面仍存在一些问题,导致最终合成的图像质量相对较低。
发明内容
本发明的目的在于提供一种基于人工智能的多曝光图像融合方法及系统,以解决采用现有的图像融合方法导致最终合成的图像质量较差的问题。
为了解决上述技术问题,本发明所采用的技术方案具体如下:
本发明提供了一种基于人工智能的多曝光图像融合方法,该方法包括以下步骤:
获取N张不同曝光度的图像;
分别对每张图像进行主成分分析,得到每张图像对应的主成分权重图;
根据每张图像的曝光时长,分别计算每张图像中各个像素点的曝光权重,得到每张图像对应的自适应曝光权重图;
分别对每张图像进行显著性分析,计算每张图像中各个像素点的显著值,得到每张图像对应的显著性权重图;
根据N张不同曝光度的图像以及每张图像对应的主成分权重图、自适应曝光权重图和显著性权重图,对N张不同曝光度的图像进行融合,生成HDR图像。
进一步地,所述分别对每张图像进行主成分分析,得到每张图像对应的主成分权重图的步骤包括:
分别对每张图像进行矢量化处理,得到每张图像对应的特征矩阵;
利用PCA算法,分别对每张图像对应的特征矩阵进行降维处理,得到降维后的特征矩阵;
利用降维后的特征矩阵,进行图像重构,从而得到每张图像对应的PCA重构图;
获取每张图像的RGB三通道图像以及每张图像对应的PCA重构图的RGB三通道图像,并将每张图像的RGB三通道图像与其对应的PCA重构图的RGB三通道图像进行比较,从而得到每张图像和与其对应的PCA重构图之间的RGB三通道差值图像;
根据每张图像和与其对应的PCA重构图之间的RGB三通道差值图像,得到每张图像对应的主成分权重图;
对每张图像对应的主成分权重图进行极差归一化,从而得到最终的每张图像对应的主成分权重图。
进一步地,所述根据每张图像的曝光时长,分别计算每张图像中各个像素点的曝光权重,得到每张图像对应的自适应曝光权重图的步骤包括:
分别对N张不同曝光度的图像进行颜色空间转换,得到图像中每个像素点对应的L通道亮度值;
对图像中每个像素点对应的L通道亮度值进行归一化,得到归一化处理后的图像中每个像素点对应的L通道亮度值;
根据归一化处理后的图像中每个像素点对应的L通道亮度值,计算图像中所有像素点对应的L通道亮度值的标准差和平均值;
根据归一化处理后的图像中每个像素点对应的L通道亮度值,图像中所有像素点对应的L通道亮度值的标准差和平均值,计算图像中每个像素点对应的曝光权重,从而得到每张图像对应的自适应曝光权重图。
进一步地,所述计算图像中每个像素点对应的曝光权重对应的公式为:
其中,An为图像中的第n个像素点对应的曝光权重,μY为图像中所有像素点对应的L通道亮度值的平均值,σY为图像中所有像素点对应的L通道亮度值的标准差,Yn为图像中的第n个像素点对应的L通道亮度值。
进一步地,所述分别对每张图像进行显著性分析,计算每张图像中各个像素点的显著值,得到每张图像对应的显著性权重图的步骤包括:
分别对N张不同曝光度的图像进行高斯平滑,得到平滑后的图像;
对每张平滑后的图像进行颜色空间转换,得到每张图像中各个像素点对应的Lab颜色特征;
计算高斯平滑后的每张图像对应的Lab颜色特征的均值,并根据高斯平滑后的每张图像对应的Lab颜色特征以及均值,计算每张图像中各个像素点的显著值,并对各个像素点的显著值进行归一化处理,从而得到每张图像对应的显著性权重图。
进一步地,所述对N张不同曝光度的图像进行融合,生成HDR图像的步骤包括:
将N张不同曝光度的图像以及每张图像对应的主成分权重图、自适应曝光权重图和显著性权重图输入到预先构建和训练好的融合神经网络中,由融合神经网络输出HDR图像。
进一步地,所述融合神经网络的构建和训练的步骤包括:
构造融合神经网络,所述融合神经网络包括N个编码器和一个解码器,每个编码器均与解码器相连接;
构造融合神经网络的目标函数,所述目标函数包括重构损失函数;
构造融合神经网络的训练数据集,所述训练数据集包括M组训练图像,每组训练图像包括N张不同曝光度的图像以及每张图像对应的主成分权重图、自适应曝光权重图和显著性权重图,并为M组训练图形制作标签;
根据融合神经网络的目标函数,利用融合神经网络的训练数据集对融合神经网络进行训练,从而得到训练好的融合神经网络。
进一步地,所述重构损失函数的公式为:
Loss=1-SSIM(Image,HDR)
其中,SSIM(Image,HDR)为结构相似函数,Loss为重构损失函数,HDR为标签数据,Image为重构HDR图像。
本发明还提供了一种基于人工智能的多曝光图像融合系统,包括处理器和存储器,处理器用于处理存储在存储器中的指令以实现上述的基于人工智能的多曝光图像融合方法。
本发明具有如下有益效果:
本发明通过计算每一张图像的主成分权重图、自适应曝光权重图和显著性权重图获取多曝光图像的融合权重,这就为不同曝光度的图像确定了不同的融合权重,即根据图像的不同曝光情况,可以自适应确定每张图像不同的融合权重,并根据每张图像各自所对应的融合权重来进行图像融合,这样就避免了现有技术中不同曝光度的图像进行融合时仅仅根据一个固定参数进行融合,进而忽略了图像曝光度的不同对最终获取的融合图像质量的影响,有效提高了最终融合图像的质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明基于人工智能的多曝光图像融合方法的流程图;
图2为本发明三张不同曝光图像的示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的技术方案的具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
步骤1:获取N张不同曝光度的图像。
在感光度、光圈大小一样的情况下,拍摄N张不同快门速度的照片,所拍摄的N张照片的内容一致,但N张照片对应的曝光度有所不同。在本实施例中,设置N=3,对应的应该获取3张不同曝光度的图像,这三张照片分别称为第一曝光图像、第二曝光图像和第三曝光图像,分别记为图像A、图像B和图像C。
步骤2:分别对每张图像进行主成分分析,得到每张图像对应的主成分权重图。
将三张不同曝光图像在RGB三个通道分量的灰度图进行矢量化,矢量化为三个(w*h)的矩阵,其中,三个矩阵分别为R通道上的灰度图,G通道上的灰度图,B通道上的灰度图,w和h分别表示每个图像矢量化后所得矩阵的行数和列数。利用PCA主成分分析方法对三个(w*h)矩阵进行主成分提取,以便于利用提取的主成分对三个(w*h)矩阵进行降维。由于利用PCA主成分分析方法分别对三个矩阵进行主成分提取的具体过程属于现有技术,此处不再做详细描述。在本实施例中,PCA所提取的主成分维度为1024,即保留每个矩阵的前1024个主成分,然后得到降维后的矩阵。再将降维后的矩阵转换到原空间,那么对应每一张图像,就可以得到该张图像对应的PCA重构图,通过前1024个主成分恢复出的重构图为原图像的主要信息。
通过上述步骤,可以得到三张不同曝光图像所对应的三张PCA重构图,这里将图像A、图像B和图像C所对应的三张PCA重构图分别记为图像A′、图像B′和图像C′。将图像A′、图像B′和图像C′各自在RGB通道上的三张灰度图像与三张不同曝光图像各自在RGB通道上的三张灰度图像一一对应进行差值计算,也就是,将图像A′在RGB通道上的三张灰度图像与图像A在RGB通道上的三张灰度图像一一对应进行差值计算,将图像B′在RGB通道上的三张灰度图像与图像B在RGB通道上的三张灰度图像一一对应进行差值计算,将图像C′在RGB通道上的三张灰度图像与图像C在RGB通道上的三张灰度图像一一对应进行差值计算,每一次差值计算都能够得到三张差值图,对这三张差值图相加求均值,得到一张最终的差值图,对应的计算公式如下:
其中,imagei为每一张图像在RGB其中一个通道上所对应的灰度图,i=R、G或B,也就是,imagei为图像A、图像B或图像C在RGB其中一个通道上所对应的灰度图,image′i为该图像对应的PCA重构图在RGB对应一个通道上所对应的灰度图,也就是,H为最终的差值图,最终的差值图H中,像素点所对应的灰度值越小,表示PCA重构的越好,PCA重构图像的像素越接近主成分。
对三张最终的差值图分别进行极差归一化,计算公式如下:
其中,max()为取最大值函数,min()为取最小值函数,hk为最终的差值图H中第k个像素点对应的灰度值,Xk为归一化后的最终的差值图H中第k个像素点对应的灰度值。
通过上述极差归一化,使最终的差值图H中任意一个像素点对应的灰度值范围在[0,1]之间。最终的差值图H经过上述归一化后得到的图像为主成分权重图,主成分权重图中,Xk越大,表示该图像中像素点的灰度值越接近主成分的灰度值。
步骤3:根据每张图像的曝光时长,分别计算每张图像中各个像素点的曝光权重,得到每张图像对应的自适应曝光权重图。
(3-1)对三张不同曝光图像进行颜色空间转换,转换为Lab颜色空间,Lab颜色空间中的L分量用于表示像素的亮度,取值范围为[0,100],表示从纯黑到纯白,并将Lab颜色空间的L通道进行归一化,需要说明,以下计算均是在L亮度通道上进行。
(3-2)根据归一化处理后的图像中每个像素点对应的L通道亮度值,计算图像中所有像素点对应的L通道亮度值的标准差σY和平均值μY,通过自适应权重高斯曲线对三张不同曝光图像在亮度通道进行曝光权重的计算,自适应权重高斯曲线为:
其中,An为图像中的第n个像素点所对应的曝光权重,μY为图像中所有像素点对应的L通道亮度值的平均值,σY为图像中所有像素点对应的L通道亮度值的标准差,Yn为图像中的第n个像素点对应的L通道亮度值。
上述步骤3的目的是,根据曝光图像中每个像素所对应的亮度值,分辨出曝光图像中的暗区域和亮区域,因此可以根据图像曝光度对曝光图像中的暗区域或亮区域赋予更大的权重来权衡整张曝光图像的权重。根据自适应权重高斯曲线可知,图像中越接近(1-μY)的像素其权重值越大,越接近(1-μY)的为黑暗或明亮像素,即长曝光图像中暗区域的曝光权重相对较大,短曝光图像中亮区域的曝光权重相对大。如图2所示,从左往右第一张图像为图像A1,第二张图像为图像B1,第三张图像为图像C1,三张图像的曝光度依次增强,即图像A1为短曝光图像,图像C1为长曝光图像。对于图像A1,由于亮区域的信息更加可靠、失真程度较低,因此对亮区域的曝光权重赋予更大的权重值,即短曝光图像中亮区域的曝光权重相对于暗区域的曝光权重较大;对于图像C1,由于暗区域的信息更加可靠、失真程度较低,因此对暗区域的曝光权重赋予更大的权重值,即长曝光图像中暗区域的曝光权重相对于亮区域的曝光权重较大。
通过上述自适应权重高斯曲线,可以获得三张不同曝光图像的每个像素位置的曝光权重,进而最终得到三张不同曝光图像的自适应曝光权重图。
步骤4:分别对每张图像进行显著性分析,计算每张图像中各个像素点的显著值,得到每张图像对应的显著性权重图。
通过FT算法从频率角度将三张不同曝光图像分为高频部分和低频部分,在本实施例中,显著性区域检测是在曝光图像的低频部分进行的,以下过程大多数是在曝光图像的低频部分进行的。
将三张不同曝光图像进行5*5的高斯平滑,将高斯平滑后的曝光图像的RGB转换到Lab颜色空间,Lab颜色空间中的L分量用于表示像素的亮度,取值范围为[0,100],表示从纯黑到纯白,a分量和b分量表示颜色对立维度。计算出三张曝光图像的任意一个像素点在L分量上的均值
在a分量上的均值
在b分量上的均值
将Lab分量上的均值
和
构成一个特征向量I
u,并将三张图像中任意一个像素点p在Lab分量上的值L、a、b分别构成一个特征向量I
WCH(p),计算出特征向量I
u与特征向量I
WCH(p)的欧氏距离,对应的计算公式如下:
S(p)=‖Iu-IWCH(p)‖
其中,Iu为三张曝光图像中的像素点p分别在Lab分量上的均值所构成的特征向量,IWCH(p)为其中一个图像的像素点p分别在Lab分量上的值所构成的特征向量,S(p)为该图像的像素点p所对应的特征向量Iu与特征向量IWCH(p)的欧氏距离。
在得出三个图像中的任意一个像素点的Lab欧氏距离之后,对该Lab欧氏距离值进行极差归一化,得到极差归一化后的欧氏距离,极差归一化后的欧氏距离值即为显著性权重值,根据三张图像中的任意一个像素点所对应的显著性权重值,即可得到每张图像所对应的显著性权重图。
通过显著性权重图,可以为图像中对观察者更具吸引力的区域分配更大的权重,突出图像中的显著区域,提高后续最终生成HDR图像的视觉吸引力和质量。
步骤5:根据N张不同曝光度的图像以及每张图像对应的主成分权重图、自适应曝光权重图和显著性权重图,对N张不同曝光度的图像进行融合,生成HDR图像。
其中,在本实施例中,为了生成HDR图像,将N张不同曝光度的图像以及每张图像对应的主成分权重图、自适应曝光权重图和显著性权重图输入到预先构建和训练好的融合神经网络中,由融合神经网络输出HDR图像。该融合神经网络对应的构建和训练过程如下:
构造融合神经网络,该融合神经网络包括N个编码器和一个解码器,每个编码器均与解码器相连接。在本实施例中,由于曝光图像有三张,所以融合神经网络包括三个编码器和一个解码器,编码器和解码器可采用Unet、FCN等网络结构。
构造融合神经网络的目标函数,该目标函数包括重构损失函数,重构损失函数采用重构损失Loss:
Loss=1-SSIM(Image,HDR)
其中,SSIM(Image,HDR)为结构相似函数,Loss为重构损失函数,HDR为标签数据,Image为重构HDR图像。
构造融合神经网络的训练数据集,该训练数据集包括多组训练图像,在本实施例中,每组训练图像均包括三张不同曝光图像和三张不同曝光图像对应的主成分权重图、自适应曝光权重图和显著性权重图。人为采集高质量的HDR图像,可以利用数码相机等具有高曝光设置范围的设备,也可以采用基于硬件的HDR图像收集方法来采集该高质量的HDR图像,并将采集到的该高质量的HDR图像作为训练数据集的标签数据。
根据融合神经网络的目标函数,利用构造的训练数据集对融合神经网络进行训练。在进行训练时,将每张曝光图像及其对应的主成分权重图、自适应曝光权重图和显著性权重图三张权重图像分别输入到融合神经网络中,融合神经网络的每一个编码器都会接收到一张图像及该张图像对应的主成分权重图、自适应曝光权重图和显著性权重图三张权重图像,每一个编码器将主成分权重图、自适应曝光权重图和显著性权重图三张权重图像进行Concatenate(联合),得到一张三通道权重图像,然后将该三通道权重图像与对应的图像(RGB图像)进行Concatenate(联合),最终得到六通道的权重图像。在得到六通道的权重图像后,编码器对该六通道的权重图像进行特征提取与拟合,并输出相应的特征图。融合神经网络的解码器对三个编码器的输出进行采样和特征拟合,从而重构出HDR图像。需要说明的,对于上述的重构损失函数Loss,由于结构相似函数SSIM综合了亮度、对比度和结构指标,这就考虑人类视觉的感知,可使最终经过融合神经网络重构出来的HDR图像与原始的曝光图像相比更具细节,图像质量更高。
另外,需要强调的是,上述步骤5的目的是利用预先构建和训练好的融合神经网络,以重构出HDR图像,而构建和训练融合神经网络的关键在于根据应用需要,确定出网络的模型结构,本实施例的网络模型的结构为N个编码器和一个解码器,以及确定网络的训练数据集和标签数据,而至于训练过程中的详细细节属于现有技术,此处不再进行详细描述。
本实施例还提供了一种基于人工智能的多曝光图像融合系统,包括处理器和存储器,处理器用于处理存储在存储器中的指令以实现基于人工智能的多曝光图像融合方法,由于基于人工智能的多曝光图像融合方法在上文已做出详细说明,此处不再赘述。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。