CN109919887A

CN109919887A - 一种基于深度学习的无监督图像融合方法

Info

Publication number: CN109919887A
Application number: CN201910137041.8A
Authority: CN
Inventors: 李阳; 王继霄; 苗壮; 王家宝; 张睿; 卢继荣
Original assignee: Army Engineering University of PLA
Current assignee: Army Engineering University of PLA
Priority date: 2019-02-25
Filing date: 2019-02-25
Publication date: 2019-06-21
Anticipated expiration: 2039-02-25
Also published as: CN109919887B

Abstract

一种基于深度学习的无监督图像融合方法，包括如下步骤：获取可见光和红外图像，并利用计算机对图像进行预处理，构建一个用于训练图像融合网络的数据集，数据集中包含成对的红外和可见光图像；构造一个轻量级的深度卷积神经网络，网络可以实现将输入的可见光和红外图像进行加权融合和解码还原；构造一个混合损失函数，混合损失函数包括图像的生成损失和结构损失，利用该混合损失函数训练深度卷积神经网络，获得深度图像融合网络模型参数；模型学习完毕后，去掉解码网络，即可利用该网络输入可见光和红外图像，网络的输出即为融合之后的图像。本发明实现了轻量级的图像融合方法，在有限计算资源的移动设备和嵌入式设备中能够达到高质量的融合效果。

Description

一种基于深度学习的无监督图像融合方法

技术领域

本发明属于图像处理技术领域，具体涉及一种基于深度学习的无监督图像融合方法。

背景技术

随着信息技术的发展，数字图像被广泛适用于各种场景中。但多种传感器的使用，同时也带来了信息的冗余与分析复杂性的增加。如何更好的综合利用多源传感信息，将多源冗余信息合并，同时构建出内容更加丰富的融合信息，已经成为科学家们亟待解决的关键问题。图像融合是复杂探测系统的关键问题之一，其目的是利用特定的算法将同一场景的多源图像综合成一幅信息更加完整的新图像。虽然图像融合经过了长时间的研究，但由于在实际运用中仍存在局限性，当前的融合策略只适用于特定的场合和特定和角度。

为了解决上述关键问题，近年来大量的研究者希望利用深度学习的方式，让计算机通过深度卷积网络来对图像进行融合的算法。但由于深度卷积神经网络模型结构复杂，且融合策略过于单一，在实际应用中模型需要大量的存储和计算资源，很难应用到手机等移动终端中。同时，由于图像融合结果没有严格的评价指标，很难通过有监督信息进行学习。因此，图像融合方法急需轻量级的无监督方法，实现在有限计算资源的移动设备和嵌入式设备中达到高质量的融合效果。

发明内容

本发明针对现有技术中的不足，提供一种基于深度学习的无监督图像融合方法。

为实现上述目的，本发明采用以下技术方案：

一种基于深度学习的无监督图像融合方法，其特征在于，包括如下步骤：

步骤S1、获取红外和可见光图像，并利用计算机对图像进行预处理，构建一个用于训练图像融合网络的数据集，该数据集中包含成对的红外和可见光图像；

步骤S2、构造一个轻量级深度卷积神经网络，该深度卷积神经网络可以实现将输入的红外和可见光图像进行加权融合和解码还原；

步骤S3、构造一个混合损失函数，该混合损失函数包括图像的生成损失和结构损失，利用混合损失函数训练深度卷积神经网络，获得深度图像融合网络模型参数；

步骤S4、深度图像融合网络模型学习完毕后，去掉解码网络，利用该网络输入红外和可见光图像，网络的输出即为融合之后的图像。

为优化上述技术方案，采取的具体措施还包括：

进一步地，步骤S1中，获取的红外和可见光图像是成对的，是在同一机位和同一时刻拍摄的，不同数据源获取的多源图像无需缩放至同一尺度大小。

进一步地，步骤S1中，构建训练数据集时，当数据集规模包含预设数量的多源图像时，停止收集数据。

进一步地，步骤S2中，轻量级深度卷积神经网络由两部分单位构成，分别为编码单元和解码单元，编码单元和解码单元均依次由单点卷积层、单层卷积层和单点卷积层构成，单点卷积层和单层卷积层之间加入批量归一化与非线性激活函数；给定一对红外和可见光图像，经过该编码单元后输出融合图像；给定融合图像，经过该解码单元后输出对应的一对红外和可见光图像。

进一步地，步骤S3具体包括：

构建生成损失，该损失L_p为：L_p＝||O-I||₂，其中O表示输出的红外和可见光图像，I表示输入的红外和可见光图像；

构建结构损失，即图像融合后和原输入的红外和可见光图像之间的SSIM差异损失，该损失L_ssim为：L_ssim＝1-SSIM(O，I)，其中SSIM表示结构相似性计算函数；

构建优化目标函数，该优化目标函数为混合损失函数：L＝λL_ssim+L_p，其中λ为比例系数；

利用反向传播算法，求解目标函数关于系数的偏导数，同时对深度卷积神经网络各层参数利用随机梯度下降进行参数更新学习。

进一步地，步骤S4中，模型学习得到模型参数后，直接去掉网络中的解码单元；通过输入任意一对红外和可见光图像，网络对输入图像进行计算，输出融合图像。

本发明的有益效果是：通过无监督学习方法，实现了轻量级的图像融合，在有限计算资源的移动设备和嵌入式设备中达到高质量的融合效果。

附图说明

图1为本发明基于深度学习的轻量级无监督图像融合方法流程图。

图2为本发明轻量级深度卷积神经网络模型结构图。

具体实施方式

现在结合附图对本发明作进一步详细的说明。

如图1所示的一种基于基于深度学习的轻量级无监督图像融合方法，包括以下步骤：

步骤S1：获取可见光和红外图像，并利用计算机对图像进行预处理，构建一个用于训练图像融合网络的数据集，数据集中包含成对红外和可见光图像。

在本实施方式中，获取的红外和可见光图像需是成对的，即在同一机位和同一时刻拍摄的，不同数据源获取的图像无需缩放至同一尺度大小；构建训练数据集时，当数据集规模包含预设数量的图像时，停止收集数据。

具体地，在步骤S1中包括如下内容：

1.1、对于需要采集的红外和可见光图像需是成对的，即同一机位同一时刻采集的；

1.2、成对红外和可见光图像的收集可以从传感器获得；

1.3、不同数据源获取的图像无需缩放至同一尺度大小；

1.4、采用上述方法构建训练数据集，当数据集规模包含预设数量的图像时，可停止收集数据。

步骤S2：构造一个轻量级的深度卷积神经网络，网络可以实现将输入的可见光和红外图像进行加权融合和解码还原。

在本实施方式中，轻量级深度卷积神经网络由两部分单位构成，分别为编码单元和解码单元，编码单元和解码单元依次由单点卷积层、单层卷积层和单点卷积层构成，单点卷积层和单层卷积层之间加入批量归一化与非线性激活单元；给定一对红外和可见光图像，经过该编码单元后输出融合图像；给定融合图像，经过该解码单元后输出对应的一对红外和可见光图像。

具体地，轻量级深度卷积神经网络结构参见图2，在步骤S2中包括如下内容：

输入图像为红外和可见光图像，输入图像首先经过编码单元，通过编码单元分别提取红外图像和可见光图像的特征信息，而后通过预设的融合策略将两部分特征信息进行融合输出融合图像；将融合图像输入到解码单元中，由解码单元将图像信息进行解码生成红外和可见光图像。

步骤S3：构造一个混合损失函数，混合损失函数包括图像的生成损失和结构损失，利用该混合损失函数训练深度卷积神经网络，获得深度图像融合网络模型参数。

在本实施方式中，图像融合的混合损失函数包括生成损失和结构损失。通过生成损失可以比对解码后的红外和可见光图像和原图像之间的差异，可以保证融合后图像保留了原图像的关键信息；通过结构损失可以比对融合图像和原图像之间的结构差异，使得融合后的图像的评价指标较高。

具体地，在步骤S3中包括如下步骤：

构建生成损失，该损失为：L_p＝||O-I||₂，其中O表示输出的红外和可见光图像，I表示输入的红外和可见光图像；

构建结构损失，即图像融合后和原输入的红外和可见光图像之间的SSIM差异损失，该损失为：L_ssim＝1-SSIM(O，I)，其中SSIM表示结构相似性计算函数；

步骤S4：模型学习完毕后，去掉解码网络，即可利用该网络输入可见光和红外图像，网络的输出即为融合之后的图像。

在本实施方式中，模型学习得到模型参数后，直接去掉网络中的解码单元；通过输入任意一对红外和可见光图像，网络将对输入图像进行计算，输出融合图像。

需要注意的是，发明中所引用的如“上”、“下”、“左”、“右”、“前”、“后”等的用语，亦仅为便于叙述的明了，而非用以限定本发明可实施的范围，其相对关系的改变或调整，在无实质变更技术内容下，当亦视为本发明可实施的范畴。

以上仅是本发明的优选实施方式，本发明的保护范围并不仅局限于上述实施例，凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理前提下的若干改进和润饰，应视为本发明的保护范围。

Claims

1.一种基于深度学习的无监督图像融合方法，其特征在于，包括如下步骤：

2.如权利要求1所述的一种基于深度学习的无监督图像融合方法，其特征在于：步骤S1中，获取的红外和可见光图像是成对的，是在同一机位和同一时刻拍摄的，不同数据源获取的多源图像无需缩放至同一尺度大小。

3.如权利要求1所述的一种基于深度学习的无监督图像融合方法，其特征在于：步骤S1中，构建训练数据集时，当数据集规模包含预设数量的多源图像时，停止收集数据。

4.如权利要求1所述的一种基于深度学习的无监督图像融合方法，其特征在于：步骤S2中，轻量级深度卷积神经网络由两部分单位构成，分别为编码单元和解码单元，编码单元和解码单元均依次由单点卷积层、单层卷积层和单点卷积层构成，单点卷积层和单层卷积层之间加入批量归一化与非线性激活函数；给定一对红外和可见光图像，经过该编码单元后输出融合图像；给定融合图像，经过该解码单元后输出对应的一对红外和可见光图像。

5.如权利要求1所述的一种基于深度学习的无监督图像融合方法，其特征在于：步骤S3具体包括：

6.如权利要求1所述的一种基于深度学习的无监督图像融合方法，其特征在于：步骤S4中，模型学习得到模型参数后，直接去掉网络中的解码单元；通过输入任意一对红外和可见光图像，网络对输入图像进行计算，输出融合图像。