CN111145131B

CN111145131B - 一种基于多尺度生成式对抗网络的红外和可见光图像融合方法

Info

Publication number: CN111145131B
Application number: CN201911187619.7A
Authority: CN
Inventors: 周勇; 张迪; 赵佳琦; 夏士雄; 周子渊; 姚睿; 刘兵; 杜文亮
Original assignee: China University of Mining and Technology CUMT
Current assignee: China University of Mining and Technology CUMT
Priority date: 2019-11-28
Filing date: 2019-11-28
Publication date: 2023-05-26
Anticipated expiration: 2039-11-28
Also published as: CN111145131A

Abstract

本发明公开了一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，解决由光谱分辨率和空间分辨率制约以及物理条件的限制，红外图像具有很高的光谱分辨率而其空间分辨率却较低的问题。包括：第一阶段，构造生成式对抗网络模型，利用高分辨率可见光图像生成高质量红外图像，一方面红外图像数据得到了增强扩充，另一方面提高了红外图像的分辨率；第二阶段，通过高分辨率可见光图像与其低通版本的差乘以增益因子获得空间细节信息，然后将提取到的空间细节信息注入到第一阶段生成后的高分辨率红外图像中，最终得到融合后的高分辨率图像，使得融合图像可以同时保持红外图像中的热辐射信息和可见图像中的纹理信息。

Description

一种基于多尺度生成式对抗网络的红外和可见光图像融合方法

技术领域

本发明涉及图像处理技术领域，尤其涉及一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，可用于图像生成和图像融合领域。

背景技术

红外成像技术已经发展成为对国家经济利益和安全有重大影响的高新技术。多领域的应用为红外成像技术带来了广大的市场，从而带动了其蓬勃发展。尽管红外成像技术的发展非常迅速，但是整体的红外成像技术依然存在着空间分辨率低、立体感差等限制，从而导致红外成像技术并不适用于高质量红外图像要求的领域。

高质量的红外图像既可以增强对微弱目标观测的能力，又有利于人眼对图像内容和关键细节信息的有效获取，能为后续进一步进行目标识别和机器视觉应用提供良好的图像预处理功能。然而，由于红外成像系统所面对的应用场景往往处在较大的温度变化(如地面与天空、局部高温目标等)中，而目标与背景或目标局部的温差却相对较小，同时受红外目标的固有特性及外界大气环境因素的干扰影响，因此，与可见光图像相比，红外图像普遍存在着空间相关性强、对比度低、信噪比低、边缘易模糊等问题，这严重影响了红外图像的目标探测和目标识别能力。

因此，如何提高红外图像质量是目前红外领域的一个重要问题。图像分辨率是对图像细节分辨能力的一种度量，是对成像系统图像质量评价的关键性指标，也是成像系统在实际应用中应该考虑到的至关重要的参数。理论上，若要提高红外图像分辨率，就要增加探测器阵列数目或者减小感应单元尺寸，以增加抽样频率，从而减小混频。但在很多领域如遥感、医疗、安防等，图像分辨率的提升往往受到成像传感器的硬件成本、制造工艺和信息传输条件的限制。特别是对体积、功耗、重量要求苛刻的卫星遥感领域，加大光学系统设计所带来体积和重量的增加是无法忽视的。

随着传感器技术的发展，红外和可见光图像传感器在军事和安全监控领域得到了广泛应用。红外和可见光图像传感器的成像特点及局限性，使其在不同的成像条件、环境和背景下，利用单一传感器难以完成探测、侦察、跟踪等任务。因此，如何利用红外和可见光图像传感器间信息互补的特性，有效地综合和发掘红外和可见光图像的特征信息，突出红外目标，增强场景理解，一直是提高红外图像质量的研究热点。

发明内容

发明目的：针对以上问题，本发明提出一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，通过构造多尺度生成式对抗网络，使生成红外图像数据得到了增强扩充，并提高了生成红外图像的分辨率，通过融合策略将获取到的空间细节信息与生成的红外图像进行融合，既保持了可见光图像的纹理细节信息又具备了热辐射信息。

技术方案：为实现本发明的目的，本发明所采用的技术方案是：

一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，包括以下步骤：

S1，获取成对的原始红外图像和可见光图像，构建训练数据集，构造多尺度生成式对抗网络图像转化模型，学习红外图像的热辐射信息和可见光图像的纹理信息的映射关系，利用数据集中的可见光图像得到生成的红外图像；

S2，利用下采样后的可见光图像与原始红外图像之间的线性模型，计算可见光图像每一个通道的权重值，获得初步的融合源；根据广义拉普拉斯融合方式，获得图像空间细节信息；

S3，使用基于l₁范数和块平均操作的融合策略，将获得的空间细节信息注入生成的红外图像中，得到最终的融合图像。

进一步，所述步骤S1中，获取成对的红外图像和可见光图像，构建训练数据集，构造多尺度生成式对抗网络图像转化模型，所述模型由生成器G和判别器D组成；利用数据集中的可见光图像得到生成的红外图像；步骤如下：

S1.1，所述生成器包括全局生成器G_A、局部增强生成器G_B，所述判别器包括全局判别器D_A、多尺度判别器D_B，随机初始化生成器G_A、G_B和判别器D_A、D_B的参数；

S1.2，设计多尺度生成式对抗网络的生成器和判别器的网络结构，生成器网络用于从可见光图像生成红外图像，判别器网络用于区分真实红外图像和生成的红外图像；

S1.3，以最小化生成误差和特征匹配误差为优化目标，构造多尺度生成式对抗网络的损失函数；

S1.4，将训练数据集输入训练网络，训练生成式对抗网络，学习红外图像的热辐射信息和可见光图像的纹理信息的映射关系，利用数据集中的可见光图像得到生成的红外图像；

S1.5，计算生成的红外图像与数据集中真实的红外图像之间的差异，使用随机梯度下降法进行网络参数优化，实现生成器和判别器网络参数的更新。

进一步，所述步骤S1.2中，设计生成器的网络结构，步骤如下：

(1)全局生成器网络包含卷积模块、残差模块和反卷积模块，通过卷积模块对输入图像进行特征提取，所述卷积模块包含5个卷积层；

(2)将步骤(1)得到的特征图传入残差模块，全局生成器通过残差块学习输出与输入之间的差别，即维度一样的卷积输出结果与输入结果相减；所述残差模块包含9个残差块；

(3)将步骤(2)得到的特征图传入反卷积模块，所述反卷积模块包含5个反卷积层，输入图像经过全局生成器的三个模块处理后，生成一个大小保持一致的特征图像；

(4)将步骤(3)中由全局生成器生成的特征图传入局部增强生成器，局部增强生成器也包含卷积模块、残差模块和反卷积模块；

(5)局部增强生成器对传入的特征图进行两次不同尺度的下采样操作，得到两个不同尺度特征图；对传入的特征图和下采样得到的两个不同尺度特征图进行平均池化操作，保留特征图的全局基本信息；

(6)通过局部增强生成器的卷积模块的卷积操作提取不同尺度特征图的特征，并将提取到的特征与全局基本信息进行上采样操作，最大限度提取、保留特征信息；

(7)将局部增强生成器的卷积模块输出的特征图与全局生成器的反卷积模块最后一层输出的特征图相应元素相加得到整体生成器生成的图像。对于图像生成任务，使用这种生成器的设计可以有效整合全局信息和局部信息。

进一步，所述步骤S1.2中，设计判别器的网络结构，步骤如下：

(1)为了能够准确区分生成图像与真实图像，借鉴补丁生成式对抗网络的判别器结构，实现对不同尺寸生成图像的操作。单个判别器的结构相同，由三层卷积网络组成，区别是处理的输入尺寸不同；尺寸不超过阈值的判别器增强图像全局的生成，尺寸大于阈值的判别器增强图像纹理信息的生成；

(2)使用平均池化的方法对生成图像进行两次不同尺度的下采样，输出的结果和真实图像共同组成三层图像金字塔；判别器对真实图像和两个不同尺度的图像进行训练，输出一个为真或假的标签。

进一步，所述步骤S1.3中，构造多尺度生成式对抗网络的损失函数，具体如下：

生成式对抗网络的对抗损失函数定义如下：

其中L_GAN(G,D_k)表示生成式对抗网络中生成器和判别器的对抗损失约束，s表示待处理图像，x表示根据输入图像生成的输出图像；(s,x)～p_data(s,x)表示变量(s,x)服从真实数据分布p_data(s,x)；s～p_data(s)表示输入图像s服从数据分布p_data(s)；D(s,x)和D(s,G(s))分别表示判别器D对图像对(s,x)和由生成器G生成的(s,G(s))图像对的预测结果；对抗损失约束期望判别器正确区分出真实图像和合成图像中的假图像；

通过公式(1)对抗损失函数迭代计算生成器与判别器的对抗损失；

引入特征匹配损失函数以满足生成器输出不同尺度生成图像的要求，使训练更加稳定；所述特征匹配损失函数定义如下：

其中L_FM(G,D_k)表示判别器的特征匹配损失，

表示第k个判别器所获得的第i层特征，T是判别器所包含的层数，N_i是判别器中第i个特征元素；||*||₁表示一范数，计算的是真实图像与生成图像之间的差异；

结合对抗损失函数和特征匹配损失函数，生成式对抗网络整体目标函数的定义如下：

其中β是平衡因子，用于调节生成式对抗损失和特征匹配损失的比重；D₁,D₂,D₃分别代表多尺度判别器，用于处理不同尺度的图像；目标函数的第一项表示k个判别器的对抗损失之和，第二项表示k个判别器的特征匹配损失之和；

通过公式(3)最小化生成误差和特征匹配误差来优化整体目标函数，更新生成器参数，完成对生成器的整体优化。

进一步，所述步骤S2中，获得图像空间细节信息，步骤如下：

根据广义拉普拉斯融合方式，定义空间细节信息D_e如下：

其中X表示有效融合源，X经低通滤波与下采样后的图像记为

是

上采样后的图像，

表示获得的初始细节信息；g为增益因子，调节细节信息与生成的红外图像融合的比重；

增益因子g由全局计算获得，定义如下：

其中ir表示原始红外图像，ir_exp表示原始红外图像上采样后的图像；

根据可见光图像的光谱和空间特性，可见光图像与有效融合源X之间有如下线性关系：

其中CO表示可见光图像，CO_j表示可见光图像第j个通道图，由于可见光图像包含3个通道，因此j∈{1,2,3}，w_j表示可见光图像第j个通道权重，b表示偏置项；

权重w_j由ir_exp和

的相关性决定，通过线性回归算法估计w_j和b，通过公式(6)得到有效融合源X，结合公式(4)和(5)获得空间细节信息。

进一步，所述步骤S3中，由于传统的红外图像与获得的细节信息融合策略为相加策略，该策略是一种非常粗糙的特征选择融合策略，为了提高融合效果，本发明方法使用一种基于l₁范数和块平均操作的融合策略，具体如下：

卷积自动编码器是一种卷积神经网络，可在输出处重建输入，并可用作输入图像的特征提取器；其包括两个部分：用于特征表示的编码部分，以及用于从压缩版本中重建输入的解码部分。

利用卷积自动编码器对输入的待融合图像的结构特征进行提取，所述待融合图像是指获得的空间细节信息以及生成的红外图像，计算方法如下：

其中φ_m(x,y)表示待融合图像的特征图，s表示sigmoid激活函数，

表示编码器中第m个特征图的偏置，F⁽¹⁾表示编码器的卷积核，K表示待融合图像；

待融合图像特征图经过l₁范数操作，得到初始的特征映射图，表示如下：

C_m(x,y)＝||φ_m(x,y)||₁ (8)

其中C_m(x,y)表示初始的特征映射图；

利用基于块的平均算子计算最终的特征映射图，公式如下：

其中C′_m(x,y)表示最终的特征映射图，r表示块的大小，a,b分别表示在横轴和纵轴上移动的长度；

将待融合图像的特征映射图进行融合，获得融合特征图f(x,y)，其计算方法如下：

最终，利用卷积自动编码器将融合特征图解码，重构获得可见光和红外图像的融合图像，方法如下：

其中f_final表示最终的融合图像，s表示sigmoid激活函数，f(x,y)表示融合特征图，F⁽²⁾表示解码器的卷积核，

表示解码器中第m个特征图的偏置。

有益效果：与现有技术相比，本发明的技术方案具有以下有益的技术效果：

本发明提供的一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，能够实现将可见光图像转化为红外图像，生成的红外图像在纹理、光谱等方面与真实图像非常接近，从而有效解决了红外数据集获取困难以及红外图像空间分辨率较低的问题。此外，通过有效的融合策略，将可见光图像的细节信息注入生成的红外图像中，进一步提升了红外图像的质量，其包含的细节纹理信息得到加强。融合图像不仅保持了可见光图像的纹理细节信息，而且具备了热辐射信息。

附图说明

图1为本发明方法的实施流程图；

图2为多尺度循环生成式对抗网络框架示意图；

图3为可见光图像细节信息提取示意图；

图4为基于l₁范数和块平均操作融合策略示意图。

具体实施方式

下面结合附图以及具体实例对本发明的技术方案作更进一步的说明。

如图1所示，基于多尺度生成式对抗网络的红外和可见光图像融合方法，包括如下步骤：

S1，获取成对的原始红外图像和可见光图像，构建训练数据集，构建多尺度生成式对抗网络图像转化模型，学习红外图像的热辐射信息和可见光图像的纹理信息的映射关系，利用数据集中的可见光图像得到生成的红外图像。该网络模型由生成器网络和判别器网络组成，生成器网络包含G_A和G_B两个子网络，G_A是全局生成器网络，G_B是局部增强生成器网络。判别器网络包含D_A和D_B两个子网络，D_A是全局判别器网络，D_B是多尺度判别器网络。多尺度生成式对抗网络图像转化模型框架示意图如2图所示。具体构建步骤如下：

S1.1，全局生成器网络G_A由三个部分组成：卷积模块、残差模块和反卷积模块。卷积模块包含五层卷积，残差模块包含九个残差块，反卷积模块包含五层反卷积。卷积模块与反卷积模块的卷积核大小相反，卷积模块第一层卷积的卷积核大小为7×7，后四层为3×3，每一层的卷积核个数分别是64、64、128、256和512。反卷积模块前四层卷积的卷积核大小为3×3，最后一层为7×7。残差模块卷积核大小为3×3。

局部增强生成器网络G_B由三个部分组成：卷积模块、残差模块和反卷积模块。卷积模块包含两层卷积，残差模块包含八个残差块，反卷积模块包含五层反卷积。卷积层和残差块中所有的卷积核大小均为3×3，反卷积块中前面四层卷积核的大小为3×3，最后一层卷积核的大小为7×7。

和全局生成器网络不同，局部增强生成器网络中残差模块输出的特征图是局部生成器网络卷积模块输出特征图与全局生成器网络反卷积模块最后一层特征图相应元素相加获得的。对于图像生成任务，使用这种生成器的设计可以有效整合全局信息和局部信息。

S1.2，为了能够准确区分生成图像与真实图像，借鉴补丁生成式对抗网络的判别器结构，实现对不同尺寸生成图像的操作。

使用平均池化的方法对生成图像进行2倍下采样和4倍下采样，输出结果和真实图像共同组成三层图像金字塔，判别器对这三个不同尺度的图像进行训练，输出一个为真或假的标签。

单个判别器的结构是一样的，由三层卷积网络组成，只是处理的输入尺寸不同。如此设计的目的是希望尺寸小的判别器能够增强图像全局的生成，尺寸大的判别器增强图像纹理信息的生成。

S1.3，多尺度生成式对抗网络中的生成器网络用于从可见光图像生成红外图像，而判别器网络用于区分真实红外图像和生成的红外图像，生成式对抗网络的对抗损失函数定义如下：

由于生成器要产生不同尺度的图像，为使训练更加稳定，引入特征匹配损失函数，定义如下：

其中L_FM(G,D_k)表示判别器的特征匹配损失，

S2，利用下采样后的可见光图像与原始红外图像之间的线性模型，计算可见光图像每一个通道的权重值，获得初步的融合源；根据广义拉普拉斯融合方式，获得图像空间细节信息；具体步骤如下：

根据广义拉普拉斯融合方式，定义空间细节信息D_e如下：

其中X表示有效融合源，X经低通滤波与下采样后的图像记为

是

上采样后的图像，

增益因子g由全局计算获得，定义如下：

其中CO表示可见光图像，CO_j表示可见光图像第j个通道图，由于可见光图像包含3个通道，因此j∈{1,2,3}，w_j表示可见光图像第j个通道权重，b表示偏置项。

权重w_j由ir_exp和

S3，将步骤S2提取到图像空间细节信息通过l₁范数和块平均操作融合策略注入到步骤S1生成的红外图像中。具体如下：

由于传统的红外图像与从可见光图像获得的细节信息融合策略是相加策略，该策略是一种非常粗糙的特征选择融合策略。为了提高融合效果，本发明方法应用了一种基于l₁范数和块平均操作的融合策略。具体流程图如图4所示，具体包括：

C_m(x,y)＝||φ_m(x,y)||₁ (8)

其中C_m(x,y)表示初始的特征映射图；

利用基于块的平均算子计算最终的特征映射图，公式如下：

表示解码器中第m个特征图的偏置。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，其特征在于：包括以下步骤：

S2，利用下采样后的可见光图像与原始红外图像之间的线性模型，计算可见光图像每一个通道的权重值，获得初步的融合源；根据广义拉普拉斯融合方式，获得图像空间细节信息，步骤如下：

根据广义拉普拉斯融合方式，定义空间细节信息D_e如下：

其中X表示有效融合源，X经低通滤波与下采样后的图像记为

是

上采样后的图像，

表示获得的初始细节信息；g为增益因子，调节细节信息与生成的红外图像融合的比重；增益因子g定义如下：

其中ir表示原始红外图像，ir_exp表示原始红外图像上采样后的图像；根据可见光图像的光谱和空间特性，可见光图像与有效融合源X之间有如下线性关系：

其中CO表示可见光图像，CO_j表示可见光图像第j个通道图，j∈{1,2,3}，w_j表示可见光图像第j个通道权重，b表示偏置项；

权重w_j由ir_exp和

的相关性决定，通过线性回归算法估计w_j和b，通过公式(6)得到有效融合源X，结合公式(4)和(5)获得空间细节信息；

S3，使用基于l₁范数和块平均操作的融合策略，将获得的空间细节信息注入生成的红外图像中，得到最终的融合图像，具体如下：

表示编码器中第m个特征图的偏置，

表示编码器的卷积核，K表示待融合图像；

C_m(x,y)＝||φ_m(x,y)||₁ (8)

其中C_m(x,y)表示初始的特征映射图；

利用基于块的平均算子计算最终的特征映射图，公式如下：

其中C'_m(x,y)表示最终的特征映射图，r表示块的大小，a,b分别表示在横轴和纵轴上移动的长度；

其中f_final表示最终的融合图像，s表示sigmoid激活函数，f(x,y)表示融合特征图，

表示解码器的卷积核，

表示解码器中第m个特征图的偏置。

2.根据权利要求1所述的一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，其特征在于：所述步骤S1中，获取成对的红外图像和可见光图像，构建训练数据集，构造多尺度生成式对抗网络图像转化模型，所述模型由生成器G和判别器D组成；利用数据集中的可见光图像得到生成的红外图像；步骤如下：

3.根据权利要求2所述的一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，其特征在于：所述步骤S1.2中，设计生成器的网络结构，步骤如下：

(1)全局生成器网络包含卷积模块、残差模块和反卷积模块，通过卷积模块对输入图像进行特征提取；

(2)将步骤(1)得到的特征图传入残差模块，全局生成器通过残差块学习输出与输入之间的差别，即维度一样的卷积输出结果与输入结果相减；

(3)将步骤(2)得到的特征图传入反卷积模块，输入图像经过全局生成器的三个模块处理后，生成一个大小保持一致的特征图像；

(6)通过局部增强生成器的卷积模块的卷积操作提取不同尺度特征图的特征，并将提取到的特征与全局基本信息进行上采样操作，提取特征信息；

(7)将局部增强生成器的卷积模块输出的特征图与全局生成器的反卷积模块最后一层输出的特征图相应元素相加得到整体生成器生成的图像。

4.根据权利要求2所述的一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，其特征在于：所述步骤S1.2中，设计判别器的网络结构，步骤如下：

(1)单个判别器的结构相同，由三层卷积网络组成；尺寸不超过阈值的判别器增强图像全局的生成，尺寸大于阈值的判别器增强图像纹理信息的生成；

5.根据权利要求2所述的一种基于多尺度生成式对抗网络的红外和可见光图像融合方法，其特征在于：所述步骤S1.3中，构造多尺度生成式对抗网络的损失函数，具体如下：

生成式对抗网络的对抗损失函数定义如下：

其中L_GAN(G,D_k)表示生成式对抗网络中生成器和判别器的对抗损失约束，s表示待处理图像，x表示根据输入图像生成的输出图像；(s,x)～p_data(s,x)表示变量(s,x)服从真实数据分布p_data(s,x)；s～p_data(s)表示输入图像s服从数据分布p_data(s)；D(s,x)和D(s,G(s))分别表示判别器D对图像对(s,x)和由生成器G生成的(s,G(s))图像对的预测结果；

引入特征匹配损失函数以满足生成器输出不同尺度生成图像的要求；

所述特征匹配损失函数定义如下：

其中L_FM(G,D_k)表示判别器的特征匹配损失，