CN116434024A

CN116434024A - 目标特征嵌入的红外与可见光图像融合方法

Info

Publication number: CN116434024A
Application number: CN202310434441.1A
Authority: CN
Inventors: 赵文达; 解世赓; 王海鹏; 赵凡; 何友; 卢湖川; 刘颢; 夏学知; 杨向广
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2023-04-21
Filing date: 2023-04-21
Publication date: 2023-07-14
Anticipated expiration: 2043-04-21
Also published as: CN116434024B

Abstract

本发明属于图像信息处理技术领域，公开了一种目标特征嵌入的红外与可见光图像融合方法。本方法构建一个目标特征嵌入的红外与可见光图像融合方法，解决了目标检测任务与图像融合任务不匹配的问题，让目标检测任务有效的提升了图像融合的结果，并且目标检测元特征嵌入过程仅在训练过程中使用，训练完毕后在测试阶段并没有增加额外的计算量。

Description

目标特征嵌入的红外与可见光图像融合方法

技术领域

本发明属于图像信息处理技术领域，特别是红外与可见光图像融合方法，具体为一种目标特征嵌入的红外与可见光图像融合方法。

背景技术

目前，主要有两方面的图像处理方法与本发明相关，第一种是基于深度学习的目标检测算法，第二种是基于深度学习的图像融合算法。

目前，主要存在两种基于深度学习的目标检测网络：两阶段与一阶段目标检测算法。Girshick等人在《Rich feature hierarchies for accurate object detection andsemantic segmentation》提出的目标检测算法首先利用区域选择算法筛选可能存在目标的区域，然后将这些区域送入卷积神经网络预测。Ren等人在《Faster R-CNN:TowardsReal-Time Object Detection with Region Proposal Networks》在目标检测网络中加入了感兴趣区域提取网络，避免了在图像上进行区域选择，减少了计算量提升了检测速度。一阶段的目标检测网络直接利用卷积神经网络计算图像中目标的类别与位置信息，没有区域选择的过程。Liu等在《SSD:Single Shot MultiBox Detector》中提出了一种一阶段的目标检测网络，该方法为全卷积的网络架构，并使用多种级别的特征图进行检测，从而对不同大小目标的检测有一定的鲁棒性。Lin等人在《Focal Loss for Dense Object Detection》中为了应对一阶段目标检测网络中正负样本不平衡的问题，研究人员提出了一种新的损失函数，以提高网络的检测准确率。与两阶段目标检测网络不同，一阶段网络没有单独的前景和背景分离过程，因此速度更快。然而，这也导致一阶段网络在提高速度的同时难以避免准确度下降的问题。

现有的图像融合算法主要集中于图像融合网络与融合损失的研究。Li等人在《Infrared and Visible Image Fusion using a Deep Learning Framework》中提出了一个基于深度学习的图像融合框架，在此框架中，作者将可见光图像与红外图像解耦为两部分：基础分量与细节分量，然后对这两个解耦的分量分别进行处理来计算融合结果的基础与细节分量，最终将两个分量组合在一起用于生成融合结果。Ma等人在《Swinfusion:Cross-domain long-rangelearning for general image fusion via swintransformer》提出了一种基于卷积神经网络与SwinTransformer结合的图像融合架构，实现了图像局部信息与全局信息的提取，并构架了局部与全局信息融合的方法来生成融合结果。Xu等人在《U2fusion:A unified unsupervised image fusion network》中提出了一种统一的融合方法，该模型可以处理多种类型输入图像，如多模态图像，多聚焦图像等。此融合框架方法，可以利用自适应的方式评估图像中信息的有效程度，实现了在融合结果中保留输入源图像中重要的信息。另外，作者还在此方法中构建了一个全新的红外与可见光图像融合数据集RoadScene。Liu等人在《Target-aware dual adversarial learning and amulti-scenario multi-modalitybenchmark to fuse infrared and visible forobject detection》采用对抗攻击的方式约束图像融合网络生成更加清晰的目标，并利用目标检测网络作为融合网络的约束，来训练融合网络生成的融合结果可以实现更好的检测结果。

现有的图像大多数融合算法忽略了目标检测任务的帮助，或者仅仅将目标检测网络与其损失视为融合网络的一个约束。前者由于忽略了目标语义信息的帮助，因此无法进一步提升其融合性能；后者忽视了目标检测任务与图像融合任务不匹配的问题，因此对与融合效果的提升有限。

发明内容

为了利用目标检测任务提升图像融合性能，并解决目标检测任务与图像融合任务不匹配的问题，本专利提出了一种目标特征嵌入的红外与可见光图像融合方法。它可以根据图像融合网络的性能生成与图像融合模型兼容的目标检测元特征，并将其用于指导图像融合模型，从而提升图像融合模型的图像融合性能。

本发明的技术方案：

一种目标特征嵌入的红外与可见光图像融合方法，其框架主要由目标检测模型D、图像融合模型F、元特征嵌入模型MFE组成；其中目标检测模型D用于提供目标语义特征，图像融合模型F用于生成融合结果，元特征嵌入模型MFE用于生成指导图像融合模型的元特征；其中元特征是基于图像融合模型F性能在目标检测特征基础上生成的，因此与图像融合模型F匹配并能提升其性能。

红外与可见光图像融合模型的框架的训练过程分为两个部分，预训练阶段与元特征嵌入训练阶段；预训练阶段用于训练图像融合模型F与目标检测模型D，元特征嵌入训练用于训练元特征嵌入模型MFE与图像融合模型F；

在预训练阶段，首先训练图像融合模型F，其参数θ_F更新方式为：

其中，I_i与I_v分别为从M3FD数据集中划分出的训练集S_tr中采样的红外图像与可见光图像，其中M3FD来自《Target-aware dual adversarial learning and amulti-scenario multi-modalitybenchmark to fuse infrared and visible for objectdetection》，I_f为融合结果；β_F为图像融合模型F的学习率，L_f为SSIM融合损失，

表示对L_f求关于θ_F的梯度；待图像融合模型F收敛后，用图像融合模型F生成的融合结果对目标检测模型D进行预训练，使其有合理的特征提取能力，在此本方法选取yolov5s(https://github.com/ultralytics/yolov5)作为目标检测模型，其参数θ_D更新方式为：

其中，I_f为融合结果；β_D为目标检测模型D的学习率，L_D为yolov5的目标检测损失；训练完目标检测模型D之后进入元特征嵌入训练阶段；

在元特征嵌入训练阶段，首先加载预训练阶段中图像融合模型F与目标检测模型D训练好的参数；元特征嵌入训练阶段分为两个过程：内循环更新阶段和外循环更新阶段，内循环更新用于训练图像融合模型F与元特征嵌入模型MFE，元特征嵌入模型MFE主要由元特征生成器MFG与特征转换器FT两个子模型构成，其中元特征生成器MFG用于生成元特征，特征转换器FT用于将元特征中信息转移到图像融合模型F中；外循环更新用于训练图像融合模型F。

在内循环更新阶段，将训练集S_tr分为元训练集S_mtr与元测试集S_mts，用于更新元特征生成器MFG与特征转换器FT；首先，在训练集S_mtr上更新图像融合模型F的参数θ_F：

其中，L_g是引导损失，通过计算两个输入的L₂距离实现，具体计算方式为L_g(F_mj,F_tj)＝(F_mj,F_tj)²，β_F′代表模型参数更新时的学习率，θ_F′是更新后的图像融合模型F’的模型参数；元特征F_mj＝MFG(F_uj,F_ej)，其中F_uj为图像融合模型F中第j个图像融合特征，F_ej为目标检测模型D中第j个图像目标检测特征；转换后的特征F_tj＝FT(F_uj)；然后，利用更新后的图像融合模型F’去计算在元测试集S_mts上的融合损失L_f；

通过此方式，由于在公式(1-3)的指导过程中元特征生成器MFG与特征转换器FT接收的是来自图像融合模型F的特征，因此该融合损失L_f可衡量元学习引导图像融合模型F的效果；因此，本方法利用该融合损失L_f训练元特征生成器MFG的参数θ_MFG与特征转换器FT的参数θ_FT：

其中，

与/>

分别为从元测试集中采样的红外图像与可见光图像，/>

对应的元融合结果图像，β_MFG与β_FT分别为元特征生成器MFG的参数θ_MFG与特征转换器FT的参数θ_FT对应的学习率；通过此方式，元特征生成器MFG可学习到如何根据图像融合模型F的语义提取能力生成元特征与特征转换器FT可学习到如何合理的将信息传递给图像融合模型F；

在外循环更新阶段，本方法采用训练集S_tr训练图像融合模型F，其他模型参数固定，由于在指导过程中元特征生成器MFG与特征转换器FT接收的是来自图像融合模型F的特征来学习如何指导图像融合模型F，因此在外循环中图像融合模型F从未执行(1-3)中更新过程的参数θ_F开始更新，图像融合模型F的参数θ_F更新方式为：

其中，I_i与I_v分别为从训练集S_tr中采样的红外图像与可见光图像，I_f为融合结果；β_F为图像融合模型F的学习率；λ_g是用于平衡融合损失L_f与引导损失L_g的超参数；通过外循环更新，图像融合模型F在目标检测元特征的引导下，不断提升其语义提取能力；

最后，为了持续优化图像融合模型F与元特征嵌入模型MFE内循环更新与外循环更新交替进行每M个epoch交替进行。

本发明的有益效果：现有的图像大多数融合算法大多数忽略了目标语义信息的帮助或者忽视了目标检测任务与图像融合任务不匹配的问题，因此对与融合效果的提升有限。本方法构建一个目标特征嵌入的红外与可见光图像融合方法，解决了目标检测任务与图像融合任务不匹配的问题，让目标检测任务有效的提升了图像融合的结果，并且目标检测元特征嵌入过程仅在训练过程中使用，训练完毕后在测试阶段并没有增加额外的计算量。

附图说明

图1为元学习嵌入训练过程流程图。

图2为训练过程中目标特征嵌入的红外与可见光图像融合方法结构示意图。

具体实施方式

以下结合附图和技术方案，进一步说明本发明的具体实施方式。

图1为元学习嵌入训练过程流程图，在利用(1-1)、(1-2)对图像融合模型F与目标检测模型进行预训练以后。本方法进入元学习嵌入训练过程，如图1所示，本过程分为两个阶段，内循环更新与外循环更新。在首先进行的是内循环更新，从元学习训练集中采样一对源图像后，送入图像融合模型，并利用(1-3)式跟新其参数，并在元学习测试集上计算其融合损失，通过此方式，融合损失可以对体现元特征嵌入模型对于图像融合模型的指导效果，因此，本方法利用(1-4)、(1-5)更新元特征嵌入模型的参数，以此训练元特征嵌入模型学会如何指导图像融合模型。在外循环更新中，本方法利用元特征指导图像融合模型以提升其语义提取能力。另外为了有效的训练元特征嵌入模型与图像融合模型，内循环与外循环每M个epoch交替进行。

总的来说，本方法设计了一种基于目标检测元特征嵌入的红外与可见光图像融合方法，可以有效的用目标检测任务提升图像融合性能。

Claims

1.一种目标特征嵌入的红外与可见光图像融合方法，其特征在于，目标特征嵌入的红外与可见光图像融合方法的框架主要由目标检测模型D、图像融合模型F、元特征嵌入模型MFE组成；其中目标检测模型D用于提供目标语义特征，图像融合模型F用于生成融合结果，元特征嵌入模型MFE用于生成指导图像融合模型的元特征；

其中，I_i与I_v分别为从M3FD数据集中划分出的训练集S_tr中采样的红外图像与可见光图像，I_f为融合结果；β_F为图像融合模型F的学习率，L_f为SSIM融合损失，

表示对L_f求关于γ_F的梯度；待图像融合模型F收敛后，用图像融合模型F生成的融合结果对目标检测模型D进行预训练，使其有合理的特征提取能力，在此本方法选取yolov5s作为目标检测模型，其参数γ_D更新方式为：

在元特征嵌入训练阶段，首先加载预训练阶段中图像融合模型F与目标检测模型D训练好的参数；元特征嵌入训练阶段分为两个过程：内循环更新阶段和外循环更新阶段，内循环更新用于训练图像融合模型F与元特征嵌入模型MFE，元特征嵌入模型MFE主要由元特征生成器MFG与特征转换器FT两个子模型构成，其中元特征生成器MFG用于生成元特征，特征转换器FT用于将元特征中信息转移到图像融合模型F中；外循环更新用于训练图像融合模型F；

其中，

与/>

分别为从元测试集中采样的红外图像与可见光图像，/>