CN110956581B

CN110956581B - 一种基于双通道生成-融合网络的图像模态变换方法

Info

Publication number: CN110956581B
Application number: CN201911203850.0A
Authority: CN
Inventors: 王晗; 施佺; 余佩伦; 沈克成
Original assignee: Nantong University
Current assignee: Nantong University
Priority date: 2019-11-29
Filing date: 2019-11-29
Publication date: 2022-08-02
Anticipated expiration: 2039-11-29
Also published as: CN110956581A

Abstract

本发明公开了一种基于双通道生成‑融合网络的图像模态变换方法，包括如下步骤：步骤1)利用双目摄像机采集红外‑可见光图像对，并通过图像配准获取视野与分辨率均相同的红外‑可见光双模态数据集；步骤2)建立“双通道生成‑融合网络”，利用红外‑可见光双模态数据集训练，获取各通道生成神经网络参数(网络权值)、图像融合参数(亮度阈值)；步骤3)利用训练完毕的“双通道生成‑融合网络”对待测的红外图像进行模态变换。采用本发明方法，能够将基于残差单元、稠密单元网络的生成图像,有效地利用亮度阈值分割之后进行融合，实现两种网络单元结构的优势互补，显著提高生成图像与真值图像之间的相似度，降低拟合误差。

Description

一种基于双通道生成-融合网络的图像模态变换方法

技术领域：

本发明涉及基于图像模态、风格变换技术，尤其涉及一种利用双通道生成网络对红外图像进行可见光图像模态的转变，然后利用图像融合方法将两种生成图像进行优化融合减小图像重建误差的方法。

背景技术：

由于视觉传感器的不同，或者成像原理不同，相应获取的图像呈现出显著的不同，具体表现在像素值的非线性变化。如场景相同的近红外图像、远红外图像、可见光图像、手绘图像、微光图像等。有效地在各类图像之间建立非线性映射变换可以将不同种类的图像相互转换，该技术对工业、国防、刑侦的领域的应用提供着重要的技术支持。

目前，常见的图像模态、风格变换方法是基于对抗生成网络(GAN)的图像重建及其变异的方法，如GAN-UNET，GAN-RESNET等。现有的方法常常局限于设计单通道的生成图像网络结构，重建图像误差较高。

发明内容：

为了解决上述问题，本发明的主要目的在于提供一种基于双通道生成-融合网络的图像模态变换方法，其先进性表现为：一、分别利用残差单元、稠密单元设计双通道生成网络，获取两种特性不同的生成图像。二、通过亮度阈值对两种生成图像进行分割然后拼接融合，实现两种特性图像的优势互补，减少图像重建误差。

为达到上述目的，本发明的技术方案是：一种基于双通道生成-融合网络的图像模态变换方法，该方法包括：

步骤1)利用双目摄像机采集红外-可见光图像对，并通过图像配准获取视野与分辨率均相同的红外-可见光双模态数据集；

步骤2)建立“双通道生成-融合网络”，利用红外-可见光双模态数据集训练，获取各通道生成神经网络参数(网络权值)、图像融合参数(亮度阈值)；

步骤3)利用训练完毕的“双通道生成-融合网络”对待测的红外图像进行模态变换；

步骤1)的具体内容为：

首先，将可见光彩色图像转换为灰度图像I_CCD，并且在灰度图像I_CCD和红外图像I_IR中分别提取SIFT特征点；然后，以红外图像I_IR中每个SIFT特征点F_IR ⁱ为中心，在给定的搜索范围(searchwindow)内在可见光灰度图像I_CCD中寻找SIFT候补特征点集合{F_CCD ¹,F_CCD ²,…F_IR ⁿ}；接着，计算红外图像I_IR特征点F_IR ⁱ与灰度图像I_CCD候补特征点集合中每一个特征点F_CCD ^j之间的相似度，最后，根据最大相似度完成F_IR ⁱ和{F_CCD ¹,F_CCD ²,…F_IR ⁿ}之间的可见光-红外SIFT特征点匹配。其中，F_IR ⁱ与F_CCD ^j之间相似度的具体计算方法如下：

1.分别以SIFT特征点F_IR ⁱ和F_CCD ^j为中心，从I_IR和I_CCD中提取80x80的图像块P_IR和P_CCD。然后，分别从P_IR和P_CCD中提取384维的LGHD特征向量H_IR ⁱ和H_CCD ^j。

2.利用直方图交叉核(histogramintersection)度量两个LGHD特征向量H_IR ⁱ和H_CCD ^j之间的相似度，计算公式如下：

式中，H_IR ⁱ,H_CCD ^j分别是红外图像I_IR第i个SIFT特征点对应LGHD特征向量。H_CCD ^j是可见光灰度图像I_CCD第j个SIFT特征点对应LGHD特征向量。

在红外图像I_IR中所有的SIFT特征点匹配之后，利用RANSAC算法从可见光-红外SIFT特征点对儿集合中，估计可见光图像I_CCD与红外图像I_IR之间的转换矩阵M。最后，根据M矩阵将灰度图像I_CCD转换为与红外图像I_IR在视野和分辨率均相同的图像I_color。

利用上述方法将双目摄像机获取的可见光-红外图像配准成分辨率和视野相同的红外-可见光双模态数据集。

步骤2)的具体内容为：

本发明提出的“双通道生成-融合网络”由三个模块构成：“基于残差单元(ResBlock)的图像生成网络”、“基于稠密单元(DenseBlock)的图像生成网络”和“图像融合”，参见图2(双通道生成-融合网络结构图)、图3(参数说明)。

“基于残差单元(ResBlock)的图像生成网络”的输入为红外图像I_IR，网络结构如下：下采样层1、下采样层2、下采样层3、9个残差单元、上采样层1、上采样层2、上采样层3。其中，第n个残差单元结构如下：卷积层n-1、卷积层n、元素相加层。元素相加层的输出为卷积层n-1与卷积层n的输出特征图按照元素相加的结果。“基于残差单元(ResBlock)的图像生成网络”输出为与输入I_IR分辨率相同的可见光生成图像I_RES。

“基于稠密单元(DenseBlock)的图像生成网络”的输入为红外图像I_IR，网络结构如下：下采样层1、下采样层2、下采样层3、9个稠密单元、上采样层1、上采样层2、上采样层3。其中，第n个稠密单元结构如下：卷积层n-1、向量拼接层1、卷积层n、向量拼接层2、卷积层n+1。向量拼接层1的输出为卷积层n-2与卷积层n-1的输出特征向量的连接结果。向量拼接层2的输出为卷积层n-2、卷积层n-1和卷积层n的输出特征向量的连接结果。“基于稠密单元(DenseBlock)的图像生成网络”输出为与输入I_IR分辨率相同的可见光生成图像I_DENSE。

“图像融合”模块的输入为I_RES和I_DENSE。该模块的结构如下：图像分割(≥亮度阈值)、图像分割(<亮度阈值)、图像拼接。图像融合过程如下：首先，将“基于残差单元(ResBlock)的图像生成网络”的输出I_RES图像，利用亮度阈值b^*进行分割，保留亮度值大于等于b^*的像素点，获得分割结果I_Seg1。接着，将“基于稠密单元(DenseBlock)的图像生成网络”的输出I_DENSE图像利用亮度阈值b^*进行分割，保留亮度值小于b^*的像素点，获得分割结果I_Seg2。最后，将两次分割的图像进行拼接,获取最终生成图像I_Out＝I_Seg1+I_Seg2。

利用红外-可见光双模态数据集训练，获取各通道生成神经网络参数(网络权值)、图像融合参数(亮度阈值)的过程如下：

1.利用对抗生成网络(GAN)的训练方法单独训练“基于残差单元(ResBlock)的图像生成网络”，获取其网络权值，并且保存数据。

2.利用对抗生成网络(GAN)的训练方法单独训练“基于稠密单元(DenseBlock)的图像生成网络”，获取其网络权值，并且保存数据。

3.利用各通道的生成图像与真值图像的灰度直方图的拟合结果，估计图像分割、拼接的亮度阈值：

3.1)设定亮度值阈值的搜索区间[b₀,255]；设b_i为亮度阈值，且b_i∈

[b₀,255]；

3.2)遍历训练数据获取“基于残差单元(ResBlock)的图像生成网络”的生成图像I_RES(k),k＝1,…,N。N为训练样本数,I_RES(k)为第k个训练样本的残差单元网络生成图像；遍历训练数据获取“基于稠密单元(DenseBlock)的图像生成网络”的生成图像I_DENSE(k),k＝1,…,N。N为训练样本数，I_DENSE(k)为第k个训练样本的残差单元网络生成图像；

3.3)利用亮度阈值b_i，分别对I_RES(k)、I_DENSE(k),k＝1,…,N进行分割后拼接融合，I_fusion(b_i,k)＝I_Seg1(k)+I_Seg2(k),k＝1,…,N。

3.4)分别计算I_RES(k)、I_DENSE(k)、I_fusion(b_i,k)，k＝1,…,N与训练样本中可见光图像真值I_GT(k)之间误差MSE(I_RES(k),I_GT(k))、MSE(I_DENSE(k),I_GT(k))、MSE(I_FUSION(k),I_GT(k))。

3.5)计算同时满足MSE(I_FUSION(k),I_GT(k))<MSE(I_DENSE(k),I_GT(k))和MSE(I_FUSION(k),I_GT(k))<MSE(I_RES(k),I_GT(k))条件的样本个数N^*，k＝1,…,N

3.6)计算满足3.5)条件的N^*个MSE误差的平均值MSE^*(b_i)

3.7)计算亮度阈值b_i的优化目标函数

式中，μ₁是MSE的最优希望值，μ₂是N*的最优希望值，σ₁，σ₂是归一化常数。

3.8)求取最佳亮度阈值b^*

b^*＝argmax(J(b_i)),b_i＝b₀,...,255 (4)

步骤3)的具体内容为：

待测红外图像I_IR经过双通道生成网络分别生成I_RES、I_DENSE。然后，利用步骤2)训练获取的最优亮度阈值b^*对I_RES、I_DENSE分别进行分割，获得分割图像I_SEG1，I_SEG2。最后将分割后的图像进行拼接融合：I_out＝I_SEG1+I_SEG2。

有益效果，一种基于双通道生成-融合网络的红外-可见光图像模态变化方法，具有如下有益效果：

采用本发明方法，能够亮度值对残差单元网络和稠密单元网络的生成图像进行有效地分割与融合、实现双通道特性优化互补，显著减少小传统单通道生成网络图像模态变换的MSE误差。

附图说明

图1为本发明红外-可见光图像模态变换方法的流程图；

图2为本发明提出的“双通道生成-融合网络”结构的示意图；

图3为本发明的“双通道生成-融合网络”方法与其他单通道生成网络方法的图像模态变换误差比较实例。

具体实施方式

下面结合本发明所提供的附图对本发明的技术作进一步说明：

如图1所示，一种基于双通道生成-融合网络的图像模态变换方法，包括如下步骤：

步骤101：)利用双目摄像机采集红外-可见光图像对，并通过图像配准获取视野与分辨率均相同的红外-可见光双模态数据集；的具体内容为：

步骤102：建立“双通道生成-融合网络”，利用红外-可见光双模态数据集训练，获取各通道生成神经网络参数(网络权值)、图像融合参数(亮度阈值)；的具体内容为：

本发明提出的“双通道生成-融合网络”由三个模块构成：“基于残差单元(ResBlock)的图像生成网络”、“基于稠密单元(DenseBlock)的图像生成网络”和“图像融合”，参见图2(双通道生成-融合网络结构图)、表1“双通道生成-融合网络”结构参数说明表。

表1“双通道生成-融合网络”结构参数说明表

“图像融合”模块的输入为I_RES和I_DENSE。该模块的结构如下：图像分割(≥亮度阈值)、图像分割(<亮度阈值)、图像拼接。图像融合过程如下：首先，将“基于残差单元(ResBlock)的图像生成网络”的输出I_RES图像利用亮度阈值b^*进行分割，保留亮度值大于等于b^*的像素点，获得分割结果I_Seg1。接着，将“基于稠密单元(DenseBlock)的图像生成网络”的输出I_DENSE图像利用亮度阈值b^*进行分割，保留亮度值小于b^*的像素点，获得分割结果I_Seg2。最后，将两次分割的图像进行拼接获取最终生成图像I_Out＝I_Seg1+I_Seg2

3.1)设定亮度值阈值的搜索区间[b₀,255]；设b_i为亮度阈值，且b_i∈[b₀,255]；

3.3)利用亮度阈值b_i，分别对I_RES(k)、I_DENSE(k),k＝1,…,N进行分割后拼接融合I_fusion(b_i,k)＝I_Seg1(k)+I_Seg2(k),k＝1,…,N。

3.6)计算满足3.5)条件的N^*个MSE误差的平均值MSE^*(b_i)

3.7)计算亮度阈值b_i的优化目标函数

3.8)求取最佳亮度阈值b^*

b^*＝argmax(J(b_i)),b_i＝b₀,...,255 (4)

步骤103：利用训练完毕的“双通道生成-融合网络”对待测的红外图像进行模态变换；的具体内容为：

下面结合具体示例对本发明的技术方案作进一步详细说明。

实例1

如图3上、中、下分别给出了“单通道残差单元生成网络”、“单通道稠密单元生成网络”、“双通道生成-融合网络”测试图像与真值图像之间的灰度直方图拟合程度和拟合误差MSE的对比结果。

经过对比可以清楚的看出：“单通道残差单元生成网络”输出的灰度直方图曲线在高亮度部分拟合的较好；“单通稠密单元生成网络”输出的灰度直方图曲线在低亮度部分拟合的较好；本发明提出的“双通道生成-融合网络”有效地结合了两种单通道生成网络的输出的优点，其输出的灰度直方图拟合程度最好，相应的拟合误差MSE数值最低(6.45<6.48<6.85)。

本发明的技术内容及技术特征已揭示如上，然而熟悉本领域的技术人员仍可能基于本发明的揭示而作种种不背离本发明精神的替换及修饰，因此，本发明保护范围应不限于实施例所揭示的内容，而应包括各种不背离本发明的替换及修饰，并为本专利申请权利要求所涵盖。

Claims

1.一种基于双通道生成-融合网络的图像模态变换方法，其特征在于，包括如下步骤：

步骤2)建立“双通道生成-融合网络”，利用红外-可见光双模态数据集训练，获取各通道生成神经网络权值、亮度阈值；

所述步骤1)中：

首先，将可见光彩色图像转换为灰度图像I_CCD，并且在灰度图像I_CCD和红外图像I_IR中分别提取SIFT特征点；然后，以红外图像I_IR中每个SIFT特征点F_IR ⁱ为中心，在给定的搜索范围内在可见光灰度图像I_CCD中寻找SIFT候补特征点集合{F_CCD ¹,F_CCD ²,…F_IR ⁿ}；接着，计算红外图像I_IR特征点F_IR ⁱ与灰度图像I_CCD候补特征点集合中每一个特征点F_CCD ^j之间的相似度，最后，根据最大相似度完成F_IR ⁱ和{F_CCD ¹,F_CCD ²,…F_IR ⁿ}之间的可见光-红外SIFT特征点匹配；

在红外图像I_IR中所有的SIFT特征点匹配之后，利用RANSAC算法从可见光-红外SIFT特征点对集合中，估计可见光图像I_CCD与红外图像I_IR之间的转换矩阵M；最后，根据M矩阵将灰度图像I_CCD转换为与红外图像I_IR在视野和分辨率均相同的图像I_color；

所述步骤2)为：

“双通道生成-融合网络”由三个模块构成：“基于残差单元的图像生成网络”、“基于稠密单元的图像生成网络”和“图像融合”模块；

“基于残差单元的图像生成网络”的输入为红外图像I_IR，网络结构如下：下采样层1、下采样层2、下采样层3、9个残差单元、上采样层1、上采样层2、上采样层3；其中，第n个残差单元结构如下：卷积层n-1、卷积层n、元素相加层；元素相加层的输出为卷积层n-1与卷积层n的输出特征图按照元素相加的结果；“基于残差单元的图像生成网络”输出为与输入I_IR分辨率相同的可见光生成图像I_RES；

“基于稠密单元的图像生成网络”的输入为红外图像I_IR，网络结构如下：下采样层1、下采样层2、下采样层3、9个稠密单元、上采样层1、上采样层2、上采样层3；其中，第n个稠密单元结构如下：卷积层n-1、向量拼接层1、卷积层n、向量拼接层2、卷积层n+1；向量拼接层1的输出为卷积层n-2与卷积层n-1的输出特征向量的连接结果；向量拼接层2的输出为卷积层n-2、卷积层n-1和卷积层n的输出特征向量的连接结果；“基于稠密单元的图像生成网络”输出为与输入I_IR分辨率相同的可见光生成图像I_DENSE；

“图像融合”模块的输入为I_RES和I_DENSE，该模块的结构如下：“图像分割≥亮度阈值”、“图像分割<亮度阈值”和“图像拼接”模块；图像融合过程如下：首先，将“基于残差单元的图像生成网络”的输出I_RES图像,利用亮度阈值b^*进行分割,保留亮度值大于等于b^*的像素点，获得分割结果I_Seg1；接着，将“基于稠密单元的图像生成网络”的输出I_DENSE图像,利用亮度阈值b^*进行分割，保留亮度值小于b^*的像素点，获得分割结果I_Seg2；最后，将两次分割的图像进行拼接,获取最终生成图像I_Out＝I_Seg1+I_Seg2；

如上述建立“双通道生成-融合网络”后，利用红外-可见光双模态数据集训练，获取各通道生成神经网络权值、亮度阈值；

所述步骤3)中：

待测红外图像I_IR经过双通道生成网络分别生成I_RES、I_DENSE；然后，利用步骤2)训练获取的最优亮度阈值b^*对I_RES、I_DENSE分别进行分割，获得分割图像I_SEG1，I_SEG2；最后将分割后的图像进行拼接融合：I_out＝I_SEG1+I_SEG2。

2.根据权利要求1所述的基于双通道生成-融合网络的图像模态变换方法，其特征在于：所述的利用红外-可见光双模态数据集训练，获取各通道生成神经网络权值、亮度阈值；具体如下：

1)利用对抗生成网络的训练方法单独训练“基于残差单元的图像生成网络”，获取其网络权值，并且保存数据；

2)利用对抗生成网络的训练方法单独训练“基于稠密单元的图像生成网络”，获取其网络权值，并且保存数据；

3)利用各通道的生成图像与真值图像的灰度直方图的拟合结果，估计图像分割、拼接的亮度阈值：

3.1)设定亮度阈值的搜索区间[b₀,255]；设b_i为亮度阈值，且b_i∈[b₀,255]；

3.2)遍历训练数据获取“基于残差单元的图像生成网络”的生成图像I_RES(k),k＝1,…,N；N为训练样本数,I_RES(k)为第k个训练样本的残差单元网络生成图像；遍历训练数据获取“基于稠密单元的图像生成网络”的生成图像I_DENSE(k),k＝1,…,N，N为训练样本数，I_DENSE(k)为第k个训练样本的稠密单元网络生成图像；

3.3)利用亮度阈值b_i，分别对I_RES(k)、I_DENSE(k)进行分割后拼接融合，其中，k＝1,…,N，I_FUSION(b_i,k)＝I_Seg1(k)+I_Seg2(k),k＝1,…,N；

3.4)分别计算I_RES(k)、I_DENSE(k)、I_FUSION(b_i,k)，与训练样本中可见光图像真值I_GT(k)之间误差MSE(I_RES(k),I_GT(k))、MSE(I_DENSE(k),I_GT(k))、MSE(I_FUSION(k),I_GT(k))，其中，k＝1,…,N；

3.5)计算同时满足MSE(I_FUSION(k),I_GT(k))<MSE(I_DENSE(k),I_GT(k))和MSE(I_FUSION(k),I_GT(k))<MSE(I_RES(k),I_GT(k))条件的样本个数N^*，k＝1,…,N；

3.6)计算满足3.5)条件的N^*个MSE误差的平均值MSE^*(b_i)

3.7)计算亮度阈值b_i的优化目标函数

式中，μ₁是MSE的最优希望值，μ₂是N^*的最优希望值，σ₁，σ₂是归一化常数；

3.8)求取最佳亮度阈值b^*

b^*＝argmax(J(b_i)),b_i＝b₀,...,255。