CN107369147B

CN107369147B - 基于自我监督学习的图像融合方法

Info

Publication number: CN107369147B
Application number: CN201710545757.2A
Authority: CN
Inventors: 陈莹; 余南南
Original assignee: Jiangsu Normal University
Current assignee: Jiangsu Zhongshang Robot Technology Co ltd
Priority date: 2017-07-06
Filing date: 2017-07-06
Publication date: 2020-12-25
Anticipated expiration: 2037-07-06
Also published as: CN107369147A

Abstract

本发明公开了一种基于自我监督学习的图像融合方法，涉及图像融合技术领域。本方法具体步骤如下：1)获取原图像；2)对原图像的预处理操作，将两幅原图像进行分块，编纂成新的矩阵，再按列组成联合矩阵；3)特征提取，将步骤2)中得到的联合矩阵作为输入信号输入到稀疏自编码器中，得到两幅图像简单合并后的边缘特征信息，得到的隐藏层的权值，该权值体现了待融合图像的显著特征，将此看做一个权值矩阵，4)图像的重构,步骤3)得到的权值矩阵作为字典，再通过匹配追踪算法得到原始图像各自的稀疏系数矩阵，在图像重构中，利用最大化选择算法得到联合稀疏系数矩阵，最终的重构图像由字典与联合稀疏系数矩阵相乘得到。

Description

基于自我监督学习的图像融合方法

技术领域

本发明涉及图像融合技术领域，具体是一种基于自我监督学习的图像融合方法。

背景技术

近年来，在图像融合方面，一些技术已经日渐成熟，在复杂的场景下拍摄出来的一组图像照片一般是无法完全涵盖解决一个实际问题需要的所有信息的，但是，在不同的条件下对同一个场景拍摄出来的图像就可能会涵盖足够的所需信息。图像融合技术可以利用从不同的角度拍摄或是用多个不一样的传感器获取的一组图像去得到一幅从人类的感官上可以更易于理解的图像。融合形成的图像可以更加清晰地呈现出对某一场景的描述。在视觉效果上，融合的图像更加的完美。简单来说，图像融合就是将很多种具有不同特性的关于图像的数据结合起来，相互之间可以互补以发挥各自最大的优势的目的，也可以更加全面的反映目标的一些固定不变的属性，还可以提供更强的对信息进行分析的能力。

目前现有的大部分的图像融合的算法都包括三个部分：图像的特征提取，图像的特征合并，图像的重构融合。图像融合算法大致分为两种，一种是空间域算法，它是将图像或者是图像的一部分看作是图像自身的特征，再使用某种规则进行合并，重构得到融合图像；另一种是变换域算法，该种算法先要将源图像转换到变换域，对变换域上的系数进行合并，再重构得到融合图像。在以往的浅层模型当中，都是依靠人工规则来构造特征的，而深度训练则是自身根据大数据来学习特征，这样的方法更能够刻画数据的内在信息，对于特征提取而言，手工选取特征是十分费力的，能不能选取好的特征在很大程度上都是靠运气和经验的，而且调节它也需要不少的时间。

发明内容

为了克服上述现有技术的缺点，本发明提供一种基于基于自我监督学习的图像融合方法，最大程度的将图像自身的高级隐藏的特征表达出来，保障了最终融合后的图像的清晰度以及准确性。

本发明是以如下技术方案实现的：一种基于自我监督学习的图像融合方法，

1)获取原图像；

2)对原图像的预处理操作，将两幅原图像进行分块，编纂成新的矩阵，再按列组成联合矩阵；

3)特征提取，将步骤2)中得到的联合矩阵作为输入信号输入到稀疏自编码器中，得到两幅图像简单合并后的边缘特征信息，得到的隐藏层的权值，该权值体现了待融合图像的显著特征，将此看做一个权值矩阵，

4)图像的重构,步骤3)得到的权值矩阵作为字典，再通过匹配追踪算法得到原始图像各自的稀疏系数矩阵，在图像重构中，利用最大化选择算法得到联合稀疏系数矩阵，最终的重构图像由字典与联合稀疏系数矩阵相乘得到。

优选的，步骤1)中的原图像指的是从开源的图像库里面的原始图像。

优选的，步骤2)采用滑动窗技术将两幅原图像进行分块。

优选的，步骤3)具体步骤如下：滑动得到的小块经过编纂成列向量组合形成新的矩阵aa1和bb1，这里将aa1和bb1按列按行依次相加，合并形成一个新的联合矩阵cc1，大小不变，选取同一组数据的训练集和测试集，经过训练得到的是两幅图像简单合并后的边缘特征信息，也就是经过稀疏自编码器的特征提取，得到的隐藏层的权值，该权值体现了待融合图像的显著特征，将此看做一个权值矩阵，把得到的这个含有待融合图像特征的权值矩阵作为一个字典W₂来使用。

初始化的过程具体如下：首先基于图层的大小随机初始化参数W₁,W₂,b₁,b₂,将权重和偏差转换为向量的形式，定直接误差项，权值惩罚项，稀疏性惩罚项均为0；

然后采用前向算法计算出各神经网络节点的线性组合值和激活值，如公式(1)(2)所示；

z_i＝W_i×x_i+b_i (1)

a_i＝sigmoid(z_i) (2)

i＝1,2；

其中sigmoid函数表示为，

稀疏自编码器采用的是两层的结构，W是权值向量，b是偏置向量，分别就是对应的两层的两对参数，公式得到的是每一层的输出值，这里的W和b是一开始随机初始化的，通过网络模型的训练对参数进行调整，得到最终的W₂，作为最终需要的字典矩阵；而这里的x表示的就是网络模型的输入信号，也就是图像信息；

其次用反向传播算法更新权值参数和偏置项参数，采用梯度下降法将误差减到最小。

优选的，y₁和y₂是原图像对应的稀疏系数矩阵，采用最大化选择算法得到的是联合稀疏系数矩阵A，重构图像为

由公式(4)可得到重构图像；

本发明的有益效果是：通过本方法对图像特征进行提取，避免了手工选取特征的麻烦，将该特征提取方法与最大化选择法相结合，最大程度的将图像自身的高级隐藏的特征表达出来，对于最终融合后的图像的清晰度，准确性提供了保障。

附图说明

图1为本发明原理框图。

具体实施方式

如图1所示，一种基于基于自我监督学习的图像融合方法，具体步骤如下:

首先，就是源图像的获取，采取的是从开源的图像库里面的原始图像，这样的图片做起实验来更有效果；

再次，就是对原图像的预处理操作，要采用滑动窗技术将原图像进行分块，编纂成新的矩阵，再按列组成联合矩阵；

其次，就是要对原始图像进行特征提取，将第二步中得到的联合矩阵作为输入信号输入到稀疏自编码器中，对于稀疏自编码器而言，它的输出是通过一个非线性变换得到的，但是我所需要的并不是最终的输出，而是使得最终输出能够与输入信号十分近似的隐藏层的输出，于是，通过训练得到图像的边缘特征信息，这些特征信息便是稀疏自编码器的隐层输出；

最后，就要进行图像的重构，第三步得到的权值矩阵作为字典，再通过匹配追踪算法可以得到原始图像各自的稀疏系数矩阵，在图像重构中，利用最大化选择算法得到联合稀疏系数矩阵，最终的重构图像由字典与联合稀疏系数矩阵相乘得到。

本方法中稀疏自动编码器就是一种基于自我监督特征学习和特征层次结构的学习结构模型，它是属于深度学习研究领域比较主流的一种网络模型。深度学习其实就是神经网络的一种延伸，是对已有的神经网络进行改进，从输入层可以获取基本信息，中间通过多层的抽象特征的表达方式，再通过反馈对网络参数实现微调，最终可以实现预定想要实现的目标效果。稀疏自动编码器目的在于图像的特征提取。

1.特征提取

假设两幅图像分别为m和n，大小均为128×128，对两幅图像用滑动窗进行分块(这里采用的是大小为8×8且滑动步长为1的滑动小块)，滑动得到的小块经过编纂成列向量组合形成新的矩阵aa1和bb1，大小变成了64×14641，这里将aa1和bb1按列按行依次相加，合并形成一个新的联合矩阵cc1，大小仍然是64×14641，这里，训练集和测试集(要提取的特征，不可能直接给一幅图片就可以得到特征，首先需要进行训练，也就是要先利用一组图片数据进行处理，也就是训练，得到网络模型中所需要的参数，参数一旦确定了，模型也就形成了，接下来就是进行测试，也就是待融合图像的特征提取步骤)选取的是同一组数据，经过训练得到的是两幅图像简单合并后的边缘特征信息，也就是经过稀疏自编码器的特征提取，得到的隐藏层的权值，该权值体现了待融合图像的显著特征，将此看做一个权值矩阵，在此算法中，把得到的这个含有待融合图像特征的权值矩阵W₂作为一个字典来使用。得到了字典W₁后，用匹配追踪算法求得待融合图像的稀疏系数矩阵y₁和y₂。具体地，首先基于图层的大小随机初始化参数W₁,W₂,b₁,b₂,将权重和偏差转换为向量的形式，设定直接误差项，权值惩罚项，稀疏性惩罚项均为0；然后采用前向算法计算出各神经网络节点的线性组合值和激活值，如公式(1)(2)所示。

z_i＝W_i×x_i+b_i (1)

a_i＝sigmoid(z_i) (2)

i＝1,2；

其中sigmoid函数表示为，

2.图像重构

通过特征提取后得到图像经过深度训练后的可以良好的代表输入信号的特征字典W₂，并且还得到了各个待融合图像的稀疏系数矩阵y₁和y₂，本设计中采用的方法使得所有的图像块对应的都是同一个字典W₂。融合规则采用的是最大化选择算法。具体地，y₁和y₂是原图像对应的稀疏系数矩阵，采用最大化选择得到的是联合稀疏系数矩阵A，重构图像为

由公式(4)可得到重构图像。

本发明研究的图像融合的算法都是基于MATLAB实验平台进行搭建的，效果还算满意。

Claims

1.一种基于自我监督学习的图像融合方法，其特征在于：

1)获取原图像；

4)图像的重构，步骤3)得到的权值矩阵作为字典，再通过匹配追踪算法得到原始图像各自的稀疏系数矩阵，在图像重构中，利用最大化选择算法得到联合稀疏系数矩阵，最终的重构图像由字典与联合稀疏系数矩阵相乘得到；

步骤3)具体步骤如下：

滑动得到的小块经过编纂成列向量组合形成新的矩阵aa1和bb1，这里将aa1和bb1按列按行依次相加，合并形成一个新的联合矩阵cc1，大小不变，选取同一组数据的训练集和测试集，经过训练得到的是两幅图像简单合并后的边缘特征信息，也就是经过稀疏自编码器的特征提取，得到的隐藏层的权值，该权值体现了待融合图像的显著特征，将此看做一个权值矩阵，把得到的这个含有待融合图像特征的权值矩阵作为一个字典W₂来使用；

首先基于图层的大小随机初始化参数W₁，W₂，b₁，b₂将权重和偏差转换为向量的形式，定直接误差项、权值惩罚项、稀疏性惩罚项均为0；

然后采用前向算法计算出各神经网络节点的线性组合值和激活值，如公式(1)(2)所示，

z_i＝W_i×x_i+b_i (1)

α_i＝sigmoid(z_i) (2)

i＝1,2；

其中sigmoid函数表示为，

稀疏自编码器采用的是两层的结构，W是权值向量，b是偏置向量，分别就是对应的两层的两对参数，公式得到的是每一层的输出值，这里的W和b是一开始随机初始化的，通过网络模型的训练对参数进行调整，得到最终的W₂，作为最终需要的字典矩阵，

2.根据权利要求1所述的一种基于自我监督学习的图像融合方法，其特征在于：步骤1)中的原图像指的是从开源的图像库里面的原始图像。

3.根据权利要求1所述的一种基于自我监督学习的图像融合方法，其特征在于：步骤2)采用滑动窗技术将两幅原图像进行分块。

4.根据权利要求1所述的一种基于自我监督学习的图像融合方法，其特征在于：用匹配追踪算法求得待融合图像的稀疏系数矩阵y₁和y₂，采用最大化选择算法得到的是联合稀疏稀疏矩阵A，重构图像为

由公式(4)可得到重构图像：