CN111654621A

CN111654621A - 一种基于卷积神经网络模型的双焦相机连续数字变焦方法

Info

Publication number: CN111654621A
Application number: CN202010455069.9A
Authority: CN
Inventors: 李奇; 宋炯辉; 徐之海; 冯华君
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang Jingzheng Optoelectronics Co ltd
Priority date: 2020-05-26
Filing date: 2020-05-26
Publication date: 2020-09-11
Anticipated expiration: 2040-05-26
Also published as: CN111654621B

Abstract

本发明公开了一种基于卷积神经网络模型的双焦相机连续数字变焦方法。对公开数据集预处理，得尺寸相同的高低分辨图像以及对应的参考图像，构成图像对，作为训练集；建立卷积神经网络模型，以训练集迭代训练达到预设次数；输入短焦相机获得的低分辨图像和长焦相机获得的高分辨图像及变焦倍率，使用双三次插值的方法，上采样裁剪后和高分辨图像通过训练完成后的卷积神经网络模型，输出变焦后图像。本发明方法利用卷积神经网络模型实现连续倍率的数字变焦图像合成，相较于现有的连续数字变焦方法，可更有效地利用长焦相机获得的高分辨率图像提供的丰富的纹理细节。

Description

一种基于卷积神经网络模型的双焦相机连续数字变焦方法

技术领域

本发明属于数字图像处理领域的一种双焦相机连续数字变焦方法，涉及了一种利用卷积神经网络模型的双焦相机连续数字变焦方法。

背景技术

出于成本和尺寸以及成像系统可靠性的考虑，在航天相机以及智能手机中，很少搭载光学变焦的镜头，而是倾向于使用定焦相机。短焦相机视场较大，但是细节分辨力却不足，而长焦相机虽然可以拍摄高分辨图片并获得大量细节信息，但是视场却较小。因此，用两个焦距不同的定焦相机组成一个非对称的光学系统来模拟光学变焦相机有着越来越广的应用场景。但是这样的系统引入了一个新的问题：如何设计一种高效的算法，从输入的长焦相机高分辨图像和短焦相机低分辨图像出发，进行数字变焦，产生和光学变焦视觉效果相似的连续数字变焦算法。

在实现双焦相机连续数字变焦的过程中，主要面临以下几个技术难点：第一，传统的图像融合算法无法将长焦相机获得的纹理信息转移到长焦视场外，导致仅有短焦相机拍摄的区域纹理恢复效果较差。第二，目前被深入研究和广泛应用的基于卷积神经网络的单帧图像超分辨算法只能在一定程度上提升短焦相机所获得的图像质量，但无法有效利用长焦图像的纹理细节；而基于参考图像的图像超分辨算法，算法效果十分依赖参考图像和短焦图像的配准效果，同时绝大多数的基于卷积神经网络模型的图像超分辨算法由于网络模型输入和输出的图像大小为定值，仅能实现固定倍率的变焦，而基于块匹配的传统数字变焦算法耗时过长，所以难以提出一种能有效利用长焦相机获得的纹理细节的连续倍率变焦算法。

发明内容

本发明针对如图1所示的双焦相机成像系统在成像过程中难以有效利用长焦相机获得的纹理细节、现有卷积神经网络模型无法实现连续倍率数字变焦、传统算法耗时长等技术问题，采用了利用卷积神经网络模型的双焦相机连续数字变焦方法。

为达到以上目的，本发明采用以下技术方案，实现流程如图2所示：

(1)对公开数据集进行预处理，得到图像尺寸大小相同的高分辨图像和低分辨图像以及对应的参考图像，高分辨图像和低分辨图像构成图像对，作为训练卷积神经网络模型的训练集；

(2)建立如图4所示的卷积神经网络模型，以训练集迭代训练初始化后的卷积神经网络模型，直至迭代次数达到预设次数，完成模型训练，具体是：

(2.1)以固定的初始化方法初始化待训练卷积神经网络模型的初始模型参数，使得服从特定的分布；

(2.2)利用训练集中的高分辨图像I_H和裁剪后图像I_UC，通过细节迁移子网络，将纹理细节迁移到低分辨图像上采样后的对应区域，得到掩膜图像mask、中心高分辨率区域R_H和周边低分辨率区域R_L；

(2.3)以中心高分辨率区域R_H中的纹理细节信息为参考，结合周边低分辨率区域R_L中的语义信息，并根据掩膜图像mask通过图像修复子网络，修复周边低分辨率区域R_L中的纹理细节，输出修复后图像I_B；

(2.4)根据修复后图像I_B和对应参考图像I_R计算保真项误差Loss；

(2.5)根据计算得到的保真项误差Loss，对待训练的卷积神经网络模型参数进行调整；

(2.6)根据调整后的卷积神经网络模型参数，重复进行步骤(2.2)至步骤(2.5) 的操作，进行模型参数调整的过程，直至迭代次数达到预设次数，则模型训练完毕；

(3)输入短焦相机获得的低分辨图像I_RL和长焦相机获得的高分辨图像I_RH以及变焦倍率B，使用双三次插值的方法，对低分辨图像I_RL进行上采样，上采样倍率为变焦倍率B，将上采样后图像进行中心裁剪，使得裁剪后的图像尺寸大小为H×W，将上采样、裁剪后的图像和高分辨图像I_RH通过训练完成后的卷积神经网络模型，输出变焦后图像I_B。

本发明方法通常是针对拥有两个焦距不同的定焦相机，需要获得连续变焦图像的场景进行处理。

所述的双焦相机是获得低分辨图像的短焦相机和获得高分辨图像的长焦相机，短焦相机采集的图像作为低分辨图像，长焦相机采集的图像作为高分辨图像，低分辨图像和高分辨图像尺寸大小相同，且高分辨图像的视场在低分辨图像的视场内。

所述步骤(1)具体为：

(1.1)设短焦相机和长焦相机的空间采样率倍率比为M，获得图像尺寸大小为H×W，H和W分别表示图像的横纵方向的标准尺寸，从公开数据集获取的输入图像I尺寸大小为H_I×W_I，H_I和W_I分别表示输入图像I的横纵方向的尺寸，满足H_I≥MH，W_I≥MW；

(1.2)在输入图像I中随机裁剪尺寸大小为MH×MW的区域I₀，对区域I₀进行下采样，下采样倍率为M，将下采样后得到的区域I₁作为低分辨图像I_L；

将区域I₀随机旋转θ，满足-1°≤θ≤1°，得到旋转后区域I₂，对区域I₂进行中心裁剪，裁剪成图像尺寸大小为H×W，将裁剪后的区域I₂作为高分辨图像 I_H；

(1.3)随机生成变焦倍率B，满足1≤B≤M，其中M为短焦相机和长焦相机的空间采样率倍率比，使用双三次插值的方法，对低分辨图像I_L进行上采样，上采样倍率为变焦倍率B，将上采样后的图像进行中心裁剪，使得裁剪成图像尺寸大小为H×W，得到裁剪后图像I_UC；

(1.4)对(1.2)获得的区域I₀进行下采样，使得下采样后区域尺寸大小为BH ×BW，然后对下采样后的区域进行中心裁剪，裁剪成尺寸大小为H×W的区域，将下采样、裁剪后的区域I₀作为对应参考图像I_R；将裁剪后图像I_UC、高分辨图像I_H和对应参考图像I_R作为训练集的一组图像；

(1.5)对公开数据集中的每幅图像随机生成3个不同的变焦倍率B，重复(1.1) 至(1.4)的操作，构建组成训练集。

所述的公开数据集为BSD100、Urban100、DIV2K等用于图像超分辨率重建的数据集。

所述步骤(2)中的卷积神经网络模型包含依次连接的细节迁移子网络和图像修复子网络的两个子网络：

细节迁移子网络主要由六层卷积层和一个基于注意力机制的特征迁移模块构成，第1层、第2层卷积层依次连接，第3层、第4层卷积层依次连接，第5 层、第6层卷积层依次连接，将训练集中得裁剪后图像I_UC和高分辨图像I_H分别输入到细节迁移子网络的第1层卷积层和第3层卷积层中，细节迁移子网络的第1层卷积层、第2层卷积层和第4层卷积层的输出均输入到特征迁移模块中，特征迁移模块的输出和第1层卷积层的输出一起经图像通道连接操作后输入到细节迁移子网络的第5层卷积层中，细节迁移子网络的第6层卷积层输出的中心高分辨率区域R_H和裁剪后图像I_UC处理后输出的周边低分辨率区域R_L一起进行融合操作后输出融合后图像I_trans到图像修复子网络；

图像修复子网络主要由十层卷积层和四个特征迁移模块构成，融合后图像 I_trans输入到第1层卷积层中，第1层卷积层～第5层卷积层依次连接，第6层卷积层～第10层卷积层依次连接，第1层卷积层和第2层卷积层的输出输入到第1 特征迁移模块中，第2层卷积层和第3层卷积层的输出输入到第2特征迁移模块中，第3层卷积层和第4层卷积层的输出输入到第3特征迁移模块中，第4 层卷积层和第5层卷积层的输出输入到第4特征迁移模块中，第1特征迁移模块～第3特征迁移模块的输出分别和第1层卷积层～第3层卷积层的输出、第8层卷积层～第6层卷积层的输出经图像通道连接操作后分别再连接输入到第9层卷积层～第7层卷积层，即第1特征迁移模块的输出分别和第1层卷积层、第8 层卷积层的输出经图像通道连接操作后分别再连接输入到第9层卷积层，第2 特征迁移模块的输出分别和第2层卷积层、第7层卷积层的输出经图像通道连接操作后分别再连接输入到第8层卷积层，第3特征迁移模块的输出分别和第3 层卷积层、第6层卷积层的输出经图像通道连接操作后分别再连接输入到第7 层卷积层，同时第4特征迁移模块的输出和第4层卷积层的输出经图像通道连接操作后连接输入到第6层卷积层，第10层卷积层输出修复后图像I_B。

所述步骤(2.1)中，将卷积神经网络模型的初始模型参数，即卷积神经网络的各级卷积层的初始卷积核和所述各级卷积层的初始偏置矩阵中的所有元素值，初始化为32位浮点数，使卷积神经网络模型的所有初始模型参数服从(0,1)之间的均匀分布。

所述步骤(2.2)具体为：

(2.2.1)对步骤(1)获得的裁剪后图像I_UC进行上采样，上采样倍率为M/B，得到上采样后图像I'_UC，定义与上采样后图像I'_UC尺寸大小相同的掩膜图像mask，将掩膜图像mask中心的H×W大小的区域的像素值均置为0，其余区域置为1；

(2.2.2)对掩膜图像mask进行下采样，下采样倍率为B/M，得到下采样后掩膜图像mask’，则周边低分辨率区域R_L采用以下公式获得：

R_L＝mask’.*I_UC

其中，.*运算表示为矩阵中相同位置的元素对应相乘；

(2.2.3)对上采样后图像I'_UC进行中心裁剪，使得裁剪后图像尺寸大小与裁剪后图像I_UC相同，得到再次裁剪图像I”_UC；

(2.2.4)对于再次裁剪图像I”_UC和高分辨图像I_H，分别输入到第1层卷积层和第3层卷积层中，分别利用下式同样处理获得经卷积层处理得到的结果图像：

其中，

为再次裁剪图像I”_UC经第1层卷积层处理得到的结果图像，

为

经第2层卷积层处理得到的结果图像，

为高分辨图像IH经第2层卷积层处理得到的结果图像，

为

经第4层卷积层处理得到的结果图像； DownSample为作0.5倍下采样的操作；Conv为用初始化后的初始卷积核和初始偏置矩阵作卷积操作；

(2.2.5)特征迁移模块：对于特征迁移模块，从第2层卷积层处理得到的结果图像

第4层卷积层处理得到的结果图像

中以1为步长提取3×3的裁剪小块p_i、高分辨小块p_j，i、j为小块编号，利用卷积操作得到一个裁剪小块和一个高分辨小块的每两个小块之间的余弦相似度s_i,j，对于第i个裁剪小块，利用下式计算其与各个高分辨小块的相似度α_i,j：

其中，N为从第4层卷积层处理得到的结果图像

中提取的小块总数；

从

中以2为步长提取6×6的小块q_j，小块q_j为高分辨小块p_j在结果图像

中对应的小块，利用相似度α_i,j和小块q_j通过下式得到特征迁移小块q_i：

将所有特征迁移小块q_i组合得到特征迁移模块的结果ATN¹；

(2.2.6)利用下式得到经过第3层卷积层处理的结果图像fea³：

其中，

为第1层卷积层处理得到的结果图像；ATN¹为特征迁移模块处理的结果图像；UpSample为作2.0倍上采样的操作；Cat为图像通道维度拼接操作；

(2.2.7)利用下式得到经过第4层卷积层处理的结果图像fea⁴：

fea⁴＝Conv{fea³}

(2.2.8)最后对第4层卷积层处理的结果图像fea⁴进行下采样，下采样倍率为 B/M，得到下采样后的结果图像作为高分辨率区域R_H。

所述步骤(2.3)具体为：

(2.3.1)对步骤(2.2)获得的中心高分辨率区域R_H和周边低分辨率区域R_L，将中心高分辨率区域R_H融合到周边低分辨率区域R_L中心区域后得到如图5所示的融合后图像I_trans；

(2.3.2)对于融合后图像I_trans，在图像修复子网络的当前第1,2,3,4,5层卷积层时，利用下式处理获得每一当前层卷积层处理得到的结果图像：

其中，

为第k-1层卷积层处理得到的结果图像，k表示卷积层的序号， k＝1,2,3,4,5，

DownSample为作0.5倍下采样的操作；Conv为用初始化后的初始卷积核和初始偏置矩阵作卷积操作；

(2.3.3)对于第n个特征迁移模块，n＝1,2,3,4：

首先，对步骤(2.2.2)获得的下采样后掩膜图像mask’作1/2ⁿ⁺¹倍下采样的操作得到中间掩膜图像mask_n+1，根据中间掩膜图像mask_n+1得到中心高分辨率区域 R_H和周边低分辨率区域R_L分别在结果图像

中对应的区域

在区域

和

中分别以1为步长提取3×3的低分辨小块

高分辨小块

i、 j为小块编号，利用卷积操作得到一个低分辨小块和一个高分辨小块的每两个小块之间的余弦相似度

对于第i个低分辨小块，利用下式计算其与各个高分辨小块的相似度

其中，N为从区域

中提取的小块总数；

从

中以2为步长提取6×6的小块

小块

为高分辨小块

在结果图像

中对应的小块，利用相似度

和小块

通过下式得到第n个特征迁移模块的特征迁移小块

将

组合得到第n个特征迁移模块的结果ATNⁿ；

(2.3.4)利用下式得到经过第6层卷积层处理的结果图像

其中，ATN⁴为第4个特征迁移模块处理的结果图像；UpSample为作2.0倍上采样的操作；Cat为图像通道维度拼接操作；

(2.3.5)在第7,8,9层卷积层时，均利用下式处理获得经第7/8/9层卷积层处理得到的结果图像

其中，ATN^10-k为第10-k个特征迁移模块处理的结果图像；UpSample为作2.0 倍上采样的操作；Cat为图像通道维度拼接操作，k表示卷积层的序号，k＝7,8,9；

(2.3.6)利用下式得到经过第10层卷积层处理的结果图像作为修复后图像I_B：

所述步骤(2.4)具体为：在得到最后一级卷积层输出的结果图像I_B和参考图像I_R后，通过以下公式计算保真项误差Loss：

其中，(x,y)为图像像素点的坐标值，I_B(x,y)表示修复后图像I_B的坐标(x,y) 的像素点的像素值，I_R(x,y)表示参考图像I_R的坐标(x,y)的像素点的像素值，|| ||₁表示计算该项的L1范数。

所述步骤(2.5)具体为：首先通过下式获得保真项误差Loss对所有卷积神经网络模型的卷积层的卷积核权重和偏置参数的偏导数值：

其中，

分别为步骤(2.2)和(2.3)中卷积操作Conv的卷积核权重，

分别为步骤(2.2)和(2.3)中卷积操作Conv的偏置参数；I_R为参考图像；l为输入的高分辨图像与低分辨图像构成的图像对的序号；m为输入图像对的总量；

然后利用求得的保真项误差按照如下公式对卷积核权重

和偏置参数

进行更新：

其中，α为学习速率，

为更新后卷积核权重，

为更新后偏置参数。

本发明的有益效果：

本发明方法首先对公开数据集进行预处理，得到图像尺寸大小相同的高分辨图像和低分辨图像，以及与之对应的参考图像，作为训练卷积神经网络的训练集，然后建立卷积神经网络模型，以训练集迭代训练初始化后的卷积神经网络模型，直至迭代次数达到预设次数，完成模型训练，最后利用训练完成后的卷积神经网络模型，输入短焦相机获得的低分辨图像和长焦相机获得的高分辨图像以及变焦倍率，得到变焦后图像。

相比较现有的双焦相机数字变焦方法，本发明方法具有以下优势：第一，由于有长焦相机拍摄的高分辨图像的纹理细节，本发明方法根据图像修复的思路，通过特征迁移模块在深层特征的匹配，将高分辨图像的纹理细节迁移到低分辨图像语义相近的区域中，使得最终输出纹理信息较为丰富的数字变焦图像。第二，针对现有卷积神经网络模型的超分辨算法只支持固定倍率的变焦，将无法实现连续倍率数字变焦的问题，本发明方法在设计卷积网络模型时不按照图像超分辨网络进行设计，而是从图像修复的角度出发来实现数字变焦，从而实现了用一个卷积神经网络模型进行连续变焦。第三，本发明方法与传统方法相比，除了在训练卷积神经网络模型时需要耗费一定的运算资源与时间，当模型训练完成后对于输入图像进行处理的耗时短、消耗运算资源少，且具有较强算法鲁棒性。

综合来说，本发明方法利用卷积神经网络模型实现连续倍率的数字变焦图像合成，相较于现有的连续数字变焦方法，可更有效地利用长焦相机获得的高分辨率图像提供的丰富的纹理细节。

附图说明

图1为双焦相机成像系统示意图。

图2为本发明方法主要框架流程示意图。

图3为训练集图像对示意图(图中变焦倍率B＝3)。

图4为本发明方法所述卷积神经网络模型结构图。

图5为R_H和R_L融合后图像I_trans(图中变焦倍率B＝2)。

图6为根据短焦相机获得的低分辨图像I_RL和长焦相机获得的高分辨图像I_RH，利用训练完成的卷积神经网络模型获得的不同变焦倍率的图像。

图7为在变焦倍率B＝3.5的情况下，参考图像I_R、变焦后图像I_B和直接上采样后的图像。

具体实施方式

以下结合附图对本发明作进一步说明。

本发明针对如图1所示的双焦相机成像系统在成像过程中难以有效利用长焦相机获得的纹理细节、现有卷积神经网络模型无法实现连续倍率数字变焦、传统算法耗时长等技术问题，采用了利用卷积神经网络模型的双焦相机连续数字变焦方法。首先对公开数据集进行预处理，得到图像尺寸大小相同的高分辨图像和低分辨图像，以及与之对应的参考图像，作为训练卷积神经网络的训练集，然后建立卷积神经网络模型，以训练集迭代训练初始化后的卷积神经网络模型，直至迭代次数达到预设次数，完成模型训练，最后利用训练完成后的卷积神经网络模型，输入短焦相机获得的低分辨图像和长焦相机获得的高分辨图像以及变焦倍率，得到变焦后图像。

本发明的实施例及其实施情况如下：

实施例的流程如附图2所示，主要包括对公开数据集进行预处理建立训练集、利用训练集迭代训练卷积神经网络模型和利用训练完成卷积神经网络模型进行测试三个步骤。

步骤1对公开数据集进行预处理，得到图像尺寸大小相同的高分辨图像和低分辨图像，以及与之对应的参考图像，作为训练卷积神经网络的训练集。

1-1设短焦相机和长焦相机的空间采样率倍率比为M，获得图像尺寸大小为 H×W，H和W分别表示图像的横纵方向的标准尺寸，从公开数据集获取的输入图像I尺寸大小为H_I×W_I，H_I和W_I分别表示输入图像I的横纵方向的尺寸，满足H_I≥MH，W_I≥MW，公开数据集为BSD100、Urban100、DIV2K等用于图像超分辨率重建的数据集。

在具体实验中，采用空间采样率倍率比M＝4，获得图像尺寸大小为256×256，使用的公开数据集为DIV2K数据集。

1-2在输入图像I中随机裁剪尺寸大小为MH×MW的区域I₀，对区域I₀进行下采样，下采样倍率为M，将下采样后得到的区域I₁作为低分辨图像I_L；

在具体实验中，考虑到长焦高分辨图像和短焦低分辨图像虽然存在未配准的情况，但在大多数情况下并不是特别明显，因此θ的生成分布满足

的正态分布。

1-3随机生成变焦倍率B，满足1≤B≤M，其中M为短焦相机和长焦相机的空间采样率倍率比，使用双三次插值的方法，对训练集中的低分辨图像I_L进行上采样，上采样倍率为变焦倍率B，将上采样后图像进行中心裁剪，使得裁剪后图像尺寸大小为H×W，得到裁剪后图像I_UC；

1-4对步骤1-2获得的区域I₀进行下采样，使得下采样后区域尺寸大小为 BH×BW，然后对下采样后的区域进行中心裁剪，裁剪成尺寸大小为H×W的区域，将下采样、裁剪后的区域I₀作为对应参考图像I_R；将裁剪后图像I_UC、高分辨图像I_H和对应参考图像I_R作为训练集的一组图像，如图3所示；

1-5对公开数据集中的每幅图像随机生成3个变焦倍率B，重复步骤1-1至 1-4的操作，组成训练集；

在具体实验中，为了提升卷积神经网络模型训练效果，生成了两组不同的训练集，第一组为训练前期使用的训练集，该组训练集的变焦倍率为定值，B＝2， 3，3.5；第二组为模型较为稳定后使用的训练集，该组训练集的变焦倍率为随机值。

步骤2建立如图4所示的卷积神经网络模型，以训练集迭代训练初始化后的卷积神经网络模型，直至迭代次数达到预设次数，完成模型训练。

2-1卷积神经网络模型包含依次连接的细节迁移子网络和图像修复子网络的两个子网络：

图像修复子网络主要由十层卷积层和四个特征迁移模块构成，融合后图像 I_trans输入到图像修复子网络的第1层卷积层中，第1层卷积层～第5层卷积层依次连接，第6层卷积层～第10层卷积层依次连接，第1层卷积层和第2层卷积层的输出输入到第1特征迁移模块中，第2层卷积层和第3层卷积层的输出输入到第2特征迁移模块中，第3层卷积层和第4层卷积层的输出输入到第3特征迁移模块中，第4层卷积层和第5层卷积层的输出输入到第4特征迁移模块中，第1特征迁移模块～第3特征迁移模块的输出分别和第1层卷积层～第3层卷积层的输出、第8层卷积层～第6层卷积层的输出经图像通道连接操作后分别再连接输入到第9层卷积层～第7层卷积层，同时第4特征迁移模块的输出和第 4层卷积层的输出经图像通道连接操作后连接输入到第6层卷积层，第10层卷积层输出修复后图像I_B；

将卷积神经网络模型的初始模型参数，即卷积神经网络的各级卷积层的初始卷积核和所述各级卷积层的初始偏置矩阵中的所有元素值，初始化为32位浮点数，使所有初始模型参数服从(0,1)之间的均匀分布。

在具体实验中，卷积层的结构如下表所示：

2-2对步骤1获得的I_UC进行上采样，上采样倍率为M/B，得到上采样后图像I'_UC，定义与I'_UC尺寸大小相同的掩膜图像mask，将其中心H×W区域置为0，其余区域置为1；

对mask进行下采样，下采样倍率为B/M，得到下采样后掩膜图像mask’则周边低分辨率区域R_L＝mask’.*I_UC，其中.*运算为矩阵元素对应相乘；

对I'_UC进行中心裁剪，使得裁剪后图像尺寸大小与I_UC相同，得到裁剪后图像I”_UC；

对于再次裁剪图像I”_UC和高分辨图像I_H，分别输入到第1层卷积层和第3层卷积层中，分别利用下式同样处理获得经卷积层处理得到的结果图像：

其中，

为再次裁剪图像I”_UC经第1层卷积层处理得到的结果图像，

为

经第2层卷积层处理得到的结果图像，

为高分辨图像I_H经第2层卷积层处理得到的结果图像，

为

特征迁移模块：对于特征迁移模块，从第2层卷积层处理得到的结果图像

第4层卷积层处理得到的结果图像

其中，N为从第4层卷积层处理得到的结果图像

中提取的小块总数；

从

中对应的小块，利用相似度α_i,j和小块q_j，通过下式得到特征迁移小块q_i：

将所有特征迁移小块q_i组合得到特征迁移模块的结果ATN¹；

利用下式得到经过第3层卷积层处理的结果图像fea³：

其中，

为第1层卷积层处理得到的结果图像；ATN¹为第一层特征迁移模块处理的结果图像；UpSample为作2.0倍上采样的操作；Cat为沿着图像的通道维度拼接起来的操作；

利用下式得到经过第4层卷积层处理的结果图像fea⁴：

fea⁴＝Conv{fea³}

对fea⁴进行下采样，下采样倍率为B/M，得到下采样后的结果图像即为高分辨率区域R_H。

2-3对步骤2-2获得的R_L和R_H，将R_H填充到R_L中心为0的区域，得到融合后图像I_trans，如图5所示；对于融合后图像I_trans，在图像修复子网络的当前第 1,2,3,4,5层卷积层时，利用下式处理获得每一当前层卷积层处理得到的结果图像：

其中，

对于第n个特征迁移模块，n＝1,2,3,4：

中对应的区域

在区域

和

中分别以1为步长提取3×3的低分辨小块

高分辨小块

其中，N为从区域

中提取的小块总数；

从

中以2为步长提取6×6的小块

小块

为高分辨小块

在结果图像

中对应的小块，利用相似度

和小块

通过下式得到第n个特征迁移模块的特征迁移小块

将

组合得到第n个特征迁移模块的结果ATNⁿ；

利用下式得到经过第6层卷积层处理的结果图像

在第7,8,9层卷积层时，均利用下式处理获得经第7/8/9层卷积层处理得到的结果图像

利用下式得到经过第10层卷积层处理的结果图像作为修复后图像I_B：

2-4在得到最后一级卷积层输出的结果图像I_B和参考图像I_R后，通过以下公式计算保真项误差Loss：

其中，(x,y)为图像像素点的坐标值，I_B(x,y)表示修复后图像I_B的坐标(x,y) 的像素点的像素值，I_R(x,y)表示参考图像I_R的坐标(x,y)的像素点的像素值，||||₁表示计算该项的L1范数。

2-5首先通过下式获得保真项误差Loss对所有卷积神经网络模型的卷积层的卷积核权重和偏置参数的偏导数值：

其中，

和

分别为步骤2-2和2-3中卷积操作Conv的卷积核权重和偏置参数；I_R为参考图像；l为输入高分辨与低分辨图像对的序号；m为输入图像对的总量，在具体实验中，每输入16个图像对更新一次偏导；

然后利用求得的保真项误差按照如下公式对卷积核权重

和偏置参数

进行更新：

其中，α为学习速率，是控制卷积核权重和偏置参数变化快慢的参数。

2-6根据调整后的卷积神经网络模型参数，继续进行步骤2-2至2-5的操作，进行模型参数调整的过程，直至迭代次数达到预设次数，则模型训练完毕，在具体实验中，预设次数为250000次。

步骤3输入短焦相机获得的低分辨图像I_RL和长焦相机获得的高分辨图像I_RH以及变焦倍率B，使用双三次插值的方法，对低分辨图像I_RL进行上采样，上采样倍率为变焦倍率B，将上采样后图像进行中心裁剪，使得裁剪后图像尺寸大小为H×W，将上采样、裁剪后图像和高分辨图像I_RH通过训练完成后的卷积神经网络模型，输出变焦后图像I_B。

图6为输入不同变焦倍率B后得到的变焦后图像，图7为同一变焦倍率下参考图像、直接上采样后图像和使用本方法获得的变焦后图像的视觉效果对比。从视觉结果可以明显发现，本发明方法实现了用一个卷积神经网络模型进行连续变焦，且具有较好的视觉效果。

Claims

1.一种基于卷积神经网络模型的双焦相机连续数字变焦方法，其特征在于：该方法包括以下步骤：

(2)建立卷积神经网络模型，以训练集迭代训练初始化后的卷积神经网络模型，直至迭代次数达到预设次数，完成模型训练，具体是：

(2.6)根据调整后的卷积神经网络模型参数，重复进行步骤(2.2)至步骤(2.5)的操作，进行模型参数调整的过程，直至迭代次数达到预设次数，则模型训练完毕；

2.根据权利要求1所述的基于卷积神经网络模型的双焦相机连续数字变焦方法，其特征在于：所述的双焦相机是获得低分辨图像的短焦相机和获得高分辨图像的长焦相机，短焦相机采集的图像作为低分辨图像，长焦相机采集的图像作为高分辨图像，低分辨图像和高分辨图像尺寸大小相同，且高分辨图像的视场在低分辨图像的视场内。

3.根据权利要求1所述的基于卷积神经网络模型的双焦相机连续数字变焦方法，其特征在于：所述步骤(1)具体为：

将区域I₀随机旋转θ，满足-1°≤θ≤1°，得到旋转后区域I₂，对区域I₂进行中心裁剪，裁剪成图像尺寸大小为H×W，将裁剪后的区域I₂作为高分辨图像I_H；

(1.4)对(1.2)获得的区域I₀进行下采样，使得下采样后区域尺寸大小为BH×BW，然后对下采样后的区域进行中心裁剪，裁剪成尺寸大小为H×W的区域，将下采样、裁剪后的区域I₀作为对应参考图像I_R；将裁剪后图像I_UC、高分辨图像I_H和对应参考图像I_R作为训练集的一组图像；

(1.5)对公开数据集中的每幅图像随机生成3个不同的变焦倍率B，重复(1.1)至(1.4)的操作，构建组成训练集。

4.根据权利要求1所述的基于卷积神经网络模型的双焦相机连续数字变焦方法，其特征在于：所述步骤(2)中的卷积神经网络模型包含依次连接的细节迁移子网络和图像修复子网络的两个子网络：

细节迁移子网络主要由六层卷积层和一个特征迁移模块构成，第1层、第2层卷积层依次连接，第3层、第4层卷积层依次连接，第5层、第6层卷积层依次连接，将训练集中得裁剪后图像I_UC和高分辨图像I_H分别输入到细节迁移子网络的第1层卷积层和第3层卷积层中，细节迁移子网络的第1层卷积层、第2层卷积层和第4层卷积层的输出均输入到特征迁移模块中，特征迁移模块的输出和第1层卷积层的输出一起经图像通道连接操作后输入到细节迁移子网络的第5层卷积层中，细节迁移子网络的第6层卷积层输出的中心高分辨率区域R_H和裁剪后图像I_UC处理后输出的周边低分辨率区域R_L一起进行融合操作后输出融合后图像I_trans到图像修复子网络；

图像修复子网络主要由十层卷积层和四个特征迁移模块构成，融合后图像I_trans输入到第1层卷积层中，第1层卷积层～第5层卷积层依次连接，第6层卷积层～第10层卷积层依次连接，第1层卷积层和第2层卷积层的输出输入到第1特征迁移模块中，第2层卷积层和第3层卷积层的输出输入到第2特征迁移模块中，第3层卷积层和第4层卷积层的输出输入到第3特征迁移模块中，第4层卷积层和第5层卷积层的输出输入到第4特征迁移模块中，第1特征迁移模块～第3特征迁移模块的输出分别和第1层卷积层～第3层卷积层的输出、第8层卷积层～第6层卷积层的输出经图像通道连接操作后分别再连接输入到第9层卷积层～第7层卷积层，同时第4特征迁移模块的输出和第4层卷积层的输出经图像通道连接操作后连接输入到第6层卷积层，第10层卷积层输出修复后图像I_B。

5.根据权利要求1所述的基于卷积神经网络模型的双焦相机连续数字变焦方法，其特征在于：所述步骤(2.1)中，将卷积神经网络模型的初始模型参数，即卷积神经网络的各级卷积层的初始卷积核和所述各级卷积层的初始偏置矩阵中的所有元素值，初始化为32位浮点数，使卷积神经网络模型的所有初始模型参数服从(0,1)之间的均匀分布。

6.根据权利要求1所述的基于卷积神经网络模型的双焦相机连续数字变焦方法，其特征在于：所述步骤(2.2)具体为：

R_L＝mask’.*I_UC

其中，.*运算表示为矩阵中相同位置的元素对应相乘；