CN111626927B

CN111626927B - 采用视差约束的双目图像超分辨率方法、系统及装置

Info

Publication number: CN111626927B
Application number: CN202010274811.6A
Authority: CN
Inventors: 杨杰; 张天忆; 黄晓霖
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2023-05-30
Anticipated expiration: 2040-04-09
Also published as: CN111626927A

Abstract

本发明提供了一种采用视差约束的双目图像超分辨率方法、系统及装置，所述方法用成对的高、低分辨率双目图像作为训练集对神经网络进行训练，构建神经网络中的双目视差约束，得到双目超分辨率的神经网络模型，该模型是一种视差约束注意力机制网络模型；利用所述双目超分辨率的神经网络模型对待超分辨率的双目图像进行超分辨率，得到超分辨率后的双目图像。本发明所提出的双目图像超分辨方法，能够有效地利用双目视差约束提升图像分辨率，且端对端模型计算方便，使用训练后的模型具有较高的实时性。

Description

采用视差约束的双目图像超分辨率方法、系统及装置

技术领域

本发明涉及计算机视觉与数字图像处理领域，具体地，涉及一种基于视差约束下注意力机制网络的双目图像超分辨率方法、系统及装置。

背景技术

图像超分辨率是当前计算机视觉和图像处理领域的一个热点问题，即给定低分辨率图像，恢复出高分辨率的图像的方法，该方法输出的结果图像称为超分辨率图像。目前而言，图像超分辨方法按目标图像可分为针对单张图像的超分辨率(Single Image Super-Resolution,SISR)方法和针对双目图像的超分辨率方法；按照方法中的图像处理方式可分为基于深度学习的图像超分辨率方法和基于传统图像处理技术的图像超分辨率方法。

基于传统图像处理技术的超分辨率方法由于其计算复杂，通用性差，目前已经较少使用。主流的图像超分辨率方法为基于深度学习的方法，如SRCNN(超分辨率卷积神经网络)、VDSR(基于极深网络的超分辨率)等，但以上都属于单目图像超分辨率方法。目前的双目图像超分辨率方法以构建神经网络的方法为主，如Wang L G,Wang Y Q,Liang Z F,etal.Learning parallax attention for stereo image super-resolution.[C]//Computer Vision and Pattern Recognition(CVPR),2018 IEEE Conference on.IEEE,2019:12250-12259.，作者提出了一种基于双目注意力机制网络的超分辨率方法，该方法试图利用双目图像的映射关系，将低分辨率下的左、右特征图像进行融合，与其他单目的图像超分辨率方法相比增加了特征图像的信息量，提升了图像超分辨率的效果。

专利方面，公开号为CN105844630A的中国发明专利发明公开了一种双目视觉的图像超分辨率融合去噪方法。该方法通过提取SIFT特征对左右灰度图进行位置匹配，然后利用拉普拉斯算子对两图进行超分辨率融合，最后利用非局部均值滤波方法对融合后的图像进行去噪，属于基于传统图像处理技术的图像超分辨率方法。

然而以上方法均未考虑到双目超分辨率方法中，低分辨率图像与超分辨率图像左右图映射关系是否一致的问题，无法保证超分辨率的结果不改变原始双目图像的映射关系。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种采用视差约束的双目图像超分辨率方法、系统及装置，在神经网络训练中加入视差约束，使得低分辨率与超分辨率下双目图像的视差图尽可能相似，提升超分辨率在某些边缘和纹理上的效果。

根据本发明的第一方面，提供一种采用视差约束的双目图像超分辨率方法，包括：

用成对的高、低分辨率双目图像作为训练集对神经网络进行训练，构建神经网络中的双目视差约束，得到双目超分辨率的神经网络模型，该模型是一种视差约束注意力机制网络模型；

利用所述双目超分辨率的神经网络模型对待超分辨率的双目图像进行超分辨率，得到超分辨率后的双目图像。

可选地，所述构建神经网络中的双目视差约束，双目超分辨率的神经网络模型，包括：

对低分辨率双目图像进行特征提取得到特征图像，利用注意力机制建立能够表现映射关系的低分辨率双目图像视差图，用该视差图将所述特征图像进行拼接、融合并执行超分辨率操作，得到超分辨率后的双目图像，利用同样的注意力机制建立超分辨率双目图像视差图；

利用真实高分辨率双目图像与超分辨率双目图像的差距、低分辨率双目图像与超分辨率双目图像视差图的差距构建损失函数，输入训练集训练所述神经网络，优化所述神经网络的网络参数，得到双目超分辨率的神经网络模型。

可选地，所述对低分辨率双目图像进行特征提取得到特征图像，包括：

对于每对双目图像输入的左、右低分辨率图像，依次经过权值共享的卷积层、交替排布的带有残差的膨胀空间金字塔池化层和带有残差的卷积层，得到提取后的左、右特征图像。

可选地，所述利用注意力机制建立能够表现映射关系的低分辨率双目图像视差图，包括：

对于提取得到的左、右特征图像，输入并行注意力模块得到左、右视差图像。

可选地，所述用该视差图将特征图像进行拼接、融合并执行超分辨率操作，得到超分辨率后的双目图像，包括：

所述左、右视差图像经过拼接、融合、子像素卷积上采样操作得到超分辨率后的双目图像。

可选地，所述构建损失函数，包括：

将损失函数最小化问题定义为：

上式中，θ代表模型参数，n为每次训练的图像数即batch数量，其余三项损失函数分别为均方误差损失L_MSE、视差约束损失L_DC和并行注意力模块损失L_PAM；以下假设I表示图像矩阵，D表示视差图张量；上标中SR表示超分辨率，HR表示高分辨率，LR表示低分辨率；下标中L表示左图，R表示右图，则

均方误差损失L_MSE为：

视差约束损失L_DC为：

其中，ups表示三次线性插值函数，将低分辨率视差图缩放到与超分辨率视差图相同的尺寸；

并行注意力模块损失L_PAM为：

L_PAM＝L_photo+L_smooth+L_cycle

其中，

上式中

为矩阵乘法，I为单位张量，i,j,k分别为张量的三个维度坐标。

可选地，所述方法还包括数据收集，将校正与配准后的双目高、低分辨率图像数据进行数据集划分，划分为训练集与测试集，所述训练集用于训练神经网络，所述测试集用于对所述双目超分辨率的神经网络模型结果进行测试。

根据本发明的第二方面，提供一种采用视差约束的双目图像超分辨率系统，包括：

模型构建模块，用成对的高、低分辨率双目图像作为训练集对神经网络进行训练，构建神经网络中的双目视差约束，得到双目超分辨率的神经网络模型，该模型是一种视差约束注意力机制网络模型；

测试模块，利用所述双目超分辨率的神经网络模型对待超分辨率的双目图像进行超分辨率，得到超分辨率后的双目图像。

根据本发明的第三方面，提供一种采用视差约束的双目图像超分辨率装置，包括：存储器，处理器，以及计算机程序；其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现上述的采用视差约束的双目图像超分辨率方法。

根据本发明的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现上述的采用视差约束的双目图像超分辨率方法。

与现有技术相比，本发明具有如下至少一种有益效果：

本发明上述采用视差约束的双目图像超分辨率方法、系统和装置，利用双目图像的映射关系，采用带有视差约束的、利用注意力机制网络实现的双目图像超分辨率，将双目低分辨率图像转换为双目超分辨率图像，并尽可能使得低分辨率与超分辨率中的视差映射关系具有一致性，提升超分辨率在某些边缘和纹理上的效果。

本发明上述采用视差约束的双目图像超分辨率方法、系统和装置，有效地避免了利用单目图像超分辨率方法无法充分利用双目图像映射关系中所包含信息的问题。

本发明上述采用视差约束的双目图像超分辨率方法、系统和装置，能够有效地利用双目视差约束提升图像分辨率，且可以是端对端模型，计算方便，具有较高的实时性，可广泛运用在视频监控与医学图像等领域。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明一实施例中方法流程图；

图2为本发明一实施例中视差约束注意力机制网络示意图；

图3为本发明一实施例中输入图像的特征提取模块示意图；

图4为本发明一实施例中带有残差的膨胀空间金字塔池化层resASPP示意图；

图5为本发明一实施例中带有残差的卷积层res示意图；

图6为本发明一实施例中并行注意力模块PAM模块示意图(以左图对应的PAM为例)；

图7为本发明一实施例中上采样模块示意图；

图8为本发明一实施例中所展示的图像超分辨率结果图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进。这些都属于本发明的保护范围。以下没有详细说明的部分可以采用现有技术实现。

图1为本发明一实施例中方法流程图。如图1所示，本实施例中的采用视差约束的双目图像超分辨率方法，构建一个端对端的深度神经网络，并用训练集中成对的双目图像进行训练，构建神经网络中的双目视差约束，然后利用测试集图像数据进行双目图像超分辨。

在优选实施例中，对于双目图像按照如下详细步骤进行超分辨率处理：

S1，将校正与配准后的双目高、低分辨率图像数据进行数据集划分，包括训练集与测试集。

S2，建立并训练视差约束注意力机制网络模型：首先对低分辨率双目图像进行特征提取，并利用注意力机制建立能够表现映射关系的低分辨率双目图像视差图，利用视差图将特征图像进行拼接、融合并执行超分辨率操作，得到超分辨率后的双目图像并利用同样的注意力机制建立超分辨率双目图像视差图；利用真实高分辨率与超分辨率图像的差距和低分辨率与超分辨率视差图的差距构建损失函数，输入训练集训练模型，优化网络模型参数；

S3，对待定图像进行超分辨率操作：将待超分辨率的双目图像输入S2所训练的模型中，得到超分辨后的输出图像。

本发明上述实施例利用双目图像的映射关系，提供了一种带有视差约束的，利用注意力机制网络实现的双目图像超分辨率方法。该方法能够利用神经网络，将双目低分辨率图像转换为双目超分辨率图像，并尽可能使得低分辨率与超分辨率中的视差映射关系具有一致性。本发明有效地避免了利用单目图像超分辨率方法无法充分利用双目图像映射关系中所包含信息的问题。

在部分优选实施例中，S1中，利用配准和校正后的高、低分辨率双目图像构建数据集，即对于某一个实体中的点对应双目图像的像素应当只有宽度上的位移，而没有高度上的位移。数据集划分为训练集与测试集，其中训练集用于S2的训练模型，测试集用于S3的测试模型。

在部分优选实施例中，S2中，得到的差约束注意力机制网络模型，如图2所示。其中，PAM表示并行注意力模块(Parallel-Attention Module,PAM)。

S2中，对低分辨率双目图像进行特征提取，可以按照以下方式进行：对于每对输入的左、右低分辨率图像

和/>

依次经过权值共享的卷积层(convolutional layer,conv)、交替排布的带有残差的膨胀空间金字塔池化层(residual Atrous SpatialPyramid Pooling,resASPP)和带有残差的卷积层(conv layer with residual,res)，如图3所示，图3中，卷积层conv指的是3×3卷积，带有残差的膨胀空间金字塔池化层resASPP的结构如图4所示，带有残差的卷积层res为串联的两个3×3卷积与输入相加得到的结构，如图5所示。用虚线箭头相连的两个模块权值共享，即拥有共同的参数。图4中，矩形除带有标注之外均为3×3卷积，膨胀系数由d进行标识，圆形Σ代表加法器。

将特征提取后的特征图输入到两个PAM模块中。两个PAM为对称结构，以其中一个为例，其结构如图6所示，并行注意力模块PAM模块示意图(以左图对应的PAM为例)，其中，concat表示张量拼接，

代表矩阵乘法。该模块可以输入经过特征提取后的左右特征图像，输出视差图和用于下一步上采样操作的张量。

将上一步PAM模块中得到的张量，经过上采样模块得到超分辨率图像。利用超分辨率左、右图进行特征提取并输入到PAM模块，可以得到超分辨率双目图像视差图，如图2所示。上采样模块的结构如图7所示。其中，Sub pixel指的是子像素卷积(Subpixelconvolution)操作。

将训练集输入模型，利用优化器迭代调整网络模型参数，使损失函数最小化，其中损失函数最小化问题定义为：

上式中，θ代表模型参数，n为每次训练的图像数即batch数量。其余三项损失函数分别为均方误差损失L_MSE、视差约束损失L_DC和并行注意力模块损失L_PAM.

均方误差损失为：

其中，上标SR表示超分辨率图像，HR表示真实高分辨率图像；下标L与R分别代表左图、右图。

视差约束损失为：

其中，ups表示三次线性插值函数，将低分辨率视差图缩放到与超分辨率视差图相同的尺寸。

并行注意力模块损失为：

L_PAM＝L_photo+L_smooth+L_cycle

其中，

/>

上式中

为矩阵乘法，I为单位张量。

在另一实施例中，提供一种采用视差约束的双目图像超分辨率系统，该系统可以用于实现上述方法，包括：模型构建模块，用成对的高、低分辨率双目图像作为训练集对神经网络进行训练，构建神经网络中的双目视差约束，得到双目超分辨率的神经网络模型，该模型是一种视差约束注意力机制网络模型；测试模块，利用所述双目超分辨率的神经网络模型对待超分辨率的双目图像进行超分辨率，得到超分辨率后的双目图像。

上述模块的具体实现技术可以采用上述实施例中的采用视差约束的双目图像超分辨率方法的对应技术。在此不再赘述。

在另一实施例中，还提供一种采用视差约束的双目图像超分辨率装置，包括：存储器，处理器，以及计算机程序；所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现上述任一项实施例中的采用视差约束的双目图像超分辨率方法。

在另一实施例中，还提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现上述任一项实施例中的采用视差约束的双目图像超分辨率方法。

本发明上述实施例的效果通过以下实验进一步说明：

1.实验条件

本实验采用4560个高分辨率双目图像对，作为模型的训练集。高分辨率图像大小为512×512像素，在训练时切割成30×90像素的成对图像块输入网络。双目图像对用daVanci外科手术系统采集，并经过图像校正使左右图像对齐。另外，使用870对双目图像作为验证集，用来调整模型超参数；使用870对双目图像作为测试集，用来测试模型效果。模型实现采用Pytorch，计算硬件为Nvidia GTX 1080 Ti GPU。

训练过程中的参数如下：优化器采用Adam，动量设置为0.9；训练过程共80代，每次训练时的batch大小设置为8，图像放大倍数为4倍，初始模型学习率为0.0002，且每30代学习率减半。

为了表现超分辨率的效果，实验中对比了插值方法(bicubic)和其他基于神经网络的超分辨率方法，包括SRCNN、VDSR、DRRN、PASSR。

2.实验内容

从定性和定量两个角度对本发明实施例提出的双目超分辨图像方法进行验证。

2.1定性实验结果

本发明实施例对测试集中的图像进行了超分辨率操作，并与其他方法得到的结果进行对比。如图8所示，为超分辨率结果图，其中DCSSR为本发明实施例中的方法。图8中图像中，右下角的框中展示的是完整图像，其余部分为该图像中某个区块的局部放大。可以看到，与其他超分辨率的方法相比，本发明实施例所提出的方法恢复出了更多与边缘、纹理相关的细节，验证了本发明实施例在双目图像超分辨任务上具有良好的效果。

2.2定量分析

本发明实施例对测试集中的870对双目图像超分辨率结果进行了定量误差分析，所对比的方法包括插值方法(bicubic)、SRCNN、VDSR、DRRN和PASSR方法。评价指标包括图像的峰值信噪比(Peak Signal to Noise Ratio,PSNR)和结构相似度(StructuralSIMilarity index，SSIM)，峰值信噪比定义如下：

其中，MSE指真实高清图像I与超分辨率结果图像K的均方误差(Mean SquareError):

公式中的m和n分别表示图像的高和宽，I(i,j)表示图像I第i行，第j列上的像素值，取值范围为0-255。峰值信噪比的单位是分贝(dB)，均方误差越小，峰值信噪比越高，两张图像差距越小，说明算法效果越好。

结构相似度与图像像素均值与方差有关，其计算方式为

其中，μ_I为图像I的像素均值，σ_I为图像I的像素方差，σ_IK为图像I与K的像素协方差。常数c₁、c₂分别取c₁＝(0.01×255)²，c₂＝(0.03×255)²，SSIM的取值范围为0-1，且越接近1，两张图像差距越小，说明算法效果越好。

对测试集中的图像利用不同方法进行测试并取平均后，得到实验结果如表1所示：

表1.不同超分辨率方法在测试集上的PSNR和SSIM对比(最好的结果加粗表示)

从表1的结果可以看出，本发明实施例所提出的双目图像超分辨率方法取得了35.598dB的平均峰值信噪比和0.9809的结构相似度。相比于其他利用神经网络进行超分辨率的方法，该数值说明，本发明实施例所提出的超分辨率方法在测试集上的结果更好，利用双目图像之间的映射关系提升了超分辨率的效果。

本发明实施例能够有效地利用双目视差约束提升图像分辨率，且端对端模型计算方便，使用训练后的模型具有较高的实时性。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质内容。