CN113506217A

CN113506217A - 一种基于循环交互的立体图像超分辨率重建方法

Info

Publication number: CN113506217A
Application number: CN202110780942.6A
Authority: CN
Inventors: 雷建军; 张哲�; 彭勃; 朱杰; 范晓婷
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2021-07-09
Filing date: 2021-07-09
Publication date: 2021-10-15
Anticipated expiration: 2041-07-09
Also published as: CN113506217B

Abstract

本发明公开了一种基于循环交互的立体图像超分辨率重建方法，包括：通过队列重组转换将左右视点的多层特征重组为左右序列，重组排列遵循特征从浅层到深层的顺序；构建循环交互模块，以循环结构交互增强左右视点多层特征，所述循环交互模块由循环交互单元组成，循环交互单元由2个交互单元和跳连接组成；通过多次传播策略，循环交互输入序列中的左右视点多层特征，学习视点间依赖性以增强特征，进而获取最终的循环交互增强特征；基于循环交互增强特征，使用子像素卷积提高特征分辨率，使用n×n卷积将特征重建为高分辨率左右视图；使用相关性损失函数、差异损失函数和L1损失函数构建多损失函数机制，提升立体图像的超分辨率重建质量。

Description

一种基于循环交互的立体图像超分辨率重建方法

技术领域

本发明涉及深度学习、图像超分辨率重建领域，尤其涉及一种基于循环交互的立体图像超分辨率重建方法。

背景技术

随着立体显示设备的不断普及，立体图像显示质量愈发受到关注。立体显示中，高分辨率的立体图像能够为人们提供细腻逼真的立体视觉体验，因而至关重要。立体图像超分辨率重建旨在通过预测低分辨率立体图像中缺失的高频信息，实现高分辨率立体图像的重建。立体图像超分辨率重建能够恢复左右视点的纹理细节，使其被广泛应用于深度估计、视点合成和图像压缩等多种图像处理技术。此外，作为基础的图像处理任务，立体图像超分辨率重建也促进了很多高级计算机视觉任务的发展，例如：行人重识别和目标检测等。因此，立体图像超分辨率重建具有重要的研究意义和实际应用价值。然而，由于立体图像左右视点图像组成，视点间的视差关系会引起左右视图空间位置不一致，使得利用视点间信息以辅助立体图像超分辨率重建具有挑战性。因此，有效探索并利用立体图像的视点间相关性是重建高分辨率立体图像的关键。

得益于深度学习在单图超分辨率重建任务中的成功，近年来基于深度学习的立体图像超分辨率重建方法开始受到关注。Jeon等人提出了立体超分辨率方法，通过学习视差先验来获得低分辨率图像到高分辨率图像的端到端映射。Wang等人提出基于视差注意力的立体超分辨率重建方法，该方法通过使用视差注意力机制获取全局一致性，有效整合视点间信息以实现立体图像超分辨率重建。Song等人提出了基于自视差注意力机制的方法，同时获取自注意力图和视差注意力图，深入挖掘左右视点间的全局一致关系。Lei等人提出了基于深度交互学习的立体图像超分辨率重建方法，该方法通过构建交互模块以探索深层特征间的互补信息，提高立体图像超分辨率重建性能。然而，来自网络不同层级的左右视点不同层级特征间的互补信息未被充分挖掘。

因此，如何基于循环神经网络，有效利用不同层级特征间的视点间依赖性，以重建高分辨率立体图像，值得进一步的研究。这种不同层特征间的视点间依赖性需要被进一步探索和利用，以帮助重建高分辨率立体图像。

为了有效探索双视点多层特征间的视点间依赖性，基于循环神经网络的方法值得进一步的研究与开发。

发明内容

本发明提供了一种基于循环交互的立体图像超分辨率重建方法，本发明利用深度学习的特征表达能力，基于循环神经网络挖掘立体图像不同层级特征间的视点间依赖性，实现立体图像超分辨率重建，详见下文描述：

一种基于循环交互的立体图像超分辨率重建方法，所述方法包括以下步骤：

通过队列重组转换将左右视点的多层特征重组为左右序列，重组排列遵循特征从浅层到深层的顺序；

构建循环交互模块，以循环结构交互增强左右视点多层特征，所述循环交互模块由循环交互单元组成，所述循环交互单元由2个交互单元和跳连接组成；

通过多次传播策略，循环交互输入序列中的左右视点多层特征，学习视点间依赖性以增强特征，进而获取最终的循环交互增强特征；

基于循环交互增强特征，使用子像素卷积提高特征分辨率，使用n×n卷积将特征重建为高分辨率左右视图；

使用相关性损失函数、差异损失函数和L1损失函数构建多损失函数机制，提升立体图像的超分辨率重建质量。

其中，所述通过队列重组转换将左右视点的多层特征重组为左右序列具体为：

在队列重组转换过程中，左右序列由不同层级的左右视点特征交替排列组成，且重组排列遵循特征从浅层到深层的顺序。

进一步地，所述循环交互单元用于学习当前输入与之前的输入间的视点间依赖性，即：

在每个时间步，将传播的隐藏层状态与当前输入的特征进行交互，以获得增强的隐藏层状态和增强的当前特征；

将增强的隐藏层状态传播至下一时间步进行下一次交互增强，增强的当前特征保留以用作第n+1次传播；

在遍历序列S_(n)中的所有特征后，最后一个隐藏层状态即为此次传播的增强特征F_(n)，将增强特征F_(n)作为序列S_(n+1)的第一个特征，进行第n+1次传播。

其中，所述多次传播策略为：

利用多次传播策略获得的第n+1个左序列表达如下：

S₍₁₎＝S_l

S_(n+1)＝RI_(n)(...RI₍₂₎(RI₍₁₎(S₍₁₎))...)

其中，S_(n+1)代表第n次传播RI_(n)(·)输出的增强序列，RI_(n)表示第n次循环交互；右序列的传播策略相同。

进一步地，所述第n次传播的循环过程表达如下：

其中，

代表第n次传播的第i时间步输出的隐藏层状态，

代表序列S_(n)在第n次传播的第i时间步的输入特征，InU_H和InU_S分别代表用于增强隐藏层状态的交互单元和用于增强当前特征的交互单元，

和

由跳连接实现。

本发明提供的技术方案的有益效果是：

1、本发明利用深度学习的特征表达能力，使用循环结构充分挖掘双视点多层特征间的视点间依赖性，从而实现立体图像超分辨率重建；

2、本发明设计了循环交互模块，循环增强双视点特征，使其具有更强立体图像特征表达能力；同时，面向循环交互模块提出了队列重组转换和多次传播策略，辅助实现双视点特征的循环增强；

3、本发明通过在多个数据集上进行实验验证，可以获得优于现有立体图像超分辨率重建方法的性能。

附图说明

图1为一种基于循环交互的立体图像超分辨率重建方法的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面对本发明实施方式作进一步地详细描述。

一、构建多层空间特征提取模块

对输入的左右视图，本发明实施例分两支路构建多层空间特征提取模块获取多层空间特征表达

和

具体地，两支路的多层空间特征提取模块共享参数，均由级联的p层残差组构成，第p层残差组输出的特征记作

和

其中，每个残差组由级联的多个残差块和一个通道注意力组成。

二、队列重组转换

对于左右视点的多层空间特征表达

和

本发明实施例设计队列重组转换将双视点多层特征重组为左右序列。在队列重组转换过程中，左右序列由不同层级的左右视点特征交替排列组成，且重组排列遵循特征从浅层到深层的顺序。左序列S_l和右序列S_r分别定义如下：

三、构建循环交互模块

为了充分探索并利用双视点多层特征间的视点间依赖性，本发明实施例构建循环交互模块，设计多次传播策略，以循环结构交互增强左右视点特征。以左视点支路为例，对于输入的左序列S_l，利用多次传播策略获得的第n+1个左序列表达如下：

S₍₁₎＝S_l

S_(n+1)＝RI_(n)(...RI₍₂₎(RI₍₁₎(S₍₁₎))...)

其中，S_(n+1)代表第n次传播RI_(n)(·)输出的增强序列，RI_(n)表示第n次循环交互。循环交互模块由循环交互单元组成，对于第n次传播，输入序列S_(n)中的特征利用循环交互单元实现交互。该循环交互单元由2个交互单元和跳连接组成。对于循环过程中的每一时间步，利用循环交互单元学习当前输入与之前的输入间的视点间依赖性。

具体地，在每个时间步，首先将传播的隐藏层状态与当前输入的特征进行交互，以获得增强的隐藏层状态和增强的当前特征。其中，增强的隐藏层状态传播至下一时间步进行下一次交互增强，增强的当前特征保留以用作第n+1次传播。在遍历序列S_(n)中的所有特征后，最后一个隐藏层状态即为此次传播的增强特征F_(n)。然后，增强特征F_(n)作为序列S_(n+1)的第一个特征(即第一个送入循环过程)，进行第n+1次传播。第n次传播的循环过程表达如下：

其中，

代表第n次传播的第i时间步输出的隐藏层状态。

代表序列S_(n)在第n次传播的第i时间步的输入特征。InU_H和InU_S分别代表用于增强隐藏层状态的交互单元和用于增强当前特征的交互单元，

和

由跳连接实现。

通过使用多次传播策略，循环交互输入序列中的双视点多层特征，充分学习视点间依赖性以增强特征。整体循环交互进程表达如下：

F_(n)＝RI(S₍₁₎)

其中，RI(·)代表循环交互进程。

具体到左右视点，最终获得的循环交互增强特征表达如下：

F_l＝RI_l(S_l)

F_r＝RI_r(S_r)

其中，RI_l和RI_r分别代表左右视点的循环交互模块，F_l和F_r分别代表循环交互增强的左右视点特征。

四、构建重建模块

为了将左右视点的增强特征重建为高分辨率立体图像，构建重建模块实现从特征域到图像域的转换。

对循环交互增强特征F_l和F_r，本发明实施例首先使用一层子像素卷积提高特征分辨率，然后使用一层n×n(本发明实施例优选以3×3为例进行说明)卷积将特征重建为高分辨率左右视图

和

五、构建多损失函数机制

为了增强立体图像的纹理细节，并保持视点间的视差一致性，本发明实施例使用相关性损失函数、差异损失函数和L1损失函数构建多损失函数机制，提升立体图像的超分辨率重建质量。

为保持重建立体图像的视点间相关性，本发明实施例利用相关性矩阵计算相关性损失。相关性损失函数的公式表达如下：

其中，N表示批次大小，||·||₁表示L1距离，

表示转置的重建左视图，

表示重建的右视图，

表示转置的高分辨率左视图，I_r表示高分辨率右视图，×代表矩阵乘法。

此外，为了直接约束左右视点的差异，利用差异损失函数约束重建的左右视图，公式表达如下：

其中，|·|表示绝对值计算，I_l表示高分辨率左视图。

最后，本发明实施例使用L1损失函数来约束重建立体图像的整体质量，L1损失函数的公式表达如下：

最终训练网络使用的损失函数表达如下：

L＝L₁+L_corr+L_diff

训练基于循环交互的立体图像超分辨率重建网络。该训练过程中，基于循环交互的立体图像超分辨率重建网络包括：多层空间特征提取模块、队列重组转换、循环交互模块和重建模块。在该训练阶段，多层空间特征提取模块包含4个级联的残差组，每个残差组包含20层级联的残差块和1个通道注意力。

本发明实施例对各器件的型号除做特殊说明的以外，其他器件的型号不做限制，只要能完成上述功能的器件均可。

本领域技术人员可以理解附图只是一个优选实施例的示意图，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。