CN111986106A

CN111986106A - 一种基于神经网络的高动态图像重建方法

Info

Publication number: CN111986106A
Application number: CN202010749859.8A
Authority: CN
Inventors: 马展; 蒲志远; 郭珮瑶
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2020-11-24
Anticipated expiration: 2040-07-30
Also published as: CN111986106B

Abstract

本发明公开了一种基于神经网络的高动态图像重建方法。该方法的具体步骤如下：(1)将多个LDR域的图像按照亮度高低排列，并选取参考图像。(2)利用伽玛变换转换LDR域的图像得到HDR域的图像。(2)将HDR域和LDR域的图像输入到特征提取网络中提取不同尺度的HDR域和LDR域的图像特征。(3)将HDR域和LDR域的图像特征输入到金字塔对齐网络，利用HDR域特征来计算对齐所需的偏移量，用所得偏移对齐HDR域和LDR域的图像特征。(4)对齐后的HDR域和LDR域图像特征经过融合网络，得到重建的HDR图像。利用本方法可以较好地处理输入图像组中的物体运动和视差，重建高主观质量的无伪影的HDR图像。

Description

一种基于神经网络的高动态图像重建方法

技术领域

本发明涉及计算摄像学领域，尤其涉及一种基于神经网络的高动态成像技术。

背景技术

人眼对光线高度敏感且可捕获高动态范围的场景，而普通相机捕获的图像往往包含过曝或者欠曝区域，会丢失较多场景中的细节信息。高动态成像技术旨在生成接近人眼感知的场景的图像，现有的高动态成像方法主要包括两大类：基于硬件设计的方法和基于计算重建的方法。

基于硬件设计的方法通过设计专用结构来捕获高光和暗部信息，生成高动态范围的图像。这类方法大多利用分束器或空间多曝光像素来设计。基于硬件的方法可以直接拍摄得到较高质量的高动态图像或视频，但这类设备往往需要严格的校准且价格昂贵，难以普遍使用。

基于计算成像的方法利用一系列不同曝光的图像输入来合成高动态图像。由于场景中的物体运动，相机位置设置和拍摄者的运动等，输入图像组中往往包含和参考图像内容不一致的像素，这可能导致最终合成的高动态图像中出现伪影。现有的方法大多基于运动检测或者先光流对齐再融合的思路解决问题。其中，基于运动检测的方法先全局对齐背景，再根据参考图像检测其他图像中的运动区域，这类方法对像素的利用率低，其重建准确度依赖运动检测算法的准确度；光流对齐图像再融合的方法，由于光流难以准确对齐多曝光图像的所有区域，容易在最终图像中遗留光流对齐不当导致的失真。因此，这些方法在输入图像组中包含大运动或大视差时往往会导致伪影或不自然的细节等。

发明内容

针对以上现有重建方法中存在的缺陷，本发明的目的在于提出一种创新的高动态图像重建方法，通过具有金字塔特征对齐和掩膜融合的神经网络，实现高质量的高动态图像重建。

为达上述目的，本发明采用的技术方案如下：

一种基于神经网络的高动态图像重建方法，其特征在于，包括如下步骤：

步骤1，将i个低动态范围域的图像按照亮度高低排列，记为{L_i}，并从中选取一张图像作为参考图像；

步骤2，利用伽玛变换将步骤1的低动态范围域图像变换得到高动态范围域图像，记为{H_i}；

步骤3，将步骤1的低动态范围域图像与步骤2得到的高动态范围域图像输入同一个特征提取网络，得到不同尺度的低动态范围域图像特征

和高动态范围域图像特征

其中，s表示不同的尺度，s数值增大对应特征尺度减小；

步骤4，将步骤3提取的图像特征

和

输入到金字塔特征对齐网络，网络输出对齐的与输入图像尺寸相同的低动态范围域图像特征

和高动态范围域图像特征

步骤5，将步骤4对齐的图像特征

和

经过掩膜融合网络，得到重建的参考图像视角的高动态范围域图像

进一步地，所述步骤4中，金字塔特征对齐网络仅利用高动态范围域的图像特征来计算可变形卷积层所需的偏移Δp，以此减小曝光差异对特征对齐的影响，具体步骤如下：

步骤41，确定金字塔的尺度数目，输入步骤3中提取图像特征

和

步骤42，取最小尺度的高动态范围域图像特征输入卷积块ConM计算偏移Δp^s，用可变形卷积DConv对图像特征

和

进行粗对齐：

式中[·,·]表示特征级联，下标为r代表该特征与参考图视角一致；

步骤43，对较大尺度的图像特征，基于前一尺度图像特征计算的偏移以逐步细化的方式进行优化：

其中，↑²表示两倍上采样；

步骤44，经过逐步细化的对齐后，得到和原始输入图像同尺度的对齐图像特征，再经过一个额外的可变形卷积层用于特征的整体微调，生成最终的对齐图像特征

和

进一步地，所述步骤5中，具体步骤如下：

步骤51，对齐的图像特征

和参考图像特征

被级联作为掩膜融合网络的输入；

步骤52，级联特征经过残差密集连接卷积块和卷积层得到初步重建结果Z₄；

步骤53，重建结果Z₄和高动态范围域参考图像H_r经过掩膜融合得到最终重建的高动态范围图像

掩膜

的生成及融合具体公式如下：

其中A·B表示A和B两对象的逐元素乘积，sigmoid为S形函数，M为由卷积块得到的掩膜，经过通道拆分split操作得到调整掩膜M_refine和融合掩膜M_merge。

本发明提出了一种高动态图像重建方法，通过一个由金字塔特征对齐网络和掩膜融合网络构成的神经网络，实现了鲁棒的高质量HDR(High-Dynamic Range)重建。本发明中的金字塔特征对齐网络利用HDR域的信息计算对齐所需的偏移，减小了光照差异对对齐的影响，能够较好的处理输入图像组中的大运动或视差。此外利用掩膜融合网络优化的HDR重建，能够进一步去除可能的伪影或不自然的融合细节，得到更高质量的重建图像。相比于现有方法，本方法能够鲁棒的处理输入数据中的大运动和视差，得到无伪影的高主观质量的HDR重建结果。

附图说明

图1为本发明方法的流程示意图。

图2为本发明方法的金字塔特征对齐网络结构图。

图3为本方法的残差密集连接卷积块的结构图。

具体实施方式

下面将结合附图及具体实施例对本发明进行详细描述，实施例的多曝光输入图像组可为动态场景中拍摄或三相机系统拍摄，本发明在两种情况下的测试均可得到高质量的重建结果。

参照图1，本实施例的一种基于神经网络的高动态图像重建方法，具体步骤如下：

步骤1，将三张输入图像按照曝光高低排列，记为L₁,L₂,L₃。从输入中选取一张图作为参考图像，最终生成的高动态范围(High-Dynamic Range，HDR)图像的视角/动态和参考图像相同。本实施例中选取输入的3张图像中过曝和欠曝面积最小的图像L₂作为参考图像。

步骤2，利用伽玛变换

将步骤1获得的原LDR(Low-DynamicRange)域图像组变换到HDR域，其中，t_i为LDR图像对应的曝光时间，γ为伽马变换的参数(一般取γ＝2.2)，变换后的HDR域的图像为H₁,H₂,H₃。

步骤3，HDR域和LDR域的输入图像对(L_i,H_i)经过特征提取网络，得到不同尺度的HDR域和LDR域的图像特征

和

其中s表示不同的尺度。特征提取网络由一系列3×3的卷积块构成，卷积块的数目和金字塔尺度数目相等。

步骤4，提取的多尺度HDR域和LDR域图像特征对

和

输入到金字塔特征对齐网络，网络输出对齐的原尺寸(同输入图像尺寸)HDR域和LDR域图像特征

和

步骤5，对齐的HDR域和LDR域图像特征

和

经过掩膜融合网络(参照图2)，得到重建的参考图像视角的HDR图像

在步骤4中，图2为有两种尺度的金字塔特征对齐网络，金字塔的尺度数目选择可依照具体应用情况改变。金字塔特征对齐网络仅用HDR域的特征对

来计算用于对齐不同尺度特征的可变形卷积层(图中DConv)所需的偏移Δp^s，此设置可以减小曝光差异对对齐准确度的影响。用ConM(·)表示卷积块，[·,·]表示特征级联。对特征金字塔中最小尺度的特征，可由下式得到粗糙对齐的特征

用↑²表示两倍上采样，对较大尺度的特征，基于前一尺度特征计算的偏移以逐步细化的方式进行优化：

得到细化后的对齐特征

后，

经过一个额外的可变形卷积层用于特征的整体微调，生成最终的对齐特征

在步骤5中，对齐的HDR域和LDR域图像特征

和参考图像特征

被级联输入到融合网络。级联特征经过3个连续的残差密集连接卷积块和一个卷积层得到初步重建结果Z₄，随后Z₄和H₂经过掩膜融合得到最终重建的HDR图像

残差密集连接卷积块中在残差连接前加入了论文Hu J,Shen L,Albanie S,et al.Squeeze-and-ExcitationNetworks[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2019:1-1.提出的挤压激励模块(Squeeze-and-Excitationblock，SE)，以去除对齐过程中可能产生的误对齐和伪影，见图3。掩膜

的生成及融合具体实施如下：

其中A·B表示A，B两对象的逐元素乘积，sigmoid为S形函数，M为由卷积块得到的掩膜，经过通道拆分split操作得到调整掩膜M_refine和融合掩膜M_merge。调整掩膜M_refine可用于抑制重建结果Z₄中的残留错误像素，融合掩膜M_merge进一步优化改善得到最终重建的HDR图像

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改，等同替换等，均应包含在本发明的保护范围之中。