CN112950481B

CN112950481B - 一种基于图像拼接网络的水花遮挡图像数据集采集方法

Info

Publication number: CN112950481B
Application number: CN202110436571.XA
Authority: CN
Inventors: 李恒宇; 程立; 刘靖逸; 刘军; 谢少荣; 罗均
Original assignee: Jining University; University of Shanghai for Science and Technology
Current assignee: Jining University; University of Shanghai for Science and Technology
Priority date: 2021-04-22
Filing date: 2021-04-22
Publication date: 2022-12-06
Anticipated expiration: 2041-04-22
Also published as: CN112950481A

Abstract

本发明属于图像修复领域，涉及一种基于图像拼接网络的水花遮挡图像数据集采集方法，步骤为：S1:采集m个场景中每个场景的左视角图像、中间视角图像、右视角图像，得到了m组三视角图像，记为数据集Y；用于采集中间视角图像的相机镜头上分布有水滴，采集的中间视角图像为有水花遮挡图像；S2:将数据集Y中随机一组三视角图像的左视角图像和右视角图像输入训练好的图像拼接网络中进行预测，得到中间视角恢复图像；将中间视角恢复图像与对应的有水花遮挡的中间视角图像组合，形成一对水花遮挡图像数据；S3:按照步骤S2操作对数据集Y中剩下(m‑1)组图像处理，得到(m‑1)对水花遮挡图像数据；S4将步骤S2得到的一对水花遮挡图像数据与步骤S3得到的(m‑1)对水花遮挡图像数据进行合并，得到水花遮挡图像数据集。

Description

一种基于图像拼接网络的水花遮挡图像数据集采集方法

技术领域

本发明涉及计算机视觉领域，具体涉及一种基于图像拼接网络的水花遮挡图像数据集采集方法。

背景技术

随着科技的进步，对海洋的勘探日益加深从而得知海洋资源丰富多样，然而海洋环境恶劣多变不易人工去勘探。因此，各国会利用无人艇作为勘探工具对海洋资源进行探索。近几年，计算机视觉逐渐被应用到海洋环境感知上。由于视觉相机具有许多相对其它感知系统的优良特性，如：廉价、能源消耗小、轻量化、能提供丰富的图像语义信息等。目前，大多数无人艇都利用基于相机系统的计算机视觉感知技术去完成海洋作业。然而，海洋环境复杂多变且无人艇相机镜头必须裸露在外才能获得视野，这就导致雨水很容易遮挡镜头，这种干扰不易消除，这对无人挺的视觉感知系统是一个难点。

目前关于相机镜头被遮挡问题的解决方案都是利用深度神经网络，利用它独特的拟合能力来对残缺、遮掩图像进行修复。神经网络能修复的前提是需要大量的不同场景下的类似残缺图像数据集进行训练。然而目前此种雨水遮挡镜头采集出来的图像数据集相当少，大多数都是通过PS人为添加虚假雨水来代替真实的雨水遮掩图像，这些图像数据集真实性较差。真实雨水会对场景环境光进行折射，而认为添加上去得到雨水并不能有此功能。因此，用这种人造数据集训练出来的深度神经网络并不能很好的应用在实际勘探上。

发明内容

本发明针对现有海面雨水图像数据集缺少、不真实问题，提出了一种基于图像拼接网络的水花遮挡图像数据集采集方法。

为达到上述目的，本发明采用如下技术方案：

一种基于图像拼接网络的水花遮挡图像数据集采集方法，包括以下步骤：

S1：采用相机设备采集m个场景中每个场景的左视角图像、中间视角图像、右视角图像，得到了m组三视角图像，记为图像数据集Y；其中，用于采集中间视角图像的相机镜头上分布有水滴，采集的中间视角图像为有水花遮挡的中间视角图像；m组三视角图像中每组三视角图像数据均包括左视角图像、中间视角图像和右视角图像；一组三视角图像对应一个场景，针对同一场景，左视角图像、中间视角图像和右视角图像的采集时间相同，且左视角图像、右视角图像均与中间视角图像有重合；

S2：将图像数据集Y中随机一组三视角图像的左视角图像和右视角图像输入训练好的图像拼接网络模型中进行处理，得到全景视角图像；利用特征匹配找出全景视角图像与输入左视角图像同组的中间视角图像相匹配的边缘角点，根据边缘角点对全景视角图像进行裁切，得到尺寸比例与中间视角图像一致的中间视角恢复图像；将中间视角恢复图像与对应的图像数据集Y中的中间视角图像进行配对，形成一对水花遮挡图像数据；

S3：按照步骤S2的操作，对图像数据集Y中剩下的(m-1)组图像进行处理，得到(m-1)对水花遮挡图像数据；

S4：将步骤S2得到的一对水花遮挡图像数据与步骤S3得到的(m-1)对水花遮挡图像数据进行合并，得到m对水花遮挡图像数据，即得水花遮挡图像数据集。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，步骤S2中所述图像拼接网络模型的具体训练过程如下：

S201：采集n个场景中每个场景的左视角图像I_A、中间视角图像I_B、右视角图像I_C，得到了n组三视角图像，记为图像数据集X；其中，n组三视角图像中每组三视角图像数据均包括左视角图像I_A、中间视角图像I_B、右视角图像I_C，一组三视角图像对应一个场景；针对同一场景，左视角图像I_A、中间视角图像I_B、右视角图像I_C的采集时间相同，且左视角图像I_A、右视角图像I_C均与中间视角图像I_B有重合；

S202：从图像数据集X中随机抽取一组三视角图像，记作第一组三视角图像，将第一组三视角图像中的左视角图像I_A和右视角图像I_C挑出，组成一对样本(I_A,I_C)，记作第一组样本，将第一组三视角图像中的中间视角图像I_B挑出，作为第一组样本的真值I_B；重复上述操作对图像数据集X中剩余的(n-1)组三视角图像进行处理，共得到n对样本(I_A,I_C)和n个真值I_B；将n对样本(I_A,I_C)按比例随机划分为训练样本集、验证样本集和测试样本集；

S203：采用训练样本集对构建的图像拼接网络进行训练，优化图像拼接网络的参数，得到训练后图像拼接网络；

S204：利用验证集对所有训练后图像拼接网络进行验证，评估图像拼接网络的图像处理性能，挑选出最优图像拼接网络；

S205：采用测试样本集对步骤S204挑选出的最优图像拼接网络进行测试，评价最优图像拼接网络的图像处理性能。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，步骤S1和步骤S201中，左视角图像与中间视角图像的重合视角加上右视角图像与中间视角图像的重合视角能覆盖中间视角图像。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，所述图像拼接网络由单应性估计模块、结构拼接模块和内容修复模块组成。所述单应性模块的输入为左视角图像、右视角图像，输出为单应性矩阵H；所述结构拼接模块是用于将输入的左、右视角图像进行拼接得到粗略轮廓的全景视角图像。所述内容修复模块的输入为结构拼接模块输出的全景视角图像，该模块将输入的粗略轮廓的全景视图进行修正，主要是全景视图中间部分的重叠区域，以修正重叠区域会由于特征不匹配而导致单应性估计错误导致出现重影的伪像，最终输出完整的更接近与真实场景的全景视角图像。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，步骤S203中，采用训练样本集对构建的图像拼接网络进行训练，优化图像拼接网络的参数的具体操作为：

S203-1：将训练样本集中的样本图像(I_A,I_C)输入到图像拼接网络中，生成全景视角图像，找出全景视角图像与输入左视角图像同组的中间视角图像相匹配的边缘角点，根据边缘角点对全景视角图像进行裁切，得到尺寸比例与中间视角图像一致的Sham图像

S203-2：通过单应性估计模块计算从右视角图像I_C向左视角图像I_A投影后对应像素点间的实际偏移量f和预测偏移量

使实际偏移量f和预测偏移量

之间的L₂距离最小化来估计得到单应性损失函数L_H；计算Sham图像

与输入样本图像(I_A、I_C)对应的真值I_B的L₁距离损失，得到L₁损失函数L_S；将Sham图像

和输入样本图像(I_A、I_C)对应的真值I_B输入到VGG-19网络中，通过VGG-19网络得到内容损失函数L_C；单应性损失函数L_H、L₁损失函数L_S、内容损失函数L_C的计算公式分别如式I、II、III所示：

其中，单应性损失L_H中

为预测偏移量，f为实际偏移量，N为预测偏移量

的分量数；L₁损失函数L_S中W、H分别为Sham图像

的宽和高；内容损失函数L_C中W、H分别为Sham图像

的宽和高，

分别为将图像

I_B同时输入到VGG-19网络的卷积层中获得的特征图；其中，在该图像拼接网络的内容修复阶段的最后添加了VGG-19网络，添加该网络的作用是为了使Sham图像I^_B与真实图像I_B具有相似内容的表示，减少容易导致图像特征急剧变化的伪影和图像接缝不连续；

S203-3：根据构建的单应性损失函数L_H、L₁损失函数L_S、内容损失函数L_C，利用反向传播算法调节图像拼接网络的参数，使单应性损失函数L_H、L₁损失函数L_S、内容损失函数L_C的曲线均处于稳定且不再下降，完成对图像拼接网络的训练，得到训练后图像拼接网络。

根据上述基于图像拼接网络的水花遮挡图像数据集采集方法，步骤S203-3中，对于图像拼接网络的训练，采用初始学习率为2e-4、训练批次为200、学习率100个批次后按直线衰减方式进行训练，且网络参数的初始化方式为axvier。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，步骤S204的具体操作为：

S204-1：将验证样本集中的样本图像(I_A、I_C)依次输入到训练后图像拼接网络中，得到所有样本图像(I_A、I_C)的全景视角图像，找出全景视角图像与输入左视角图像同组的中间视角图像相匹配的边缘角点，根据边缘角点对全景视角图像进行裁切，得到尺寸比例与中间视角图像一致的Sham图像

计算Sham图像

与输入样本图像(I_A、I_C)对应的真值I_B的L₁距离，按照式IV计算Sham图像

与输入样本图像(I_A、I_C)对应的真值I_B的PSNR，然后求取验证样本集中所有样本图像的L₁距离平均值和PSNR平均值，得到该图像拼接网络的L₁距离和PSNR；

其中，n为8；

S204-2：按照步骤S204-1所述的操作计算所有训练后图像拼接网络的L₁距离和PSNR，选取L₁距离最小且PSNR最大的图像拼接网络作为最优图像拼接网络。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，步骤S205的具体操作为：

S205-1：将测试样本集中的样本图像(I_A、I_C)依次输入到最优图像拼接网络中，得到所有样本图像(I_A、I_C)的全景视角图像，找出全景视角图像与输入左视角图像同组的中间视角图像相匹配的边缘角点，根据边缘角点对全景视角图像进行裁切，得到尺寸比例与中间视角图像一致的Sham图像

计算Sham图像

与输入样本图像(I_A、I_C)对应的真值I_B的PSNR，然后求取测试样本集中所有样本图像的L₁距离平均值和PSNR平均值，得到最优图像拼接网络的L₁距离和PSNR；

S205-2：选取L₁距离小于1％且PSNR大于30dB的最优图像拼接网络作为最终训练好的图像拼接网络。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，所述单应性估计模块由灰度转换器G_L、灰度转化器G_R、特征提取器F_L、特征提取器F_R、全局相关层、卷积层、全连接层和直接线性变换层组成。其中，灰度转换器G_L是将输入的左视角图像I_A转换为灰度图G_A，灰度转化器G_R是将输入的右视角图像I_C转换为灰度图G_C；特征提取器F_L、特征提取器F_R为两个共享权重的特征提取器，特征提取器F_L用于对输入的灰度图G_A进行特征提取，特征提取器F_L的输出为与左视角图像I_A相对应的左视角特征图

特征提取器F_R用于对输入的灰度图G_C进行特征提取，特征提取器F_R的输出为与右视角图像I_C对应的右视角特征图

全局相关层用于学习输入的两个特征图特征方面的全局相似性，全局相关层的输入为经过L₂归一化处理后的左视角特征图

和右视角特征图

全局相关层的输出为左视角特征图

右视角特征图

的特征方面的全局相似度；所述卷积层用于对输入的全局相似度进行卷积处理，卷积层的输出为对全局相似度进行特征提取后的特征数据，所述特征数据为左视角图像I_A、右视角图像I_C内容相似部分的图像特征数据；所述全连接层用于将卷积层输出的特征数据进行特征匹配处理，将左视角图像I_A、右视角图像I_C内容相似部分的图像特征数据进行一一对应匹配，输出从I_C向I_A投影后对应像素点间的实际偏移量f；所述直接线性变换层用于将输入的偏移量f偏移到偏移量对应的单应性矩阵H中，计算出单应性矩阵H，直接线性变换层的输入是实际偏移量f，直接线性变换层的输出是单应性矩阵H。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，所述结构拼接模块由空间变换网络STN和Fusion网络组成。其中，空间变换网络STN的作用是提取输入的左视角图像I_A和右视角图像I_C相似部分的结构信息，为后续图像的拼接提供数据，空间变换网络STN的输入为左视角图像I_A、右视角图像I_C、单位矩阵E和单应性矩阵H，空间变换网络STN的输出为经投影变换得到的左视角变换特征图I_AW、右视角变换特征图I_CW。所述Fusion网络是将输入的左视角变换特征图I_AW、右视角变换特征图I_CW进行拼接融合，得到全景视角图像，并将全景视角图像输出。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，所述空间变换网络STN由定位模块、变换模块和空间注意力模块组成，所述定位模块用于计算左视角图像或右视角图像相对于中间视角图像的空间变换矩阵，定位模块的输入为左视角图像或右视角图像，定位模块的输出为计算出来的空间变换矩阵，其中，左视角图像相对于中间视角图像的空间变换矩阵的计算公式如式V所示，右视角图像相对于中间视角图像的空间变换矩阵的计算公式如式VI所示；所述变换模块用于利用定位模块计算出的空间变换矩阵对左视角图像或右视角图像进行空间变换，变换模块的输出为将左视角图像进行空间变换后的左视角变换特征图I_AW或将右视角进行空间变换后的右视角变换特征图I_CW；所述空间注意力模块用于提高STN网络的特征图中像素间语义信息的聚合能力，空间注意力模块的输入为定位模块每一层输出的特征图，空间注意力模块的输出为特征图像素间的权重图与特征图本身的乘积；

其中，(x，y，z)为左视角图像或右视角图像的齐次坐标、(u、v)为网格中每个代表的二维空间的位置。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，将左视角图像I_A、单位矩阵E输入到空间变换网络STN中，得到左视角变换特征图I_AW；将右视角图像I_C和单应性矩阵H输入到空间变换网络STN中，得到右视角变换特征图I_CW。更加优选地，在计算投影变换后的左视角变换特征图I_AW、右视角变换特征图I_CW前，首先要为每个输入的图像生成一个具有与缝合标签大小相同的网格，而网格中的每个元素都代表其二维空间位置(u，v)。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，Fusion网络由softmax层、bottleneck模块、两个卷积层、tanh层组成；其中，softmax层利用softmax函数将左视角变换图像I_AW、右视角变换图像I_CW进行融合；bottleneck模块由降采样层、上采样层和分支卷积层组成，其目的是增加网络对图像的理解能力，所述降采样层的降采样因子为2，上采样层的上采样因子为2；Fusion网络包含的最后两个卷积层用于保持特征图的尺度不变；所述tanh层用于将特征图的值映射到(-1,1)之间得到后续内容修复模块的输入。更加优选地，softmax层利用softmax函数将变换后的左视角图像I_AW、右视角图像I_CW进行融合的具体操作为：分别将变换后的左视角图像I_AW、右视角图像I_CW按照1:3进行切片，得到左权重图、左特征图、右权重图、右特征图，将左权重图和右权重图沿通道方向进行拼接然后输入到softmax函数中进行归一化计算，得到通道为2的权重图，再将该权重按照1:1切片得到新的左权重图、右权重图，最后将新的左权重图与左特征图相乘，加上新的右权重图与右特征图相乘的结果得到softmax层的输出结果，其通道数为3。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，采用Fusion网络将输入的左视角变换特征图I_AW、右视角变换特征图I_CW进行拼接融合时，将左视角变换特征图I_AW与中间视角图像的重合区域记作第一重合区域，将右视角变换特征图I_CW与中间视角图像的重合区域记作第二重合区域，针对第一重合区域与第二重合区域的重合区域，其像素值计算是将第一重合区域的像素值之和与第二重合区域的像素值之和进行加权，加权值为0.5。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，所述内容修复模块包括编码器、卷积层和解码器；编码器的作用是将拼接后得到的全景视角图像分解为多通道全景视图数据，编码器的输入是全景视角图像，编码器的输出是多通道全景视图数据；卷积层用于对编码器输出的多通道全景视图数据进行卷积处理，卷积层的输出为降维后的多通道全景视图数据；所述解码器用于将降维后的多通道全景视图数据转化为三通道RGB图像，解码器的输入为降维后的多通道全景视图数据，编码器的输出为RGB全景视角图像。更加优选地，所述卷积层之间设有跳过连接，其能防止梯度消失问题和每一层中的信息不平衡。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，对于步骤S1中，针对不同场景，采集中间视角图像的相机镜头被水滴覆盖的面积不同；每组三视角图像中左视角图像与中间视角图像的图像重合率大于等于50％，右视角图像与中间视角图像的图像重合率大于等于50％。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，对于步骤S1和步骤S201中，每组三视角图像中左、中、右视角图像应在同一水平面上。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，对于步骤S201中，每组三视角图像中左视角图像与中间视角图像的图像重合率大于等于50％，右视角图像与中间视角图像的图像重合率大于等于50％。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，对于步骤S1和步骤S203-1中，采用特征匹配方法找出全景视角图像与输入左视角图像同组的中间视角图像相匹配的边缘角点。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，S1和步骤S201中采集的左视角图像、有视角图像和中间视角图像的大小应大于480×360；此外，步骤S2和步骤S203-1中，将左视角图像、右视角图像输入图像拼接网络模型中之前，先将左视角图像、右视角图像大小调整为128×128，标签设置大小为304×304，以覆盖任意视图中的所有的拼接结果。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，本发明中采集的左、中右视角图像均为彩色图像。

根据上述的基于图像拼接网络的水花遮挡图像数据集采集方法，优选地，本发明中用于采集图像的场景均为海面场景。

与现有技术相比，本发明取得的积极有益效果为：

(1)本发明提供的水花遮挡图像数据集采集方法是以采集时间同步且具有一定重合视场的三视角图像中的左、右视角图像作为图像拼接网络的输入，其能够充分利用不同视角信息，将左视角图像与右视角图像进行特征编码融合、解码处理，输出拼接的全景视角图像，全景视角图像经过特征匹配裁剪后与输入图像分布一致的中间视角恢复图像；然后将采集的有水花遮挡的中间视角图像和图像拼接网络拼接生成的无水化遮挡的中间视角恢复图像进行组合，得到水花遮挡图像-正常图像数据集。本发明制作的水花遮挡图像数据集真实度高，能够提供修复水花遮挡图像的先验知识，可用作后续利用神经网络进行水花遮挡图像修复的训练数据集。

(2)本发明在制作水花遮挡图像数据集时，通过采集时间相同且具有一定重合视场的三视角图像中的左视角图像、右视角图像作为先验信息来训练生成图像拼接网络，使该网络能够拼接额处理得到全景视角图像，引入了额外的损失函数进行有效约束，极大地提高了中间视角恢复图像的真实性，得到的中间视角恢复图像更加真实。

(3)本发明采用基于CNN的全局单应性图像拼接网络，即使对重合视角较小的左、右相机视角也有较强的中间视图恢复能力。在拼接阶段的网络结构中加入了共享权重的特征提取器，其能够高效准确的提取左、右视角图像的特征，并利用左、右视图间的投影变换并通过双线性插值将左、右视图的相重合的部分进行特征点匹配，能有效的解决左、右视角图像特征匹配有误差带来的重影伪像问题；而且，本发明还在内容修复模块的网络结构中加入卷积层中设有跳过连接，其能防止梯度消失问题和每一层中的信息不平衡。

(4)本发明图像拼接网络训练中，单应性损失函数L_H用于约束单应性估计，约束单应性H的取值范围，为后续的图像拼接提供更为准确的数据以减少误差；L₁损失函数L_S和内容损失函数L_H都用于约束图像拼接的结果，对图像拼接网络拼接处理图像进行指导，使其尽可能的接近真实图像。

(5)本发明结构拼接模块中设有空间注意力模块，空间注意力模块的设置能够有效捕捉到特征图像素间的空间上下文关系，以实现相似图像结构的聚合，能有效提升中间视角图像恢复的效果，使恢复出的中间视角图像的边缘信息得到保留。

(6)本发明采用真实的海面无人艇去采集图像数据集，采集来的数据集更加真实有效，能为后续神经网络的训练提供大量的数据集，为利用神经网络方法恢复残缺、遮挡图像提供准确的先验知识、为无人艇的自主环境感知与导航能带来切实有效的提升。

附图说明

图1为本发明提出的图像数据采集平台，cam0、cam1、cam2分别代表左、中、右相机；

图2为本发明采用图像拼接网络模型对左视角图像、右视角图像进行处理的流程示意图；

图3为本发明中单应性估计模块的网络架构示意图；

图4中为本发明中结构拼接模块和内容修复模块的网络架构示意图，其中，A为结构拼接模块的网络架构示意图，B为内容修复模块的网络架构示意图；

图5为本发明中空间变换网络STN的架构示意图；

图6为本发明中Fusion网络的架构示意图。

具体实施方式

下面结合具体附图，来对本发明的具体实施过程做详细清楚的说明，以表现出本发明方法的目的、技术方案和优点，但并不限制本发明的范围。

实施例1：

S1：采用相机设备采集m个场景中每个场景的左视角图像、中间视角图像、右视角图像，得到了m组三视角图像，记为图像数据集Y；其中，用于采集中间视角图像的相机镜头上分布有水滴，采集的中间视角图像为有水花遮挡的中间视角图像；m组三视角图像中每组三视角图像数据均包括左视角图像、中间视角图像和右视角图像；一组三视角图像对应一个场景，针对同一场景，左视角图像、中间视角图像和右视角图像的采集时间相同，且左视角图像、右视角图像均与中间视角图像有重合，左视角图像与中间视角图像的重合视角加上右视角图像与中间视角图像的重合视角能覆盖中间视角图像。

其中，用于采集一组三视角图像的相机设备如图1所示，该相机采集设备由三台时间同步的相机组成，当接收到触发信号时，三台相机同时拍照；而且，三台相机的型号及使用的镜头均相同，且三台相机在水平方向上保持平行，视平面保持一致，用于捕捉左视角图像的左侧相机与中间相机之间的基线距离为8cm，中间相机与右侧相机之间的基线距离为8cm。所有采集的左视角图像、中间视角图像和右视角图像均为彩色图像；每组三视角图像中左视角图像、中间视角图像和右视角图像的视平面相同。

S2：将图像数据集Y中随机一组三视角图像的左视角图像和右视角图像输入训练好的图像拼接网络模型中进行处理，得到全景视角图像；利用特征匹配找出全景视角图像与输入左视角图像同组的中间视角图像相匹配的边缘角点，根据边缘角点对全景视角图像进行裁切，得到尺寸比例与中间视角图像一致的中间视角恢复图像；将中间视角恢复图像与对应的图像数据集Y中的中间视角图像进行配对，形成一对水花遮挡图像数据。

S3：按照步骤S2的操作，对图像数据集Y中剩下的(m-1)组图像进行处理，得到(m-1)对水花遮挡图像数据。

其中，步骤S2中所述图像拼接网络模型的具体训练过程如下：

S201：采集n个场景中每个场景的左视角图像I_A、中间视角图像I_B、右视角图像I_C，得到了n组三视角图像，记为图像数据集X；其中，n组三视角图像中每组三视角图像数据均包括左视角图像I_A、中间视角图像I_B、右视角图像I_C，一组三视角图像对应一个场景；针对同一场景，左视角图像I_A、中间视角图像I_B、右视角图像I_C的采集时间相同，且左视角图像I_A、右视角图像I_C均与中间视角图像I_B有重合；左视角图像与中间视角图像的重合视角加上右视角图像与中间视角图像的重合视角能覆盖中间视角图像。

S202：从图像数据集X中随机抽取一组三视角图像，记作第一组三视角图像，将第一组三视角图像中的左视角图像I_A和右视角图像I_C挑出，组成一对样本(I_A,I_C)，记作第一组样本，将第一组三视角图像中的中间视角图像I_B挑出，作为第一组样本的真值I_B；重复上述操作对图像数据集X中剩余的(n-1)组三视角图像进行处理，共得到n对样本(I_A,I_C)和n个真值I_B；将n对样本(I_A,I_C)按4:2:1的比例随机划分为训练样本集、验证样本集和测试样本集。

S203：采用训练样本集对构建的图像拼接网络进行训练，优化图像拼接网络的参数，得到训练后图像拼接网络。

S204：利用验证集对所有训练后图像拼接网络进行验证，评估图像拼接网络的图像处理性能，挑选出最优图像拼接网络。

上述步骤S203中，采用训练样本集对构建的图像拼接网络进行训练，优化图像拼接网络的参数的具体操作为：

S203-1：将训练样本集中的样本图像(I_A,I_C)输入到图像拼接网络中，生成全景视角图像，利用特征匹配找出全景视角图像与输入左视角图像同组的中间视角图像相匹配的边缘角点，根据边缘角点对全景视角图像进行裁切，得到尺寸比例与中间视角图像一致的Sham图像

使实际偏移量f和预测偏移量

其中，单应性损失L_H中

为预测偏移量，f为实际偏移量，N为预测偏移量

的分量数；L₁损失函数L_S中W、H分别为Sham图像

的宽和高；内容损失函数L_C中W、H分别为Sham图像

的宽和高，

分别为将图像

S203-3：根据构建的单应性损失函数L_H、L₁损失函数L_S、内容损失函数L_C，利用反向传播算法调节图像拼接网络的参数，使单应性损失函数L_H、L₁损失函数L_S、内容损失函数L_C的曲线均处于稳定且不再下降，完成对图像拼接网络的训练，得到训练后图像拼接网络。其中，对于图像拼接网络的训练，采用初始学习率为2e-4、训练批次为200、学习率100个批次后按直线衰减方式进行训练，且网络参数的初始化方式为axvier。

上述步骤S204的具体操作为：

计算Sham图像

其中，n为8；

上述步骤S205的具体操作为：

计算Sham图像

上述步骤S2中，所述图像拼接网络由单应性估计模块、结构拼接模块和内容修复模块组成。所述单应性模块的输入为左视角图像、右视角图像，输出为单应性矩阵H。所述结构拼接模块是用于将输入的左、右视角图像进行拼接得到粗略轮廓的全景视角图像。所述内容修复模块的输入为结构拼接模块输出的全景视角图像，该模块将输入的粗略轮廓的全景视图进行修正，主要是全景视图中间部分的重叠区域，以修正重叠区域会由于特征不匹配而导致单应性估计错误导致出现重影的伪像，最终输出完整的更接近与真实场景的全景视角图像。采用图像拼接网络模型对左视角图像、右视角图像进行处理的流程示意图如图2所示。

其中，所述单应性估计模块(单应性估计模块的网络架构示意图如图3所示)由灰度转换器G_L、灰度转化器G_R、特征提取器F_L、特征提取器F_R、全局相关层、卷积层、全连接层和直接线性变换层组成。其中，灰度转换器G_L是将输入的左视角图像I_A转换为灰度图G_A，灰度转化器G_R是将输入的右视角图像I_C转换为灰度图G_C；特征提取器F_L、特征提取器F_R为两个共享权重的特征提取器，特征提取器F_L用于对输入的灰度图G_A进行特征提取，特征提取器F_L的输出为与左视角图像I_A相对应的左视角特征图

和右视角特征图

全局相关层的输出为左视角特征图

右视角特征图

所述结构拼接模块(结构拼接模块的网络架构示意图如图4所示)由空间变换网络STN和Fusion网络组成。其中，空间变换网络STN的作用是提取输入的左视角图像I_A和右视角图像I_C相似部分的结构信息，为后续图像的拼接提供数据，空间变换网络STN的输入为左视角图像I_A、右视角图像I_C、单位矩阵E和单应性矩阵H，空间变换网络STN的输出为经投影变换得到的左视角变换特征图I_AW、右视角变换特征图I_CW。

空间变换网络STN(空间变换网络STN的网络架构示意图如图5所示)由定位模块、变换模块和空间注意力模块组成，所述定位模块用于计算左视角图像或右视角图像相对于中间视角图像的空间变换矩阵，定位模块的输入为左视角图像或右视角图像，定位模块的输出为计算出来的空间变换矩阵，其中，左视角图像相对于中间视角图像的空间变换矩阵的计算公式如式V所示，右视角图像相对于中间视角图像的空间变换矩阵的计算公式如式VI所示；所述变换模块用于利用定位模块计算出的空间变换矩阵对左视角图像或右视角图像进行空间变换，变换模块的输出为将左视角图像进行空间变换后的左视角变换特征图I_AW或将右视角进行空间变换后的右视角变换特征图I_CW；所述空间注意力模块用于提高STN网络的特征图中像素间语义信息的聚合能力，空间注意力模块的输入为定位模块每一层输出的特征图，空间注意力模块的输出为特征图像素间的权重图与特征图本身的乘积；

在计算投影变换后的左视角变换特征图I_AW、右视角变换特征图I_CW前，首先要为每个输入的图像生成一个具有与缝合标签大小相同的网格，而网格中的每个元素都代表其二维空间位置(u，v)。

Fusion网络是将输入的左视角变换特征图I_AW、右视角变换特征图I_CW进行拼接融合，得到全景视角图像，并将全景视角图像输出。Fusion网络(Fusion网络的网络架构示意图如图6所示)由softmax层、bottleneck模块、两个卷积层、tanh层组成；其中，softmax层利用softmax函数将左视角变换图像I_AW、右视角变换图像I_CW进行融合；bottleneck模块由降采样层、上采样层和分支卷积层组成，其目的是增加网络对图像的理解能力，所述降采样层的降采样因子为2，上采样层的上采样因子为2；Fusion网络包含的最后两个卷积层用于保持特征图的尺度不变；所述tanh层用于将特征图的值映射到(-1,1)之间得到后续内容修复模块的输入。

其中，softmax层利用softmax函数将变换后的左视角图像I_AW、右视角图像I_CW进行融合的具体操作为：分别将变换后的左视角图像I_AW、右视角图像I_CW按照1:3进行切片，得到左权重图、左特征图、右权重图、右特征图，将左权重图和右权重图沿通道方向进行拼接然后输入到softmax函数中进行归一化计算，得到通道为2的权重图，再将该权重按照1:1切片得到新的左权重图、右权重图，最后将新的左权重图与左特征图相乘，加上新的右权重图与右特征图相乘的结果得到softmax层的输出结果，其通道数为3。优选地，采用Fusion网络将输入的左视角变换特征图I_AW、右视角变换特征图I_CW进行拼接融合时，将左视角变换特征图I_AW与中间视角图像的重合区域记作第一重合区域，将右视角变换特征图I_CW与中间视角图像的重合区域记作第二重合区域，针对第一重合区域与第二重合区域的重合区域，其像素值计算是将第一重合区域的像素值之和与第二重合区域的像素值之和进行加权，加权值为0.5。

所述内容修复模块(内容修复模块的网络架构示意图如图4所示)包括编码器、卷积层和解码器组成；编码器的作用是将拼接后得到的全景视角图像分解为多通道全景视图数据，编码器的输入是全景视角图像，编码器的输出是多通道全景视图数据。卷积层的层数为八层，每层滤镜的数量为64、64、128、128、256、256、512和512，卷积层用于对编码器输出的多通道全景视图数据进行卷积处理，把多通道全景视图数据降维成少量的数据参数以方便后续的处理且在降维的过程中保留数据的主要特征，卷积层的输出为降维后的多通道全景视图数据；为了减少计算量，在第2、第4和第6卷积层之后，采用2×2的最大池化层来减小特征图维数。所述解码器用于将降维后的多通道全景视图数据转化为三通道RGB图像，解码器的输入为降维后的多通道全景视图数据，解码器的输出为RGB全景视角图像。

实施例2：

实施例2的内容与实施例1基本相同，其不同之处在于：

步骤S1和步骤S201中：每组三视角图像中左视角图像与中间视角图像的重合率大于等于50％，右视角图像与中间视角图像的重合率大于等于50％；

步骤S2和步骤S203-1中，将左视角图像、右视角图像输入图像拼接网络模型中之前，先将左视角图像、右视角图像大小调整为128×128。

以上所述仅为本发明的较佳实施例而已，但不仅限于上述实例，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于图像拼接网络的水花遮挡图像数据集采集方法，其特征在于，包括如下步骤：

S2：将图像数据集Y中随机一组三视角图像的左视角图像和右视角图像输入训练好的图像拼接网络模型中进行处理，得到全景视角图像；找出全景视角图像与输入左视角图像同组的中间视角图像相匹配的边缘角点，根据边缘角点对全景视角图像进行裁切，得到尺寸比例与中间视角图像一致的中间视角恢复图像；将中间视角恢复图像与对应的图像数据集Y中的中间视角图像进行配对，形成一对水花遮挡图像数据；

S4：将步骤S2得到的一对水花遮挡图像数据与步骤S3得到的(m-1)对水花遮挡图像数据进行合并，得到m对水花遮挡图像数据，即得水花遮挡图像数据集；

步骤S2中所述图像拼接网络模型的具体训练过程如下：

S204：利用验证样本集对所有训练后图像拼接网络进行验证，评估图像拼接网络的图像处理性能，挑选出最优图像拼接网络；

S205：采用测试样本集对步骤S204挑选出的最优图像拼接网络进行测试，评价最优图像拼接网络的图像处理性能；

步骤S203中，采用训练样本集对构建的图像拼接网络进行训练，优化图像拼接网络的参数的具体操作为：

使实际偏移量f和预测偏移量

之间的L₂距离最小化估计得到单应性损失函数L_H；计算Sham图像

其中，单应性损失L_H中

为预测偏移量，f为实际偏移量，N为预测偏移量

的分量数；L₁损失函数L_S中W、H分别为Sham图像

的宽和高；内容损失函数L_C中W、H分别为Sham图像

的宽和高，

分别为将图像

I_B同时输入到VGG-19网络的卷积层中获得的特征图；

2.根据权利要求1所述的基于图像拼接网络的水花遮挡图像数据集采集方法，其特征在于，步骤S1和步骤S201中，左视角图像与中间视角图像的重合视角加上右视角图像与中间视角图像的重合视角能覆盖中间视角图像。

3.根据权利要求2所述的基于图像拼接网络的水花遮挡图像数据集采集方法，其特征在于，所述图像拼接网络由单应性估计模块、结构拼接模块和内容修复模块组成。

4.根据权利要求3所述的基于图像拼接网络的水花遮挡图像数据集采集方法，其特征在于，步骤S204的具体操作为：

计算Sham图像

其中，n为8；

5.根据权利要求4所述的基于图像拼接网络的水花遮挡图像数据集采集方法，其特征在于，步骤S205的具体操作为：

计算Sham图像

6.根据权利要求3-5任一所述的基于图像拼接网络的水花遮挡图像数据集采集方法，其特征在于，所述单应性估计模块由灰度转换器G_L、灰度转化器G_R、特征提取器F_L、特征提取器F_R、全局相关层、卷积层、全连接层和直接线性变换层组成；其中，灰度转换器G_L是将输入的左视角图像I_A转换为灰度图G_A，灰度转化器G_R是将输入的右视角图像I_C转换为灰度图G_C；特征提取器F_L、特征提取器F_R为两个共享权重的特征提取器，特征提取器F_L用于对输入的灰度图G_A进行特征提取，特征提取器F_L的输出为与左视角图像I_A相对应的左视角特征图

和右视角特征图

全局相关层的输出为左视角特征图

右视角特征图

7.根据权利要求6所述的基于图像拼接网络的水花遮挡图像数据集采集方法，其特征在于，所述结构拼接模块由空间变换网络STN和Fusion网络组成；其中，空间变换网络STN的作用是提取输入的左视角图像I_A和右视角图像I_C相似部分的结构信息，为后续图像的拼接提供数据，空间变换网络STN的输入为左视角图像I_A、右视角图像I_C、单位矩阵E和单应性矩阵H，空间变换网络STN的输出为经投影变换得到的左视角变换特征图I_AW、右视角变换特征图I_CW；所述Fusion网络是将输入的左视角变换特征图I_AW、右视角变换特征图I_CW进行拼接融合，得到全景视角图像，并将全景视角图像输出。

8.根据权利要求7所述的基于图像拼接网络的水花遮挡图像数据集采集方法，其特征在于，所述空间变换网络STN由定位模块、变换模块和空间注意力模块组成，所述定位模块用于计算左视角图像或右视角图像相对于中间视角图像的空间变换矩阵，定位模块的输入为左视角图像或右视角图像，定位模块的输出为计算出来的空间变换矩阵，其中，左视角图像相对于中间视角图像的空间变换矩阵的计算公式如式V所示，右视角图像相对于中间视角图像的空间变换矩阵的计算公式如式VI所示；所述变换模块用于利用定位模块计算出的空间变换矩阵对左视角图像或右视角图像进行空间变换，变换模块的输出为将左视角图像进行空间变换后的左视角变换特征图I_AW或将右视角进行空间变换后的右视角变换特征图I_CW；所述空间注意力模块用于提高STN网络的特征图中像素间语义信息的聚合能力，空间注意力模块的输入为定位模块每一层输出的特征图，空间注意力模块的输出为特征图像素间的权重图与特征图本身的乘积；