CN113012037B

CN113012037B - 一种用于水下图像复原的深度学习训练数据集合成方法

Info

Publication number: CN113012037B
Application number: CN202110263407.3A
Authority: CN
Inventors: 马峻; 尹翔宇; 陈寿宏; 徐翠锋; 郭玲
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2021-03-11
Filing date: 2021-03-11
Publication date: 2022-08-05
Anticipated expiration: 2041-03-11
Also published as: CN113012037A

Abstract

本发明公开了一种用于水下图像复原的深度学习训练数据集合成方法，获取现有的RGBD数据集，并基于水下图像参数估计算法计算出真实水下场景对应的RGB颜色数值集合；基于柏林噪声生成不均匀的单通道背景光集合，并利用改进的水下光学模型生成多个数据对应的合成水下图像，其中，多个所述数据为在所述RGBD数据集、所述RGB颜色数值集合和所述单通道背景光集合中随机抽取的数据，考虑了由人工光源和水下自然环境渐变造成的不均匀背景光现象。并改变了随机生成背景光颜色的方法，采用在真实图像上获取的数值，让合成的图像更加逼真，颜色更加自然，提高了图像合成效果。

Description

一种用于水下图像复原的深度学习训练数据集合成方法

技术领域

本发明涉及图像处理技术领域，尤其涉及一种用于水下图像复原的深度学习训练数据集合成方法。

背景技术

由于水中存在强烈的光线散射和吸收现象，水下成像往往遭受严重的视觉上的退化。随着机器学习技术近几年的迅猛发展，人们可以通过利用退化后和退化前的成对图像，让网络学习图像复原过程，进而高效的恢复退化图像。当前水下图像合成方法，多利用简化的水下光学模型，但由于该模型的提出最初应用于陆上雾霾图像，故不能完全模拟水下场景的特征。由于光线变化很难预测，在现存的水下图像复原算法中，几乎都只假设背景光为均匀的。这样造成的影响是会对图像某些部分过度增强，使得图像中较亮的一部分在复原结果中过亮，暗的一部分更暗，通过这样的数据集训练的网络也不能具有对真实场景中人工光源造成影响的适应性。

另外由于不同波长光线在水下被吸收的速度不同，在一些在河流和湖泊中，由于藻类和矿物质影响，水体颜色也存在近似黄褐色或灰绿色。一些合成方法为了模拟水下图像背景光的这些颜色特征，在范围内随机取值得到RGB颜色通道数值，或将红色通道数值小于蓝绿色作为先验知识，再随机取值。现有方法合成的水下图像数据不能体现水下图像中不均匀背景光的问题，且不能涵盖各种水体颜色且拟真度不足的缺陷，导致图像合成效果不好。

发明内容

本发明的目的在于提供一种用于水下图像复原的深度学习训练数据集合成方法，提高图像合成效果。

为实现上述目的，本发明提供了一种用于水下图像复原的深度学习训练数据集合成方法，包括以下步骤：

获取现有RGBD数据集，并基于水下图像参数估计算法计算出真实水下场景对应的RGB颜色数值集合；

基于柏林噪声生成不均匀的单通道背景光集合，并利用改进的水下光学模型生成多个数据对应的合成水下图像，其中，多个所述数据为在所述RGBD数据集、所述RGB颜色数值集合和所述单通道背景光集合中随机抽取的数据。

其中，获取现有RGBD数据集，并基于水下图像参数估计算法计算出真实水下场景对应的RGB颜色数值集合，包括：

获取室内外深度数据集，以及获取UIEB数据集；

获取每张所述UIEB数据集的深度信息，并将所述深度信息按照降序排序后，获取排序第一位上的0.1％的像素中最大值，作为一组像素值符合阈值的RGB颜色数值集合。

其中，获取现有RGBD数据集，并基于水下图像参数估计算法计算出真实水下场景对应的RGB颜色数值集合之后，所述方法还包括：

将得到的所述像素值乘以一位以正态分布随机生成的在±0.1之间的数值。

其中，基于柏林噪声生成不均匀的单通道背景光集合，并利用改进的水下光学模型生成多个数据对应的合成水下图像，包括：

将柏林噪声设置为二维，得到一组不均匀的单通道背景光集合；

基于RGBD图像数据、RGB颜色数值和单通道背景光，得到添加了不均匀光成分的改进的水下光学模型，其中，所述RGB颜色数值和所述单通道背景光分别在所述RGB颜色数值集合和所述单通道背景光集合中随机抽取的数据；

设置30％生成的水下图像中不均匀背景光的成分权重为0，另外70％的所述水下图像的成分权重为随机生成的系数值，并根据曝光程度自适应地调节所述系数值；同时根据所述RGBD数据集中对应深度图，得到传输映射；

将对应的图像和数据代入所述改进的水下光学模型，得到合成水下图像，其中，所述图像和数据为RGBD图像数据、RGB颜色数值、单通道背景光及其权重、传输映射。

本发明的一种用于水下图像复原的深度学习训练数据集合成方法，获取现有RGBD数据集，并基于水下图像参数估计算法计算出真实水下场景对应的RGB颜色数值集合；基于柏林噪声生成不均匀的单通道背景光集合，并利用改进的水下光学模型生成多个数据对应的合成水下图像，其中，多个所述数据为在所述RGBD数据集、所述RGB颜色数值集合和所述单通道背景光集合中随机抽取的数据，考虑了由人工光源和水下自然环境渐变造成的不均匀背景光现象。并改变了随机生成背景光颜色的方法，采用在真实图像上获取的数值，让合成的图像更加逼真，颜色更加自然，提高了图像合成效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的一种用于水下图像复原的深度学习训练数据集合成方法的步骤示意图。

图2是本发明提供的一种用于水下图像复原的深度学习训练数据集合成方法的流程示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

请参阅图1和图2，本发明提供一种用于水下图像复原的深度学习训练数据集合成方法，包括以下步骤：

S101、获取现有RGBD数据集，并基于水下图像参数估计算法计算出真实水下场景对应的RGB颜色数值集合。

具体的，当今广泛应用的RGB-D数据集众多，由于多样的图像光照条件和较准确的深度信息，本次实施该方法可采用NYU-Depth V2室内深度数据集。包括1449张室内图像及其深度图。本发明提出的方法同样可应用于其他任何室内室外RGBD图像。

经大量调研，UIEB真实水下数据集能较全面的涵盖从各海域到浑浊的河流中各种水体的光线颜色的情况。故选择在890张UIEB数据集上估计得到一组反应真实水体的890张背景光颜色集合。

在对这些真实水下图像提取背景光颜色信息的过程中，选择应用ULAP先验的水下图像参数估计算法，即利用一个像素中，G、B通道中最大值与R通道像素值的差别强相关于场景深度的先验知识。首先，估计真实水下图像的深度信息。再选取其中深度最深的0.1％的像素。最终以这些像素中最亮的点为背景光颜色。经实践，该方法能产生较准确的估计值。所以只要收集到的真实水下图像数据集涵盖场景和水域足够全面，就能得到一组反应真实水体的背景光颜色的集合。另外，为了增加合成数据的随机性和对水下不同深度光线的适应性，可以让每通道乘以一位以正态分布随机生成的在±0.1之间的数值。

S102、基于柏林噪声生成不均匀的单通道背景光集合，并利用改进的水下光学模型生成多个数据对应的合成水下图像。

具体的，采用Perlin(柏林)噪声模拟非均匀背景光。Perlin噪声是Ken Perlin发明的用于生成随机内容的算法，可以用于生成波形，起伏不平的材质或者纹理。在游戏影视制作领域，广泛用于生成随机地形，火焰，云雨等自然现象。本发明提出Perlin噪声也可以较好的模拟水下图像中由于人工光源或水下复杂地形地貌造成的不均匀光线分布情况。由于水下图像存在的人工光源多为单一光源，这些光源都为三通道均衡的白光，所以设置Perlin噪声为二维，且每个坐标轴方向只有一个噪声循环。并不采用任何噪声分形措施，以模拟水下光线缓慢削减的过程。由此得到一组不均匀的单通道背景光图像集合，共1000张。

首先在所述RGB颜色数值集合和所述单通道背景光集合中分别随机抽取：背景光颜色数值记作A_c和单通道的不均匀背景光记为N(x)。

提出添加了不均匀背景光项的改进的水下光学模型：

I_c(x)＝J_c(x)T_c(x)+A_c(1-T_c(x))+ηN(x)

其中，x表示像素坐标，c表示颜色通道R、G、B。A_c代表通道c的全局背景光，对每一通道为常量；J_c(x)表示未退化图像，I_c(x)表示退化后图像。T_c(x)称作传输映射，即经过距离d(x)前后的能量比例，d(x)表示图像的深度。η为自适应参数用于控制添加的不均匀成分的权重。考虑存在没有不均匀光线的水下图像，设置30％的生成的水下图像中不均匀背景光成分权重η＝0。其他水下图像中不均匀背景光权重η为随机生成的系数值，并根据曝光程度自适应调节该数值。自适应规则由添加不均匀背景光后图像中新增白色像素占整幅图像像素数的比例决定。最后，随机生成衰减系数

值，再利用步骤一中RGBD图像对应的深度映射d(x)带入传输映射方程得到传输映射T_c(x)。由此可将上述图像和数据带入改进的水下光学模型得到合成水下图像。

传输映射T_c(x)方程为：

改进的水下光学模型中，不均匀背景光项权重η初始值在(0.2,0.4)的均匀分布中随机取值。添加η*N(x)前图像像素中像素值大于0.99的像素所占比例为p₀，添加η*N(x)后该比例为p_N。则为了限制添加N(x)对图像过曝光区域大小的影响，设定η的自适应更新策略为：若p_N-p₀≥0.1，取η＝η*0.6，直到p_N-p₀＜0.1。

另外对于传输映射T_c(x)的合成需要生成合适的衰减系数

RGB颜色通道的

之间与A_c和各通道波长λ_c之间的关系如以下衰减方程所示：

其中，λ_r，λ_g，λ_b分别红、绿、蓝光的典型波长值，为620nm，540nm，和450nm。

分别为对应R，G，B通道的传输映射的衰减系数值。又由于已知各通道背景光颜色数值，则只需生成蓝色通道的衰减系数

即可根据关系式计算其他通道衰减系数。本设计中，在(1,3)之间的均匀分布范围内取

数值。再利用步骤一中图像数据的深度信息d(x)，带入传输映射方程即可得到传输映射T_c(x)。

将上述变量带入改进的水下光学模型，可从每张室内外陆上图像中生成多幅水下图像。每张含有的随机参数成分包括：随机选取的背景光颜色、蓝色通道衰减系数

Perlin噪声分布图及其权重数值η。

有益效果

该发明对传统的水下成像光学模型进行改进，考虑了由人工光源和水下自然环境渐变造成的不均匀背景光现象。并改变了随机生成背景光颜色的方法，采用在真实图像上获取的数值，让合成的图像更加逼真，颜色更加自然。利用这样的合成数据集，能使被训练的网络在真实场景下的泛化性能和去模糊效果得到进一步提升，且拥有对单幅图像中不均匀光线的适应性。为了能让合成的图像呈现逼真的背景光颜色，以减少随机生成的颜色数值与真实情况下水体颜色的差异，利用先进的参数估计算法，在大量真实水下图像上估计他们背景光的RGB颜色通道数值，得到能涵盖各种真实水下场景的背景光颜色数据集合。同时，对简化的水下光学模型进行了改进，添加不均匀背景光项，并自适应的调节该项权重使图像不至于出现大范围的过曝光现象。其中，不均匀背景光由单噪声循环的二维Perlin噪声模拟。

以上所揭露的仅为本发明一种较佳实施例而已，当然不能以此来限定本发明之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本发明权利要求所作的等同变化，仍属于发明所涵盖的范围。

Claims

1.一种用于水下图像复原的深度学习训练数据集合成方法，其特征在于，包括以下步骤：

基于柏林噪声生成不均匀的单通道背景光集合，并利用改进的水下光学模型生成多个数据对应的合成水下图像，其中，多个所述数据为在所述RGBD数据集、所述RGB颜色数值集合和所述单通道背景光集合中随机抽取的数据；

获取现有RGBD数据集，并基于水下图像参数估计算法计算出真实水下场景对应的RGB颜色数值集合，包括：

获取室内外深度数据集，以及获取UIEB数据集；

获取每张所述UIEB数据集的深度信息，并将所述深度信息按照降序排序后，获取排序第一位上的0.1％的像素中最大值，作为一组像素值符合阈值的RGB颜色数值集合；

获取现有RGBD数据集，并基于水下图像参数估计算法计算出真实水下场景对应的RGB颜色数值集合之后，所述方法还包括：

将得到的所述像素值乘以一位以正态分布随机生成的在±0.1之间的数值；

基于柏林噪声生成不均匀的单通道背景光集合，并利用改进的水下光学模型生成多个数据对应的合成水下图像，包括：

将对应的图像和数据代入所述改进的水下光学模型，得到合成水下图像，其中，所述图像和数据为RGBD图像数据、RGB颜色数值、单通道背景光及其权重、传输映射；

其中，添加了不均匀背景光项的改进的水下光学模型：

I_c(x)＝J_c(x)T_c(x)+A_c(1-T_c(x))+ηN(x)

其中，x表示像素坐标，c表示颜色通道R、G、B；A_c代表通道c的全局背景光，对每一通道为常量；J_c(x)表示未退化图像，I_c(x)表示退化后图像；T_c(x)称作传输映射，即经过距离d(x)前后的能量比例，d(x)表示图像的深度；η为自适应参数用于控制添加的不均匀成分的权重；考虑存在没有不均匀光线的水下图像，设置30％的生成的水下图像中不均匀背景光成分权重η＝0；其他水下图像中不均匀背景光权重η为随机生成的系数值，并根据曝光程度自适应调节该数值；自适应规则由添加不均匀背景光后图像中新增白色像素占整幅图像像素数的比例决定；最后，随机生成衰减系数

值，再利用RGBD图像对应的深度映射d(x)带入传输映射方程得到传输映射T_c(x)。