CN111310582A

CN111310582A - 基于边界感知和对抗学习的湍流退化图像语义分割方法

Info

Publication number: CN111310582A
Application number: CN202010058022.9A
Authority: CN
Inventors: 崔林艳; 张妍
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2020-01-19
Filing date: 2020-01-19
Publication date: 2020-06-19

Abstract

本发明涉及基于边界感知和对抗学习的湍流退化图像语义分割方法，包括以下步骤：(1)针对湍流退化图像，基于湍流成像物理模型，将仿真湍流退化图像与真实湍流退化图像相结合，构建湍流退化图像语义分割数据集；(2)针对步骤(1)获得的数据集，结合湍流退化图像的模糊和畸变特性，构建基于边界感知的DeepLabV3+语义分割模型；(3)将步骤(2)中基于边界感知的DeepLabV3+语义分割模型作为生成器，并结合由五个卷积层组成的鉴别器，构建基于对抗学习的边界感知生成对抗网络GAN模型；(4)针对步骤(3)获得的GAN模型，在步骤(1)获得的湍流退化图像语义分割数据集上进行模型的训练，获得训练后的语义分割GAN模型，利用训练后的语义分割对抗网络GAN模型对湍流退化图像进行语义分割，获得预测分割图。

Description

基于边界感知和对抗学习的湍流退化图像语义分割方法

技术领域

本发明涉及基于边界感知和对抗学习的湍流退化图像语义分割方法，这是一种结合边界感知算法和生成对抗网络(GAN)的深度模型，适用于受到大气湍流影响而产生退化的图像的语义分割任务。

背景技术

语义分割在智能驾驶、安防监控、工业检测等多种行业中都有广泛的应用，是计算机视觉领域中极具挑战性的任务。湍流退化图像语义分割是指对受到大气湍流影响而形成的降质图像进行像素级分类的任务。大气湍流会对光学系统的成像性能产生严重的影响，造成观测图像出现畸变、模糊等退化现象，从而降低了图像语义分割模型的准确性。因此，湍流退化图像语义分割任务的困难性不容小觑，实现退化图像的精确语义分割至关重要。

对于图像语义分割任务，过去通常使用各种传统的机器学习技术。传统的图像分割方法，往往只进行相似区域的分割，并不能获得语义信息，而且过于依靠先验知识和人工选择，消耗大量的人力成本和时间成本，难以保证最终结果的精度，具有很大的应用局限性。语义分割任务本身具有许多难点，例如，在物体层次，同一物体在不同拍摄条件下展现出不同外观形象；在类别层次，同类物体的相异性和异类物体的相似性等；背景层次，实际场景中的背景往往复杂多变等。此外，相比常规图像，湍流退化图像的图像质量受到大气湍流现象的严重影响，为降质图像，表现出空间模糊和时空畸变，为语义分割任务带来了很大难度。

通过深度CNN网络进行监督学习，已经成为近年来解决图像语义分割任务的主要方法，例如FCN、U-Net、DeepLab系列模型等，进行端到端的训练，获得预测分割图。然而，针对湍流退化图像进行语义分割任务的方法很少，目前的研究难点主要表现在以下几个方面： (1)湍流退化图像具有模糊和畸变两大特点，较常规图像而言，图像质量较差、边缘模糊、物体畸变、对比度低、纹理信息难以表达，且往往含有噪声，进行准确的语义分割较为困难； (2)退化图像语义分割任务始终存在着“高层语义”和“低层细节”的双重挑战，不仅需要利用全局信息来解决语义判别的问题，而且需要利用局部信息解决细节定位的问题；(3)目前针对湍流退化图像语义分割研究的数据集还十分匮乏，需要人工获取和建立湍流退化图像数据集，难度较大；(4)现有的基于深度学习的语义分割方法一般只针对常见场景的较高质量图像，不适用于湍流退化图像。

发明内容

本发明的技术解决问题是：克服现有技术不足，针对湍流场景条件下图像的模糊、畸变问题，提供基于边界感知和对抗学习的湍流退化图像语义分割方法，改善湍流退化图像的分割边缘细节，提升语义识别准确性，提高模型的语义分割精度。

本发明的技术解决方案为基于边界感知和对抗学习的湍流退化图像语义分割方法，包括以下步骤：

(1)基于湍流成像物理模型，将仿真湍流退化图像与真实湍流退化图像相结合，构建湍流退化图像语义分割数据集；

(2)针对步骤(1)获得的数据集，结合湍流退化图像的模糊和畸变特性，构建基于边界感知的DeepLabV3+语义分割模型；

(3)将步骤(2)中基于边界感知的DeepLabV3+语义分割模型作为生成器，并结合由五个卷积层组成的鉴别器，构建基于对抗学习的边界感知生成对抗网络GAN模型；

(4)针对步骤(3)获得的GAN模型，在步骤(1)获得的湍流退化图像语义分割数据集上进行模型的训练，获得训练后的语义分割GAN模型，利用训练后的语义分割对抗网络 GAN模型对湍流退化图像进行语义分割，获得预测分割图。

进一步的，所述步骤(1)中，湍流退化图像语义分割数据集的构建方法如下：

将湍流物理成像模型与图像处理算法即图像插值和图像卷积方法相结合，利用大气湍流物理成像模型，进行图像的湍流退化仿真，湍流物理成像模型的参数包括湍流调制传递函数 MTF和光波到达角AOA起伏；图像模糊特性通过频域中的大气湍流调制传递函数MTF和空域中的点扩展函数PSF来描述，图像畸变失真与光波到达角AOA的波动有关；

真实湍流具有各向异性和非柯尔莫哥洛夫(Kolmogorov)性质，其中，各向异性因子能够在水平和垂直方向上对湍涡尺度分布的不对称性进行参数化；而湍流谱指数α在3到4之间进行取值；

给定原始图像I(x,y)，O(x,y)表示仿真后的湍流退化图像，F()和D()分别代表图像模糊算子和图像畸变算子，使用以下公式获取仿真后的湍流退化图像：

O(x,y)＝F(D(I(x,y)))

首先，设置仿真条件和参数数值，即各向异性因子、湍流谱指数、湍流强度、湍流内外尺度和成像距离，确定各向异性非Kolmogorov湍流MTF和光波AOA方差理论模型；然后，计算图像x和y两个方向上的位移矩阵，即δx和δy；第三，计算与湍流MTF的傅立叶逆变换有关的湍流点扩展函数PSF；第四，在已知δx和δy的条件下，使用图像双线性插值算法进行图像畸变仿真；最后，将畸变图像与湍流点扩展函数PSF进行卷积，得到各向异性非 Kolmogorov湍流中的退化图像；

对于真实的湍流退化图像，参考现有数据集的标注规则，进行图像标签的标注。

进一步的，所述步骤(2)中，构建基于边界感知的DeepLabV3+语义分割模型，方法如下：

首先以DeepLabV3+为基础网络，然后在此基础上添加边界辅助监督模块，作为边界信息的监督指引；

边界辅助监督模块使用边缘检测滤波器，在预测分割图F和真实标签图GT上分别与边缘检测滤波器f_B进行卷积，从而获得边界预测F_B和边界真值GT_B；边缘检测滤波器为3×3的 Sobel滤波器；两个滤波器S_x,S_y分别描述了水平和垂直梯度，将两个滤波器连接成3×3×2 维张量即为Sobel滤波器；

随后，对边界标签采用高斯模糊f_G进行高斯滤波，从而得到最终的边界真值GT_BG；平滑步骤中使用3×3高斯核；

边界辅助监督任务分支的训练：构造有效的边界辅助损失L_BAS，定义为预测值

和与之对应的标签真值y之间的L₂损失：

其中，s是样本，n是样本数量；总损失L_tot包括原始语义分割损失L_ce和新的边界辅助损失L_BAS，其中边界权重因子β用于调节了全局信息和边界信息之间的比重；

L_tot＝L_ce+βL_BAS

通过最终损失函数提取准确的语义边界，同时增大特征的类别之间的差异性。

进一步的，所述步骤(3)中，构建基于对抗学习的边界感知对抗网络GAN模型，方法如下：

对抗网络GAN模型中，生成器采用边界感知DeepLabV3+模型，鉴别器采用由5个卷积层组成的神经网络模型，GAN网络的训练过程使用合成损失函数，即两组损失函数的加权和：

其中，N为数据集中的图像数量，X_i表示某一输入训练图像，Y_i表示对应真实标签图，输入图像的维度为H×W×3；H为图像高度，W为图像宽度，第一项为生成器中的损失项，促进分割模型预测每个像素的正确类别；S(X_i)表示生成器输出的维度为H×W×C的类别概率图，C为类别个数，E(Y_i)表示通过对具有离散标签的真实标签图Y_i进行独热编码而获得的C个通道的标签概率向量；第二项为鉴别器的损失函数；当对抗网络正确判别出真实标签图和生成预测图时，此损失项大于预定阈值；p(X,Y)表示鉴别器预测Y是X的真实标签的概率，取值范围为[0,1]；λ表示权重系数；

鉴别器的训练使以下损失函数L_dis最小化：

其中，当样本为生成器中分割网络输出的预测分割图时，z_i＝0；而当样本为真实标签图时，z_i＝1；此外，D(S(X_i))^p是X_i在像素p处的置信图，同理，D(Y_i)^p是Y_i在像素p处的置信图；

生成器的训练使以下损失函数L_seg最小化：

L_seg＝(L_ce+λ_BASL_BAS)+λ_advL_adv

其中，L_ce和L_BAS为边界感知分割网络中的损失函数，分别是多类交叉熵损失和边界辅助监督损失，L_adv是对抗损失Adversarial Loss；λ_BAS和λ_adv是最小化多任务损失函数的权重系数，分别设置为0.1和0.01。

其中，如果像素

属于类别c，则

取值为1，否则取值为0；给定完全卷积判别网络D(·)，通过进行对抗学习，来训练鉴别器，对抗损失L_acv为：

进一步的，所述步骤(4)中，在湍流退化图像语义分割数据集上进行模型的训练，获得训练后的GAN模型，利用训练后模型对湍流退化图像进行语义分割，方法如下：进行模型训练过程的参数及优化方式的设置，包括图像裁剪尺寸、学习率策略、训练步数和输出比率；

图像裁剪尺寸设置为长宽均大于原图一个像素；学习率策略选择“POLY”，初始学习率设置为0.0001，初始训练步数为30000步，学习率衰减步数设为2000，学习速率衰减因子为0.1；训练步数设置为50000；编码器输出比率设置为16，即编码器输出特征图为原图尺寸的1/16，对应空洞卷积扩张率为[12,24,36]。

本发明与现有技术相比的优点在于：

(1)本发明采用了添加边界辅助监督任务分支的方式，将边界辅助监督模块与DeepLabV3+网络相结合，聚焦于湍流退化图像的边界细节区域。此方式有效降低分割预测图在目标边界区域的分割误差，有效改善分割结果粗糙的问题。

(2)本发明采用了对抗学习与语义分割算法相结合的方式，将边界感知语义分割网络作为生成器，结合有效的鉴别器，发明了基于对抗学习的边界感知GAN模型。该方法可有效改善真实标签图和预测分割图的高阶不一致性，可提高预测分割图中目标语义识别的正确性，并整体提升湍流退化图像的语义分割效果。

总之，本发明采用的方法原理简洁，语义分割效果良好，可达到对湍流退化图像精确语义分割的目的。

附图说明

图1为本发明基于边界感知和对抗学习的湍流退化图像语义分割方法流程图；

图2为采用本发明方法获得的语义分割前后的图像示例。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例仅为本发明的一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域的普通技术人员在不付出创造性劳动的前提下所获得的所有其他实施例，都属于本发明的保护范围。

如图1所示，本发明的具体实现步骤如下：

步骤1、将湍流物理成像模型与图像处理算法(即图像插值和图像卷积方法)相结合。利用大气湍流物理成像模型，进行图像的湍流退化仿真，构建湍流退化图像语义分割数据集。湍流物理成像模型的主要参数有湍流调制传递函数MTF和光波到达角AOA。图像模糊特性通过频域中的调制传递函数MTF和空域中的点扩展函数PSF来描述，而图像畸变失真与光波到达角AOA的波动有关。

真实湍流具有各向异性和非Kolmogorov性质。其中，各向异性因子可在水平和垂直方向上对湍涡尺度分布的不对称性进行参数化；而湍流谱指数α在3到4之间进行取值。

给定原始图像I(x,y)，O(x,y)表示仿真后的湍流退化图像，F()和D()分别代表图像模糊算子和图像畸变算子，使用以下公式获取模拟后的湍流退化图像：

O(x,y)＝F(D(I(x,y)))

首先，设置仿真条件和参数数值，即各向异性因子、湍流谱指数、湍流强度、湍流内外尺度和成像距离等，确定各向异性非Kolmogorov湍流MTF和光波AOA方差理论模型；然后，计算图像x和y两个方向上的位移矩阵，即δx和δy；第三，计算与湍流MTF的傅立叶逆变换有关的湍流点扩展函数PSF；第四，在已知δx和δy的条件下，使用图像双线性插值算法进行图像畸变仿真；最后，将畸变图像与湍流点扩展函数PSF进行卷积，得到各向异性非Kolmogorov湍流中的退化图像。

对于真实的湍流退化图像，参考现有数据集的标注规则，进行图像标签的标注，其中，图像标注环节使用的是像素级别图像注释工具“LabelMe”。

步骤2、以DeepLabV3+为基础网络，并在此基础上添加边界辅助监督模块，作为边界信息的监督指引，构建基于边界感知的DeepLabV3+语义分割模型。

边界辅助监督模块使用传统的边缘检测滤波器，在预测分割图F和真实标签图GT上分别与边缘检测滤波器f_B进行卷积，从而获得边界预测F_B和边界真值GT_B。边缘检测滤波器为3×3的Sobel滤波器，是一种典型的二维滤波器，描述了一阶梯度运算，与旋转相关，运算效率高。两个滤波器S_x,S_y分别描述了水平和垂直梯度，将两个滤波器连接成3×3×2维张量即为Sobel滤波器。

随后，对边界标签采用高斯模糊f_G进行高斯滤波，从而得到最终的边界真值GT_BG。平滑步骤中使用3×3高斯核。

为了边界辅助监督任务分支的训练，构造了有效的边界辅助损失L_BAS，定义为预测值

和与之对应的标签真值y之间的L₂损失：

其中，s是样本，n是样本数量。总损失L_tot包括原始语义分割损失L_ce和新的边界辅助损失L_BAS，其中边界权重因子β用于调节了全局信息和边界信息之间的比重。

L_tot＝L_ce+βL_BAS

β取值0.125时，模型取得更优性能。通过最终损失函数可以提取准确的语义边界，同时增大特征的类别之间的差异性。

步骤3、以边界感知DeepLabV3+模型为生成器，以由5个卷积层组成的神经网络模型为鉴别器，构建基于对抗学习的边界感知GAN模型。

GAN网络的训练过程使用合成损失函数，即两组损失函数的加权和：

其中，N为数据集中的图像数量，X_i表示某一输入训练图像，Y_i表示对应真实标签图，输入图像的维度为H×W×3。第一项为生成器中的损失项，促进分割模型预测每个像素的正确类别。S(X_i)表示生成器输出的维度为H×W×C的类别概率图，E(Y_i)表示通过对具有离散标签的真实标签图Y_i进行独热编码而获得的C通道的标签概率向量。第二项为鉴别器的损失函数。当对抗网络正确判别出真实标签图和生成预测图时，此损失项很大。p(X,Y)表示鉴别器预测Y是X的真实标签的概率，取值范围为[0,1]。

鉴别器的训练使以下损失函数L_dis最小化：

其中，当样本为生成器中分割网络输出的预测分割图时，z_i＝0；而当样本为真实标签图时，z_i＝1。此外，D(S(X_i))^p是X_i在像素p处的置信图，同理，D(Y_i)^p是Y_i在像素p处的置信图。

生成器的训练使以下损失函数L_seg最小化：

L_seg＝(L_ce+λ_BASL_BAS)+λ_advL_adv

其中，L_ce和L_BAS为边界感知分割网络中的损失函数，分别是多类交叉熵损失和边界辅助监督损失，L_adv是对抗损失(Adversarial Loss)。λ_BAS和λ_adv是最小化多任务损失函数的权重系数，为获得良好性能分别设置为0.1和0.01。

其中，如果像素

属于类别c，则

取值为1，否则取值为0。给定完全卷积判别网络D(·)，通过进行对抗学习，来训练鉴别器，对抗损失L_acv为：

步骤4、在湍流退化图像语义分割数据集上进行模型的训练，获得训练后的GAN模型，利用训练后模型对湍流退化图像进行语义分割。其中需要进行模型训练过程的参数及优化方式的设置，主要包括图像裁剪尺寸、学习率策略、训练步数和输出比率等。

图像裁剪尺寸设置为略大于原图尺寸，此时训练模型效果更好；学习率策略选择“POLY”，初始学习率设置为0.0001，初始训练步数为30000步，学习率衰减步数设为2000，学习速率衰减因子为0.1；训练步数设置为50000；编码器输出比率设置为16，即编码器输出特征图为原图尺寸的1/16，对应空洞卷积扩张率为[12,24,36]。

如图2所示，该图第一列为输入的原始图像，由于大气湍流影响，原始图像具有模糊和畸变的特点；图2第二列为真实标签图像；图2第三列为原始的DeepLabV3+模型的语义分割结果，其中，车辆分割误差较大、小目标车辆未被识别分割出来；图2第四列为本发明提出的模型获得的湍流退化图像语义分割结果，可见，车辆边界处分割更加精确，分割误差明显降低，同时小目标车辆被识别分割出来。由此可见，本发明能够针对湍流退化图像，改善分割结果的边界细节，提高语义分割精度。

本发明说明书中未作详细描述的内容属于本领域专业技术人员的公知技术。尽管上面对本发明说明性的具体实施方式进行了描述，以便于本技术领域的技术人员理解本发明，且应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

Claims

1.基于边界感知和对抗学习的湍流退化图像语义分割方法，其特征在于，包括以下步骤：

(4)针对步骤(3)获得的GAN模型，在步骤(1)获得的湍流退化图像语义分割数据集上进行模型的训练，获得训练后的语义分割GAN模型，利用训练后的语义分割对抗网络GAN模型对湍流退化图像进行语义分割，获得预测分割图。

2.根据权利要求1所述的基于边界感知和对抗学习的湍流退化图像语义分割方法，其特征在于：所述步骤(1)中，湍流退化图像语义分割数据集的构建方法如下：

将湍流物理成像模型与图像处理算法即图像插值和图像卷积方法相结合，利用大气湍流物理成像模型，进行图像的湍流退化仿真，湍流物理成像模型的参数包括湍流调制传递函数MTF和光波到达角AOA起伏；图像模糊特性通过频域中的大气湍流调制传递函数MTF和空域中的点扩展函数PSF来描述，图像畸变失真与光波到达角AOA的波动有关；

O(x,y)＝F(D(I(x,y)))

首先，设置仿真条件和参数数值，即各向异性因子、湍流谱指数、湍流强度、湍流内外尺度和成像距离，确定各向异性非Kolmogorov湍流MTF和光波AOA方差理论模型；然后，计算图像x和y两个方向上的位移矩阵，即δx和δy；第三，计算与湍流MTF的傅立叶逆变换有关的湍流点扩展函数PSF；第四，在已知δx和δy的条件下，使用图像双线性插值算法进行图像畸变仿真；最后，将畸变图像与湍流点扩展函数PSF进行卷积，得到各向异性非Kolmogorov湍流中的退化图像；

3.根据权利要求1所述的基于边界感知和对抗学习的湍流退化图像语义分割方法，其特征在于：所述步骤(2)中，构建基于边界感知的DeepLabV3+语义分割模型，方法如下：

边界辅助监督模块使用边缘检测滤波器，在预测分割图F和真实标签图GT上分别与边缘检测滤波器f_B进行卷积，从而获得边界预测F_B和边界真值GT_B；边缘检测滤波器f_B为3×3的Sobel滤波器；两个滤波器S_x,S_y分别描述了水平和垂直梯度，将两个滤波器连接成3×3×2维张量即为Sobel滤波器；

和与之对应的标签真值y之间的L₂损失：

其中，s是样本，n是样本数量；总损失L_tot包括原始语义分割损失L_ce和新的边界辅助损失L_BAS，其中边界权重因子β用于调节全局信息和边界信息之间的比重；

L_tot＝L_ce+βL_BAS

4.根据权利要求1所述的基于边界感知和对抗学习的湍流退化图像语义分割方法，其特征在于：所述步骤(3)中，构建基于对抗学习的边界感知对抗网络GAN模型，方法如下：

鉴别器的训练使以下损失函数L_dis最小化：

生成器的训练使以下损失函数L_seg最小化：

L_seg＝(L_ce+λ_BASL_BAS)+λ_advL_adv

其中，如果像素

属于类别c，则Y_i ^(p,c)取值为1，否则取值为0；给定完全卷积判别网络D(·)，通过进行对抗学习，来训练鉴别器，对抗损失L_acv为：

5.根据权利要求1所述的基于边界感知和对抗学习的湍流退化图像语义分割方法，其特征在于：

所述步骤(4)中，在湍流退化图像语义分割数据集上进行模型的训练，获得训练后的GAN模型，利用训练后模型对湍流退化图像进行语义分割，方法如下：进行模型训练过程的参数及优化方式的设置，包括图像裁剪尺寸、学习率策略、训练步数和输出比率；