CN112561782B

CN112561782B - 一种提高海上场景仿真图片真实度的方法

Info

Publication number: CN112561782B
Application number: CN202011484532.9A
Authority: CN
Inventors: 苏丽; 崔浩浩
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2020-12-15
Filing date: 2020-12-15
Publication date: 2023-01-03
Anticipated expiration: 2040-12-15
Also published as: CN112561782A

Abstract

本发明公开了一种提高海上场景仿真图片真实度的方法，本发明将仿真图的前景背景分割，分别采用传统的方法与深度学习方法CycleGAN两种算法进行风格迁移，实现了由仿真图到真实海上照片的转换。其中背景采用泊松融合加色彩转换的方法，将真实的海面照片作为子图，仿真图作为母图泊松融合后，再经过Reinhard色彩迁移，得到逼真的背景，前景采用CycleGAN算法，并对生成器的每一层卷积均点乘其掩码来提取前景部分，并在最后一层与输入层进行拼接，来保留原图的背景信息，从而生成完整的拥有真实风格的海面图片。本发明利用仿真软件构建海上场景，得到仿真图片后转为真实图片的风格，用于神经网络训练，解决样本稀缺的问题。

Description

一种提高海上场景仿真图片真实度的方法

技术领域

本发明涉及一种提高海上场景仿真图片真实度的方法，涉及样本风格迁移、深度学习和神经网络领域。

背景技术

随着图像仿真技术的逐渐成熟，利用计算机对一些目标场景进行仿真变得越来越容易，且仿真效果也越来越真实，通过一些常见的仿真软件，如：3Dmax、Unity、UE4、Blender等即可很容易地获得各种场景的仿真图片。而在深度学习任务中，一些特殊场景下的样本往往不容易获取，如在进行海上目标的识别等任务时，通过物联网能够得到的照片数量有限且各种拍摄角度样本数量不均衡，通过真实拍摄构建数据集又会花费较大的人力物力，因此，一些研究者尝试将仿真图作为深度学习的样本用于神经网络的训练中，通过该方法可以轻松得到大量所需的难以获得的稀缺样本，且样本的各种信息在仿真软件中皆有显示，可以很容易且更加准确的进行标注。目前用仿真图片进行训练主要有两种方式：(1)直接用仿真图片进行训练，然后用迁移学习迁移到真实图上。(2)利用图像翻译算法将仿真图转为真实图的风格后进行训练。目前第一种迁移学习的方法比较常见，技术比较成熟。但是该方法并不能完全消除不同样本域之间的差异，所以一些研究者试图利用一些算法来将仿真图转化为更加逼真地图像，从而消除两个样本域之间的差异，直接使用转换后的图像来进行神经网络的训练。

发明内容

针对上述现有技术，本发明要解决的技术问题是提供一种提高海上场景仿真图片真实度的方法，可以利用仿真软件构建海上场景，得到仿真图片后转为真实图片的风格，从而用于神经网络的训练，解决样本稀缺的问题。

为解决上述技术问题，本发明的一种提高海上场景仿真图片真实度的方法，包括以下步骤：

步骤1：准备数据集，具体为：

准备三个数据集，包括：(1)海上场景仿真图片数据集Train_CG及其标签，要求标签将图片分割为天空，海面，前景目标三部分；(2)真实海面场景照片数据集Train_real及其标签，要求标签将照片分为前景、背景两部分；(3)没有目标的海面照片数据集Train_sea；

步骤2：从Train_sea中随机选取一张样本图片，利用区域增长算法对其进行分割；

步骤3：根据Train_CG的语义标签与Train_sea的分割结果对其进行海天线检测，具体为：从Train_CG与Train_sea中各随机选出一张图片，并对两者分割图中海面部分与天空部分的接触点进行多次采样，得到一组采样点样本，并去除其中的噪声点，之后将样本坐标送入一维线性分类器中进行训练，得到拟合的直线，该直线即检测得到的海天线；

步骤4：根据检测得到的海天线将挑选的两张图片进行对齐，具体为：

首先根据两张图片中检测得到的海天线的斜率，将Train_sea中挑选的海面图片进行相应的旋转，使其斜率保持一致，之后将两张图片的海天线位置对齐，并调整海面图片的大小，将超出仿真图的部分裁剪掉，得到两张海天线位于同一位置，且大小相同的仿真图CG与海面照片Sea；

步骤5：将步骤4得到的仿真图CG与海面照片Sea进行背景部分泊松融合，具体为：

根据仿真图的标签图片，得到仿真图的掩码图，其前景部分为0，背景部分为255，将仿真图CG作为母图，海面照片作为子图，仿真图的掩码图作为掩码，进行泊松融合，得到具有真实海面纹理的仿真图片；

步骤6：将步骤5得到的结果图片经过Reinhard色彩迁移算法改变其色彩风格，具体为：

将步骤5中的结果图与海面照片Sea分别转换为Lab颜色通道，分别计算三个通道的均值与方差，将源图像中每个通道均进行以下所示公式计算，并将计算结果重新转为RGB颜色空间即可得到色彩转换后的图片：

其中，p为源图像，m₁为源图像的均值，m₂为目标图像的均值，d₁为源图像的方差，d₂为目标图像的方差；

步骤7：循环步骤2-6，将仿真图片数据集Train_CG中所有的图片背景均进行泊松融合与色彩迁移，得到新的数据集Train_cg；

步骤8：将数据集Train_cg与Train_real分别经过深度学习算法CycleGAN进行训练，进行前景部分的风格迁移，具体为：

CycleGAN共具有两个生成器G_AB、G_BA和两个判别器D_A、D_B四个网络，每次循环分为前向过程与反向过程。前向过程对G_AB与D_A进行训练，反向过程对G_BA与D_B进行训练。其中前向过程可以分为判别器训练与生成器训练两个阶段，在判别器训练阶段，固定生成器G_AB参数，从数据集Train_cg中提取图片a，并由其标签得到掩码图，其中前景部分置为1，背景部分置为0，通过点乘其掩码图，提取出前景，将背景部分置黑，将点乘结果送入生成器G_AB中，生成假的真实照片风格的图片fake_b，把fake_b与Train_real中取出的照片b分别送入判别器D_B中对判别器进行训练，输入为fake_b时判别器输出与0计算交叉熵，输入为b时判别器输出与1计算交叉熵，将两个交叉熵结果相加，得到判别器损失指导判别器D_B的训练；在生成器训练阶段，固定判别器D_B的参数，将fake_b送入D_B中进行判别，并将判别结果点乘图片a的掩码后与1计算交叉熵损失，得到L_GAN(G_AB，D_B，A，B)，将fake_b与a分别点乘提取出两者的背景，计算L1损失||G_AB(a)_b-a_b||₁，将fake_b经过生成器G_BA得到rec_a，并对rec_a的前景与a的前景求L1损失||G_BA(G_AB(a)_f)-a_f||₁，将a进过生成器G_BA后得到idt_b与a求L1损失||G_BA(a)-a||₁，对以上四个损失添加权重后作为G_AB的损失，反向过程训练方式与正向过程相同，两个生成器采用联合训练，利用总的损失函数共同指导两个生成器的训练，正反过程总损失函数具体为：

L(G_AB，G_BA，D_A，D_B)＝L_GAN(G_AB，D_B，A，B)+L_GAN(G_BA，D_A，B，A)+αL_cyc(G_AB，G_BA)+

βL_idt(G_AB，G_BA)+γL_back(G_AB，G_BA，A，B)

其中：

L_GAN(G_AB，D_B，A，B)＝E[log D_B(b_f)]+E[log(1-D_B(G_AB(a)_f))]

L_GAN(G_BA，D_A，B，A)＝E[log D_A(a_f)]+E[log(1-D_A(G_BA(b)_f))]

L_cyc(G_AB，G_BA)＝E[||G_BA(G_AB(a)_f)-a_f||₁]+E[||G_AB(G_BA(b)_f)-b_f||₁]

L_idt(G_AB，G_BA，A，B)＝E[||G_BA(a)-a||₁]+E[||G_AB(b)-b||₁]

L_back(G_AB，G_BA，A，B)＝E[||G_AB(a)_b-a_b||₁]+E[||G_BA(b)_b-b_b||₁]

A表示仿真图片数据集，B表示真实照片数据集；a表示仿真图片数据集中的图片，b表示真实图片数据集中的图片；G_AB为由仿真图生成真实照片风格图片的生成器，G_BA为其反向过程由真实照片生成仿真图片风格的生成器，D_A为判别是否为真实图的判别器，D_B为判别是否为仿真图的判别器；下角标为f表示与掩码点乘提取出前景，下角标为b表示与(1-掩码图)点乘提取出背景；E代表期望，α取值500，β取值250，γ取值1；

步骤9：将数据集Train_CG和Train_real分别送入语义分割网络deeplab v3+中进行训练，保存训练后的参数；

步骤10：将语义分割结果代替标签，使用任意的仿真图经过步骤2-6，之后经过CycleGAN中训练好的生成器G_AB来得到真实风格的图片。

本发明的有益效果：

在深度学习技术中，样本集往往占据着相当重要的地位，能够直接影响到最终网络训练的好坏，但是在许多情况下我们往往很难得到理想的样本集，样本数量的稀缺会对网络的训练造成很大的影响。本发明提供了一种提高海上场景仿真图片真实度的方法，通过该方法可以利用仿真软件构建海上场景，得到仿真图片后转为真实图片的风格，从而用于神经网络的训练，解决样本稀缺的问题。本发明将仿真图的前景背景分割，分别采用传统的方法与深度学习方法CycleGAN两种算法进行风格迁移，实现了由仿真图到真实海上照片的转换。其中背景采用泊松融合加色彩转换的方法，将真实的海面照片作为子图，仿真图作为母图泊松融合后，再经过Reinhard色彩迁移，得到逼真的背景，前景采用CycleGAN算法，并对生成器的每一层卷积均点乘其掩码来提取前景部分，并在最后一层与输入层进行拼接，来保留原图的背景信息，从而生成完整的拥有真实风格的海面图片。

附图说明

图1(a)是部分海面背景数据集；

图1(b)部分仿真图片数据集及其标签；

图1(c)部分真实海面照片及其标签；

图2(a)是CycleGAN生成器训练过程示意图(正向过程)；

图2(b)是CycleGAN生成器训练过程示意图(反向过程)；

图3为训练前景用生成器结构示意图；

图4是原仿真图与生成图对比示意图。

具体实施方式

下面结合附图对本发明具体实施方式做进一步说明。

在深度学习任务中，样本数据往往占据着重要的地位，然而一些特殊场景下的样本往往不容易获取，如在进行海上目标的识别等任务时，通过物联网能够得到的照片数量有限且各种拍摄角度样本数量不均衡，通过真实拍摄构建数据集又会花费较大的人力物力，因此，一些研究者尝试将仿真图作为深度学习的样本用于神经网络的训练中，通过该方法可以轻松得到大量所需的难以获得的稀缺样本，且样本的各种信息在仿真软件中皆有显示，可以很容易且更加准确的进行标注。然而仿真图片与真实图片两个域之间往往存在较大的差别，导致仿真图无法直接代替真实图用于神经网络的训练中。本发明提供一种提高海上场景仿真图片真实度的方法，从而能够直接代替真实照片用于神经网络的训练，解决样本数量稀少的问题。

本发明步骤：

1、准备如附图1(a)至图1(c)中仿真图片数据集Train_CG及其标签，真实海上场景照片数据集Train_real及其标签，没有目标的海面场景数据集Train_sea。

步骤2、随机选取一张Train_sea数据集照片进行区域增长分割，并根据分割结果，对海面天空分割部分进行采样，将采样点坐标送入一维线性分类器中进行拟合，得到海天线。

步骤3、随机选取Train_CG中一张图片，进行步骤2中操作，得到其海天线。

步骤4、根据Train_CG与Train_sea的海天线，将两者进行对齐，保留两幅图相交部分。

步骤5、根据Train_CG的标签得到其掩码，前景置为0，背景置为255，并将步骤4中对齐后的仿真图作为母图，海面图作为子图，进行泊松融合。

步骤6、将步骤5中泊松融合的结果和海面图片转为Lab颜色空间，分别计算两者三个通道的均值与方差。并带入以下公式中计算，得到色彩转换后的仿真图。

其中，p为源图像，m₁为源图像的均值，m₂为目标图像的均值，d₁为源图像的方差，d₂为目标图像的方差。

步骤7、循环步骤2-6，直至数据集Train_CG中所有图片均完成泊松融合与色彩转换。

步骤8、将转换完成的仿真图构建新的数据集，与真实海上场景照片数据集一同放入CycleGAN(循环生成对抗网络)算法中进行前景风格的转换。

其中CycleGAN算法为一种基于深度学习的非成对图像翻译算法，将两个不同风格的数据集图片同时送入网络中进行训练即可实现从一种风格向另一种风格的转换。其本质是两个镜像对称的GAN(生成对抗网络)，构成了一个环形网络，具有两个生成器G_AB、G_BA和两个判别器D_A、D_B，本发明中，生成器结构如附图3所示，采用残差网络，并对每层卷积层的输入均点乘其对应大小的掩码，即仅对前景部分进行生成，在最后一层卷积层前将网络的输入与特征图进行拼接，从而保留背景部分的信息，使得网络能够输出完整的迁移后的图片。一个完整的CycleGAN可以拆分为两个相同的单向网络，互为反向过程。

对于由仿真图生成真实图风格的单向过程可以分为判别器训练与生成器训练两个阶段，在判别器训练阶段，固定生成器G_AB参数，从数据集Train_cg中提取图片a，并由其标签得到其掩码图，其中前景部分置为1，背景部分置为0，通过点乘其掩码图，提取出前景，将背景部分置黑，将点乘结果送入生成器G_AB中，生成假的真实照片风格的图片fake_b，把fake_b与Train_real中取出的照片b分别送入判别器DB中对判别器进行训练，输入为fake_b时判别器输出与0计算交叉熵，输入为b时判别器输出与1计算交叉熵，将两个交叉熵结果相加，得到判别器损失，来指导判别器DB的训练；生成器训练过程如附图2(a)和图2(b)所示，固定判别器D_B的参数，将fake_b送入D_B中进行判别，并将判别结果点乘图片a的掩码后与1计算交叉熵损失，得到L_GAN(G_AB，D_B，A，B)，将fake_b与a分别点乘(1-a的掩码图)提取出两者的背景，计算L1损失||G_AB(a)_b-a_b||₁，将fake_b经过生成器G_BA得到rec_a，并对rec_a的前景与a的前景求L1损失||G_BA(G_AB(a)_f)-a_f||₁，将a进过生成器G_BA后得到idt_b与a求L1损失||G_BA(a)-a||₁，对以上四个损失添加合适的权重后作为G_AB的损失。反向过程与其类似。两个生成器采用联合训练，正反过程总损失函数如下，利用总的损失函数共同指导两个生成器的训练。

L(G_AB，G_BA，D_A，D_B)＝L_GAN(G_AB，D_B，A，B)+L_GAN(G_BA，D_A，B，A)+αL_cyc(G_AB，G_BA)+βL_idt(G_AB，G_BA)+γL_back(G_AB，G_BA，A，B)

其中：

L_GAN(G_AB，D_B，A，B)＝E[log D_B(b_f)]+E[log(1-D_B(G_AB(a)_f))]

L_GAN(G_BA，D_A，B，A)＝E[log D_A(a_f)]+E[log(1-D_A(G_BA(b)_f))]

L_idt(G_AB，G_BA，A，B)＝E[||G_BA(a)-a||₁]+E[||G_AB(b)-b||₁]

L_back(G_AB，G_BA，A，B)＝E[||G_AB(a)_b-a_b||₁]+E[||G_BA(b)_b-b_b||₁]

A表示仿真图片数据集，B表示真实照片数据集；a表示仿真图片数据集中的图片，b表示真实图片数据集中的图片；G_AB为由仿真图生成真实照片风格图片的生成器，G_BA为其反向过程由真实照片生成仿真图片风格的生成器，D_A为判别是否为真实图的判别器，D_B为判别是否为仿真图的判别器；下角标为f表示与掩码点乘提取出前景，下角标为b表示与(1-掩码图)点乘提取出背景；E代表期望。α取值500，β取值250，γ取值1。

步骤9、将数据集Train_CG和Train_real分别送入语义分割网络DeepLab v3+中进行训练，保存训练后的参数。

步骤10、完成以上步骤之后就可以将语义分割结果代替标签，使用任意的仿真图经过步骤2-6，之后经过CycleGAN中训练好的生成器G_AB来得到真实风格的图片，实现批量的快速转换，转换结果如附图4所示。

实施例：

1、准备数据集

本方法一共需要准备三个数据集，(1)海上场景仿真图片数据集Train_CG及其标签，要求标签将图片分割为天空，海面，前景目标三部分。(2)准备真实海面场景照片数据集Train_real及其标签，要求标签将照片分为前景背景两部分。(3)没有目标的海面照片数据集Train_sea。

2、从Train_sea中随机选取一张样本图片，利用区域增长算法对其进行分割。

3、根据Train_CG的语义标签与Train_sea的分割结果对其进行海天线检测。

从Train_CG与Train_sea中各随机选出一张图片，并对两者分割图中海面部分与天空部分的接触点进行多次采样，得到一组采样点样本，并去除其中的噪声点，之后将样本坐标送入一维线性分类器中进行训练，得到其拟合的直线，该直线即检测得到的海天线。

4、根据检测得到的海天线将挑选的两张图片进行对齐。

首先根据两张图片中检测得到的海天线的斜率，将Train_sea中挑选的海面图片进行相应的旋转，使其斜率保持一致，之后将两张图片的海天线位置对齐，并调整海面图片的大小，将超出仿真图的部分裁剪掉。得到两张海天线位于同一位置，且大小相同的仿真图CG与海面照片Sea。

5、将步骤4得到的仿真图CG与海面照片Sea进行背景部分泊松融合。

根据仿真图的标签图片，得到仿真图的掩码图，其前景部分为0，背景部分为255。将仿真图CG作为母图，海面照片作为子图，仿真图的掩码图作为掩码，进行泊松融合，即可得到具有真实海面纹理的仿真图片。

6、将步骤5得到的结果图片经过Reinhard色彩迁移算法改变其色彩风格。

将步骤5中的结果图与海面照片Sea分别转换为Lab颜色通道。分别计算三个通道的均值与方差，将源图像中每个通道均进行以下所示公式计算，并将计算结果重新转为RGB颜色空间即可得到色彩转换后的图片。

7、循环步骤2-6，将仿真图片数据集Train_CG中所有的图片背景均进行泊松融合与色彩迁移，得到新的数据集Train_cg。

8、将数据集Train_cg与Train_real的前景分别经过CycleGAN算法，进行前景部分的风格迁移。

对于由仿真图生成真实图风格的单向过程可以分为判别器训练与生成器训练两个阶段，在判别器训练阶段，固定生成器G_AB参数，从数据集Train_cg中提取图片a，并由其标签得到其掩码图，其中前景部分置为1，背景部分置为0，通过点乘其掩码图，提取出前景，将背景部分置黑，将点乘结果送入生成器G_AB中，生成假的真实照片风格的图片fake_b，把fake_b与Train_real中取出的照片b分别送入判别器D_B中对判别器进行训练，输入为fake_b时判别器输出与0计算交叉熵，输入为b时判别器输出与1计算交叉熵，将两个交叉熵结果相加，得到判别器损失，来指导判别器D_B的训练；生成器训练过程如附图2(a)和图2(b)所示，固定判别器D_B的参数，将fake_b送入D_B中进行判别，并将判别结果点乘图片a的掩码后与1计算交叉熵损失，得到L_GAN(G_AB，D_B，A，B)，将fake_b与a分别点乘(1-a的掩码图)提取出两者的背景，计算L1损失||G_AB(a)_b-a_b||₁，将fake_b经过生成器G_BA得到rec_a，并对rec_a的前景与a的前景求L1损失||G_BA(G_AB(a)_f)-a_f||₁，将a进过生成器G_BA后得到idt_b与a求L1损失||G_BA(a)-a||₁，对以上四个损失添加合适的权重后作为G_AB的损失。反向过程与其类似。两个生成器采用联合训练，正反过程总损失函数如下，利用总的损失函数共同指导两个生成器的训练。

其中：

L_GAN(G_AB，D_B，A，B)＝E[log D_B(b_f)]+E[log(1-D_B(G_AB(a)_f))]

L_GAN(G_BA，D_A，B，A)＝E[log D_A(a_f)]+E[log(1-D_A(G_BA(b)_f))]

L_idt(G_AB，G_BA，A，B)＝E[||G_BA(a)-a||₁]+E[||G_AB(b)-b||₁]

L_back(G_AB，G_BA，A，B)＝E[||G_AB(a)_b-a_b||₁]+E[||G_BA(b)_b-b_b||₁]

9、将数据集Train_CG和Train_real分别送入语义分割网络deeplab v3+中进行训练，保存训练后的参数。

10、完成以上步骤之后就可以将语义分割结果代替标签，使用任意的仿真图经过步骤2-6，之后经过CycleGAN中训练好的生成器G_AB来得到真实风格的图片，实现批量的快速转换。

Claims

1.一种提高海上场景仿真图片真实度的方法，其特征在于，包括以下步骤：

步骤1：准备数据集，具体为：

CycleGAN共具有两个生成器G_AB、G_BA和两个判别器D_A、D_B四个网络，每次循环分为前向过程与反向过程，前向过程对G_AB与D_A进行训练，反向过程对G_BA与D_B进行训练，其中前向过程可以分为判别器训练与生成器训练两个阶段，在判别器训练阶段，固定生成器G_AB参数，从数据集Train_cg中提取图片a，并由其标签得到掩码图，其中前景部分置为1，背景部分置为0，通过点乘其掩码图，提取出前景，将背景部分置黑，将点乘结果送入生成器G_AB中，生成假的真实照片风格的图片fake_b，把fake_b与Train_real中取出的照片b分别送入判别器D_B中对判别器进行训练，输入为fake_b时判别器输出与0计算交叉熵，输入为b时判别器输出与1计算交叉熵，将两个交叉熵结果相加，得到判别器损失指导判别器D_B的训练；在生成器训练阶段，固定判别器D_B的参数，将fake_b送入D_B中进行判别，并将判别结果点乘图片a的掩码后与1计算交叉熵损失，得到L_GAN(G_AB，D_B，A，B)，将fake_b与a分别点乘提取出两者的背景，计算L1损失||G_AB(a)_b-a_b||₁，将fake_b经过生成器G_BA得到rec_a，并对rec_a的前景与a的前景求L1损失||G_BA(G_AB(a)_f)-a_f||₁，将a进过生成器G_BA后得到idt_b与a求L1损失||G_BA(a)-a||₁，对以上四个损失添加权重后作为G_AB的损失，反向过程训练方式与正向过程相同，两个生成器采用联合训练，利用总的损失函数共同指导两个生成器的训练，正反过程总损失函数具体为：

其中：

L_GAN(G_AB，D_B，A，B)＝E[logD_B(b_f)]+E[log(1-D_B(G_AB(a)_f))]

L_GAN(G_BA，D_A，B，A)＝E[logD_A(a_f)]+E[log(1-D_A(G_BA(b)_f))]

L_idt(G_AB，G_BA，A，B)＝E[||G_BA(a)-a||₁]+E[||G_AB(b)-b||₁]

L_back(G_AB，G_BA，A，B)＝E[||G_AB(a)_b-a_b||₁]+E[||G_BA(b)_b-b_b||₁]

A表示仿真图片数据集，B表示真实照片数据集；a表示仿真图片数据集中的图片，b表示真实图片数据集中的图片；G_AB为由仿真图生成真实照片风格图片的生成器，G_BA为其反向过程由真实照片生成仿真图片风格的生成器，D_A为判别是否为真实图的判别器，D_B为判别是否为仿真图的判别器；下角标为f表示与掩码点乘提取出前景，下角标为b表示与掩码点乘提取出背景；E代表期望，α取值500，β取值250，γ取值1；