WO2022105308A1

WO2022105308A1 - 一种基于生成对抗级联网络增广图像的方法

Info

Publication number: WO2022105308A1
Application number: PCT/CN2021/110525
Authority: WO
Inventors: 袁杰; 程裕家; 金志斌; 周雪
Original assignee: 南京大学
Priority date: 2020-11-20
Filing date: 2021-08-04
Publication date: 2022-05-27
Also published as: CN112396110B; CN112396110A

Abstract

本发明公开了一种基于生成对抗级联网络增广图像的方法。包括：从原始图像I ori圈定感兴趣区域并裁剪，获得裁剪后的图像I cut；对I cut通过预处理获得增广后的数据集S cut；利用数据集S cut进行Ⅰ级生成对抗网络的训练；加载训练好的Ⅰ级生成器，输入随机噪声推理出图像，并对生成的图像通过上采样处理后，制作成新的数据集S Ⅰ；利用数据集S Ⅰ与I cut作为Ⅱ级生成对抗网络的训练数据集，进行Ⅱ级生成对抗网络的训练；加载训练好的Ⅱ级生成器，将数据集S Ⅰ输入Ⅱ级生成器，推理出所需的增广图像I des。本发明在对图像增广时，解决了Ⅰ级生成对抗网络中生成图像差异性小和分辨率低的问题，在增广图像的同时提高了网络的泛化性能。

Description

一种基于生成对抗级联网络增广图像的方法

技术领域

本发明涉及超声图像分析领域，尤其涉及一种基于生成对抗级联网络增广图像的方法。

背景技术

在深度学习的图像研究中，通常都依赖于大规模的数据集以避免过拟合问题的发生。当图像数据量严重不足时，通常采用传统图像增广方式进行图像增广，例如多次裁剪、添加高斯噪声、灰度均衡等。

这些传统图像增广方法在对现有数据集实现扩充的同时也给网络的训练带来了过拟合的风险。原因是通过这些传统的图像增广方法得到的图像与原始图像相关性极高，而且单级生成对抗网络生成的图像也存在一定的相似性且分辨率较低，这些方法并不能明显提高数据集样本的多样性。随着增广数据量的增加，数据集中雷同的数据项越来越多，最终导致网络过拟合，泛化性能差。

在深度学习领域中常常存在着图像数据量不足，或者图像种类不够丰富等情况，使用良好的图像增广方法往往能起到事半功倍甚至是决定性的作用；但与此同时，单一的图像增广方式也有可能会导致网络的过拟合，致使网络的泛化性能差；除此之外，单级生成对抗网络生成的图像存在图像之间相似度较高且分辨率低等问题。

发明内容

发明目的：本发明所要解决的技术问题是针对现有技术的不足，提供一种基于生成对抗级联网络增广图像的方法。

为了解决上述技术问题，本发明公开了一种基于生成对抗级联网络增广图像的方法，包括如下步骤：

步骤1，从原始图像I _ori圈定感兴趣区域并裁剪，获得裁剪后的图像I _cut；

步骤2，对裁剪的图像I _cut进行预处理以增广图像，获得增广后的数据集S _cut；

步骤3，利用所述增广后的数据集S _cut进行Ⅰ级生成对抗网络的训练，并验证测试，保存训练好的Ⅰ级判别器和Ⅰ级生成器；

步骤4，加载所述训练好的Ⅰ级生成器，通过输入随机噪声推理出图像，对推理出的图像运用上采样的方法进行后处理，制作成尺寸为W*L的图像并添加至新的数据集S _Ⅰ中；

步骤5，将步骤4制作的新的数据集S _Ⅰ与所述裁剪后的图像I _cut共同作为Ⅱ级生成对抗网络的训练集，进行Ⅱ级生成对抗网络训练，并验证测试，保存训练好的Ⅱ级判别器和Ⅱ级生成器；

步骤6，加载所述训练好的Ⅱ级生成器，输入经步骤4处理后的数据集S _Ⅰ，推理出增广图像I _des，所述增广图像I _des的尺寸为W*L；将具有一定先验信息的图像数据集S _Ⅰ作为Ⅱ级生成器的输入，获得的增广图像I _des相对于传统增广方式获得的图像更具有多样性。

进一步地，在一种实现方式中，所述步骤1包括：从所述原始图像I _ori中选择包含目标区域的图像子块并进行裁剪，获得裁剪后的图像I _cut，所述裁剪后的图像I _cut的尺寸为W*L，所述包含目标区域的图像子块即原始图像的感兴趣区域。

进一步地，在一种实现方式中，所述步骤2包括：所述预处理指对所述裁剪后的图像I _cut进行多抽样以增广图像，获得增广后的数据集S _cut；对图像进行多抽样起到图像增广的作用，增加了数据集图像数量，降低后续Ⅰ级生成对抗网络的训练难度。

进一步地，在一种实现方式中，所述步骤3包括：

步骤3-1，所述Ⅰ级生成对抗网络中所述Ⅰ级生成器后串接Ⅰ级判别器，输入随机噪声，经由Ⅰ级生成器后，生成Ⅰ级生成图像；

步骤3-2，训练Ⅰ级判别器，将通过所述步骤2获得的数据集S _cut添加到真实图像数据集S _Ⅰ,real，将所述真实图像数据集S _Ⅰ,real输入到Ⅰ级生成对抗网络中，和所述Ⅰ级生成图像一起作为Ⅰ级判别器的输入图像；将所述真实图像数据集S _Ⅰ,real中图像的标签设置为真，所述Ⅰ级生成图像的标签设置为假；Ⅰ级判别器的训练由两部分组成，第一部分是所述真实图像数据集S _Ⅰ,real中的图像判别为真，第二部分是所述Ⅰ级生成图像判别为假，在这两个过程中，将Ⅰ级判别器输出的损失函数值回传至Ⅰ级判别器，Ⅰ级生成器的网络参数不参与更新，只更新所述Ⅰ级判别器的网络参数；

步骤3-3，训练Ⅰ级生成器，将Ⅰ级生成图像输入到Ⅰ级判别器中，将所述Ⅰ级生成图像的标签设置为真；Ⅰ级生成器训练时，Ⅰ级判别器固定，将Ⅰ级生成器输出的损失函数值回传至Ⅰ级生成器，只更新所述Ⅰ级生成器的网络参数而保持Ⅰ级判别器的网络参数不变；

步骤3-4，由训练好的Ⅰ级生成器的网络参数和Ⅰ级判别器的网络参数生成训练好的Ⅰ级判别器和Ⅰ级生成器。

进一步地，在一种实现方式中，所述步骤4包括：

步骤4-1，将随机噪声输入步骤3所述Ⅰ级生成器，进行推理获得I级生成图像；

步骤4-2，利用上采样的方法将步骤4-1中获得的I级生成图像还原成步骤1裁剪后的图像尺寸W*L；所述上采样为基于插值的上采样；

步骤4-3，对插值后的图像用归一化、直方图均衡的方法和增加对比度进行处理，将处理后的图像添加至新的数据集S _Ⅰ中。

进一步地，在一种实现方式中，所述步骤5包括：

步骤5-1，将步骤4制作的新的数据集S _Ⅰ，输入Ⅱ级生成对抗网络的Ⅱ级生成器，经由Ⅱ级生成器后，生成Ⅱ级生成图像；

步骤5-2，训练Ⅱ级判别器，将步骤1裁剪后的图像I _cut添加到真实图像数据集S _Ⅱ,real，将所述真实图像数据集S _Ⅱ,real输入到Ⅱ级生成对抗网络中，和所述Ⅱ级生成图像一起作为Ⅱ级判别器的输入图像；将所述真实图像数据集S _Ⅱ,real中图像的标签设置为真，所述Ⅱ级生成图像的标签设置为假；Ⅱ级判别器的训练由两部分组成，第一部分是所述真实图像数据集S _Ⅱ,real中的图像判别为真，第二部分是所述Ⅱ级生成图像判别为假，在这两个过程中，将Ⅱ级判别器输出的损失函数值回传至Ⅱ级判别器，Ⅱ级生成器的网络参数不参与更新，只更新所述Ⅱ级判别器的网络参数；

步骤5-3，训练Ⅱ级生成器，将Ⅱ级生成图像输入到Ⅱ级判别器中，将所述Ⅱ级生成图像的标签设置为真；Ⅱ级生成器训练时，Ⅱ级判别器固定，将Ⅱ级生成器输出的损失函数值回传至Ⅱ级生成器，只更新所述Ⅱ级生成器的网络参数而保持Ⅱ级判别器的网络参数不变；

步骤5-4，由训练好的Ⅱ级生成器的网络参数和Ⅱ级判别器的网络参数生成训练好的Ⅱ级判别器和Ⅱ级生成器。

进一步地，在一种实现方式中，所述步骤3-2和步骤3-3中Ⅰ级判别器输出的损失函数值均包括Ⅰ级判别器的损失函数值和Ⅰ级生成器的损失函数值；所述Ⅰ级判别器的损失函数值包括对所述真实图像数据集S _Ⅰ,real中图像的误差计算结果和对Ⅰ级生成图像的误差计算结果之和，计算公式如下：

loss _real＝criterion(real _out,real _label)

loss _fake＝criterion(fake _out,fake _label)

loss _d＝loss _real+loss _fake

其中，loss _real为Ⅰ级判别器对真实图像数据集S _Ⅰ,real中图像得出的损失函数值，loss _fake为Ⅰ级判别器对Ⅰ级生成图像得出的损失函数值，real _label为真实图像数据集S _Ⅰ,real中图像的标签，该标签此时为1，real _out为真实图像数据集S _Ⅰ,real中具体图像；fake _out为Ⅰ级生成图像的具体图像，fake _label为Ⅰ级生成图像的标签，该标签此时为0，loss _d是经由Ⅰ级生成图像和真实图像数据集S _Ⅰ,real中图像的结果汇总之后所得到的Ⅰ级判别器的整体损失函数，criterion代表损失函数的计算方法；

所述Ⅰ级生成器的损失函数值是由真实图像数据集S _Ⅰ,real中图像的标签和Ⅰ级生成图像相结合计算获得，计算公式如下：

loss _g＝criterion(output,fack_label)

其中，loss _g是Ⅰ级生成器的损失函数，output代表Ⅰ级生成图像，fack_label代表真实图像数据集S _Ⅰ,real中图像的标签，该标签此时为0。

进一步地，在一种实现方式中，所述步骤3中，Ⅰ级生成器和Ⅰ级判别器均选用Adam优化器进行网络参数更新。

进一步地，在一种实现方式中，所述步骤5-2和步骤5-3中Ⅱ级判别器输出的损失函数值均包含Ⅱ级判别器的损失函数值和Ⅱ级生成器的损失函数值；所述Ⅱ级判别器的损失函数值包括对真实图像数据集S _Ⅱ,real中图像的误差计算结果和对Ⅱ级生成图像的误差计算结果之和，计算公式如下：

loss _Ⅱ,raal＝criterion(real _Ⅱ,out,real _Ⅱ,label)

loss _Ⅱ,fake＝criterion(fake _Ⅱ,out,fake _Ⅱ,label)

loss _Ⅱ,d＝loss _Ⅱ,real+loss _Ⅱ,fake

其中，loss _Ⅱ,real为Ⅱ级判别器对真实图像数据集S _Ⅱ,real中图像得出的损失函数值，loss _Ⅱ,fake为Ⅱ级判别器对Ⅱ级生成图像得出的损失函数值，real _Ⅱ,label为真实图像数据集S _Ⅱ,real中图像的标签，该标签此时为1，real _Ⅱ,out为真实图像数据集S _Ⅱ,real中具体图像；fake _Ⅱ,out为Ⅱ级生成图像的具体图像，fake _Ⅱ,label为Ⅱ级生成图像的标签，该标签此时为0，loss _Ⅱ,d是经由Ⅱ级生成图像和真实图像数据集S _Ⅱ,real中图像的结果汇总之后所得到的Ⅱ级判别器的整体损失函数，criterion代表损失函数的计算方法；

所述Ⅱ级生成器的损失函数是由真实图像数据集S _Ⅱ,real中图像的标签和Ⅱ级生成图像相结合计算获得，计算公式如下：

loss _Ⅱ,g＝criterion(output _Ⅱ,fack_label _Ⅱ)

其中，loss _Ⅱ,g是Ⅱ级生成器的损失函数，output _Ⅱ代表Ⅱ级生成图像，fack_label _Ⅱ代表真实图像数据集S _Ⅱ,real中图像的标签，该标签此时为0。

进一步地，在一种实现方式中，所述步骤5中，Ⅱ级生成器和Ⅱ级判别器均选用Adam优化器进行网络参数更新。

有益效果：本发明中，利用两级生成对抗网络级联生成增广图像，将Ⅰ级生成对抗网络生成的图像经过后处理，输入到Ⅱ级生成对抗网络，即利用Ⅱ级生成对抗网络将生成对抗网络中常以随机噪声作为输入改为将具有一定先验信息的图像作为输入，生成具有明显差异性和高分辨率的新图像，提高了图像增广的差异性和分辨率；相对于现有技术，本发明解决了仅利用现有图像样本进行深度学习研究的训练数据量不足的问题，并且避免了局限于传统增广方式而造成的网络过拟合问题；同时，解决了单级生成对抗网络生成的图像之间相似度较高且分辨率低等问题，提高了网络的泛化性能。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例部分提供的一种基于生成对抗级联网络增广图像的方法中Ⅰ级生成对抗网络的工作流程示意图；

图2是本发明实施例部分提供的一种基于生成对抗级联网络增广图像的方法中Ⅱ级生成对抗网络的工作流程示意图；

图3是本发明实施例部分提供的一种基于生成对抗级联网络增广图像的方法中Ⅰ级生成对抗网络的Ⅰ级生成器(G)和Ⅰ级判别器(D)的神经网络架构示意图；

图4是本发明实施例部分提供的一种基于生成对抗级联网络增广图像的方法中Ⅱ级生成对抗网络的Ⅱ级生成器(G)和Ⅱ级判别器(D)的神经网络架构示意图；

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明实施例公开一种基于生成对抗级联网络增广图像的方法，本方法应用于关节炎超声图像的增广研究，由于该病的患病人群较少，可供研究的样本不足，进而导致超声图像的相关研究迟缓。

本实施例所述的一种基于生成对抗级联网络增广图像的方法，包括如下步骤：

步骤1，从原始图像I _ori圈定感兴趣区域并裁剪，获得裁剪后的图像I _cut；本实施例中，可以采用Matlab软件圈定原始图像感兴趣区域并进行确定尺寸裁剪，从而获得裁剪后的图像I _cut。

步骤2，对裁剪的图像I _cut进行预处理增广图像，获得增广后的数据集S _cut；本实施例中，所述预处理指图像抽样。

步骤3，利用所述增广后的数据集S _cut进行Ⅰ级生成对抗网络的训练，并验证测试，保存训练好的Ⅰ级判别器和Ⅰ级生成器。本实施例中，所述生成对抗网络(Generative Adversarial Networks,GAN)为通过生成器(G)和判别器(D)形成的网络；所述生成对抗级联网络是将两个生成对抗网络(Ⅰ级生成对抗网络和Ⅱ级生成对抗网络)经过级联形成的组合网络。

步骤4，加载所述训练好的Ⅰ级生成器，通过输入随机噪声推理出图像，对推理出的图像运用上采样的方法进行后处理，制作成尺寸为W*L的图像并添加至新的数据集S _Ⅰ中。本实施例中，数据集S _Ⅰ中包含720幅图像。

步骤5，将步骤4制作的新的数据集S _Ⅰ与步骤1裁剪后的图像I _cut共同作为Ⅱ级生成对抗网络的训练集，进行Ⅱ级生成对抗网络训练，并验证测试，保存训练好的Ⅱ级判别器和Ⅱ级生成器。本步骤中，所述的Ⅱ级生成对抗网络的训练集指步骤1中裁剪后的图像I _cut和步骤4中制作的新的数据集S _Ⅰ共同获得的数据集。

步骤6，加载所述训练好的Ⅱ级生成器，输入经步骤4处理后的数据集S _Ⅰ，推理出增广图像I _des，所述增广图像I _des的尺寸为W*L。本步骤中，所述的Ⅱ级生成器指步骤5中保存的生成器。

本实施例所述的一种基于生成对抗级联网络增广图像的方法中，所述步骤1包括：从所述原始图像I _ori中选择包含目标区域的图像子块并进行裁剪，获得裁剪后的图像I _cut，所述裁剪后的图像I _cut的尺寸为W*L，所述包含目标区域的图像子块即原始图像的感兴趣区域。

具体的，本步骤中，后续的处理都针对这个感兴趣区域以减少处理时间、提高精度。本实施例中，使用的原始图像I _ori是由医学超声成像设备采集得到的关节炎患病部位图像，共有720幅，图像的成像深度根据采集设备的不同而有所区别。所述原始图像的分辨率为1024*768，单位为像素，为了剔除所述原始图像的无效区域，减少生成对抗网络的计算量和计算时间，利用Matlab软件对原始图像中包含目标区域为滑膜所在位置的图像子块进行裁剪，裁剪后的图像I _cut的尺寸为512*128，将裁剪后的图像I _cut作为训练样本，共有720幅。

本实施例中，所述步骤2包括：对裁剪的图像I _cut进行多抽样以增广图像，获得增广后的数据集S _cut；

具体的，本实施例中，对裁剪得到的512*128的图像分别按照宽度方向8抽样和高度方向2抽样的方法抽样成大小为64*64的图像。本实施例中，通过多抽样的方式，使图像样本数量增广为原来的16倍。

本实施例中，所述步骤3包括：

步骤3-2，训练I级判别器，将通过所述步骤2获得的数据集S _cut添加到真实图像数据集S _I，real，将所述真实图像数据集S _I，real输入到I级生成对抗网络中，和所述I级生成图像一起作为I级判别器的输入图像；将所述真实图像数据集S _I，real中图像的标签设置为真，所述I级生成图像的标签设置为假；I级判别器的训练由两部分组成，第一部分是所述真实图像数据集S _I，real中的图像判别为真，第二部分是所述I级生成图像判别为假，在这两个过程中，将I级判别器输出的损失函数值回传至I级判别器，I级生成器的网络参数不参与更新，只更新所述I级判别器的网络参数；

步骤3-3，训练I级生成器，将I级生成图像输入到I级判别器中，将所述I级生成图像的标签设置为真；I级生成器训练时，I级判别器固定，将I级生成器输出的损失函数值回传至I级生成器，只更新所述I级生成器的网络参数而保持I级判别器的网络参数不变；

本实施例中，步骤3-2和步骤3-3中I级判别器输出的损失函数值均包含I级判别器的损失函数值和I级生成器的损失函数值；I级判别器的损失函数包括两个部分，为对真实图像的误差计算结果和对生成图像的误差计算结果之和。其中，在Pytorch下，损失函数的计算方法为BCEloss：

loss _real＝criterion(real _out，real _label)

loss _fake＝criterion(fake _out，fake _label)

loss _d＝loss _real+loss _fake

其中，loss _real为I级判别器对真实图像数据集S _I，real中图像得出的损失函数值，loss _fake为I级判别器对I级生成图像得出的损失函数值，real _label为真实图像数据集S _I，real中图像的标签，该标签此时为1，real _out为真实图像数据集S _I，real中图像的具体图像；fake _out为I级生成图像的具体图像，fake _label为I级生成图像的标签，该标签此时为0，loss _d是经由I级生成图像和真实图像数据集S _I，real中图像的结果汇总之后所得到的I级判别器的整体损失函数，criterion代表损失函数的计算方法，本质上是一种仿函数，本实施例中使用的计算方法是BCEloss。

I级生成器的损失函数则是以真实图像数据集S _I，real中图像的标签和I级生成图像相结合，以BCEloss来计算损失函数，本实施例中，真实图像的标签即在I级生成对抗网络中记为0：

loss _g＝criterion(output,fack_label)

其中，loss _g是Ⅰ级生成器的损失函数，output代表Ⅰ级生成图像，fack_label代表真实图像数据集S _Ⅰ,real中图像的标签，该标签此时为0，criterion代表损失函数的计算方法，本质上是一种仿函数，本实施例中使用的计算方法是BCEloss。

此外，由于卷积神经网络的需要，Ⅰ级生成器和Ⅰ级判别器均需要选择合适的优化算法，保证Ⅰ级生成器的损失函数和Ⅰ级判别器的损失函数在极大值收敛的同时，防止损失函数值的发散。具体的实现上，Ⅰ级生成器和Ⅰ级判别器选用了Adam优化器进行网络参数更新。本实施例中，每轮训练送入Ⅰ级生成对抗网络中的训练样本的数量batch_size＝32，训练迭代次数epoch＝200，学习速率lr＝0.0002，输入Ⅰ级生成器的随机噪声的维度z_dimension＝100。

本实施例中，所述步骤3中利用步骤2中增广后的数据集S _cut作为训练样本，通过Ⅰ级生成对抗网络进行训练。其中，Ⅰ级生成对抗网络的基本流程图如图1所示，Ⅰ级生成器(G)和Ⅰ级判别器(D)的神经网络架构如图3所示。运用所述Ⅰ级生成器和I级判别器的神经网络架构，通过训练所有样本得到一组训练后的Ⅰ级判别器和Ⅰ级生成器，其中Ⅰ级判别器的网络参数如表1所示，Ⅰ级生成器的网络参数如表2所示。

表1 Ⅰ级判别器的网络参数

网络层类型	网络输出尺寸
卷积层Conv2d-1	[32，64，32，32]
卷积层Conv2d-2	[32，128，16，16]
卷积层Conv2d-3	[32，256，8，8]
卷积层Conv2d-4	[32，512，4，4]
Linear-5	[32，1]

表2 Ⅰ级生成器的网络参数

网络层类型	网络输出尺寸
逆卷积层ConvTranspose2d-1	[32，512，4，4]
逆卷积层ConvTranspose2d-2	[32，256，8，8]
逆卷积层ConvTranspose2d-3	[32，128，16，16]
逆卷积层ConvTranspose2d-4	[32，64，32，32]
逆卷积层ConvTranspose2d-5	[32，3，64，64]

本实施例所述的一种基于生成对抗级联网络增广图像的方法中，所述步骤4包括：

步骤4-1，将随机噪声输入步骤3所述训练后的Ⅰ级生成器，进行推理获得I级生成图像；

本实施例中，Ⅰ级生成器生成图像尺寸为64*64，利用Matlab的interp2函数在图像长度方向和高度方向分别做8倍以及2倍插值，将图像还原为512*128的尺寸。

本实施例中，将插值后的大小为512*128的图像利用Matlab做归一化、直方图均衡处理，增加图像的对比度，提升图像质量。

本实施例所述的一种基于生成对抗级联网络增广图像的方法中，所述步骤5包括：

步骤5-3，训练II级生成器，将II级生成图像输入到II级判别器中，将所述II级生成图像的标签设置为真；II级生成器训练时，II级判别器固定，将II级生成器输出的损失函数值回传至II级生成器，只更新所述II级生成器的网络参数而保持II级判别器的网络参数不变；

本实施例中，步骤5-2和步骤5-3中II级判别器输出的损失函数值均包含II级判别器的损失函数值和II级生成器的损失函数值；所述II级判别器的损失函数包括两个部分，为对真实图像的误差计算结果和对生成图像的误差计算结果之和。其中，在Pytorch下，损失函数的计算方法为BCEloss：

loss _II，real＝criterion(real _II，out，real _II，label)

loss _II，fake＝criterion(fake _II，out，fake _II，label)

loss _II，d＝loss _II， _real+loss _II，fake

其中，loss _lI，real为II级判别器对真实图像数据集S _II，real中图像得出的损失函数值，loss _II，fake为II级判别器对II级生成图像得出的损失函数值，real _II，label为真实图像数据集S _II，real中图像的标签，该标签此时为1，real _II，out为真实图像数据集S _II，real中图像的具体图像；fake _II，out为II级生成图像的具体图像，fake _II，label为II级生成图像的标签，该标签此时为0，loss _II，d是经由II级生成图像和真实图像数据集S _II，real中图像的结果汇总之后所得到的II级判别器的整体损失函数，criterion代表损失函数的计算方法，本质上是一种仿函数，本实施例中使用的计算方法是BCEloss。

II级生成器的损失函数则是以真实图像数据集S _II，real中图像的标签和II级生成图像相结合，以BCEloss来计算损失函数，本实施例中，真实图像的标签即在II级生成对抗网络中记为0：

loss _II，g＝criterion(output _II，fack_label _II)

其中，loss _II，g是II级生成器的损失函数，output _II代表II级生成图像，fack_label _II 代表真实图像数据集S _Ⅱ,real中图像的标签，该标签此时为0，criterion代表损失函数的计算方法，本质上是一种仿函数，本实施例中使用的计算方法是BCEloss。

此外，由于卷积神经网络的需要，Ⅱ级生成器和Ⅱ级判别器均需要选择合适的优化算法，保证Ⅱ级生成器的损失函数和Ⅱ级判别器的损失函数在极大值收敛的同时，防止损失函数值的发散。具体的实现上，Ⅱ级生成器和Ⅱ级判别器选用了Adam优化器进行网络参数更新。本实施例中，每轮训练送入Ⅱ级生成对抗网络中的训练样本的数量batch_size＝16，训练迭代次数epoch＝200，学习速率lr＝0.0003。

本实施例中，将步骤4生成并处理后的512*128的图像作为Ⅱ级生成对抗网络的Ⅱ级生成器的输入，将其与步骤1裁剪后的512*128的图像共同作为Ⅱ级生成对抗网络的Ⅱ级判别器的输入，进行Ⅱ级生成对抗网络的对抗训练，其中，Ⅱ级生成对抗网络的基本流程图如图2所示，Ⅱ级生成器(G)和Ⅱ级判别器(D)的神经网络架构如图4所示。运用所述Ⅱ级生成器和Ⅱ级判别器的神经网络架构，通过训练所有样本得到一组训练后的Ⅱ级判别器和Ⅱ级生成器，其中Ⅱ级判别器的网络参数如表3所示，Ⅱ级生成器的网络参数如表4所示。

表3 Ⅱ级判别器网络参数

网络层类型	网络输出尺寸
卷积层Conv2d-1	[16，32，64，256]
池化层AvgPool2d-2	[16，32，32，128]
卷积层Conv2d-3	[16，64，32，128]
池化层AvgPool2d-4	[16，64，16，64]
卷积层Conv2d-5	[16，128，16，64]
池化层AvgPool2d-6	[16，128，8，32]
卷积层Conv2d-7	[16，256，8，32]
池化层AvgPool2d-8	[16，256，4，16]
Linear-9	[16，1]

表4 Ⅱ级生成器网络参数

网络层类型	网络输出尺寸
卷积层Conv2d-1	[16，200，128，512]
卷积层Conv2d-2	[16，100，128，512]
卷积层Conv2d-3	[16，50，128，512]
卷积层Conv2d-4	[16，25，128，512]
卷积层Conv2d-5	[16，3，128，512]

本实施例所述的一种基于生成对抗级联网络增广图像的方法中，所述步骤6中将步骤4制作的新的数据集S _Ⅰ，输入步骤5训练后的Ⅱ级生成器，从而进行推理，得到512*128的高分辨率图像，达到数据增广的目的。

本发明中，将Ⅰ级生成对抗网络生成的图像经过后处理，输入到Ⅱ级生成对抗网络，生成具有明显差异性和高分辨率的新图像，提高了图像增广的差异性和分辨率，相对于现有技术，本发明解决了仅利用现有图像样本进行深度学习研究的训练数据量不足的问题，并且避免了局限于传统增广方式而造成的网络过拟合问题；同时，解决了Ⅰ级生成对抗网络生成的图像之间相似度较高且分辨率低等问题，提高了网络的泛化性能。

本发明提出了一种基于生成对抗级联网络增广图像的方法，应当指出，所需的超声设备种类不对本专利构成限制；所采集的超声图像规模、尺寸和分辨率不对本专利构成限制；所采集的图像内容不对本专利构成限制。应当指出，对于本技术领域的普通人员来说，在不脱离发明原理的前提下还可以做出若干改进和润饰，这些也应视为本发明的保护范围。另外，本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims

一种基于生成对抗级联网络增广图像的方法，其特征在于，包括如下步骤：

步骤1，从原始图像I _ori圈定感兴趣区域并裁剪，获得裁剪后的图像I _cut，所述裁剪后的图像I _cut的尺寸为W*L；

步骤2，对裁剪的图像I _cut进行预处理以增广图像，获得增广后的数据集S _cut；

步骤3，利用所述增广后的数据集S _cut进行Ⅰ级生成对抗网络的训练，并验证测试，保存训练好的Ⅰ级判别器和Ⅰ级生成器；

步骤4，加载所述训练好的Ⅰ级生成器，通过输入随机噪声推理出图像，对推理出的图像运用上采样的方法进行后处理，制作成尺寸为W*L的图像并添加至新的数据集S _Ⅰ中；

步骤5，将新的数据集S _Ⅰ与所述裁剪后的图像I _cut共同作为Ⅱ级生成对抗网络的训练集，进行Ⅱ级生成对抗网络训练，并验证测试，保存训练好的Ⅱ级判别器和Ⅱ级生成器；

步骤6，加载所述训练好的Ⅱ级生成器，输入经步骤4处理后的数据集S _Ⅰ，推理出增广图像I _des，所述增广图像I _des的尺寸为W*L。
根据权利要求1所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤1包括：从所述原始图像I _ori中选择包含目标区域的图像子块并进行裁剪，获得裁剪后的图像I _cut，所述裁剪后的图像I _cut的尺寸为W*L，所述包含目标区域的图像子块即原始图像的感兴趣区域。
根据权利要求1所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤2中，所述预处理指对所述裁剪后的图像I _cut进行多抽样以增广图像，获得增广后的数据集S _cut。
根据权利要求1所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤3包括：

步骤3-1，所述Ⅰ级生成对抗网络中所述Ⅰ级生成器后串接Ⅰ级判别器，输入随机噪声，经由Ⅰ级生成器后，生成Ⅰ级生成图像；

步骤3-2，训练Ⅰ级判别器，将通过所述步骤2获得的数据集S _cut添加到真实图像数据集S _Ⅰ,real，将所述真实图像数据集S _Ⅰ,real输入到Ⅰ级生成对抗网络中，和所述Ⅰ级生成图像一起作为Ⅰ级判别器的输入图像；将所述真实图像数据集S _Ⅰ,real中图像的标签设置为真，所述Ⅰ级生成图像的标签设置为假；Ⅰ级判别器的训练由两部分组成，第一部分是所述真实图像数据集S _Ⅰ,real中的图像判别为真，第二部分是所述Ⅰ级生成图像判别为假，在这两个过程中，将Ⅰ级判别器输出的损失函数值回传至Ⅰ级判别器，Ⅰ级生成器的网络参数不参与更新，只更新所述Ⅰ级判别器的网络参数；

步骤3-3，训练Ⅰ级生成器，将Ⅰ级生成图像输入到Ⅰ级判别器中，将所述Ⅰ级生成图像的标签设置为真；Ⅰ级生成器训练时，Ⅰ级判别器固定，将Ⅰ级生成器输出的损失函数值回传至Ⅰ级生成器，只更新所述Ⅰ级生成器的网络参数而保持Ⅰ级判别器的网络参数不变；

步骤3-4，由训练好的Ⅰ级生成器的网络参数和Ⅰ级判别器的网络参数生成训练好的Ⅰ级判别器和Ⅰ级生成器。
根据权利要求1所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤4包括：

步骤4-1，将随机噪声输入步骤3所述训练好的Ⅰ级生成器，进行推理获得I级生成图像；

步骤4-2，利用上采样的方法将步骤4-1中获得的I级生成图像还原成步骤1裁剪后的图像尺寸W*L；所述上采样为基于插值的上采样；

步骤4-3，对插值后的图像用归一化、直方图均衡的方法和增加对比度进行处理，将处理后的图像添加至新的数据集S _Ⅰ中。
根据权利要求1所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤5包括：

步骤5-1，将步骤4制作的新的数据集S _Ⅰ，输入Ⅱ级生成对抗网络的Ⅱ级生成器，经由Ⅱ级生成器后，生成Ⅱ级生成图像；

步骤5-2，训练Ⅱ级判别器，将步骤1裁剪后的图像I _cut添加到真实图像数据集S _Ⅱ,real，将所述真实图像数据集S _Ⅱ,real输入到Ⅱ级生成对抗网络中，和所述Ⅱ级生成图像一起作为Ⅱ级判别器的输入图像；将所述真实图像数据集S _Ⅱ,real中图像的标签设置为真，所述Ⅱ级生成图像的标签设置为假；Ⅱ级判别器的训练由两部分组成，第一部分是所述真实图像数据集S _Ⅱ,real中的图像判别为真，第二部分是所述Ⅱ级生成图像判别为假，在这两个过程中，将Ⅱ级判别器输出的损失函数值回传至Ⅱ级判别器，Ⅱ级生成器的网络参数不参与更新，只更新所述Ⅱ级判别器的网络参数；

步骤5-3，训练Ⅱ级生成器，将Ⅱ级生成图像输入到Ⅱ级判别器中，将所述Ⅱ级生成图像的标签设置为真；Ⅱ级生成器训练时，Ⅱ级判别器固定，将Ⅱ级生成器输出的损失函数值回传至Ⅱ级生成器，只更新所述Ⅱ级生成器的网络参数而保持Ⅱ级判别器的网络参数不变；

步骤5-4，由训练好的Ⅱ级生成器的网络参数和Ⅱ级判别器的网络参数生成训练好的Ⅱ级判别器和Ⅱ级生成器。
根据权利要求4所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤3-2和步骤3-3中Ⅰ级判别器输出的损失函数值均包括Ⅰ级判别器的损失函数值和Ⅰ级生成器的损失函数值；所述Ⅰ级判别器的损失函数值包括对所述真实图像数据集S _Ⅰ,real中图像的误差计算结果和对Ⅰ级生成图像的误差计算结果之和，计算公式如下：

loss _real＝criterion(real _out,real _label)

loss _fake＝criterion(fake _out,fake _label)

loss _d＝loss _real+loss _fake

其中，loss _real为Ⅰ级判别器对真实图像数据集S _Ⅰ,real中图像得出的损失函数值，loss _fake为Ⅰ级判别器对Ⅰ级生成图像得出的损失函数值，real _label为真实图像数据集S _Ⅰ,real中图像的标签，该标签此时为1，real _out为真实图像数据集S _Ⅰ,real中具体图像；fake _out为Ⅰ级生成图像的具体图像，fake _label为Ⅰ级生成图像的标签，该标签此时为0，loss _d是经由Ⅰ级生成图像和真实图像数据集S _Ⅰ,real中图像的结果汇总之后所得到的Ⅰ级判别器的整体损失函数，criterion代表损失函数的计算方法；

所述Ⅰ级生成器的损失函数值是由真实图像数据集S _Ⅰ,real中图像的标签和Ⅰ级生成图像相结合计算获得，计算公式如下：

loss _g＝criterion(output,fack_label)

其中，loss _g是Ⅰ级生成器的损失函数，output代表Ⅰ级生成图像，fack_label代表真实图像数据集S _Ⅰ,real中图像的标签，该标签此时为0。
根据权利要求7所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤3中，Ⅰ级生成器和Ⅰ级判别器均选用Adam优化器进行网络参数更新。
根据权利要求6所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤5-2和步骤5-3中Ⅱ级判别器输出的损失函数值均包含Ⅱ级判别器的损失函数值和Ⅱ级生成器的损失函数值；所述Ⅱ级判别器的损失函数值包括对真实图像数据集S _Ⅱ,real中图像的误差计算结果和对Ⅱ级生成图像的误差计算结果之和，计算公式如下：

loss _Ⅱ,real＝criterion(real _Ⅱ,out,real _Ⅱ,label)

loss _Ⅱ,fake＝criterion(fake _Ⅱ,out,fake _Ⅱ,label)

loss _Ⅱ,d＝loss _Ⅱ,real+loss _Ⅱ,fake

其中，loss _Ⅱ,real为Ⅱ级判别器对真实图像数据集S _Ⅱ,real中图像得出的损失函数值，loss _Ⅱ,fake为Ⅱ级判别器对Ⅱ级生成图像得出的损失函数值，real _Ⅱ,label为真实图像数据集S _Ⅱ,real中图像的标签，该标签此时为1，real _Ⅱ,out为真实图像数据集S _Ⅱ,real中具体图像；fake _Ⅱ,out为Ⅱ级生成图像的具体图像，fake _Ⅱ,label为Ⅱ级生成图像的标签，该标签此时为0，loss _Ⅱ,d是经由Ⅱ级生成图像和真实图像数据集S _Ⅱ,real中图像的结果汇总之后所得到的Ⅱ级判别器的整体损失函数，criterion代表损失函数的计算方法；

所述Ⅱ级生成器的损失函数是由真实图像数据集S _Ⅱ,real中图像的标签和Ⅱ级生成图像相结合计算获得，计算公式如下：

loss _Ⅱ,g＝criterion(output _Ⅱ,fack_label _Ⅱ)

其中，loss _Ⅱ,g是Ⅱ级生成器的损失函数，output _Ⅱ代表Ⅱ级生成图像，fack_label _Ⅱ代表真实图像数据集S _Ⅱ,real中图像的标签，该标签此时为0。
根据权利要求9所述的一种基于生成对抗级联网络增广图像的方法，其特征在于，所述步骤5中，Ⅱ级生成器和Ⅱ级判别器均选用Adam优化器进行网络参数更新。