CN109920512B

CN109920512B - 一种三维剂量分布网络模型的训练方法及装置

Info

Publication number: CN109920512B
Application number: CN201910155163.XA
Authority: CN
Inventors: 周琦超; 王文琪
Original assignee: Fujian Pilot Free Trade Zone Xiamen Area Manteia Data Technology Co ltd
Current assignee: Fujian Pilot Free Trade Zone Xiamen Area Manteia Data Technology Co ltd
Priority date: 2019-02-28
Filing date: 2019-02-28
Publication date: 2023-06-06
Anticipated expiration: 2039-02-28
Also published as: CN109920512A

Abstract

本发明公开了一种三维剂量分布网络模型的训练方法及装置，其中，所述方法包括：获取训练数据集，所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像；将所述训练数据集进行预处理，获取预处理后的训练数据集；构建待训练生成式对抗网络模型；将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练，直至收敛。在本发明实施例中，可以有效的防止在训练过程中的过度拟合问题，使训练得到的模型具有更强的泛化能力，且模型具有更好的稳定性。

Description

一种三维剂量分布网络模型的训练方法及装置

技术领域

本发明涉及人工智能技术领域，尤其涉及一种三维剂量分布网络模型的训练方法及装置。

背景技术

生成对抗性网络模型已经广泛应用在图像分类、语音识别和人脸识别等领域中，并带来了相关领域的革命性进步；将生成对抗性网络模型应用在医学图像进行3D剂量预测上时，当前的训练方式的不符合医学上的判别方式，采用现有的训练方法训练的模型不适用于医学上的实际使用场景，且现有的模型在训练的时候，容易发生过度拟合、需要训练的样本较多等问题，这样将直接导致模型训练效率较低。

发明内容

本发明的目的在于克服现有技术的不足，本发明提供了一种三维剂量分布网络模型的训练方法及装置，可以有效的防止在训练过程中的过度拟合问题，使训练得到的模型具有更强的泛化能力，且模型具有更好的稳定性。

为了解决上述技术问题，本发明实施例提供了一种三维剂量分布网络模型的训练方法，所述方法包括：

获取训练数据集，所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像；

将所述训练数据集进行预处理，获取预处理后的训练数据集；

构建待训练生成式对抗网络模型；

将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练，直至收敛。

可选的，所述将所述训练数据集进行预处理，获取预处理后的训练数据集，包括：

对所述训练数据集中的三维放射剂量计划处方数值图像进行归一化处理，获得处理后的训练数据集；

其中，归一化的公式如下：

其中，x^*表示归一化后的三维放射剂量计划处方数值图像的任意一点的数值，x表示为三维放射剂量计划处方数值图像的任意一点的数值，x_max表示三维放射剂量计划处方数值图像中的最大数值，x_min表示三维放射剂量计划处方数值图像中的最小数值。

可选的，所述待训练生成式对抗网络模型包括生成器和判别器；其中，

所述生成器为Unet结构，所述生成器依次包括三个下采样模块、中间模块和三个上采样器；

所述判别器依次包括四个步长为2的下采样层、全连接层和Sigmoid层。

可选的，所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练之间，还包括：

确定训练使用的评价指标为伽马传递率矩阵；

确定训练使用的损失函数为对抗损失函数和重建损失函数共同构建的损失函数；

对所述待训练生成式对抗网络模型的参数进行随机初始化，且在训练过程中使用Adam优化器，训练过程中使用批量归一化，批量尺寸设为32。

可选的，所述对抗损失函数和重建损失函数共同构建的损失函数的公式如下：

其中，V(G,D)为对抗损失函数，公式如下：

其中，G表示待训练生成式对抗网络模型中的生成器；D表示待训练生成式对抗网络模型中的判别器；y～P_data(y)表示y为训练过程中使用的实际三维放射剂量数值，P_data(y)表示训练数据服从的概率分布；z～P_Z(z)表示z为勾画后的三维靶区图像，P_Z(z)为勾画后的三维靶区图像服从的概率分布；E表示期望；λ表示正则参数。

可选的，所述Adam优化器的参数中学习率设置为0.0002，一阶矩阵估计的指数衰减率β₁为0.5，二阶矩阵估计的指数衰减率β₂为0.999。

可选的，所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练，直至收敛，包括：

将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练，获得训练后的生成式对抗网络模型；

利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型；

使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像；

将所述预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果；

将生成器和判别器得到的结果代入对抗损失函数中，判断对抗损失函数输出结果是否低于预设阈值，若是，则训练结束；

若否，判断当前训练次数是否达到预设训练最大次数，若是，则训练结束；

若否，通过反向传播算法更新权重，并采用所述预处理后的训练数据集进行重新训练，直至收敛或达到预设训练最大次数；

其中，所述判别器在进行目标预测判别时，当输入为预测的三维剂量预测数值图像，期望判别器输出的结果为0，当输入为对应的三维放射剂量计划处方数值图像时，期望判别器输出的结果为1；所述生成器在进行目标预测生成时，期望输出预测的三维剂量预测数值图像在判别器输出的结果为1。

可选的，所述将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练，获得训练后的生成式对抗网络模型，包括：

将所述训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练，生成训练三维剂量预测数值图像；

将所述训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练，获得训练后的生成式对抗网络模型。

可选的，所述通过反向传播算法更新权重包括：

使用反向传播算法依次对判别器和生成器进行训练；

首先对判别器进行训练，需要对所述生成器的权重进行冻结，通过反向传播算法更新待训练生成式对抗网络模型中的判别器的权重；

然后对生成器进行训练，通过反向传播算法更新待训练生成式对抗网络模型中的生成器和判别器的权重。

另外，本发明实施例还提供了一种三维剂量分布网络模型的训练装置，所述装置包括：

数据获取模块：用于获取训练数据集，所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像；

预处理模块：用于将所述训练数据集进行预处理，获取预处理后的训练数据集；

模型构建模块：用于构建待训练生成式对抗网络模型；

训练模块：用于将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练，直至收敛。

在本发明具体实施例中，通过构建新的待训练生成式对抗网络模型，以对训练数据集的预处理，可以有效的防止在训练过程中的过度拟合问题，使训练得到的模型具有更强的泛化能力，且模型具有更好的稳定性。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实际了解到。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见的，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例中的三维剂量分布网络模型的训练方法的流程示意图；

图2是本发明实施例中的三维剂量分布网络模型的训练装置的结构组成示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例

请参阅图1，图1是本发明实施例中的三维剂量分布网络模型的训练方法的流程示意图。

如图1所示，一种三维剂量分布网络模型的训练方法，所述方法包括：

S11：获取训练数据集，所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像；

在本发明具体实施过程中，训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像；其中，勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像均来源于医院；其中，勾画后的三维靶区图像来源于医院患者的经过勾画后的三维CT图像；通过临床勾画对CT图像的体素(尺寸为4mm*4mm*2mm的3D像素)进分类，包括OARs(organs at risk，危急器官)和PTVs(planning target volumes，计划靶区)；三维CT图像的每一个体素都被赋予特定的颜色，用来表示不同的器官或者目标体积，并且如果一个体素同时被分类为PTVs和OARs的情况时，将该体素视为PTVs；将所有未分类的组织留作原始CT图像灰度，训练数据集中的勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像是肿瘤专家给出的三维剂量临床处方数据图像，包括分别针对总疾病，中度风险和选择性计划靶区分别为70Gy，63Gy和56Gy的处方。其中Gy为戈瑞，表示吸收剂量单位，定义为每1千克被照射物吸收辐射的能量为1J(焦耳)。

S12：将所述训练数据集进行预处理，获取预处理后的训练数据集；

在本发明具体实施过程中，所述将所述训练数据集进行预处理，获取预处理后的训练数据集，包括：对所述训练数据集中的三维放射剂量计划处方数值图像进行归一化处理，获得处理后的训练数据集；其中，归一化的公式如下：

具体的，考虑到后续加快训练的速度和提升训练的稳定性，在本发明中采用归一化的公式将训练数据集中的三维放射剂量计划处方数值图像进行归一化处理，将三维放射剂量计划处方数值图像中的数值归一化至[0,1]的范围。

S13：构建待训练生成式对抗网络模型；

在本发明具体实施过程中，所述待训练生成式对抗网络模型包括生成器和判别器；其中，所述生成器为Unet结构，所述生成器依次包括三个下采样模块、中间模块和三个上采样器；所述判别器依次包括四个步长为2的下采样层、全连接层和Sigmoid层。

具体的，构建的待训练生成式对抗网络模型包括生成器和判别器两个部分；其中生成器为Unet结构，包括三个下采样模块，一个中间模块和三个上采样模块；各个模块的结构如表1所示。

表1

三个相同结构的下采样模块的相互堆叠可以更好的处理输入的图片，提取到具有最佳表达能力的特征；卷积层间使用了丢失率为0.25的Dropout层来防止生成器过拟合；这主要是因为医学数据的训练样本较少，通过在生成网络中增加正则化模块，可以使训练得到的网络具有更强的泛化能力；中间模块依次采用了卷积核为3，扩张率为2和4的空洞卷积，通过这种方式增大了网络的感受野，避免了采用池化方法导致的较多信息丢失。后面接了一个5x1和1x5的非对称卷积，相比于直接使用5x5的卷积减少了计算量，同时引入的不同尺度的卷积，可以得到不同空间维度的特征。上采样模块采用双线性插值和1x1卷积来扩大特征图尺寸；通过Concat层将前面下采样模块的输出和当前上采样的特征融合在一起，使得输出包含更多的原始图像的信息，结果更为准确。

判别器包含四个步长为2的下采样层，如表2所示。

表2

在判别器中的下采样层与生成器的下采样模块不同在于，判别器的下采样层不需要使用Dropout层来防止网络过拟合，然后通过全连接成将特征图输出为判断标志，通过Sigmoid层将判断标志限制在0～1的范围。

S14：将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练，直至收敛。

在本发明具体实施过程中，所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练之间，还包括：确定训练使用的评价指标为伽马传递率矩阵；确定训练使用的损失函数为对抗损失函数和重建损失函数共同构建的损失函数；对所述待训练生成式对抗网络模型的参数进行随机初始化，且在训练过程中使用Adam优化器，训练过程中使用批量归一化，批量尺寸设为32。

进一步的，所述对抗损失函数和重建损失函数共同构建的损失函数的公式如下：

其中，V(G,D)为对抗损失函数，公式如下：

进一步的，所述Adam优化器的参数中学习率设置为0.0002，一阶矩阵估计的指数衰减率β₁为0.5，二阶矩阵估计的指数衰减率β₂为0.999。

具体的，在训练之前，首先需要设置训练使用的损失函数和训练采用的优化器的学习率，在具体实施过程中，设置的损失函数是由对抗损失函数和重建损失函数共同构成的损失函数，具体的损失函数公式如下：

其中，V(G,D)为对抗损失函数，公式如下：

训练时，采用的优化器为Adam优化器，该优化器的参数中学习率设置为0.0002，一阶矩阵估计的指数衰减率β₁为0.5，二阶矩阵估计的指数衰减率β₂为0.999。

在本发明具体实施过程中，所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练，直至收敛，包括：将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练，获得训练后的生成式对抗网络模型；利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型；使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像；将所述预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果；将生成器和判别器得到的结果代入对抗损失函数中，判断对抗损失函数输出结果是否低于预设阈值，若是，则训练结束；若否，判断当前训练次数是否达到预设训练最大次数，若是，则训练结束；若否，通过反向传播算法更新权重，并采用所述预处理后的训练数据集进行重新训练，直至收敛或达到预设训练最大次数；其中，所述判别器在进行目标预测判别时，当输入为预测的三维剂量预测数值图像，期望判别器输出的结果为0，当输入为对应的三维放射剂量计划处方数值图像时，期望判别器输出的结果为1；所述生成器在进行目标预测生成时，期望输出预测的三维剂量预测数值图像在判别器输出的结果为1。

进一步的，所述将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练，获得训练后的生成式对抗网络模型，包括：将所述训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练，生成训练三维剂量预测数值图像；将所述训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练，获得训练后的生成式对抗网络模型。

进一步的，所述通过反向传播算法更新权重包括：使用反向传播算法依次对判别器和生成器进行训练；首先对判别器进行训练，需要对所述生成器的权重进行冻结，通过反向传播算法更新待训练生成式对抗网络模型中的判别器的权重；然后对生成器进行训练，通过反向传播算法更新待训练生成式对抗网络模型中的生成器和判别器的权重。

具体的，将预处理后的训练数据集中的勾画后的三维靶区图像和对应的归一化后的三维放射剂量计划处方数值图像输入到待训练生成式对抗网络模型中进行特征学习训练，获得训练后的生成式对抗网络模型；在获得训练后的生成式对抗网络模型之后，需要判断该训练后的生成式对抗网络模型是否收敛，因此，需要利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型进行测试，使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像；然后将预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像一同输入到训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果，将生成器和判别器输出的结果代入到损失函数中，判断损失函数输出结果是否低于预设阈值，其中该预设阈值为0.5；若是，则该训练后的生成式对抗网络模型收敛，训练结束；若否，判断当前训练次数是否达到预设训练最大次数，若是，则训练结束；若否，通过反向传播算法更新权重，并采用所述预处理后的训练数据集进行重新训练，直至收敛或达到预设训练最大次数。

在待训练生成式对抗网络模型的训练过程中，需要将训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练，生成训练三维剂量预测数值图像；然后将训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练，获得训练后的生成式对抗网络模型。

在训练后的生成式对抗网络模型没有收敛或者没有达到预设的最大训练次数的时候，需要利用反向传播算法更新权重，即利用反向传播算法依次对判别器和生成器进行训练来进行权重更新；首先是对判别器进行训练，在对判别器进行训练之前，首先需要对生成器的权重进行冻结，然后通过反向传播算法更新模型中的判别器的权重；然后解冻生成器的权重，再通过反向传播算法对模型中的生成器和判别器的权重进行同时更新。

由于判别器相比于生成器更容易训练，为了让模型训练具有更好的稳定性，通过上述方式对每个训练循环，每训练两次生成器，才对判别器进行一次训练。

实施例

请参阅图2，图2是本发明实施例中的三维剂量分布网络模型的训练装置的结构组成示意图。

如图2所示，一种三维剂量分布网络模型的训练装置，所述装置包括：

数据获取模块11：用于获取训练数据集，所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像；

在本发明具体实施过程中，训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像；其中，勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像均来源于医院；其中，勾画后的三维靶区图像来源于医院患者的经过勾画后的三维CT图像；通过临床勾画对CT图像的体素(尺寸为4mm*4mm*2mm的3D像素)进分类，包括OARs(organs at risk，危急器官)和PTVs(planning target volumes，计划靶区)；三维CT图像的每一个体素都被赋予特定的颜色，用来表示不同的器官或者目标体积，并且如果一个体素同时被分类为PTVs和OARs的情况时，我们将该体素视为PTVs；将所有未分类的组织留作原始CT图像灰度，训练数据集中的勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像是肿瘤专家给出的三维剂量临床处方数据图像，包括分别针对总疾病，中度风险和选择性计划靶区分别为70Gy，63Gy和56Gy的处方。其中Gy为戈瑞，表示吸收剂量单位，定义为每1千克被照射物吸收辐射的能量为1J(焦耳)。

预处理模块12：用于将所述训练数据集进行预处理，获取预处理后的训练数据集；

模型构建模块13：用于构建待训练生成式对抗网络模型；

表1

判别器包含四个步长为2的下采样层，如表2所示。

表2

训练模块14：用于将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练，直至收敛。

其中，V(G,D)为对抗损失函数，公式如下：

其中，V(G,D)为对抗损失函数，公式如下：

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，ReadOnly Memory)、随机存取存储器(RAM，Random AccessMemory)、磁盘或光盘等。

另外，以上对本发明实施例所提供的一种三维剂量分布网络模型的训练方法及装置进行了详细介绍，本文中应采用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。