CN109920512B - 一种三维剂量分布网络模型的训练方法及装置 - Google Patents
一种三维剂量分布网络模型的训练方法及装置 Download PDFInfo
- Publication number
- CN109920512B CN109920512B CN201910155163.XA CN201910155163A CN109920512B CN 109920512 B CN109920512 B CN 109920512B CN 201910155163 A CN201910155163 A CN 201910155163A CN 109920512 B CN109920512 B CN 109920512B
- Authority
- CN
- China
- Prior art keywords
- training
- network model
- trained
- dimensional
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000005855 radiation Effects 0.000 claims abstract description 70
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 66
- 230000008485 antagonism Effects 0.000 claims description 24
- 239000011159 matrix material Substances 0.000 claims description 17
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 230000008014 freezing Effects 0.000 claims description 6
- 238000007710 freezing Methods 0.000 claims description 6
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 2
- 210000000920 organ at risk Anatomy 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种三维剂量分布网络模型的训练方法及装置,其中,所述方法包括:获取训练数据集,所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;将所述训练数据集进行预处理,获取预处理后的训练数据集;构建待训练生成式对抗网络模型;将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛。在本发明实施例中,可以有效的防止在训练过程中的过度拟合问题,使训练得到的模型具有更强的泛化能力,且模型具有更好的稳定性。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种三维剂量分布网络模型的训练方法及装置。
背景技术
生成对抗性网络模型已经广泛应用在图像分类、语音识别和人脸识别等领域中,并带来了相关领域的革命性进步;将生成对抗性网络模型应用在医学图像进行3D剂量预测上时,当前的训练方式的不符合医学上的判别方式,采用现有的训练方法训练的模型不适用于医学上的实际使用场景,且现有的模型在训练的时候,容易发生过度拟合、需要训练的样本较多等问题,这样将直接导致模型训练效率较低。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种三维剂量分布网络模型的训练方法及装置,可以有效的防止在训练过程中的过度拟合问题,使训练得到的模型具有更强的泛化能力,且模型具有更好的稳定性。
为了解决上述技术问题,本发明实施例提供了一种三维剂量分布网络模型的训练方法,所述方法包括:
获取训练数据集,所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;
将所述训练数据集进行预处理,获取预处理后的训练数据集;
构建待训练生成式对抗网络模型;
将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛。
可选的,所述将所述训练数据集进行预处理,获取预处理后的训练数据集,包括:
对所述训练数据集中的三维放射剂量计划处方数值图像进行归一化处理,获得处理后的训练数据集;
其中,归一化的公式如下:
其中,x*表示归一化后的三维放射剂量计划处方数值图像的任意一点的数值,x表示为三维放射剂量计划处方数值图像的任意一点的数值,xmax表示三维放射剂量计划处方数值图像中的最大数值,xmin表示三维放射剂量计划处方数值图像中的最小数值。
可选的,所述待训练生成式对抗网络模型包括生成器和判别器;其中,
所述生成器为Unet结构,所述生成器依次包括三个下采样模块、中间模块和三个上采样器;
所述判别器依次包括四个步长为2的下采样层、全连接层和Sigmoid层。
可选的,所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练之间,还包括:
确定训练使用的评价指标为伽马传递率矩阵;
确定训练使用的损失函数为对抗损失函数和重建损失函数共同构建的损失函数;
对所述待训练生成式对抗网络模型的参数进行随机初始化,且在训练过程中使用Adam优化器,训练过程中使用批量归一化,批量尺寸设为32。
可选的,所述对抗损失函数和重建损失函数共同构建的损失函数的公式如下:
其中,V(G,D)为对抗损失函数,公式如下:
其中,G表示待训练生成式对抗网络模型中的生成器;D表示待训练生成式对抗网络模型中的判别器;y~Pdata(y)表示y为训练过程中使用的实际三维放射剂量数值,Pdata(y)表示训练数据服从的概率分布;z~PZ(z)表示z为勾画后的三维靶区图像,PZ(z)为勾画后的三维靶区图像服从的概率分布;E表示期望;λ表示正则参数。
可选的,所述Adam优化器的参数中学习率设置为0.0002,一阶矩阵估计的指数衰减率β1为0.5,二阶矩阵估计的指数衰减率β2为0.999。
可选的,所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛,包括:
将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型;
利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型;
使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像;
将所述预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果;
将生成器和判别器得到的结果代入对抗损失函数中,判断对抗损失函数输出结果是否低于预设阈值,若是,则训练结束;
若否,判断当前训练次数是否达到预设训练最大次数,若是,则训练结束;
若否,通过反向传播算法更新权重,并采用所述预处理后的训练数据集进行重新训练,直至收敛或达到预设训练最大次数;
其中,所述判别器在进行目标预测判别时,当输入为预测的三维剂量预测数值图像,期望判别器输出的结果为0,当输入为对应的三维放射剂量计划处方数值图像时,期望判别器输出的结果为1;所述生成器在进行目标预测生成时,期望输出预测的三维剂量预测数值图像在判别器输出的结果为1。
可选的,所述将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型,包括:
将所述训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练,生成训练三维剂量预测数值图像;
将所述训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练,获得训练后的生成式对抗网络模型。
可选的,所述通过反向传播算法更新权重包括:
使用反向传播算法依次对判别器和生成器进行训练;
首先对判别器进行训练,需要对所述生成器的权重进行冻结,通过反向传播算法更新待训练生成式对抗网络模型中的判别器的权重;
然后对生成器进行训练,通过反向传播算法更新待训练生成式对抗网络模型中的生成器和判别器的权重。
另外,本发明实施例还提供了一种三维剂量分布网络模型的训练装置,所述装置包括:
数据获取模块:用于获取训练数据集,所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;
预处理模块:用于将所述训练数据集进行预处理,获取预处理后的训练数据集;
模型构建模块:用于构建待训练生成式对抗网络模型;
训练模块:用于将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛。
在本发明具体实施例中,通过构建新的待训练生成式对抗网络模型,以对训练数据集的预处理,可以有效的防止在训练过程中的过度拟合问题,使训练得到的模型具有更强的泛化能力,且模型具有更好的稳定性。
本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实际了解到。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例中的三维剂量分布网络模型的训练方法的流程示意图;
图2是本发明实施例中的三维剂量分布网络模型的训练装置的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例
请参阅图1,图1是本发明实施例中的三维剂量分布网络模型的训练方法的流程示意图。
如图1所示,一种三维剂量分布网络模型的训练方法,所述方法包括:
S11:获取训练数据集,所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;
在本发明具体实施过程中,训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;其中,勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像均来源于医院;其中,勾画后的三维靶区图像来源于医院患者的经过勾画后的三维CT图像;通过临床勾画对CT图像的体素(尺寸为4mm*4mm*2mm的3D像素)进分类,包括OARs(organs at risk,危急器官)和PTVs(planning target volumes,计划靶区);三维CT图像的每一个体素都被赋予特定的颜色,用来表示不同的器官或者目标体积,并且如果一个体素同时被分类为PTVs和OARs的情况时,将该体素视为PTVs;将所有未分类的组织留作原始CT图像灰度,训练数据集中的勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像是肿瘤专家给出的三维剂量临床处方数据图像,包括分别针对总疾病,中度风险和选择性计划靶区分别为70Gy,63Gy和56Gy的处方。其中Gy为戈瑞,表示吸收剂量单位,定义为每1千克被照射物吸收辐射的能量为1J(焦耳)。
S12:将所述训练数据集进行预处理,获取预处理后的训练数据集;
在本发明具体实施过程中,所述将所述训练数据集进行预处理,获取预处理后的训练数据集,包括:对所述训练数据集中的三维放射剂量计划处方数值图像进行归一化处理,获得处理后的训练数据集;其中,归一化的公式如下:
其中,x*表示归一化后的三维放射剂量计划处方数值图像的任意一点的数值,x表示为三维放射剂量计划处方数值图像的任意一点的数值,xmax表示三维放射剂量计划处方数值图像中的最大数值,xmin表示三维放射剂量计划处方数值图像中的最小数值。
具体的,考虑到后续加快训练的速度和提升训练的稳定性,在本发明中采用归一化的公式将训练数据集中的三维放射剂量计划处方数值图像进行归一化处理,将三维放射剂量计划处方数值图像中的数值归一化至[0,1]的范围。
S13:构建待训练生成式对抗网络模型;
在本发明具体实施过程中,所述待训练生成式对抗网络模型包括生成器和判别器;其中,所述生成器为Unet结构,所述生成器依次包括三个下采样模块、中间模块和三个上采样器;所述判别器依次包括四个步长为2的下采样层、全连接层和Sigmoid层。
具体的,构建的待训练生成式对抗网络模型包括生成器和判别器两个部分;其中生成器为Unet结构,包括三个下采样模块,一个中间模块和三个上采样模块;各个模块的结构如表1所示。
表1
三个相同结构的下采样模块的相互堆叠可以更好的处理输入的图片,提取到具有最佳表达能力的特征;卷积层间使用了丢失率为0.25的Dropout层来防止生成器过拟合;这主要是因为医学数据的训练样本较少,通过在生成网络中增加正则化模块,可以使训练得到的网络具有更强的泛化能力;中间模块依次采用了卷积核为3,扩张率为2和4的空洞卷积,通过这种方式增大了网络的感受野,避免了采用池化方法导致的较多信息丢失。后面接了一个5x1和1x5的非对称卷积,相比于直接使用5x5的卷积减少了计算量,同时引入的不同尺度的卷积,可以得到不同空间维度的特征。上采样模块采用双线性插值和1x1卷积来扩大特征图尺寸;通过Concat层将前面下采样模块的输出和当前上采样的特征融合在一起,使得输出包含更多的原始图像的信息,结果更为准确。
判别器包含四个步长为2的下采样层,如表2所示。
表2
在判别器中的下采样层与生成器的下采样模块不同在于,判别器的下采样层不需要使用Dropout层来防止网络过拟合,然后通过全连接成将特征图输出为判断标志,通过Sigmoid层将判断标志限制在0~1的范围。
S14:将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛。
在本发明具体实施过程中,所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练之间,还包括:确定训练使用的评价指标为伽马传递率矩阵;确定训练使用的损失函数为对抗损失函数和重建损失函数共同构建的损失函数;对所述待训练生成式对抗网络模型的参数进行随机初始化,且在训练过程中使用Adam优化器,训练过程中使用批量归一化,批量尺寸设为32。
进一步的,所述对抗损失函数和重建损失函数共同构建的损失函数的公式如下:
其中,V(G,D)为对抗损失函数,公式如下:
其中,G表示待训练生成式对抗网络模型中的生成器;D表示待训练生成式对抗网络模型中的判别器;y~Pdata(y)表示y为训练过程中使用的实际三维放射剂量数值,Pdata(y)表示训练数据服从的概率分布;z~PZ(z)表示z为勾画后的三维靶区图像,PZ(z)为勾画后的三维靶区图像服从的概率分布;E表示期望;λ表示正则参数。
进一步的,所述Adam优化器的参数中学习率设置为0.0002,一阶矩阵估计的指数衰减率β1为0.5,二阶矩阵估计的指数衰减率β2为0.999。
具体的,在训练之前,首先需要设置训练使用的损失函数和训练采用的优化器的学习率,在具体实施过程中,设置的损失函数是由对抗损失函数和重建损失函数共同构成的损失函数,具体的损失函数公式如下:
其中,V(G,D)为对抗损失函数,公式如下:
其中,G表示待训练生成式对抗网络模型中的生成器;D表示待训练生成式对抗网络模型中的判别器;y~Pdata(y)表示y为训练过程中使用的实际三维放射剂量数值,Pdata(y)表示训练数据服从的概率分布;z~PZ(z)表示z为勾画后的三维靶区图像,PZ(z)为勾画后的三维靶区图像服从的概率分布;E表示期望;λ表示正则参数。
训练时,采用的优化器为Adam优化器,该优化器的参数中学习率设置为0.0002,一阶矩阵估计的指数衰减率β1为0.5,二阶矩阵估计的指数衰减率β2为0.999。
在本发明具体实施过程中,所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛,包括:将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型;利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型;使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像;将所述预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果;将生成器和判别器得到的结果代入对抗损失函数中,判断对抗损失函数输出结果是否低于预设阈值,若是,则训练结束;若否,判断当前训练次数是否达到预设训练最大次数,若是,则训练结束;若否,通过反向传播算法更新权重,并采用所述预处理后的训练数据集进行重新训练,直至收敛或达到预设训练最大次数;其中,所述判别器在进行目标预测判别时,当输入为预测的三维剂量预测数值图像,期望判别器输出的结果为0,当输入为对应的三维放射剂量计划处方数值图像时,期望判别器输出的结果为1;所述生成器在进行目标预测生成时,期望输出预测的三维剂量预测数值图像在判别器输出的结果为1。
进一步的,所述将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型,包括:将所述训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练,生成训练三维剂量预测数值图像;将所述训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练,获得训练后的生成式对抗网络模型。
进一步的,所述通过反向传播算法更新权重包括:使用反向传播算法依次对判别器和生成器进行训练;首先对判别器进行训练,需要对所述生成器的权重进行冻结,通过反向传播算法更新待训练生成式对抗网络模型中的判别器的权重;然后对生成器进行训练,通过反向传播算法更新待训练生成式对抗网络模型中的生成器和判别器的权重。
具体的,将预处理后的训练数据集中的勾画后的三维靶区图像和对应的归一化后的三维放射剂量计划处方数值图像输入到待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型;在获得训练后的生成式对抗网络模型之后,需要判断该训练后的生成式对抗网络模型是否收敛,因此,需要利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型进行测试,使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像;然后将预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像一同输入到训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果,将生成器和判别器输出的结果代入到损失函数中,判断损失函数输出结果是否低于预设阈值,其中该预设阈值为0.5;若是,则该训练后的生成式对抗网络模型收敛,训练结束;若否,判断当前训练次数是否达到预设训练最大次数,若是,则训练结束;若否,通过反向传播算法更新权重,并采用所述预处理后的训练数据集进行重新训练,直至收敛或达到预设训练最大次数。
在待训练生成式对抗网络模型的训练过程中,需要将训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练,生成训练三维剂量预测数值图像;然后将训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练,获得训练后的生成式对抗网络模型。
在训练后的生成式对抗网络模型没有收敛或者没有达到预设的最大训练次数的时候,需要利用反向传播算法更新权重,即利用反向传播算法依次对判别器和生成器进行训练来进行权重更新;首先是对判别器进行训练,在对判别器进行训练之前,首先需要对生成器的权重进行冻结,然后通过反向传播算法更新模型中的判别器的权重;然后解冻生成器的权重,再通过反向传播算法对模型中的生成器和判别器的权重进行同时更新。
由于判别器相比于生成器更容易训练,为了让模型训练具有更好的稳定性,通过上述方式对每个训练循环,每训练两次生成器,才对判别器进行一次训练。
在本发明具体实施例中,通过构建新的待训练生成式对抗网络模型,以对训练数据集的预处理,可以有效的防止在训练过程中的过度拟合问题,使训练得到的模型具有更强的泛化能力,且模型具有更好的稳定性。
实施例
请参阅图2,图2是本发明实施例中的三维剂量分布网络模型的训练装置的结构组成示意图。
如图2所示,一种三维剂量分布网络模型的训练装置,所述装置包括:
数据获取模块11:用于获取训练数据集,所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;
在本发明具体实施过程中,训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;其中,勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像均来源于医院;其中,勾画后的三维靶区图像来源于医院患者的经过勾画后的三维CT图像;通过临床勾画对CT图像的体素(尺寸为4mm*4mm*2mm的3D像素)进分类,包括OARs(organs at risk,危急器官)和PTVs(planning target volumes,计划靶区);三维CT图像的每一个体素都被赋予特定的颜色,用来表示不同的器官或者目标体积,并且如果一个体素同时被分类为PTVs和OARs的情况时,我们将该体素视为PTVs;将所有未分类的组织留作原始CT图像灰度,训练数据集中的勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像是肿瘤专家给出的三维剂量临床处方数据图像,包括分别针对总疾病,中度风险和选择性计划靶区分别为70Gy,63Gy和56Gy的处方。其中Gy为戈瑞,表示吸收剂量单位,定义为每1千克被照射物吸收辐射的能量为1J(焦耳)。
预处理模块12:用于将所述训练数据集进行预处理,获取预处理后的训练数据集;
在本发明具体实施过程中,所述将所述训练数据集进行预处理,获取预处理后的训练数据集,包括:对所述训练数据集中的三维放射剂量计划处方数值图像进行归一化处理,获得处理后的训练数据集;其中,归一化的公式如下:
其中,x*表示归一化后的三维放射剂量计划处方数值图像的任意一点的数值,x表示为三维放射剂量计划处方数值图像的任意一点的数值,xmax表示三维放射剂量计划处方数值图像中的最大数值,xmin表示三维放射剂量计划处方数值图像中的最小数值。
具体的,考虑到后续加快训练的速度和提升训练的稳定性,在本发明中采用归一化的公式将训练数据集中的三维放射剂量计划处方数值图像进行归一化处理,将三维放射剂量计划处方数值图像中的数值归一化至[0,1]的范围。
模型构建模块13:用于构建待训练生成式对抗网络模型;
在本发明具体实施过程中,所述待训练生成式对抗网络模型包括生成器和判别器;其中,所述生成器为Unet结构,所述生成器依次包括三个下采样模块、中间模块和三个上采样器;所述判别器依次包括四个步长为2的下采样层、全连接层和Sigmoid层。
具体的,构建的待训练生成式对抗网络模型包括生成器和判别器两个部分;其中生成器为Unet结构,包括三个下采样模块,一个中间模块和三个上采样模块;各个模块的结构如表1所示。
表1
三个相同结构的下采样模块的相互堆叠可以更好的处理输入的图片,提取到具有最佳表达能力的特征;卷积层间使用了丢失率为0.25的Dropout层来防止生成器过拟合;这主要是因为医学数据的训练样本较少,通过在生成网络中增加正则化模块,可以使训练得到的网络具有更强的泛化能力;中间模块依次采用了卷积核为3,扩张率为2和4的空洞卷积,通过这种方式增大了网络的感受野,避免了采用池化方法导致的较多信息丢失。后面接了一个5x1和1x5的非对称卷积,相比于直接使用5x5的卷积减少了计算量,同时引入的不同尺度的卷积,可以得到不同空间维度的特征。上采样模块采用双线性插值和1x1卷积来扩大特征图尺寸;通过Concat层将前面下采样模块的输出和当前上采样的特征融合在一起,使得输出包含更多的原始图像的信息,结果更为准确。
判别器包含四个步长为2的下采样层,如表2所示。
表2
在判别器中的下采样层与生成器的下采样模块不同在于,判别器的下采样层不需要使用Dropout层来防止网络过拟合,然后通过全连接成将特征图输出为判断标志,通过Sigmoid层将判断标志限制在0~1的范围。
训练模块14:用于将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛。
在本发明具体实施过程中,所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练之间,还包括:确定训练使用的评价指标为伽马传递率矩阵;确定训练使用的损失函数为对抗损失函数和重建损失函数共同构建的损失函数;对所述待训练生成式对抗网络模型的参数进行随机初始化,且在训练过程中使用Adam优化器,训练过程中使用批量归一化,批量尺寸设为32。
进一步的,所述对抗损失函数和重建损失函数共同构建的损失函数的公式如下:
其中,V(G,D)为对抗损失函数,公式如下:
其中,G表示待训练生成式对抗网络模型中的生成器;D表示待训练生成式对抗网络模型中的判别器;y~Pdata(y)表示y为训练过程中使用的实际三维放射剂量数值,Pdata(y)表示训练数据服从的概率分布;z~PZ(z)表示z为勾画后的三维靶区图像,PZ(z)为勾画后的三维靶区图像服从的概率分布;E表示期望;λ表示正则参数。
进一步的,所述Adam优化器的参数中学习率设置为0.0002,一阶矩阵估计的指数衰减率β1为0.5,二阶矩阵估计的指数衰减率β2为0.999。
具体的,在训练之前,首先需要设置训练使用的损失函数和训练采用的优化器的学习率,在具体实施过程中,设置的损失函数是由对抗损失函数和重建损失函数共同构成的损失函数,具体的损失函数公式如下:
其中,V(G,D)为对抗损失函数,公式如下:
其中,G表示待训练生成式对抗网络模型中的生成器;D表示待训练生成式对抗网络模型中的判别器;y~Pdata(y)表示y为训练过程中使用的实际三维放射剂量数值,Pdata(y)表示训练数据服从的概率分布;Z~PZ(Z)表示z为勾画后的三维靶区图像,PZ(z)为勾画后的三维靶区图像服从的概率分布;E表示期望;λ表示正则参数。
训练时,采用的优化器为Adam优化器,该优化器的参数中学习率设置为0.0002,一阶矩阵估计的指数衰减率β1为0.5,二阶矩阵估计的指数衰减率β2为0.999。
在本发明具体实施过程中,所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛,包括:将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型;利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型;使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像;将所述预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果;将生成器和判别器得到的结果代入对抗损失函数中,判断对抗损失函数输出结果是否低于预设阈值,若是,则训练结束;若否,判断当前训练次数是否达到预设训练最大次数,若是,则训练结束;若否,通过反向传播算法更新权重,并采用所述预处理后的训练数据集进行重新训练,直至收敛或达到预设训练最大次数;其中,所述判别器在进行目标预测判别时,当输入为预测的三维剂量预测数值图像,期望判别器输出的结果为0,当输入为对应的三维放射剂量计划处方数值图像时,期望判别器输出的结果为1;所述生成器在进行目标预测生成时,期望输出预测的三维剂量预测数值图像在判别器输出的结果为1。
进一步的,所述将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型,包括:将所述训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练,生成训练三维剂量预测数值图像;将所述训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练,获得训练后的生成式对抗网络模型。
进一步的,所述通过反向传播算法更新权重包括:使用反向传播算法依次对判别器和生成器进行训练;首先对判别器进行训练,需要对所述生成器的权重进行冻结,通过反向传播算法更新待训练生成式对抗网络模型中的判别器的权重;然后对生成器进行训练,通过反向传播算法更新待训练生成式对抗网络模型中的生成器和判别器的权重。
具体的,将预处理后的训练数据集中的勾画后的三维靶区图像和对应的归一化后的三维放射剂量计划处方数值图像输入到待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型;在获得训练后的生成式对抗网络模型之后,需要判断该训练后的生成式对抗网络模型是否收敛,因此,需要利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型进行测试,使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像;然后将预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像一同输入到训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果,将生成器和判别器输出的结果代入到损失函数中,判断损失函数输出结果是否低于预设阈值,其中该预设阈值为0.5;若是,则该训练后的生成式对抗网络模型收敛,训练结束;若否,判断当前训练次数是否达到预设训练最大次数,若是,则训练结束;若否,通过反向传播算法更新权重,并采用所述预处理后的训练数据集进行重新训练,直至收敛或达到预设训练最大次数。
在待训练生成式对抗网络模型的训练过程中,需要将训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练,生成训练三维剂量预测数值图像;然后将训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练,获得训练后的生成式对抗网络模型。
在训练后的生成式对抗网络模型没有收敛或者没有达到预设的最大训练次数的时候,需要利用反向传播算法更新权重,即利用反向传播算法依次对判别器和生成器进行训练来进行权重更新;首先是对判别器进行训练,在对判别器进行训练之前,首先需要对生成器的权重进行冻结,然后通过反向传播算法更新模型中的判别器的权重;然后解冻生成器的权重,再通过反向传播算法对模型中的生成器和判别器的权重进行同时更新。
由于判别器相比于生成器更容易训练,为了让模型训练具有更好的稳定性,通过上述方式对每个训练循环,每训练两次生成器,才对判别器进行一次训练。
在本发明具体实施例中,通过构建新的待训练生成式对抗网络模型,以对训练数据集的预处理,可以有效的防止在训练过程中的过度拟合问题,使训练得到的模型具有更强的泛化能力,且模型具有更好的稳定性。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,ReadOnly Memory)、随机存取存储器(RAM,Random AccessMemory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的一种三维剂量分布网络模型的训练方法及装置进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种三维剂量分布网络模型的训练方法,其特征在于,所述方法包括:
获取训练数据集,所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;
将所述训练数据集进行预处理,获取预处理后的训练数据集;
构建待训练生成式对抗网络模型;
将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛;
所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练之间,还包括:
确定训练使用的评价指标为伽马传递率矩阵;
确定训练使用的损失函数为对抗损失函数和重建损失函数共同构建的损失函数;
对所述待训练生成式对抗网络模型的参数进行随机初始化,且在训练过程中使用Adam优化器,训练过程中使用批量归一化,批量尺寸设为32;
所述对抗损失函数和重建损失函数共同构建的损失函数的公式如下:
其中,V(G,D)为对抗损失函数,公式如下:
其中,G表示待训练生成式对抗网络模型中的生成器;D表示待训练生成式对抗网络模型中的判别器;y~Pdata(y)表示y为训练过程中使用的实际三维放射剂量数值,Pdata(y)表示训练数据服从的概率分布;z~PZ(z)表示z为勾画后的三维靶区图像,PZ(z)为勾画后的三维靶区图像服从的概率分布;E表示期望;λ表示正则参数。
3.根据权利要求1所述的训练方法,其特征在于,所述待训练生成式对抗网络模型包括生成器和判别器;其中,
所述生成器为Unet结构,所述生成器依次包括三个下采样模块、中间模块和三个上采样器;
所述判别器依次包括四个步长为2的下采样层、全连接层和Sigmoid层。
4.根据权利要求1所述的训练方法,其特征在于,所述Adam优化器的参数中学习率设置为0.0002,一阶矩阵估计的指数衰减率β1为0.5,二阶矩阵估计的指数衰减率β2为0.999。
5.根据权利要求1所述的训练方法,其特征在于,所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛,包括:
将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型;
利用测试勾画后的三维靶区图像及对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型;
使用训练后的生成式对抗网络模型中的生成器生成预测的三维剂量预测数值图像;
将所述预测的三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入训练后的生成式对抗网络模型中判别器中进行判断并输出判别结果;
将生成器和判别器得到的结果代入对抗损失函数中,判断对抗损失函数输出结果是否低于预设阈值,若是,则训练结束;
若否,判断当前训练次数是否达到预设训练最大次数,若是,则训练结束;
若否,通过反向传播算法更新权重,并采用所述预处理后的训练数据集进行重新训练,直至收敛或达到预设训练最大次数;
其中,所述判别器在进行目标预测判别时,当输入为预测的三维剂量预测数值图像,期望判别器输出的结果为0,当输入为对应的三维放射剂量计划处方数值图像时,期望判别器输出的结果为1;所述生成器在进行目标预测生成时,期望输出预测的三维剂量预测数值图像在判别器输出的结果为1。
6.根据权利要求5所述的训练方法,其特征在于,所述将所述预处理后的训练数据集输入至所述待训练生成式对抗网络模型中进行特征学习训练,获得训练后的生成式对抗网络模型,包括:
将所述训练数据集中的勾画后的三维靶区图像输入待训练生成式对抗网络模型中的生成器进行训练,生成训练三维剂量预测数值图像;
将所述训练三维剂量预测数值图像和对应的三维放射剂量计划处方数值图像输入待训练生成式对抗网络模型中的判别器中进行训练,获得训练后的生成式对抗网络模型。
7.根据权利要求5所述的训练方法,其特征在于,所述通过反向传播算法更新权重包括:
使用反向传播算法依次对判别器和生成器进行训练;
首先对判别器进行训练,需要对所述生成器的权重进行冻结,通过反向传播算法更新待训练生成式对抗网络模型中的判别器的权重;
然后对生成器进行训练,通过反向传播算法更新待训练生成式对抗网络模型中的生成器和判别器的权重。
8.一种三维剂量分布网络模型的训练装置,其特征在于,所述装置包括:
数据获取模块:用于获取训练数据集,所述训练数据集包括勾画后的三维靶区图像以及对应的三维放射剂量计划处方数值图像;
预处理模块:用于将所述训练数据集进行预处理,获取预处理后的训练数据集;
模型构建模块:用于构建待训练生成式对抗网络模型;
训练模块:用于将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练,直至收敛;
所述将所述预处理后的训练数据集输入所述待训练生成式对抗网络模型进行训练之间,还包括:
确定训练使用的评价指标为伽马传递率矩阵;
确定训练使用的损失函数为对抗损失函数和重建损失函数共同构建的损失函数;
对所述待训练生成式对抗网络模型的参数进行随机初始化,且在训练过程中使用Adam优化器,训练过程中使用批量归一化,批量尺寸设为32;
所述对抗损失函数和重建损失函数共同构建的损失函数的公式如下:
其中,V(G,D)为对抗损失函数,公式如下:
其中,G表示待训练生成式对抗网络模型中的生成器;D表示待训练生成式对抗网络模型中的判别器;y~Pdata(y)表示y为训练过程中使用的实际三维放射剂量数值,Pdata(y)表示训练数据服从的概率分布;z~PZ(z)表示z为勾画后的三维靶区图像,PZ(z)为勾画后的三维靶区图像服从的概率分布;E表示期望;λ表示正则参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910155163.XA CN109920512B (zh) | 2019-02-28 | 2019-02-28 | 一种三维剂量分布网络模型的训练方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910155163.XA CN109920512B (zh) | 2019-02-28 | 2019-02-28 | 一种三维剂量分布网络模型的训练方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109920512A CN109920512A (zh) | 2019-06-21 |
CN109920512B true CN109920512B (zh) | 2023-06-06 |
Family
ID=66962901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910155163.XA Active CN109920512B (zh) | 2019-02-28 | 2019-02-28 | 一种三维剂量分布网络模型的训练方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109920512B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085162B (zh) * | 2020-08-12 | 2024-02-09 | 北京师范大学 | 基于神经网络的磁共振脑组织分割方法、装置、计算设备及存储介质 |
CN111888665B (zh) * | 2020-08-13 | 2022-09-02 | 四川大学华西医院 | 基于自适应对抗网络的三维剂量分布预测模型的构建方法 |
CN112263787B (zh) * | 2020-10-30 | 2021-08-10 | 福建自贸试验区厦门片区Manteia数据科技有限公司 | 放疗的控制方法及装置 |
CN113096766B (zh) * | 2021-04-08 | 2022-05-20 | 济南大学 | 一种个性化精准放疗计划中的三维剂量预测方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764054A (zh) * | 2018-04-27 | 2018-11-06 | 厦门大学 | 基于生成式对抗网络的机器人书写书法的方法 |
-
2019
- 2019-02-28 CN CN201910155163.XA patent/CN109920512B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108764054A (zh) * | 2018-04-27 | 2018-11-06 | 厦门大学 | 基于生成式对抗网络的机器人书写书法的方法 |
Non-Patent Citations (4)
Title |
---|
"【GAN ZOO阅读】模式正则化的生成对抗网络";hyczkg;《CSDN论坛》;20181116;第1-10页 * |
"MODE REGULARIZED GENERATIVE ADVERSARIAL NETWORKS";Tong Che et al.;《ICLR》;20170302;第1-13页 * |
"放射治疗的传统剂量验证存在哪些问题?";放疗人的聚集地;《放疗前沿微信公众号》;20180507;第1-7页 * |
基于条件生成式对抗网络的数据增强方法;陈文兵等;《计算机应用》;20181110(第11期);第259-265页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109920512A (zh) | 2019-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109920512B (zh) | 一种三维剂量分布网络模型的训练方法及装置 | |
EP3830791B1 (en) | 3-d convolutional neural networks for organ segmentation in medical images for radiotherapy planning | |
CN111652321B (zh) | 一种基于改进yolov3算法的海上船舶检测方法 | |
CN111798462B (zh) | 一种基于ct图像的鼻咽癌放疗靶区自动勾画方法 | |
CN110705555B (zh) | 基于fcn的腹部多器官核磁共振图像分割方法、系统及介质 | |
CN108416802B (zh) | 一种基于深度学习的多模医学图像非刚性配准方法及系统 | |
CN111932529B (zh) | 一种图像分类分割方法、装置及系统 | |
CN110739070A (zh) | 一种基于3d卷积神经网络的脑疾病诊断方法 | |
CN110599500B (zh) | 一种基于级联全卷积网络的肝脏ct图像的肿瘤区域分割方法及系统 | |
CN109584254A (zh) | 一种基于深层全卷积神经网络的心脏左心室分割方法 | |
CN110992351B (zh) | 基于多输入卷积神经网络的sMRI图像分类方法和装置 | |
CN110310287A (zh) | 基于神经网络的危及器官自动勾画方法、设备和存储介质 | |
CN114782350A (zh) | 一种基于注意力机制的多模态特征融合的mri脑瘤图像分割方法 | |
CN111369574B (zh) | 一种胸腔器官的分割方法及装置 | |
US20220301224A1 (en) | Systems and methods for image segmentation | |
CN114581453A (zh) | 基于多轴面特征融合二维卷积神经网络的医学图像分割方法 | |
CN116563232A (zh) | 基于长程依赖关系和多尺度输入的视网膜血管分割方法 | |
Suganyadevi et al. | Alzheimer’s Disease Diagnosis using Deep Learning Approach | |
CN109934796A (zh) | 一种基于深度集成学习的器官自动勾画方法 | |
CN114581459A (zh) | 一种基于改进性3D U-Net模型的学前儿童肺部影像感兴趣区域分割方法 | |
CN112489048B (zh) | 一种基于深度网络的视神经自动分割方法 | |
CN113850796A (zh) | 基于ct数据的肺部疾病识别方法及装置、介质和电子设备 | |
CN117474933A (zh) | 一种基于空洞卷积注意力机制的医学图像分割方法 | |
CN109949905A (zh) | 一种基于靶区的三维剂量分布预测方法 | |
CN112669319A (zh) | 一种多视角多尺度淋巴结假阳性抑制建模方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |