CN113012086B

CN113012086B - 一种跨模态图像的合成方法

Info

Publication number: CN113012086B
Application number: CN202110301849.2A
Authority: CN
Inventors: 曹国刚; 刘顺堃; 毛红东; 孔德卿; 李梦雪; 朱信玉; 王一杰; 张术; 李思诚
Original assignee: Shanghai Institute of Technology
Current assignee: Shanghai Institute of Technology
Priority date: 2021-03-22
Filing date: 2021-03-22
Publication date: 2024-04-16
Anticipated expiration: 2041-03-22
Also published as: CN113012086A

Abstract

本发明公开了一种跨模态图像的合成方法，包括：S1：接收不同模态的数据集，对各数据集中的图像数据进行预处理；S2：基于GAN神经网络中的GAN生成器和GAN判别器，将空洞卷积网络嵌入到U‑Net网络中形成Du‑Net生成器；S3：将训练集中的第一模态图像数据、第二模态图像数据输入到Du‑Net生成器中，得到第二合成模态图像数据；S4：将第二合成模态图像数据和第二模态图像数据输入到GAN判别器，生成跨模态图像合成模型；S5：将第一模态图像数据、第二模态图像数据输入到跨模态图像合成模型中，输出第二合成模态图像数据。本发明通过以GAN结构改进的Du‑Net生成器，有效提升伪模态图像的可信度，尤其是减小了伪模态图像与真实模态图像之间的平均绝对误差。

Description

一种跨模态图像的合成方法

技术领域

本发明涉及图像处理技术，尤其涉及一种跨模态图像的合成方法。

背景技术

医学影像的发展一直致力于为医护人员提供精准和全面的诊断信息。病患身体因疾病导致的形态或功能异常表现在各个方面，本申请发明人发现，目前的单一模态成像设备获取的信息往往无法全面反映疾病的复杂特征，因此多模态融合及综合辅助诊断已成为医学成像技术发展的重要趋势。

不同模态图像有其各自的优缺点和适用范围，临床诊断中常用的医学模态包括但不局限于计算机断层扫描、磁共振成像、正电子发射型计算机断层扫描以及包括超声成像在内的各类声学、光学成像模态。

本申请发明人发现，若是将已有的医学图像通过跨模态合成，得到不同模态图像，从而实现多模态融合及综合辅助诊断，将帮助医护人员更好地获得多模态图像信息从而提高诊断效果和效率。

发明内容

本申请实施例通过提供一种跨模态图像的合成方法，解决了现有技术中单个医学影像诊断效果以及效率低下的问题，通过合成不同模态的医学影像来提高医护人员的诊断效果和效率。

本申请实施例提供了一种跨模态图像的合成方法，包括步骤：

S1：接收不同模态的数据集，对各所述数据集中的图像数据进行预处理，分别输出第一模态图像数据、第二模态图像数据的训练集和测试集；

S2：基于GAN神经网络中的GAN生成器和GAN判别器，将空洞卷积网络嵌入到U-Net网络中形成Du-Net生成器；

S3：将所述训练集中的所述第一模态图像数据、所述第二模态图像数据输入到Du-Net生成器中，提取并融合所述第一模态图像数据在GAN结构上下采样层中的特征数据，得到第二合成模态图像数据；

S4：将所述第二合成模态图像数据和所述第二模态图像数据输入到所述 GAN判别器，经过多次判别迭代训练，生成跨模态图像合成模型；

S5：将所述测试集中的所述第一模态图像数据、第二模态图像数据输入到所述跨模态图像合成模型中，直接输出与所述第二模态图像数据一致的第二合成模态图像数据。

进一步地，所述步骤S1中，对各所述数据集中的若干图像数据进行预处理的方法包括：

S11：对数据集中的若干图像数据进行归一化处理；

S12：利用OpenCV对图像数据进行识别生成Mask图，通过图像数据与Mask 图进行与运算，裁剪去除图像数据中像素值为0的边框；

S13：利用N3偏置场校正算法对各模态图像数据进行强度均匀校正。

进一步地，所述步骤S2中的Du-Net生成器包括Du-Net编码器、Du-Net 解码器，所述第一模态图像数据依次经过所述Du-Net编码器和所述Du-Net解码器后，实现特征数据的提取，后通过相应层级的特征数据的维度相加，实现所述第二合成模态图像数据的融合。

进一步地，所述Du-Net编码器包括5个下采样层，各所述下采样层包含两个3*3的第一卷积层，各所述第一卷积层中包含一个空洞卷积，通过所述空洞卷积实现线性修正单元组成的激活函数ReLU和批量归一化处理的运算，提取所述第一模态图像数据的第一特征数据。

进一步地，所述Du-Net解码器包括5个上采样层，各所述上采样层包含两个3*3卷积运算层和LeakyReLU激活函数，通过反卷积运算处理，提取所述第一模态图像数据的第二特征数据。

进一步地，将所述第一特征数据和所述第二特征数据按照采样层级配对方法进行维度相加，实现所述第二合成模态图像数据的融合。

进一步地，所述步骤S3中的GAN判别器包括5个第三卷积层；

通过所述第三卷积层接收第二合成模态图像数据和第二模态图像数据后，先批量归一化处理，然后利用判别损失函数对所述第二合成模态图像数据进行分类，当与第二模态图像数据一致时，输出第二合成模态图像数据，否则返回GAN生成器重新合成后，再进行判别。

进一步地，所述步骤S2中，所述GAN神经网络利用随机梯度下降算法SGD 和学习率衰减优化梯度下降过程训练GAN神经网络。

进一步地，所述步骤S4中，迭代训练所述GAN神经网络时，以上次迭代保存的模型权重作为参考依据，训练并验证当前模型权重，以便生成适配的所述跨模态图像合成模型。

进一步地，所述步骤S5之后还包括，利用轴向、冠状和矢状面视图的差分图，对第二合成模态图像数据与第二模态图像数据进行比较分析，再利用平均绝对损失和峰值信噪比，实现第二合成模态图像数据与第二模态图像数据的定量分析。

本申请实施例中提供的跨模态图像的合成方法，至少具有如下技术效果：

本发明通过以GAN结构改进的Du-Net生成器，有效提升伪模态图像的可信度，尤其是减小了伪模态图像与真实模态图像之间的平均绝对误差。

附图说明

图1为本申请实施例跨模态图像的合成方法的流程图；

图2为本申请实施例整体GAN结构的网络图；

图3为本申请实施例Du-Net生成器的的合成方法模型图；

图4为本申请实施例GAN结构中的卷积神经网络判别器模型图；

具体实施方式

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

参考附图1-4所示，本申请实施例提供了一种跨模态图像的合成方法，该方法包括如下步骤。

步骤S1：接收不同模态的数据集，对各数据集中的图像数据进行预处理，分别输出第一模态图像数据、第二模态图像数据的训练集和测试集。

在本步骤中，各数据集由同一模态的图像数据组成，以临床常用医学影像为例，模态数据集可以但不局限于A超数据集、B超数据集、M超数据集、X 线数据集、CT成像数据集、MRI成像数据集、核素放射成像数据集。医护人员根据需求选取至少两种模态数据集。各模态数据集由若干同一模态的医学图像数据组成。

在步骤S1中，还包括对获取的至少两种模态数据集中的图像数据分别进行预处理。常见的图像预处理过程有：数字化、几何变换、归一化、平滑、复原和增强等步骤，通过该一系列操作步骤，对后续输入的图像进行特征抽取、分割和匹配前所进行的处理，以消除图像中无关的信息，恢复有用的真实信息，增强有关信息的可检测性和最大限度地简化数据，从而改进特征抽取、图像分割、匹配和识别的可靠性。

本实施例中的步骤S1中，对各数据集中的若干图像数据进行预处理的方法包括步骤S11-S13。

步骤S11：对数据集中的若干图像数据进行归一化处理。

图像的归一化处理使图像的某些特征在给定变换下具有不变性质的一种图像标准形式。图像的某些性质，例如物体的面积和周长，本来对于坐标旋转来说就具有不变的性质。在一般情况下，某些因素或变换对图像一些性质的影响可通过归一化处理得到消除或减弱，从而可以被选作测量图像的依据。例如对于光照不可控的遥感图片，灰度直方图的归一化对于图像分析是十分必要的。灰度归一化、几何归一化和变换归一化是获取图像不变性质的三种归一化方法。因此可以理解为，图像归一化处理利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响，进而通过一系列变换将待处理的原始图像数据转换成相应的唯一标准形式，该标准形式的图像数据可以理解为对平移、旋转、缩放等仿射变换具有不变特性。

步骤S12：利用OpenCV对图像数据进行识别生成Mask图，通过图像数据与Mask图进行与运算，裁剪去除图像数据中像素值为0的边框。

本步骤中基于步骤S11中已进行归一化处理的图像数据，各图像数据中在后续进一步处理运算时，为提高运算效率，减少不必要的运算过程，本实施例中采用Mask(掩膜)技术对没有像素值的边框进行裁剪。

步骤S13：利用N3偏置场校正算法对各模态图像数据进行强度均匀校正。进一步说明，比如，若其中一种模态数据集中的图像数据的强度不均匀，那么需要对该强度不均匀的图像数据利用N3偏置场校正算法进行校正。

诸如MRI扫描仪，扫描仪本身以及许多未知问题等因素可导致输出的MR 图像出现亮度差异。换句话说，强度值(从黑色到白色)可以在同一组织内变化，这被称为偏置场。这是一种低频平滑的不良信号，会破坏MR图像。偏置场导致MRI机器的磁场中的不均匀性。如果未校正偏置字段将导致所有成像处理算法(例如，分段(例如，Freesurfer)和分类)输出不正确的结果。因此需要在预处理步骤中来校正偏置场的影响，以减少后续处理时的数据误差，提高医学诊断的准确性。

图像校正步骤，针对由于灰度不均衡而产生的伪影，采用N3 Correction 算法对图像进行校正，即通过一个预设的概率模型对图像的偏移场进行估测，根据预测得到的偏移场对图像的伪影进行修正。当然，在一些预处理操作中，还可以进行图像降噪处理，采用Non-local mean denoising算法对图像降噪处理，Non-local mean denoising算法将原始图像中每一像素的灰度值替换为以该像素为中心的一定区域内所有像素灰度的加权平均值，以此实现对图像噪声的抑制，所选区域内各像素的权重由该像素与中心像素间的相似程度决定，相似度越高，权重越大。

步骤S2:基于GAN神经网络中的GAN生成器和GAN判别器，将空洞卷积网络嵌入到U-Net网络中形成Du-Net生成器。

GAN神经网络又被称为对抗神经网络，包括生成器Generator Network、判别器Discriminator Network，GAN的核心逻辑就是生成器和判别器相互对抗、相互博弈。生成器Generator Network的任务是生成看起来自然真实和原始数据相似的实例。判别器Discriminator Network的任务是判断给定的实例看起来是自然真实的还是人为伪造的。进一步地，在步骤S1中输出至少两种模态的训练集，各训练集内包含若干图像数据，比如，CT成像训练集中的若干 CT图，MRI成像训练集中的若干MR图。本实施例中将CT图处理为与MR图相似的图像。生成器Generator Network试图欺骗判别器Discriminator Network，判别器则努力不被生成器欺骗。模型经过交替优化训练，两种模型都能得到提升，最终得到效果提升到很高很好的生成模型，理论上，这生成模型所生成的产品能达到真假难分的地步。在训练过程中，生成网络G的目标是生成尽可能多的真实图像来欺骗网络D，而D的目标是试图将G生成的假图像与真实图像区分开来。这样，G和D构成一个动态的“博弈过程”，最终的均衡点为纳什均衡点。

通常GAN神经网络通过一些运算达到生成或判别效果，比如，激活函数：使用tanhbegin将输入规范化为(-1,1)，最后一级激活函数(异常)；Loss 函数：使用wassertein GAN的loss函数；数据集标签：如果有标签数据，尝试使用标签。可以使用倒装标签，并使用标签平滑，单侧标签平滑或双侧标签平滑；批处理：使用小型批处理范数，也可以使用实例范数或权重范数；激活函数：避免使用RELU和池化层来降低稀疏梯度的可能性，可以使用leakrelu；优化器：尽可能选择Adam，学习速率尽可能小；正则化：在D的网络层中加入高斯噪声相当于一种正则化。本实施例区别于现有的GAN神经网络，以现有GAN 神经网络的核心逻辑作为处理框架。

进一步地，本实施例创新设计Du-Net网络，Du-Net网络的结构可以理解为将空洞卷积(dilated convolution)嵌入到U-Net网络中，得到的Du-NET网络为GAN生成器原始下采样的卷积操作换成空洞卷积。

步骤S3：S3：将所述训练集中的所述第一模态图像数据、所述第二模态图像数据输入到Du-Net生成器中，提取并融合所述第一模态图像数据在GAN结构上下采样层中的特征数据，得到第二合成模态图像数据。

进一步地，本步骤中的Du-Net生成器包括Du-Net编码器、Du-Net解码器，第一模态图像数据依次经过Du-Net编码器和Du-Net解码器后，实现特征数据的提取，后通过相应层级的特征数据的维度相加，实现第二合成模态图像数据的融合。

进一步地，Du-Net编码器包括5个下采样层，各下采样层包含两个3*3 的第一卷积层，各第一卷积层中包含一个空洞卷积，通过空洞卷积实现线性修正单元组成的激活函数ReLU和批量归一化处理的运算，提取第一模态图像数据的第一特征数据。

本实施例中采用的ReLU为修正线性单元(Rectified linear unit)，是神经网络中最常用的激活函数。其保留了step函数的生物学启发(只有输入超出阈值时神经元才激活)，不过当输入为正的时候，导数不为零，从而允许基于梯度的学习。使用ReLU函数能使计算变得很快，因为无论是函数还是其导数都不包含复杂的数学运算。然而，当输入为负值的时候，ReLU的学习速度可能会变得很慢，甚至使神经元直接无效，因为此时输入小于零而梯度为零，从而其权重无法得到更新，在剩下的训练过程中会一直保持静默。

批量归一化处理中的归一化就是将数据的输入值减去其均值然后除以数据的标准差，在训练学习过程中可以理解为逐层特征提取的过程，每一层的输出其实都可以理解为经过特征提取后的数据。因此批量归一化方法的“归一化”所做的其实就是在网络的每一层都进行数据归一化处理，但每一层对所有数据都进行归一化处理的计算开销太大，因此就使用最小批量梯度下降一样，批量归一化中的“批量”其实是采样一小批数据，然后对该批数据在网络各层的输出进行归一化处理。

本实施例中的Du-Net解码器包括5个上采样层，各上采样层包含两个3*3 卷积运算层和LeakyReLU激活函数，通过反卷积运算处理，提取第一模态图像数据的第二特征数据。

本实施例中所使用的LeakyReLU激活函数解决了神经元“死亡”问题， LeakyReLU激活函数与ReLU激活函数很相似，仅在输入小于0的部分有差别， ReLU输入小于0的部分值都为0，而LeakyReLU输入小于0的部分，值为负，且有微小的梯度。使用LeakyReLU的好处就是：在反向传播过程中，对于 LeakyReLU激活函数输入小于零的部分，也可以计算得到梯度(而不是像ReLU 一样值为0)，这样就避免了上述梯度方向锯齿问题。

本步骤中，将第一特征数据和第二特征数据按照采样层级配对方法进行维度相加，实现第二合成模态图像数据的融合。进一步地，本实施例中采用多层特征融合，即为Du-Net编码器中的一个下采样层提取的特征数据与Du-Net解码器中的一个上采样层中提取的特征数据进行融合，从而通过维度相加实现第二合成模态图像数据的融合。

步骤S2中，GAN神经网络利用随机梯度下降算法SGD和学习率衰减优化梯度下降过程训练GAN神经网络。

在机器学习算法中,有时候需要对原始的模型构建损失函数,然后通过优化算法对损失函数进行优化，以便寻找到最优的参数，使得损失函数的值最小。而在求解机器学习参数的优化算法中，使用较多的就是基于梯度下降的优化算法(Gradient Descent,GD)。随机梯度下降(SGD)为梯度下降算法中的一种，是一种简单但非常有效的方法，多用用于支持向量机、逻辑回归等凸损失函数下的线性分类器的学习。SGD既可以用于分类计算，也可以用于回归计算。

模型训练学习中，以监督式学习通过定义一个模型，并根据训练集上的数据估计最优参数。梯度下降法是一个广泛被用来最小化模型误差的参数优化算法。梯度下降法通过多次迭代，并在每一步中最小化成本函数(cost来估计模型的参数。学习率(learningrate)，在迭代过程中会控制模型的学习进度。在梯度下降法中，给定统一的学习率，整个优化过程中都以确定的步长进行更新，在迭代优化的前期中，学习率较大，则前进的步长就会较长，便能以较快的速度进行梯度下降，而在迭代优化的后期，逐步减小学习率的值，减小步长，这样将有助于算法的收敛，更容易接近最优解。在模型优化中，常用到的几种学习率衰减方法有：分段常数衰减、多项式衰减、指数衰减、自然指数衰减、余弦衰减、线性余弦衰减、噪声线性余弦衰减。

步骤S4：将所述第二合成模态图像数据和所述第二模态图像数据输入到所述GAN判别器，经过多次判别迭代训练，生成跨模态图像合成模型。

进一步地，本实施例中的GAN判别器包括5个第三卷积层。进一步地，5 个卷积层分别适配于Du-Net编码器的5个下采样层和Du-Net解码器的5个上采样层。本实施例中通过第三卷积层接收第二合成模态图像数据和第二模态图像数据后，先批量归一化处理，然后利用判别损失函数对第二合成模态图像数据进行分类，当与第二模态图像数据一致时，输出第二合成模态图像数据，否则返回GAN生成器重新合成后，再进行判别。

在步骤S4中，迭代训练GAN神经网络时，以上次迭代保存的模型权重作为参考依据，训练并验证当前模型权重，以便生成适配的跨模态图像合成模型。

步骤S5：将测试集中的第一模态图像数据、第二模态图像数据输入到跨模态图像合成模型中，直接输出与第二模态图像数据一致的第二合成模态图像数据。

本实施例中的步骤S5之后，还包括利用轴向、冠状和矢状面视图的差分图，对第二合成模态图像数据与第二模态图像数据进行比较分析，再利用平均绝对损失和峰值信噪比，实现第二合成模态图像数据与第二模态图像数据的定量分析。

进一步地，在实际医学影像应用中，通过构建端到端的GAN神经网络，在不断学习训练后，能够完成MR图像合成CT图像的生成。进一步地，首先对MR 图像和CT图像的数据集进行预处理；完成模型的基本结构搭建，利用空洞卷积和U-Net结合构建DU-Net生成器，合成伪CT图像，再构建卷积神经网络判别器对真实CT图像和伪CT图像进行判别；其中，将预处理后的数据包括训练集和测试集，通过训练集训练模型，通过测试集测试生成的跨模态图像合成模型。

将真实的MR图像和真实CT图像输入到改进的GAN生成器中合成CT图像，合成CT图像和真实MR图像一并输入到卷积神经网络的判别器中进行分类，判断出是真实的还是合成的。其中，合成的CT图像和真实的CT图像同时输入到卷积神经网络的判别器中，由于该判别器有5个卷积层，且每个卷积层后面有批量归一化和ReLU作为激活函数，对输入进来的数据进行分类，分出是真实的还是合成的。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种跨模态图像的合成方法，其特征在于，包括步骤：

S3：将所述训练集中的所述第一模态图像数据、所述第二模态图像数据输入到Du-Net生成器中，提取并融合所述第一模态图像数据在GAN结构上下采样层中的特征数据，得到第二合成模态图像数据，所述Du-Net生成器包括Du-Net编码器、Du-Net解码器，所述第一模态图像数据依次经过所述Du-Net编码器和所述Du-Net解码器后，实现特征数据的提取；所述Du-Net编码器包括5个下采样层，各所述下采样层包含两个3*3的第一卷积层，各所述第一卷积层中包含一个空洞卷积，通过所述空洞卷积实现线性修正单元组成的激活函数ReLU和批量归一化处理的运算，提取所述第一模态图像数据的第一特征数据；所述Du-Net解码器包括5个上采样层，各所述上采样层包含两个3*3卷积运算层和LeakyReLU激活函数，通过反卷积运算处理，提取所述第一模态图像数据的第二特征数据；所述第一特征数据和所述第二特征数据按照采样层级配对方法进行维度相加，实现所述第二合成模态图像数据的融合；所述GAN判别器包括5个第三卷积层；通过所述第三卷积层接收第二合成模态图像数据和第二模态图像数据后，先批量归一化处理，然后利用判别损失函数对所述第二合成模态图像数据进行分类，当与第二模态图像数据一致时，输出第二合成模态图像数据，否则返回GAN生成器重新合成后，再进行判别；

S4：将所述第二合成模态图像数据和所述第二模态图像数据输入到所述GAN判别器，经过多次判别迭代训练，生成跨模态图像合成模型；

2.如权利要求1所述的跨模态图像的合成方法，其特征在于，所述步骤S1中，对各所述数据集中的若干图像数据进行预处理的方法包括：

S11：对数据集中的若干图像数据进行归一化处理；

S12：利用OpenCV对图像数据进行识别生成Mask图，通过图像数据与Mask图进行与运算，裁剪去除图像数据中像素值为0的边框；

3.如权利要求1所述的跨模态图像的合成方法，其特征在于，所述步骤S2中，所述GAN神经网络利用随机梯度下降算法SGD和学习率衰减优化梯度下降过程训练GAN神经网络。

4.如权利要求3所述的跨模态图像的合成方法，其特征在于，所述步骤S4中，迭代训练所述GAN神经网络时，以上次迭代保存的模型权重作为参考依据，训练并验证当前模型权重，以便生成适配的所述跨模态图像合成模型。

5.如权利要求1所述的跨模态图像的合成方法，其特征在于，所述步骤S5之后还包括，利用轴向、冠状和矢状面视图的差分图，对第二合成模态图像数据与第二模态图像数据进行比较分析，再利用平均绝对损失和峰值信噪比，实现第二合成模态图像数据与第二模态图像数据的定量分析。