CN117372306B

CN117372306B - 一种基于双编码器的肺部医学影像增强方法

Info

Publication number: CN117372306B
Application number: CN202311567496.6A
Authority: CN
Inventors: 徐鹏摇; 舒明雷; 周书旺; 刘照阳; 刘振宇; 陈超; 狄冲
Original assignee: Shandong Institute of Artificial Intelligence
Current assignee: Shandong Institute of Artificial Intelligence
Priority date: 2023-11-23
Filing date: 2023-11-23
Publication date: 2024-03-01
Anticipated expiration: 2043-11-23
Also published as: CN117372306A

Abstract

一种基于双编码器的肺部医学影像增强方法，涉及图像处理技术领域，将强化编码结果和置信度增强结果输入到重建解码器中，得到图像增强结果、重建解码结果、置信度增强结果。通过交叉熵损失函数进行微调，得到最终的图像增强模型。有效的提高了图像增强的质量，充分利用预训练和微调的训练方式挖掘肺部医学影像的潜在语义信息，提高了肺部医学影像增强的质量和鲁棒性，适用于各种类型的肺部医学影像增强，解决了肺部医学影像增强的需求。

Description

一种基于双编码器的肺部医学影像增强方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于双编码器的肺部医学影像增强方法。

背景技术

随着人工智能的快速发展，近几年医学影像图像增强技术迅速兴起，特别是在肺部疾病的治疗中，这一技术展现出了巨大的潜力。传统的肺部医学影像图像增强模型对数据集具有较大的依赖性。当在不同的数据集上测试性能时，它们的诊断效果往往会受到影响，这主要是因为当前的迁移学习方法通常无法充分关注与特定疾病或病变相关的特征。

发明内容

本发明为了克服以上技术的不足，提供了一种提高肺部医学影像清晰度的基于双编码器的肺部医学影像增强方法。

本发明克服其技术问题所采用的技术方案是：

一种基于双编码器的肺部医学影像增强方法，包括如下步骤：

(a)从数据集中获取肺部医学影像；

(b)对肺部医学影像进行预处理，得到预处理后的肺部医学图像/>；

(c)构建图像增强模型，图像增强模型由初始编码器、强化编码器构成；

(d)将预处理后的肺部医学图像输入到图像增强模型的初始编码器中，输出得到初始编码特征/>；

(e)将初始编码特征输入到图像增强模型的强化编码器中，输出得到强化编码结果/>；

(f)对图像增强模型进行迭代，得到预训练后的图像增强模型；

(g)从数据集中获取新的肺部医学影像；

(h)对新的肺部医学影像进行预处理，得到预处理后的肺部医学图像/>；

(i)将预处理后的肺部医学图像输入到训练后的图像增强模型的初始编码器中，输出得到初始编码特征/>，将预处理后的肺部医学图像/>输入到训练后的图像增强模型中输出得到强化编码结果/>；

(j)建立置信分类模型，将初始编码特征及强化编码结果/>输入到置信分类模型中，输出得到重建解码结果/>、图像增强结果/>、置信度增强结果/>；

(k)对置信分类模型进行迭代，得到预训练后的置信分类模型；

(l)将待增强的肺部医学图像进行预处理，得到预处理后的肺部医学图像/>，将预处理后的肺部医学图像/>输入到训练后的图像增强模型的初始编码器中，输出得到初始编码特征/>，将预处理后的肺部医学图像/>输入到训练后的图像增强模型中输出得到强化编码结果/>，将初始编码特征/>及强化编码结果/>输入到预训练后的置信分类模型中，输出得到重建解码结果/>、图像增强结果/>、置信度增强结果/>。

进一步的，步骤(a)中从LIDC-IDRI数据集中获取肺部医学影像。

进一步的，步骤(b)包括如下步骤：

(b-1)利用NLM去噪算法对肺部医学影像去噪，得到去噪后的肺部医学影像/>；

(b-2)使用Python中的dataset类将去噪后的肺部医学影像按照类别封装，得到预处理后的肺部医学图像/>。

进一步的，步骤(d)包括如下步骤：

(d-1)图像增强模型的初始编码器由第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块构成，第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块均依次由第一卷积层、Batch Normalization层、ReLU激活函数层构成；

(d-2)将预处理后的肺部医学图像输入到初始编码器的第一卷积模块中，输出得到第一编码特征/>；

(d-3)将第一编码特征输入到初始编码器的第二卷积模块中，输出得到第二编码特征/>；

(d-4)将第二编码特征输入到初始编码器的第三卷积模块中，输出得到第三编码特征/>；

(d-5)将第三编码特征输入到初始编码器的第四卷积模块中，输出得到第四编码特征/>；

(d-6)将第一编码特征、第二编码特征/>、第三编码特征/>、第四编码特征/>依次相加得到初始编码特征/>。

进一步的，步骤(e)包括如下步骤：

(e-1)图像增强模型的强化编码器由自注意力机制、第一BatchNorm层、前馈神经网络、第二BatchNorm层、输出模块构成；

(e-2)强化编码器的自注意力机制由矩阵生成层、缩放点积注意力单元、Softmax函数、加权和计算单元构成，矩阵生成层由维度为8×8的查询矩阵、维度为8×8的键矩阵/>、维度为8×8的值矩阵/>，将初始编码特征/>乘以查询矩阵/>得到可学习的权重矩阵/>，将初始编码特征/>乘以键矩阵/>得到可学习的权重矩阵/>，将初始编码特征/>乘以值矩阵/>得到可学习的权重矩阵/>，将可学习的权重矩阵/>及可学习的权重矩阵/>输入到缩放点积注意力单元中进行矩阵转置操作，将转置后的可学习的权重矩阵/>输入Softmax函数中，输出得到权重矩阵/>，将转置后的可学习的权重矩阵/>输入Softmax函数中，输出得到权重矩阵/>，将可学习的权重矩阵/>取平方根后输入到自注意力机制的Softmax函数中，输出得到权重矩阵/>，将权重矩阵/>、权重矩阵/>、权重矩阵/>输入到加权和计算单元中，通过公式/>计算得到加权和矩阵/>；

(e-3)将加权和矩阵输入到强化编码器的第一BatchNorm层中，输出得到归一化后的加权和矩阵/>；

(e-4)强化编码器的前馈神经网络由隐藏单元、ReLU激活函数、线性层构成，前馈神经网络的隐藏单元依次由第一线性层、第一sigmoid激活函数、第二线性层、第二sigmoid激活函数构成，将归一化后的加权和矩阵输入到隐藏单元中，输出得到特征/>，将特征/>依次输入到前馈神经网络的ReLU激活函数、线性层中，输出得到特征/>；

(e-5)将特征输入到强化编码器的第二BatchNorm层中，输出得到前馈特征/>；

(e-6)强化编码器的输出模块由Softmax函数构成，将前馈特征输入到输出模块中，输出得到强化编码结果/>。

进一步的，步骤(f)中通过KL散度利用Adam优化器迭代图像增强模型，得到预训练后的图像增强模型。

进一步的，步骤(g)中从JSRT数据集中获取新的肺部医学影像。

进一步的，步骤(h)包括如下步骤：

(h-1)利用NLM去噪算法对新的肺部医学影像去噪，得到去噪后的肺部医学影像；

(h-2)使用Python中的dataset类将去噪后的肺部医学影像按照类别封装，得到预处理后的肺部医学图像/>。

进一步的，步骤(j)包括如下步骤：

(j-1)置信分类模型由置信度解码器、重建解码器构成；

(j-2)置信分类模型的置信度解码器由输入嵌入单元、卷积模块构成，输入嵌入单元由维度为8×8的嵌入矩阵、索引查找模块、位置编码模块构成，将初始编码特征/>与嵌入矩阵/>相乘操作，得到嵌入矩阵/>，将嵌入矩阵/>与8×8的嵌入矩阵/>按行相加操作得到嵌入向量/>，将嵌入向量/>输入到位置编码模块中利用余弦函数计算得到向量，将向量/>与嵌入向量/>相加操作，得到包含位置信息的嵌入向量/>，置信度解码器的卷积模块依次由第一卷积层、第一Batch Normalization层、第一ReLU激活函数层、第二卷积层、第二Batch Normalization层、第二ReLU激活函数层、平均池化层构成，将包含位置信息的嵌入向量/>输入到置信度解码器的卷积模块中，输出得到置信度增强结果/>；

(j-3)置信分类模型的重建解码器由第一分支、第二分支、第三分支构成，重建解码器的第一分支依次由卷积层、Batch Normalization层、ReLU激活函数层、Python中PIL库中的save函数构成，重建解码器的第二分支依次由Python中的Flatten函数、线性层、Python中的max函数构成，重建解码器的第三分支依次由Python中的Flatten函数、线性层构成，将强化编码结果与置信度增强结果/>相加操作得到特征/>，将特征/>输入到重建解码器的第一分支中，输出得到特征/>，将特征/>与强化编码结果/>进行相加操作，得到图像增强结果/>，将特征/>输入到重建解码器的第二分支中，输出得到重建解码结果/>，将特征/>输入到重建解码器的第三分支中，输出得到特征/>，将特征/>与置信度增强结果/>进行相加操作，得到置信度增强结果/>。

进一步的，步骤(k)中通过交叉熵损失函数利用Adam优化器迭代置信分类模型，得到预训练后的置信分类模型。

进一步的，步骤(l)中利用NLM去噪算法对待增强的肺部医学图像去噪，得到去噪后的肺部医学影像/>，用Python中的dataset类将去噪后的肺部医学影像/>按照类别封装，得到预处理后的肺部医学图像/>。

本发明的有益效果是：对LIDC-IDRI数据集中的视频进行处理，提取出图像并通过初始编码器和强化编码器得到强化编码结果。然后，将JSRT数据集中的图像经过同样的预处理，输入到模型中得到强化编码结果，再通过置信度解码器得到置信度增强结果。最后，将强化编码结果和置信度增强结果输入到重建解码器中，得到图像增强结果、重建解码结果、置信度增强结果。通过交叉熵损失函数进行微调，得到最终的图像增强模型。有效的提高了图像增强的质量，充分利用预训练和微调的训练方式挖掘肺部医学影像的潜在语义信息，提高了肺部医学影像增强的质量和鲁棒性，适用于各种类型的肺部医学影像增强，解决了肺部医学影像增强的需求。

附图说明

图1为本发明的图像增强模型的结构图

图2为本发明的置信分类模型的结构图。

具体实施方式

下面结合附图1、附图2对本发明做进一步说明。

(a)从数据集中获取肺部医学影像；

(g)从数据集中获取新的肺部医学影像；

由初始编码器、强化编码器构成双编码器，通过双编码器重新聚焦模型注意力以进行迁移学习，当解读肺部医学影像时，能够针对特定的疾病或病变定向精准地学习特征，使得模型的可解释性得到显著增强。

在本发明的一个实施例中，步骤(a)中从LIDC-IDRI数据集中获取肺部医学影像。

在本发明的一个实施例中，步骤(b)包括如下步骤：

在本发明的一个实施例中，步骤(d)包括如下步骤：

(d-1)图像增强模型的初始编码器由第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块构成，第一卷积模块、第二卷积模块、第三卷积模块、第四卷积模块均依次由卷积核大小为3*3*3，步长为1的第一卷积层、Batch Normalization层、ReLU激活函数层构成；

在本发明的一个实施例中，步骤(e)包括如下步骤：

(e-2)强化编码器的自注意力机制由矩阵生成层、缩放点积注意力单元、Softmax函数、加权和计算单元构成，矩阵生成层由维度为8×8的查询矩阵、维度为8×8的键矩阵、维度为8×8的值矩阵/>，将初始编码特征/>乘以查询矩阵/>得到可学习的权重矩阵/>，将初始编码特征/>乘以键矩阵/>得到可学习的权重矩阵/>，将初始编码特征/>乘以值矩阵/>得到可学习的权重矩阵/>，将可学习的权重矩阵/>及可学习的权重矩阵/>输入到缩放点积注意力单元中进行矩阵转置操作，将转置后的可学习的权重矩阵/>输入Softmax函数中，输出得到权重矩阵/>，将转置后的可学习的权重矩阵/>输入Softmax函数中，输出得到权重矩阵/>，将可学习的权重矩阵/>取平方根后输入到自注意力机制的Softmax函数中，输出得到权重矩阵/>，将权重矩阵/>、权重矩阵/>、权重矩阵/>输入到加权和计算单元中，通过公式/>计算得到加权和矩阵/>；

在本发明的一个实施例中，步骤(f)中通过KL散度利用Adam优化器迭代图像增强模型，得到预训练后的图像增强模型。

在本发明的一个实施例中，步骤(g)中从JSRT数据集中获取新的肺部医学影像。

在本发明的一个实施例中，步骤(h)包括如下步骤：

在本发明的一个实施例中，步骤(j)包括如下步骤：

(j-1)置信分类模型由置信度解码器、重建解码器构成；

(j-2)置信分类模型的置信度解码器由输入嵌入单元、卷积模块构成，输入嵌入单元由维度为8×8的嵌入矩阵、索引查找模块、位置编码模块构成，将初始编码特征/>与嵌入矩阵/>相乘操作，得到嵌入矩阵/>，将嵌入矩阵/>与8×8的嵌入矩阵/>按行相加操作得到嵌入向量/>，将嵌入向量/>输入到位置编码模块中利用余弦函数计算得到向量，将向量/>与嵌入向量/>相加操作，得到包含位置信息的嵌入向量/>，置信度解码器的卷积模块依次由卷积核大小为3*3*3，步长为2的第一卷积层、第一BatchNormalization层、第一ReLU激活函数层、卷积核大小为3*3*3，步长为1第二卷积层、第二Batch Normalization层、第二ReLU激活函数层、平均池化层构成，将包含位置信息的嵌入向量/>输入到置信度解码器的卷积模块中，输出得到置信度增强结果/>；

(j-3)置信分类模型的重建解码器由第一分支、第二分支、第三分支构成，重建解码器的第一分支依次由卷积核大小为3*3*3，步长为1的卷积层、Batch Normalization层、ReLU激活函数层、Python中PIL库中的save函数构成，重建解码器的第二分支依次由Python中的Flatten函数、线性层、Python中的max函数构成，重建解码器的第三分支依次由Python中的Flatten函数、线性层构成，将强化编码结果与置信度增强结果/>相加操作得到特征/>，将特征/>输入到重建解码器的第一分支中，输出得到特征/>，将特征/>与强化编码结果/>进行相加操作，得到图像增强结果/>，将特征/>输入到重建解码器的第二分支中，输出得到重建解码结果/>，将特征/>输入到重建解码器的第三分支中，输出得到特征/>，将特征/>与置信度增强结果/>进行相加操作，得到置信度增强结果/>。图像增强结果/>可以提高原始图像的分辨率及对比度，重建解码结果/>取值为0或1，取值为0时表示模型未进行医学影像增强，取值为1时表示模型进行了医学影像增强，可以用于辅助诊疗。置信度增强结果/>取值为0-1之间，取值越大表示模型输出的图像的增强结果越清晰。

在本发明的一个实施例中，步骤(k)中通过交叉熵损失函数利用Adam优化器迭代置信分类模型，得到预训练后的置信分类模型。

在本发明的一个实施例中，步骤(l)中利用NLM去噪算法对待增强的肺部医学图像去噪，得到去噪后的肺部医学影像/>，用Python中的dataset类将去噪后的肺部医学影像按照类别封装，得到预处理后的肺部医学图像/>。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于双编码器的肺部医学影像增强方法，其特征在于，包括如下步骤：

(a)从数据集中获取肺部医学影像V；

(b)对肺部医学影像V进行预处理，得到预处理后的肺部医学图像V_IMGNet；

(d)将预处理后的肺部医学图像V_IMGNet输入到图像增强模型的初始编码器中，输出得到初始编码特征F_DFER；

(e)将初始编码特征F_DFER输入到图像增强模型的强化编码器中，输出得到强化编码结果O_DFER；

(g)从数据集中获取新的肺部医学影像V′；

(h)对新的肺部医学影像V′进行预处理，得到预处理后的肺部医学图像V′_IMGNet；

(i)将预处理后的肺部医学图像V′_IMGNet输入到训练后的图像增强模型的初始编码器中，输出得到初始编码特征F′_DFER，将预处理后的肺部医学图像V′_IMGNet输入到训练后的图像增强模型中输出得到强化编码结果O′_DFER；

(j)建立置信分类模型，将初始编码特征F′_DFER及强化编码结果O′_DFER输入到置信分类模型中，输出得到重建解码结果R、图像增强结果V_D、置信度增强结果V_C；

(l)将待增强的肺部医学图像V″进行预处理，得到预处理后的肺部医学图像V″_IMGNet，将预处理后的肺部医学图像V″_IMGNet输入到训练后的图像增强模型的初始编码器中，输出得到初始编码特征F_D″_FER，将预处理后的肺部医学图像V″_IMGNet输入到训练后的图像增强模型中输出得到强化编码结果O″_DFER，将初始编码特征F″_DFER及强化编码结果O″_DFER输入到预训练后的置信分类模型中，输出得到重建解码结果R′、图像增强结果V′_D、置信度增强结果V′_C；步骤(d)包括如下步骤：

(d-2)将预处理后的肺部医学图像V_IMGNet输入到初始编码器的第一卷积模块中，输出得到第一编码特征

(d-3)将第一编码特征输入到初始编码器的第二卷积模块中，输出得到第二编码特征/>

(d-4)将第二编码特征输入到初始编码器的第三卷积模块中，输出得到第三编码特征/>

(d-5)将第三编码特征输入到初始编码器的第四卷积模块中，输出得到第四编码特征/>

(d-6)将第一编码特征第二编码特征/>第三编码特征/>第四编码特征/>依次相加得到初始编码特征F_DFER；

步骤(e)包括如下步骤：

(e-2)强化编码器的自注意力机制由矩阵生成层、缩放点积注意力单元、Softmax函数、加权和计算单元构成，矩阵生成层由维度为8×8的查询矩阵Q、维度为8×8的键矩阵K、维度为8×8的值矩阵V，将初始编码特征F_DFER乘以查询矩阵Q得到可学习的权重矩阵W_Q，将初始编码特征F_DFER乘以键矩阵K得到可学习的权重矩阵W_K，将初始编码特征F_DFER乘以值矩阵V得到可学习的权重矩阵W_V，将可学习的权重矩阵W_Q及可学习的权重矩阵W_K输入到缩放点积注意力单元中进行矩阵转置操作，将转置后的可学习的权重矩阵W_Q输入Softmax函数中，输出得到权重矩阵W′_Q，将转置后的可学习的权重矩阵W_K输入Softmax函数中，输出得到权重矩阵W′_K，将可学习的权重矩阵W_V取平方根后输入到自注意力机制的Softmax函数中，输出得到权重矩阵W′_V，将权重矩阵W′_Q、权重矩阵W′_K、权重矩阵W′_V输入到加权和计算单元中，通过公式W＝W′_Q×F_DFER+W′_K×F_DFER+W′_V×F_DFER计算得到加权和矩阵W；

(e-3)将加权和矩阵W输入到强化编码器的第一BatchNorm层中，输出得到归一化后的加权和矩阵W′；

(e-4)强化编码器的前馈神经网络由隐藏单元、ReLU激活函数、线性层构成，前馈神经网络的隐藏单元依次由第一线性层、第一sigmoid激活函数、第二线性层、第二sigmoid激活函数构成，将归一化后的加权和矩阵W′输入到隐藏单元中，输出得到特征F，将特征F依次输入到前馈神经网络的ReLU激活函数、线性层中，输出得到特征F′；

(e-5)将特征F′输入到强化编码器的第二BatchNorm层中，输出得到前馈特征F_back；

(e-6)强化编码器的输出模块由Softmax函数构成，将前馈特征F_back输入到输出模块中，输出得到强化编码结果O_DFER。

2.根据权利要求1所述的基于双编码器的肺部医学影像增强方法，其特征在于：步骤(a)中从LIDC-IDRI数据集中获取肺部医学影像V。

3.根据权利要求1所述的基于双编码器的肺部医学影像增强方法，其特征在于，步骤(b)包括如下步骤：

(b-1)利用NLM去噪算法对肺部医学影像V去噪，得到去噪后的肺部医学影像V′；

(b-2)使用Python中的dataset类将去噪后的肺部医学影像V′按照类别封装，得到预处理后的肺部医学图像V_IMGNet。

4.根据权利要求1所述的基于双编码器的肺部医学影像增强方法，其特征在于：步骤(f)中通过KL散度利用Adam优化器迭代图像增强模型，得到预训练后的图像增强模型。

5.根据权利要求1所述的基于双编码器的肺部医学影像增强方法，其特征在于：步骤(g)中从JSRT数据集中获取新的肺部医学影像V′。

6.根据权利要求1所述的基于双编码器的肺部医学影像增强方法，其特征在于，步骤(h)包括如下步骤：

(h-1)利用NLM去噪算法对新的肺部医学影像V′去噪，得到去噪后的肺部医学影像V″；

(h-2)使用Python中的dataset类将去噪后的肺部医学影像V″按照类别封装，得到预处理后的肺部医学图像V′_IMGNet。

7.根据权利要求1所述的基于双编码器的肺部医学影像增强方法，其特征在于，步骤(j)包括如下步骤：

(j-1)置信分类模型由置信度解码器、重建解码器构成；

(j-2)置信分类模型的置信度解码器由输入嵌入单元、卷积模块构成，输入嵌入单元由维度为8×8的嵌入矩阵A、索引查找模块、位置编码模块构成，将初始编码特征F′_DFER与嵌入矩阵A相乘操作，得到嵌入矩阵将嵌入矩阵/>与8×8的嵌入矩阵A按行相加操作得到嵌入向量/>将嵌入向量/>输入到位置编码模块中利用余弦函数计算得到向量/>将向量/>与嵌入向量/>相加操作，得到包含位置信息的嵌入向量/>置信度解码器的卷积模块依次由第一卷积层、第一Batch Normalization层、第一ReLU激活函数层、第二卷积层、第二Batch Normalization层、第二ReLU激活函数层、平均池化层构成，将包含位置信息的嵌入向量/>输入到置信度解码器的卷积模块中，输出得到置信度增强结果O_con；

(j-3)置信分类模型的重建解码器由第一分支、第二分支、第三分支构成，重建解码器的第一分支依次由卷积层、Batch Normalization层、ReLU激活函数层、Python中PIL库中的save函数构成，重建解码器的第二分支依次由Python中的Flatten函数、线性层、Python中的max函数构成，重建解码器的第三分支依次由Python中的Flatten函数、线性层构成，将强化编码结果O′_DFER与置信度增强结果O_con相加操作得到特征O′，将特征O′输入到重建解码器的第一分支中，输出得到特征O″，将特征O″与强化编码结果O′_DFER进行相加操作，得到图像增强结果V_D，将特征O′输入到重建解码器的第二分支中，输出得到重建解码结果R，将特征O′输入到重建解码器的第三分支中，输出得到特征O″′，将特征O″′与置信度增强结果O_con进行相加操作，得到置信度增强结果V_C。

8.根据权利要求1所述的基于双编码器的肺部医学影像增强方法，其特征在于：步骤(k)中通过交叉熵损失函数利用Adam优化器迭代置信分类模型，得到预训练后的置信分类模型。

9.根据权利要求1所述的基于双编码器的肺部医学影像增强方法，其特征在于：步骤(l)中利用NLM去噪算法对待增强的肺部医学图像V″去噪，得到去噪后的肺部医学影像V″′，用Python中的dataset类将去噪后的肺部医学影像V″′按照类别封装，得到预处理后的肺部医学图像V″_IMGNet。