CN113822865B - 一种基于深度学习的腹部ct图像肝脏自动分割方法 - Google Patents
一种基于深度学习的腹部ct图像肝脏自动分割方法 Download PDFInfo
- Publication number
- CN113822865B CN113822865B CN202111096723.2A CN202111096723A CN113822865B CN 113822865 B CN113822865 B CN 113822865B CN 202111096723 A CN202111096723 A CN 202111096723A CN 113822865 B CN113822865 B CN 113822865B
- Authority
- CN
- China
- Prior art keywords
- network
- image
- feature map
- unet
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30056—Liver; Hepatic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medical Informatics (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
一种基于深度学习的腹部CT图像肝脏自动分割方法属于医学图像分割技术领域,目的在于解决现有技术存在的整体网络复杂、训练开销大、训练过程较长、网络难收敛、无法捕获长距离依赖信息导致的分割精度低的问题。本发明提出了一种基于深度学习的腹部CT图像肝脏自动分割方法,以3D UNet为基础网络架构,并在相邻的编码器和解码器间引入残差连接来优化梯度传播和特征传递;同时,将原始UNet中的瓶颈层替换成提出的上下文收集模块(CCM)来获得具有密集上下文信息的特征;通过残差连接的引入和上下文收集模块的应用,本方法有效地提高了腹部CT图像中肝脏的自动分割精度,为肝癌的诊断和治疗提供了更有利的前提条件。
Description
技术领域
本发明属于医学图像分割技术领域,具体涉及一种基于深度学习的腹部CT图像肝脏自动分割方法。
背景技术
临床上从腹部CT图像中分割肝脏主要依靠有经验医生依据先验知识手动勾画边界和轮廓,提取肝脏感兴趣区域,特点是耗时时间长,效率较低,可重复性差。随着计算机技术的发展,各种肝脏的自动化分割方法相继被提出。
目前基于深度学习的肝脏分割方法主要采用FCN或UNet作为基础网络架构,在网络中引入残差连接或密集连接,并结合注意力机制进行肝脏注意区域的校准,从而准确地从腹部CT图像中分割出肝脏感兴趣区域。
目前基于深度学习的肝脏分割方法主要关注于注意力机制的使用和级联网络结构。注意力机制的使用仅仅使网络关注于重要部分,对性能的提升有限;而级联网络结构整体网络复杂,训练开销大,训练过程较长,网络难收敛。上述的方法都忽略了肝脏分割本身属于密集预测任务,需要丰富密集的上下文信息,而受限于深度卷积神经网络自身架构,网络无法捕获长距离依赖信息,因此只能获得局部的上下文信息,导致网络分割精度提升到一定程度便遭遇性能瓶颈。
发明内容
本发明的目的在于提出一种基于深度学习的腹部CT图像肝脏自动分割方法,解决现有技术存在的整体网络复杂、训练开销大、训练过程较长、网络难收敛、无法捕获长距离依赖信息导致的分割精度低的问题。
为实现上述目的,本发明的一种基于深度学习的腹部CT图像肝脏自动分割方法包括以下步骤:
步骤一:构建改进的3D UNet神经网络模型;
步骤二:数据预处理,构建神经网络训练集和测试集;具体步骤为:
1)采集多个病人的腹部CT图像作为原始数据集,原始数据平面切片内尺寸大小为512*512,切片厚度各异;将原始数据集按照3:1比例分为训练集和测试集;
2)对步骤1)中获得的多个病人的腹部CT图像进行重采样使每个病人的数据体素空间分辨率相同;
3)对步骤2)中获得的多个重采样后的图像进行2倍的平面内下采样操作,将图像大小由512*512缩小到256*256;
4)对步骤3)缩小尺寸后的多个图像进行[-200,200]的窗口化操作来突出肝脏区域并消除不相关细节的影响;然后进行随机翻转、随机旋转以及直方图均衡化数据增强来进一步增强图像特征和扩充数据集得到增强后的病人体数据;
5)对步骤4)中得到的增强后的病人体数据进行分块操作,将增强后的病人体数据中每相邻的48张切片为一个训练数据块,每次移动3张切片进行分块,从而得到由大小为256*256*48的数据块组成的训练集和测试集;
步骤三:设置网络初始学习率、学习率衰减方式、网络迭代次数以及损失函数;此处使用的初始学习率为0.0001,学习率衰减方式为指数衰减,网络迭代次数为50次,损失函数选择focal loss焦点损失函数;
步骤四:利用训练集进行网络模型训练,待训练完成后使用测试集图像进行模型分割效果评估。
步骤一中所述的改进的3D UNet神经网络模型具体为:
网络整体架构:本网络采用3D UNet作为基本网络架构,并在UNet相邻的编码器和解码器间添加残差连接;将UNet原始瓶颈层替换为上下文收集模块。
步骤三中所述的损失函数为:
L=αLdice+βLbce
其中:L为本网络损失函数;
Ldice表示Dice损失函数;
Lbce表示二元交叉熵损失函数;
α,β分别为对应的平衡因子,根据实验对比,α设置为1,β设置为0.5。
所述上下文收集模块包括通道维度衰减、十字路径的第一上下文收集块以及十字路径的第二上下文收集模块;3D UNet编码器输出的特征图E经1*1*1卷积对通道维度进行降维操作得到特征图F,后经第一上下文收集块处理后得到具备十字路径稀疏上下文信息的特征图F′,最后经第二上下文收集块处理后得到具备全图像密集上下文信息的特征图F″。
所述第一上下文收集块对于输入的特征图F∈RC×D×H×W,进行两个1*1*1卷积进行通道降维得到特征图Q∈RC1×D×H×W和K∈RC1×D×H×W;然后对Q中每个像素位置向量与K中该像素位置的十字路径位置上的所有像素向量进行向量相乘;得到像素向量之间的相关度图D∈R(D+H+W)×D×H×W;进一步对相关度图D进行softmax操作得到权重图W;然后对特征图F再进行一次1*1*1卷积操作,保持通道维度不变得到特征图V∈RC×D×H×W;对相关度图D中每个像素位置向量和V中对应的空间十字路径上的像素向量相乘并与原特征图F对应位置相加;最后可以得到经过上下文信息加强的特征图F′。
本发明的有益效果为:本发明的一种基于深度学习的腹部CT图像肝脏自动分割方法采用3D UNet的基础架构,可以很好地学习三维切片深度上的特征,同时设计了丰富的上下文收集模块CCM,该模块以较小的计算量和GPU资源耗费达到和非局部网络相同的功能。通过CCM,网络可以得到有利于密集预测任务的特征,从而显著提高模型的分割精度。最后,我们将残差连接引入3D UNet中,可以帮助网络更好地收敛,有利于特征和梯度的传播,也提高了模型的分割精度。
附图说明
图1为本发明构建改进的3D UNet神经网络模型总体结构图;
图2残差连接示意图
图3为本发明中上下文收集模块CCM结构示意图;
图4为本发明中上下文收集块CCB结构示意图;
图5本发明模型在LiTS数据集上部分分割结果。
具体实施方式
下面结合附图对本发明的实施方式作进一步说明。
本发明遵循3D UNet出色的解码器和编码器结构,并在相邻的阶段中引入残差连接来帮助网络更好地收敛和加强特征重用;为了捕获具备全图像依赖的丰富上下文信息,本发明设计了上下文收集模块并作为UNet的瓶颈层。
参见附图1-附图4,本发明的一种基于深度学习的腹部CT图像肝脏自动分割方法包括以下步骤:
步骤一:构建改进的3D UNet神经网络模型;
步骤二:数据预处理,构建神经网络训练集和测试集;具体步骤为:
1)采集多个病人的腹部CT图像作为原始数据集,原始数据平面切片内尺寸大小为512*512,切片厚度各异;将原始数据集按照3:1比例分为训练集和测试集;
2)对步骤1)中获得的多个病人的腹部CT图像进行重采样使每个病人的数据体素空间分辨率相同;
3)对步骤2)中获得的多个重采样后的图像进行2倍的平面内下采样操作,将图像大小由512*512缩小到256*256;
4)对步骤3)缩小尺寸后的多个图像进行[-200,200]的窗口化操作来突出肝脏区域并消除不相关细节的影响;然后进行随机翻转、随机旋转以及直方图均衡化数据增强来进一步增强图像特征和扩充数据集得到增强后的病人体数据;
5)对步骤4)中得到的增强后的病人体数据进行分块操作,将增强后的病人体数据中每相邻的48张切片为一个训练数据块,每次移动3张切片进行分块,从而得到由大小为256*256*48的数据块组成的训练集和测试集;
步骤三:设置网络初始学习率、学习率衰减方式、网络迭代次数以及损失函数;此处使用的初始学习率为0.0001,学习率衰减方式为指数衰减,网络迭代次数为50次,损失函数选择focal loss焦点损失函数;
步骤四:利用训练集进行网络模型训练,待训练完成后使用测试集图像进行模型分割效果评估。
步骤一中所述的改进的3D UNet神经网络模型具体为:
网络整体架构:本网络采用3D UNet作为基本网络架构,并在UNet相邻的编码器和解码器间添加残差连接,改善特征和梯度传递。为了获取密集丰富的上下文信息,将UNet原始瓶颈层替换为上下文收集模块;
上下文收集模块架构;上下文收集模块主要包含通道降维部分和两个相同结构的上下文收集块。通道降维部分通过1*1*1卷积实现,上下文收集块采用典型的非局部网络的自注意结构,通过query,key,value之间的互相运算来获取像素间相似度联系,计算具备丰富上下文的特征图。
为了利用Dice损失函数对类不平衡不敏感的特性和交叉熵损失函数稳定的特性,我们将二元交叉熵损失函数和Dice损失函数结合,提出了混合损失函数:步骤三中所述的损失函数为:
L=αLdice+βLbce
其中:L为本网络损失函数;
Ldice表示Dice损失函数;
Lbce表示二元交叉熵损失函数;
α,β分别为对应的平衡因子,根据实验对比,α设置为1,β设置为0.5。
所述上下文收集模块包括通道维度衰减、十字路径的第一上下文收集块以及十字路径的第二上下文收集模块;3D UNet编码器输出的特征图E经1*1*1卷积对通道维度进行降维操作得到特征图F,后经第一上下文收集块处理后得到具备十字路径稀疏上下文信息的特征图F′,最后经第二上下文收集块处理后得到具备全图像密集上下文信息的特征图F″。
所述第一上下文收集块对于输入的特征图F∈RC×D×H×W,进行两个1*1*1卷积进行通道降维得到特征图Q∈RC1×D×H×W和K∈RC1×D×H×W;然后对Q中每个像素位置向量与K中该像素位置的十字路径位置上的所有像素向量进行向量相乘;得到像素向量之间的相关度图D∈R(D+H+W)×D×H×W;进一步对相关度图D进行softmax操作得到权重图W;然后对特征图F再进行一次1*1*1卷积操作,保持通道维度不变得到特征图V∈RC×D×H×W;对相关度图D中每个像素位置向量和V中对应的空间十字路径上的像素向量相乘并与原特征图F对应位置相加;最后可以得到经过上下文信息加强的特征图F′。
经过实验验证,该发明方法在MICCAI2017肝脏肿瘤分割挑战赛LiTS数据集上实现了0.961的Dice每例得分和0.963的Dice全局得分,部分分割结果实例如图5所示。
Claims (2)
1.一种基于深度学习的腹部CT图像肝脏自动分割方法,其特征在于,包括以下步骤:
步骤一:构建改进的3D UNet神经网络模型;
步骤二:数据预处理,构建神经网络训练集和测试集;具体步骤为:
1)采集多个病人的腹部CT图像作为原始数据集,原始数据平面切片内尺寸大小为512*512,切片厚度各异;将原始数据集按照3:1比例分为训练集和测试集;
2)对步骤1)中获得的多个病人的腹部CT图像进行重采样使每个病人的数据体素空间分辨率相同;
3)对步骤2)中获得的多个重采样后的图像进行2倍的平面内下采样操作,将图像大小由512*512缩小到256*256;
4)对步骤3)缩小尺寸后的多个图像进行[-200,200]的窗口化操作来突出肝脏区域并消除不相关细节的影响;然后进行随机翻转、随机旋转以及直方图均衡化数据增强来进一步增强图像特征和扩充数据集得到增强后的病人体数据;
5)对步骤4)中得到的增强后的病人体数据进行分块操作,将增强后的病人体数据中每相邻的48张切片为一个训练数据块,每次移动3张切片进行分块,从而得到由大小为256*256*48的数据块组成的训练集和测试集;
步骤三:设置网络初始学习率、学习率衰减方式、网络迭代次数以及损失函数;此处使用的初始学习率为0.0001,学习率衰减方式为指数衰减,网络迭代次数为50次,损失函数选择focal loss焦点损失函数;
步骤四:利用训练集进行网络模型训练,待训练完成后使用测试集图像进行模型分割效果评估;
步骤一中所述的改进的3D UNet神经网络模型具体为:
网络整体架构:本网络采用3D UNet作为基本网络架构,并在UNet相邻的编码器和解码器间添加残差连接;将UNet原始瓶颈层替换为上下文收集模块;
所述上下文收集模块包括通道维度衰减、十字路径的第一上下文收集块以及十字路径的第二上下文收集模块;3D UNet编码器输出的特征图E经1*1*1卷积对通道维度进行降维操作得到特征图F,后经第一上下文收集块处理后得到具备十字路径稀疏上下文信息的特征图F′,最后经第二上下文收集块处理后得到具备全图像密集上下文信息的特征图F″;
2.根据权利要求1所述的一种基于深度学习的腹部CT图像肝脏自动分割方法,其特征在于,步骤三中所述的损失函数为:
L=αLdice+βLbce
其中:L为本网络损失函数;
Ldice表示Dice损失函数;
Lbce表示二元交叉熵损失函数;
α,β分别为对应的平衡因子,根据实验对比,α设置为1,β设置为0.5。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111096723.2A CN113822865B (zh) | 2021-09-18 | 2021-09-18 | 一种基于深度学习的腹部ct图像肝脏自动分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111096723.2A CN113822865B (zh) | 2021-09-18 | 2021-09-18 | 一种基于深度学习的腹部ct图像肝脏自动分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113822865A CN113822865A (zh) | 2021-12-21 |
CN113822865B true CN113822865B (zh) | 2023-05-05 |
Family
ID=78914896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111096723.2A Active CN113822865B (zh) | 2021-09-18 | 2021-09-18 | 一种基于深度学习的腹部ct图像肝脏自动分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113822865B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115018784B (zh) * | 2022-05-31 | 2024-03-12 | 广东电网有限责任公司 | 一种导线散股缺陷的检测方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889852A (zh) * | 2018-09-07 | 2020-03-17 | 天津大学 | 基于残差-注意力深度神经网络的肝脏分割方法 |
CN110889853A (zh) * | 2018-09-07 | 2020-03-17 | 天津大学 | 基于残差-注意力深度神经网络的肿瘤分割方法 |
WO2020235951A1 (ko) * | 2019-05-21 | 2020-11-26 | 삼성전자 주식회사 | 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치 |
CN112598656A (zh) * | 2020-12-28 | 2021-04-02 | 长春工业大学 | 一种基于UNet++优化和权值预算的脑肿瘤分割算法 |
CN112927255A (zh) * | 2021-02-22 | 2021-06-08 | 武汉科技大学 | 一种基于上下文注意力策略的三维肝脏影像语义分割方法 |
-
2021
- 2021-09-18 CN CN202111096723.2A patent/CN113822865B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889852A (zh) * | 2018-09-07 | 2020-03-17 | 天津大学 | 基于残差-注意力深度神经网络的肝脏分割方法 |
CN110889853A (zh) * | 2018-09-07 | 2020-03-17 | 天津大学 | 基于残差-注意力深度神经网络的肿瘤分割方法 |
WO2020235951A1 (ko) * | 2019-05-21 | 2020-11-26 | 삼성전자 주식회사 | 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치 |
CN112598656A (zh) * | 2020-12-28 | 2021-04-02 | 长春工业大学 | 一种基于UNet++优化和权值预算的脑肿瘤分割算法 |
CN112927255A (zh) * | 2021-02-22 | 2021-06-08 | 武汉科技大学 | 一种基于上下文注意力策略的三维肝脏影像语义分割方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113822865A (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022047625A1 (zh) | 一种图像处理方法、系统和计算机存储介质 | |
CN113673307B (zh) | 一种轻量型的视频动作识别方法 | |
CN111325751B (zh) | 基于注意力卷积神经网络的ct图像分割系统 | |
CN112465827B (zh) | 一种基于逐类卷积操作的轮廓感知多器官分割网络构建方法 | |
CN109033945B (zh) | 一种基于深度学习的人体轮廓提取方法 | |
CN112085677A (zh) | 一种图像处理方法、系统和计算机存储介质 | |
CN112767417B (zh) | 一种基于级联U-Net网络的多模态图像分割方法 | |
CN111325750B (zh) | 一种基于多尺度融合u型链神经网络的医学图像分割方法 | |
CN111862136A (zh) | 基于卷积神经网络的多模态核磁影像缺血性脑卒中病变分割方法 | |
CN113191968B (zh) | 三维超声图像盲去噪模型的建立方法及其应用 | |
CN114037714B (zh) | 一种面向前列腺系统穿刺的3d mr与trus图像分割方法 | |
CN116563204A (zh) | 一种融合多尺度残差注意力的医学图像分割方法 | |
CN111696042B (zh) | 基于样本学习的图像超分辨重建方法 | |
CN111127490A (zh) | 一种基于循环残差U-Net网络的医学图像分割方法 | |
CN113822865B (zh) | 一种基于深度学习的腹部ct图像肝脏自动分割方法 | |
CN116228792A (zh) | 一种医学图像分割方法、系统及电子装置 | |
CN114266939A (zh) | 一种基于ResTLU-Net模型的脑提取方法 | |
Qin | Transfer learning with edge attention for prostate MRI segmentation | |
CN113160229A (zh) | 基于层级监督级联金字塔网络的胰腺分割方法及装置 | |
CN116721253A (zh) | 一种基于深度学习的腹部ct图像多器官分割方法 | |
You et al. | EfficientUNet: An efficient solution for breast tumour segmentation in ultrasound images | |
CN116542924A (zh) | 一种前列腺病灶区域检测方法、装置及存储介质 | |
CN116152060A (zh) | 一种双特征融合引导的深度图像超分辨率重建方法 | |
CN115908451A (zh) | 一种结合多视图几何及迁移学习的心脏ct影像分割方法 | |
Yan et al. | Two and multiple categorization of breast pathological images by transfer learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |