CN113808085A - 脑部ct图像的分割模型的训练方法、分割方法和训练装置 - Google Patents
脑部ct图像的分割模型的训练方法、分割方法和训练装置 Download PDFInfo
- Publication number
- CN113808085A CN113808085A CN202110996998.5A CN202110996998A CN113808085A CN 113808085 A CN113808085 A CN 113808085A CN 202110996998 A CN202110996998 A CN 202110996998A CN 113808085 A CN113808085 A CN 113808085A
- Authority
- CN
- China
- Prior art keywords
- feature map
- fusion
- brain
- segmentation
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 title claims abstract description 74
- 210000004556 brain Anatomy 0.000 title claims abstract description 68
- 238000012549 training Methods 0.000 title claims abstract description 57
- 230000004927 fusion Effects 0.000 claims abstract description 93
- 238000012545 processing Methods 0.000 claims abstract description 48
- 230000002776 aggregation Effects 0.000 claims abstract description 21
- 238000004220 aggregation Methods 0.000 claims abstract description 21
- 238000007499 fusion processing Methods 0.000 claims abstract description 16
- 238000010586 diagram Methods 0.000 claims description 40
- 238000011176 pooling Methods 0.000 claims description 35
- 238000001514 detection method Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 abstract description 9
- 238000002591 computed tomography Methods 0.000 description 54
- 206010008118 cerebral infarction Diseases 0.000 description 16
- 230000000302 ischemic effect Effects 0.000 description 14
- 201000006474 Brain Ischemia Diseases 0.000 description 12
- 206010008120 Cerebral ischaemia Diseases 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 208000006011 Stroke Diseases 0.000 description 5
- 208000026106 cerebrovascular disease Diseases 0.000 description 5
- 208000028867 ischemia Diseases 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000002490 cerebral effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 206010060840 Ischaemic cerebral infarction Diseases 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007654 ischemic lesion Effects 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010002660 Anoxia Diseases 0.000 description 1
- 241000976983 Anoxia Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010008190 Cerebrovascular accident Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 208000032382 Ischaemic stroke Diseases 0.000 description 1
- 206010028851 Necrosis Diseases 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000007953 anoxia Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000017074 necrotic cell death Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20088—Trinocular vision calculations; trifocal tensor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30016—Brain
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明公开了一种脑部CT图像的分割模型的训练方法、分割方法和训练装置。该训练方法包括:获取待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图,获取待训练的解码网络根据输入特征图得到的分割结果,解码网络对若干不同通道数的特征图进行空间信息融合处理和通道信息融合处理,并对得到的空间融合特征和通道融合特征进行聚合处理,得到分割结果;计算分割结果与脑部CT样本图像的标签信息之间的差异,并根据差异更新编码网络和解码网络的模型参数。在训练过程中通过空间信息融合提取编码阶段丰富的空间信息,提高分割的精度,同时通过通道信息融合建立通道之间的动态非依赖关系,简化学习过程,显著地增强了模型的表征能力。
Description
技术领域
本发明属于医学图像处理技术领域,具体地讲,涉及一种用于CT图像的分割模型的训练方法、分割方法、训练装置、分割装置、计算机可读存储介质、计算机设备。
背景技术
脑梗死是临床发病率较高的脑血管疾病,该病症会因脑部血液循环受阻,致使局部脑组织缺血、缺氧,进而出现软化坏死的情况。超急性期大面积脑梗死是脑梗死中较为严重的类型,若未能及时为患者进行诊断及治疗则会对患者生命安全构成严重威胁。因为计算机断层扫描(CT)成像快、成本低的优势,其在临床中被广泛用于快速诊断缺血性脑梗死。当前,CT影像分析主要由医生根据经验完成的,受过良好训练的放射科医生能够较好地辨认,但对缺血程度的判断一致性较差。同时在临床上,医生很难判别早期缺血变化的程度,尤其在超急性期中。除此之外,当前多才用手动的方法分割缺血病灶,但手动分割十分耗时,同时分割结果也依赖操作者的主观判断。然而,现有的超急性期脑缺血图像处理的精度低,误差大,检测不准确;同时如果对脑卒中不能够及时的评估风险,导致不能及时的治疗,贻误病情。
值得注意的是,在现有的关于脑卒中CT影像的研究工作中,包括相关的研究论文和相关专利中,大部分脑缺血分割和检测方法都是基于传统图像处理算法的基于传统图像处理方法,往往需要花大量算力去计算图像的形状,灰度,纹理特征等,检测速度和精度都不高。
另外也有部分学者提出采用深度学习方法,基于卷积神经网络进行分割任务,克服前期的图像特征提取困难,提高了分割速度,同时也有较好的分割精度。然而目前深度学习中采用的卷积神经网络较为单一,且全连接层的加入使得网络整体训练参数较为庞大,计算较为复杂,信息量大,网络训练时间较长,分割精度较差。后基于此改进的全卷积网络的整体分割精度依然较低,且基于像素的分类没有考虑像素之间的关系,缺乏空间一致性。
发明内容
(一)本发明所要解决的技术问题
本发明解决的技术问题是:如何提供一种能充分关注图像的空间信息和通道间联系的分割模型。
(二)本发明所采用的技术方案
一种脑部CT图像的分割模型的训练方法,待训练的分割模型包括编码网络和解码网络,所述训练方法包括:
获取待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图,所述输入特征图包括若干不同通道数的特征图;
获取待训练的解码网络根据所述输入特征图得到的分割结果,其中所述解码网络对若干不同通道数的特征图进行空间信息融合处理和通道信息融合处理,并对得到的空间融合特征和通道融合特征进行聚合处理,得到分割结果;
计算所述分割结果与脑部CT样本图像的标签信息之间的差异,并根据所述差异更新所述编码网络和所述解码网络的模型参数。
优选地,所述待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图的方法包括:
对所述带标签信息的脑部CT样本图像进行卷积处理得到底层特征图;
对所述底层特征图依次进行若干次卷积池化处理,得多若干份通道数递增的中间层特征图,其中第一次卷积池化处理的输入为所述底层特征图,每次卷积池化处理后输出一份中间层特征图并作为下一次卷积池化处理的输入;
对最后一次卷积池化处理后输出的中间层特征图进行非局部注意力处理,得到高层特征图,所述底层特征图、除最后一次卷积池化处理后输出的中间层特征图之外的其他中间层特征图、所述高层特征图构成所述输入特征图。
优选地,所述卷积池化处理的方法包括:
对输入依次进行两次卷积处理和一次最大池化处理,得到待输出特征;
将所述待输出特征的通道数增加一倍,得到中间层特征图。
优选地,所述解码网络包括由高级别至低级别依次级联的若干融合模块,每个所述融合模块包括空间融合单元、通道融合单元、聚合单元和上采样卷积单元,所述空间融合单元用于对特征图的空间信息进行加权处理,所述通道融合单元用于对特征图的通道信息进行加权处理,所述聚合单元用于聚合所述空间融合单元和所述通道融合单元的输出数据,所述上采样卷积单元用于对上一级所述融合模块的聚合单元输出的数据进行上采样、反卷积和卷积处理,并将得到的数据作为所述通道融合单元的输入数据,其中最高级的融合模块的上采样卷积单元的输入数据为所述高层特征图,各个融合模块的空间融合单元的输入数据为所述输入特征图中除所述高层特征图之外的其他特征图,且空间融合单元的输入数据的通道数随着级别递减,最低级的融合模块的聚合单元的输出数据为分割结果。
优选地,所述空间融合单元对特征图的空间信息进行加权处理的方法包括:
分别计算输入的特征图各像素的空间信息集合的平均值和最大值,得到平均值特征图和最大值特征图;
分别对所述平均值特征图和所述最大值特征图进行卷积处理,并通过PReLu函数激活,得到空间信息权重;
根据将所述空间信息权重与所述输入的特征图进行矩阵乘法运算,得到所述空间融合单元的输出数据。
优选地,所述通道融合单元对特征图的通道信息进行加权处理的方法包括:
分别对输入的特征图进行全局最大化处理和全局平均池化处理,并对全局最大化处理和全局平均池化处理得到结果进行矩阵加法运算,得到通道信息权重;
根据所述通道信息权重对所述输入的特征图进行sigmoid变换,得到所述通道融合单元的输出数据。
本申请还公开了一种用于脑部CT图像的分割方法,所述分割方法包括:
获取待检测的脑部CT图像;
将所述脑部CT图像输入到根据上述的训练方法进行训练得到的脑部CT图像的分割模型,分割模型输出检测结果。
本申请还公开了一种脑部CT图像的分割模型的训练装置,所述训练装置包括:
第一获取单元,用于获取待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图,所述输入特征图包括若干不同通道数的特征图;
第二获取单元,用于获取待训练的解码网络根据所述输入特征图得到的分割结果,其中所述解码网络对若干不同通道数的特征图进行空间信息融合处理和通道信息融合处理,并对得到的空间融合特征和通道融合特征进行聚合处理,得到分割结果;
训练单元,用于计算所述分割结果与脑部CT样本图像的标签信息之间的差异,并根据所述差异更新所述编码网络和所述解码网络的模型参数。
本申请还公开了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种方法。
本申请还公开了一种计算机设备,所述计算机设备包括计算机可读存储介质、处理器和存储在所述计算机可读存储介质中的计算机程序,所述计算机程序被处理器执行时实现上述任一种方法。
(三)有益效果
本发明公开了一种脑部CT图像的分割模型的训练方法、分割方法,相对于现有方法,具有如下技术效果:
在训练过程中利用空间融合单元提取了编码阶段丰富的空间信息,使得解码层也能利用浅层丰富的空间信息,提高了分割的精度,同时利用通道融合单元建立了通道之间的动态非依赖关系,简化了学习过程,显著地增强了模型的表征能力。
附图说明
图1为本发明的实施例一的脑部CT图像的分割模型的训练方法的流程图;
图2为本发明的实施例一的编码网络的提取输入特征图的流程图;
图3为本发明的实施例一的分割模型的数据处理过程示意图;
图4为本发明的实施例一的空间融合单元的数据融合示意图;
图5为本发明的实施例一的通道融合单元的数据融合示意图;
图6为本发明的实施例三的脑部CT图像的分割模型的训练装置的示意图;
图7为本发明的实施例四的计算机设备示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在详细描述本申请的各个实施例之前,首先简单描述本申请的发明构思:现有技术中采用深度学习方法对脑部CT图像进行分割时,未充分考虑图像的空间信息和像素间的通道联系,模型的分割精度不高。为此,本申请提供了一种脑部CT图像的分割模型的训练方法,首先利用编码网络从脑部CT样本图像中提取若干具有丰富图像信息的特征图,接着利用解码网络对若干不同通道数的特征图进行空间信息融合处理和通道信息融合处理,并对得到的空间融合特征和通道融合特征进行聚合处理,得到分割结果,最后根据分割结果和脑部CT样本图像的标签信息之间的差异来调整模型参数。
具体地,如图1所示,本实施例一的脑部CT图像的分割模型包括编码网络和解码网络两部分,其中脑部CT图像的分割模型的训练方法包括如下步骤:
步骤S10:获取待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图,所述输入特征图包括若干不同通道数的特征图;
步骤S20:获取待训练的解码网络根据所述输入特征图得到的分割结果,其中所述解码网络对若干不同通道数的特征图进行空间信息融合处理和通道信息融合处理,并对得到的空间融合特征和通道融合特征进行聚合处理,得到分割结果;
步骤S30:计算所述分割结果与脑部CT样本图像的标签信息之间的差异,并根据所述差异更新所述编码网络和所述解码网络的模型参数。
其中,本实施例一的脑部CT图像以超急性期大面积脑缺血CT影像为例,在进行本实施例一的训练方法之前,首先要进行数据处理,包括如下过程:
1、数据收集和预处理:收集超急性期大面积脑缺血CT影像数据,并进行标注;由于不同机器采集的CT影像大小不一致,需要将CT影像切片裁剪到相同大小(512×512)。同时,由于在CT图像中各组织的Hounsfield Unit(HU)相差较大,需要选定窗口以更好表现脑实质中的缺血区域。在本实施例一中,我们选定的窗口值为-30-100HU(图像像素值大于100Hu的设置为100,小于-30的设置为-30,其余不变),以便更好地显示病变组织。之后再将数据集划分成相应的训练集、验证集和测试集。
2、数据增强:原始的训练数据较为单调,对于网络的信息丰富度来说会较为欠缺,少且单调的数据信息会导致网络学习的泛化性降低,所以需要对原始图像数据进行数据扩充与增强。我们对每张影像切片进行随机裁剪、旋转、位移等几何变换,同时也随机对切片进行50%概率的模糊、锐化、扭曲、边缘检测、加噪等操作。同时由于病例中也存在大量的健康组织切片,造成数据的极度不平衡。若将健康组织全部去除,又降低了网络的泛化性。为了减少上述问题,我们针对性的扩充数据,5次对有病变的切片进行一次增广操作,就对无病变区域进行一次增广操作。
3、数据归一化:为了方便网络训练,需要对原始脑CT影像以及脑部缺血区域金标准进行归一化处理。这里使用的是线性归一化,将灰度数据归一化到[0,1]区间,其公式为:
其中Xnorm为归一化后的数据,X为原始数据,Xmax、Xmin分别为原始数据集的最大值和最小值,且对输入分割模型之前,灰度为0/255的脑部缺血区域数据进行0-1标准化作为缺血区域金标准,数据除以255后以0.5为阈值,高于0.5设为1,低于0.5设为0。
进一步地,在步骤S10中,待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图的方法包括如下步骤:
步骤S101:对带标签信息的脑部CT样本图像进行卷积处理得到底层特征图;
步骤S102:对底层特征图依次进行若干次卷积池化处理,得多若干份通道数递增的中间层特征图,其中第一次卷积池化处理的输入为底层特征图,每次卷积池化处理后输出一份中间层特征图并作为下一次卷积池化处理的输入;
步骤S103:对最后一次卷积池化处理后输出的中间层特征图进行非局部注意力处理,得到高层特征图,底层特征图、除最后一次卷积池化处理后输出的中间层特征图之外的其他中间层特征图、高层特征图构成输入特征图。
示例性地,如图3所示,本实施例一编码网络是基于U型深度网络U-Net加以拓展改进得到的,首先对脑部CT样本图像进行一次3×3卷积操作获得32通道的特征图像Conv1/32,后续再通过四次卷积池化处理操作来提取图像特征。每次卷积池化处理包含两个3×3的卷积的重复应用,在每个卷积层后都有一个批处理归一化层和非线性激活函数PReLu,在两次卷积后再通过一个2×2的最大池化操作,并且在在每次池化操作后,我们都将特征的通道数进行翻倍,以提取更为丰富的影像特征,得到四份通道数分别为64、128、256和512的中间层特征图Conv2/64、Conv3/128、Conv4/256、Conv1/512。在第四次卷积池化处理后引入非局部注意力模块(Non-local),得到高层特征图。这样可以利用全局上下文信息来增加对特征的提取,该模块在计算某个位置的响应时,会考虑所有通道位置和空间位置的特征的加权,以此来提高对脑缺血区域的检测,抑制假阳性。
在步骤S20中,如图3所示,解码网络包括由高级别至低级别依次级联的若干融合模块,每个融合模块包括空间融合单元SIF、通道融合单元CIF、聚合单元CAT和上采样单元UWC,空间融合单元用于对特征图的空间信息进行加权处理,通道融合单元CIF用于对特征图的通道信息进行加权处理,聚合单元CAT用于聚合空间融合单元SIF和通道融合单元CIF的输出数据,上采样卷积单元UWC用于对上一级融合模块的聚合单元CAT输出的数据进行上采样、反卷积和卷积处理,并将得到的数据作为通道融合单元CIF的输入数据,其中最高级的融合模块的上采样卷积单元UWC的输入数据为高层特征图,各个融合模块的空间融合单元SIF的输入数据为输入特征图中除高层特征图之外的其他特征图,且空间融合单元SIF的输入数据的通道数随着级别递减,最低级的融合模块的聚合单元CAT的输出数据为分割结果。
示例性地,融合模块的数量为四个,如图4所示,空间融合单元对特征图的空间信息进行加权处理的方法包括:分别计算输入的特征图各像素的空间信息集合的平均值和最大值,得到平均值特征图和最大值特征图;分别对平均值特征图和最大值特征图进行卷积处理,并通过PReLu函数激活,得到空间信息权重;根据将空间信息权重与输入的特征图进行矩阵乘法运算,得到所述空间融合单元的输出数据。其中,X是当前空间融合单元的输入特征,Fmax和Favg分别是求最大值和平均值操作,W是空间信息权重,Y是当前空间融合单元的输出特征。对特征图上的同一位置点上的通道信息进行压缩融合到同一个空间位置上。
示例性地,对于同一级联的编码部分特征数据作为该空间融合单元的输入,在通道维度上进行压缩,分别对特征图各像素的空间信息集合求其平均值和最大值,分别获得两个单通道二维的特征图。之后再将这两个特征图经过1*1的卷积,通过PReLu函数激活,得到最终的空间信息权重。最后将获得的空间信息权重通过简单的矩阵乘法加权到该空间融合单元的输入,将该加权过的空间信息作为该空间融合单元的输出。
如图5所示,通道融合单元CIF对特征图的通道信息进行加权处理的方法包括:分别对输入的特征图进行全局最大化处理和全局平均池化处理,并对全局最大化处理和全局平均池化处理得到结果进行矩阵加法运算,得到通道信息权重;根据通道信息权重对所述输入的特征图进行sigmoid变换,得到通道融合单元的输出数据。
示例性地,对特征图上的每一个通道的空间信息进行压缩融合到同一个通道上。对于更低层获得的解码后的特征信息作为该模块的输入,在空间维度上进行压缩,提高各通道对通道有效信息的敏感度。利用全局最大池化和全局平均池化将各个通道的空间信息融合得到加权系数。然后在利用PReLu函数对得到的通道信息权值激活,以此控制对每个通道的激励。但同时在通道间的信息并不是孤立存在的,并且这些信息之间存在非线性的相互作用。为了在获得全局信息的同时关注多个通道信息,加强通道的相互依赖性,可以在获得通道信息权重后,利用“sigmoid”变换将其映射到[0,1],以此来捕捉通道信息的相关性。通过建立通道之间的依赖关系,更好地进行自适应重新校准与通道相关的特征和响应。最后将获得的通道信息权重通过简单的矩阵乘法加权到该通道融合单元CIF的输入,得到通道融合单元CIF的输出数据。
进一步地,上采样卷积单元UWC将上层的特征信息通过的2*2反卷积得到分辨率更高的特征图,同时再通过两个卷积层将特征信息的通道数减半,以减少信息冗余。聚合单元CAT将通道融合单元CIF得到的通道信息和空间融合单元SIF得到的空间信息进行简单的连接,在本实施例一中是将两种信息进行简单的叠加操作。
在步骤S30中,计算分割结果与脑部CT样本图像的标签信息之间的差异时,需要选择合适的损失函数,其中在医学图像分割任务中,Dice损失函数是使用最广泛的损失函数,被用于衡量预测结果与金标准之间的差异。这种方法直接在评价标准上进行优化,可以得到较高的准确度。但在脑缺血区域分割问题上,缺血区域往往占整个影像较小的部分,也就造成了数据类别的极度不平衡的现象。为了弱化这种不平衡的现象,在牺牲一定的精度条件下,提高像素分类的召回率。因此,本实施例一优先选用Tversky损失函数作为网络训练的损失函数。利用预处理过的脑缺血CT影像数据进行模型训练,达到最佳收敛状态,从而获得分割模型。其中,损失函数的具体计算过程和模型参数的更新过程为本领域技术人员熟知的技术,在此不进行赘述。
本实施例一脑部CT图像的分割模型的训练方法,利用空间融合单元提取了编码阶段丰富的空间信息,使得解码层也能利用浅层丰富的空间信息,提高了分割的精度。同时利用了通道融合单元建立了通道之间的动态非依赖关系,简化了学习过程,显著地增强了模型的表征能力。并且在模型中引入非局部注意力模块(Non-local),利用全局上下文信息来增加对特征的提取。非局部注意力模块在计算某个位置的响应时,会考虑所有通道位置和空间位置的特征的加权。以此来提高对脑缺血区域的检测,抑制假阳性。因此本实施例一提供的的训练方法大大提高了分割模型在临床中对大面积脑缺血的分割和检测性能和效率。
实施例二还提供了一种用于脑部CT图像的分割方法,所述分割方法包括如下步骤:步骤S100、获取待检测的脑部CT图像;步骤S200、将脑部CT图像输入到根据实施例一的训练方法进行训练得到的脑部CT图像的分割模型,分割模型输出检测结果。
进一步,在实际诊断过程中,还包括缺血区域量化与预测步骤以及结果可视化步骤。具体来说,将脑部CT影像输入到训练完成的分割模型中,最终将得到切片每个像素的缺血概率。然后将概率大于0.5的像素视为缺血像素,将其他像素视为背景像素,从而得到缺血区域的分割图。其次使用所有像素的分割图来计算分割图中的3D连通分量并去除小的连通分量以减少误报的影响。接着计算所有剩余连接分量的像素总和,并根据实际体素值获得缺血体积。最后我们将缺血体积超过71cm3的患者视为LHI患者。训练好的脑缺血分割模型和检测算法,可封装部署在常用的Windows系统平台上。对于有缺血的脑CT图像,可以准确的标注出缺血病变组织,并且能有效诊断是否存在大面积脑缺血。如果未能检测出来,则该病患不存在缺血性脑梗死病变。从而有效地实现了超急性期脑缺血的自动分割与检测,缩减了人为观察、思考及判断大面积脑梗死所需要的时间,可以作为计算机辅助手段,为脑卒中等医学研究提供客观依据。
为了验证本实施例一的训练方法训练得到的分割模型的分割性能和检测形状,在采集的超急性期HLI数据集和超急性期缺血性脑卒中分割数据集上进行实验验证。具体算法是基于Keras框架与Tensorflow后端的Python语言实现的,并使用4个24G的TITAN RTXGPU进行训练。将训练数据的85%随机划分为训练集数据,其余数据划分为验证集数据。利用训练集数据对网络训练了50个epoch,batch_size设置为16。同时使用自适应矩估计(adaptive moment estimation,Adam)优化器训练分割网络,其中beta_1设置为0.9,beta_2设置为0.999,epsilon被设置为10-8,初始学习率设为10-4,并在每一轮进行0.9次幂的多项式衰减。
表1.不同方法在超急性期脑缺血数据集上的分割性能
表2.不同方法在超急性期HLI数据集上的检测性能
因此,训练参数一致的前提下用不同方法对超急性期脑缺血数据集进行分割评估,DSC(Dice similarity coefficient)和IOU coefficient(Intersection over union)结果如表1,不同方法在超急性期HLI数据集上的检查结果如表2。通过这两个实验有效验证本实施例一得到分割模型在超急性期大面积脑缺血的自动分割和检测的优越性。
如图6所示,本实施例三公开了一种脑部CT图像的分割模型的训练装置,训练装置包括第一获取单元300、第二获取单元400和训练单元500。第一获取单元300用于获取待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图,输入特征图包括若干不同通道数的特征图;第二获取单元400用于获取待训练的解码网络根据输入特征图得到的分割结果,其中解码网络对若干不同通道数的特征图进行空间信息融合处理和通道信息融合处理,并对得到的空间融合特征和通道融合特征进行聚合处理,得到分割结果;训练单元500用于计算分割结果与脑部CT样本图像的标签信息之间的差异,并根据差异更新编码网络和解码网络的模型参数。
本实施例四还公开了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现实施例一的脑部CT图像的分割模型的训练方法或者实施例二的用于脑部CT图像的分割方法。
本实施例五还公开了一种计算机设备,在硬件层面,如图7所示,该计算机设备包括处理器12、内部总线13、网络接口14、计算机可读存储介质11。处理器12从计算机可读存储介质中读取对应的计算机程序然后运行,在逻辑层面上形成请求处理装置。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。计算机可读存储介质11上存储有计算机程序,计算机程序被处理器执行时实现实施例一的脑部CT图像的分割模型的训练方法或者实施例二的用于脑部CT图像的分割方法。
计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机可读存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上面对本发明的具体实施方式进行了详细描述,虽然已表示和描述了一些实施例,但本领域技术人员应该理解,在不脱离由权利要求及其等同物限定其范围的本发明的原理和精神的情况下,可以对这些实施例进行修改和完善,这些修改和完善也应在本发明的保护范围内。
Claims (10)
1.一种脑部CT图像的分割模型的训练方法,其特征在于,待训练的分割模型包括编码网络和解码网络,所述训练方法包括:
获取待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图,所述输入特征图包括若干不同通道数的特征图;
获取待训练的解码网络根据所述输入特征图得到的分割结果,其中所述解码网络对若干不同通道数的特征图进行空间信息融合处理和通道信息融合处理,并对得到的空间融合特征和通道融合特征进行聚合处理,得到分割结果;
计算所述分割结果与脑部CT样本图像的标签信息之间的差异,并根据所述差异更新所述编码网络和所述解码网络的模型参数。
2.根据权利要求1所述的脑部CT图像的分割模型的训练方法,其特征在于,所述待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图的方法包括:
对所述带标签信息的脑部CT样本图像进行卷积处理得到底层特征图;
对所述底层特征图依次进行若干次卷积池化处理,得多若干份通道数递增的中间层特征图,其中第一次卷积池化处理的输入为所述底层特征图,每次卷积池化处理后输出一份中间层特征图并作为下一次卷积池化处理的输入;
对最后一次卷积池化处理后输出的中间层特征图进行非局部注意力处理,得到高层特征图,所述底层特征图、除最后一次卷积池化处理后输出的中间层特征图之外的其他中间层特征图、所述高层特征图构成所述输入特征图。
3.根据权利要求2所述的脑部CT图像的分割模型的训练方法,其特征在于,所述卷积池化处理的方法包括:
对输入依次进行两次卷积处理和一次最大池化处理,得到待输出特征;
将所述待输出特征的通道数增加一倍,得到中间层特征图。
4.根据权利要求2所述的脑部CT图像的分割模型的训练方法,其特征在于,所述解码网络包括由高级别至低级别依次级联的若干融合模块,每个所述融合模块包括空间融合单元、通道融合单元、聚合单元和上采样卷积单元,所述空间融合单元用于对特征图的空间信息进行加权处理,所述通道融合单元用于对特征图的通道信息进行加权处理,所述聚合单元用于聚合所述空间融合单元和所述通道融合单元的输出数据,所述上采样卷积单元用于对上一级所述融合模块的聚合单元输出的数据进行上采样、反卷积和卷积处理,并将得到的数据作为所述通道融合单元的输入数据,其中最高级的融合模块的上采样卷积单元的输入数据为所述高层特征图,各个融合模块的空间融合单元的输入数据为所述输入特征图中除所述高层特征图之外的其他特征图,且空间融合单元的输入数据的通道数随着级别递减,最低级的融合模块的聚合单元的输出数据为分割结果。
5.根据权利要求4所述的脑部CT图像的分割模型的训练方法,其特征在于,所述空间融合单元对特征图的空间信息进行加权处理的方法包括:
分别计算输入的特征图各像素的空间信息集合的平均值和最大值,得到平均值特征图和最大值特征图;
分别对所述平均值特征图和所述最大值特征图进行卷积处理,并通过PReLu函数激活,得到空间信息权重;
根据将所述空间信息权重与所述输入的特征图进行矩阵乘法运算,得到所述空间融合单元的输出数据。
6.根据权利要求4所述的脑部CT图像的分割模型的训练方法,其特征在于,所述通道融合单元对特征图的通道信息进行加权处理的方法包括:
分别对输入的特征图进行全局最大化处理和全局平均池化处理,并对全局最大化处理和全局平均池化处理得到结果进行矩阵加法运算,得到通道信息权重;
根据所述通道信息权重对所述输入的特征图进行sigmoid变换,得到所述通道融合单元的输出数据。
7.一种用于脑部CT图像的分割方法,其特征在于,所述分割方法包括:
获取待检测的脑部CT图像;
将所述脑部CT图像输入到根据权利要求1至6任一项所述的训练方法进行训练得到的脑部CT图像的分割模型,分割模型输出检测结果。
8.一种脑部CT图像的分割模型的训练装置,其特征在于,所述训练装置包括:
第一获取单元,用于获取待训练的编码网络根据带标签信息的脑部CT样本图像得到的输入特征图,所述输入特征图包括若干不同通道数的特征图;
第二获取单元,用于获取待训练的解码网络根据所述输入特征图得到的分割结果,其中所述解码网络对若干不同通道数的特征图进行空间信息融合处理和通道信息融合处理,并对得到的空间融合特征和通道融合特征进行聚合处理,得到分割结果;
训练单元,用于计算所述分割结果与脑部CT样本图像的标签信息之间的差异,并根据所述差异更新所述编码网络和所述解码网络的模型参数。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
10.一种计算机设备,其特征在于,所述计算机设备包括计算机可读存储介质、处理器和存储在所述计算机可读存储介质中的计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110996998.5A CN113808085A (zh) | 2021-08-27 | 2021-08-27 | 脑部ct图像的分割模型的训练方法、分割方法和训练装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110996998.5A CN113808085A (zh) | 2021-08-27 | 2021-08-27 | 脑部ct图像的分割模型的训练方法、分割方法和训练装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113808085A true CN113808085A (zh) | 2021-12-17 |
Family
ID=78894230
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110996998.5A Pending CN113808085A (zh) | 2021-08-27 | 2021-08-27 | 脑部ct图像的分割模型的训练方法、分割方法和训练装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113808085A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117292232A (zh) * | 2023-11-24 | 2023-12-26 | 烟台大学 | T1加权成像的多维空间特征获取方法、系统和设备 |
WO2024065536A1 (en) * | 2022-09-29 | 2024-04-04 | Intel Corporation | Methods and apparatus for image segmentation on small datasets |
-
2021
- 2021-08-27 CN CN202110996998.5A patent/CN113808085A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024065536A1 (en) * | 2022-09-29 | 2024-04-04 | Intel Corporation | Methods and apparatus for image segmentation on small datasets |
CN117292232A (zh) * | 2023-11-24 | 2023-12-26 | 烟台大学 | T1加权成像的多维空间特征获取方法、系统和设备 |
CN117292232B (zh) * | 2023-11-24 | 2024-02-06 | 烟台大学 | T1加权成像的多维空间特征获取方法、系统和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pinaya et al. | Unsupervised brain imaging 3D anomaly detection and segmentation with transformers | |
US9959615B2 (en) | System and method for automatic pulmonary embolism detection | |
Gu et al. | MedSRGAN: medical images super-resolution using generative adversarial networks | |
CN112258415B (zh) | 一种基于生成对抗网络的胸部x光片超分辨率和去噪方法 | |
CN113808085A (zh) | 脑部ct图像的分割模型的训练方法、分割方法和训练装置 | |
CN111724397B (zh) | 一种颅脑ct图像出血区域自动分割方法 | |
CN115496771A (zh) | 一种基于脑部三维mri图像设计的脑肿瘤分割方法 | |
EP4208848A1 (en) | Connected machine-learning models with joint training for lesion detection | |
US11257210B2 (en) | Method and system of performing medical treatment outcome assessment or medical condition diagnostic | |
CN113012163A (zh) | 一种基于多尺度注意力网络的视网膜血管分割方法、设备及存储介质 | |
CN114742802B (zh) | 基于3Dtransformer混合卷积神经网络的胰腺CT图像分割方法 | |
CN111583262A (zh) | 一种血管分割方法与系统 | |
CN116703901B (zh) | 肺部医学ct影像分割及分类装置及设备 | |
CN113379773A (zh) | 基于双重注意力机制的分割模型建立、分割方法及装置 | |
CN112364920A (zh) | 基于深度学习的甲状腺癌病理图像分类方法 | |
CN114998265A (zh) | 一种基于改进U-Net的肝脏肿瘤分割方法 | |
CN112508884A (zh) | 一种癌变区域综合检测装置及方法 | |
CN114565601A (zh) | 基于DeepLabV3+改进的肝脏CT图像分割算法 | |
CN114399510A (zh) | 结合图像和临床元数据的皮肤病灶分割和分类方法及系统 | |
WO2024104035A1 (zh) | 基于长短期记忆自注意力模型的三维医学图像分割方法及系统 | |
Han et al. | Utilization of an attentive map to preserve anatomical features for training convolutional neural‐network‐based low‐dose CT denoiser | |
CN116363438B (zh) | 一种基于多模态的儿童脑炎分类系统 | |
CN114494952B (zh) | 一种基于感知损失的乳腺mri影像时间序列生成方法 | |
CN116309806A (zh) | 一种基于CSAI-Grid RCNN的甲状腺超声图像感兴趣区域定位方法 | |
Du et al. | X-ray image super-resolution reconstruction based on a multiple distillation feedback network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |