基于深度学习的骨骼分割方法和系统
技术领域
本发明涉及图像分割技术领域,尤其涉及基于深度学习的骨骼分割方法和系统。
背景技术
医学图像分割是医学图像处理的基础,可以定量计算目标物体体积、诊断疾病、定位病变区域、研究解剖结构、设计治疗方案、计算机辅助外科手术等。受人体器官和组织内在结构复杂多样的特性,图像分割方法具有面向对象性的特点,不存在一种分割方法适合人体所有部位。
骨骼起着支撑身体的作用,是人体运动系统的一部分,骨与骨之间一般用关节和韧带连接起来。骨科疾病多发,例如,髋关节疾病、膝关节疾病等。精准、快速地分割出不同类型的骨骼结构是具有现实意义的研究方向。
发明内容
(一)技术问题
本发明的一个目的在于提供基于深度学习的骨骼分割方法;
本发明的另一个目的在于提供基于深度学习的骨骼分割系统。
(二)技术方案
1、基于深度学习的骨骼分割方法,所述分割方法基于医学图像数据,所述分割方法包括:
构建医学图像数据库:获取医学图像数据集,手动标注出不同类型的骨骼的区域;将所述数据集划分为训练集和测试集;将未标注前的医学图像数据转换成第一格式的图片并保存,将标注后的医学图像数据转换成第二格式的图片并保存;
建立分割神经网络模型;
模型训练:利用训练集对分割神经网络模型进行训练,并利用测试集进行测试;和
利用训练好的分割神经网络模型进行分割。
2、根据技术方案1所述的方法,
所述分割神经网络模型包括粗分割神经网络和精确分割神经网络。
3、根据技术方案2所述的方法,
所述粗分割神经网络选自FCN、SegNet、Unet、3D-Unet、 Mask-RCNN、空洞卷积、ENet、CRFasRNN、PSPNet、ParseNet、RefineNet、ReSeg、LSTM-CF、DeepMask中的任一种或多种。
4、根据技术方案2或3所述的方法,
所述精确分割神经网络为EfficientDet、SimCLR、PointRend中的任一种或多种。
5、根据技术方案3至4任一项所述的方法,
所述Unet神经网络包括n个上采样层和n个下采样层;
每个上采样层包括上采样操作层和卷积层;
每个下采样层包括卷积层和池化层。
6、根据技术方案5所述的方法,
n的取值优选为2-8,进一步优选为3-6,更优选为4-5。
7、根据技术方案5或6所述的方法,
每个上采样层包括1个上采样操作层和2个卷积层,其中的卷积层中的卷积核大小为3*3,上采样操作层中的卷积核大小为2*2,每个上采样层中的卷积核个数为512,256,256,128。
8、根据技术方案7所述的方法,
每个下采样层包括2个卷积层和1个池化层,其中的卷积层中的卷积核大小为3*3,池化层中的卷积核大小为2*2,每个卷积层中的卷积核的个数为128,256,256,512。
9、根据技术方案1至8任一项所述的方法,
将所述数据集按照7:3的比例划分为训练集和测试集。
10、根据技术方案5至9任一项所述的方法,
最后一次上采样结束后设有一个dropout层,droupout率设置为0.7。
11、根据技术方案5至10任一项所述的方法,
所有的卷积层后面设有激活层,激活层使用的激活函数为relu函数。
12、根据技术方案2至11任一项所述的方法,
所述训练按照如下方法进行:
粗分割:将训练集送入粗分割神经网络进行训练;训练过程中,数据标签的背景像素值设置为0,不同类型的骨骼设置为不同的自然数,训练的batch_size为6,学习率设置为1e-4,优化器使用Adam优化器,使用的损失函数为DICE loss;可选地,根据训练过程中损失函数的变化,调整训练批次的大小;
精确分割:送入精确分割神经网络进行精确分割;初始过程包括,先使用双线性插值上采样粗分割的预测结果,再在特征图中选定多个最不确定的点,然后计算多个点的特征表示并且预测labels;重复所述初始过程,直到上采样到需要的大小;
优选地,选定置信度为0.5的点作为最不确定的点;
优选地,点的特征通过双线性插值Bilinear计算。
13、根据技术方案1至12任一项所述的方法,
所述医学图像数据为CT数据、MRI数据、超声数据、X-射线数据、DynaCT数据、PET数据中的任一种或多种;
获取的医学图像数据为二维数据和/或三维数据;和/或
手动标注出股骨、胫骨、腓骨、髌骨中的任一种或多种的区域。
14、基于深度学习的骨骼分割系统,所述系统包括:
数据库构建模块,用于获取医学图像数据集,手动标注出不同类型的骨骼的区域;将所述数据集划分为训练集和测试集;将未标注前的医学图像数据转换成第一格式的图片并保存,将标注后的医学图像数据转换成第二格式的图片并保存;
模型构建模块,用于建立分割神经网络模型;
模型训练模块,用于利用训练集对分割神经网络模型进行训练,并利用测试集进行测试;和
图像分割模块,用于利用训练好的分割神经网络模型进行分割。
15、根据技术方案14所述的系统,
所述数据库构建模块包括:
数据获取单元,用于获取医学图像数据集;接收手动标注出不同类型骨骼区域后的医学图像数据;和将未标注前的医学图像数据转换成第一格式的图片并保存,将标注后的医学图像数据转换成第二格式的图片并保存;
训练集和测试集生成单元,用于根据数据获取单元按照比例生成训练集以及测试集。
16、根据技术方案15所述的系统,
所述训练集和测试集生成单元按照7:3的比例生成训练集和测试集。
17、根据技术方案14至16任一项所述的系统,
所述分割神经网络模型包括粗分割神经网络和精确分割神经网络。
18、根据技术方案17所述的系统,
所述粗分割神经网络选自FCN、SegNet、Unet、3D-Unet、 Mask-RCNN、空洞卷积、ENet、CRFasRNN、PSPNet、ParseNet、RefineNet、ReSeg、LSTM-CF、DeepMask中的任一种或多种。
19、根据技术方案17或18所述的系统,
所述精确分割神经网络为EfficientDet、SimCLR、PointRend中的任一种或多种。
20、根据技术方案18或19所述的系统,
所述Unet神经网络包括n个上采样层和n个下采样层;
每个上采样层包括上采样操作层和卷积层;
每个下采样层包括卷积层和池化层。
21、根据技术方案20所述的系统,
n的取值优选为2-8,进一步优选为3-6,更优选为4-5。
22、根据技术方案20或21所述的系统,
每个上采样层包括1个上采样操作层和2个卷积层,其中的卷积层中的卷积核大小为3*3,上采样操作层中的卷积核大小为2*2,每个上采样层中的卷积核个数为512,256,256,128。
23、根据技术方案22所述的系统,
每个下采样层包括2个卷积层和1个池化层,其中的卷积层中的卷积核大小为3*3,池化层中的卷积核大小为2*2,每个卷积层中的卷积核的个数为128,256,256,512。
24、根据技术方案20至23任一项所述的系统,
最后一次上采样结束后设有一个dropout层,droupout率设置为0.7。
25、根据技术方案20至24任一项所述的方法,
所有的卷积层后面设有激活层,激活层使用的激活函数为relu函数。
26、根据技术方案17至25任一项所述的系统,
所述训练按照如下方法进行:
粗分割:将训练集送入粗分割神经网络进行训练;训练过程中,数据标签的背景像素值设置为0,不同类型的骨骼设置为不同的自然数,训练的batch_size为6,学习率设置为1e-4,优化器使用Adam优化器,使用的损失函数为DICE loss;可选地,根据训练过程中损失函数的变化,调整训练批次的大小;
精确分割:送入精确分割神经网络进行精确分割;初始过程包括,先使用双线性插值上采样粗分割的预测结果,再在特征图中选定多个最不确定的点,然后计算多个点的特征表示并且预测labels;重复所述初始过程,直到上采样到需要的大小;
优选地,选定置信度为0.5的点作为最不确定的点;
优选地,点的特征通过双线性插值Bilinear计算。
27、根据技术方案14至26任一项所述的系统,
所述医学图像数据为CT数据、MRI数据、超声数据、X-射线数据、DynaCT数据、PET数据中的任一种或多种;
获取的医学图像数据为二维数据和/或三维数据;和/或
手动标注出股骨、胫骨、腓骨、髌骨中的任一种或多种的区域。
28、根据技术方案14至27任一项所述的系统,
所述系统还包括显示模块,用于显示分割出来的骨骼结构;
可选地,所述显示模块显示骨骼结构的二维影像和/或三维影像。
(三)有益效果
本发明提供的分割方法和系统基于深度学习实现了不同类型的骨骼结构的自动分割。与现有技术相比,本发明提高了分割效率以及准确率。
本发明利用神经网络设计了一个可以自动对骨骼结构进行分割的系统。该系统可以医学图像数据为基础,通过粗分割后再进行精确分割,加快的训练速度,缩短了训练时间,实现了骨骼结构精准、快速地分割,分割出来的骨骼结构无连接并且边缘清晰,可以为定位病变区域、研究解剖结构、设计治疗方案、计算机辅助外科手术等提供基础。
附图说明
图1是本发明的一个实施例提供的分割方法的流程示意图;
图2是本发明的一个实施例提供的分割系统的结构示意图;
图3是转换前后的二维横断面影像图(a为转换前,b为转换后);
图4至图7是不同层面上分割出来的二维横断面的影像图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
﹤第一方面﹥
本发明在第一方面提供了一种基于深度学习的骨骼分割方法,所述分割方法基于医学图像数据。图1图示了根据本发明实施例的基于深度学习的骨骼分割方法。
参考图1,在步骤101处,构建医学图像数据库,该步骤具体包括:获取医学图像数据集,手动标注出不同类型的骨骼的区域,例如下肢骨骼中的股骨、胫骨、腓骨、髌骨中的任一种或多种,还可以包括籽股;将所述数据集划分为训练集和测试集,优选按照7:3的比例进行划分;将未标注前的医学图像数据转换成第一格式的图片(图片的像素值优选为0-255)并保存,将标注后的医学图像数据转换成第二格式(图片的像素值优选为0-255)的图片并保存;需要说明的是,第一格式与第二格式不同。
医学图像可以为通过任何医学成像模态,如CT(计算机断层扫描)、 MRI(磁共振成像)、超声、X-射线、DynaCT、PET(正电子发射断层扫描),获取的医学图像。医学图像可以是二维图像、三维图像或三维 +时间的图像。因此,本发明中的医学图像数据可以为CT数据、MRI 数据、超声数据、X-射线数据、DynaCT数据、PET数据中的任一种或多种;获取的医学图像数据可以为二维数据和/或三维数据。
在步骤102处,建立分割神经网络模型。
在一些优选的实施方式中,所述分割神经网络模型包括粗分割神经网络和精确分割神经网络。优选地,所述粗分割神经网络选自FCN、 SegNet、Unet、3D-Unet、Mask-RCNN、空洞卷积、ENet、CRFasRNN、PSPNet、ParseNet、RefineNet、ReSeg、LSTM-CF、DeepMask中的任一种或多种;优选地,所述精确分割神经网络选自EfficientDet、SimCLR、 PointRend中的任一种或多种。
以所述分割神经网络模型为Unet+PointRend为例,利用Unet神经网络进行粗分割,利用PointRend神经网络进行精确分割。具体地,所述Unet神经网络包括n个上采样层和n个下采样层;每个上采样层包括上采样操作层和卷积层;每个下采样层包括卷积层和池化层。n的取值优选为2-8,进一步优选为3-6,更优选为4-5。每个上采样层优选包括1个上采样操作层和2个卷积层,其中的卷积层中的卷积核大小为 3*3,上采样操作层中的卷积核大小为2*2,每个上采样层中的卷积核个数为512,256,256,128。每个下采样层优选包括2个卷积层和1 个池化层,其中的卷积层中的卷积核大小为3*3,池化层中的卷积核大小为2*2,每个卷积层中的卷积核的个数为128,256,256,512。
在一些优选的实施方式中,最后一次上采样结束后设有一个 dropout层,droupout率设置为0.5-0.7。
在一些优选的实施方式中,所有的卷积层后面设有激活层,激活层使用的激活函数为relu函数。
需要说明的是,本发明对构建医学图像数据库和建立分割神经网络模型这两个步骤没有顺序上的限定。本发明在此处为了具体说明而给出了包含顺序的方法步骤,但不应理解为对处理顺序的限定。
在步骤103处,模型训练。模型训练为利用训练集对分割神经网络模型进行训练,并利用测试集进行测试的步骤。
以所述分割神经网络模型为Unet+PointRend为例进行说明。
训练过程中,将训练集全部送入Unet神经网络进行训练;训练过程中,数据标签的背景像素值设置为0,股骨为1,胫骨为2,腓骨为 3,髌骨为4,训练的batch_size为6,学习率设置为1e-4,优化器使用 Adam优化器,使用的损失函数为DICE loss,可以根据训练过程中损失函数的变化,调整训练批次的大小;
完成粗分割后,送入PointRend神经网络进行精确分割;初始过程包括,先使用双线性插值上采样粗分割的预测结果,再在特征图中选定多个最不确定的点,然后计算多个点的特征表示并且预测labels;重复所述初始过程,直到上采样到需要的大小;
优选地,选定置信度为0.5的点作为最不确定的点;
优选地,点的特征通过双线性插值Bilinear计算。
在步骤104处,利用训练好的分割神经网络模型进行分割。
本发明的骨骼分割涉及在患者医学图像中的骨骼与骨骼之间和/或骨骼与组织之间的边界的检测。本发明提供了基于多种不同深度学习的医学图像分割方法。
﹤第二方面﹥
本发明在第二方面提供了基于深度学习的骨骼分割系统,参考图2,所述系统包括:
数据库构建模块1,用于获取医学图像数据集,手动标注出不同类型的骨骼的区域;将所述数据集划分为训练集和测试集;将未标注前的影像数据转换成第一格式的图片(图片的像素值优选为0-255)并保存,将标注后的数据转换成第二格式的图片(图片的像素值优选为 0-255)并保存;
模型构建模块2,用于建立分割神经网络模型;
模型训练模块3,用于利用训练集对分割神经网络模型进行训练,并利用测试集进行测试;和
图像分割模块4,用于利用训练好的分割神经网络模型进行分割。
所述系统还可以包括显示模块5,用于显示分割出来的骨骼结构。所述显示模块可以显示骨骼结构的二维影像和/或三维影像。
在一些优选的实施方式中,所述数据库构建模块1包括:
数据获取单元,用于获取医学图像数据集;接收手动标注出不同类型骨骼区域后的医学图像数据;和将未标注前的医学图像数据转换成第一格式的图片并保存,将标注后的医学图像数据转换成第二格式的图片并保存;
训练集和测试集生成单元,用于根据数据获取单元按照比例生成训练集以及测试集。
在一些优选的实施方式中,所述训练集和测试集生成单元按照7:3 的比例生成训练集和测试集。
在一些优选的实施方式中,所述分割神经网络模型包括粗分割神经网络和精确分割神经网络。所述粗分割神经网络优选自FCN、SegNet、 Unet、3D-Unet、Mask-RCNN、空洞卷积、ENet、CRFasRNN、PSPNet、 ParseNet、RefineNet、ReSeg、LSTM-CF、DeepMask中的任一种或多种。所述精确分割神经网络优选自EfficientDet、SimCLR、PointRend 中的任一种或多种。
以所述分割神经网络模型为Unet+PointRend为例,利用Unet神经网络进行粗分割,利用PointRend神经网络进行精确分割。具体地,所述Unet神经网络包括n个上采样层和n个下采样层;每个上采样层包括上采样操作层和卷积层;每个下采样层包括卷积层和池化层。n的取值优选为2-8,进一步优选为3-6,更优选为4-5。每个上采样层优选包括1个上采样操作层和2个卷积层,其中的卷积层中的卷积核大小为 3*3,上采样操作层中的卷积核大小为2*2,每个上采样层中的卷积核个数为512,256,256,128。每个下采样层优选包括2个卷积层和1 个池化层,其中的卷积层中的卷积核大小为3*3,池化层中的卷积核大小为2*2,每个卷积层中的卷积核的个数为128,256,256,512。
在一些优选的实施方式中,最后一次上采样结束后设有一个 dropout层,droupout率设置为0.5-0.7。
在一些优选的实施方式中,所有的卷积层后面设有激活层,激活层使用的激活函数为relu函数。
在一些优选的实施方式中,所述训练按照如下方法进行:
粗分割:将训练集送入粗分割神经网络进行训练;训练过程中,数据标签的背景像素值设置为0,不同类型的骨骼设置为不同的自然数,训练的batch_size为6,学习率设置为1e-4,优化器使用Adam优化器,使用的损失函数为DICE loss;可选地,根据训练过程中损失函数的变化,调整训练批次的大小;
精确分割:送入精确分割神经网络进行精确分割;初始过程包括,先使用双线性插值上采样粗分割的预测结果,再在特征图中选定多个最不确定的点,然后计算多个点的特征表示并且预测labels;重复所述初始过程,直到上采样到需要的大小;
优选地,选定置信度为0.5的点作为最不确定的点;
优选地,点的特征通过双线性插值Bilinear计算。
本发明这一系统可以基于CT数据、MRI数据、超声数据、X-射线数据、DynaCT数据、PET数据中的任一种或多种而进行分割,可以基于二维数据和/或三维数据进行分割。
下面再结合图3至图7对本发明的方法和系统进行更为详细的说明。
利用本发明提供的方法和系统来分割股骨、胫骨、腓骨和髌骨这四类骨骼,所用的数据为CT扫描获得的二维横断面dicom数据。
在步骤101处,在数据库构建模块1中构建医学图像数据库。
该步骤具体包括:获取CT扫描的数据集,手动标注出股骨、胫骨、腓骨、髌骨区域;将所述数据集按照7:3的比例划分为训练集和测试集;将未标注前的二维横断面dicom数据转换成像素值为0-255的jpg格式的数据图片并保存(如图3所示),将标注后的数据转换成像素值为 0-255的PNG格式的图片并保存。
在步骤102处,在模型构建模块2中建立分割神经网络模型。
所述分割神经网络模型为Unet+PointRend,利用Unet神经网络进行粗分割,利用PointRend神经网络进行精确分割。所述Unet神经网络包括4个上采样层和4个下采样层;每个上采样层包括上采样操作层和卷积层;每个下采样层包括卷积层和池化层。每个上采样层包括1 个上采样操作层和2个卷积层,其中的卷积层中的卷积核大小为3*3,上采样操作层中的卷积核大小为2*2,每个上采样层中的卷积核个数为 512,256,256,128。每个下采样层包括2个卷积层和1个池化层,其中的卷积层中的卷积核大小为3*3,池化层中的卷积核大小为2*2,每个卷积层中的卷积核的个数为128,256,256,512。最后一次上采样结束后设有一个dropout层,droupout率设置为0.7。所有的卷积层后面设有激活层,激活层使用的激活函数为relu函数。
在步骤103处,在模型训练模块3中进行模型训练。
粗分割训练:将训练集全部送入Unet神经网络进行训练;训练过程中,数据标签的背景像素值设置为0,股骨为1,胫骨为2,腓骨为 3,髌骨为4,训练的batch_size为6,学习率设置为1e-4,优化器使用 Adam优化器,使用的损失函数为DICE loss,根据训练过程中损失函数的变化,调整训练批次的大小;
完成粗分割后,送入PointRend神经网络进行精确分割;初始过程包括,先使用双线性插值上采样粗分割的预测结果,再在特征图中选定多个置信度为0.5的点作为最不确定的点,然后通过双线性插值 Bilinear计算多个点的特征表示并且预测labels;重复所述初始过程,直到上采样到需要的大小。
在步骤104处,在图像分割模块4中进行分割。
最终,分割出来的股骨、胫骨、腓骨和髌骨的二维影像横断面影像可以通过显示模块5显示出来,为了区分,可以使用不同颜色区分这四类骨骼结构。图4至图7是不同层面上分割出来的二维横断面的影像,10为股骨、11为髌骨、12为胫骨、13为腓骨,可以清楚地看到,各类骨骼之间无连结,并且边缘清晰。
需要说明的是,本发明在实施例中用二维横断面影像进行举例,但不应理解为对医学图像数据类型的限定。本发明提供的方法和系统可以使用二维数据和/或三维数据进行分割,实现二维图像和/或三维图像的分割。如,本发明方法和系统可以使用二维横断面影像数据、二维矢状面影像数据、二维冠状面影像数据中的一种或多种来进行分割。
需要说明的是,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现。依据这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备 (可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。