一种基于断层扫描图数据集进行血管区域分割的方法
技术领域
本发明涉及信息技术领域,主要涉及信息的筛选和标定,尤其涉及一种采集并标注断层扫描图数据进行数据集建立的方法。
背景技术
粒子植入全称为“放射性粒子植入治疗技术”,是一种将放射源植入肿瘤内部,让其摧毁肿瘤的治疗手段。粒子植入治疗技术涉及放射源,其核心是放射粒子。现在临床运用的是一种被称为碘125的同位素物质,每个碘125粒子就像一个小太阳,其中心附近的射线最强,可最大限度降低对正常组织的损伤。放射性粒子植入治疗技术主要依靠立体定向系统将放射性粒子准确植入瘤体内,通过微型放射源发出持续、短距离的放射线,使肿瘤组织遭受最大限度的杀伤,而正常组织不损伤或只有微小损伤。专家认为,相比其他肿瘤治疗技术,放射性粒子植入治疗技术本身技术含量并不高、难度并不大。但由于直接植入人体内,而且是放射源,所以要严格把握适应症。
一般在粒子植入时,首先需要对患者的肿瘤区域进行扫描,可通过核磁共振或者CT等设备进行扫描,得到该患者的肿瘤区域图像。然后根据图像进行手动或者电脑靶区绘制,根据绘制好的靶区图进行粒子布局,然后确认粒子深度和粒子数量,同时确认针道位置,再通过该信息制作植入针模板。手术时,将患者固定在CT床上,并植入针模板固定在患者靠近肿瘤的皮肤位置,再将植入针按照预先设计步骤进行穿刺,同时实时通过CT扫描查看植入针位置,再通过设置在植入针上的刻度提供深度参考。当植入针到达指定深度时,开始注入粒子,然后向外拉出植入针,并当达到指定深度后再次注入粒子,直到该植入针上的所有粒子都已注入即可拉出植入针。
鉴于粒子植入治疗技术的特点,通过对患者身体的肿瘤所在区域进行识别和划分,建立起肿瘤区的虚拟模型,便于确定粒子植入的方向、位置以及植入量。便于确定肿瘤的形态、位置、大小及与邻近器官、血管的关系,因此即使已经诊断出存在肿瘤,但是目前主要通过人工来实现,因此需要额外付出很长的时间,才能确定肿瘤的实际参数,进而确定诊治方案,如此将大大延长患者进行诊治的时间,缩小了患者获得痊愈的机会,也增加了患者的痛苦。
在进行参数确认的过程中,由于人体的血管网遍布广泛,且错综复杂,在进行模型建立的过程中容易造成干扰,被误认为是肿瘤组织,将影响确诊参数和方案。因此需要将血管作为噪音从模型中分离,保留更为纯粹和精确的模型,更为真实地反应人体组织病灶处的实际症状。
现有的技术方案对血管组织的识别判断还无法做到自主分离处理,建立准确的模型存在难度,不利于患者的康复,需要对现有的技术方案进行调整优化,提出更为合理的技术方案,解决现有技术中存在的技术问题。
发明内容
本发明提供了一种基于断层扫描图数据集进行血管区域分割的方法,旨在利用断层扫描图整合数据后建立的数据集,对临床中获取的断层扫描图进行处理,通过掩膜消除非目标区域和噪音区域,将目标区域中的图像进行针对性的提取使用。
为了实现上述效果,本发明所采用的技术方案为:
一种基于断层扫描图数据集进行血管区域分割的方法,包括数据集的建立、模型的训练和分割三个步骤。具体地说,按照下列步骤进行:
数据集的建立包括如下步骤:
S01:获取目标部位的若干张断面扫描图;
S02:对获得的断面扫描图进行预处理和标注,将断面扫描图血管组织和其他组织进行标记以进行区分,如此获得多个标注样本;
S03:将标注样本进行存储,得到数据集;
按照上述步骤得到的数据集,应用于模型训练,模型的训练包括如下步骤:
S04:建立3D卷积神经网络模型;
S05:将标注样本中的信息输入至3D卷积神经模型中进行训练;
S06:所有的标注样本数据均输入至3D卷积神经模型中训练完毕后,输出训练好的3D卷积神经深度学习模型;
当3D卷积神经深度学习模型建立之后,接收到外部输入的任何断层扫描图时,均可根据需求进行分割,具体分割包括如下步骤:
S07:对断层扫描图进行预处理,在断层扫描图上进行区域划分,将断层扫描图划分出血管组织区域和其他组织区域;
S08:将经过预处理的断层扫描图数据信息输入至训练好的卷积神经深度学习模型中,并输出分割好的断层扫描图;
S09:将多个分割好的立方块数据进行合并,得到将血管分割之后的目标部位模型图。
进一步的,对上述技术方案中公开的断层扫描图预处理进行详细说明,预处理的目的是消除断层扫描图上的非目标组织区域和噪音区域,便于进行更加精细的分割,作为一种可行的选择,所述的预处理过程具体包括如下步骤:
S071:标准化图像的像素值,并对像素值做概率密度分布;
S072:根据像素值的分布找到不同区域组织之间的分界,区分血管组织区域和其他组织区域;
S073:使血管组织区域连接为整体,制作断层扫描图掩膜;
S074:将原始三维标注数据点乘对应的图像掩膜信息即可得到只有血管组织区域图像的数据。
这样经过预处理的断层扫描图数据,在输入至训练好的学习模型中能够更加精准地输出所需的目标部位模型图。
进一步的,上述技术方案中的区域划分目的在于提高分割前标注的便捷度,因此对上述技术方案中公开的区域划分方式进行优化,作为一种可行的选择,区分血管组织区域和其他组织区域的方式如下:
读取识别断层扫描图上不同区域的色值,将血管组织对应的色值和所有其他组织对应的色值进行收集整理,得出血管组织对应的色值区间和其他组织对应的色值区间,以此作为区分血管组织和其他组织的标准。
进一步的,上述方案中公开了制做掩膜的步骤,作为一种可行的选择,断层扫描图掩膜的制作方式如下:
通过形态学处理中的腐蚀处理和膨胀处理,使目标区域尽可能连在一起,并尽可能的消除目标区域中的特定色值部分,以完成目标区域的掩膜的制作。
再进一步,对上述技术方案中公开的卷积神经网络进行优化设置,作为一种可行的选择,所述的卷积神经网络模型包括用于存储信息的浅层网络和深层网络,所述浅层网络中存储的信息用于补充至深层网络。
再进一步,对上述技术方案中公开的标注方式进行细化说明,步骤S02中的标注方式为:针对人体目标部位的断层扫描图的血管组织和其他组织进行标注,区分血管组织和其他组织。
进一步的,上述技术方案中公开的标注直接对断层扫描图上的信息进行标记,所述标注的内容包括坐标信息,所述的坐标信息基于标注所在断层扫描图上的坐标系生成,且用于标记血管组织在断层扫描图上的相对位置。
进一步的,当标记断层扫描图上的坐标时,采用的坐标系为三维笛卡尔坐标系,利用三维笛卡尔坐标系来表示每张断层扫描图上的血管组织和其他组织的相对位置。
进一步的,标注的内容除开坐标信息,还应对该坐标下的组织进行辨别,因此所述的标注内容还包括识别信息,所述的识别信息用于将当前位置的组织标记为血管组织或其他组织。
再一步的,对上述技术方案中的识别信息进行优化,所述的识别信息与坐标信息相匹配,当前位置对应组织的识别信息被赋予当前位置对应组织的坐标信息之后。
与现有技术相比,本发明的有益效果为:
1.本发明通应用于粒子植入中,训练模型后能够实现迅速对断层扫描图的血管进行识别和获取,快速发现断层扫描图上的血管组织区域,便于提高粒子植入的精准度和效率。
2.本发明将经过识别标注的断层扫描图作为标注样本,建立数据集应用于粒子植入中,提高了粒子植入前期准备工作的效率,也便于提高粒子植入的精度。
3.本发明通过对断层扫描图上的目标组织和非目标组织进行标注,将断层扫描图上的目标组织和非目标组织进行直观的区分,便于直接读取识别各个组织,提高了对断层扫描图信息的识别和获取效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅表示出了本发明的部分实施例,因此不应看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。
图1是实施例1中断面扫描图自动分割的示意图;
图2是断层扫描图像预处理的过程示意图;
图3是实施例2中血管区域分割的示意图。
具体实施方式
下面结合附图及具体实施例对本发明做进一步阐释。
实施例1
本实施例作为血管区域分割的基础,本实施例公开了一种基于病灶断层扫描图进行自动分割的方法,旨在利用断层扫描图整合数据后建立的数据集,对临床中获取的断层扫描图进行处理,通过掩膜消除非目标区域和噪音区域,将目标区域中的图像进行针对性的提取使用。
如图1所示,具体的,对扫描图实现分割需要在网络模型中实现,前期建立网络模型的步骤包括:
S01:通过医院和网络获取目标部位的若干张断面扫描图;
S02:对获得的断面扫描图进行预处理和标注,将断面扫描图目标组织和非目标组织进行标记以进行区分,如此获得多个标注样本;
在该步骤中,具体的标注方法为:由经验丰富的医生在目标区域的断层扫描图上标注目标部位的断面轮廓或端面位置。标注该目标区域上目标部位的断面轮廓或断面位置目的在于提高其断面轮廓的识别显著性,同时便于后续掩膜制作,从断层扫描图中分离病灶靶区和正常组织区域。
具体的标注过程通过此种方式实现:针对人体目标部位的断层扫描图的目标组织和非目标组织进行标注,尤其是对目标组织进行区别标注。
上述标注过程中,标注的形式包括轮廓标记和点位标记。所述的轮廓标记通过勾勒描线或描点连线的方式在断层扫描图上选定封闭的区域,该封闭的区域即为目标组织;所述的点位标记通过描点的方式在断层扫描图上标记出选定的点位,该选定点位所在处即为目标组织。
上述标注过程中,标注的内容包括坐标信息和识别信息,所述的坐标信息基于标注所在断层扫描图上的坐标系生成,且用于标记目标组织在断层扫描图上的相对位置。一般情况下,所述的断层扫描图上采用二维笛卡尔坐标系确定坐标信息,并利用坐标信息X(x,y)表示目标组织和非目标组织的位置;同时采用Y(a)表示识别信息并将识别信息赋予目标组织和非目标组织对应的坐标信息之后。识别信息中采用“是与否”进行标记,当识别信息与目标组织的坐标信息匹配时,识别信息为“是”;当识别信息与非目标组织的坐标信息匹配时,识别信息为“否”。本实施例中,a=1则表示为“是”;a=0则表示为“否”。
S03:将标注样本进行存储,得到数据集;
S04:建立卷积神经网络模型;
S05:将标注样本中的信息输入至卷积神经模型中进行训练;
S06:所有的标注样本数据均输入至卷积神经模型中训练完毕后,输出训练好的卷积神经深度学习模型。
S07:对断层扫描图进行预处理,在断层扫描图上进行区域划分,将断层扫描图划分出目标区域和非目标区域,使得目标区域和非目标区域可通过视觉进行区分,如图2所示,预处理过程具体通过如下方式实现:
S071:标准化图像的像素值,并对像素值做概率密度分布;
S072:根据像素值的分布找到不同区域组织之间的分界,区分目标区域和非目标区域;
具体的,该步骤采用K-means算法对像素值进行聚类,聚类的类别为2,找到目标组织和非目标组织的像素分界点,并对高于临界点的值赋值为0,低于临界点的值赋值为1。
S073:使目标区域连接为整体,制作断层扫描图掩膜;
具体的,该步骤通过形态学处理中的腐蚀处理和膨胀处理,使目标区域尽可能连在一起,并尽可能的消除目标区域中的特定色值部分,以完成目标区域的掩膜的制作。本实施例中血管组织所在的器官区域为目标区域,器官以外的区域为非目标区域。
S074:将原始三维数据点乘对应的目标区域的图像掩膜信息即可得到只有目标区域图像的数据。
在上述预处理过程中,采用一种更为确切的区域划分方式,可以确定的是,目标部位中目标区域的断面轮廓为封闭的图形,该断面轮廓内部即为同种组织,同种组织在断层扫描图上的成像色值应该相同或近似,而断面轮廓的外部应为异于断面轮廓内部的组织,其成像色值与断面轮廓内部组织的成像色值不同,二者以断面轮廓为界呈现明显不同的色值。因此,通过色值识别记录将断层扫描图上的断面轮廓内外的不同颜色色值进行区分和标记,将色值与目标组织的色值相差在一定范围内的区域识别为目标组织,将其余色值的区域识别为非目标组织。
实际情况中存在目标组织将非目标组织的血管或其他组织包围的情况,在这种情况下,断面扫描图穿过该非目标组织时的成像将出现目标组织的断面轮廓中间存在非目标组织的色值区域,该色值区域内的组织为被目标组织包围的非目标组织。
对断层扫描图上的点进行坐标定义,并将每个点的坐标值与其在步骤S02中的标注相匹配结合。
该标注过程包括平面坐标的标注和三维坐标的标注。其中,在单张断层扫描图上进行平面坐标的标注,每张断层扫描图的尺寸和像素值均调整为标准值,并建立相同的平面坐标系,利用(x,y)坐标对每张断层扫描图上的点进行对应标注,因此位于一条垂直于断层扫描图的直线上的所有点的(x,y)坐标值相同。同时,多张断层扫描图沿该条垂直于断层扫描图平面的直线均匀间隔分布,并按该直线方向建立z轴,对每张断层扫描图上的点赋予三维坐标系的z轴坐标值,位于同一断面扫描图上的点的z轴坐标均相同。
将若干张断层扫描图按照上述方案进行标记后,导入至训练好的模型中,供模型读取、识别和存储,将所有的目标组织对应的色值和所有非目标组织对应的色值进行收集整理,得出目标组织对应的色值区间和非目标组织对应的色值区间,以此作为评定目标组织和非目标组织的标准。
为了便于区分,提高不同组织对应区域的对比度,在本实施例中采用灰度值区分断层扫描图上的目标区域和非目标区域。具体的,采用RGB色值标记灰度值,并将断层扫描图上某一点处的灰度值标记为(a,a,a),且预设的目标组织的灰度值最低值为(k,k,k),当识别得断层扫描图上某一点的灰度值数据a≤k时,将该点标记为目标组织对应点;当识别得断层扫描图上某一点的灰度值数据a>k时,将该点标记为非目标组织对应点。
S08:将经过预处理的断层扫描图数据信息输入至训练好的卷积神经深度学习模型中,并输出分割好的断层扫描图。
实施例2
本实施例在上述实施例的基础上进行改进,将断层扫描图的分割应用于血管组织的分割,并输出分割后的三维模型。具体地说,本实施例公开了一种基于断层扫描图数据集进行血管区域分割的方法,旨在利用断层扫描图整合数据后建立的数据集,对临床中获取的断层扫描图进行处理,通过掩膜消除非目标区域和噪音区域,将目标区域中的图像进行针对性的提取使用,最终输出分割好的目标部位模型图。
具体的,如图3所示,对扫描图实现分割需要在网络模型中实现,前期建立网络模型的步骤包括:
S01:通过医院和网络获取目标部位的若干张断面扫描图;
S02:对获得的断面扫描图进行预处理和标注,将断面扫描图血管组织和其他组织进行标记以进行区分,如此获得多个标注样本;
在该步骤中,具体的标注方法为:由经验丰富的医生在目标区域的断层扫描图上标注目标部位的断面位置。标注该目标区域上目标部位的断面位置目的在于提高其识别显著性,同时便于后续掩膜制作,从断层扫描图中分离病灶靶区和正常组织区域。
具体的标注过程通过此种方式实现:针对人体目标部位的断层扫描图的血管组织和其他组织进行标注,尤其是对血管组织进行区别标注。
上述标注过程中,标注的形式包括轮廓标记和点位标记。所述的轮廓标记通过勾勒描线或描点连线的方式在断层扫描图上选定封闭的区域,该封闭的区域即为血管组织;所述的点位标记通过描点的方式在断层扫描图上标记出选定的点位,该选定点位所在处即为血管组织。
上述标注过程中,标注的内容包括坐标信息和识别信息,所述的坐标信息基于标注所在断层扫描图上的坐标系生成,且用于标记目标组织在断层扫描图上的相对位置。本实施例中,利用三维笛卡尔坐标系来表示每张断层扫描图上的目标组织和非目标组织的位置,即采用X(x,y,z)来表示目标组织和非目标组织的位置;同时采用Y(a)表示识别信息并将识别信息赋予目标组织和非目标组织对应的坐标信息之后。识别信息中采用“是与否”进行标记,当识别信息与目标组织的坐标信息匹配时,识别信息为“是”;当识别信息与非目标组织的坐标信息匹配时,识别信息为“否”。本实施例中,a=1则表示为“是”;a=0则表示为“否”。本实施例中以血管组织作为目标组织,其他组织作为非目标组织。
S03:将标注样本进行存储,得到数据集;
S04:建立卷积神经网络模型;
S05:将标注样本中的信息输入至卷积神经模型中进行训练;
S06:所有的标注样本数据均输入至卷积神经模型中训练完毕后,输出训练好的卷积神经深度学习模型。
S07:对断层扫描图进行预处理,在断层扫描图上进行区域划分,将断层扫描图划分出其他组织区域和血管组织区域,使得目标区域和非目标区域可通过视觉进行区分。预处理过程具体通过如下方式实现:
S071:标准化图像的像素值,并对像素值做概率密度分布;
S072:根据像素值的分布找到不同区域组织之间的分界,区分目标区域和非目标区域;本实施例中血管组织所在器官的区域为目标区域,器官以外的区域为非目标区域。
具体的,该步骤采用K-means算法对像素值进行聚类,聚类的类别为2,找到血管组织和其他组织的像素分界点,并对高于临界点的值赋值为0,低于临界点的值赋值为1。本实施例中将病变组织区域作为目标区域。
S073:使目标区域连接为整体,制作断层扫描图掩膜;
具体的,该步骤通过形态学处理中的腐蚀处理和膨胀处理,使目标区域尽可能连在一起,并尽可能的消除目标区域中的特定色值部分,以完成目标区域的掩膜的制作。所述的特定色值部分包括黑色部分。
S074:将原始三维数据点乘对应的目标区域的图像掩膜信息即可得到只有非目标部位区域图像的数据。
在上述预处理过程中,采用一种更为确切的区域划分方式,可以确定的是,目标部位中血管的断面轮廓为封闭的图形,该断面轮廓内部即为血管组织,血管组织在断层扫描图上的成像色值应该相同或近似,而断面轮廓的外部应为其他组织,其成像色值与血管组织的成像色值不同,二者以断面轮廓为界呈现明显不同的色值。因此,通过色值识别记录将断层扫描图上的断面轮廓内外的不同颜色色值进行区分和标记,将色值与血管组织的色值相差在一定范围内的区域识别为血管组织,将其余色值的区域识别为目标部位其他组织。
对断层扫描图上的点进行坐标定义,并将每个点的坐标值与其在步骤S02中的标注相匹配结合。
该标注过程包括平面坐标的标注和三维坐标的标注。其中,在单张断层扫描图上进行平面坐标的标注,每张断层扫描图的尺寸和像素值均调整为标准值,并建立相同的平面坐标系,利用(x,y)坐标对每张断层扫描图上的点进行对应标注,因此位于一条垂直于断层扫描图的直线上的所有点的(x,y)坐标值相同。同时,多张断层扫描图沿该条垂直于断层扫描图平面的直线均匀间隔分布,并按该直线方向建立z轴,对每张断层扫描图上的点赋予三维坐标系的z轴坐标值,位于同一断面扫描图上的点的z轴坐标均相同。
将若干张断层扫描图按照上述方案进行标记后,导入至训练好的模型中,供模型读取、识别和存储,将所有的血管组织对应的色值和所有目标部位其他组织对应的色值进行整理,得出血管组织对应的色值区间和目标部位其他组织对应的色值区间,以此作为评定血管组织和其他组织的凭据。
为了便于区分,提高不同组织对应区域的对比度,在本实施例中采用灰度值区分断层扫描图上的血管组织区域和其他组织区域。具体的,采用RGB色值标记灰度值,并将断层扫描图上某一点处的灰度值标记为(a,a,a),且预设的血管组织的灰度值最低值为(k,k,k),当识别得断层扫描图上某一点的灰度值数据a≤k时,将该点标记为血管组织对应点;当识别得断层扫描图上某一点的灰度值数据a>k时,将该点标记为其他组织对应点。
S08:将经过预处理的断层扫描图数据信息输入至训练好的卷积神经深度学习模型中,并输出分割好的断层扫描图;
S09:将多个分割好的立方块数据进行合并,得到将血管分割之后的目标部位模型图。
实施例3
本实施例公开了另一种建立模型的方法,具体包括如下步骤:
1.利用数据集中的坐标信息,将三个方向同时外扩2.5mm,形成一个正方块单元,该单元作为后续分类的特征输入值,标签为对应的坐标标签值。
2.将原始三维切片数据进行多尺度金字塔式放缩,对放缩后的数据进行3D方块数据提取(方法同上述实施例),采用字典学习的机器学习算法对提取方块数据进行特征学习得到特征字典。再利用得到的字典作为卷积filter对原始三维切片数据做卷积运算,进行稀疏表示。从稀疏表示的数据中按标注信息中的X坐标提取5*5*5的方块单元数据,此数据作为下一步分类训练的X数据,标签为该数据坐标的标签Y。
3.利用逻辑回归算法,对被稀疏表示过的原始数据进行分类训练,通过调整训练的参数,并使用交叉验证评价模型,训练出理想的模型可应用于后期分割血管。
以上即为本发明列举的几种实施方式,但本发明不局限于上述可选的实施方式,在不相矛盾的情况下,上述技术特征可进行任意组合得到新的技术方案,且本领域技术人员可根据上述方式相互任意组合得到其他多种实施方式,任何人在本发明的启示下都可得出其他各种形式的实施方式。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。