CN115409990B - 一种医学图像分割方法、装置、设备及存储介质 - Google Patents
一种医学图像分割方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115409990B CN115409990B CN202211188150.0A CN202211188150A CN115409990B CN 115409990 B CN115409990 B CN 115409990B CN 202211188150 A CN202211188150 A CN 202211188150A CN 115409990 B CN115409990 B CN 115409990B
- Authority
- CN
- China
- Prior art keywords
- residual
- feature
- organ
- layer
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003709 image segmentation Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 58
- 210000000056 organ Anatomy 0.000 claims abstract description 224
- 238000000605 extraction Methods 0.000 claims abstract description 118
- 230000004927 fusion Effects 0.000 claims abstract description 86
- 238000013136 deep learning model Methods 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 17
- 230000007797 corrosion Effects 0.000 claims description 13
- 238000005260 corrosion Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 12
- 238000004891 communication Methods 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 11
- 239000004973 liquid crystal related substance Substances 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 67
- 230000000694 effects Effects 0.000 abstract description 6
- 239000000523 sample Substances 0.000 description 103
- 238000010586 diagram Methods 0.000 description 21
- 230000008859 change Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 238000003384 imaging method Methods 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000002604 ultrasonography Methods 0.000 description 3
- 210000001015 abdomen Anatomy 0.000 description 2
- 238000002059 diagnostic imaging Methods 0.000 description 2
- 230000003628 erosive effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 210000001685 thyroid gland Anatomy 0.000 description 2
- 230000003187 abdominal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012285 ultrasound imaging Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/28—Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Abstract
本公开提供了一种医学图像分割方法、装置、设备及存储介质,所述方法包括:将待分割医学图像输入预先训练的目标图像分割模型,第一残差特征提取层提取第一残差特征,第二残差特征提取层对第一残差特征提取第二残差特征,语义特征提取层对第一残差特征提取语义特征,特征融合层对第二残差特征和语义特征进行融合得到融合特征,结果输出层基于融合特征提取待分割医学图像中目标器官的器官区域图像,以及确定目标器官的器官类别,并输出器官区域图像和器官类别。采用该方法,使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时,也可以在器官对应的检测模式下进行检测,提高了检测结果准确率,从而达到了更好的辅助检查效果。
Description
技术领域
本公开涉及图像处理领域,尤其涉及一种医学图像分割方法、装置、设备及存储介质。
背景技术
图像分割是根据图像的相似性特征将图像划分为若干个互不相交的连通区域的过程,其中,图像的相似性特征如:亮度、颜色、纹理、面积、形状、位置、局部统计特征或频谱特征等。医学图像分割是医学图像处理与分析领域的重要步骤,其目的是将医学图像中某些具有特殊含义的部分分割出来,为医学研究提供可靠的依据,以使医学检测仪器能更好地进行检测。
随着深度学习技术的兴起,卷积神经网络被应用于医学图像分割,基于深度学习的图像分割方法成为了目前常用的医学图像分割方法。基于深度学习的图像分割方法是预先利用训练集的图像训练出图像分割模型,然后通过训练得到的图像分割模型进行图像分割。
一台医学检测仪器可以进行多种器官的检测,不同器官对应的检测模式是存在差异的。而现有的医学图像分割方法得到的分割图像中的器官的类型需要工作人员人工判断。因此,在得到分割图像后,如果分割图像中显示的器官与医学检测仪器当前的检测模式对应的器官不一致,则需要工作人员人工变更器官检测模式。而在实际的检测过程中,工作人员很容易忘记变更器官对应的检测模式,使得匹配到的医学检测仪器的检测模式很可能与实际的器官不符,进而导致医学检测仪器的检测结果不够准确。
发明内容
本公开提供了一种医学图像分割方法、装置、设备及存储介质,以至少解决现有技术中存在的以上技术问题。
根据本公开的第一方面,提供了一种医学图像分割方法,所述方法包括:
将待分割医学图像输入预先训练的目标图像分割模型,其中,所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层;
所述第一残差特征提取层,对输入的所述待分割医学图像进行第一残差特征提取,并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层;
所述第二残差特征提取层,对所述第一残差特征进行第二残差特征提取,并将所述第二残差特征输入所述特征融合层;
所述语义特征提取层,对所述第一残差特征进行语义特征提取,并将所述语义特征输入所述特征融合层;
所述特征融合层,对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层;
所述结果输出层,基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像,以及确定所述目标器官的器官类别,并输出所述器官区域图像和所述器官类别。
在一可实施方式中,在所述输出所述器官区域图像和所述器官类别之后,所述方法还包括:
提取所述器官区域图像的轮廓区域;
确定所述轮廓区域对应的外接矩形区域;
当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时,调整所述轮廓区域对应的外接矩形区域;其中,所述前一帧矩形区域为:基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域;所述目标差值阈值为基于所述器官区域图像的尺寸确定的。
在一可实施方式中,所述目标图像分割模型的训练方式包括:
将样本医学图像输入待训练深度学习模型,所述待训练深度学习模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层;
所述第一残差特征提取层,对输入的所述样本医学图像进行第一样本残差特征提取,并将所述第一样本残差特征输入所述第二残差特征提取层和所述语义特征提取层;
所述第二残差特征提取层,对所述第一样本残差特征进行第二样本残差特征提取,并将所述第二样本残差特征输入所述特征融合层;
所述语义特征提取层,对所述第一样本残差特征进行样本语义特征提取,并将所述样本语义特征输入所述特征融合层;
所述特征融合层,对所述第二样本残差特征和所述样本语义特征进行融合得到样本融合特征,并将所述样本融合特征输入所述结果输出层;
所述结果输出层,基于所述样本融合特征提取所述样本医学图像中的预测器官区域图像,以及确定所述样本医学图像中的器官的预测器官类别,并输出所述预测器官区域图像和所述预测器官类别;
基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练模型的损失函数;
确定所述损失函数是否收敛;
如果是,将当前的待训练深度学习模型确定为目标图像分割模型;
如果否,调整当前的待训练深度学习模型的各个层的参数,并选取下一个样本医学图像,返回所述将样本医学图像输入待训练深度学习模型的步骤。
在一可实施方式中,在所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练模型的损失函数之前,所述方法还包括:
对所述样本医学图像进行二值化处理,得到二值化图像;
对所述二值化图像进行腐蚀处理,得到腐蚀图像;
提取所述腐蚀图像中的所有连通区域图像;
将面积最大的连通区域图像确定为所述样本医学图像对应的器官区域图像;
为所述样本医学图像对应的器官区域图像中每个像素点赋予预先标注的器官类别标签,得到携带标签的器官区域图像;
所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练模型的损失函数,包括:
根据所述预测器官区域图像、所述预测器官类别和所述携带标签的器官区域图像,计算所述待训练模型的损失函数。
在一可实施方式中,所述第二残差特征提取层由第一常规残差模块、第二常规残差模块和瓶颈残差模块构成;所述语义特征提取层由Transformer编码器构成。
在一可实施方式中,所述第二残差特征包括所述第一常规残差模块输出的第一残差子特征、所述第二常规残差模块输出的第二残差子特征和所述瓶颈残差模块输出的第三残差子特征;
所述语义特征包括:所述Transformer编码器的第一网络层输出的第一语义子特征、所述Transformer编码器的第二网络层输出的第二语义子特征和所述Transformer编码器第三网络层输出的第三语义子特征;
所述对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层,包括:
将所述第一残差子特征与所述第一语义子特征进行融合得到第一融合子特征,并将所述第一融合子特征输入所述第二常规残差模块和所述第二网络层,得到所述第二常规残差模块输出的所述第二残差子特征和所述第二网络层输出的所述第二语义子特征;
将所述第二残差子特征与所述第二语义子特征进行融合得到第二融合子特征,并将所述第二融合子特征输入所述瓶颈残差模块和所述第三网络层,得到所述瓶颈残差模块输出的所述第三残差子特征和所述第三网络层输出的所述第三语义子特征;
将所述第三残差子特征与所述第三语义子特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层。
根据本公开的第二方面,提供了一种医学图像分割装置,所述装置包括:
图像输入模块,用于将待分割医学图像输入预先训练的目标图像分割模型;其中,所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层;
图像分割模块,用于所述第一残差特征提取层,对输入的所述待分割医学图像进行第一残差特征提取,并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层;所述第二残差特征提取层,对所述第一残差特征进行第二残差特征提取,并将所述第二残差特征输入所述特征融合层;所述语义特征提取层,对所述第一残差特征进行语义特征提取,并将所述语义特征输入所述特征融合层;所述特征融合层,对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层;所述结果输出层,基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像,以及确定所述目标器官的器官类别,并输出所述器官区域图像和所述器官类别。
在一可实施方式中,所述装置还包括:
区域调整模块,用于提取所述器官区域图像的轮廓区域;确定所述轮廓区域对应的外接矩形区域;当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时,调整所述轮廓区域对应的外接矩形区域;其中,所述前一帧矩形区域为:基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域;所述目标差值阈值为基于所述器官区域图像的尺寸确定的。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开所述的方法。
本公开的医学图像分割方法、装置、设备及存储介质,通过目标图像分割模型,可以直接得到待分割医学图像的器官区域图像和器官类别,不再需要工作人员人工调整医学检测仪器的检测模式,使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时,也可以在器官对应的检测模式下进行检测,提高了检测结果准确率,从而达到了更好的辅助检查效果。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
在附图中,相同或对应的标号表示相同或对应的部分。
图1示出了医学成像类型示意图;
图2示出了本公开实施例提供的医学图像分割方法的实现流程示意图;
图3示出了常规残差模块的一种结构示意图;
图4示出了瓶颈残差模块的一种结构示意图;
图5示出了一种Transformer编码器的结构示意图;
图6示出了本公开实施例提供的利用目标图像分割模型的分割器官区域图像的示意图;
图7示出了本公开实施例提供的目标图像分割模型的一种训练流程示意图;
图8示出了本公开实施例提供的训练目标图像分割模型的一种示意图;
图9示出了本公开实施例提供的双支分割网络的网络框架示意图;
图10示出了本公开实施例提供的医学图像分割装置的结构示意图;
图11示出了本公开实施例一种电子设备的组成结构示意图。
具体实施方式
为使本公开的目的、特征、优点能够更加的明显和易懂,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而非全部实施例。基于本公开中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
图1示出了医学成像类型示意图,如图1所示,超声检测技术针对不同器官所使用的超声成像探头是不一样的,比如针对心脏,通常使用相控阵探头成像;针对外周血管、甲状腺、乳腺等器官,通常使用线阵探头成像;针对腹部,通常使用凸阵探头成像。不同探头的成像格式也是不一样的,会在显示屏上呈现不同范围和不同形状的超声图像区域,具体的,相控阵探头在显示屏上呈现扇形的超声图像区域,线阵探头在显示屏上呈现矩形的超声图像区域,凸阵探头在显示屏上呈现环扇形的超声图像区域。
超声检测仪器通常可以进行多种器官的检测,由于不同器官对应的成像探头不同,因此不同器官对应的检测模式是存在差异的。因此,在变更所要检测的器官时通常需要改变检测模式。而现有的医学图像分割方法得到的分割图像中的器官的类型需要工作人员人工判断。因此,在得到分割图像后,如果分割图像中显示的器官与医学检测仪器当前的检测模式对应的器官不一致,则需要工作人员人工变更器官检测模式。而在实际的检测过程中,工作人员很容易忘记变更器官对应的检测模式,使得匹配到的超声检测仪器的检测模式很可能与实际的器官不符,进而导致检测结果不够准确。
因此,为了解决因检测模式变更导致的检测结果不够准确的问题,本公开提供了一种医学图像分割方法、装置、设备及存储介质。本公开提供的医学图像分割方法可以应用于能够进行图像处理的电子设备。
下面将结合本公开实施例中的附图,对本公开实施例的技术方案进行描述。
图2示出了本公开实施例提供的医学图像分割方法的实现流程示意图。如图2所示,所述方法包括:
S201,将待分割医学图像输入预先训练的目标图像分割模型,其中,所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层。
本公开实施例中,待分割医学图像可以是包括腹部区域图像、心脏区域图像、外周血管区域图像、甲状腺区域图像或乳腺区域图像的医学图像。医学图像具体可以为CT图像或超声图像等。
S202,所述第一残差特征提取层,对输入的所述待分割医学图像进行第一残差特征提取,并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层。
第一残差特征提取层由可以对待分割医学图像进行4倍下采样的常规残差模块和可以对待分割医学图像进行8倍下采样的常规残差模块构成。
S203,所述第二残差特征提取层,对所述第一残差特征进行第二残差特征提取,并将所述第二残差特征输入所述特征融合层。
所述第二残差特征提取层由第一常规残差模块、第二常规残差模块和瓶颈残差模块构成。第一常规残差模块和第二常规残差模块为可以对输入图像进行8倍下采样的常规残差模块,瓶颈残差模块为以对输入图像进行8倍下采样的瓶颈残差模块。
图3示出了常规残差模块的一种结构示意图,如图3所示,常规残差模块包括两个卷积层和激活函数ReLU,输入图像X经过卷积层的卷积处理后可以得到卷积特征F(X),利用激活函数ReLU对卷积特征F(X)和输出图像X进行激活处理,可以得到特征F(X)+X。
图4示出了瓶颈残差模块的一种结构示意图,如图4所示,瓶颈残差模块包括两个1×1的卷积层、一个常规卷积层和激活函数ReLU,输入图像X经过各个卷积层的卷积处理后可以得到卷积特征F(X),利用激活函数ReLU对卷积特征F(X)和输出图像X进行激活处理,可以得到特征F(X)+X。
本公开中,所述第二残差特征提取层和所述语义特征提取层为并列的两个特征提取层,S203和S204为并列的两个步骤。
S204,所述语义特征提取层,对所述第一残差特征进行语义特征提取,并将所述语义特征输入所述特征融合层。
语义特征提取层由Transformer编码器构成。Transformer编码器是由M个blocks(层)编码器叠加组成的,每个block编码器是由交替的MSA(Multi-Head Self-Attention,多头自注意力机制)和MLP(多层感知机)组成,并且在头尾还加入了LN(层标准化)结构和跳跃连接结构ResNet。图5示出了一种Transformer编码器的结构示意图,如图5所示,Transformer编码器包括:LN、MSA、跳跃连接结构和MLP。如图5所示,可以对所述第一残差特征fi均匀的分块,每一块展平后输入到Transformer编码器中。通过M层Transformer,得到与所述第一残差特征fi相同大小的所述语义特征fbi,所述语义特征 fbi可以反映待分割医学图像的语义信息和全局信息。其中,通过第n层的Transformer的输出特征为
S205,所述特征融合层,对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层。
S206,所述结果输出层,基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像,以及确定所述目标器官的器官类别,并输出所述器官区域图像和所述器官类别。
图6示出了本公开实施例提供的利用目标图像分割模型的分割器官区域图像的示意图。如图6所示,将待分割医学图像Xi输入预先训练的目标图像分割模型,目标图像分割模型的第一残差特征提取层提取了待分割医学图像Xi的第一残差特征fi,然后第二残差特征提取层和语义特征提取层分别基于第一残差特征fi提取第二残差特征fai和语义特征fbi,特征融合层对第二残差特征fai和语义特征fbi进行融合得到融合特征,然后结果输出层对融合特征进行8倍上采样,可以得到待分割医学图像中目标器官的器官区域图像以及目标器官的器官类别Yi,然后可以并输出器官区域图像和器官类别Yi。
采用本公开实施例提供的方法,通过目标图像分割模型,可以直接得到待分割医学图像的器官区域图像和器官类别,不再需要工作人员人工调整医学检测仪器的检测模式,使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时,也可以在器官对应的检测模式下进行检测,提高了检测结果准确率,从而达到了更好的辅助检查效果。
在一可实施方式中,所述第二残差特征包括所述第一常规残差模块输出的第一残差子特征、所述第二常规残差模块输出的第二残差子特征和所述瓶颈残差模块输出的第三残差子特征;所述语义特征包括:所述Transformer编码器的第一网络层输出的第一语义子特征、所述Transformer编码器的第二网络层输出的第二语义子特征和所述Transformer编码器第三网络层输出的第三语义子特征。
本公开实施例中,第二残差特征提取层和语义特征提取层的信息,每经过一些层的时候都要进行信息融合。具体的,以Transformer编码器的层数等于12为例,第一网络层为Transformer编码器的前4层,第二网络层为Transformer编码器的第5层-第8层,第三网络层为Transformer编码器的第9层-第12层。
具体的,所述对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层,具体可以包括如下步骤A1-A3:
步骤A1,将所述第一残差子特征与所述第一语义子特征进行融合得到第一融合子特征,并将所述第一融合子特征输入所述第二常规残差模块和所述第二网络层,得到所述第二常规残差模块输出的所述第二残差子特征和所述第二网络层输出的所述第二语义子特征。
步骤A2,将所述第二残差子特征与所述第二语义子特征进行融合得到第二融合子特征,并将所述第二融合子特征输入所述瓶颈残差模块和所述第三网络层,得到所述瓶颈残差模块输出的所述第三残差子特征和所述第三网络层输出的所述第三语义子特征。
步骤A3,将所述第三残差子特征与所述第三语义子特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层。
本公开实施例中,第二残差特征提取层和语义特征提取层的信息,每经过一些层的时候都要进行信息融合。具体的,以Transformer编码器的层数等于12为例,第一网络层为Transformer编码器的前4层,第二网络层为Transformer编码器的第5层-第8层,第三网络层为Transformer编码器的第9层-第12层。
在一可实施方式中,由于对医学图像进行器官区域图像分割和器官分类,是为了服务于后续的超声检测算法。而后续的超声检测算法是基于动态超声成像的,为了使超声检测算法更好的获取动态的超声成像前后帧的有效信息,本公开实施例还可以对分割得到的器官区域图像进行一些后处理,使超声区域保持稳定。具体的,在所述输出所述器官区域图像和所述器官类别之后,所述方法还可以包括如下步骤B1-B3:
步骤B1,提取所述器官区域图像的轮廓区域。
由于通过目标图像分割模所分割得到的器官区域图像通常为具有器官类别值的遮罩,遮罩不是规则的长方形,因此需要将遮罩的轮廓提取出来,轮廓的外接矩形即为超声检测仪器的超声区域的范围框。
步骤B2,确定所述轮廓区域对应的外接矩形区域。
具体的,可以将能包括所述轮廓区域的最小矩形确定为所述轮廓区域对应的外接矩形区域。
步骤B3,当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时,调整所述轮廓区域对应的外接矩形区域。
其中,所述前一帧矩形区域为:基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域;所述目标差值阈值为基于所述器官区域图像的尺寸确定的。
其中,w和h分别为待分割医学图像的宽和高,α为预设的波动范围百分比,α取值范围为0~1,
在一可实施方式中,图7示出了本公开实施例提供的目标图像分割模型的一种训练流程示意图,如图7所示,所述目标图像分割模型的训练方式包括:
S701,将样本医学图像输入待训练深度学习模型。
所述待训练深度学习模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层。
S702,所述第一残差特征提取层,对输入的所述样本医学图像进行第一样本残差特征提取,并将所述第一样本残差特征输入所述第二残差特征提取层和所述语义特征提取层。
第一残差特征提取层由可以对待分割医学图像进行4倍下采样的常规残差模块和可以对待分割医学图像进行8倍下采样的常规残差模块构成。
S703,所述第二残差特征提取层,对所述第一样本残差特征进行第二样本残差特征提取,并将所述第二样本残差特征输入所述特征融合层。
所述第二残差特征提取层由第一常规残差模块、第二常规残差模块和瓶颈残差模块构成。第一常规残差模块和第二常规残差模块为可以对输入图像进行8倍下采样的常规残差模块,瓶颈残差模块为以对输入图像进行8倍下采样的瓶颈残差模块。
本公开中,所述第二残差特征提取层和所述语义特征提取层为并列的两个特征提取层,因此,S703和S704为并列的两个步骤。
S704,所述语义特征提取层,对所述第一样本残差特征进行样本语义特征提取,并将所述样本语义特征输入所述特征融合层。
语义特征提取层具体可以由M层的Transformer编码器构成,其结构可以参考图5。
S705,所述特征融合层,对所述第二样本残差特征和所述样本语义特征进行融合得到样本融合特征,并将所述样本融合特征输入所述结果输出层。
S706,所述结果输出层,基于所述样本融合特征提取所述样本医学图像中的预测器官区域图像,以及确定所述样本医学图像中的器官的预测器官类别,并输出所述预测器官区域图像和所述预测器官类别。
S707,基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练模型的损失函数。
损失函数具体可以选用骰子损失函数或交叉熵损失函数等。
S708,确定所述损失函数是否收敛。
S709,如果是,将当前的待训练深度学习模型确定为目标图像分割模型。
S710,如果否,调整当前的待训练深度学习模型的各个层的参数,并选取下一个样本医学图像,返回所述将样本医学图像输入待训练深度学习模型的步骤。
在一种可实施方式中,将样本医学图像输入待训练深度学习模型之前,本公开实施例可以预先提取样本医学图像对应的器官区域图像,以及预先样本医学图像对应的器官类别标签。通常可以通过人工标注样本医学图像对应的器官区域图像,但是人工标注会耗费巨大的人工资源且标注效率较低,本公开实施例中,可以通过提取样本医学图像的连通区域得到器官区域图像,再对器官区域图像中的各个像素标注器官类别标签。
具体的,在所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练模型的损失函数之前,所述方法还包括步骤C1-C5:
步骤C1,对所述样本医学图像进行二值化处理,得到二值化图像。
本步骤中,可以计算样本医学图中所有像素值的平均值,然后将像素值小于平均值的像素点的像素置为0,将像素值不小于平均值的像素点的像素置为255,得到二值化图像。
步骤C2,对所述二值化图像进行腐蚀处理,得到腐蚀图像。
本步骤可以采用任意的图像腐蚀算法对所述二值化图像进行腐蚀处理,此处不做具体限定。
步骤C3,提取所述腐蚀图像中的所有连通区域图像。
具体的,可以将所述腐蚀图像中具有相同像素值且位置相邻的前景像素点组成的各个图像区域均提取出来,得到一个或多个连通区域图像。
步骤C4,将面积最大的连通区域图像确定为所述样本医学图像对应的器官区域图像。
步骤C5,为所述样本医学图像对应的器官区域图像中每个像素点赋予预先标注的器官类别标签,得到携带标签的器官区域图像。
本公开实施例中,不同的器官对应不同的标签,例如标签label1可以用于标识腹部,标签label2可以用于标识心脏,标签label3可以用于标识外部血管。
具体的,本步骤中可以预先通过人工判断出样本医学图像对应的器官区域的器官类别,然后为所述样本医学图像对应的器官区域图像中每个像素点赋予器官类别标签。
则所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练模型的损失函数,具体可以包括步骤D1:
步骤D1,根据所述预测器官区域图像、所述预测器官类别和所述携带标签的器官区域图像,计算所述待训练模型的损失函数。
图8示出了本公开实施例提供的训练目标图像分割模型的一种示意图,如图8所示,maski为预先提取的携带标签的器官区域图像,将样本医学图像Xi输入待训练深度学习模型,待训练深度学习模型的第一残差特征提取层提取了样本医学图像Xi的第一残差特征fi,然后第二残差特征提取层和语义特征提取层分别基于第一残差特征fi提取第二残差特征fai和语义特征fbi,特征融合层对第二残差特征fai和语义特征fbi进行融合得到融合特征,然后结果输出层对融合特征进行8倍上采样,可以得到样本医学图像Xi中的预测器官区域图像以及预测器官类别Yi,然后,可以利用预先提取的携带标签的器官区域图像maski与预测器官区域图像以及预测器官类别Yi计算损失函数L,如果损失函数L收敛,可以将当前的待训练深度学习模型确定为目标图像分割模型,如果如果损失函数L不收敛,可以调整当前的待训练深度学习模型的各个层的参数,并选取下一个样本医学图像,返回所述将样本医学图像输入待训练深度学习模型的步骤。
本公开实施例对待训练网络设计了双支分割网络,包括分支a(即第二残差特征提取层)和分支b(即语义特征提取层),分支a和分支b可以在不同层之间进行融合,其网络框架参见图9。如图9所示,第二残差特征提取层和语义特征提取层的信息,每经过一些层的时候都要进行信息融合。语义特征提取层由Transformer编码器构成,具体的,以Transformer编码器的层数等于12为例,Transformer编码器的第一网络层为Transformer编码器的前4层,Transformer编码器的第二网络层为Transformer编码器的第5层-第8层,Transformer编码器的第三网络层为Transformer编码器的第9层-第12层。本公开实施例中,可以将分支a的第一个残差模块输出的第一残差子特征和第一网络层输出的第一语义子特征进行融合,得到第一融合子特征,并将第一融合子特征分别输入Transformer编码器后续的网络层和分支a的第二个残差模块。然后,可以将分支a的第二个残差模块输出的第二残差子特征和第二网络层输出的第二语义子特征进行融合,得到第二融合子特征,并将第二融合子特征分别输入Transformer编码器后续的网络层和分支a的第三个残差模块。然后,可以将分支a的第三个残差模块输出的第三残差子特征和第三网络层输出的第三语义子特征进行融合,得到融合特征。
采用本公开实施例提供的方法,通过目标图像分割模型,可以直接得到待分割医学图像的器官区域图像和器官类别,不再需要工作人员人工调整医学检测仪器的检测模式,使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时,也可以在器官对应的检测模式下进行检测,提高了检测结果准确率,从而达到了更好的辅助检查效果。并且,通过目标图像分割模型的双支分割网络,其中一个分支保持较高的分辨率,另一个分支通过下采样操作获取丰富的语义信息,并对两个双支分割网络输出的特征进行交叉融合,使得分割得到的器官区域图像更准确。
基于同一发明构思,根据本公开上述实施例提供的医学图像分割方法,相应地,本公开另一实施例还提供了一种医学图像分割装置,其结构示意图如图10所示,具体包括:
图像输入模块1001,用于将待分割医学图像输入预先训练的目标图像分割模型;其中,所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层;
图像分割模块1002,用于所述第一残差特征提取层,对输入的所述待分割医学图像进行第一残差特征提取,并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层;所述第二残差特征提取层,对所述第一残差特征进行第二残差特征提取,并将所述第二残差特征输入所述特征融合层;所述语义特征提取层,对所述第一残差特征进行语义特征提取,并将所述语义特征输入所述特征融合层;所述特征融合层,对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层;所述结果输出层,基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像,以及确定所述目标器官的器官类别,并输出所述器官区域图像和所述器官类别。
采用本公开实施例提供的装置,通过目标图像分割模型,可以直接得到待分割医学图像的器官区域图像和器官类别,不再需要工作人员人工调整医学检测仪器的检测模式,使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时,也可以在器官对应的检测模式下进行检测,提高了检测结果准确率,从而达到了更好的辅助检查效果。
在一可实施方式中,所述装置还包括:
区域调整模块(图中未示出),用于提取所述器官区域图像的轮廓区域;确定所述轮廓区域对应的外接矩形区域;当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时,调整所述轮廓区域对应的外接矩形区域;其中,所述前一帧矩形区域为:基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域;所述目标差值阈值为基于所述器官区域图像的尺寸确定的。
在一可实施方式中,所述装置还包括:
模型训练模块(图中未示出),用于将样本医学图像输入待训练深度学习模型,所述待训练深度学习模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层;所述第一残差特征提取层,对输入的所述样本医学图像进行第一样本残差特征提取,并将所述第一样本残差特征输入所述第二残差特征提取层和所述语义特征提取层;所述第二残差特征提取层,对所述第一样本残差特征进行第二样本残差特征提取,并将所述第二样本残差特征输入所述特征融合层;所述语义特征提取层,对所述第一样本残差特征进行样本语义特征提取,并将所述样本语义特征输入所述特征融合层;所述特征融合层,对所述第二样本残差特征和所述样本语义特征进行融合得到样本融合特征,并将所述样本融合特征输入所述结果输出层;所述结果输出层,基于所述样本融合特征提取所述样本医学图像中的预测器官区域图像,以及确定所述样本医学图像中的器官的预测器官类别,并输出所述预测器官区域图像和所述预测器官类别;基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练模型的损失函数;确定所述损失函数是否收敛;如果是,将当前的待训练深度学习模型确定为目标图像分割模型;如果否,调整当前的待训练深度学习模型的各个层的参数,并选取下一个样本医学图像,返回所述将样本医学图像输入待训练深度学习模型的步骤。
在一可实施方式中,所述装置还包括:
数据预处理模块(图中未示出),用于对所述样本医学图像进行二值化处理,得到二值化图像;对所述二值化图像进行腐蚀处理,得到腐蚀图像;提取所述腐蚀图像中的所有连通区域图像;将面积最大的连通区域图像确定为所述样本医学图像对应的器官区域图像;为所述样本医学图像对应的器官区域图像中每个像素点赋予预先标注的器官类别标签,得到携带标签的器官区域图像;
所述模型训练模块,具体用于根据所述预测器官区域图像、所述预测器官类别和所述携带标签的器官区域图像,计算所述待训练模型的损失函数。
在一可实施方式中,所述第二残差特征提取层由第一常规残差模块、第二常规残差模块和瓶颈残差模块构成;所述语义特征提取层由Transformer编码器构成。
在一可实施方式中,所述第二残差特征包括所述第一常规残差模块输出的第一残差子特征、所述第二常规残差模块输出的第二残差子特征和所述瓶颈残差模块输出的第三残差子特征;
所述语义特征包括:所述Transformer编码器的第一网络层输出的第一语义子特征、所述Transformer编码器的第二网络层输出的第二语义子特征和所述Transformer编码器第三网络层输出的第三语义子特征;
所述图像分割模块1002,具体用于将所述第一残差子特征与所述第一语义子特征进行融合得到第一融合子特征,并将所述第一融合子特征输入所述第二常规残差模块和所述第二网络层,得到所述第二常规残差模块输出的所述第二残差子特征和所述第二网络层输出的所述第二语义子特征;将所述第二残差子特征与所述第二语义子特征进行融合得到第二融合子特征,并将所述第二融合子特征输入所述瓶颈残差模块和所述第三网络层,得到所述瓶颈残差模块输出的所述第三残差子特征和所述第三网络层输出的所述第三语义子特征;将所述第三残差子特征与所述第三语义子特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层。
采用本公开实施例提供的装置,通过目标图像分割模型,可以直接得到待分割医学图像的器官区域图像和器官类别,不再需要工作人员人工调整医学检测仪器的检测模式,使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时,也可以在器官对应的检测模式下进行检测,提高了检测结果准确率,从而达到了更好的辅助检查效果。并且,通过目标图像分割模型的双支分割网络,其中一个分支保持较高的分辨率,另一个分支通过下采样操作获取丰富的语义信息,并对两个双支分割网络输出的特征进行交叉融合,使得分割得到的器官区域图像更准确。
根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质。
图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元1108,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如医学图像分割方法。例如,在一些实施例中,医学图像分割方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的医学图像分割方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行医学图像分割方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种医学图像分割方法,其特征在于,所述方法包括:
将待分割医学图像输入预先训练的目标图像分割模型,其中,所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层;
所述第一残差特征提取层,对输入的所述待分割医学图像进行第一残差特征提取,并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层;
所述第二残差特征提取层,对所述第一残差特征进行第二残差特征提取,并将所述第二残差特征输入所述特征融合层;
所述语义特征提取层,对所述第一残差特征进行语义特征提取,并将所述语义特征输入所述特征融合层;
所述特征融合层,对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层;
所述结果输出层,基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像,以及确定所述目标器官的器官类别,并输出所述器官区域图像和所述器官类别。
2.根据权利要求1所述的方法,其特征在于,在所述输出所述器官区域图像和所述器官类别之后,所述方法还包括:
提取所述器官区域图像的轮廓区域;
确定所述轮廓区域对应的外接矩形区域;
当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时,调整所述轮廓区域对应的外接矩形区域;其中,所述前一帧矩形区域为:基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域;所述目标差值阈值为基于所述器官区域图像的尺寸确定的。
3.根据权利要求1所述的方法,其特征在于,所述目标图像分割模型的训练方式包括:
将样本医学图像输入待训练深度学习模型,所述待训练深度学习模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层;
所述第一残差特征提取层,对输入的所述样本医学图像进行第一样本残差特征提取,并将所述第一样本残差特征输入所述第二残差特征提取层和所述语义特征提取层;
所述第二残差特征提取层,对所述第一样本残差特征进行第二样本残差特征提取,并将所述第二样本残差特征输入所述特征融合层;
所述语义特征提取层,对所述第一样本残差特征进行样本语义特征提取,并将所述样本语义特征输入所述特征融合层;
所述特征融合层,对所述第二样本残差特征和所述样本语义特征进行融合得到样本融合特征,并将所述样本融合特征输入所述结果输出层;
所述结果输出层,基于所述样本融合特征提取所述样本医学图像中的预测器官区域图像,以及确定所述样本医学图像中的器官的预测器官类别,并输出所述预测器官区域图像和所述预测器官类别;
基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练深度学习模型的损失函数;
确定所述损失函数是否收敛;
如果是,将当前的待训练深度学习模型确定为目标图像分割模型;
如果否,调整当前的待训练深度学习模型的各个层的参数,并选取下一个样本医学图像,返回所述将样本医学图像输入待训练深度学习模型的步骤。
4.根据权利要求3所述的方法,其特征在于,在所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练深度学习模型的损失函数之前,所述方法还包括:
对所述样本医学图像进行二值化处理,得到二值化图像;
对所述二值化图像进行腐蚀处理,得到腐蚀图像;
提取所述腐蚀图像中的所有连通区域图像;
将面积最大的连通区域图像确定为所述样本医学图像对应的器官区域图像;
为所述样本医学图像对应的器官区域图像中每个像素点赋予预先标注的器官类别标签,得到携带标签的器官区域图像;
所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像,以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签,计算所述待训练深度学习模型的损失函数,包括:
根据所述预测器官区域图像、所述预测器官类别和所述携带标签的器官区域图像,计算所述待训练深度学习模型的损失函数。
5.根据权利要求1所述的方法,其特征在于,所述第二残差特征提取层由第一常规残差模块、第二常规残差模块和瓶颈残差模块构成;所述语义特征提取层由Transformer编码器构成。
6.根据权利要求5所述的方法,其特征在于,所述第二残差特征包括所述第一常规残差模块输出的第一残差子特征、所述第二常规残差模块输出的第二残差子特征和所述瓶颈残差模块输出的第三残差子特征;
所述语义特征包括:所述Transformer编码器的第一网络层输出的第一语义子特征、所述Transformer编码器的第二网络层输出的第二语义子特征和所述Transformer编码器第三网络层输出的第三语义子特征;
所述对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层,包括:
将所述第一残差子特征与所述第一语义子特征进行融合得到第一融合子特征,并将所述第一融合子特征输入所述第二常规残差模块和所述第二网络层,得到所述第二常规残差模块输出的所述第二残差子特征和所述第二网络层输出的所述第二语义子特征;
将所述第二残差子特征与所述第二语义子特征进行融合得到第二融合子特征,并将所述第二融合子特征输入所述瓶颈残差模块和所述第三网络层,得到所述瓶颈残差模块输出的所述第三残差子特征和所述第三网络层输出的所述第三语义子特征;
将所述第三残差子特征与所述第三语义子特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层。
7.一种医学图像分割装置,其特征在于,所述装置包括:
图像输入模块,用于将待分割医学图像输入预先训练的目标图像分割模型;其中,所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层;
图像分割模块,用于所述第一残差特征提取层,对输入的所述待分割医学图像进行第一残差特征提取,并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层;所述第二残差特征提取层,对所述第一残差特征进行第二残差特征提取,并将所述第二残差特征输入所述特征融合层;所述语义特征提取层,对所述第一残差特征进行语义特征提取,并将所述语义特征输入所述特征融合层;所述特征融合层,对所述第二残差特征和所述语义特征进行融合得到融合特征,并将所述融合特征输入所述结果输出层;所述结果输出层,基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像,以及确定所述目标器官的器官类别,并输出所述器官区域图像和所述器官类别。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
区域调整模块,用于提取所述器官区域图像的轮廓区域;确定所述轮廓区域对应的外接矩形区域;当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时,调整所述轮廓区域对应的外接矩形区域;其中,所述前一帧矩形区域为:基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域;所述目标差值阈值为基于所述器官区域图像的尺寸确定的。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211188150.0A CN115409990B (zh) | 2022-09-28 | 2022-09-28 | 一种医学图像分割方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211188150.0A CN115409990B (zh) | 2022-09-28 | 2022-09-28 | 一种医学图像分割方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115409990A CN115409990A (zh) | 2022-11-29 |
CN115409990B true CN115409990B (zh) | 2023-06-16 |
Family
ID=84168226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211188150.0A Active CN115409990B (zh) | 2022-09-28 | 2022-09-28 | 一种医学图像分割方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115409990B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116246774B (zh) * | 2023-03-15 | 2023-11-24 | 浙江医准智能科技有限公司 | 一种基于信息融合的分类方法、装置及设备 |
CN116844143B (zh) * | 2023-09-01 | 2023-12-05 | 武汉互创联合科技有限公司 | 基于边缘增强的胚胎发育阶段预测与质量评估系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109410185B (zh) * | 2018-10-10 | 2019-10-25 | 腾讯科技(深圳)有限公司 | 一种图像分割方法、装置和存储介质 |
CN111104962B (zh) * | 2019-11-05 | 2023-04-18 | 北京航空航天大学青岛研究院 | 图像的语义分割方法、装置、电子设备及可读存储介质 |
CN111028246A (zh) * | 2019-12-09 | 2020-04-17 | 北京推想科技有限公司 | 一种医学图像分割方法、装置、存储介质及电子设备 |
CN111627024A (zh) * | 2020-05-14 | 2020-09-04 | 辽宁工程技术大学 | 一种改进U-net的肾脏肿瘤分割方法 |
CN114066902A (zh) * | 2021-11-22 | 2022-02-18 | 安徽大学 | 一种基于卷积和transformer融合的医学图像分割方法、系统、装置 |
CN114359248A (zh) * | 2022-01-10 | 2022-04-15 | 海杰亚(北京)医疗器械有限公司 | 一种医学图像分割方法、装置、存储介质及电子设备 |
CN114998307A (zh) * | 2022-07-06 | 2022-09-02 | 重庆大学 | 基于双分辨率网络的两阶段全3d腹部器官分割方法及系统 |
-
2022
- 2022-09-28 CN CN202211188150.0A patent/CN115409990B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115409990A (zh) | 2022-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115409990B (zh) | 一种医学图像分割方法、装置、设备及存储介质 | |
CN112560862B (zh) | 文本识别方法、装置及电子设备 | |
CN114565763B (zh) | 图像分割方法、装置、设备、介质及程序产品 | |
CN113361578B (zh) | 图像处理模型的训练方法、装置、电子设备及存储介质 | |
CN113947188A (zh) | 目标检测网络的训练方法和车辆检测方法 | |
CN113971728B (zh) | 图像识别方法、模型的训练方法、装置、设备及介质 | |
CN114648676A (zh) | 点云处理模型的训练和点云实例分割方法及装置 | |
CN113344862A (zh) | 缺陷检测方法、装置、电子设备及存储介质 | |
CN115018805A (zh) | 分割模型训练方法、图像分割方法、装置、设备及介质 | |
CN114511743B (zh) | 检测模型训练、目标检测方法、装置、设备、介质及产品 | |
CN111192320A (zh) | 一种位置信息确定方法、装置、设备和存储介质 | |
CN116245832B (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN114972361B (zh) | 一种血流分割方法、装置、设备及存储介质 | |
CN115439453B (zh) | 一种脊椎椎体定位方法、装置、电子设备及存储介质 | |
CN113780239B (zh) | 虹膜识别方法、装置、电子设备和计算机可读介质 | |
CN113537026B (zh) | 建筑平面图中的图元检测方法、装置、设备及介质 | |
CN116091416A (zh) | 印制电路板组装缺陷检测、变化检测模型训练方法及装置 | |
CN115631370A (zh) | 一种基于卷积神经网络的mri序列类别的识别方法及装置 | |
CN115578564B (zh) | 实例分割模型的训练方法、装置、电子设备及存储介质 | |
CN116128863B (zh) | 一种医学图像处理方法、装置及设备 | |
CN114972242B (zh) | 心肌桥检测模型的训练方法、装置及电子设备 | |
CN115690143B (zh) | 图像分割方法、装置、电子设备及存储介质 | |
CN115358976B (zh) | 一种图像识别方法、装置、设备及存储介质 | |
CN117788903A (zh) | 数据处理方法及装置 | |
CN117809092A (zh) | 一种医学图像的处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address |
Address after: Room 3011, 2nd Floor, Building A, No. 1092 Jiangnan Road, Nanmingshan Street, Liandu District, Lishui City, Zhejiang Province, 323000 Patentee after: Zhejiang Yizhun Intelligent Technology Co.,Ltd. Address before: No. 1202-1203, 12 / F, block a, Zhizhen building, No. 7, Zhichun Road, Haidian District, Beijing 100083 Patentee before: Beijing Yizhun Intelligent Technology Co.,Ltd. |
|
CP03 | Change of name, title or address |