CN115409990B

CN115409990B - 一种医学图像分割方法、装置、设备及存储介质

Info

Publication number: CN115409990B
Application number: CN202211188150.0A
Authority: CN
Inventors: 于昕晔; 陈登博; 马璐; 丁佳; 吕晨翀
Original assignee: Beijing Yizhun Medical AI Co Ltd
Current assignee: Zhejiang Yizhun Intelligent Technology Co ltd
Priority date: 2022-09-28
Filing date: 2022-09-28
Publication date: 2023-06-16
Anticipated expiration: 2042-09-28
Also published as: CN115409990A

Abstract

本公开提供了一种医学图像分割方法、装置、设备及存储介质，所述方法包括：将待分割医学图像输入预先训练的目标图像分割模型，第一残差特征提取层提取第一残差特征，第二残差特征提取层对第一残差特征提取第二残差特征，语义特征提取层对第一残差特征提取语义特征，特征融合层对第二残差特征和语义特征进行融合得到融合特征，结果输出层基于融合特征提取待分割医学图像中目标器官的器官区域图像，以及确定目标器官的器官类别，并输出器官区域图像和器官类别。采用该方法，使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时，也可以在器官对应的检测模式下进行检测，提高了检测结果准确率，从而达到了更好的辅助检查效果。

Description

一种医学图像分割方法、装置、设备及存储介质

技术领域

本公开涉及图像处理领域，尤其涉及一种医学图像分割方法、装置、设备及存储介质。

背景技术

图像分割是根据图像的相似性特征将图像划分为若干个互不相交的连通区域的过程，其中，图像的相似性特征如：亮度、颜色、纹理、面积、形状、位置、局部统计特征或频谱特征等。医学图像分割是医学图像处理与分析领域的重要步骤，其目的是将医学图像中某些具有特殊含义的部分分割出来，为医学研究提供可靠的依据，以使医学检测仪器能更好地进行检测。

随着深度学习技术的兴起，卷积神经网络被应用于医学图像分割，基于深度学习的图像分割方法成为了目前常用的医学图像分割方法。基于深度学习的图像分割方法是预先利用训练集的图像训练出图像分割模型，然后通过训练得到的图像分割模型进行图像分割。

一台医学检测仪器可以进行多种器官的检测，不同器官对应的检测模式是存在差异的。而现有的医学图像分割方法得到的分割图像中的器官的类型需要工作人员人工判断。因此，在得到分割图像后，如果分割图像中显示的器官与医学检测仪器当前的检测模式对应的器官不一致，则需要工作人员人工变更器官检测模式。而在实际的检测过程中，工作人员很容易忘记变更器官对应的检测模式，使得匹配到的医学检测仪器的检测模式很可能与实际的器官不符，进而导致医学检测仪器的检测结果不够准确。

发明内容

本公开提供了一种医学图像分割方法、装置、设备及存储介质，以至少解决现有技术中存在的以上技术问题。

根据本公开的第一方面，提供了一种医学图像分割方法，所述方法包括：

将待分割医学图像输入预先训练的目标图像分割模型，其中，所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层；

所述第一残差特征提取层，对输入的所述待分割医学图像进行第一残差特征提取，并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层；

所述第二残差特征提取层，对所述第一残差特征进行第二残差特征提取，并将所述第二残差特征输入所述特征融合层；

所述语义特征提取层，对所述第一残差特征进行语义特征提取，并将所述语义特征输入所述特征融合层；

所述特征融合层，对所述第二残差特征和所述语义特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层；

所述结果输出层，基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像，以及确定所述目标器官的器官类别，并输出所述器官区域图像和所述器官类别。

在一可实施方式中，在所述输出所述器官区域图像和所述器官类别之后，所述方法还包括：

提取所述器官区域图像的轮廓区域；

确定所述轮廓区域对应的外接矩形区域；

当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时，调整所述轮廓区域对应的外接矩形区域；其中，所述前一帧矩形区域为：基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域；所述目标差值阈值为基于所述器官区域图像的尺寸确定的。

在一可实施方式中，所述目标图像分割模型的训练方式包括：

将样本医学图像输入待训练深度学习模型，所述待训练深度学习模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层；

所述第一残差特征提取层，对输入的所述样本医学图像进行第一样本残差特征提取，并将所述第一样本残差特征输入所述第二残差特征提取层和所述语义特征提取层；

所述第二残差特征提取层，对所述第一样本残差特征进行第二样本残差特征提取，并将所述第二样本残差特征输入所述特征融合层；

所述语义特征提取层，对所述第一样本残差特征进行样本语义特征提取，并将所述样本语义特征输入所述特征融合层；

所述特征融合层，对所述第二样本残差特征和所述样本语义特征进行融合得到样本融合特征，并将所述样本融合特征输入所述结果输出层；

所述结果输出层，基于所述样本融合特征提取所述样本医学图像中的预测器官区域图像，以及确定所述样本医学图像中的器官的预测器官类别，并输出所述预测器官区域图像和所述预测器官类别；

基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练模型的损失函数；

确定所述损失函数是否收敛；

如果是，将当前的待训练深度学习模型确定为目标图像分割模型；

如果否，调整当前的待训练深度学习模型的各个层的参数，并选取下一个样本医学图像，返回所述将样本医学图像输入待训练深度学习模型的步骤。

在一可实施方式中，在所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练模型的损失函数之前，所述方法还包括：

对所述样本医学图像进行二值化处理，得到二值化图像；

对所述二值化图像进行腐蚀处理，得到腐蚀图像；

提取所述腐蚀图像中的所有连通区域图像；

将面积最大的连通区域图像确定为所述样本医学图像对应的器官区域图像；

为所述样本医学图像对应的器官区域图像中每个像素点赋予预先标注的器官类别标签，得到携带标签的器官区域图像；

所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练模型的损失函数，包括：

根据所述预测器官区域图像、所述预测器官类别和所述携带标签的器官区域图像，计算所述待训练模型的损失函数。

在一可实施方式中，所述第二残差特征提取层由第一常规残差模块、第二常规残差模块和瓶颈残差模块构成；所述语义特征提取层由Transformer编码器构成。

在一可实施方式中，所述第二残差特征包括所述第一常规残差模块输出的第一残差子特征、所述第二常规残差模块输出的第二残差子特征和所述瓶颈残差模块输出的第三残差子特征；

所述语义特征包括：所述Transformer编码器的第一网络层输出的第一语义子特征、所述Transformer编码器的第二网络层输出的第二语义子特征和所述Transformer编码器第三网络层输出的第三语义子特征；

所述对所述第二残差特征和所述语义特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层，包括：

将所述第一残差子特征与所述第一语义子特征进行融合得到第一融合子特征，并将所述第一融合子特征输入所述第二常规残差模块和所述第二网络层，得到所述第二常规残差模块输出的所述第二残差子特征和所述第二网络层输出的所述第二语义子特征；

将所述第二残差子特征与所述第二语义子特征进行融合得到第二融合子特征，并将所述第二融合子特征输入所述瓶颈残差模块和所述第三网络层，得到所述瓶颈残差模块输出的所述第三残差子特征和所述第三网络层输出的所述第三语义子特征；

将所述第三残差子特征与所述第三语义子特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层。

根据本公开的第二方面，提供了一种医学图像分割装置，所述装置包括：

图像输入模块，用于将待分割医学图像输入预先训练的目标图像分割模型；其中，所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层；

图像分割模块，用于所述第一残差特征提取层，对输入的所述待分割医学图像进行第一残差特征提取，并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层；所述第二残差特征提取层，对所述第一残差特征进行第二残差特征提取，并将所述第二残差特征输入所述特征融合层；所述语义特征提取层，对所述第一残差特征进行语义特征提取，并将所述语义特征输入所述特征融合层；所述特征融合层，对所述第二残差特征和所述语义特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层；所述结果输出层，基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像，以及确定所述目标器官的器官类别，并输出所述器官区域图像和所述器官类别。

在一可实施方式中，所述装置还包括：

区域调整模块，用于提取所述器官区域图像的轮廓区域；确定所述轮廓区域对应的外接矩形区域；当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时，调整所述轮廓区域对应的外接矩形区域；其中，所述前一帧矩形区域为：基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域；所述目标差值阈值为基于所述器官区域图像的尺寸确定的。

根据本公开的第三方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本公开所述的方法。

根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本公开所述的方法。

本公开的医学图像分割方法、装置、设备及存储介质，通过目标图像分割模型，可以直接得到待分割医学图像的器官区域图像和器官类别，不再需要工作人员人工调整医学检测仪器的检测模式，使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时，也可以在器官对应的检测模式下进行检测，提高了检测结果准确率，从而达到了更好的辅助检查效果。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

通过参考附图阅读下文的详细描述，本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施方式，其中：

在附图中，相同或对应的标号表示相同或对应的部分。

图1示出了医学成像类型示意图；

图2示出了本公开实施例提供的医学图像分割方法的实现流程示意图；

图3示出了常规残差模块的一种结构示意图；

图4示出了瓶颈残差模块的一种结构示意图；

图5示出了一种Transformer编码器的结构示意图；

图6示出了本公开实施例提供的利用目标图像分割模型的分割器官区域图像的示意图；

图7示出了本公开实施例提供的目标图像分割模型的一种训练流程示意图；

图8示出了本公开实施例提供的训练目标图像分割模型的一种示意图；

图9示出了本公开实施例提供的双支分割网络的网络框架示意图；

图10示出了本公开实施例提供的医学图像分割装置的结构示意图；

图11示出了本公开实施例一种电子设备的组成结构示意图。

具体实施方式

为使本公开的目的、特征、优点能够更加的明显和易懂，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而非全部实施例。基于本公开中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

图1示出了医学成像类型示意图，如图1所示，超声检测技术针对不同器官所使用的超声成像探头是不一样的，比如针对心脏，通常使用相控阵探头成像；针对外周血管、甲状腺、乳腺等器官，通常使用线阵探头成像；针对腹部，通常使用凸阵探头成像。不同探头的成像格式也是不一样的，会在显示屏上呈现不同范围和不同形状的超声图像区域，具体的，相控阵探头在显示屏上呈现扇形的超声图像区域，线阵探头在显示屏上呈现矩形的超声图像区域，凸阵探头在显示屏上呈现环扇形的超声图像区域。

超声检测仪器通常可以进行多种器官的检测，由于不同器官对应的成像探头不同，因此不同器官对应的检测模式是存在差异的。因此，在变更所要检测的器官时通常需要改变检测模式。而现有的医学图像分割方法得到的分割图像中的器官的类型需要工作人员人工判断。因此，在得到分割图像后，如果分割图像中显示的器官与医学检测仪器当前的检测模式对应的器官不一致，则需要工作人员人工变更器官检测模式。而在实际的检测过程中，工作人员很容易忘记变更器官对应的检测模式，使得匹配到的超声检测仪器的检测模式很可能与实际的器官不符，进而导致检测结果不够准确。

因此，为了解决因检测模式变更导致的检测结果不够准确的问题，本公开提供了一种医学图像分割方法、装置、设备及存储介质。本公开提供的医学图像分割方法可以应用于能够进行图像处理的电子设备。

下面将结合本公开实施例中的附图，对本公开实施例的技术方案进行描述。

图2示出了本公开实施例提供的医学图像分割方法的实现流程示意图。如图2所示，所述方法包括：

S201，将待分割医学图像输入预先训练的目标图像分割模型，其中，所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层。

本公开实施例中，待分割医学图像可以是包括腹部区域图像、心脏区域图像、外周血管区域图像、甲状腺区域图像或乳腺区域图像的医学图像。医学图像具体可以为CT图像或超声图像等。

S202，所述第一残差特征提取层，对输入的所述待分割医学图像进行第一残差特征提取，并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层。

第一残差特征提取层由可以对待分割医学图像进行4倍下采样的常规残差模块和可以对待分割医学图像进行8倍下采样的常规残差模块构成。

S203，所述第二残差特征提取层，对所述第一残差特征进行第二残差特征提取，并将所述第二残差特征输入所述特征融合层。

所述第二残差特征提取层由第一常规残差模块、第二常规残差模块和瓶颈残差模块构成。第一常规残差模块和第二常规残差模块为可以对输入图像进行8倍下采样的常规残差模块，瓶颈残差模块为以对输入图像进行8倍下采样的瓶颈残差模块。

图3示出了常规残差模块的一种结构示意图，如图3所示，常规残差模块包括两个卷积层和激活函数ReLU，输入图像X经过卷积层的卷积处理后可以得到卷积特征F(X)，利用激活函数ReLU对卷积特征F(X)和输出图像X进行激活处理，可以得到特征F(X)+X。

图4示出了瓶颈残差模块的一种结构示意图，如图4所示，瓶颈残差模块包括两个1×1的卷积层、一个常规卷积层和激活函数ReLU，输入图像X经过各个卷积层的卷积处理后可以得到卷积特征F(X)，利用激活函数ReLU对卷积特征F(X)和输出图像X进行激活处理，可以得到特征F(X)+X。

本公开中，所述第二残差特征提取层和所述语义特征提取层为并列的两个特征提取层，S203和S204为并列的两个步骤。

S204，所述语义特征提取层，对所述第一残差特征进行语义特征提取，并将所述语义特征输入所述特征融合层。

语义特征提取层由Transformer编码器构成。Transformer编码器是由M个blocks(层)编码器叠加组成的，每个block编码器是由交替的MSA(Multi-Head Self-Attention，多头自注意力机制)和MLP(多层感知机)组成，并且在头尾还加入了LN(层标准化)结构和跳跃连接结构ResNet。图5示出了一种Transformer编码器的结构示意图，如图5所示，Transformer编码器包括：LN、MSA、跳跃连接结构和MLP。如图5所示，可以对所述第一残差特征f_i均匀的分块，每一块展平后输入到Transformer编码器中。通过M层Transformer，得到与所述第一残差特征f_i相同大小的所述语义特征fb_i，所述语义特征 fb_i可以反映待分割医学图像的语义信息和全局信息。其中，通过第n层的Transformer的输出特征为

S205，所述特征融合层，对所述第二残差特征和所述语义特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层。

S206，所述结果输出层，基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像，以及确定所述目标器官的器官类别，并输出所述器官区域图像和所述器官类别。

图6示出了本公开实施例提供的利用目标图像分割模型的分割器官区域图像的示意图。如图6所示，将待分割医学图像X_i输入预先训练的目标图像分割模型，目标图像分割模型的第一残差特征提取层提取了待分割医学图像X_i的第一残差特征f_i，然后第二残差特征提取层和语义特征提取层分别基于第一残差特征f_i提取第二残差特征f_ai和语义特征f_bi，特征融合层对第二残差特征f_ai和语义特征f_bi进行融合得到融合特征，然后结果输出层对融合特征进行8倍上采样，可以得到待分割医学图像中目标器官的器官区域图像以及目标器官的器官类别Y_i，然后可以并输出器官区域图像和器官类别Y_i。

采用本公开实施例提供的方法，通过目标图像分割模型，可以直接得到待分割医学图像的器官区域图像和器官类别，不再需要工作人员人工调整医学检测仪器的检测模式，使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时，也可以在器官对应的检测模式下进行检测，提高了检测结果准确率，从而达到了更好的辅助检查效果。

在一可实施方式中，所述第二残差特征包括所述第一常规残差模块输出的第一残差子特征、所述第二常规残差模块输出的第二残差子特征和所述瓶颈残差模块输出的第三残差子特征；所述语义特征包括：所述Transformer编码器的第一网络层输出的第一语义子特征、所述Transformer编码器的第二网络层输出的第二语义子特征和所述Transformer编码器第三网络层输出的第三语义子特征。

本公开实施例中，第二残差特征提取层和语义特征提取层的信息，每经过一些层的时候都要进行信息融合。具体的，以Transformer编码器的层数等于12为例，第一网络层为Transformer编码器的前4层，第二网络层为Transformer编码器的第5层-第8层，第三网络层为Transformer编码器的第9层-第12层。

具体的，所述对所述第二残差特征和所述语义特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层，具体可以包括如下步骤A1-A3：

步骤A1，将所述第一残差子特征与所述第一语义子特征进行融合得到第一融合子特征，并将所述第一融合子特征输入所述第二常规残差模块和所述第二网络层，得到所述第二常规残差模块输出的所述第二残差子特征和所述第二网络层输出的所述第二语义子特征。

步骤A2，将所述第二残差子特征与所述第二语义子特征进行融合得到第二融合子特征，并将所述第二融合子特征输入所述瓶颈残差模块和所述第三网络层，得到所述瓶颈残差模块输出的所述第三残差子特征和所述第三网络层输出的所述第三语义子特征。

步骤A3，将所述第三残差子特征与所述第三语义子特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层。

在一可实施方式中，由于对医学图像进行器官区域图像分割和器官分类，是为了服务于后续的超声检测算法。而后续的超声检测算法是基于动态超声成像的，为了使超声检测算法更好的获取动态的超声成像前后帧的有效信息，本公开实施例还可以对分割得到的器官区域图像进行一些后处理，使超声区域保持稳定。具体的，在所述输出所述器官区域图像和所述器官类别之后，所述方法还可以包括如下步骤B1-B3：

步骤B1，提取所述器官区域图像的轮廓区域。

由于通过目标图像分割模所分割得到的器官区域图像通常为具有器官类别值的遮罩，遮罩不是规则的长方形，因此需要将遮罩的轮廓提取出来，轮廓的外接矩形即为超声检测仪器的超声区域的范围框。

步骤B2，确定所述轮廓区域对应的外接矩形区域。

具体的，可以将能包括所述轮廓区域的最小矩形确定为所述轮廓区域对应的外接矩形区域。

步骤B3，当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时，调整所述轮廓区域对应的外接矩形区域。

其中，所述前一帧矩形区域为：基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域；所述目标差值阈值为基于所述器官区域图像的尺寸确定的。

具体的，外接矩形区域的左上角的点的坐标为

矩形的宽为

高为/>

前一帧矩形区域的左上角的点的坐标为

前一帧矩形区域的宽为/>

高为/>

如果

并且/>

表示超声检测仪器的超声区域抖动较大，存在更换探头增加超声区域范围的可能性，因此，需要调整所述轮廓区域对应的外接矩形区域，以改变超声区域范围。

如果

或者/>

表示超声检测仪器的超声区域抖动在可接受的范围内，没有更换探头的可能性较大，因此，不需要调整所述轮廓区域对应的外接矩形区域。

其中，w和h分别为待分割医学图像的宽和高，α为预设的波动范围百分比，α取值范围为0～1，

在一可实施方式中，图7示出了本公开实施例提供的目标图像分割模型的一种训练流程示意图，如图7所示，所述目标图像分割模型的训练方式包括：

S701，将样本医学图像输入待训练深度学习模型。

所述待训练深度学习模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层。

S702，所述第一残差特征提取层，对输入的所述样本医学图像进行第一样本残差特征提取，并将所述第一样本残差特征输入所述第二残差特征提取层和所述语义特征提取层。

S703，所述第二残差特征提取层，对所述第一样本残差特征进行第二样本残差特征提取，并将所述第二样本残差特征输入所述特征融合层。

本公开中，所述第二残差特征提取层和所述语义特征提取层为并列的两个特征提取层，因此，S703和S704为并列的两个步骤。

S704，所述语义特征提取层，对所述第一样本残差特征进行样本语义特征提取，并将所述样本语义特征输入所述特征融合层。

语义特征提取层具体可以由M层的Transformer编码器构成，其结构可以参考图5。

S705，所述特征融合层，对所述第二样本残差特征和所述样本语义特征进行融合得到样本融合特征，并将所述样本融合特征输入所述结果输出层。

S706，所述结果输出层，基于所述样本融合特征提取所述样本医学图像中的预测器官区域图像，以及确定所述样本医学图像中的器官的预测器官类别，并输出所述预测器官区域图像和所述预测器官类别。

S707，基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练模型的损失函数。

损失函数具体可以选用骰子损失函数或交叉熵损失函数等。

S708，确定所述损失函数是否收敛。

S709，如果是，将当前的待训练深度学习模型确定为目标图像分割模型。

S710，如果否，调整当前的待训练深度学习模型的各个层的参数，并选取下一个样本医学图像，返回所述将样本医学图像输入待训练深度学习模型的步骤。

在一种可实施方式中，将样本医学图像输入待训练深度学习模型之前，本公开实施例可以预先提取样本医学图像对应的器官区域图像，以及预先样本医学图像对应的器官类别标签。通常可以通过人工标注样本医学图像对应的器官区域图像，但是人工标注会耗费巨大的人工资源且标注效率较低，本公开实施例中，可以通过提取样本医学图像的连通区域得到器官区域图像，再对器官区域图像中的各个像素标注器官类别标签。

具体的，在所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练模型的损失函数之前，所述方法还包括步骤C1-C5：

步骤C1，对所述样本医学图像进行二值化处理，得到二值化图像。

本步骤中，可以计算样本医学图中所有像素值的平均值，然后将像素值小于平均值的像素点的像素置为0，将像素值不小于平均值的像素点的像素置为255，得到二值化图像。

步骤C2，对所述二值化图像进行腐蚀处理，得到腐蚀图像。

本步骤可以采用任意的图像腐蚀算法对所述二值化图像进行腐蚀处理，此处不做具体限定。

步骤C3，提取所述腐蚀图像中的所有连通区域图像。

具体的，可以将所述腐蚀图像中具有相同像素值且位置相邻的前景像素点组成的各个图像区域均提取出来，得到一个或多个连通区域图像。

步骤C4，将面积最大的连通区域图像确定为所述样本医学图像对应的器官区域图像。

步骤C5，为所述样本医学图像对应的器官区域图像中每个像素点赋予预先标注的器官类别标签，得到携带标签的器官区域图像。

本公开实施例中，不同的器官对应不同的标签，例如标签label1可以用于标识腹部，标签label2可以用于标识心脏，标签label3可以用于标识外部血管。

具体的，本步骤中可以预先通过人工判断出样本医学图像对应的器官区域的器官类别，然后为所述样本医学图像对应的器官区域图像中每个像素点赋予器官类别标签。

则所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练模型的损失函数，具体可以包括步骤D1：

步骤D1，根据所述预测器官区域图像、所述预测器官类别和所述携带标签的器官区域图像，计算所述待训练模型的损失函数。

图8示出了本公开实施例提供的训练目标图像分割模型的一种示意图，如图8所示，mask_i为预先提取的携带标签的器官区域图像，将样本医学图像X_i输入待训练深度学习模型，待训练深度学习模型的第一残差特征提取层提取了样本医学图像X_i的第一残差特征f_i，然后第二残差特征提取层和语义特征提取层分别基于第一残差特征f_i提取第二残差特征f_ai和语义特征f_bi，特征融合层对第二残差特征f_ai和语义特征f_bi进行融合得到融合特征，然后结果输出层对融合特征进行8倍上采样，可以得到样本医学图像X_i中的预测器官区域图像以及预测器官类别Y_i，然后，可以利用预先提取的携带标签的器官区域图像mask_i与预测器官区域图像以及预测器官类别Y_i计算损失函数L，如果损失函数L收敛，可以将当前的待训练深度学习模型确定为目标图像分割模型，如果如果损失函数L不收敛，可以调整当前的待训练深度学习模型的各个层的参数，并选取下一个样本医学图像，返回所述将样本医学图像输入待训练深度学习模型的步骤。

本公开实施例对待训练网络设计了双支分割网络，包括分支a(即第二残差特征提取层)和分支b(即语义特征提取层)，分支a和分支b可以在不同层之间进行融合，其网络框架参见图9。如图9所示，第二残差特征提取层和语义特征提取层的信息，每经过一些层的时候都要进行信息融合。语义特征提取层由Transformer编码器构成，具体的，以Transformer编码器的层数等于12为例，Transformer编码器的第一网络层为Transformer编码器的前4层，Transformer编码器的第二网络层为Transformer编码器的第5层-第8层，Transformer编码器的第三网络层为Transformer编码器的第9层-第12层。本公开实施例中，可以将分支a的第一个残差模块输出的第一残差子特征和第一网络层输出的第一语义子特征进行融合，得到第一融合子特征，并将第一融合子特征分别输入Transformer编码器后续的网络层和分支a的第二个残差模块。然后，可以将分支a的第二个残差模块输出的第二残差子特征和第二网络层输出的第二语义子特征进行融合，得到第二融合子特征，并将第二融合子特征分别输入Transformer编码器后续的网络层和分支a的第三个残差模块。然后，可以将分支a的第三个残差模块输出的第三残差子特征和第三网络层输出的第三语义子特征进行融合，得到融合特征。

采用本公开实施例提供的方法，通过目标图像分割模型，可以直接得到待分割医学图像的器官区域图像和器官类别，不再需要工作人员人工调整医学检测仪器的检测模式，使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时，也可以在器官对应的检测模式下进行检测，提高了检测结果准确率，从而达到了更好的辅助检查效果。并且，通过目标图像分割模型的双支分割网络，其中一个分支保持较高的分辨率，另一个分支通过下采样操作获取丰富的语义信息，并对两个双支分割网络输出的特征进行交叉融合，使得分割得到的器官区域图像更准确。

基于同一发明构思，根据本公开上述实施例提供的医学图像分割方法，相应地，本公开另一实施例还提供了一种医学图像分割装置，其结构示意图如图10所示，具体包括：

图像输入模块1001，用于将待分割医学图像输入预先训练的目标图像分割模型；其中，所述目标图像分割模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层；

图像分割模块1002，用于所述第一残差特征提取层，对输入的所述待分割医学图像进行第一残差特征提取，并将所述第一残差特征输入所述第二残差特征提取层和所述语义特征提取层；所述第二残差特征提取层，对所述第一残差特征进行第二残差特征提取，并将所述第二残差特征输入所述特征融合层；所述语义特征提取层，对所述第一残差特征进行语义特征提取，并将所述语义特征输入所述特征融合层；所述特征融合层，对所述第二残差特征和所述语义特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层；所述结果输出层，基于所述融合特征提取所述待分割医学图像中目标器官的器官区域图像，以及确定所述目标器官的器官类别，并输出所述器官区域图像和所述器官类别。

采用本公开实施例提供的装置，通过目标图像分割模型，可以直接得到待分割医学图像的器官区域图像和器官类别，不再需要工作人员人工调整医学检测仪器的检测模式，使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时，也可以在器官对应的检测模式下进行检测，提高了检测结果准确率，从而达到了更好的辅助检查效果。

在一可实施方式中，所述装置还包括：

区域调整模块(图中未示出)，用于提取所述器官区域图像的轮廓区域；确定所述轮廓区域对应的外接矩形区域；当所述外接矩形区域与前一帧矩形区域的对应坐标之间的坐标差值大于目标差值阈值时，调整所述轮廓区域对应的外接矩形区域；其中，所述前一帧矩形区域为：基于所述待分割医学图像的前一帧医学图像所分割的器官区域图像的轮廓区域对应的外接矩形区域；所述目标差值阈值为基于所述器官区域图像的尺寸确定的。

在一可实施方式中，所述装置还包括：

模型训练模块(图中未示出)，用于将样本医学图像输入待训练深度学习模型，所述待训练深度学习模型包括第一残差特征提取层、第二残差特征提取层、语义特征提取层、特征融合层和结果输出层；所述第一残差特征提取层，对输入的所述样本医学图像进行第一样本残差特征提取，并将所述第一样本残差特征输入所述第二残差特征提取层和所述语义特征提取层；所述第二残差特征提取层，对所述第一样本残差特征进行第二样本残差特征提取，并将所述第二样本残差特征输入所述特征融合层；所述语义特征提取层，对所述第一样本残差特征进行样本语义特征提取，并将所述样本语义特征输入所述特征融合层；所述特征融合层，对所述第二样本残差特征和所述样本语义特征进行融合得到样本融合特征，并将所述样本融合特征输入所述结果输出层；所述结果输出层，基于所述样本融合特征提取所述样本医学图像中的预测器官区域图像，以及确定所述样本医学图像中的器官的预测器官类别，并输出所述预测器官区域图像和所述预测器官类别；基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练模型的损失函数；确定所述损失函数是否收敛；如果是，将当前的待训练深度学习模型确定为目标图像分割模型；如果否，调整当前的待训练深度学习模型的各个层的参数，并选取下一个样本医学图像，返回所述将样本医学图像输入待训练深度学习模型的步骤。

在一可实施方式中，所述装置还包括：

数据预处理模块(图中未示出)，用于对所述样本医学图像进行二值化处理，得到二值化图像；对所述二值化图像进行腐蚀处理，得到腐蚀图像；提取所述腐蚀图像中的所有连通区域图像；将面积最大的连通区域图像确定为所述样本医学图像对应的器官区域图像；为所述样本医学图像对应的器官区域图像中每个像素点赋予预先标注的器官类别标签，得到携带标签的器官区域图像；

所述模型训练模块，具体用于根据所述预测器官区域图像、所述预测器官类别和所述携带标签的器官区域图像，计算所述待训练模型的损失函数。

所述图像分割模块1002，具体用于将所述第一残差子特征与所述第一语义子特征进行融合得到第一融合子特征，并将所述第一融合子特征输入所述第二常规残差模块和所述第二网络层，得到所述第二常规残差模块输出的所述第二残差子特征和所述第二网络层输出的所述第二语义子特征；将所述第二残差子特征与所述第二语义子特征进行融合得到第二融合子特征，并将所述第二融合子特征输入所述瓶颈残差模块和所述第三网络层，得到所述瓶颈残差模块输出的所述第三残差子特征和所述第三网络层输出的所述第三语义子特征；将所述第三残差子特征与所述第三语义子特征进行融合得到融合特征，并将所述融合特征输入所述结果输出层。

采用本公开实施例提供的装置，通过目标图像分割模型，可以直接得到待分割医学图像的器官区域图像和器官类别，不再需要工作人员人工调整医学检测仪器的检测模式，使得医学检测仪器可以利用器官区域图像在更精确的区域检测的同时，也可以在器官对应的检测模式下进行检测，提高了检测结果准确率，从而达到了更好的辅助检查效果。并且，通过目标图像分割模型的双支分割网络，其中一个分支保持较高的分辨率，另一个分支通过下采样操作获取丰富的语义信息，并对两个双支分割网络输出的特征进行交叉融合，使得分割得到的器官区域图像更准确。

根据本公开的实施例，本公开还提供了一种电子设备和一种可读存储介质。

图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示，设备1100包括计算单元1101，其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序，来执行各种适当的动作和处理。在RAM 1103中，还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

设备1100中的多个部件连接至I/O接口1105，包括：输入单元1106，例如键盘、鼠标等；输出单元1107，例如各种类型的显示器、扬声器等；存储单元1108，例如磁盘、光盘等；以及通信单元1109，例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理，例如医学图像分割方法。例如，在一些实施例中，医学图像分割方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1108。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时，可以执行上文描述的医学图像分割方法的一个或多个步骤。备选地，在其他实施例中，计算单元1101可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行医学图像分割方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种医学图像分割方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述输出所述器官区域图像和所述器官类别之后，所述方法还包括：

提取所述器官区域图像的轮廓区域；

确定所述轮廓区域对应的外接矩形区域；

3.根据权利要求1所述的方法，其特征在于，所述目标图像分割模型的训练方式包括：

基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练深度学习模型的损失函数；

确定所述损失函数是否收敛；

4.根据权利要求3所述的方法，其特征在于，在所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练深度学习模型的损失函数之前，所述方法还包括：

对所述样本医学图像进行二值化处理，得到二值化图像；

对所述二值化图像进行腐蚀处理，得到腐蚀图像；

提取所述腐蚀图像中的所有连通区域图像；

所述基于所述预测器官区域图像和预先提取的所述样本医学图像对应的器官区域图像，以及所述预测器官类别和预先标注的所述样本医学图像对应的器官类别标签，计算所述待训练深度学习模型的损失函数，包括：

根据所述预测器官区域图像、所述预测器官类别和所述携带标签的器官区域图像，计算所述待训练深度学习模型的损失函数。

5.根据权利要求1所述的方法，其特征在于，所述第二残差特征提取层由第一常规残差模块、第二常规残差模块和瓶颈残差模块构成；所述语义特征提取层由Transformer编码器构成。

6.根据权利要求5所述的方法，其特征在于，所述第二残差特征包括所述第一常规残差模块输出的第一残差子特征、所述第二常规残差模块输出的第二残差子特征和所述瓶颈残差模块输出的第三残差子特征；

7.一种医学图像分割装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。