CN111429460A - 图像分割方法、图像分割模型训练方法、装置和存储介质 - Google Patents

图像分割方法、图像分割模型训练方法、装置和存储介质 Download PDF

Info

Publication number
CN111429460A
CN111429460A CN202010532525.5A CN202010532525A CN111429460A CN 111429460 A CN111429460 A CN 111429460A CN 202010532525 A CN202010532525 A CN 202010532525A CN 111429460 A CN111429460 A CN 111429460A
Authority
CN
China
Prior art keywords
voxel
image
segmented
characteristic
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010532525.5A
Other languages
English (en)
Other versions
CN111429460B (zh
Inventor
崔恒基
魏东
顾实
马锴
郑冶枫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010532525.5A priority Critical patent/CN111429460B/zh
Publication of CN111429460A publication Critical patent/CN111429460A/zh
Application granted granted Critical
Publication of CN111429460B publication Critical patent/CN111429460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10088Magnetic resonance imaging [MRI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30016Brain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及人工智能技术领域,特别是涉及一种图像分割方法、图像分割模型训练方法、装置和存储介质。所述图像分割方法包括:获取待分割图像;从所述待分割图像中提取体素特征;确定所述体素特征与不同类别对应的体素参考值之间的第一相似度;所述体素参考值是利用待分割的图像样本进行模型训练所得的模型参数;当所述体素特征中的目标体素特征与相应的所述类别对应的体素参考值之间的第一相似度满足分割条件时,则在所述待分割图像中分割所述目标体素特征对应的图块。采用本方法能够提高图像分割效率。

Description

图像分割方法、图像分割模型训练方法、装置和存储介质
技术领域
本申请涉及人工智能技术领域,特别是涉及一种图像分割方法、图像分割模型训练方法、装置和存储介质。
背景技术
随着图像分割技术的发展,图像分割技术被广泛应用到各领域,如机器视觉、人脸识别以及医学影像分割等领域。在传统的图像分割方案中,如基于3D卷积神经网络的语义分割方案,通常需要专业人员对大量图像样本进行精确标注,利用图像样本和对应的标注(即标签)对3D卷积神经网络进行训练,然后通过训练后的3D卷积神经网络进行图像分割。然而,传统的图像分割方案中,需要大量的图像样本以及进行大量的标注,导致训练耗时,也影响了图像分割效率。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高图像分割效率,以及避免因大量的图像样本以及进行大量的标注而导致训练耗时大的图像分割方法、图像分割模型训练方法、装置和存储介质。
一种图像分割方法,所述方法包括:
获取待分割图像;
从所述待分割图像中提取体素特征;
确定所述体素特征与不同类别对应的体素参考值之间的第一相似度;所述体素参考值是利用待分割的图像样本进行模型训练所得的模型参数;
当所述体素特征中的目标体素特征与相应的所述类别对应的体素参考值之间的第一相似度满足分割条件时,则
在所述待分割图像中分割所述目标体素特征对应的图块。
一种图像分割装置,所述装置包括:
获取单元,用于获取待分割图像;
提取单元,用于从所述待分割图像中提取体素特征;
确定单元,用于确定所述体素特征与不同类别对应的体素参考值之间的第一相似度;所述体素参考值是利用待分割的图像样本进行模型训练所得的模型参数;
分割单元,用于当所述体素特征中的目标体素特征与相应的所述类别对应的体素参考值之间的第一相似度满足分割条件时,则在所述待分割图像中分割所述目标体素特征对应的图块。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待分割图像;
从所述待分割图像中提取体素特征;
确定所述体素特征与不同类别对应的体素参考值之间的第一相似度;所述体素参考值是利用待分割的图像样本进行模型训练所得的模型参数;
当所述体素特征中的目标体素特征与相应的所述类别对应的体素参考值之间的第一相似度满足分割条件时,则在所述待分割图像中分割所述目标体素特征对应的图块。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待分割图像;
从所述待分割图像中提取体素特征;
确定所述体素特征与不同类别对应的体素参考值之间的第一相似度;所述体素参考值是利用待分割的图像样本进行模型训练所得的模型参数;
当所述体素特征中的目标体素特征与相应的所述类别对应的体素参考值之间的第一相似度满足分割条件时,则在所述待分割图像中分割所述目标体素特征对应的图块。
上述图像分割方法、装置、计算机设备和存储介质,通过模型训练的方式获得模型参数,而不同类别对应的体素参考值属于模型参数,从而可以不需要采用大量图像样本以及对大量图像样本进行标注以进行模型训练,只需要少量图像样本进行模型训练得到训练完成后的模型参数,从而得到不同类别对应的体素参考值。此外,利用该体素参考值与从待分割图像中提取的体素特征进行相似度计算,当目标体素特征与相应类别对应的体素参考值之间的第一相似度满足分割条件时,则在待分割图像中分割目标体素特征对应的图块,可以有效地分割出对应的图块,提高了图像分割效率。
一种图像分割模型训练方法,所述方法包括:
获取待分割的图像样本;
将所述图像样本输入机器学习模型,提取所述图像样本中各体素的训练体素特征;
对所述训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;所述待调整体素值属于所述机器学习模型中的模型参数;
根据所确定的第二相似度计算损失值,并依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练;
将训练后的所述机器学习模型所对应的待调整体素值作为体素参考值;所述体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在所述待分割图像中依据所述第一相似度达到分割条件时所对应的目标体素特征进行图像分割。
在一个实施例中,所述根据所确定的第二相似度计算损失值包括:
根据确定的第二相似度依次计算交叉熵损失和嵌入损失;
计算所述交叉熵损失和所述嵌入损失的和值,得到所述损失值。
在一个实施例中,所述依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整包括:
当所述类别为第一指定类别时,将计算所得的损失值反向传播到所述机器学习模型,获得所述模型参数的第一梯度;
根据获得的第一梯度对所述模型参数进行调整。
在一个实施例中,所述依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整包括:
当所述类别为第二指定类别时,将计算所得的损失值从大到小进行排序;
将排序序号达到预设名次的损失值反向传播到所述机器学习模型,获得所述模型参数的第二梯度;
根据获得的第二梯度对所述模型参数进行调整。
一种图像分割模型训练装置,所述装置包括:
获取单元,用于获取待分割的图像样本;
提取单元,用于将所述图像样本输入机器学习模型,提取所述图像样本中各体素的训练体素特征;
第一计算单元,用于对所述训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;所述待调整体素值属于所述机器学习模型中的模型参数;
第二计算单元,用于根据所确定的第二相似度计算损失值;
调整单元,用于依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练;
确定单元,用于将训练后的所述机器学习模型所对应的待调整体素值作为体素参考值;所述体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在所述待分割图像中依据所述第一相似度达到分割条件时所对应的目标体素特征进行图像分割。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待分割的图像样本;
将所述图像样本输入机器学习模型,提取所述图像样本中各体素的训练体素特征;
对所述训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;所述待调整体素值属于所述机器学习模型中的模型参数;
根据所确定的第二相似度计算损失值,并依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练;
将训练后的所述机器学习模型所对应的待调整体素值作为体素参考值;所述体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在所述待分割图像中依据所述第一相似度达到分割条件时所对应的目标体素特征进行图像分割。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待分割的图像样本;
将所述图像样本输入机器学习模型,提取所述图像样本中各体素的训练体素特征;
对所述训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;所述待调整体素值属于所述机器学习模型中的模型参数;
根据所确定的第二相似度计算损失值,并依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练;
将训练后的所述机器学习模型所对应的待调整体素值作为体素参考值;所述体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在所述待分割图像中依据所述第一相似度达到分割条件时所对应的目标体素特征进行图像分割。
上述图像分割模型训练方法、装置、计算机设备和存储介质,在训练过程中不断更新机器学习模型的模型参数,而不同类别对应的待调整体素值是属于机器学习模型中的模型参数,因此在模型训练过程中,待调整体素值不断进行更新调整,从而可以不需要采用大量图像样本以及对大量图像样本进行标注以进行模型训练,只需要少量图像样本进行模型训练得到训练完成后的模型参数,从而便可得到不同类别对应的体素参考值,降低了训练耗时,提高了训练效率。
附图说明
图1为一个实施例中图像分割方法和图像分割模型训练方法的应用环境图;
图2为一个实施例中图像分割方法的流程示意图;
图3为一个实施例中机器学习模型训练步骤的流程示意图;
图4为另一个实施例中图像分割模型训练方法的流程示意图;
图5为一个实施例中模型训练以及图像分割的框架示意图;
图6为一个实施例中机器学习模型的结构示意图;
图7为一个实施例中图像分割装置的结构框图;
图8为另一个实施例中图像分割装置的结构框图;
图9为一个实施例中图像分割模型训练装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像分割、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习和度量学习等技术。
本申请实施例提供的方案涉及人工智能的计算机视觉技术和机器学习等技术,具体通过如下实施例进行说明:
本申请提供的图像分割方法和图像分割模型训练方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信,该网络可以是有线网络或无线网络。图像分割方法和图像分割模型训练方法可以由终端102执行,也可由服务器104执行,或者由终端102和服务器104协同执行。以图像分割方法由服务器104执行为例进行阐述,服务器104可以从本地或终端102获取待分割图像;从待分割图像中提取体素特征;确定体素特征与不同类别对应的体素参考值之间的第一相似度;当体素特征中的目标体素特征与相应的类别对应的体素参考值之间的第一相似度满足分割条件时,则在待分割图像中分割目标体素特征对应的图块;服务器104可以将分割的图块显示于终端102。
以图像分割模型训练方法由服务器104执行为例进行阐述,服务器104可以从本地或终端102获取待分割的图像样本;将图像样本输入机器学习模型,提取图像样本中各体素的训练体素特征;对训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;待调整体素值属于机器学习模型中的模型参数;根据所确定的第二相似度计算损失值;依据计算所得的损失值对机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练;将训练后的机器学习模型所对应的待调整体素值作为体素参考值;该体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在待分割图像中依据第一相似度达到分割条件时所对应的目标体素特征进行图像分割。
需要指出的是,该体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度指的是:该体素参考值用于在进行图像分割时,计算该体素参考值与待分割图像的体素特征之间的第一相似度。
终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,或者是用于生成待分割图像或待分割的图像样本的专用设备,如医学领域的CT(Computed Tomography,电子计算机断层扫描)设备、MRI(Magnetic ResonanceImaging,磁共振成像)设备或心电图机等待。服务器104可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器来实现。
如图2所示,图2为一个实施例中提供的一种图像分割方法,以该方法由图1中的服务器104执行为例进行说明,该方法包括以下步骤:
S202,获取待分割图像。
其中,待分割图像可以是二维或三维的图像,具体可以是待分割的医学影像,或者是其它应用场景或应用领域的图像。医学影像可以是CT影像、MRI影像或心电图等等。当待分割图像为脑部的MRI影像时,该MRI影像可以包括以下三种扫描序列的图像:T1加权序列(T1-weighted sequence)、T1加权反转恢复序列(T1-weighted inversion recoverysequence)和T2液体衰减反转恢复序列(T2-fluid attenuated inversion recoverysequence),这三种扫描序列可表示MRI的三种不同模式。在后续实施例中,以待分割图像为三维的图像为例进行阐述。
在一个实施例中,服务器与终端建立的通信连接,当终端拍摄目标对象得到待分割图像时,终端实时将待分割图像发送至服务器,服务器接收终端发送的拍摄目标对象所得的待分割图像。其中,目标对象可以是人体、或人体的某个部位、或人体的某个组织;此外,该目标对象还可以是各种动物或静止的物体等。该通信连接可以是有线连接或无线连接。
例如,以待分割图像为脑部的MRI影像为例,服务器与MRI设备建立通信连接,当MRI设备拍摄人体脑部得到MRI影像时,MRI设备将MRI影像实时发送给服务器,从而服务器从MRI设备获得脑部的MRI影像。
在另一个实施例中,服务器接收图像选取指令,根据该图像选取指令获取保存于本地存储器中的待分割图像。
S204,从待分割图像中提取体素特征。
其中,体素是图像在三维空间分割上的最小单位,应用于三维成像、科学数据与医学影像等。体素特征可以指待分割图像中与体素有关的特征。
在一个实施例中,服务器可以先对待分割图像进行灰度处理,得到灰度化的待分割图像,然后从灰度化的待分割图像中提取体素特征。
在一个实施例中,S204具体可以包括:服务器对待分割图像进行裁剪;将裁剪后所得的待分割图像进行下采样,得到下采样体素特征;对下采样体素特征进行上采样,获得待分割图像的体素特征。
其中,下采样可以是随机下采样、EasyEnsemble采样、BalanceCascade采样、NearMiss采样或下池化等中的任一种。上采样可以是双线性插值、转置卷积或上池化(unpooling)中的任一种。
在一个实施例中,服务器可以将待分割图像的边缘区域裁剪掉,得到有效区域的待分割图像。例如,服务器将待分割图像边缘的空白区域裁作为无效区域裁剪掉。
在另一个实施例中,服务器将将裁剪后所得的待分割图像输入至机器学习模型,通过机器学习模型对输入的待分割图像进行下采样,得到下采样体素特征。
该下采样体素特征包括第一下采样体素特征和第二下采样体素特征。具体地,当裁剪后所得的待分割图像输入至机器学习模型时,服务器通过机器学习模型的特征提取模块对裁剪后所得的待分割图像进行卷积处理,得到初始体素特征;通过机器学习模型的第一编码器对初始体素特征进行下采样,得到第一下采样体素特征;通过机器学习模型的第二编码器对第一下采样体素特征进行下采样,得到第二下采样体素特征。
其中,上述的特征提取模块、第一编码器和第二编码器是机器学习模型中特征提取网络的组成部分;此外,该特征提取网络还包括第一解码器和第二解码器。上述特征提取模块、第一编码器和第二编码器可以分别由不同数量的卷积层级联所构成。
在一个实施例中,服务器通过机器学习模型的特征提取模块对裁剪后所得的待分割图像进行卷积处理,得到初始体素特征;然后,通过第一编码器对初始体素特征进行下采样,得到第一下采样体素特征,该第一下采样体素特征的尺寸大小为裁剪后待分割图像尺寸大小的一半;接着,通过第二编码器对第一下采样体素特征进行下采样,得到第二下采样体素特征,该第二下采样体素特征的尺寸大小再一次进行缩小。
例如,服务器将裁剪后的三维医学影像(该三维医学影像的尺寸大小为8×24×24×3,其中3是输入模式的数目)输入至机器学习模型中,通过机器学习模型的特征提取模块对该三维医学影像进行卷积处理得到初始体素特征;然后,通过第一编码器对初始体素特征进行下采样,得到尺寸大小为该三维医学影像尺寸大小一半的第一下采样体素特征(即尺寸大小为4×12×12);接着,通过第一编码器对第一下采样体素特征进行下采样,得到尺寸大小为4×6×6的第二下采样体素特征。
在一个实施例中,服务器通过机器学习模型对下采样体素特征进行上采样,得到上采样体素特征。
在一个实施例中,上述对下采样体素特征进行上采样,获得待分割图像的体素特征的步骤,具体可以包括:服务器通过机器学习模型的第一解码器对第二下采样体素特征进行上采样,得到第一上采样体素特征;通过机器学习模型的第二解码器对第一上采样体素特征进行上采样,得到第二上采样体素特征;将初始体素特征、第一上采样体素特征、第二上采样体素特征和裁剪后的待分割图像中各体素的坐标进行拼接,得到体素特征。
在解码阶段,服务器先从第二编码器输出的第二下采样体素特征开始解码。其中,第一解码器和第二解码器中应用了核尺寸为1×2×2、步长1×2×2的反褶积(deconvolution)层。上述的坐标可以是体素的笛卡尔坐标。
当待分割图像为医学影像时,由于医学影像中不同组织和器官的位置信息对于处理分割问题有着重要的参考价值,因此将每个体素的笛卡尔坐标作为额外的三通道特征与初始体素特征、第一上采样体素特征、第二上采样体素特征进行拼接,可以提高分割效果。
在一个实施例中,服务器通过机器学习模型的第一转换层对第一下采样体素特征进行转换处理,得到第一转换体素特征;将第一上采样体素特征进行上采样,得到第一目标上采样体素特征;将第一转换体素特征和第一上采样体素特征所组成的拼接特征进行上采样,得到第二目标上采样体素特征;通过机器学习模型的第二转换层对初始体素特征进行转换处理,得到目标初始体素特征;然后将目标初始体素特征、第一目标上采样体素特征、第二目标上采样体素特征和裁剪后的待分割图像中各体素的坐标进行拼接,可参考图6。
S206,确定体素特征与不同类别对应的体素参考值之间的第一相似度。
其中,类别是待分割图像中的目标物所属的类型,或者该目标物所表征出来的特征所属的类型。以待分割图像为脑部MRI影像为例,类别可以是灰质(GM)、基底神经节(BG)、白质(WM)、白质病变(WMH)、脑室(VT)、脑脊液(CSF)、小脑(CB)和脑干(BS)。以待分割图像为动物影像为例,类别可以是动物的类型,如猫、狗和马等。第一相似度可以用于衡量待分割图像中各体素的体素特征与不同类别对应的体素参考值之间的相似距离,两者之间的相似距离越小,则对应的第一相似度越高;反之,两者之间的相似距离越大,则对应的第一相似度越低。
体素参考值是利用待分割的图像样本进行模型训练所得的模型参数,即体素参考值可被视为机器学习模型的模型参数,在训练过程中随机器学习模型训练而进行更新。
在一个实施例中,服务器可以通过计算待分割图像中各体素的体素特征与不同类别对应的体素参考值之间的相似距离,根据该距离确定第一相似度。
其中,该相似距离可以是欧几里德距离、平方欧几里德距离、明可夫斯基距离、曼哈顿距离、切比雪夫距离、马哈拉诺比斯距离或海明距离中的任一种。
在一个实施例中,S206可以包括:服务器可以先将体素特征映射至目标特征空间,得到体素特征图;计算体素特征图与不同类别对应的体素参考值之间的第一相似度。
其中,将体素特征映射至目标特征空间,可以指将体素特征从当前所在的特征空间投影至另一个新特征空间,以便在该新特征空间中计算相似距离。
在一个实施例中,服务器在计算第一相似度时,可以先计算体素特征图中各体素值与不同类别对应的体素参考值之间的相似距离,根据该相似距离确定第一相似度。
在一个实施例中,对于特征空间的转换,其步骤具体可以包括:服务器可以采用采用机器学习模型的空洞卷积模块对体素特征进行卷积处理,得到目标特征空间的体素特征图。
其中,空洞卷积模块可以是基于空洞空间卷积池化金字塔(Atrous SpatialPyramid Pooling,ASPP)和特定尺寸卷积核的卷积层所构建的模块,通过该空洞卷积模块可得到目标特征空间的体素特征图。
在一个实施例中,服务器首先会通过空洞空间卷积池化金字塔处理体素特征,得到多尺寸体素特征;然后经过特定尺寸卷积核的卷积层对该多尺寸体素特征进行卷积处理,得到目标特征空间的体素特征图。
例如,服务器先通过空洞空间卷积池化金字塔处理448通道的体素特征,得到多尺寸体素特征,然后经过尺寸为1×1卷积核的卷积层对多尺寸体素特征进行卷积处理,从而可以得到1024维的体素特征图。
在一个实施例中,上述计算体素特征图与不同类别对应的体素参考值之间的第一相似度的步骤,具体可以包括:服务器计算体素特征与不同类别对应的体素参考值间的相似距离;根据相似距离确定体素特征与对应的体素参考值之间的第一相似度。
在一个实施例中,当相似距离为平方欧几里德距离时,可以通过以下计算式计算平方欧几里德距离;其中,该目标计算式为:
Figure 405709DEST_PATH_IMAGE001
上述的i表示裁剪后的待分割图像中体素的索引,
Figure 678559DEST_PATH_IMAGE002
表示从裁剪后的待分割图像中的第i个体素所提取的体素特征,
Figure 63273DEST_PATH_IMAGE003
表示第k个类别的第j个模式所对应的体素参考值,
Figure 204404DEST_PATH_IMAGE004
代表L2范数。
在一个实施例中,上述根据相似距离确定体素特征与对应的体素参考值之间的第一相似度的步骤,具体可以包括:服务器计算体素特征与不同类别对应的体素参考值间的相似距离;利用相似距离,计算待分割图像中各体素属于对应类别中的相应模式的概率;对所计算所得的概率进行求和,得到概率和值;对概率和值进行正则化处理,得到后验概率;将后验概率确定为体素特征与对应的体素参考值之间的第一相似度。
例如,平方欧几里德距离d可用来计算体素
Figure 531743DEST_PATH_IMAGE005
属于第k个类别中第j个模式的概率,该距离d与概率之间的关系为:
Figure 241073DEST_PATH_IMAGE006
;其中,超参数
Figure 378662DEST_PATH_IMAGE007
设置为0.5。然后,将每个类别中各个模式的概率相加,然后进行正则化处理得到后验概率:
Figure 792325DEST_PATH_IMAGE008
其中,
Figure 816913DEST_PATH_IMAGE009
是体素
Figure 713456DEST_PATH_IMAGE005
的分割标注,M是每个类别所对应的体素参考值的个数,K是类别总数。
S208,当体素特征中的目标体素特征与相应的类别对应的体素参考值之间的第一相似度满足分割条件时,则在待分割图像中分割目标体素特征对应的图块。
其中,分割条件可以指第一相似度是否达到预设阈值。目标体素特征的数量可以是多个。
在一个实施例中,在所有提取的体素特征中,服务器判断是否存在与相应的类别对应的体素参考值之间的第一相似度满足分割条件的体素特征,当目标体素特征与相应的类别对应的体素参考值之间的第一相似度达到预设阈值时,表示该第一相似度满足分割条件。
在一个实施例中,目标体素特征是从待分割图像中提取出来的,每个目标体素特征可以对应一个或多个待分割图像中的体素,所有的目标体素特征所对应的体素可以组成一个或多个图像块。对应地,服务器在待分割图像中确定与目标体素特征对应的图块,然后将从待分割图像中分割出与目标体素特征对应的图块。
上述实施例中,通过模型训练的方式获得模型参数,而不同类别对应的体素参考值属于模型参数,从而可以不需要采用大量图像样本以及对大量图像样本进行标注以进行模型训练,只需要少量图像样本进行模型训练得到训练完成后的模型参数,从而得到不同类别对应的体素参考值。此外,利用该体素参考值与从待分割图像中提取的体素特征进行相似度计算,当目标体素特征与相应类别对应的体素参考值之间的第一相似度满足分割条件时,则在待分割图像中分割目标体素特征对应的图块,可以有效地分割出对应的图块,提高了图像分割效率。
在一个实施例中,如图3所示,机器学习模型的训练步骤包括:
S302,获取待分割的图像样本。
其中,图像样本可以是二维或三维的图像,具体可以是用于训练机器学习模型的医学影像样本,或者是其它应用场景或应用领域的图像样本。该图像样本可以是不同模态(该模态也即模式)的图像。医学影像样本可以是CT影像、MRI影像或心电图等等。当图像样本为脑部的MRI影像样本时,该MRI影像样本可以包括以下三种扫描序列的图像:T1加权序列、T1加权反转恢复序列和T2液体衰减反转恢复序列,这三种扫描序列可表示MRI的三种不同模式。在后续实施例中,以图像样本为三维的图像为例进行阐述。
在一个实施例中,服务器与终端建立的通信连接,当终端拍摄目标对象得到图像样本时,终端实时将图像样本发送至服务器,服务器接收终端发送的拍摄目标对象所得的图像样本。
例如,以图像样本为脑部的MRI影像为例,服务器与MRI设备建立通信连接,当MRI设备拍摄人体脑部得到脑部的MRI影像样本时,MRI设备将MRI影像样本实时发送给服务器,从而服务器从MRI设备获得脑部的MRI影像样本。
在另一个实施例中,服务器接收图像选取指令,根据该图像选取指令获取保存于本地存储器中的图像样本。
S304,将图像样本输入机器学习模型,提取图像样本中各体素的训练体素特征。
其中,上述的训练体素特征可以指图像样本中与体素有关的特征。
在一个实施例中,服务器可以先对图像样本进行灰度处理,得到灰度化的图像样本,然后从灰度化的图像样本中提取训练体素特征。
在一个实施例中,S304具体可以包括:服务器对图像样本进行裁剪;将裁剪后所得的图像样本进行下采样,得到下采样训练体素特征;对下采样训练体素特征进行上采样,获得图像样本的训练体素特征。
在一个实施例中,服务器可以将图像样本的边缘区域裁剪掉,得到有效区域的图像样本。例如,服务器将图像样本边缘的空白区域裁作为无效区域裁剪掉。
在另一个实施例中,服务器将将裁剪后所得的图像样本输入至机器学习模型,通过机器学习模型对输入的图像样本进行下采样,得到下采样训练体素特征。
该下采样训练体素特征包括第一下采样训练体素特征和第二下采样训练体素特征。具体地,当裁剪后所得的图像样本输入至机器学习模型时,服务器通过机器学习模型的特征提取模块对裁剪后所得的图像样本进行卷积处理,得到初始训练体素特征;通过机器学习模型的第一编码器对初始训练体素特征进行下采样,得到第一下采样训练体素特征;通过机器学习模型的第二编码器对第一下采样训练体素特征进行下采样,得到第二下采样训练体素特征。
其中,上述特征提取模块、第一编码器和第二编码器可以分别由不同数量的卷积层级联所构成。
在一个实施例中,服务器通过机器学习模型的特征提取模块对裁剪后所得的图像样本进行卷积处理,得到初始训练体素特征;然后,通过第一编码器对初始训练体素特征进行下采样,得到第一下采样训练体素特征,该第一下采样训练体素特征的尺寸大小为裁剪后图像样本尺寸大小的一半;接着,通过第二编码器对第一下采样训练体素特征进行下采样,得到第二下采样训练体素特征,该第二下采样训练体素特征的尺寸大小再一次进行缩小。
例如,服务器将裁剪后的三维医学影像样本(该三维医学影像样本的尺寸大小为8×24×24×3,其中3是输入模式的数目)输入至机器学习模型中,通过机器学习模型的特征提取模块对该三维医学影像样本进行卷积处理得到初始训练体素特征;然后,通过第一编码器对初始训练体素特征进行下采样,得到尺寸大小为该三维医学影像样本尺寸大小一半的第一下采样训练体素特征(即尺寸大小为4×12×12);接着,通过第一编码器对第一下采样训练体素特征进行下采样,得到尺寸大小为4×6×6的第二下采样训练体素特征。
在一个实施例中,服务器通过机器学习模型对下采样训练体素特征进行上采样,得到上采样训练体素特征。
在一个实施例中,上述对下采样训练体素特征进行上采样,获得图像样本的训练体素特征的步骤,具体可以包括:服务器通过机器学习模型的第一解码器对第二下采样训练体素特征进行上采样,得到第一上采样训练体素特征;通过机器学习模型的第二解码器对第一上采样训练体素特征进行上采样,得到第二上采样训练体素特征;然后,将初始训练体素特征、第一上采样训练体素特征、第二上采样训练体素特征和裁剪后的图像样本中各体素的坐标进行拼接,得到训练体素特征。
在解码阶段,服务器先从第二编码器输出的第二下采样训练体素特征开始解码。其中,第一解码器和第二解码器中应用了核尺寸为1×2×2、步长1×2×2的反褶积(deconvolution)层。上述的坐标可以是体素的笛卡尔坐标。
当图像样本为医学影像样本时,由于医学影像样本中不同组织和器官的位置信息对于处理分割问题有着重要的参考价值,因此将每个体素的笛卡尔坐标作为额外的三通道特征与初始训练体素特征、第一上采样训练体素特征、第二上采样训练体素特征进行拼接,可以提高分割效果。
在一个实施例中,服务器通过机器学习模型的第一转换层对第一下采样训练体素特征进行转换处理,得到第一转换训练体素特征;将第一上采样训练体素特征进行上采样,得到第一目标上采样训练体素特征;将第一转换训练体素特征和第一上采样训练体素特征所组成的拼接特征进行上采样,得到第二目标上采样训练体素特征;通过机器学习模型的第二转换层对初始训练体素特征进行转换处理,得到目标初始训练体素特征;然后将目标初始训练体素特征、第一目标上采样训练体素特征、第二目标上采样训练体素特征和裁剪后的图像样本中各体素的坐标进行拼接。
S306,对训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度。
其中,上述的待调整体素值属于机器学习模型中的模型参数。上述的类别是图像样本中的目标物所属的类型,或者该目标物所表征出来的特征所属的类型。以图像样本为脑部MRI影像样本为例,类别可以是灰质(GM)、基底神经节(BG)、白质(WM)、白质病变(WMH)、脑室(VT)、脑脊液(CSF)、小脑(CB)和脑干(BS)。以图像样本为动物影像样本为例,类别可以是动物的类型,如猫、狗和马等。
待调整体素值可以是对经过标注的图像样本进行特征提取所得的体素特征值,该待调整体素值被作为机器学习模型的模型参数,在模型训练过程中随机器学习模型的其它模型参数一起进行更新。
第二相似度可以用于衡量图像样本中各体素的训练体素特征与不同类别对应的待调整体素值之间的相似距离,两者之间的相似距离越小,则对应的第二相似度越高;反之,两者之间的相似距离越大,则对应的第二相似度越低。
在一个实施例中,服务器可以通过计算图像样本中各体素的训练体素特征与不同类别对应的待调整体素值之间的相似距离,根据该距离确定第二相似度。
其中,该相似距离可以是欧几里德距离、平方欧几里德距离、明可夫斯基距离、曼哈顿距离、切比雪夫距离、马哈拉诺比斯距离或海明距离中的任一种。
在一个实施例中,S306可以包括:服务器可以先将训练体素特征映射至目标特征空间,得到训练体素特征图;计算训练体素特征图与不同类别对应的待调整体素值之间的第二相似度。
其中,将训练体素特征映射至目标特征空间,可以指将训练体素特征从当前所在的特征空间投影至另一个新特征空间,以便在该新特征空间中计算相似距离。
在一个实施例中,服务器在计算第二相似度时,可以先计算体素特征图中各体素值与不同类别对应的待调整体素值之间的相似距离,根据该相似距离确定第二相似度。
在一个实施例中,对于特征空间的转换,其步骤具体可以包括:服务器可以采用采用机器学习模型的空洞卷积模块对训练体素特征进行卷积处理,得到目标特征空间的训练体素特征图。
其中,空洞卷积模块可以是基于空洞空间卷积池化金字塔和特定尺寸卷积核的卷积层所构建的模块,通过该空洞卷积模块可得到目标特征空间的训练体素特征图。
在一个实施例中,服务器首先会通过空洞空间卷积池化金字塔处理训练体素特征,得到多尺寸训练体素特征;然后经过特定尺寸卷积核的卷积层对该多尺寸训练体素特征进行卷积处理,得到目标特征空间的训练体素特征图。
例如,服务器先通过空洞空间卷积池化金字塔处理448通道的训练体素特征,得到多尺寸训练体素特征,然后经过尺寸为1×1卷积核的卷积层对多尺寸训练体素特征进行卷积处理,从而可以得到1024维的训练体素特征图。
在一个实施例中,上述计算训练体素特征图与不同类别对应的待调整体素值之间的第二相似度的步骤,具体可以包括:服务器计算训练体素特征与不同类别对应的待调整体素值间的相似距离;根据相似距离确定训练体素特征与对应的待调整体素值之间的第二相似度。
在一个实施例中,当相似距离为平方欧几里德距离时,可以通过以下计算式计算平方欧几里德距离;其中,该目标计算式为:
Figure 89074DEST_PATH_IMAGE001
上述的i表示裁剪后的图像样本中体素的索引,
Figure 696642DEST_PATH_IMAGE002
表示从裁剪后的图像样本中的第i个体素所提取的训练体素特征,
Figure 575736DEST_PATH_IMAGE003
表示第k个类别的第j个模式所对应的待调整体素值,
Figure 112022DEST_PATH_IMAGE004
代表L2范数。
在一个实施例中,上述根据相似距离确定训练体素特征与对应的待调整体素值之间的第二相似度的步骤,具体可以包括:服务器利用相似距离,计算图像样本中各体素属于对应类别中的相应模式的概率;对所计算所得的概率进行求和,得到概率和值;对概率和值进行正则化处理,得到后验概率;将后验概率确定为训练体素特征与对应的待调整体素值之间的第二相似度。
例如,平方欧几里德距离d可用来计算体素
Figure 568411DEST_PATH_IMAGE005
属于第k个类别中第j个模式的概率,该距离d与概率之间的关系为:
Figure 464823DEST_PATH_IMAGE006
;其中,超参数
Figure 650953DEST_PATH_IMAGE007
设置为0.5。然后,将每个类别中各个模式的概率相加,然后进行正则化处理得到后验概率:
Figure 889299DEST_PATH_IMAGE008
其中,
Figure 832984DEST_PATH_IMAGE009
是经过标注的图像样本中体素
Figure 549399DEST_PATH_IMAGE005
的分割标注,M是每个类别所对应的待调整体素值的个数,K是类别总数。
S308,根据所确定的第二相似度计算损失值。
在一个实施例中,S308具体可以包括:服务器根据所确定的第二相似度计算损失值包括:根据确定的第二相似度依次计算交叉熵损失和嵌入损失;计算交叉熵损失和嵌入损失的和值,得到损失值。
其中,计算交叉熵损失和嵌入损失的计算式分别如下所示:
Figure 527719DEST_PATH_IMAGE010
Figure 389496DEST_PATH_IMAGE011
其中
Figure 148373DEST_PATH_IMAGE012
是体素
Figure 610754DEST_PATH_IMAGE005
的分割标注,
Figure 568215DEST_PATH_IMAGE013
是狄拉克
Figure 725527DEST_PATH_IMAGE014
函数,如果
Figure 519171DEST_PATH_IMAGE015
时,
Figure 311808DEST_PATH_IMAGE013
函数值等于1,否则等于0;
Figure 140087DEST_PATH_IMAGE016
为真实类别;
Figure 389672DEST_PATH_IMAGE017
是线性整流函数(Relu),从而最终的损失为
Figure 936191DEST_PATH_IMAGE018
,其中超参数
Figure 266940DEST_PATH_IMAGE019
设置为0.5。
S310,依据计算所得的损失值对机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练。
在一个实施例中,S310具体可以包括:当类别为第一指定类别时,服务器将计算所得的损失值反向传播到机器学习模型的各网络层,获得模型参数的第一梯度;根据获得的第一梯度对模型参数进行调整。
对于医学场景,可以将占据脑组织85%以上的白质、灰质和脑脊液作为大类,其他组织作为小类别。这里,第一指定类别即为上述的大类。
在一个实施例中,S310具体可以包括:当类别为第二指定类别时,服务器将计算所得的损失值从大到小进行排序;将排序序号达到预设名次的损失值反向传播到机器学习模型,获得模型参数的第二梯度;根据获得的第二梯度对模型参数进行调整。其中,第二指定类别即为上述的小类。
在一个实施例中,当停止对机器学习模型进行训练时,将训练后的机器学习模型所对应的待调整体素值作为体素参考值。
上述实施例中,在训练过程中不断更新机器学习模型的模型参数,而不同类别对应的待调整体素值是属于机器学习模型中的模型参数,因此在模型训练过程中,待调整体素值不断进行更新调整,从而可以不需要采用大量图像样本以及对大量图像样本进行标注以进行模型训练,只需要少量图像样本进行模型训练得到训练完成后的模型参数,从而便可得到不同类别对应的体素参考值,降低了训练耗时,提高了训练效率。
如图4所示,图4为一个实施例中提供的一种图像分割模型训练方法,以该方法应用于图1中的服务器104为例进行说明,包括以下步骤:
S402,获取待分割的图像样本。
S404,将图像样本输入机器学习模型,提取图像样本中各体素的训练体素特征。
S406,对训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度。
其中,待调整体素值属于机器学习模型中的模型参数。
S408,根据所确定的第二相似度计算损失值。
S410,依据计算所得的损失值对机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练。
上述S402-S410可以参考上述实施例中的S302-S310。
S412,将训练后的机器学习模型所对应的待调整体素值作为体素参考值。
其中,上述体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在待分割图像中依据第一相似度达到分割条件时所对应的目标体素特征进行图像分割,具体的图像分割过程可参考S202-S208。
在模型训练过程中,由于待调整体素值可作为机器学习模型的模型参数进行迭代更新,待调整体素值不断被优化更新,在模型训练结束时,可以得到最终的不同类别所对应的体素参考值。此外,由于该图像样本可以是不同模式的图像,因此不同类别所对应的体素参考值是多模的体素参考值,可以更好地适应类别内及不同类别之间的差别。
上述实施例中,在训练过程中不断更新机器学习模型的模型参数,而不同类别对应的待调整体素值是属于机器学习模型中的模型参数,因此在模型训练过程中,待调整体素值不断进行更新调整,从而可以不需要采用大量图像样本以及对大量图像样本进行标注以进行模型训练,只需要少量图像样本进行模型训练得到训练完成后的模型参数,从而便可得到不同类别对应的体素参考值,降低了训练耗时,提高了训练效率。
作为一个示例,以待分割图像为脑部的MRI影像,以及以待分割的图像样本为脑部的MRI影像样本为例进行阐述,如图5所示,图5为本实施例中提供的模型训练以及图像分割的框架示意图,模型训练以及图像分割过程如下所述:
1)模型训练的阶段:
将一例脑部MRI影像样本通过机器学习模型中的特征提取网络提取体素特征,然后将提取的体素特征投影到嵌入空间(即另一个目标特征空间),与不同类别的原型表示计算距离,通过距离确定MRI影像样本的分割结果。将分割结果与人工标注进行比较并计算损失值,通过梯度回传方式更新原型及特征提取网络的模型参数。
其中,该原型表示可视为机器学习模型的模型参数,在训练过程中随机器学习模型训练而进行更新。
上述距离可以是平方欧几里德距离,计算平方欧几里德距离的计算式为:
Figure 74359DEST_PATH_IMAGE001
i表示MRI影像样本中体素的索引,
Figure 448840DEST_PATH_IMAGE002
表示从MRI影像样本中的第i个体素所提取的体素特征,
Figure 997502DEST_PATH_IMAGE003
表示第k个类别的第j个模式所对应的原型表示,
Figure 804046DEST_PATH_IMAGE004
代表L2范数。
2)图像分割的阶段(即预测阶段):
待分割的MRI影像通过训练阶段更新后的特征提取网络提取体素特征,然后将提取的体素特征投影到嵌入空间,将投影后的体素特征与训练得到的原型表示计算距离,得到最终分割结果。
作为另一个示例,以待分割图像为脑部多序列的MRI影像,以及以待分割的图像样本为脑部的MRI影像样本为例进行阐述,如图6所示,图6为本实施例中提供的机器学习模型的结构示意图,在该机器学习模型的结构中,分三个模块:(a)特征提取的模块(即特征提取网络),(b)特征嵌入模块,(c)基于DML(Deep Metric Learning,度量学习)的分割预测模块。
(a)特征提取网络
本实施例中,特征提取网络可以是U-Nets,U-Nets被广泛应用于医学影像分割领域,它将待分割的MRI影像进行下采样和上采样(对应图6中的编码器和解码器),并在编码器和解码器之间加入跳层连接(skip connections)来提高分割质量,该跳层即为上述实施例中的两个转换层。本实施例中使用了U-Nets作为特征提取网络的主干。
该特征提取网络的输入是从多序列的MRI影像中裁切而得的三维医学影像,不同的序列将作为输入块的不同通道,经过两级下采样以及两级上采样,最终可得到与输入尺寸相等的64通道的体素特征。
(b)体素特征嵌入模块
如图6所示,不同层级(即不同编码器对应的层级)的体素特征被上采样,得到与待分割的MRI影像相同大小的尺寸,然后对这些体素特征进行拼接,得到448通道的特征图。另外医学影像中不同组织和器官的位置信息对于解决分割问题有着重要的参考价值,因此每个体素的笛卡尔坐标被当做额外的三通道特征与所提取的体素特征进行拼接,具体可以参考S204中所述的拼接过程。
在得到拼接的体素特征时,利用空洞空间卷积池化金字塔得到多尺度体素特征,然后经过卷积核尺寸为1×1的卷积层进行卷积操作,得到目标特征空间下的1024维的体素特征。
(c)基于DML的分割预测模块
为了解决缺少训练所需的MRI影像样本而带来的过拟合问题,本实施例的分割预测基于度量学习。具体来说,为每个类别定义一个多模的原型表示,以更好地适应类别内和/或不同类别之间的差别,利用
Figure 731551DEST_PATH_IMAGE003
表示第k个类别的第j个模式的原型表示;然后,计算原型表示与体素特征
Figure 542512DEST_PATH_IMAGE002
之间的平方欧几里得距离,该体素特征
Figure 312891DEST_PATH_IMAGE002
是通过特征提取网络从体素
Figure 765869DEST_PATH_IMAGE005
提取得到。其中,上述平方欧几里得距离的计算式如下:
Figure 439558DEST_PATH_IMAGE001
Figure 155841DEST_PATH_IMAGE004
代表L2范数,i代表体素的索引,距离d可用来计算体素
Figure 39614DEST_PATH_IMAGE005
属于第k个类别中第j个模式的概率,该距离d与概率之间的关系为:
Figure 765125DEST_PATH_IMAGE006
,其中,超参数
Figure 526277DEST_PATH_IMAGE007
设置为0.5。最终将每个类别中各个模式的概率相加,然后进行正则化处理,得到后验概率:
Figure 803674DEST_PATH_IMAGE008
其中,
Figure 659897DEST_PATH_IMAGE009
是体素
Figure 438366DEST_PATH_IMAGE005
的分割标注,M是每个类别所采用的原型表示的个数,k是总的类别个数。
此外,在本实施例中还对损失函数、困难样本挖掘、训练及预测进行阐述,具体如下所述:
(d)损失函数
损失函数由两部分构成:交叉熵损失和嵌入损失;交叉熵损失和嵌入损失的计算式分别如下:
Figure 804756DEST_PATH_IMAGE010
Figure 253055DEST_PATH_IMAGE011
其中,
Figure 635057DEST_PATH_IMAGE012
是体素
Figure 531731DEST_PATH_IMAGE005
的分割标注,
Figure 533054DEST_PATH_IMAGE013
是狄拉克
Figure 27620DEST_PATH_IMAGE014
函数,如果
Figure 825812DEST_PATH_IMAGE015
时,
Figure 447548DEST_PATH_IMAGE013
函数值等于1,否则等于0;
Figure 647586DEST_PATH_IMAGE016
为真实类别;
Figure 313053DEST_PATH_IMAGE021
是线性整流函数(Relu),从而最终的损失为
Figure 723175DEST_PATH_IMAGE018
,其中超参数
Figure 522504DEST_PATH_IMAGE019
设置为0.5。
(e)困难样本挖掘(OHEM)
在医学影像中,类别数量不均衡的情况普遍存在。小类别欠采样导致分割效果变差,因此在本实施例的模型中使用在目标检测任务中取得良好效果的MRI影像样本,并将其应用在体素层面上来解决小类别欠采样问题。
困难样本挖掘是指用机器学习模型对MRI影像样本进行图像分割,把其中错误分割的MRI影像样本放入负样本集合,然后再继续训练机器学习模型。
将占据脑组织85%以上的白质、灰质和脑脊液作为大类,其它组织作为小类别。每次训练时,将小类别计算得出的损失值全部计入最终损失;大类别中每个体素,按照损失值从大到小排序,取损失值前N的体素计入最终损失,然后进行反向传播。其中,N取值为每次训练迭代中小类别体素数量的6倍。
(f)训练及预测
传统方案中,训练阶段每次迭代时将训练所需的MRI影像样本分为支持集与查询集,支持集用于提取原型表示,查询集用于预测分割(分类),根据预测结果计算损失值,然后反向传播以更新模型参数,而且每次迭代后原型表示即被丢弃,然而这需要大量MRI影像样本。
在本实施例中,用于训练的MRI影像样本输入机器学习模型后,将提取的体素特征与不同类别的原型表示进行比较,得到分割计算损失,更新包含原型表示在内的所有模型参数。这里,将原型表示作为模型参数有利于适应单例样本的训练环境,并解决过拟合问题。
同时,此模型也适用于数个MRI影像样本及标签的小样本情景,独立训练多个使用单样本和标注得到的模型,将各个模型的预测集成并确定分割。
通过本实施例的方案,仅需提供一例由分割标注的样本,便可在其它同类数据上进行准确的分割,节省了时间成本及人工成本。
实验结果如表1所示,配准使用ANTs[4]进行实验。由于白质病变因其形状位置多变,对于脑部MRI影像分割是个具有挑战性的任务,因此在计算两个评价指标时,列出了除白质病变外的平均值(Mean ex.)。从表1中可知,使用一例样本及标签训练的U-Net-1表现极差。与U-Net-6相比,本实施例提出的模型达到了其最优结果的93%。将训练所采用的样本从1例增加到3例时,可以很明显的观察到本实施例的分割结果得到明显提升。使用2例样本进行训练时豪斯多夫距离就已优于U-Net-6;而使用3例样本进行训练,本实施例的模型在两个指标(即豪斯多夫距离和戴斯相似性系数)上都已优于U-Net-6。
表1
Figure 452413DEST_PATH_IMAGE022
Figure 305094DEST_PATH_IMAGE023
需要指出的是,戴斯相似性系数(Dice similarity coefficient)越高越好,95%豪斯多夫(Hausdorff)距离越小越好。Ours-1、Ours-2和Ours-3是指本实施例中分别采用1例样本、2例样本和3例样本所训练出来的模型。
综上所述,本实施例提出的用于图像分割的模型,在大脑MRI影像分割上具有优越性。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
如图7所示,图7为一个实施例中提供的一种图像分割装置,该装置可以采用软件单元或硬件单元,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取单元702、提取单元704、确定单元706和分割单元708,其中:
获取单元702,用于获取待分割图像;
提取单元704,用于从待分割图像中提取体素特征;
确定单元706,用于确定体素特征与不同类别对应的体素参考值之间的第一相似度;体素参考值是利用待分割的图像样本进行模型训练所得的模型参数;
分割单元708,用于当体素特征中的目标体素特征与相应的类别对应的体素参考值之间的第一相似度满足分割条件时,则在待分割图像中分割目标体素特征对应的图块。
在一个实施例中,提取单元704,还用于:对待分割图像进行裁剪;将裁剪后所得的待分割图像进行下采样,得到下采样体素特征;对下采样体素特征进行上采样,获得待分割图像的体素特征。
在一个实施例中,下采样体素特征包括初始体素特征、第一下采样体素特征和第二下采样体素特征。
提取单元704,还用于:通过机器学习模型的特征提取模块对裁剪后所得的待分割图像进行卷积处理,得到初始体素特征;通过机器学习模型的第一编码器对初始体素特征进行下采样,得到第一下采样体素特征;通过机器学习模型的第二编码器对第一下采样体素特征进行下采样,得到第二下采样体素特征。
在一个实施例中,提取单元704,还用于:通过机器学习模型的第一解码器对第二下采样体素特征进行上采样,得到第一上采样体素特征;通过机器学习模型的第二解码器对第一上采样体素特征进行上采样,得到第二上采样体素特征;将初始体素特征、第一上采样体素特征、第二上采样体素特征和裁剪后的待分割图像中各体素的坐标进行拼接,得到体素特征。
在一个实施例中,提取单元704,还用于:通过机器学习模型的第一转换层对第一下采样体素特征进行转换处理,得到第一转换体素特征;将第一上采样体素特征进行上采样,得到第一目标上采样体素特征;将第一转换体素特征和第一上采样体素特征所组成的拼接特征进行上采样,得到第二目标上采样体素特征;通过机器学习模型的第二转换层对初始体素特征进行转换处理,得到目标初始体素特征;将目标初始体素特征、第一目标上采样体素特征、第二目标上采样体素特征和裁剪后的待分割图像中各体素的坐标进行拼接。
在一个实施例中,如图8所示,该装置还包括:第一计算单元710、第二计算单元712和调整单元714;其中:
获取单元702,还用于获取待分割的图像样本;
提取单元704,还用于将图像样本输入机器学习模型,提取图像样本中各体素的训练体素特征;
第一计算单元710,用于对训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;待调整体素值属于机器学习模型中的模型参数;
第二计算单元712,用于根据所确定的第二相似度计算损失值;
调整单元714,用于依据计算所得的损失值对机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练。
在一个实施例中,确定单元706,还用于当停止对机器学习模型进行训练时,将训练后的机器学习模型所对应的待调整体素值作为体素参考值。
在一个实施例中,确定单元706,还用于将体素特征映射至目标特征空间,得到体素特征图;计算体素特征图与不同类别对应的体素参考值之间的第一相似度。
在一个实施例中,确定单元706,还用于采用机器学习模型的空洞卷积模块对体素特征进行卷积处理,得到目标特征空间的体素特征图。
在一个实施例中,确定单元706,还用于计算所述体素特征与不同类别对应的体素参考值间的相似距离;利用所述相似距离,计算所述待分割图像中各体素属于对应所述类别中的相应模式的概率;对所计算所得的概率进行求和,得到概率和值;对所述概率和值进行正则化处理,得到后验概率;将所述后验概率确定为所述体素特征与对应的所述体素参考值之间的第一相似度。
上述实施例中,通过模型训练的方式获得模型参数,而不同类别对应的体素参考值属于模型参数,从而可以不需要采用大量图像样本以及对大量图像样本进行标注以进行模型训练,只需要少量图像样本进行模型训练得到训练完成后的模型参数,从而得到不同类别对应的体素参考值。此外,利用该体素参考值与从待分割图像中提取的体素特征进行相似度计算,当目标体素特征与相应类别对应的体素参考值之间的第一相似度满足分割条件时,则在待分割图像中分割目标体素特征对应的图块,可以有效地分割出对应的图块,提高了图像分割效率。
关于图像分割装置的具体限定可以参见上文中对于图像分割方法的限定,在此不再赘述。上述图像分割装置中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各单元可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个单元对应的操作。
如图9所示,图9为一个实施例中提供的一种图像分割模型训练装置,该装置可以采用软件单元或硬件单元,或者是二者的结合成为计算机设备的一部分,该装置具体包括:获取单元902、提取单元904、第一计算单元906、第二计算单元908、调整单元910和确定单元912,其中:
获取单元902,用于获取待分割的图像样本;
提取单元904,用于将图像样本输入机器学习模型,提取图像样本中各体素的训练体素特征;
第一计算单元906,用于对训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;待调整体素值属于机器学习模型中的模型参数;
第二计算单元908,用于根据所确定的第二相似度计算损失值;
调整单元910,用于依据计算所得的损失值对机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练;
确定单元912,用于将训练后的机器学习模型所对应的待调整体素值作为体素参考值;该体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在待分割图像中依据第一相似度达到分割条件时所对应的目标体素特征进行图像分割。
在一个实施例中,第二计算单元908,还用于根据确定的第二相似度依次计算交叉熵损失和嵌入损失;计算交叉熵损失和嵌入损失的和值,得到损失值。
在一个实施例中,调整单元910,还用于当类别为第一指定类别时,将计算所得的损失值反向传播到机器学习模型,获得模型参数的第一梯度;根据获得的第一梯度对模型参数进行调整。
在一个实施例中,调整单元910,还用于当类别为第二指定类别时,将计算所得的损失值从大到小进行排序;将排序序号达到预设名次的损失值反向传播到机器学习模型,获得模型参数的第二梯度;根据获得的第二梯度对模型参数进行调整。
上述实施例中,在训练过程中不断更新机器学习模型的模型参数,而不同类别对应的待调整体素值是属于机器学习模型中的模型参数,因此在模型训练过程中,待调整体素值不断进行更新调整,从而可以不需要采用大量图像样本以及对大量图像样本进行标注以进行模型训练,只需要少量图像样本进行模型训练得到训练完成后的模型参数,从而便可得到不同类别对应的体素参考值,降低了训练耗时,提高了训练效率。
关于图像分割模型训练装置的具体限定可以参见上文中对于图像分割模型训练方法的限定,在此不再赘述。上述图像分割模型训练装置中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各单元可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个单元对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待分割图像和图像样本。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像分割方法或图像分割模型训练方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述图像分割方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述图像分割方法实施例中的步骤。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述图像分割模型训练方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述图像分割模型训练方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种图像分割方法,其特征在于,所述方法包括:
获取待分割图像;
从所述待分割图像中提取体素特征;
确定所述体素特征与不同类别对应的体素参考值之间的第一相似度;所述体素参考值是利用待分割的图像样本进行模型训练所得的模型参数;
当所述体素特征中的目标体素特征与相应的所述类别对应的体素参考值之间的第一相似度满足分割条件时,则
在所述待分割图像中分割所述目标体素特征对应的图块。
2.根据权利要求1所述的方法,其特征在于,所述从所述待分割图像中提取体素特征包括:
对所述待分割图像进行裁剪;
将裁剪后所得的待分割图像进行下采样,得到下采样体素特征;
对所述下采样体素特征进行上采样,获得所述待分割图像的体素特征。
3.根据权利要求2所述的方法,其特征在于,所述下采样体素特征包括初始体素特征、第一下采样体素特征和第二下采样体素特征;所述将裁剪后所得的待分割图像进行下采样,得到下采样体素特征包括:
通过机器学习模型的特征提取模块对裁剪后所得的待分割图像进行卷积处理,得到初始体素特征;
通过所述机器学习模型的第一编码器对所述初始体素特征进行下采样,得到所述第一下采样体素特征;
通过所述机器学习模型的第二编码器对所述第一下采样体素特征进行下采样,得到所述第二下采样体素特征。
4.根据权利要求3所述的方法,其特征在于,所述对所述下采样体素特征进行上采样,获得所述待分割图像的体素特征包括:
通过所述机器学习模型的第一解码器对所述第二下采样体素特征进行上采样,得到第一上采样体素特征;
通过所述机器学习模型的第二解码器对所述第一上采样体素特征进行上采样,得到第二上采样体素特征;
将所述初始体素特征、所述第一上采样体素特征、所述第二上采样体素特征和裁剪后的所述待分割图像中各体素的坐标进行拼接,得到体素特征。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
通过所述机器学习模型的第一转换层对所述第一下采样体素特征进行转换处理,得到第一转换体素特征;
将所述第一上采样体素特征进行上采样,得到第一目标上采样体素特征;
将所述第一转换体素特征和所述第一上采样体素特征所组成的拼接特征进行上采样,得到第二目标上采样体素特征;
通过所述机器学习模型的第二转换层对所述初始体素特征进行转换处理,得到目标初始体素特征;
所述将所述初始体素特征、所述第一上采样体素特征、所述第二上采样体素特征和裁剪后的所述待分割图像中各体素的坐标进行拼接包括:
将所述目标初始体素特征、所述第一目标上采样体素特征、所述第二目标上采样体素特征和裁剪后的所述待分割图像中各体素的坐标进行拼接。
6.根据权利要求3至5任一项所述的方法,其特征在于,所述机器学习模型的训练步骤包括:
获取待分割的图像样本;
将所述图像样本输入所述机器学习模型,提取所述图像样本中各体素的训练体素特征;
对所述训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;所述待调整体素值属于所述机器学习模型中的模型参数;
根据所确定的第二相似度计算损失值;
依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当停止对所述机器学习模型进行训练时,将训练后的所述机器学习模型所对应的待调整体素值作为所述体素参考值。
8.根据权利要求1至4任一项所述的方法,其特征在于,所述确定所述体素特征与不同类别对应的体素参考值之间的第一相似度包括:
将所述体素特征映射至目标特征空间,得到体素特征图;
计算所述体素特征图与不同类别对应的体素参考值之间的第一相似度。
9.根据权利要求8所述的方法,其特征在于,所述将所述体素特征映射至目标特征空间,得到体素特征图包括:
采用机器学习模型的空洞卷积模块对所述体素特征进行卷积处理,得到目标特征空间的体素特征图。
10.根据权利要求8所述的方法,其特征在于,所述计算所述体素特征图与不同类别对应的体素参考值之间的第一相似度包括:
计算所述体素特征与不同类别对应的体素参考值间的相似距离;
利用所述相似距离,计算所述待分割图像中各体素属于对应所述类别中的相应模式的概率;
对所计算所得的概率进行求和,得到概率和值;
对所述概率和值进行正则化处理,得到后验概率;
将所述后验概率确定为所述体素特征与对应的所述体素参考值之间的第一相似度。
11.一种图像分割模型训练方法,其特征在于,所述方法包括:
获取待分割的图像样本;
将所述图像样本输入机器学习模型,提取所述图像样本中各体素的训练体素特征;
对所述训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;所述待调整体素值属于所述机器学习模型中的模型参数;
根据所确定的第二相似度计算损失值,并依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练;
将训练后的所述机器学习模型所对应的待调整体素值作为体素参考值;所述体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在所述待分割图像中依据所述第一相似度达到分割条件时所对应的目标体素特征进行图像分割。
12.一种图像分割装置,其特征在于,所述装置包括:
获取单元,用于获取待分割图像;
提取单元,用于从所述待分割图像中提取体素特征;
确定单元,用于确定所述体素特征与不同类别对应的体素参考值之间的第一相似度;所述体素参考值是利用待分割的图像样本进行模型训练所得的模型参数;
分割单元,用于当所述体素特征中的目标体素特征与相应的所述类别对应的体素参考值之间的第一相似度满足分割条件时,则在所述待分割图像中分割所述目标体素特征对应的图块。
13.一种图像分割模型训练装置,其特征在于,所述装置包括:
获取单元,用于获取待分割的图像样本;
提取单元,用于将所述图像样本输入机器学习模型,提取所述图像样本中各体素的训练体素特征;
第一计算单元,用于对所述训练体素特征与不同类别对应的待调整体素值进行相似度计算,得到第二相似度;所述待调整体素值属于所述机器学习模型中的模型参数;
第二计算单元,用于根据所确定的第二相似度计算损失值;
调整单元,用于依据计算所得的损失值对所述机器学习模型中的各模型参数进行调整,直至调整后的机器学习模型对应的损失值小于损失阈值时停止训练;
确定单元,用于将训练后的所述机器学习模型所对应的待调整体素值作为体素参考值;所述体素参考值用于在进行图像分割时,计算与待分割图像的体素特征之间的第一相似度,并在所述待分割图像中依据所述第一相似度达到分割条件时所对应的目标体素特征进行图像分割。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。
15.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11任一项所述的方法的步骤。
CN202010532525.5A 2020-06-12 2020-06-12 图像分割方法、图像分割模型训练方法、装置和存储介质 Active CN111429460B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010532525.5A CN111429460B (zh) 2020-06-12 2020-06-12 图像分割方法、图像分割模型训练方法、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010532525.5A CN111429460B (zh) 2020-06-12 2020-06-12 图像分割方法、图像分割模型训练方法、装置和存储介质

Publications (2)

Publication Number Publication Date
CN111429460A true CN111429460A (zh) 2020-07-17
CN111429460B CN111429460B (zh) 2020-09-22

Family

ID=71559062

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010532525.5A Active CN111429460B (zh) 2020-06-12 2020-06-12 图像分割方法、图像分割模型训练方法、装置和存储介质

Country Status (1)

Country Link
CN (1) CN111429460B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932562A (zh) * 2020-09-22 2020-11-13 平安科技(深圳)有限公司 基于ct序列的图像识别方法、装置、电子设备及介质
CN112102251A (zh) * 2020-08-20 2020-12-18 上海壁仞智能科技有限公司 一种分割影像的方法及装置、电子设备和存储介质
CN112149634A (zh) * 2020-10-23 2020-12-29 北京百度网讯科技有限公司 图像生成器的训练方法、装置、设备以及存储介质
CN112241955A (zh) * 2020-10-27 2021-01-19 平安科技(深圳)有限公司 三维图像的碎骨分割方法、装置、计算机设备及存储介质
CN112381101A (zh) * 2021-01-13 2021-02-19 南京理工大学 一种基于类别原型回归的红外道路场景分割方法
CN112561921A (zh) * 2020-11-10 2021-03-26 联想(北京)有限公司 一种图像分割方法及设备
CN113627609A (zh) * 2021-06-30 2021-11-09 国网福建省电力有限公司信息通信分公司 一种基于仿射变换的网络度量方法和存储设备
WO2022142450A1 (zh) * 2020-12-28 2022-07-07 北京达佳互联信息技术有限公司 用于图像分割模型训练和图像分割的方法及装置
US11663759B1 (en) * 2022-04-04 2023-05-30 Cloudstream Medical Imaging, Inc. System and method for processing multi-dimensional and time-overlapping imaging data in real time with cloud computing
WO2023115797A1 (zh) * 2021-12-24 2023-06-29 上海商汤智能科技有限公司 图像分割方法、装置、设备及存储介质
US11690601B1 (en) 2022-04-04 2023-07-04 Cloudstream Medical Imaging, Inc. System and method for processing multi-dimensional ultrasound imaging data on real-time cloud computers
CN116823994A (zh) * 2023-02-20 2023-09-29 阿里巴巴达摩院(杭州)科技有限公司 图像生成、模型训练方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108364294A (zh) * 2018-02-05 2018-08-03 西北大学 基于超像素的腹部ct图像多器官分割方法
CN109166107A (zh) * 2018-04-28 2019-01-08 北京市商汤科技开发有限公司 一种医学图像分割方法及装置、电子设备和存储介质
CN109191471A (zh) * 2018-08-28 2019-01-11 杭州电子科技大学 基于改进U-Net网络的胰腺细胞图像分割方法
CN109377496A (zh) * 2017-10-30 2019-02-22 北京昆仑医云科技有限公司 用于分割医学图像的系统和方法及介质
CN111161269A (zh) * 2019-12-23 2020-05-15 上海联影智能医疗科技有限公司 图像分割方法、计算机设备和可读存储介质
CN111192269A (zh) * 2020-01-02 2020-05-22 腾讯科技(深圳)有限公司 模型训练、医学影像分割方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109377496A (zh) * 2017-10-30 2019-02-22 北京昆仑医云科技有限公司 用于分割医学图像的系统和方法及介质
CN108364294A (zh) * 2018-02-05 2018-08-03 西北大学 基于超像素的腹部ct图像多器官分割方法
CN109166107A (zh) * 2018-04-28 2019-01-08 北京市商汤科技开发有限公司 一种医学图像分割方法及装置、电子设备和存储介质
CN109191471A (zh) * 2018-08-28 2019-01-11 杭州电子科技大学 基于改进U-Net网络的胰腺细胞图像分割方法
CN111161269A (zh) * 2019-12-23 2020-05-15 上海联影智能医疗科技有限公司 图像分割方法、计算机设备和可读存储介质
CN111192269A (zh) * 2020-01-02 2020-05-22 腾讯科技(深圳)有限公司 模型训练、医学影像分割方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YILONG CHEN 等: "Channel-Unet:a spatial channel-Wise Convolutional Neural Network for Liver and Tumors Segmentation", 《CREATIVE COMMONS ATTRIBUTION LICENSE(CCBY)》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112102251A (zh) * 2020-08-20 2020-12-18 上海壁仞智能科技有限公司 一种分割影像的方法及装置、电子设备和存储介质
CN112102251B (zh) * 2020-08-20 2023-10-31 上海壁仞智能科技有限公司 一种分割影像的方法及装置、电子设备和存储介质
CN111932562B (zh) * 2020-09-22 2021-01-19 平安科技(深圳)有限公司 基于ct序列的图像识别方法、装置、电子设备及介质
CN111932562A (zh) * 2020-09-22 2020-11-13 平安科技(深圳)有限公司 基于ct序列的图像识别方法、装置、电子设备及介质
CN112149634A (zh) * 2020-10-23 2020-12-29 北京百度网讯科技有限公司 图像生成器的训练方法、装置、设备以及存储介质
CN112149634B (zh) * 2020-10-23 2024-05-24 北京神州数码云科信息技术有限公司 图像生成器的训练方法、装置、设备以及存储介质
CN112241955B (zh) * 2020-10-27 2023-08-25 平安科技(深圳)有限公司 三维图像的碎骨分割方法、装置、计算机设备及存储介质
CN112241955A (zh) * 2020-10-27 2021-01-19 平安科技(深圳)有限公司 三维图像的碎骨分割方法、装置、计算机设备及存储介质
CN112561921A (zh) * 2020-11-10 2021-03-26 联想(北京)有限公司 一种图像分割方法及设备
WO2022142450A1 (zh) * 2020-12-28 2022-07-07 北京达佳互联信息技术有限公司 用于图像分割模型训练和图像分割的方法及装置
CN112381101A (zh) * 2021-01-13 2021-02-19 南京理工大学 一种基于类别原型回归的红外道路场景分割方法
CN112381101B (zh) * 2021-01-13 2021-05-28 南京理工大学 一种基于类别原型回归的红外道路场景分割方法
CN113627609A (zh) * 2021-06-30 2021-11-09 国网福建省电力有限公司信息通信分公司 一种基于仿射变换的网络度量方法和存储设备
CN113627609B (zh) * 2021-06-30 2023-06-09 国网福建省电力有限公司信息通信分公司 一种基于仿射变换的网络度量方法和存储设备
WO2023115797A1 (zh) * 2021-12-24 2023-06-29 上海商汤智能科技有限公司 图像分割方法、装置、设备及存储介质
US11690601B1 (en) 2022-04-04 2023-07-04 Cloudstream Medical Imaging, Inc. System and method for processing multi-dimensional ultrasound imaging data on real-time cloud computers
US11663759B1 (en) * 2022-04-04 2023-05-30 Cloudstream Medical Imaging, Inc. System and method for processing multi-dimensional and time-overlapping imaging data in real time with cloud computing
CN116823994A (zh) * 2023-02-20 2023-09-29 阿里巴巴达摩院(杭州)科技有限公司 图像生成、模型训练方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111429460B (zh) 2020-09-22

Similar Documents

Publication Publication Date Title
CN111429460B (zh) 图像分割方法、图像分割模型训练方法、装置和存储介质
CN113077471B (zh) 一种基于u型网络的医学图像分割方法
CN111311592B (zh) 一种基于深度学习的三维医学图像自动分割方法
US20210365717A1 (en) Method and apparatus for segmenting a medical image, and storage medium
CN108665457B (zh) 图像识别方法、装置、存储介质及计算机设备
CN109410219B (zh) 一种基于金字塔融合学习的图像分割方法、装置和计算机可读存储介质
CN109978037B (zh) 图像处理方法、模型训练方法、装置、和存储介质
US10853409B2 (en) Systems and methods for image search
WO2020133636A1 (zh) 前列腺手术中外包膜智能检测和预警方法及系统
CN109960742B (zh) 局部信息的搜索方法及装置
CN110838125B (zh) 医学图像的目标检测方法、装置、设备、存储介质
CN111476806B (zh) 图像处理方法、装置、计算机设备和存储介质
CN114494296A (zh) 一种基于Unet和Transformer相融合的脑部胶质瘤分割方法与系统
JP7337268B2 (ja) 三次元エッジ検出方法、装置、コンピュータプログラム及びコンピュータ機器
CN104077742B (zh) 基于Gabor特征的人脸素描合成方法及系统
US20230326173A1 (en) Image processing method and apparatus, and computer-readable storage medium
CN110570394A (zh) 医学图像分割方法、装置、设备及存储介质
CN116129141A (zh) 医学数据处理方法、装置、设备、介质和计算机程序产品
CN113421240A (zh) 一种基于超声自动乳腺全容积成像的乳腺分类方法及装置
CN113112518A (zh) 基于拼接图像的特征提取器生成方法、装置和计算机设备
CN116258933A (zh) 基于全局信息感知的医学图像分割装置
CN110992310A (zh) 一种确定纵隔淋巴结所在分区的方法及装置
CN114399510A (zh) 结合图像和临床元数据的皮肤病灶分割和分类方法及系统
CN114764870A (zh) 对象定位模型处理、对象定位方法、装置及计算机设备
CN116664590B (zh) 基于动态对比增强磁共振图像的自动分割方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40025797

Country of ref document: HK