WO2023213158A1 - 医疗图像的分割方法、装置、设备、存储介质及程序产品 - Google Patents
医疗图像的分割方法、装置、设备、存储介质及程序产品 Download PDFInfo
- Publication number
- WO2023213158A1 WO2023213158A1 PCT/CN2023/084721 CN2023084721W WO2023213158A1 WO 2023213158 A1 WO2023213158 A1 WO 2023213158A1 CN 2023084721 W CN2023084721 W CN 2023084721W WO 2023213158 A1 WO2023213158 A1 WO 2023213158A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- segmentation
- category
- pixel
- segmentation result
- probability
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 102
- 238000003709 image segmentation Methods 0.000 title claims abstract description 81
- 230000011218 segmentation Effects 0.000 claims abstract description 551
- 238000012549 training Methods 0.000 claims abstract description 43
- 230000000875 corresponding effect Effects 0.000 claims description 58
- 239000011159 matrix material Substances 0.000 claims description 43
- 238000012937 correction Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 9
- 230000002596 correlated effect Effects 0.000 claims description 2
- 230000006978 adaptation Effects 0.000 abstract description 21
- 238000013473 artificial intelligence Methods 0.000 abstract description 11
- 230000008569 process Effects 0.000 description 28
- 238000005516 engineering process Methods 0.000 description 27
- 238000012545 processing Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Abstract
一种医疗图像的分割方法、装置、设备、存储介质及程序产品,涉及人工智能领域。包括:通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果,源域分割模型基于源域的图像数据训练得到,样本医疗图像是目标域中未经标注的图像,目标域与源域中医疗图像的数据分布不同(401);通过目标域分割模型对样本医疗图像进行图像分割,得到第二分割结果(402);基于第二分割结果与目标域分割模型的分割置信度,对第一分割结果进行校正,得到校正分割结果(403);基于第二分割结果与校正分割结果,对目标域分割模型更新训练(404)。本申请实施例提供的方法,可实现无源无监督式域适应,提高图像分割准确性。
Description
本申请要求于2022年05月06日提交的申请号为202210486701.5、发明名称为“医疗图像的分割方法、装置、设备、存储介质及程序产品”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
本申请实施例涉及人工智能领域,特别涉及一种医疗图像的分割方法、装置、设备、存储介质及程序产品。
目前,基于人工智能的图像分割技术可应用于医学领域,比如,对眼底图像进行图像分割,得到视杯视盘分割结果。
在进行图像分割时,可利用预训练的图像分割模型进行训练。在使用预训练的图像分割模型进行图像分割时,由于预训练的图像分割模型采用的数据与当前需要分割的图像数据属于不同域,比如,不同医疗中心或来自不同成像仪器等,需进一步对预训练的图像分割模型进行训练,使其与目标域的图像数据相适应。相关技术中,在域适应期间,需使用图像分割模型在预训练时采用的源域数据,从而将预训练的图像分割模型自适应至目标域。
即相关技术中,域适应依赖于源域数据。在无法获取到源域数据的情况下,无法进行域适应,影响图像分割模型对目标域图像分割的效果。
发明内容
本申请实施例提供了一种医疗图像的分割方法、装置、设备、存储介质及程序产品,可实现无源无监督式域适应,提高图像分割准确性。所述技术方案如下:
一方面,本申请实施例提供了一种医疗图像的分割方法,所述方法由计算机设备执行,所述方法包括:
通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果,所述源域分割模型基于源域的医疗图像数据训练得到,所述样本医疗图像是目标域中未经标注的医疗图像,所述目标域与所述源域中医疗图像的数据分布不同;
通过目标域分割模型对所述样本医疗图像进行图像分割,得到第二分割结果;
基于所述第二分割结果与所述目标域分割模型的分割置信度,对所述第一分割结果进行校正,得到校正分割结果;
基于所述第二分割结果与所述校正分割结果,对所述目标域分割模型更新训练。
另一方面,本申请实施例提供了一种医疗图像的分割装置,所述装置包括:
图像分割模块,用于通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果,所述源域分割模型基于源域的医疗图像数据训练得到,所述样本医疗图像是目标域中未经标注的医疗图像,所述目标域与所述源域中医疗图像的数据分布不同;
所述图像分割模块,还用于通过目标域分割模型对所述样本医疗图像进行图像分割,得到第二分割结果;
校正模块,用于基于所述第二分割结果与所述目标域分割模型的分割置信度,对所述第一分割结果进行校正,得到校正分割结果;
训练模块,用于基于所述第二分割结果与所述校正分割结果,对所述目标域分割模型更新训练。
另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,
所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的医疗图像的分割方法。
另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所述的医疗图像的分割方法。
另一方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面提供的医疗图像的分割方法。
本申请实施例中,在目标域的样本医疗图像未经标注的情况下,计算机设备分别通过源域分割模型与目标域分割模型对样本医疗图像进行分割,得到第一分割结果与第二分割结果,在第二分割结果与第一分割结果具有差异的情况下,表明第一分割结果可能存在错误结果,因此,利用第二分割结果对第一分割结果进行校正,且同时目标域分割模型可能存在分割不准确的问题,同时还需基于目标域分割模型的分割置信度对第一分割结果进行校正,从而提高校正后的第一分割结果即校正分割结果的置信度,将校正分割结果作为伪标签训练模型,有利于提高模型训练准确性。
且利用校正分割结果与第二分割结果对目标域分割模型进行训练,使训练后的目标域分割模型适应目标域的图像数据,可实现在不依赖源域数据的情况下,对目标域分割模型进行无监督训练,即实现无源无监督式的域适应,从而提高目标域分割模型对目标域图像数据分割的准确性。
图1示出了本申请实施例提供的医疗图像的分割方法的原理示意图;
图2示出了本申请一个示例性实施例提供的应用场景的示意图;
图3示出了本申请一个示例性实施例提供的实施环境的示意图;
图4示出了本申请一个示例性实施例提供的医疗图像的分割方法的流程图;
图5示出了本申请另一个示例性实施例提供的医疗图像的分割方法的流程图;
图6示出了本申请另一个示例性实施例提供的医疗图像的分割方法的流程图;
图7示出了本申请一个示例性实施例提供的目标域分割模型训练过程的实施示意图;
图8是示出了不同技术下训练得到的目标域分割模型分割结果的示意图;
图9是本申请一个示例性实施例提供的医疗图像的分割装置的结构框图;
图10示出了本申请一个示例性实施例提供的计算机设备的结构示意图。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形
处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像分割、图像语义理解、图像检索、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。本申请实施例涉及的医疗图像的分割方法,即计算机视觉技术在图像分割领域的应用。
示意性的,如图1所示,首先计算机设备利用源域分割模型102对样本医疗图像101进行图像分割,得到第一分割结果103,以及利用目标域分割模型104对样本医疗图像101进行图像分割,得到第二分割结果105,之后,利用第二分割结果105与目标域分割模型104的分割置信度106对第一分割结果103进行校正,得到校正分割结果107,最终,计算机设备利用第二分割结果105与校正分割结果107对目标域分割模型104进行更新训练,使目标域分割模型适用于分割目标域的图像数据。通过第二分割结果与目标域分割模型对第一分割结果校正得到校正分割结果,可提高校正分割结果的置信度,且通过校正分割结果与第二分割结果对目标域分割模型进行训练,实现无监督式自训练过程,使训练后的目标域分割模型适用于目标域图像数据的分割,从而在不依赖源域数据的情况下,实现域适应,提高对目标域图像分割的准确性。
本申请实施例提供的医疗图像的分割方法可用于需进行域适应的图像分割模型的训练过程中。
如图2所示,应用于医疗场景时,客户方与供应方属于不同域,比如,不同医疗中心,客户方可从供应方获取其利用源域图像数据201训练得到的源域分割模型202,而无法获取源域图像数据(即供应方仅提供源域分割模型,不提供源域图像数据),之后,客户方可对源域分割模型202(初始化的目标域分割模型)进行训练,得到域适应后的目标域分割模型203,使其应用于未标注的目标域图像数据204的分割。
除了上述应用场景外,本申请实施例提供的医疗图像的分割方法,还可以应用于其他需进行域适应的图像分割场景,本申请实施例并不对具体的应用场景构成限定。
图3示出了本申请一个示例性实施例提供的实施环境的示意图。该实施环境中包括计算机设备310和服务器320。其中,计算机设备310与服务器320之间通过通信网络进行数据通信,可选地,通信网络可以是有线网络也可以是无线网络,且该通信网络可以是局域网、城域网以及广域网中的至少一种。
计算机设备310是具有图像分割需求的电子设备,该电子设备可以是智能手机、平板电脑或个人计算机等等,本实施例并此不作限定。图3中,以计算机设备310为医护人员使用的计算机为例进行说明。
在一些实施例中,计算机设备310中运行有支持图像分割功能的应用程序。当需要对目标图像进行分割时,用户将目标图像对输入应用程序,计算机设备310可将目标图像对上传至服务器320,由服务器320进行图像分割,并反馈分割结果。
服务器320可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
在一些实施例中,服务器320用于为计算机设备310中运行的应用程序提供图像分割服务。且服务器320可基于源域分割模型以及目标域的样本医疗图像进行模型训练,得到训练后的目标域分割模型。在一种可能的实施方式中,服务器320接收到计算机设备310发送的目标图像后,利用训练后的目标域分割模型进行图像分割得到目标分割结果,并将目标分割结果返回至计算机设备310,以便计算机设备310对图像分割结果进行显示。
当然,在其他可能的实施方式中,目标域分割模型也可以部署在计算机设备310侧,由计算机设备310在本地实现图像分割,无需借助服务器320,本实施例对此不作限定。且目标域分割模型可在服务器侧进行训练,也可在计算机设备侧进行训练,进行目标域分割模型的部署。为了方便表述,下述各个实施例以图像分割方法由计算机设备执行为例进行说明。
请参考图4,其示出了本申请一个示例性实施例提供的医疗图像的分割方法的流程图。本实施例以该方法用于计算机设备为例进行说明,该方法包括如下步骤。
步骤401,通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果,源域分割模型基于源域的医疗图像数据训练得到,样本医疗图像是目标域中未经标注的医疗图像,目标域与源域中医疗图像的数据分布不同。
其中,源域是目标域中初始图像分割模型(即初始化的目标域分割模型)的提供方。可选的,源域分割模型即为目标域中的初始图像分割模型,其是预先利用源域的图像数据训练得到的图像分割模型。目标域分割模型的初始模型参数与源域分割模型相同。其中,源域与目标域为不同域,源域与目标域中医疗图像的数据分布不同。由于不同域的图像存在数据分布上的差异,初始化的目标域分割模型无法直接对目标域的图像数据进行分割,需进行域适应,即需对初始化的目标域分割模型(源域分割模型)进行训练,使其适应于目标域的图像数据,从而对目标域的图像数据进行图像分割。比如,来自不同医疗中心的图像,由于设备参数、品牌等原因,其所产生的医疗图像的数据分布不同,因此,在第二医疗中心(目标域)需利用第一医疗中心(源域)提供的源域分割模型时,需进行模型自适应。
而在一种可能的情况下,在对目标域分割模型训练过程时,由于目标域的图像数据均未经过标注或标注量过少,无法用于训练,且同时也无法获取源域的图像数据用于域适应,因此,本申请实施例中,通过一种无源无监督的域适应方式训练目标域分割模型。
在一种可能的实施方式中,计算机设备预先利用源域分割模型对样本医疗图像进行图像分割,得到第一分割结果。其中,第一分割结果是指包含样本医疗图像中各个像素所属对象的标记结果,指示有各个像素所属的像素类别,其与样本医疗图像的尺寸相同。示意性的,当样本医疗图像为眼底图像且分割对象为视杯以及视盘时,第一分割结果可分别包含对视杯以及视盘的分割结果,对于视杯的分割结果是将眼底图像中属于视杯的像素与不属于视杯的像素进行不同标记的结果,从而指示各个像素是否属于视杯对应的像素类别。
可选的,第一分割模型的模型结构可为DeepLabv3+、U-Net、稠密卷积网络(Dense Convolutional Network,DenseNet)、残差网络(Residual Network,ResNet)等,本实施例对此不做限定。
步骤402,通过目标域分割模型对样本医疗图像进行图像分割,得到第二分割结果。
在一种可能的实施方式中,计算机设备将第一分割结果所指示的样本医疗图像的分类结果作为伪标签,利用伪标签进行自训练。而源域分割模型与属于目标域的样本医疗图像可能并不适配,即其对样本医疗图像的分割结果并不准确,因此,首先需对第一分割结果进行校正。
校正过程中,计算机设备通过目标域分割模型对样本医疗图像进行图像分割,得到第二分割结果。其中,第二分割结果同样包含样本医疗图像中各个像素所属对象的标记结果,即各个像素的像素类别,第二分割结果与第一分割结果的分割对象相同,比如,均为对眼底图像中视杯进行分割的结果。
步骤403,基于第二分割结果与目标域分割模型的分割置信度,对第一分割结果进行校正,得到校正分割结果。
计算机设备得到第二分割结果后,可利用第二分割结果与第一分割结果间的差异对第一分割结果进行校正。第一分割结果中包含对样本医疗图像中各个像素的像素类别的指示,在一种可能的实施方式中,计算机设备可利用第二分割结果,确定第一分割结果中可能存在错
误的分割结果(错误的像素类别),从而对可能存在错误的像素类别进行校正。比如,第二分割结果与第一分割结果所指示的样本医疗图像中像素A的类别并不相同,表明第一分割结果中像素A对应的分割结果可能存在错误,可对第一分割结果中像素A的像素类别进行校正。
且本申请实施例中,除利用第二分割结果对第一分割结果进行校正外,同时,还引入目标域分割模型的分割置信度。其中,目标域分割模型的分割置信度表示目标域分割模型进行图像分割的不确定性度,即目标域分割模型对样本医疗图像进行分割的准确程度。第二分割结果由目标域分割模型进行图像分割得到,而目标域分割模型进行图像分割时,具有不确定性,即第二分割结果可能也并不准确,因此,引入分割置信度同时对第一分割结果进行校正,从而提高校正分割结果的置信度。
需要说明的是,第一分割结果为源域分割模型的分割结果,其在对目标域分割模型的每一轮训练过程中保持不变,即在每一轮训练目标域分割模型的过程中,初始的第一分割结果均为源域分割模型直接分割得到的结果,不随训练过程改变,而目标域分割模型在训练过程中模型参数不断更新,第二分割结果随之更新,相当的,目标域分割模型的分割置信度也随之更新,在每次更新模型参数的过程,利用当前模型参数下目标域分割模型的第二分割结果与分割置信度对第一分割结果进行校正。
步骤404,基于第二分割结果与校正分割结果,对目标域分割模型更新训练。
当得到校正分割结果后,计算机设备将校正分割结果作为伪标签进行模型训练,实现无监督式的训练,且在此过程中无需使用源域的医疗图像数据,可实现无源式的训练。在一种可能的实施方式中,计算机设备可利用第二分割结果与校正分割结果间的差异对目标域分割模型进行更新训练,直至达到训练结束条件为止。
综上所述,本申请实施例中,在目标域的样本医疗图像未经标注的情况下,计算机设备分别通过源域分割模型与目标域分割模型对样本医疗图像进行分割,得到第一分割结果与第二分割结果,在第二分割结果与第一分割结果具有差异的情况下,表明第一分割结果可能存在错误结果,因此,利用第二分割结果对第一分割结果进行校正,且同时目标域分割模型可能存在分割不准确的问题,同时还需基于目标域分割模型的分割置信度对第一分割结果进行校正,从而提高校正后的第一分割结果即校正分割结果的置信度,将校正分割结果作为伪标签训练模型,有利于提高模型训练准确性。
且利用校正分割结果与第二分割结果对目标域分割模型进行训练,使训练后的目标域分割模型适应目标域的图像数据,可实现在不依赖源域数据的情况下,对目标域分割模型进行无监督训练,即实现无源无监督式的域适应,从而提高目标域分割模型对目标域图像数据分割的准确性。
在一种可能的实施方式中,第一分割结果中包含样本医疗图像中各个像素的像素类别,对第一分割结果进行校正的过程中,首先确定第一分割结果中错误的像素类别,再对错误的像素类别进行校正。下面将对确定错误的像素类别的过程进行示例性说明。
请参考图5,其示出了本申请另一个示例性实施例提供的医疗图像的分割方法的流程图。本实施例以该方法用于计算机设备为例进行说明,该方法包括如下步骤。
步骤501,通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果。
步骤502,通过目标域分割模型对样本医疗图像进行图像分割,得到第二分割结果。
其中,步骤501与步骤502的实施方式可参考上述步骤401与步骤402,本实施例不再赘述。
步骤503,基于第二分割结果,确定第一分割结果对应的标签错误指示图,其中,标签错误指示图用于指示第一分割结果中的标记正确的正确像素类别以及标记错误的错误像素类别,第一分割结果中指示有样本医疗图像的各个像素的像素类别。
在一种可能的实施方式中,计算机设备利用第二分割结果与第一分割结果的差异,确定
第一分割结果所指示的各个像素的像素类别中的错误像素类别以及正确像素类别,即错误标签与正确标签,从而得到标签错误指示图。其中,不同像素类别对应有不同标签错误指示图,比如,当样本医疗图像为眼底图像时,像素类别包括视杯、视盘等,视杯与视盘可分别对应不同的标签错误指示图,视杯对应的标签错误指示图用于指示像素类别被标记为视杯,以及被标记为非视杯中的错误标记与正确标记;视盘对应的标签错误指示图用于指示像素类别被标记为视盘以及被标记为非视盘中的错误标记与正确标记。且标签错误指示图与样本医疗图像的图像尺寸相同,其中包含样本医疗图像中各个像素类别是否标记错误的指示。可选的,该步骤可包括步骤503a-步骤503c(图中未示出):
步骤503a,基于第一分割结果,确定属于第一类别的第一像素。
计算机设备可利用第一分割结果作为伪标签,对目标域分割模型进行训练。首先,计算机设备基于第一分割结果确定样本医疗图像中各个像素属于第一类别的概率。由于第一分割结果存在噪声,因此,需对第一分割结果进行过滤。即需对第一分割结果进行去噪,利用去噪后的结果作为伪标签。在一种可能的实施方式中,采用自适应类感知的方式进行过滤,即对于不同像素类别设定不同的过滤阈值,避免采用与类别无关的阈值过滤而造成标签过滤不平衡的问题。
当计算机设备得到第一分割结果后,可利用第一分割结果确定属于第一类别的第一像素。其中,第一分割结果中包含各个像素属于第一类别的概率,计算机设备可利用各个像素属于第一类别的概率确定像素是否属于第一类别。该方式可包括如下步骤:
步骤一、基于第一分割结果,确定样本医疗图像中各个像素属于第一类别的概率。
可选的,计算机设备可基于第一分割结果指示的预测概率,确定各个像素属于第一类别的概率。其中,第一分割结果指示的预测概率包含各个像素属于不同类别的概率。示意性的,当对眼底图像进行分割时,第一分割结果中可能包含各个像素属于视杯以及视盘的概率。当第一类别为视杯时,计算机设备可根据第一分割结果获取各个像素属于视杯的概率。
步骤二、基于各个像素属于第一类别的概率,确定第一类别对应的第一概率阈值。
在一种可能的实施方式中,通过对各个像素属于第一类别的概率,确定第一类别的第一概率阈值,以筛选属于第一类别的像素,其中,确定第一概率阈值的过程可包括如下步骤:
步骤1,确定各个像素属于第一类别的概率中的最大概率值。
计算机设备确定各个属于第一类别的概率中的最大概率值。示意性的,当第一类别为视杯时,计算机设备确定样本医疗图像中各个像素属于视杯的概率,并确定其中概率最大值。
步骤2,基于最大概率值,确定第一概率阈值。
当得到最大概率值后,计算机可将最大概率值下调目标比例,得到第一概率阈值。可选的,计算机设备可利用预先设定的概率参数(即调整的目标比例)与确定的最大概率值确定第一概率阈值。方式如下:
其中,Pc即表示像素属于第一类别的概率集合,α为概率参数。可选的,α为0.75。
步骤三、在像素属于第一类别的概率大于第一概率阈值的情况下,将像素确定为第一像素。
第一概率阈值即为用于过滤第一分割结果中置信度低的概率。在像素属于第一类别的概率大于第一概率阈值的情况下,确定置信度较高,可将该像素确定为第一像素,即确定其属于第一类别。即:
其中,pc即为像素属于第一类别的概率,为指示函数,当时,即为1,表示该像素属于第一类别;当时,即为0,表示该像素不属于第一类别。
需要说明的是,上述仅对确定属于第一类别的第一像素进行示例性说明,同样的,还可利用相同的方式确定第一分割结果中属于其他类别的像素。
步骤503b,基于第二分割结果,确定第一像素属于第二类别的潜在概率,第二类别是与第一类别不同的像素类别。
上述过程中通过阈值策略对第一分割结果进行初步筛选,其仅为一粗略去噪过程,通过对第一分割结果粗略去噪,得到伪标签。而为提高伪标签的质量,还需进一步进行精细去噪。下面对精细去噪过程进行说明。
首先,计算机设备利用目标域分割模型的分割结果作为交叉验证第三方对伪标签进行精细校正。在一种可能的实施方式中,利用类条件分类噪声过程(Classification Noise Process,CNP)假设,即假设样本医疗图像中每个像素存在一个正确的(潜在)类别标签,而每个类别标签都存在一定概率被错误标记为其他类别标签,即每个类别标签存在一定概率在伪标签中被标记为其他类别标签。比如,像素xt(w,h)∈Xt的潜在标签为而属于j类的每个标签都可能以概率在伪标签中被标记为i类,其中,i∈C,j∈C,C为样本医疗图像中像素类别的集合。
在一种可能的实施方式中,目标域分割模型可输出样本外预测概率(第二分割结果),即目标域分割模型分割样本医疗图像后,得到的样本医疗图像中各个像素属于不同像素类别的概率。当第二分割结果指示像素属于目标类别的概率大于一定阈值时,则表示像素可能属于该目标类别。比如,当xt的伪标签而第二分割结果指示的像素xt属于j类的概率大于概率阈值时,像素xt的潜在标签可能为j而并非i。
因此,计算机设备可根据第二分割结果确定像素的潜在标签,从而确定伪标签中是否存在错误标签。可选的,对于伪标签为第一类别的第一像素,计算机设备可获取第二分割结果中目标像素属于第二类别的潜在概率,第二类别是与第一类别不同的像素类别,从而根据目标概率确定像素的潜在标签为第二类别而伪标签为第一类别的可能性。
示意性的,当第一类别为视杯时,计算机设备可获取第二分割结果中第一像素属于非视杯类别(如视盘)的概率。
步骤503c,基于潜在概率,确定第一分割结果中第一类别对应的标签错误指示图。
获取潜在概率后,计算机设备可基于潜在概率确定第一类别对应的标签错误指示图。该步骤可包括如下步骤:
步骤一、基于第二分割结果中各个像素属于第二类别的概率,确定第二类别的第二概率阈值。
当第二分割结果指示像素属于第二类别的概率大于对应的第二概率阈值时,则可确定像素的潜在标签可能为第二类别。计算机设备首先确定第二类别对应的第二概率阈值,在一种可能的实施方式中,可将各个像素属于第二类别的概率的平均值确定为第二概率阈值。即:
其中,即为第二分割结果中各个像素属于第二类别的概率集合。
或者,在另一种可能的实施方式中,可根据各个像素属于第二类别的概率中最大概率值确定第二概率阈值。即:
其中,α为概率参数。
步骤二、基于目标概率与第二概率阈值,确定联合分布矩阵,联合分布矩阵用于指示像素被标记为第一类别而潜在类别为第二类别的概率。
在一种可能的实施方式中,计算机设备利用第二概率阈值进行过滤,得到可能存在的像素的潜在标签为第二类别而伪标签为第一类别的数量(即第二分割结果中指示第一像素为第二类别的像素数量),从而再进一步根据数量确定样本医疗图像中像素的伪标签为第一类别而潜在类别为第二类别的概率,即联合分布矩阵。确定联合分布矩阵的过程可包含如下步骤:
步骤1,基于潜在概率与第二概率阈值,确定置信联合矩阵,置信联合矩阵用于指示第一像素的潜在类别为第二类别的数量。
首先,计算机设备可利用潜在概率与第二概率阈值,构建置信联合矩阵,方式如下:
其中,表示伪标签为第一类别i的第一像素,其潜在标签为第二类别j的数量,表示样本医疗图像中伪标签为第一类别i的第一像素,表示第二分割结果指示的像素xt属于第二类别j的概率。
步骤2,对置信联合矩阵进行归一化处理,得到联合分布矩阵。
当得到置信联合矩阵后,可对置信联合矩阵进行归一化处理,从而得到联合分布矩阵。然而,由于在构建置信联合矩阵的过程中,计算机设备对于的像素进行了过滤,像素总数发生了改变,需使矩阵表示的像素总数恢复,因此,首先对置信联合矩阵进行标定处理,方式如下:
其中,为伪标签为i的第一像素的像素总数。
之后,对标定处理后得到的进行归一化处理,得到联合分布矩阵,方式如下:
步骤三、基于联合分布矩阵,确定第一类别对应的标签错误指示图。
可选的,联合分布矩阵表示第一分割结果所指示的伪标签为第一类别而像素潜在类别为第二类别的概率,计算机设备可利用联合分布矩阵,确定第一分割结果中第一类别对应的标签错误指示图,即伪标签中对于第一类别的错误标记像素。该方式可包括如下步骤:
步骤1,基于联合分布矩阵与样本医疗图像中像素的像素总数,确定像素标签错误数量。
其中,联合分布矩阵中非对角线的值即表示第一类别被错误标记的可能性。因此,在一种可能的实施方式中,可基于像素总数与联合分布矩阵,确定第一分割结果中可能存在的像素标签错误数量,即像素标签错误数量可为:
其中,n为样本医疗图像中像素的像素总数。
步骤2,基于像素标签错误数量,在样本医疗图像的像素中选取标签错误的像素,其中,标签错误的像素属于第一类别的概率低于其他像素属于第一类别的概率。
之后,计算机设备基于像素标签错误数量,在样本医疗图像的像素中选取标签错误的像素。在一种可能的实施方式中,计算机设备对第一分割结果中各个像素属于第一类别的概率进行从低到高排序,并在排序在前的k个像素确定为标签错误的像素,其中,k即为像素标签错误数量。
步骤3,对标签错误的像素进行第一标记以及对其他像素进行第二标记,得到标签错误指示图。
第一类别的标签错误指示图中包含样本医疗图像中各个像素在第一分割结果中被标记为第一类别或非第一类别的错误标记指示。在一种可能的实施方式中,计算机设备可对选取的标签错误的像素进行第一标记,指示该像素的伪标签错误,并对除标签错误的像素之外的其他像素进行第二标记,指示该像素的伪标签正确。可选的,第一标记可为“1”,第二标记可为“0”。
上述过程中,对第一类别的标签错误指示图的确定过程进行说明。相应的,可基于相同方式确定其他类别的标签错误指示图,从而分别基于各个类别对应的标签错误指示图对第一分割结果进行校正。
步骤504,基于分割置信度,对标签错误指示图中指示的错误像素类别进行校正,得到校正分割结果。
计算机设备获取标签错误指示图后,可根据所指示的各个像素的伪标签的错误情况,确定是否进行校正。在标签错误指示图指示像素类别为错误像素类别的情况下,对该像素对应的伪标签进行校正,而在标签错误指示图指示像素类别为正确像素类别的情况下,则将伪标签确定为该像素的标签。
比如,对于第一类别的标签错误指示图,其中,第一分割结果指示像素A与像素B为第一类别,即像素A与像素B的伪标签为第一类别,标签错误指示图中指示像素A的像素类别为错误像素类别,像素B的像素类别为正确像素类别,则表示像素A的像素类别可能并非第一类别,需要进行校正,而像素B为第一类别,无需校正。
在校正时,由于目标域分割模型可能仍存在域偏移,即未适应目标域数据,因此,第二分割结果同样存在噪声,需进一步基于目标域分割模型的分割置信度进行校正。其中,基于分割置信度,对错误像素类别进行校正的过程可参考下述实施例。
步骤505,基于第二分割结果与校正分割结果,对目标域分割模型更新训练。
其中,本步骤的实施方式可参考上述步骤204,本实施例不再赘述。
本申请实施例中,首先对第一分割结果进行粗略去噪,得到用于训练的伪标签,可提高伪标签的准确性。且进一步基于第二分割结果中像素对应的像素类别与伪标签所指示的像素类别间差异,确定错误的伪标签,并利用目标域分割模型的分割置信度对错误的伪标签进一步校正,即通过第二分割结果以及目标域分割模型的分割置信度对粗略去噪后的伪标签进行双重校正,实现对伪标签进行精细校正,进一步提高伪标签的准确性,从而提高模型训练的准确性。
本申请实施例中,在对第一分割结果进行校正的过程中,同时引入目标域分割模型的分割置信度,下面将对目标域分割模型的分割置信度确定过程以及具体校正过程进行示例性说明。
请参考图6,其示出了本申请另一个示例性实施例提供的医疗图像的分割方法的流程图。本实施例以该方法用于计算机设备为例进行说明,该方法包括如下步骤。
步骤601,通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果。
步骤602,通过目标域分割模型对样本医疗图像进行图像分割,得到第二分割结果。
步骤603,基于第二分割结果,确定第一分割结果对应的标签错误指示图。
其中,步骤601至步骤603的实施方式可参考上述实施例,本实施例不再赘述。
步骤604,在开启随机扰动的情况下,通过目标域分割模型对样本医疗图像进行n次前向推理,得到样本医疗图像中像素的n组像素类别。
在一种可能的实施方式中,计算机设备利用目标域分割模型的分割不确定性来确定分割置信度。其中,分割不确定性可根据目标域分割模型在被随机扰动的情况下的分割结果确定。
可选的,可采用蒙特卡罗(Monte-Carlo,MC)dropout的方式进行贝叶斯估计,得到分割不确定性。计算机设备对目标域分割模型开启随机扰动,即开启随机dropout,在开启随机dropout的过程中,目标域分割模型的模型结果将随机发生变化,此时,利用目标域分割模型对样本医疗图像进行n次前向推理,即进行n次图像分割,得到n次分割结果,其中,每次分割结果中均包含像素的像素类别概率。
示意性的,可进行10次随机前向推理,dropout率为0.5。
步骤605,基于各个像素的n组像素类别,确定目标域分割模型的模型不确定性图。
其中,计算机设备可分别利用各个像素的n组像素类别,确定各个像素对应的分割不确定性度,从而根据各个像素的分割不确定性度,确定目标域分割模型的模型不确定性图。在一种可能的实施方式中,每组像素类别中指示有像素属于各个类别的概率,可将n组像素类
别的标准差确定为像素对应的分割不确定性度。
可选的,不同像素类别对应不同的模型不确定性图。示意性的,当像素类别为第一类别时,计算机设备可获取各个像素属于第一类别的n组像素类别概率,从而得到目标域分割模型在分割第一类别的各个像素时对应的分割不确定性度,各个像素的分割不确定性度组成目标域分割模型分割第一类别的模型不确定性图。
步骤606,基于模型不确定性图,确定目标域分割模型分割错误像素类别对应像素的分割置信度。
得到模型不确定性图后,计算机设备可根据模型不确定性图获取到错误像素类别对应像素的分割不确定度,得到分割错误像素类别对应像素的分割置信度。其中,错误像素类别对应像素即为标签错误指示图中被标记为第一标记的像素。且确定分割置信度的过程中,模型不确定性图与标签错误指示图为同一类别对对应的图,比如,根据第一类别对应的模型不确定性图,确定第一类别对应标签错误指示图中错误像素类别对应像素被目标域分割模型分割的分割置信度。且模型不确定性图的尺寸大小与标签错误指示图的标签大小相同,二者均与样本医疗图像的尺寸大小相同。示意性的,在像素A在标签错误指示图中被标记为第一标记时,即可确定其对应的像素类别为错误像素类别,此时,可在模型不确定性图中,查找像素A的对应的分割不确定度,从而得到像素A的分割置信度。
步骤607,基于错误像素类别对应像素的分割置信度,确定校正权重,校正权重与分割置信度呈负相关关系。
在一种可能的实施方式中,通过校正权重对错误像素类别即错误伪标签进行校正。其中,校正权重与分割置信度呈负相关关系,分割置信度越低,校正权重也越大。可选的,校正权重在0-1范围内。
步骤608,基于校正权重,对错误像素类别进行校正,得到校正分割结果。
利用校正权重,对错误像素类别进行校正的方式为:
其中,表示第一分割结果,Ec为标签错误指示图,Uc为模型不确定性图。其中,Ec为0或1,当Ec指示像素对应的伪标签错误即为错误像素类别时,利用校正权重(1-Uc)进行校正。校正过程中,对错误像素类别分别进行校正。
比如,第一分割结果指示像素为第一类别或非第一类别,当指示像素A为第一类别,而Ec中指示像素A为错误像素类别且获取Uc中像素A对应的分割不确定性度为0.8,则像素A校正后的分割结果为1-(1-0.8)=0.8。
而当Ec指示像素对应的伪标签错误即为正确像素类别时,则无需进行校正,即第一分割结果与校正分割结果相同。
步骤609,基于第二分割结果,确定各个像素的像素类别概率。
在一种可能的实施方式中,计算机设备利用校正分割结果与第二分割结果间差异对目标域分割模型进行更新训练,即将校正得到的校正分割结果作为伪标签对模型进行训练。可选的,可利用交叉熵损失对目标域分割模型的模型参数进行更新。首先,计算机设备根据第二分割结果,获取各个像素属于不同像素类别的像素类别概率。
步骤610,基于像素类别概率与校正分割结果中指示的各个像素的校正类别概率,确定交叉熵损失。
计算机设备利用像素类别概率与校正分割结果确定交叉熵损失,其中,对于分割不同类别的像素对应有不同的校正分割结果,确定交叉熵损失时,对于不同类别可分别得到其对应的交叉熵损失。可选的,确定目标类别的交叉熵损失时,可基于像素属于目标类别的像素类别概率与目标类别对应的校正分割结果,确定目标类别对应的交叉熵损失,其中,确定交叉熵损失的方式如下:
其中,即为像素v对应的校正分割结果,在标签错误指示图指示像素v的像素类别为正确像素类别时,校正分割结果即为第一分割结果中像素v的像素类别概率,而若指示为错误像素类别时,校正分割结果即为基于分割置信度校正后的校正类别概率。pt(v)为第二分割结果中像素v的像素类别概率。
步骤611,基于交叉熵损失,对目标域分割模型更新训练。
计算机设备利用反向传播或梯度更新等算法,基于交叉熵损失对目标域分割模型的模型参数进行更新,直至交叉熵损失达到收敛条件为止。
需要说明的是,除利用交叉熵损失进行更新训练的方式之外,还可采用其他损失,比如,L1,L2等损失函数,本申请实施例对此不做限定。
本实施例中,在开启随机扰动的情况下,利用目标域分割模型进行n次前向推理,并利用推理结果确定目标域分割模型的分割置信度,在其被扰动的情况下,n次前向推理结果越稳定,表明分割置信度越高,从而表示第二分割结果的置信度越高,在第二分割结果指示伪标签错误的情况下,可对其进行校正,从而提高校正后分割结果的准确性。
在一种可能的实施方式中,对目标域分割模型进行训练的整体结构如图7所示,其中,计算机设备预先将样本医疗图像701输入源域分割模型,得到第一分割结果702,之后,对第一分割结果702进行粗略去噪,得到伪标签703。且基于源域分割模型的模型参数对目标域分割模型进行参数初始化,得到初始化的目标域分割模型,之后,计算机设备将样本医疗图像701输入目标域分割模型中,得到第二分割结果704,从而可利用伪标签703与第二分割结果704进行标签错误估计,得到标签错误指示图705,且还需进一步基于目标域分割模型进行模型不确定性估计,得到模型不确定性图706,计算机设备可利用模型不确定性图706与标签错误指示图705对伪标签703进行校正,实现精细去噪,得到校正分割结果707,最终,利用校正分割结果707与第二分割结果704确定交叉熵损失以利用交叉熵损失对目标域分割模型进行更新训练。
在目标域分割模型训练完成后,可对目标域图像数据进行分割。在一种可能的实施方式中,通过目标域分割模型对属于目标域的目标图像进行图像分割,得到目标图像的目标分割结果。
采用上述实施例提供的方案训练得到的目标域分割模型进行图像分割,可提高分割结果的准确性。以分割目标为眼底图像为例,源域分割模型是利用Drishti-GS数据集(D1)预训练得到的模型,且将RIM-ONE-r3数据集(D2)与REFUGE数据集(D3)作为目标域数据。
表1中是采用相关技术中域适应方式与本申请实施例采用的域适应方式得到的D2数据集对应的目标域分割模型的分割效果。表2中是采用相关技术中域适应方式与本申请实施例采用的域适应方式得到的D3数据集对应的目标域分割模型的分割效果。
表1
表2
其中,上界是指基于目标域数据的标签进行全监督训练得到的目标域分割模型的分割结果。无自适应是指直接利用源域分割模型对目标域数据进行分割的结果。其中BEAL和ADVENT是基于源数据进行训练得到目标域分割模型的分割结果;SRDA是训练过程中部分基于源数据进行训练得到的目标域分割模型的分割结果;TENT与DPL均是未依赖于源数据进行训练得到的目标域分割模型的分割结果。其中,分割结果的准确性基于指标Dice分数以及对称位置的平均表面距离(Average Symmetric Surface Distance,ASSD)确定,表中括号内数据为标准差。其中,Dice分数与分割结果准确性呈正相关关系,ASSD与分割结果准确性呈负相关关系,可见,本申请提供的无源无监督式的训练方式可提高目标域分割模型在无法获取源数据且目标域数据未经标注的情况下,进行域适应的效果,提高分割准确性。
如图8所示,其示出了基于相关技术中方式以及本申请方式得到的目标域分割模型对D2数据集以及D3数据集中目标图像的分割结果(其中,金标准是指分割的标准结果),可见,本申请的分割结果准确性较高。
图9是本申请一个示例性实施例提供的医疗图像的分割装置的结构框图,如图9所示,该装置包括:
图像分割模块901,用于通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果,所述源域分割模型基于源域的图像数据训练得到,所述样本医疗图像是目标域中未经标注的图像,所述目标域与所述源域不同;
所述图像分割模块901,还用于通过目标域分割模型对所述样本医疗图像进行图像分割,得到第二分割结果;
校正模块902,用于基于所述第二分割结果与所述目标域分割模型的分割置信度,对所述第一分割结果进行校正,得到校正分割结果;
训练模块903,用于基于所述第二分割结果与所述校正分割结果,对所述目标域分割模型更新训练。
可选的,所述校正模块902,还用于:
基于所述第二分割结果,确定所述第一分割结果对应的标签错误指示图,其中,所述标签错误指示图用于指示所述第一分割结果中标记正确的正确像素类别以及标记错误的错误像素类别,所述第一分割结果中指示有所述样本医疗图像的各个像素的像素类别;
基于所述分割置信度,对所述标签错误指示图中指示的所述错误像素类别进行校正,得到所述校正分割结果。
可选的,所述校正模块902,还用于:
基于所述第一分割结果,确定属于第一类别的第一像素;
基于所述第二分割结果,确定所述第一像素属于第二类别的潜在概率,所述第二类别是与所述第一类别不同的像素类别;
基于所述潜在概率,确定所述第一分割结果中所述第一类别对应的所述标签错误指示图。
可选的,所述校正模块902,还用于:
基于所述第一分割结果,确定所述样本医疗图像中各个像素属于所述第一类别的概率;
基于所述各个像素属于所述第一类别的概率,确定所述第一类别对应的第一概率阈值;
在像素属于所述第一类别的概率大于所述第一概率阈值的情况下,将所述像素确定为所述第一像素。
可选的,所述校正模块902,还用于:
确定所述各个像素属于所述第一类别的概率中的最大概率值;
基于所述最大概率值,确定所述第一概率阈值。
可选的,所述校正模块902,还用于:
基于所述第二分割结果中各个像素属于所述第二类别的概率,确定所述第二类别的第二概率阈值;
基于所述潜在概率与所述第二概率阈值,确定联合分布矩阵,所述联合分布矩阵用于指示像素被标记为所述第一类别而潜在类别为所述第二类别的概率;
基于所述联合分布矩阵,确定所述第一类别对应的所述标签错误指示图。
可选的,所述校正模块902,还用于:
基于所述潜在概率与所述第二概率阈值,确定置信联合矩阵,所述置信联合矩阵用于指示所述第一像素的所述潜在类别为所述第二类别的数量;
对所述置信联合矩阵进行归一化处理,得到所述联合分布矩阵。
可选的,所述校正模块902,还用于:
基于所述联合分布矩阵与所述样本医疗图像中像素的像素总数,确定像素标签错误数量;
基于所述像素标签错误数量,在所述样本医疗图像的像素中选取标签错误的像素,其中,所述标签错误的像素属于所述第一类别的概率低于其他像素属于所述第一类别的概率;
对所述标签错误的像素进行第一标记以及对所述其他像素进行第二标记,得到所述标签错误指示图。
可选的,所述装置还包括:
前向推理模块,用于在开启随机扰动的情况下,通过所述目标域分割模型对所述样本医疗图像进行n次前向推理,得到所述样本医疗图像中像素的n组像素类别;
不确定性图确定模块,用于基于各个所述像素的n组所述像素类别,确定所述目标域分割模型的模型不确定性图;
置信度确定模块,用于基于所述模型不确定性图,确定所述目标域分割模型分割所述错误像素类别对应像素的所述分割置信度。
可选的,所述校正模块902,还用于:
基于所述错误像素类别对应像素的所述分割置信度,确定校正权重,所述校正权重与所述分割置信度呈正相关关系;
基于所述校正权重,对所述错误像素类别进行校正,得到所述校正分割结果。
可选的,所述训练模块903,还用于:
基于所述第二分割结果,确定各个所述像素的像素类别概率;
基于所述像素类别概率与所述校正分割结果中指示的各个像素的校正类别概率,确定交叉熵损失;
基于所述交叉熵损失,对所述目标域分割模型更新训练。
综上所述,本申请实施例中,在目标域的样本医疗图像未经标注的情况下,计算机设备分别通过源域分割模型与目标域分割模型对样本医疗图像进行分割,得到第一分割结果与第二分割结果,在第二分割结果与第一分割结果具有差异的情况下,表明第一分割结果可能存在错误结果,因此,利用第二分割结果对第一分割结果进行校正,且同时目标域分割模型可能存在分割不准确的问题,同时还需基于目标域分割模型的分割置信度对第一分割结果进行校正,从而提高校正后的第一分割结果即校正分割结果的置信度,将校正分割结果作为伪标签训练模型,有利于提高模型训练准确性。
且利用校正分割结果与第二分割结果对目标域分割模型进行训练,使训练后的目标域分割模型适应目标域的图像数据,可实现在不依赖源域数据的情况下,对目标域分割模型进行无监督训练,即实现无源无监督式的域适应,从而提高目标域分割模型对目标域图像数据分割的准确性。
需要说明的是:上述实施例提供的装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其实现过程详见方法实施例,这里不再赘述。
请参考图10,其示出了本申请一个示例性实施例提供的计算机设备的结构示意图。具体来讲:所述计算机设备1000包括中央处理单元(Central Processing Unit,CPU)1001、包括随机存取存储器1002和只读存储器1003的系统存储器1004,以及连接系统存储器1004和中央处理单元1001的系统总线1005。所述计算机设备1000还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(Input/Output,I/O系统)1006,和用于存储操作系统1013、应用程序1014和其他程序模块1015的大容量存储设备1007。
所述基本输入/输出系统1006包括有用于显示信息的显示器1008和用于用户输入信息的诸如鼠标、键盘之类的输入设备1009。其中所述显示器1008和输入设备1009都通过连接到系统总线1005的输入输出控制器1010连接到中央处理单元1001。所述基本输入/输出系统1006还可以包括输入输出控制器1010以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1010还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备1007通过连接到系统总线1005的大容量存储控制器(未示出)连接到中央处理单元1001。所述大容量存储设备1007及其相关联的计算机可读介质为计算机设备1000提供非易失性存储。也就是说,所述大容量存储设备1007可以包括诸如硬盘或者驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括随机存取记忆体(Random Access Memory,RAM)、只读存储器(Read Only Memory,ROM)、闪存或其他固态存储其技术,只读光盘(Compact Disc Read-Only Memory,CD-ROM)、数字通用光盘(Digital Versatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1004和大容量存储设备1007可以统称为存储器。
存储器存储有一个或多个程序,一个或多个程序被配置成由一个或多个中央处理单元1001执行,一个或多个程序包含用于实现上述方法的指令,中央处理单元1001执行该一个或多个程序实现上述各个方法实施例提供的方法。
根据本申请的各种实施例,所述计算机设备1000还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1000可以通过连接在所述系统总线1005上的网络
接口单元1011接到网络1012,或者说,也可以使用网络接口单元1011来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由计算机设备所执行的步骤。
本申请实施例还提供一种计算机可读存储介质,该可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述任一实施例所述的医疗图像的分割方法。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面提供的医疗图像的分割方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,该计算机可读存储介质可以是上述实施例中的存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入终端中的计算机可读存储介质。该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述任一方法实施例所述的医疗图像的分割方法。
可选地,该计算机可读存储介质可以包括:ROM、RAM、固态硬盘(Solid State Drives,SSD)或光盘等。其中,RAM可以包括电阻式随机存取记忆体(Resistance Random Access Memory,ReRAM)和动态随机存取存储器(Dynamic Random Access Memory,DRAM)。
Claims (20)
- 一种医疗图像的分割方法,所述方法由计算机设备执行,所述方法包括:通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果,所述源域分割模型基于源域的医疗图像数据训练得到,所述样本医疗图像是目标域中未经标注的医疗图像,所述目标域与所述源域中医疗图像的数据分布不同;通过目标域分割模型对所述样本医疗图像进行图像分割,得到第二分割结果;基于所述第二分割结果与所述目标域分割模型的分割置信度,对所述第一分割结果进行校正,得到校正分割结果;基于所述第二分割结果与所述校正分割结果,对所述目标域分割模型更新训练。
- 根据权利要求1所述的方法,其中,所述基于所述第二分割结果与所述目标域分割模型的分割置信度,对所述第一分割结果进行校正,得到校正分割结果,包括:基于所述第二分割结果,确定所述第一分割结果对应的标签错误指示图,其中,所述标签错误指示图用于指示所述第一分割结果中标记正确的正确像素类别以及标记错误的错误像素类别,所述第一分割结果中指示有所述样本医疗图像的各个像素的像素类别;基于所述分割置信度,对所述标签错误指示图中指示的所述错误像素类别进行校正,得到所述校正分割结果。
- 根据权利要求2所述的方法,其中,所述基于所述第二分割结果,确定所述第一分割结果对应的标签错误指示图,包括:基于所述第一分割结果,确定属于第一类别的第一像素;基于所述第二分割结果,确定所述第一像素属于第二类别的潜在概率,所述第二类别是与所述第一类别不同的像素类别;基于所述潜在概率,确定所述第一分割结果中所述第一类别对应的所述标签错误指示图。
- 根据权利要求3所述的方法,其中,所述基于所述第一分割结果,确定属于第一类别的第一像素,包括:基于所述第一分割结果,确定所述样本医疗图像中各个像素属于所述第一类别的概率;基于所述各个像素属于所述第一类别的概率,确定所述第一类别对应的第一概率阈值;在像素属于所述第一类别的概率大于所述第一概率阈值的情况下,将所述像素确定为所述第一像素。
- 根据权利要求4所述的方法,其中,所述基于所述各个像素属于所述第一类别的概率,确定所述第一类别对应的第一概率阈值,包括:确定所述各个像素属于所述第一类别的概率中的最大概率值;基于所述最大概率值,确定所述第一概率阈值。
- 根据权利要求3所述的方法,其中,所述基于所述潜在概率,确定所述第一分割结果中所述第一类别对应的所述标签错误指示图,包括:基于所述第二分割结果中各个像素属于所述第二类别的概率,确定所述第二类别的第二概率阈值;基于所述潜在概率与所述第二概率阈值,确定联合分布矩阵,所述联合分布矩阵用于指示像素被标记为所述第一类别而潜在类别为所述第二类别的概率;基于所述联合分布矩阵,确定所述第一类别对应的所述标签错误指示图。
- 根据权利要求6所述的方法,其中,所述基于所述潜在概率与所述第二概率阈值,确定联合分布矩阵,包括:基于所述潜在概率与所述第二概率阈值,确定置信联合矩阵,所述置信联合矩阵用于指示所述第一像素的所述潜在类别为所述第二类别的数量;对所述置信联合矩阵进行归一化处理,得到所述联合分布矩阵。
- 根据权利要求6所述的方法,其中,所述基于所述联合分布矩阵,确定所述第一类别对应的所述标签错误指示图,包括:基于所述联合分布矩阵与所述样本医疗图像中像素的像素总数,确定像素标签错误数量;基于所述像素标签错误数量,在所述样本医疗图像的像素中选取标签错误的像素,其中,所述标签错误的像素属于所述第一类别的概率低于其他像素属于所述第一类别的概率;对所述标签错误的像素进行第一标记以及对所述其他像素进行第二标记,得到所述标签错误指示图。
- 根据权利要求2至8任一所述的方法,其中,所述基于所述分割置信度,对所述标签错误指示图中指示的所述错误像素类别进行校正,得到所述校正分割结果之前,所述方法还包括:在开启随机扰动的情况下,通过所述目标域分割模型对所述样本医疗图像进行n次前向推理,得到所述样本医疗图像中各个像素的n组像素类别;基于各个像素的所述n组像素类别,确定所述目标域分割模型的模型不确定性图;基于所述模型不确定性图,确定所述目标域分割模型分割所述错误像素类别对应像素的所述分割置信度。
- 根据权利要求9所述的方法,其中,所述基于所述分割置信度,对所述标签错误指示图中指示的所述错误像素类别进行校正,得到所述校正分割结果,包括:基于所述错误像素类别对应像素的所述分割置信度,确定校正权重,所述校正权重与所述分割置信度呈正相关关系;基于所述校正权重,对所述错误像素类别进行校正,得到所述校正分割结果。
- 根据权利要求1至8任一所述的方法,其中,所述基于所述第二分割结果与所述校正分割结果,对所述目标域分割模型更新训练,包括:基于所述第二分割结果,确定各个所述像素的像素类别概率;基于所述像素类别概率与所述校正分割结果中指示的各个像素的校正类别概率,确定交叉熵损失;基于所述交叉熵损失,对所述目标域分割模型更新训练。
- 一种医疗图像的分割装置,所述装置包括:图像分割模块,用于通过源域分割模型对样本医疗图像进行图像分割,得到第一分割结果,所述源域分割模型基于源域的医疗图像数据训练得到,所述样本医疗图像是目标域中未经标注的医疗图像,所述目标域与所述源域中医疗图像的数据分布不同;所述图像分割模块,还用于通过目标域分割模型对所述样本医疗图像进行图像分割,得到第二分割结果;校正模块,用于基于所述第二分割结果与所述目标域分割模型的分割置信度,对所述第一分割结果进行校正,得到校正分割结果;训练模块,用于基于所述第二分割结果与所述校正分割结果,对所述目标域分割模型更 新训练。
- 根据权利要求12所述的装置,其中,所述校正模块,还用于:基于所述第二分割结果,确定所述第一分割结果对应的标签错误指示图,其中,所述标签错误指示图用于指示所述第一分割结果中的标记正确的正确像素类别以及标记错误的错误像素类别,所述第一分割结果中指示有所述样本医疗图像的各个像素的像素类别;基于所述分割置信度,对所述标签错误指示图中指示的所述错误像素类别进行校正,得到所述校正分割结果。
- 根据权利要求13所述的装置,其中,所述校正模块,还用于:基于所述第一分割结果,确定属于第一类别的第一像素;基于所述第二分割结果,确定所述第一像素属于第二类别的潜在概率,所述第二类别是与所述第一类别不同的像素类别;基于所述潜在概率,确定所述第一分割结果中所述第一类别对应的所述标签错误指示图。
- 根据权利要求14所述的装置,其中,所述校正模块,还用于:基于所述第一分割结果,确定所述样本医疗图像中各个像素属于所述第一类别的概率;基于所述各个像素属于所述第一类别的概率,确定所述第一类别对应的第一概率阈值;在像素属于所述第一类别的概率大于所述第一概率阈值的情况下,将所述像素确定为所述第一像素。
- 根据权利要求15所述的装置,其中,所述校正模块,还用于:确定所述各个像素属于所述第一类别的概率中的最大概率值;基于所述最大概率值,确定所述第一概率阈值。
- 根据权利要求14所述的装置,其中,所述校正模块,还用于:基于所述第二分割结果中各个像素属于所述第二类别的概率,确定所述第二类别的第二概率阈值;基于所述潜在概率与所述第二概率阈值,确定联合分布矩阵,所述联合分布矩阵用于像素被标记为所述第一类别而潜在类别为所述第二类别的概率;基于所述联合分布矩阵,确定所述第一类别对应的所述标签错误指示图。
- 一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1至11任一所述的医疗图像的分割方法。
- 一种计算机可读存储介质,所述可读存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至11任一所述的医疗图像的分割方法。
- 一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令以实现如权利要求1至11任一所述的医疗图像的分割方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210486701.5 | 2022-05-06 | ||
CN202210486701.5A CN115115829A (zh) | 2022-05-06 | 2022-05-06 | 医疗图像的分割方法、装置、设备、存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023213158A1 true WO2023213158A1 (zh) | 2023-11-09 |
Family
ID=83327329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2023/084721 WO2023213158A1 (zh) | 2022-05-06 | 2023-03-29 | 医疗图像的分割方法、装置、设备、存储介质及程序产品 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115115829A (zh) |
WO (1) | WO2023213158A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115115829A (zh) * | 2022-05-06 | 2022-09-27 | 腾讯医疗健康(深圳)有限公司 | 医疗图像的分割方法、装置、设备、存储介质及程序产品 |
CN116168053B (zh) * | 2023-02-28 | 2024-02-02 | 抖音视界有限公司 | 息肉分割模型的训练方法、息肉分割方法及相关装置 |
CN116895003B (zh) * | 2023-09-07 | 2024-01-30 | 苏州魔视智能科技有限公司 | 目标对象的分割方法、装置、计算机设备及存储介质 |
CN117079058B (zh) * | 2023-10-11 | 2024-01-09 | 腾讯科技(深圳)有限公司 | 图像处理方法和装置、存储介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062753A (zh) * | 2017-12-29 | 2018-05-22 | 重庆理工大学 | 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法 |
CN111476771A (zh) * | 2020-04-03 | 2020-07-31 | 中山大学 | 一种基于距离对抗生成网络的领域自适应方法及系统 |
AU2020103905A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Unsupervised cross-domain self-adaptive medical image segmentation method based on deep adversarial learning |
CN112419326A (zh) * | 2020-12-02 | 2021-02-26 | 腾讯科技(深圳)有限公司 | 图像分割数据处理方法、装置、设备及存储介质 |
CN113822851A (zh) * | 2021-06-15 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、设备及存储介质 |
CN115115829A (zh) * | 2022-05-06 | 2022-09-27 | 腾讯医疗健康(深圳)有限公司 | 医疗图像的分割方法、装置、设备、存储介质及程序产品 |
-
2022
- 2022-05-06 CN CN202210486701.5A patent/CN115115829A/zh active Pending
-
2023
- 2023-03-29 WO PCT/CN2023/084721 patent/WO2023213158A1/zh unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062753A (zh) * | 2017-12-29 | 2018-05-22 | 重庆理工大学 | 基于深度对抗学习的无监督域自适应脑肿瘤语义分割方法 |
CN111476771A (zh) * | 2020-04-03 | 2020-07-31 | 中山大学 | 一种基于距离对抗生成网络的领域自适应方法及系统 |
CN112419326A (zh) * | 2020-12-02 | 2021-02-26 | 腾讯科技(深圳)有限公司 | 图像分割数据处理方法、装置、设备及存储介质 |
AU2020103905A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Unsupervised cross-domain self-adaptive medical image segmentation method based on deep adversarial learning |
CN113822851A (zh) * | 2021-06-15 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、设备及存储介质 |
CN115115829A (zh) * | 2022-05-06 | 2022-09-27 | 腾讯医疗健康(深圳)有限公司 | 医疗图像的分割方法、装置、设备、存储介质及程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN115115829A (zh) | 2022-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023213158A1 (zh) | 医疗图像的分割方法、装置、设备、存储介质及程序产品 | |
JP6807471B2 (ja) | セマンティックセグメンテーションモデルの訓練方法および装置、電子機器、ならびに記憶媒体 | |
US11842487B2 (en) | Detection model training method and apparatus, computer device and storage medium | |
CN111754596B (zh) | 编辑模型生成、人脸图像编辑方法、装置、设备及介质 | |
CN110363210B (zh) | 一种图像语义分割模型的训练方法和服务器 | |
US11551377B2 (en) | Eye gaze tracking using neural networks | |
CN108280477B (zh) | 用于聚类图像的方法和装置 | |
CN111369576B (zh) | 图像分割模型的训练方法、图像分割方法、装置及设备 | |
US20220254134A1 (en) | Region recognition method, apparatus and device, and readable storage medium | |
CN112330684B (zh) | 对象分割方法、装置、计算机设备及存储介质 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
CN110210540B (zh) | 基于注意力机制的跨社交媒体用户身份识别方法及系统 | |
CN112036514B (zh) | 一种图像分类方法、装置、服务器及计算机可读存储介质 | |
CN111489401A (zh) | 一种图像颜色恒常性处理方法、系统、设备和存储介质 | |
CN113221983B (zh) | 迁移学习模型的训练方法及装置、图像处理方法及装置 | |
US20230072813A1 (en) | Image processing method and apparatus, electronic device, and storage medium | |
CN112419326A (zh) | 图像分割数据处理方法、装置、设备及存储介质 | |
CN114463603A (zh) | 图像检测模型的训练方法、装置、电子设备及存储介质 | |
CN113128526A (zh) | 图像识别方法、装置、电子设备和计算机可读存储介质 | |
CN111382619A (zh) | 图片推荐模型的生成、图片推荐方法、装置、设备及介质 | |
CN116958626A (zh) | 一种图像分类模型训练、图像分类方法、装置及电子设备 | |
CN113824989B (zh) | 一种视频处理方法、装置和计算机可读存储介质 | |
CN114255381B (zh) | 图像识别模型的训练方法、图像识别方法、装置及介质 | |
CN113469091B (zh) | 人脸识别方法、训练方法、电子设备及存储介质 | |
Geldenhuys et al. | Deep learning approaches to landmark detection in tsetse wing images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 23799145 Country of ref document: EP Kind code of ref document: A1 |