CN113888475A - 图像检测方法及相关模型的训练方法、相关装置和设备 - Google Patents
图像检测方法及相关模型的训练方法、相关装置和设备 Download PDFInfo
- Publication number
- CN113888475A CN113888475A CN202111063735.5A CN202111063735A CN113888475A CN 113888475 A CN113888475 A CN 113888475A CN 202111063735 A CN202111063735 A CN 202111063735A CN 113888475 A CN113888475 A CN 113888475A
- Authority
- CN
- China
- Prior art keywords
- sub
- image
- medical
- medical image
- medical images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 187
- 238000012549 training Methods 0.000 title claims abstract description 117
- 238000000034 method Methods 0.000 title claims abstract description 75
- 230000000875 corresponding effect Effects 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000007689 inspection Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 239000003550 marker Substances 0.000 claims description 3
- 238000005070 sampling Methods 0.000 description 37
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 7
- 210000005246 left atrium Anatomy 0.000 description 6
- 210000005245 right atrium Anatomy 0.000 description 6
- 210000005240 left ventricle Anatomy 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 4
- 238000002591 computed tomography Methods 0.000 description 4
- 210000004185 liver Anatomy 0.000 description 4
- 210000005241 right ventricle Anatomy 0.000 description 4
- 210000000988 bone and bone Anatomy 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000002595 magnetic resonance imaging Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 210000001624 hip Anatomy 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- 210000001638 cerebellum Anatomy 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 210000002451 diencephalon Anatomy 0.000 description 1
- 230000005489 elastic deformation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000004197 pelvis Anatomy 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 210000001587 telencephalon Anatomy 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000002861 ventricular Effects 0.000 description 1
- 210000001835 viscera Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本申请公开了一种图像检测方法及相关模型的训练方法、相关装置和设备,其中,检测模型的训练方法包括:获取第一医学图像、多个子医学图像和至少一组子医学图像的类别信息;利用检测模型对第一医学图像进行检测,得到像素点的预测标记;其中,检测模型包括第一编码网络和解码网络,预测标记表示预测像素点所属的子对象;基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示;基于样本标记和预测标记之间的差异,得到第一损失值,并基于特征表示之间的相似度和类别信息,得到第二损失值;基于第一损失值和第二损失值,调整检测模型的网络参数。上述方案,能够提高图像检测的效率和精度。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种图像检测方法及相关模型的训练方法、相关装置和设备。
背景技术
在诸如手术规划等临床应用中,CT(Computed Tomography,计算机断层扫描)图像、MRI(Magnetic Resonance Imaging,核磁共振扫描)图像等医学图像具有极其重要的意义。通常来说,可以通过人工勾画、机器检测等方式识别出医学图像中诸如器官、组织或病灶等目标对象。然而,人工勾画效率低下,现有的机器检测又严重依赖于标注数据,而在医学领域中,标注数据又往往依赖于资深医师的人工标注,其稀缺性又制约了现有机器检测的精度。有鉴于此,如何提高图像检测的效率和精度成为亟待解决的问题。
发明内容
本申请提供一种图像检测方法及相关模型的训练方法、相关装置和设备。
本申请第一方面提供了一种检测模型的训练方法,包括:获取第一医学图像、多个子医学图像和至少一组子医学图像的类别信息;其中,第一医学图像含有由若干子对象组成的目标对象,第一医学图像中像素点标注有样本标记,样本标记表示像素点实际所属的子对象,且每组子医学图像包括至少两个子医学图像,类别信息包括至少两个子医学图像分别所属的子对象是否相同;利用检测模型对第一医学图像进行检测,得到像素点的预测标记;其中,检测模型包括第一编码网络和解码网络,预测标记表示预测像素点所属的子对象;基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示;基于样本标记和预测标记之间的差异,得到第一损失值,并基于特征表示之间的相似度和类别信息,得到第二损失值;基于第一损失值和第二损失值,调整检测模型的网络参数。
因此,通过获取第一医学图像、多个子医学图像和至少一组子医学图像的类别信息,第一医学图像含有由若干子对象组成的目标对象,第一医学图像中像素点标注有样本标记,样本标记表示像素点实际所属的子对象,且每组子医学图像包括至少两个子医学图像,类别信息包括至少两个子医学图像分别所属的子对象是否相同,基于此再利用检测模型对第一医学图像进行检测,得到像素点的预测标记,且检测模型包括第一编码网络和解码网络,预测标记表示预测像素点所属的子对象,并基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示,从而基于样本标记和预测标记之间的差异,得到第一损失值,并基于特征表示之间的相似度和类别信息,得到第二损失值,进而基于第一损失值和第二损失值,调整检测模型的网络参数。由此,一方面检测模型可以通过带标注的第一医学图像和不带标注的子医学图像完成训练,能够大大减少对标注数据的依赖,另一方面通过检测模型进行图像检测,也能够提高图像检测效率,同时由于第二损失值是基于特征表示之间的相似度和类别信息得到的,其本质为第一编码网络对于若干子对象的特征级对比学习损失,能够促进第一编码网络充分学习若干子对象的特征信息,进一步地由于第一损失值是基于样本标记和预测标记之间的差异得到的,其本质为由第一编码网络和解码网络所组成的检测模型整体对于第一医学图像的像素级分类学习损失,能够在特征级对比学习的辅助下进一步促进检测模型整体的像素级分类精度。故此,能够提高图像检测的效率和精度。
其中,检测模型是经多轮训练得到的;基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示,包括:基于第一编码网络在上一轮训练调整之后的网络参数,得到当前轮训练过程中第二编码网络的网络参数;其中,第二编码网络和第一编码网络具有相同的网络结构;利用第一编码网络对多个子医学图像分别编码,得到各个子医学图像的第一特征表示,并利用第二编码网络对多个子医学图像分别编码,得到各个子医学图像的第二特征表示;基于特征表示之间的相似度和类别信息,得到第二损失值,包括:将多个子医学图像分别作为当前医学图像,并基于当前医学图像的第一特征表示和第二特征表示,确定第一相似度,以及基于当前医学图像的第一特征表示和参考医学图像的第二特征表示,确定第二相似度,基于第一相似度和第二相似度,得到子损失值;其中,参考医学图像是利用类别信息从多个子医学图像选择得到的,且参考医学与当前医学图像对应于不同子对象;基于多个子医学图像的子损失值,得到第二损失值。
因此,检测模型是通过多轮训练得到的,在编码各个子医学图像的特征表示的过程中,先基于第一编码网络在上一轮训练调整之后的网络参数,得到当前轮训练过程中第二编码网络的网络参数,且第二编码网络和第一编码网络具有相同的网络结构,基于此再利用第一编码网络对多个子医学图像分别编码,得到各个子医学图像的第一特征表示,并利用第二编码网络对多个子医学图像分别编码,得到各个子医学图像的第二特征表示,从而将多个子医学图像分别作为当前医学图像,并利用当前医学图像的第一特征表示和第二特征表示之间的第一相似度,以及当前医学图像的第一特征表示和参考医学图像的第二特征表示之间的相似度,得到子损失值,且参考医学图像是利用类别信息从多个子医学图像选择得到的,参考医学图像与当前医学图像对应于不同子对象,进而基于多个子医学图像的子损失值,得到第二损失值。故此,在编码过程中,通过与第一编码网络具有相同网络结构的第二编码网络分别对子医学图像进行编码,通过对比该子医学图像本身分别由第一编码网络和第二编码网络所编码得到的第一特征表示和第二特征表示,以及对比该子医学图像由第一编码网络所编码得到的第一特征表示与对应于不同子对象的参考医学图像经第二编码网络所编码得到的第二特征表示,能够通过第二编码网络辅助第一编码网络充分学习无标注数据,即对应若干子对象的子医学图像,以充分学习若干子对象的特征信息,有利于实现自我集成的自监督学习。
其中,在利用第一编码网络对多个子医学图像分别编码,得到各个子医学图像的第一特征表示,并利用第二编码网络对多个子医学图像分别编码,得到各个子医学图像的第二特征表示之前,方法还包括:对多个子医学图像分别执行数据增强处理,得到各个子医学图像的第一增强图像和第二增强图像;利用第一编码网络对多个子医学图像分别编码,得到各个子医学图像的第一特征表示,包括:利用第一编码网络对多个子医学图像的第一增强图像分别编码,得到各个子医学图像的第一特征表示;利用第二编码网络对多个子医学图像分别编码,得到各个子医学图像的第二特征表示,包括:利用第二编码网络对多个子医学图像的第二增强图像分别编码,得到各个子医学图像的第二特征表示。
因此,在第一编码网络和第二编码网络进行编码之前,先对多个子医学图像分别执行数据增强处理,得到各个子医学图像的第一增强图像和第二增强图像,基于此再利用第一编码网络对多个子医学图像的第一增强图像分别编码,得到各个子医学图像的第一特征表示,并利用第二编码网络对多个子医学图像的第二增强图像分别编码,得到各个子医学图像的第二特征表示。故此,通过在编码之前对子医学图像进行数据增强,能够减少视图之间的互信息,使得编码网络充分挖掘不同子对象的本质特征,有利于进一步提升编码网络的学习效果。
其中,基于第一编码网络在上一轮训练调整之后的网络参数,得到当前轮训练过程中第二编码网络的网络参数,包括:将第二编码网络在上一轮训练过程中的网络参数和第一编码网络在上一轮训练调整之后的网络参数进行加权处理,得到第二编码网络在当前轮训练过程中的网络参数。
因此,通过将第二编码网络在上一轮训练过程中的网络参数和第一编码网络在上一轮训练调整之后的网络参数进行加权处理,得到第二编码网络在当前训练轮训练过程中的网络参数,能够使得第二编码网络的网络参数在多轮训练过程中平滑变化,有利于提高训练过程的鲁棒性。
其中,子损失值与第一相似度为负相关关系,且子损失值与第二相似度为正相关关系;和/或,第二损失值为多个子医学图像的子损失值的平均值。
因此,子损失值设置为与第一相似度负相关关系,而设置为与第二相似度正相关关系,故在训练过程中通过最小化第二损失值来优化网络参数,能够尽可能提高相同子对象的特征表示之间的相似度,并尽可能降低不同子对象的特征表示之间的相似度,有利于使编码网络充分学习若干子对象的特征信息;而将第二损失值设置为多个子医学图像的子损失值的平均值,能够有利于降低计算第二损失值的复杂度。
其中,检测模型是经多轮训练得到的;多个子医学图像的获取步骤包括:获取若干第二医学图像;其中,若干第二医学图像含有目标对象;基于若干第二医学图像之间的配准结果,得到子医学图像,和/或,基于若干第二医学图像的检测结果,得到子医学图像;其中,检测结果是利用上一轮训练得到的检测模型分别对若干第二医学图像进行检测得到的。
因此,检测模型是经多轮训练得到的,且多个子医学图像具体是由包含目标对象的第二医学图像提取得到的,一方面可以离线采样,通过基于若干第二医学图像之间的配准结果,得到子医学图像,另一方面可以在线采样,通过若干第二医学图像的检测结果,得到子医学图像,且检测结果是利用上一轮训练得到的检测模型的分别对若干第二医学图像进行检测得到的,由于离线采样仅需一次采样即可得到子医学图像,故能够有利于降低采样复杂度,而在线采样每一轮训练均需重新采样子医学图像,且得益于检测模型随着训练轮次的增加,其检测精度也不断提升,故随着训练轮次的增加,子医学图像所含子对象之外的干扰信息也能够不断减少,进一步能够促进编码网络充分学习若干子对象的特征信息,有利于促进提升检测模型的图像检测精度。
其中,基于若干第二医学图像之间的配准结果,得到子医学图像,包括:将若干第二医学图像进行配准,以使不同第二医学图像中相同的子对象对齐;分别提取包含对齐的子对象的第一图像区域,得到对应于相同子对象的子医学图像。
因此,在离线采样时,通过将若干第二医学图像进行配准,以使不同第二医学图像中相同的子对象对齐,从而分别提取包含对齐的子对象的第一图像区域,得到对应于相同子对象的子医学图像,有利于降低子医学图像的采样难度。
其中,检测结果包括第二医学图像中像素点预测所属的子对象;基于若干第二医学图像的检测结果,得到子医学图像,包括:基于在属于相同子对象的像素点中处于预设位置的像素点,在第二医学图像中提取预设尺寸的第二图像区域,作为与子对象对应的子医学图像。
因此,在在线采样时,检测结果包括第二医学图像中像素点预测所属的子对象,在此基础上,基于在属于相同子对象的像素点中处于预设位置的像素点,在第二医学图像中提取预设尺寸的第二图像区域,作为与子对象对应的子医学图像,有利于提升子医学图像的采样精度。
本申请第二方面提供了一种图像检测方法,包括:获取待测医学图像;其中,待测医学图像中包含目标对象,且目标对象由若干子对象组成;利用检测模型对待检测医学图像进行检测,得到待测医学图像中像素点的检测标记。其中,检测标记表示待测医学图像中像素点所属的子对象,且检测模型是利用上述第一方面中的检测模型的训练方法得到的。
本申请第三方面提供了一种检测模型的训练装置,包括:样本获取模块、图像检测模块、特征编码模块、损失计算模块和参数优化模块,样本获取模块用于获取第一医学图像、多个子医学图像和至少一组子医学图像的类别信息;其中,第一医学图像含有由若干子对象组成的目标对象,第一医学图像中像素点标注有样本标记,样本标记表示像素点实际所属的子对象,且每组子医学图像包括至少两个子医学图像,类别信息包括至少两个子医学图像分别所属的子对象是否相同;图像检测模块用于利用检测模型对第一医学图像进行检测,得到像素点的预测标记;其中,检测模型包括第一编码网络和解码网络,预测标记表示预测像素点所属的子对象;特征编码模块用于基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示;损失计算模块用于基于样本标记和预测标记之间的差异,得到第一损失值,并基于特征表示之间的相似度和类别信息,得到第二损失值;参数优化模块用于基于第一损失值和第二损失值,调整检测模型的网络参数。
本申请第四方面提供了一种图像检测装置,包括:图像获取模块和图像检测模块,图像获取模块用于获取待测医学图像;其中,待测医学图像中包含目标对象,且目标对象由若干子对象组成;图像检测模块用于利用检测模型对待检测医学图像进行检测,得到待测医学图像中像素点的检测标记。其中,检测标记表示待测医学图像中像素点所属的子对象,且检测模型是利用上述第三方面中的检测模型的训练装置得到的。
本申请第五方面提供了一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述第一方面中的检测模型的训练方法,或实现上述第二方面中的图像检测方法。
本申请第六方面提供了一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述第一方面中的检测模型的训练方法,或实现上述第二方面中的图像检测方法。
上述方案,通过获取第一医学图像、多个子医学图像和至少一组子医学图像的类别信息,第一医学图像含有由若干子对象组成的目标对象,第一医学图像中像素点标注有样本标记,样本标记表示像素点实际所属的子对象,且每组子医学图像包括至少两个子医学图像,类别信息包括至少两个子医学图像分别所属的子对象是否相同,基于此再利用检测模型对第一医学图像进行检测,得到像素点的预测标记,且检测模型包括第一编码网络和解码网络,预测标记表示预测像素点所属的子对象,并基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示,从而基于样本标记和预测标记之间的差异,得到第一损失值,并基于特征表示之间的相似度和类别信息,得到第二损失值,进而基于第一损失值和第二损失值,调整检测模型的网络参数。由此,一方面检测模型可以通过带标注的第一医学图像和不带标注的子医学图像完成训练,能够大大减少对标注数据的依赖,另一方面通过检测模型进行图像检测,也能够提高图像检测效率,同时由于第二损失值是基于特征表示之间的相似度和类别信息得到的,其本质为第一编码网络对于若干子对象的特征级对比学习损失,能够促进第一编码网络充分学习若干子对象的特征信息,进一步地由于第一损失值是基于样本标记和预测标记之间的差异得到的,其本质为由第一编码网络和解码网络所组成的检测模型整体对于第一医学图像的像素级分类学习损失,能够在特征级对比学习的辅助下进一步促进检测模型整体的像素级分类精度。故此,能够提高图像检测的效率和精度。
附图说明
图1是本申请检测模型的训练方法一实施例的流程示意图;
图2是本申请检测模型的训练方法一实施例的框架示意图;
图3是获取子医学图像一实施例的流程示意图;
图4是离线采样一实施例的示意图;
图5是在线采样一实施例的示意图;
图6是本申请图像检测方法一实施例的流程示意图;
图7是本申请检测模型的训练装置一实施例的框架示意图;
图8是本申请图像检测装置一实施例的框架示意图;
图9是本申请电子设备一实施例的框架示意图;
图10是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请检测模型的训练方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S11:获取第一医学图像、多个子医学图像和至少一组子医学图像的类别信息。
本公开实施例中,第一医学图像含有由若干子对象组成的目标对象。目标对象可以根据实际应用需要进行设置,具体可以包括但不限于:心脏、肝脏等内脏、脑部、骨骼等等,在此不做限定。例如,在需要对心脏进行图像检测时,目标对象可以是心脏;或者,在需要对肝脏进行图像检测时,目标对象可以是肝脏;或者,在需要对脑部进行图像检测时,目标对象可以是脑部;或者,在需要对骨骼进行图像检测时,目标对象可以是骨骼。其他情况可以以此类推,在此不再一一举例。此外,如前所述,目标对象是由若干子对象组成的,若干子对象可以是目标对象在解剖学意义上的不同组成部分。以目标对象是心脏为例,若干子对象可以包括但不限于:左心房、左心室、右心房、有心室等;或者,以目标对象是肝脏为例,若干子对象可以包括但不限于:Ⅰ段、Ⅱ段、Ⅲ段、Ⅳa段、Ⅳb段、Ⅴ段、Ⅵ段、Ⅶ段、Ⅷ段等;或者,以目标对象是脑部为例,若干子对象可以包括但不限于:端脑、间脑、小脑、脑干等;或者,以目标对象是盆骨为例,若干子对象可以包括但不限于:骶骨、尾骨、左髋骨、右髋骨等。其他情况可以以此类推,在此不再一一举例。
本公开实施例中,第一医学图像中像素点标注有样本标记,样本标记表示像素点实际所属的子对象。具体地,可以采用不同编号来标记属于不同子对象的像素点。仍以目标对象是心脏为例,可以采用编号“1”来标记第一医学图像中实际属于子对象“左心房”的像素点,采用编号“2”来标记第一医学图像中实际属于子对象“左心室”的像素点,采用编号“3”来标记第一医学图像中实际属于子对象“右心房”的像素点,以及采用编号“4”来标记第一医学图像中实际属于子对象“右心室”的像素点。此外,对于第一医学图像中实际不属于任一子对象的像素点,也可以采用诸如编号“0”等除上述编号之外的其他编号来进行标记。其他情况可以以此类推,在此不再一一举例。
在一个实施场景中,多个子医学图像可以为2个子医学图像、3个子医学图像、4个子医学图像等等,在此不做限定。为了便于描述,由第一医学图像所组成的图像集合可以记为而由多个子医学图像所组成的图像集合可以记为其中,对于图像集合DL而言,N表示第一医学图像的总数,xi表示第i个第一医学图像,yi表示第i个第一医学图像中像素点的样本标记,而对于图像集合DU而言,M表示子医学图像的总数,xi′表示第i个子医学图像。
在一个实施场景中,不同子医学图像所属的子对象可以相同,或者不同子医学图像所属的子对象也可以不同。例如,图像集合DU共包含6个子医学图像,子医学图像01所属的子对象可以是左心房,子医学图像02所属的子对象可以是左心室,子医学图像03所属的子对象可以是右心房,子医学图像04所属的子对象可以是右心室,子医学图像05所属的子对象可以是左心房,子医学图像06所属的子对象可以是右心房,由此可见,子医学图像01至子医学图像04中任意两者属于不同子对象,且子医学图像01和子医学图像05术属于相同子对象,子医学图像03和子医学图像06属于相同子对象。需要说明的是,上述举例仅仅是实际应用中可能存在的一种情况,并不因此而限定实际应用时子医学图像所对应的子对象。
本公开实施例中,每组子医学图像包括至少两个子医学图像,且类别信息包括上述至少两个子医学图像所属的子对象是否相同。仍以前述图像集合DU为例,类别信息可以包括如下:甲组子医学图像(子医学图像01至子医学图像04)属于不同子对象,乙组子医学图像(子医学图像01和子医学图像05)属于相同子对象,丙组子医学图像(子医学图像03和子医学图像06)属于相同子对象。其他情况可以以此类推,在此不再一一举例。即对于子医学图像而言,无需标注其像素点实际具体所属的子对象,甚至也无需标注子医学图像具体所属的子对象,仅需知晓各组子医学图像中的子医学图像是否属于相同子对象即可,从而能够大大降低对标注数据的依赖。此外,类别信息可以囊括任意两个子医学图像是否属于相同子对象,如前述类别信息所示,基于甲组和乙组,可以知晓子医学图像02至子医学图像04任一者与子医学图像04属于不同子对象,基于甲组和丙组,可以知晓子医学图像01、子医学图像02和子医学图像04任一者与子医学图像06分属于不同子对象,基于甲组、乙组和丙组,可以知晓子医学图像05和子医学图像06属于不同子对象,由此可以知晓任意两个子医学图像是否属于相同子对象。其他情况可以以此类推,在此不再一一举例。
在一个实施场景中,为了消除医学图像采样间隔不一致的情况下,可以统一医学图像的分辨率。以三维医学图像为例,可以统一重采样为288*288*288等,在此不做限定。此外,为了降低处理负荷,可以进一步对医学图像进行降采样,如可以降采样至144*144*144,在此不做限定。
需要说明的是,上述第一医学图像、子医学图像可以是:CT图像、MR图像等,在此不做限定。
步骤S12:利用检测模型对第一医学图像进行检测,得到像素点的预测标记。
本公开实施例中,检测模型包括第一编码网络和解码网络,预测标记表示预测像素点所属的子对象。具体地,以检测三维医学图像为例,检测模型可以包括但不限于3DUNet等,在此不做限定。
在一个实施场景中,第一编码网络可以包括多层编码层,编码层可以包括但不限于:卷积层、池化层、批归一化层、非线性激活层等,在此不做限定。随着多层编码层的逐层编码,第一编码网络所编码的特征图的分辨率逐渐降低,通道数目逐渐增加,从而能够提取到更为丰富的特征信息。
在另一个实施场景中,解码网络可以包括多层解码层,解码层可以包括但不限于:上采样层、卷积层、批归一化层、非线性激活层等,在此不做限定。随着多层解码层的逐层解码,解码网络所解码的特征图的分辨率逐渐增加,通道数目逐渐减少,以最终解码得到第一医学图像中像素点预测所属的子对象。
步骤S13:基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示。
在一个实施场景中,可以利用第一编码网络直接对多个子医学图像分别进行编码,得到各个子医学图像的特征表示。
在另一个实施场景中,请结合参阅图2,图2是本申请检测模型的训练方法一实施例的框架示意图。如图2所示,可以预先构建一个第二编码网络,且第二编码网络具有与第一编码网络相同的网络结构。在此基础上,在当前轮(记为第t轮)训练时,可以基于第一编码网络在上一轮(记为第t-1轮)训练调整之后的网络参数得到当前轮(即第t轮)训练过程中第二编码网络的网络参数再利用第一编码网络对多个子医学图像分别编码,得到各个子医学图像的第一特征表示,并利用第二编码网络对多个子医学图像分别编码,得到各个子医学图像的第二特征表示。
在一个具体的实施场景中,由于第二编码网络具有和第一编码网络相同的网络结构,故第二编码网络的网络参数和第一编码网络的网络参数一一对应,进而针对每一网络参数,可以执行上述基于第一编码网络在上一轮训练调整之后的网络参数,得到当前轮训练过程中第二编码网络的网络参数的步骤,以获取到第二编码网络所有网络参数。
在另一个具体的实施场景中,请继续结合参阅图2,如图2所示,利用第一编码网络对子医学图像进行编码,可以得到一个高维特征表示,为了便于后续计算相似度,可以利用第一多层感知机对高维特征表示进行降维,得到子医学图像的第一特征表示;类似地,利用第二编码网络对子医学图像进行编码,也可以得到一个高维特征表示,为了便于后续计算相似度,可以利用第二多层感知机对高维特征表示进行降维,得到子医学图像的第二特征表示。上述第一多层感知机和第二多层感知机均可以包括多层全连接层,例如,可以包括两层全连接层,或者,也可以包括三层全连接层,在此不做限定。为了便于区分,如图2所示,可以将第一多层感知机的网络参数记为pθ,将第二多层感知机的网络参数记为pζ。
在又一个具体的实施场景中,可以将第二编码网络在上一轮(即第t-1轮)训练过程中的网络参数和第一编码网络在上一轮(即第t-1轮)训练调整之后的网络参数进行加权处理,得到第二编码网络在当前轮(即第t轮)训练过程中的网络参数
上述公式(1)中,α表示加权因子,其取值范围可以为0至1之间。上述方式,能够使得第二编码网络的网络参数在多轮训练过程中平滑变化,有利于提高训练过程的鲁棒性。类似地,在利用多层感知机进行特征降维的情况下,可以将第二多层感知机在上一轮(即第t-1轮)训练过程中的网络参数和第一多层感知机在上一轮(即第t-1轮)训练调整之后的网络参数进行加权处理,得到第二多层感知机在当前轮(即第t轮)训练过程中的网络参数
在又一个具体的实施场景中,请继续结合参阅图2,为了进一步提升编码网络的学习效果,在利用编码网络对子医学图像进行编码之前,可以对多个子医学图像分别执行数据增强处理,例如执行两次数据增强,得到各个子医学图像的第一增强图像和第二增强图像。基于此,可以再利用第一编码网络对多个子医学图像的第一增强图像分别编码,得到各个子医学图像的第一特征表示,并利用第二编码网络对多个子医学图像的第二增强图像分别编码,得到各个子医学图像的第二特征表示。需要说明的是,上述数据增强处理可以包括但不限于:随机图像值偏移、随机弹性变形、随机翻转、随机尺度、随机旋转等,在此不做限定,即通过对子医学图像分别执行数据增强处理所得到的第一增强图像和第二增强图像仍然包含原子医学图像对应的子对象,但所呈现的视角不再相同,从而能够减少视图之间的互信息,使得编码网络充分挖掘不同子对象的本质特征,有利于进一步提升编码网络的学习效果。
具体地,请结合参阅图2,如图2所示,对于第i个子医学图像xi而言,通过执行两次数据增强处理,可以得到具有不同视角的第一增强图像和第二增强图像进一步地,第一增强图像分别经过第一编码网络fθ和第一多层感知机pθ,可以得到第一特征表示类似地,第二增强图像分别经过第二编码网络fζ和第二多层感知机pζ,可以得到第一特征表示对于其他子医学图像的处理,可以以此类推,在此不再一一举例。
此外,对子医学图像分别所执行的两次数据增强处理,可以是从前述随机图像值偏移、随机弹性变形、随机翻转、随机尺度、随机旋转共5种处理中随机选择的,在此不做限定。
步骤S14:基于样本标记和预测标记之间的差异,得到第一损失值,并基于特征表示之间的相似度和类别信息,得到第二损失值。
在一个实施场景中,如前所述,预测标记表示预测像素点所属的子对象,具体地,预测标记可以包括像素点预测分别属于若干子对象的预测概率值,基于此可以将最大预测概率值对应的子对象,作为像素点预测所属的子对象。基于此,可以基于像素点的样本标记,利用第一损失函数(如,交叉熵损失函数)处理上述预测概率值,得到第一损失值。具体地,对于图像集合DL而言,其第一损失值loss1可以表示为:
在一个实施场景中,可以基于类别信息,利用第二损失函数处理特征表示之间的相似度,得到第二损失值。具体地,如前所述,各个子医学图像分别经第一编码网络和第二编码网络编码,可以得到第一特征表示和第二特征表示。基于此,可以将多个子医学图像分别作为当前医学图像,并基于当前医学图像的第一特征表示和第二特征表示,确定第一相似度,以及当前医学图像的第一特征表示和参考医学图像的第二特征表示,确定第二相似度,从而基于第一相似度和第二相似度,得到子损失值,其中,参考医学图像是利用类别信息从多个子医学图像选择得到的,参考医学图像与当前医学图像对应于不同子对象。上述方式,能够通过第二编码网络辅助第一编码网络充分学习无标注数据,即对应若干子对象的子医学图像,以充分学习若干子对象的特征信息,有利于实现自我集成的自监督学习。
在一个具体的实施场景中,如前所述,可以利用类别信息,确定当前医学图像的参考医学图像。由于每组子医学图像包括至少两个子医学图像,类别信息包括上述至少两个子医学图像分别所属的子对象是否相同,则可以结合类别信息,从多个子医学图像中确定出与当前医学图像分属于不同子对象的参考医学图像。仍以前述图像集合DU为例,类别信息具体可以包括前述甲组、乙组和丙组子医学图像的相关信息(具体可以参阅前述描述,在此不再赘述)。在子医学图像01为当前医学图像情况下,基于甲组可以确定子医学图像02、子医学图像03和子医学图像04均是当前医学图像的参考医学图像,基于乙组可以确定子医学图像05不是当前医学图像的参考医学图像,基于丙组可以确定子医学图像06是当前医学图像的参考医学图像。其他情况可以以此类推,在此不再一一举例。
在另一个具体的实施场景中,子损失值和第一相似度为负相关关系,且子损失值和第二相似度为正相关关系,也就是说,第一相似度越大,第二相似度越小,子损失值越小,反之,第一相似度越小,第二相似度越大,子损失值越大。上述方式,在训练过程中通过最小化第二损失值来优化网络参数,能够尽可能提高相同子对象的特征表示之间的相似度,并尽可能降低不同子对象的特征表示之间的相似度,有利于使编码网络充分学习若干子对象的特征信息。
在又一个具体的实施场景中,以图像集合DU中第i个子医学图像xi′为例,如前所述,子医学图像xi′经数据增强处理之后,可以得到第一增强图像和第二增强图像且第一增强图像分别经第一编码网络和第一多层感知机处理,可以得到第一特征表示第二增强图像分别经第二编码网络和第二多层感知机处理,可以得到第二特征表示经第二损失函数处理得到的子损失值可以表示为:
上述公式(4)中,sim(·)表示相似度计算函数(如,余弦相似度函数),具体地,sim(u,v)=uΤv/||u||||v||。表示第一相似度,表示第二相似度,其中,zl表示参考图像的第二特征表示。可以视为正样本对,而可以视为负样本对。此外,τ表示温度系数,在τ>1时,能够使分布趋于平滑,在τ<1时,能够使分布趋于尖锐。
在又一个具体的实施场景中,为了降低计算负荷,第二损失值具体可以为多个子医学图像的子损失值的平均值。仍以图像集合DU为例,第二损失值loss2可以表示为:
步骤S15:基于第一损失值和第二损失值,调整检测模型的网络参数。
具体地,可以将第一损失值和第二损失值进行加权处理,得到总损失值,再基于总损失值,调整检测模型的网络参数。例如,可以采用误差反向传播算法,更新检测模型的网络参数。总损失值loss可以表示为:
上述公式(6)中,λ表示加权因子。加权因子λ可以设置为一个固定值,如可以设置为0.3、0.4、0.5等等,在此不做限定。此外,加权因子λ也可以随训练轮次而发生改变,如加权因子λ可以随着训练轮次的增加而增大,例如:
上述公式(7)中,tmax表示最大训练轮次,t表示当前训练轮次。由此可见,随着训练轮次的增加,加权因子λ不断提高,从而总损失值中第二损失值的占比不断增大,即在训练初期,主要参考像素级分类学习损失(即第一损失值)来调整检测模型的网络参数,而在训练中后期,检测模型整体的检测精度得到一定提升,此时同时参考特征级对比学习损失(即第二损失值)来调整检测模型的网络参数,以使第一编码网络充分学习不同子对象的特征信息,以进一步提升检测模型的检测精度。
上述方案,通过获取第一医学图像、多个子医学图像和至少一组子医学图像的类别信息,第一医学图像含有由若干子对象组成的目标对象,第一医学图像中像素点标注有样本标记,样本标记表示像素点实际所属的子对象,且每组子医学图像包括至少两个子医学图像,类别信息包括至少两个子医学图像分别所属的子对象是否相同,基于此再利用检测模型对第一医学图像进行检测,得到像素点的预测标记,且检测模型包括第一编码网络和解码网络,预测标记表示预测像素点所属的子对象,并基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示,从而基于样本标记和预测标记之间的差异,得到第一损失值,并基于特征表示之间的相似度和类别信息,得到第二损失值,进而基于第一损失值和第二损失值,调整检测模型的网络参数。由此,一方面检测模型可以通过带标注的第一医学图像和不带标注的子医学图像完成训练,能够大大减少对标注数据的依赖,另一方面通过检测模型进行图像检测,也能够提高图像检测效率,同时由于第二损失值是基于特征表示之间的相似度和类别信息得到的,其本质为第一编码网络对于若干子对象的特征级对比学习损失,能够促进第一编码网络充分学习若干子对象的特征信息,进一步地由于第一损失值是基于样本标记和预测标记之间的差异得到的,其本质为由第一编码网络和解码网络所组成的检测模型整体对于第一医学图像的像素级分类学习损失,能够在特征级对比学习的辅助下进一步促进检测模型整体的像素级分类精度。故此,能够提高图像检测的效率和精度。
请参阅图3,图3是获取子医学图像一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S31:获取若干第二医学图像。
本公开实施例中,若干第二医学图像含有目标对象。关于第二医学图像以及目标对象具体可以参阅前述公开实施例中关于第一医学图像的相关描述,在此不再赘述。需要说明的是,可以从第一医学图像中选择至少部分医学图像作为第二医学图像,或者,也可以重新采集目标对象的医学图像作为第二医学图像。
步骤S32:基于若干第二医学图像之间的配准结果,得到子医学图像,和/或,基于若干第二医学图像的检测结果,得到子医学图像。
在一个实施场景中,可以通过离线采样的方式获取子医学图像,即基于若干第二医学图像之间的配准结果,得到子医学图像。具体地,可以将若干第二医学图像进行配准,以使不同第二医学图像中相同的子对象对齐,在此基础上,再分别提取包含对齐的子对象的第一图像区域,得到对应于相同子对象的子医学图像。上述方式,在离线采样时,通过将若干第二医学图像进行配准,以使不同第二医学图像中相同的子对象对齐,从而分别提取包含对齐的子对象的第一图像区域,得到对应于相同子对象的子医学图像,有利于降低子医学图像的采样难度。
在一个具体的实施场景中,可以基于特征进行图像配准,如可以基于SIFT(Scale-Invariant Feature Transform)、SURF(Speeded Up Robust Features)、ORB(OrientedFAST and Rotated BRIEF)等进行图像配准,在此不再赘述;或者,也可以基于深度学习的神经网络进行图像配准,具体可以包括但不限于:HomographyNet回归网络等,在此不做限定。
在另一个具体的实施场景中,请结合参阅图4,图4是离线采样一实施例的示意图。如图4所示,从左至右为三维的第二医学图像,为了便于描述,从左至右分别记为x1,x2,…,xM,且每一第二医学图像可以包括若干二维图像。上述第二医学图像x1,x2,…,xM经配准,第二医学图像x1中二维图像组合第二医学图像x2中二维图像组合第二医学图像xM中二维图像组合均包含同一对齐后的子对象,故可以将二维图像组合作为对应于相同子对象的子医学图像;类似地,可以将二维图像组合作为对应于相同子对象的子医学图像,可以将二维图像组合作为对应于相同子对象的子医学图像。其他情况可以以此类推,在此不再一一举例。需要说明的是,第一图像区域即可以是前述二维图像组,也可以是直接从第二医学图像中截取的三维图像区域,在此不做限定。
本公开实施例中,检测结果是利用上一轮训练得到的检测模型分别对若干第二医学图像进行检测得到的。在一个实施场景中,检测结果具体可以包括第二医学图像中像素点预测所属的子对象,在此基础上,可以基于在属于相同子对象的像素点中处于预设位置的像素点,在第二医学图像中提取预设尺寸的而第二图像区域,作为与子对象对应的子医学图像。上述方式,在在线采样时,检测结果包括第二医学图像中像素点预测所属的子对象,在此基础上,基于在属于相同子对象的像素点中处于预设位置的像素点,在第二医学图像中提取预设尺寸的第二图像区域,作为与子对象对应的子医学图像,有利于提升子医学图像的采样精度。
在一个具体的实施场景中,预设位置可以是中央位置,即可以选取属于相同子对象的像素点中处于中央位置的像素点,该像素点可以近似地定位子对象的中心位置,从而可以基于该像素点提取第二图像区域。
在另一个具体的实施场景中,预设尺寸可以根据实际情况进行设置,如可以设置为64*64*64等,在此不做限定。
在又一个具体的实施场景中,请结合参阅图5,图5是在线采样一实施例的示意图。如图5所示的检测结果,不同灰度的像素点属于不同子对象,在此基础上,可以确定某一灰度的像素点中处于中央位置的像素点,并以该像素点为中心提取一个预设尺寸的第二图像区域,得到子医学图像,如此循环,可以得到子医学图像x1,x2,x3,x4,x5,x6。其他情况可以额以此类推,在此不再一一举例。
需要说明的是,可以在训练之前,采用离线采样预先获取多个子医学图像,且后续训练直接利用离线采样得到的子医学图像即可;也可以在每次训练之前,重新采用在线采样预先获取多个子医学图像;也可以在当前训练轮次满足预设条件(如,当前训练轮次为奇数,或当前训练轮次小于预设数值)的情况下,采用离线采样得到的子医学图像,而在当前训练轮次不满足预设条件(如,当前训练轮次不为奇数,或当前训练轮次不小于预设数值)的情况下,采用在线采样得到的子医学图像;还可以在训练之前,采用离线采样预先获取多个子医学图像,并在每次训练之前,重新采用在线采样预先获取多个子医学图像,并将离线采样得到的子医学图像和在线采样得到的子医学图像一并作为训练样本。
上述方案,一方面可以离线采样,通过基于若干第二医学图像之间的配准结果,得到子医学图像,另一方面可以在线采样,通过若干第二医学图像的检测结果,得到子医学图像,且检测结果是利用上一轮训练得到的检测模型的分别对若干第二医学图像进行检测得到的,由于离线采样仅需一次采样即可得到子医学图像,故能够有利于降低采样复杂度,而在线采样每一轮训练均需重新采样子医学图像,且得益于检测模型随着训练轮次的增加,其检测精度也不断提升,故随着训练轮次的增加,子医学图像所含子对象之外的干扰信息也能够不断减少,进一步能够促进编码网络充分学习若干子对象的特征信息,有利于促进提升检测模型的图像检测精度。
请参阅图6,图6是本申请图像检测方法一实施例的流程示意图。
具体而言,可以包括如下步骤:
步骤S61:获取待测医学图像。
本公开实施例中,待测医学图像中包含目标对象,且目标对象由若干子对象组成。关于目标对象具体可以参阅前述公开实施例中相关描述,在此不再赘述。此外,待检测医学图像可以包括但不限于CT图像、MRI图像等,在此不做限定。
步骤S62:利用检测模型对待检测医学图像进行检测,得到待测医学图像中像素点的检测标记。
本公开实施例中,检测标记表示待测医学图像中像素点所属的子对象,且检测模型是利用上述任一检测模型的训练方法实施例训练得到的。具体训练过程,可以参阅前述公开实施例,在此不再赘述。
具体地,可以将属于相同子对象的像素点所形成的图像区域,作为与该子对象对应的图像对象。仍以目标对象是心脏为例,可以将属于子对象“左心房”的像素点所形成的图像区域,作为与子对象“左心房”对应的图像区域;将属于子对象“左心室”的像素点所形成的图像区域,作为与子对象“左心室”对应的图像区域;子对象“右心房”的像素点所形成的图像区域,作为与子对象“右心房”对应的图像区域;子对象“右心室”的像素点所形成的图像区域,作为与子对象“右心室”对应的图像区域。其他情况可以以此类推,在此不再一一举例。
上述方案,通过获取待测医学图像,并利用检测模型对待检测医学图像进行检测,得到待测医学图像中像素点的检测标记,且检测标记表示待测医学图像中像素点所属的子对象,检测模型是利用上述任一检测模型的训练方法实施例训练得到的,能够有利于提高图像检测的效率和精度。
请参阅图7,图7是本申请检测模型的训练装置70一实施例的框架示意图。检测模型的训练装置70包括:样本获取模块71、图像检测模块72、特征编码模块73、损失计算模块74和参数优化模块75,样本获取模块71用于获取第一医学图像、多个子医学图像和至少一组子医学图像的类别信息;其中,第一医学图像含有由若干子对象组成的目标对象,第一医学图像中像素点标注有样本标记,样本标记表示像素点实际所属的子对象,且每组子医学图像包括至少两个子医学图像,类别信息包括至少两个子医学图像分别所属的子对象是否相同;图像检测模块72用于利用检测模型对第一医学图像进行检测,得到像素点的预测标记;其中,检测模型包括第一编码网络和解码网络,预测标记表示预测像素点所属的子对象;特征编码模块73用于基于第一编码网络对多个子医学图像分别进行编码,得到各个子医学图像的特征表示;损失计算模块74用于基于样本标记和预测标记之间的差异,得到第一损失值,并基于特征表示之间的相似度和类别信息,得到第二损失值;参数优化模块75用于基于第一损失值和第二损失值,调整检测模型的网络参数。
在一些公开实施例中,检测模型是经多轮训练得到的;特征编码模块73包括参数迭代子模块,用于基于第一编码网络在上一轮训练调整之后的网络参数,得到当前轮训练过程中第二编码网络的网络参数;其中,第二编码网络和第一编码网络具有相同的网络结构,特征编码模块73包括第一编码子模块,用于利用第一编码网络对多个子医学图像分别编码,得到各个子医学图像的第一特征表示,特征编码模块73包括第二编码子模块,用于利用第二编码网络对多个子医学图像分别编码,得到各个子医学图像的第二特征表示,损失计算模块74包括子损失计算子模块,用于将多个子医学图像分别作为当前医学图像,并基于当前医学图像的第一特征表示和第二特征表示,确定第一相似度,以及基于当前医学图像的第一特征表示和参考医学图像的第二特征表示,确定第二相似度,基于第一相似度和第二相似度,得到子损失值;其中,参考医学图像是利用类别信息从多个子医学图像选择得到的,且参考医学与当前医学图像对应于不同子对象;损失计算模块74包括子损失统计子模块,用于基于多个子医学图像的子损失值,得到第二损失值。
在一些公开实施例中,特征编码模块73还包括数据增强子模块,用于对多个子医学图像分别执行数据增强处理,得到各个子医学图像的第一增强图像和第二增强图像,第一编码子模块具体用于利用第一编码网络对多个子医学图像的第一增强图像分别编码,得到各个子医学图像的第一特征表示,第二编码子模块具体用于利用第二编码网络对多个子医学图像的第二增强图像分别编码,得到各个子医学图像的第二特征表示。
在一些公开实施例中,参数迭代子模块具体用于将第二编码网络在上一轮训练过程中的网络参数和第一编码网络在上一轮训练调整之后的网络参数进行加权处理,得到第二编码网络在当前轮训练过程中的网络参数。
在一些公开实施例中,子损失值与第一相似度为负相关关系,且子损失值与第二相似度为正相关关系;和/或,第二损失值为多个子医学图像的子损失值的平均值。
在一些公开实施例中,检测模型是经多轮训练得到的;样本获取模块71包括原始图像获取子模块,用于获取若干第二医学图像;其中,若干第二医学图像含有目标对象,样本获取模块71包括离线图像采样子模块,用于基于若干第二医学图像之间的配准结果,得到子医学图像,样本获取模块71包括在线图像采样子模块,用于基于若干第二医学图像的检测结果,得到子医学图像;其中,检测结果是利用上一轮训练得到的检测模型分别对若干第二医学图像进行检测得到的。
在一些公开实施例中,离线图像采样子模块包括图像配准单元,用于将若干第二医学图像进行配准,以使不同第二医学图像中相同的子对象对齐;离线图像采样子模块包括图像提取单元,用于分别提取包含对齐的子对象的第一图像区域,得到对应于相同子对象的子医学图像。
在一些公开实施例中,检测结果包括第二医学图像中像素点预测所属的子对象;在线图像采样子模块具体用于基于在属于相同子对象的像素点中处于预设位置的像素点,在第二医学图像中提取预设尺寸的第二图像区域,作为与子对象对应的子医学图像。
请参阅图8,图8是本申请图像检测装置80一实施例的框架示意图。图像检测装置80包括:图像获取模块81和图像检测模块82,图像获取模块81用于获取待测医学图像;其中,待测医学图像中包含目标对象,且目标对象由若干子对象组成;图像检测模块82用于利用检测模型对待检测医学图像进行检测,得到待测医学图像中像素点的检测标记;其中,检测标记表示待测医学图像中像素点所属的子对象,且检测模型是利用上述任一检测模型的训练装置实施例中的检测模型的训练装置得到的。
请参阅图9,图9是本申请电子设备90一实施例的框架示意图。电子设备90包括相互耦接的存储器91和处理器92,处理器92用于执行存储器91中存储的程序指令,以实现上述任一检测模型的训练方法实施例的步骤,或实现上述任一图像检测方法实施例中的步骤。在一个具体的实施场景中,电子设备90可以包括但不限于:微型计算机、服务器,此外,电子设备90还可以包括笔记本电脑、平板电脑等移动设备,在此不做限定。
具体而言,处理器92用于控制其自身以及存储器91以实现上述任一检测模型的训练方法实施例的步骤,或实现上述任一图像检测方法实施例中的步骤。处理器92还可以称为CPU(Central Processing Unit,中央处理单元)。处理器92可能是一种集成电路芯片,具有信号的处理能力。处理器92还可以是通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器92可以由集成电路芯片共同实现。
上述方案,能够提高图像检测的效率和精度。
请参阅图10,图10为本申请计算机可读存储介质100一实施例的框架示意图。计算机可读存储介质100存储有能够被处理器运行的程序指令101,程序指令101用于实现上述任一检测模型的训练方法实施例的步骤,或实现上述任一图像检测方法实施例中的步骤。
上述方案,能够提高图像检测的效率和精度。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (13)
1.一种检测模型的训练方法,其特征在于,包括:
获取第一医学图像、多个子医学图像和至少一组所述子医学图像的类别信息;其中,所述第一医学图像含有由若干子对象组成的目标对象,所述第一医学图像中的像素点标注有样本标记,所述样本标记表示所述像素点实际所属的子对象,且每组所述子医学图像包括至少两个子医学图像,所述类别信息包括所述至少两个子医学图像分别所属的子对象是否相同;
利用检测模型对所述第一医学图像进行检测,得到所述像素点的预测标记;其中,所述检测模型包括第一编码网络和解码网络,所述预测标记表示预测所述像素点所属的子对象;
基于所述第一编码网络对所述多个子医学图像分别进行编码,得到各个所述子医学图像的特征表示;
基于所述样本标记和所述预测标记之间的差异,得到第一损失值,并基于所述特征表示之间的相似度和所述类别信息,得到第二损失值;
基于所述第一损失值和所述第二损失值,调整所述检测模型的网络参数。
2.根据权利要求1所述的方法,其特征在于,所述检测模型是经多轮训练得到的;所述基于所述第一编码网络对所述多个子医学图像分别进行编码,得到各个所述子医学图像的特征表示,包括:
基于所述第一编码网络在上一轮训练调整之后的网络参数,得到当前轮训练过程中第二编码网络的网络参数;其中,所述第二编码网络和所述第一编码网络具有相同的网络结构;
利用所述第一编码网络对所述多个子医学图像分别编码,得到各个所述子医学图像的第一特征表示,并利用所述第二编码网络对所述多个子医学图像分别编码,得到各个所述子医学图像的第二特征表示;
所述基于所述特征表示之间的相似度和所述类别信息,得到第二损失值,包括:
将所述多个子医学图像分别作为当前医学图像,并基于所述当前医学图像的第一特征表示和第二特征表示,确定第一相似度,以及基于所述当前医学图像的第一特征表示和参考医学图像的第二特征表示,确定第二相似度;
基于所述第一相似度和所述第二相似度,得到子损失值;其中,所述参考医学图像是利用所述类别信息从所述多个子医学图像选择得到的,且所述参考医学与所述当前医学图像对应于不同所述子对象;
基于所述多个子医学图像的子损失值,得到所述第二损失值。
3.根据权利要求2所述的方法,其特征在于,在所述利用所述第一编码网络对所述多个子医学图像分别编码,得到各个所述子医学图像的第一特征表示,并利用所述第二编码网络对所述多个子医学图像分别编码,得到各个所述子医学图像的第二特征表示之前,所述方法还包括:
对所述多个子医学图像分别执行数据增强处理,得到各个所述子医学图像的第一增强图像和第二增强图像;
所述利用所述第一编码网络对所述多个子医学图像分别编码,得到各个所述子医学图像的第一特征表示,包括:
利用所述第一编码网络对所述多个子医学图像的第一增强图像分别编码,得到各个所述子医学图像的第一特征表示;
所述利用所述第二编码网络对所述多个子医学图像分别编码,得到各个所述子医学图像的第二特征表示,包括:
利用所述第二编码网络对所述多个子医学图像的第二增强图像分别编码,得到各个所述子医学图像的第二特征表示。
4.根据权利要求2所述的方法,其特征在于,所述基于所述第一编码网络在上一轮训练调整之后的网络参数,得到当前轮训练过程中第二编码网络的网络参数,包括:
将所述第二编码网络在所述上一轮训练过程中的网络参数和所述第一编码网络在所述上一轮训练调整之后的网络参数进行加权处理,得到所述第二编码网络在所述当前轮训练过程中的网络参数。
5.根据权利要求2所述的方法,其特征在于,所述子损失值与所述第一相似度为负相关关系,且所述子损失值与所述第二相似度为正相关关系;和/或,
所述第二损失值为所述多个子医学图像的子损失值的平均值。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述检测模型是经多轮训练得到的;所述多个子医学图像的获取步骤包括:
获取若干第二医学图像;其中,所述若干第二医学图像含有所述目标对象;
基于所述若干第二医学图像之间的配准结果,得到所述子医学图像,和/或,基于所述若干第二医学图像的检测结果,得到所述子医学图像;其中,所述检测结果是利用上一轮训练得到的检测模型分别对所述若干第二医学图像进行检测得到的。
7.根据权利要求6所述的方法,其特征在于,所述基于所述若干第二医学图像之间的配准结果,得到所述子医学图像,包括:
将所述若干第二医学图像进行配准,以使不同所述第二医学图像中相同的子对象对齐;
分别提取包含对齐的所述子对象的第一图像区域,得到对应于相同的所述子对象的子医学图像。
8.根据权利要求6所述的方法,其特征在于,所述检测结果包括所述第二医学图像中像素点预测所属的子对象;所述基于所述若干第二医学图像的检测结果,得到所述子医学图像,包括:
基于在属于相同所述子对象的像素点中处于预设位置的像素点,在所述第二医学图像中提取预设尺寸的第二图像区域,作为与所述子对象对应的子医学图像。
9.一种图像检测方法,其特征在于,包括:
获取待测医学图像;其中,所述待测医学图像中包含目标对象,且所述目标对象由若干子对象组成;
利用检测模型对所述待检测医学图像进行检测,得到所述待测医学图像中像素点的检测标记;
其中,所述检测标记表示所述待测医学图像中像素点所属的子对象,且所述检测模型是利用权利要求1至8任一项所述的检测模型的训练方法得到的。
10.一种检测模型的训练装置,其特征在于,包括:
样本获取模块,用于获取第一医学图像、多个子医学图像和至少一组所述子医学图像的类别信息;其中,所述第一医学图像含有由若干子对象组成的目标对象,所述第一医学图像中像素点标注有样本标记,所述样本标记表示所述像素点实际所属的子对象,且每组所述子医学图像包括至少两个子医学图像,所述类别信息包括所述至少两个子医学图像所属的子对象是否相同;
图像检测模块,用于利用检测模型对所述第一医学图像进行检测,得到所述像素点的预测标记;其中,所述检测模型包括第一编码网络和解码网络,所述预测标记表示预测所述像素点所属的子对象;
特征编码模块,用于基于所述第一编码网络对所述多个子医学图像分别进行编码,得到各个所述子医学图像的特征表示;
损失计算模块,用于基于所述样本标记和所述预测标记之间的差异,得到第一损失值,并基于所述特征表示之间的相似度和所述类别信息,得到第二损失值;
参数优化模块,用于基于所述第一损失值和所述第二损失值,调整所述检测模型的网络参数。
11.一种图像检测装置,其特征在于,包括:
图像获取模块,用于获取待测医学图像;其中,所述待测医学图像中包含目标对象,且所述目标对象由若干子对象组成;
图像检测模块,用于利用检测模型对所述待检测医学图像进行检测,得到所述待测医学图像中像素点的检测标记;
其中,所述检测标记表示所述待测医学图像中像素点所属的子对象,且所述检测模型是利用权利要求10所述的检测模型的训练装置得到的。
12.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至8任一项所述的检测模型的训练方法,或实现权利要求9所述的图像检测方法。
13.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至8任一项所述的检测模型的训练方法,或实现权利要求9所述的图像检测方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111063735.5A CN113888475A (zh) | 2021-09-10 | 2021-09-10 | 图像检测方法及相关模型的训练方法、相关装置和设备 |
PCT/CN2022/082154 WO2023035586A1 (zh) | 2021-09-10 | 2022-03-22 | 图像检测方法、模型训练方法、装置、设备、介质及程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111063735.5A CN113888475A (zh) | 2021-09-10 | 2021-09-10 | 图像检测方法及相关模型的训练方法、相关装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113888475A true CN113888475A (zh) | 2022-01-04 |
Family
ID=79008789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111063735.5A Withdrawn CN113888475A (zh) | 2021-09-10 | 2021-09-10 | 图像检测方法及相关模型的训练方法、相关装置和设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113888475A (zh) |
WO (1) | WO2023035586A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115526266A (zh) * | 2022-10-18 | 2022-12-27 | 支付宝(杭州)信息技术有限公司 | 模型训练方法和装置、业务预测方法和装置 |
WO2023035586A1 (zh) * | 2021-09-10 | 2023-03-16 | 上海商汤智能科技有限公司 | 图像检测方法、模型训练方法、装置、设备、介质及程序 |
WO2023137906A1 (zh) * | 2022-01-21 | 2023-07-27 | 平安科技(深圳)有限公司 | 文档标题生成方法、装置、设备及存储介质 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116894844B (zh) * | 2023-07-06 | 2024-04-02 | 北京长木谷医疗科技股份有限公司 | 一种髋关节图像分割与关键点联动识别方法及装置 |
CN116580268B (zh) * | 2023-07-11 | 2023-10-03 | 腾讯科技(深圳)有限公司 | 图像目标定位模型的训练方法、图像处理方法及相关产品 |
CN117476240B (zh) * | 2023-12-28 | 2024-04-05 | 中国科学院自动化研究所 | 少样本的疾病预测方法及装置 |
CN117934977B (zh) * | 2024-03-22 | 2024-05-31 | 烟台大学 | 基于图连接和图节点的脑网络分类方法、系统和设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10430946B1 (en) * | 2019-03-14 | 2019-10-01 | Inception Institute of Artificial Intelligence, Ltd. | Medical image segmentation and severity grading using neural network architectures with semi-supervised learning techniques |
CN110363138B (zh) * | 2019-07-12 | 2024-07-26 | 腾讯科技(深圳)有限公司 | 模型训练方法、图像处理方法、装置、终端及存储介质 |
CN110458833B (zh) * | 2019-08-15 | 2023-07-11 | 腾讯科技(深圳)有限公司 | 基于人工智能的医学图像处理方法、医学设备和存储介质 |
US10997720B2 (en) * | 2019-08-21 | 2021-05-04 | Ping An Technology (Shenzhen) Co., Ltd. | Medical image classification method and related device |
CN110969245B (zh) * | 2020-02-28 | 2020-07-24 | 北京深睿博联科技有限责任公司 | 医学图像的目标检测模型训练方法和装置 |
CN112163637B (zh) * | 2020-10-19 | 2024-04-19 | 深圳赛安特技术服务有限公司 | 基于非平衡数据的图像分类模型训练方法、装置 |
CN112992308B (zh) * | 2021-03-25 | 2023-05-16 | 腾讯科技(深圳)有限公司 | 医学图像报告生成模型的训练方法及图像报告生成方法 |
CN113888475A (zh) * | 2021-09-10 | 2022-01-04 | 上海商汤智能科技有限公司 | 图像检测方法及相关模型的训练方法、相关装置和设备 |
-
2021
- 2021-09-10 CN CN202111063735.5A patent/CN113888475A/zh not_active Withdrawn
-
2022
- 2022-03-22 WO PCT/CN2022/082154 patent/WO2023035586A1/zh active Application Filing
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023035586A1 (zh) * | 2021-09-10 | 2023-03-16 | 上海商汤智能科技有限公司 | 图像检测方法、模型训练方法、装置、设备、介质及程序 |
WO2023137906A1 (zh) * | 2022-01-21 | 2023-07-27 | 平安科技(深圳)有限公司 | 文档标题生成方法、装置、设备及存储介质 |
CN115526266A (zh) * | 2022-10-18 | 2022-12-27 | 支付宝(杭州)信息技术有限公司 | 模型训练方法和装置、业务预测方法和装置 |
CN115526266B (zh) * | 2022-10-18 | 2023-08-29 | 支付宝(杭州)信息技术有限公司 | 模型训练方法和装置、业务预测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2023035586A1 (zh) | 2023-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113888475A (zh) | 图像检测方法及相关模型的训练方法、相关装置和设备 | |
Mansilla et al. | Learning deformable registration of medical images with anatomical constraints | |
US11593943B2 (en) | RECIST assessment of tumour progression | |
Larrazabal et al. | Post-DAE: anatomically plausible segmentation via post-processing with denoising autoencoders | |
CN110930416B (zh) | 一种基于u型网络的mri图像前列腺分割方法 | |
CN111461232A (zh) | 一种基于多策略批量式主动学习的核磁共振图像分类方法 | |
CN112150428A (zh) | 一种基于深度学习的医学图像分割方法 | |
Xia et al. | MC-Net: multi-scale context-attention network for medical CT image segmentation | |
Ma et al. | HT-Net: hierarchical context-attention transformer network for medical ct image segmentation | |
An et al. | Medical image segmentation algorithm based on multilayer boundary perception-self attention deep learning model | |
WO2022086910A1 (en) | Anatomically-informed deep learning on contrast-enhanced cardiac mri | |
CN114581459A (zh) | 一种基于改进性3D U-Net模型的学前儿童肺部影像感兴趣区域分割方法 | |
CN117974693A (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
CN113610746A (zh) | 一种图像处理方法、装置、计算机设备及存储介质 | |
CN116485853A (zh) | 一种基于深度学习神经网络的医学图像配准方法和装置 | |
CN111667469A (zh) | 肺部疾病分类方法、装置及设备 | |
CN117058163A (zh) | 基于多尺度大卷积核的深度可分离医疗图像分割算法 | |
CN116109822A (zh) | 一种基于多尺度多视图网络的器官图像分割方法及系统 | |
CN112419283B (zh) | 估计厚度的神经网络及其方法 | |
Xiong et al. | Lung field segmentation using weighted sparse shape composition with robust initialization | |
CN114359308A (zh) | 一种基于边缘响应与非线性损失的主动脉夹层分割方法 | |
Wang et al. | MAFUNet: Multi-Attention Fusion Network for Medical Image Segmentation | |
Wu et al. | [Retracted] Application of Multimodal Fusion Technology in Image Analysis of Pretreatment Examination of Patients with Spinal Injury | |
Saravanan et al. | Detecting Healthcare Issues Using a Neuro‐Fuzzy Classifier | |
CN117576119B (zh) | 一种基于压缩-激励网络的半监督左心房分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40059205 Country of ref document: HK |
|
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220104 |